特征工程——图像特征¶
简单特征¶
直接将像素和颜色信息转为数组
颜色特征
计算每种颜色通道中简单的统计值, 如平均值、中值、色调、标准差、偏度和峰度。 对于RGB就有\(6\times3=18\)个特征
色彩范围
颜色范围 | 定义 |
---|---|
红色范围(red range) | 红色通道中最大值减去最小值的差值 |
红蓝范围(red-to-blue range) | \(红色范围 / (蓝色通道中最大值减去最下值+1)\) |
蓝绿范围(blue-to-green range) | \((蓝色通道中最大值减去最下值)/(路色通道中最大值减去最下值+1)\) |
红绿范围(red-to-green range) | \(红色范围/(路色通道中最大值减去最下值+1)\) |
图像元数据特征
特征 | 定义 |
---|---|
制造商(manufacturer) | 相机制造商 |
方向(orientation) | 照相机的方向(横向或纵向) |
日期-时间(date-time) | 拍摄时间(可用日期时间的相关提取方式) |
压缩方式(compression) | 图像的压缩方式(JPEG或未压缩) |
解析度(resolution) | 在宽高空间中像素的数量 |
长宽比(aspect ratio) | 通过划分高度和宽度分辨率表示的度量 |
曝光时间(exposure time) | 曝光秒数 |
光圈(aperture) | 表示光圈的\(f\)值(如2.8或4.0) |
闪光灯(flash light) | 闪光灯是否打开 |
焦距(focal length) | 镜头到焦点的距离 |
提取物体和形状¶
边缘检测
常用Sobel和Ganny边缘检测算法, 可使用scikit-image库来完成
提取到边缘之后,最简单的特征是计算边缘数目(也可计算局部边缘数目),计算公式:
\(edge\_score = \frac{\sum edges}{res_x \times res_y},其中edges是边缘图像,res是图像的解析度\)
高级形状特征
方向梯度直方图(HOG),常同来检测图片中的人脸和特定动物
可以直接使用
skimgae.feature.hog
当图像中的物体方向变化太大时,HOG工作得不好
降维
主成分分析(PCA), 新图片的特征由与主成分图像的“距离”产生,可以用与每个主成分图像相关的数字表示。 为了使问题更有意义,可以使用尽可能多的主要成分
*PCA是线性算法*, 不能表示本质上是非线性的数据。由很多PCA的拓展和其他非线性的降维方式,如扩散映射(diffusion maps)