特征工程——图像特征

简单特征

直接将像素和颜色信息转为数组

颜色特征

计算每种颜色通道中简单的统计值, 如平均值、中值、色调、标准差、偏度和峰度。 对于RGB就有\(6\times3=18\)个特征

色彩范围

颜色范围 定义
红色范围(red range) 红色通道中最大值减去最小值的差值
红蓝范围(red-to-blue range) \(红色范围 / (蓝色通道中最大值减去最下值+1)\)
蓝绿范围(blue-to-green range) \((蓝色通道中最大值减去最下值)/(路色通道中最大值减去最下值+1)\)
红绿范围(red-to-green range) \(红色范围/(路色通道中最大值减去最下值+1)\)

图像元数据特征

特征 定义
制造商(manufacturer) 相机制造商
方向(orientation) 照相机的方向(横向或纵向)
日期-时间(date-time) 拍摄时间(可用日期时间的相关提取方式)
压缩方式(compression) 图像的压缩方式(JPEG或未压缩)
解析度(resolution) 在宽高空间中像素的数量
长宽比(aspect ratio) 通过划分高度和宽度分辨率表示的度量
曝光时间(exposure time) 曝光秒数
光圈(aperture) 表示光圈的\(f\)值(如2.8或4.0)
闪光灯(flash light) 闪光灯是否打开
焦距(focal length) 镜头到焦点的距离

提取物体和形状

边缘检测

常用Sobel和Ganny边缘检测算法, 可使用scikit-image库来完成

提取到边缘之后,最简单的特征是计算边缘数目(也可计算局部边缘数目),计算公式:

\(edge\_score = \frac{\sum edges}{res_x \times res_y},其中edges是边缘图像,res是图像的解析度\)

高级形状特征

方向梯度直方图(HOG),常同来检测图片中的人脸和特定动物
可以直接使用skimgae.feature.hog

当图像中的物体方向变化太大时,HOG工作得不好

降维

主成分分析(PCA), 新图片的特征由与主成分图像的“距离”产生,可以用与每个主成分图像相关的数字表示。 为了使问题更有意义,可以使用尽可能多的主要成分

*PCA是线性算法*, 不能表示本质上是非线性的数据。由很多PCA的拓展和其他非线性的降维方式,如扩散映射(diffusion maps)