图像识别，Computer Vision
- 用openCV操作图像
- 检测边
- 直方图均衡化
- 检测棱角
- 检测SIFT特征点
- 创建Star特征检测器
- 利用视觉单词码本和向量量化创建特征
- 用极端随机森林训练图像分类器
- 创建一个对象识别器

图像处理是在像素级别对图像进行变换。图像处理系统的输入和输出都是图像，常用处理方法：有变检测、直方图均衡化、图像压缩。
- OpenCV是最受欢迎的计算机视觉库，为各种不同平台进行了高度优化
- https://opencv.org/

- 用OpenCV操作图像：展示图像，剪裁、调整大小、保存图像到文件中

In [7]:
%run operating_on_images.py

边检测是计算机视觉中最常用到的图像预处理技术之一
- 如何用不同的边检测器检测输入图像的边(线条)
- 索贝尔滤波器(Sobel Filter)是一种边检测器，使用的是3 * 3内核来检测水平边和垂直边： https://www.tutorialspoint.com/dip/sobel_operator.htm
- 拉普拉斯边检测器(Laplacian edge detector)可以检测两个方向上的边： https://homepages.inf.ed.ac.uk/rbf/HIPR2/log.htm
- Canny边检测器（Canny edge detector）在解决噪声方面由于拉普拉斯边检测器和索贝尔边检测器。Canny边检测器是一个分阶段的处理过程，用到了迟滞性来做边数据清理： https://homepages.inf.ed.ac.uk/rbf/HIPR2/canny.htm

In [8]:
%run edge_detector.py

直方图均衡化
- 修改图像的像素以增强图像的对比强度的过程
- 直方图均衡化不同于彩色图像的灰度化过程
- 为了均衡彩色图像的直方图，需要用到不同于以上的步骤。直方图均衡化仅适用于亮度通道。一个RGB图像由3个颜色通道组成，因此不能对这些通道单独地做直方图均衡化，需要将强度信息从颜色信息中分离出来。
    - 将其转换到YUV色彩空间，均衡Y通道，然后将其转换回RGB并得到输出
    - 关于YUV色彩空间的介绍： https://softpixel.com/~cwright/programming/colorspace/yuv
    - OpenCV默认用BGR格式加载图像，因此需要先将其从BGR转化为YUV

In [10]:
%run histogram_equalizer.py

检测棱角
- 帮助识别图像中突起的点
- 用于开发图像分析系统中最早期的特征提取技术之一
- 哈里斯角检测器（Harris corner detector）函数： https://docs.opencv.org/3.0-beta/doc/py_tutorials/py_feature2d/py_features_harris/py_features_harris.html

In [11]:
%run corner_detector.py

检测SIFT特征点
- 尺度不变特征变换(SIFT-Scale Invariant Feature Transform), 是计算机视觉领域最常用的特征之一
- https://www.cs.ubc.ca/~lowe/papers/ijcv04.pdf
- SIFT是图像识别和图像内容分析领域最有效的特征之一，它在大小、方向、对比度等方面具有较强的健壮性。也是目标检测系统的基础。

In [12]:
%run feature_detector.py

创建Star特征检测器
- 对于目标识别系统，在SIFT检测特征之前，需要用到一个不同的特征检测器，使得能够通过灵活地层叠不同的模块来获得最佳的性能
- Star特征检测器（Star feature detector）

In [13]:
%run star_detector.py
# module 'cv2' has no attribute 'StarDetector_create'

AttributeError: module 'cv2' has no attribute 'StarDetector_create'

利用视觉码本和向量量化创建特征
- 创建一个目标识别系统，需要从每张图中提取特征向量。每个图像要有个识别标志，用于匹配。
- 用'视觉码本'来创建图像识别标识。在训练数据集中，码本就像是个字典，用于提出关于图像的描述。
- 向量量化方法将很多特征点进行聚类并得出中心点，这些中心点将作为视觉码本的元素 http://mi.eng.cam.ac.uk/~cipolla/lectures/PartIB/old/IB-visualcodebook.pdf
- 示例包括三个类的示例训练数据集，每一类包含20辐图片，下载地址： http://www.vision.caltech.edu/html-files/archive.html
- 为创建一个健壮的目标识别系统，需要数万辐图像。有个著名的数据集Caltech256，包括256类图像，每类包含上千幅示例图像。下载地址： http://www.vision.caltech.edu/Image_Datasets/Caltech256

In [31]:
%run build_features.py --data-folder ./training_images/ --codebook-file codebook.pkl --feature-map-file feature_map.pkl



AttributeError: module 'cv2' has no attribute 'StarDetector_create'

用极端随机森林训练图像分类器
- ERF(Extremely random forests),ERF具有较快的速度和比较精确的准确度。基于图像特征构建一组决策树，并通过训练这个森林实现正确决策
- 关于随机森林：https://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm
- 关于ERF：https://people.montefiore.uliege.be/ernst/uploads/news/id63/extremely-randomized-trees.pdf

In [None]:
%run trainer.py

创建一个对象识别器
- 训练好一个ERF模型后，接下来创建一个目标识别器，用以识别未知图像的内容

In [None]:
%run object_recognizer.py