# 数字图像特征练习(Image features exercise)

*完成并提交本作业（包括代码输出和作业之外的所有支持代码）。 有关更多详情，请参阅课程网站上的[作业提交页面](http://vision.stanford.edu/teaching/cs231n/assignments.html)。*

通过训练输入图像的像素上的线性分类器，我们可以在图像分类任务上达到较好的效果。 在本次练习中，我们将要提高分类的性能，同样是训练线性分类器，但是不是基于在原始的像素，而是基于从原始像素上计算得到的特征(features)。

本练习的所有工作都将在这个notebook上完成。

In [1]:
import random 
import numpy as np
from cs231n.data_utils import load_CIFAR10
import matplotlib.pyplot as plt
%matplotlib inline
plt.rcParams['figure.figsize']=(10.0, 8.0) # 设置图的大小
plt.rcParams['image.interpolation'] = 'nearest'
plt.rcParams['image.cmap'] = 'gray'

# 对于自动加载的外部模块
# 详见 http://stackoverflow.com/questions/1907993/autoreload-of-modules-in-ipython
%load_ext autoreload
%autoreload

## 加载数据

和之前的练习类似，我们将会从磁盘存储上加载 CIFAR-10 数据集。


In [2]:
from cs231n.features import color_histogram_hsv, hog_feature

def get_CIFAR10_DATA(num_training=49000, num_validation=1000, num_test=1000):
    # 加载 CIFAR-10 数据
    cifar10_dir = 'cs231n/datasets/cifar-10-batches-py'
    X_train, y_train, X_test, y_test = load_CIFAR10(cifar10_dir)
    
    #对数据进行子采样
    mask = range(num_training, num_training + num_validation)
    X_val = X_train[mask]
    y_val = y_train[mask]
    mask = range(num_training)
    X_train = X_train[mask]
    y_train = y_train[mask]
    mask = range(num_test)
    X_test = X_test[mask]
    y_test = y_test[mask]
    
    return X_train, y_train, X_val, y_val, X_test, y_test

# 训练集 验证集 测试集
X_train, y_train, X_val, y_val, X_test, y_test = get_CIFAR10_DATA()    

In [8]:
print(u"训练集大输入 X_train 大小："+str(X_train.shape))
print(u"训练集标签 y_train 大小："+str(y_train.shape))

print(u"验证集大输入 X_val 大小："+str(X_val.shape))
print(u"验证集标签 y_val 大小："+str(y_val.shape))

print(u"测试集大输入 X_test 大小："+str(X_test.shape))
print(u"测试集标签 y_test 大小："+str(y_test.shape))


训练集大输入 X_train 大小：(49000L, 32L, 32L, 3L)
训练集标签 y_train 大小：(49000L,)
验证集大输入 X_val 大小：(1000L, 32L, 32L, 3L)
验证集标签 y_val 大小：(1000L,)
测试集大输入 X_test 大小：(1000L, 32L, 32L, 3L)
测试集标签 y_test 大小：(1000L,)


## 提取特征

对于每一幅图像，我们将计算出其面向方向梯度的直方图（HOG，a Histogram of Oriented Gradients）以及其使用HSV颜色空间中的色调通道的颜色直方图（a color histogram using the hue channel in HSV color space）。我们通过连接HOG和颜色直方图特征向量来形成每个图像的最终特征向量。

总的来说，HOG能够描述图像的纹理而忽略其颜色信息，颜色直方图能表征输入图像的颜色而忽略其纹理。 因此，我们期望两者结合使用应该比单独使用更好。 验证这个假设对于附加部分（译者注：本门课程的附加题）来说很有帮助。

hog_feature和color_histogram_hsv函数参数都是单幅图像，返回的是该图像的特征向量。 extract_features函数参数是一个图像集合和特征函数列表，并评估每幅图像上的每个特征函数，将结果存储在矩阵中，其中每列是单个图像的所有特征向量的拼接。

## 在特征中训练支持向量机（Support Vector Machine, SVM）

基于提取的特征训练 SVM，其中用的是前面作业所实现的多种 SVM 实现代码 ；这将比直接在原始像素上直接训练 SVM 能获得更好的结果。

## 基于图像特征的神经网络

我们已经看到在原始像素上训练两层神经网络比直接在原始像素线性分类器有更好的分类效果。通过本编程任务我们能够知道，基于图像特征的线性分类器效果又优于基于原始像素的线性分类器。

## 附加任务：设计自己的特征

看到了吧，简单的图像特征就可以提高计算机对图像分类的表现。目前我们尝试了使用 HOG 和 颜色直方图，有没有更好的特征来得到更好的分类效果呢？

作为奖励分数，设计一种新的特征，将其用于在 CIFAR-10 的图像分类任务中，解释你的特征是如何生效的以及其为什么能够其能提升分类性能。在本 notebook 中实现它，交叉验证任何必须的超参数，并将其得到的模型性能指标和通过 HOG+彩色直方图模型得到的性能进行对比。

## 附加任务：额外的挑战

用编程任务提供的材料和代码来做一些你觉得很有意思的事情，以及你是否还有一些其他的疑问要问呢？在完成这个任务的过程中，你脑中是否迸发出了很棒很酷的点子以及头脑风暴？那么动手将这些想法变成现实！让你在伙伴们面前展示的机会到了！