Deep_Learning_Keras

第一个案例：二分类问题（基于Pima Indians数据集）

Pima Indians数据集为糖尿病患者医疗记录数据，是一个二分类问题。本代码采用80%数据训练，20%数据测试的方法。若数据不做归一化处理，最终模型的分类精度为 79.17%；而数据进行归一化以后，最终模型的分类精度为81.38%。

其中还包括一份10折交叉验证的代码，最终的运行结果为76.69% (+/- 2.95%)。

sklearn结尾的代码为用sklearn包的KerasClassifier进行多分类，通过10折交叉验证，得到最终的精度为0.7681989076737664

GridSearch结尾的代码为用sklearn包的GridSearchCV搜索超参，得到最终的结果为Best: 0.781250 using {'batch_size': 10, 'epochs': 150, 'init': 'normal', 'optimizer': 'rmsprop'}

第二个案例：多分类问题（基于Iris数据集）

Iris数据集为鸢尾花数据集，是一个拥有4个特征的3分类问题，数据集共有150个样本，最终的精度为Accuracy: 83.33% (0.30)

第三个案例：回归问题（基于Boston House Price数据集）

Boston House Price数据集为1978年波士顿房价的统计数据，共计14个特征，506个样本。最终的精度为MSE: 12.36 (4.37)。注意：cross_val_score函数当loss函数为mean_squared_error、mae等时，其得分为负数(cross_val_score里用的指标是负均方误差)，所以最终的MSE指标要在交叉验证的结果上取相反数！

第四个案例：二分类问题（基于Banking Marking数据集）

本案例中使用replace对数据集中的英文进行了编码处理，这是这份代码的一个亮点！对数据作StandardScaler()处理，使用GridSearchCV搜索超参。最终结果为：Accuracy: 88.92% (0.01) Best: 0.886308 using {'units_list': [16]}

第五个案例：神经网络模型的保存与加载（基于Iris数据集）

使用model.to_json()保存网络结构，使用model.save_weights()保存权重。使用model_from_json(model_json)加载已经保存好的模型。另一份代码采用YAML格式对模型进行保存与加载。通过加载模型的方式建立新的模型后，必须先编译模型，后对新的数据集进行预测。最终结果为acc: 99.33%

第六个案例：模型的增量更新（基于Iris数据集）

先用构建好的模型对部分数据进行训练，并将网络的结构以及权重进行保存。然后将保存的网络加载并对剩余的样本进行增量训练。相比于全量更新，这样可以大大缩短训练时间。最终结果为：Base acc: 98.33%\Increment acc: 96.67%

第七个案例：保存检查点（基于Iris数据集）

本代码将val上的accuracy提升时候的模型的权重进行保存(不覆盖前一次的保存结果)。用到了Keras的ModelCheckpoint。最后一次的保存结果为：Epoch 00177: val_acc improved from 0.80000 to 0.83333, saving model to ../model/weights-improvement-177-0.83.h5

第八个案例：保存最好的模型并计算该模型的得分（基于Iris数据集）

本代码中将val上accuracy表现最好的模型的权重进行保存，并将该权重导入用于计算此时的all_accuracy。最终得分为：acc: 96.00%

第九个案例：模型的accuracy/loss可视化（基于Iris数据集）

通过调用fit返回的history绘制网络在train/val上accuracy/loss曲线，以观察模型训练是否收敛。

第十个案例：在网络中使用Dropout（基于Iris数据集）

通过在网络中添加Dropout层，随机使一部分神经元不参与训练。本代码中首先对输入层添加Dropout层，然后对隐层以及输出层添加Dropout层，经过10折交叉验证，最终的结果分别为：Accuracy: 74.00% (0.28)/Accuracy: 65.33% (0.29)

第十一个案例：利用学习率衰减找到最优结果（基于Iris数据集）

本代码块包含两种学习率衰减模式，一种为线性衰减，一种为指数衰减。线性衰减的最终的结果为：loss: 0.4630 - acc: 0.6533/指数衰减的最终结果为loss: 0.3380 - acc: 0.9000

第十二个案例：对手写体识别进行多分类（基于mnist数据集）

mnist数据集拥有60000个样本，每张图片均为28x28。在本案例中首先采用传统的多层感知器构建手写体识别的模型，其原理是把每一张图片看成一个向量，其label为图片代表的数字，通过构造神经网络学习feature与label之间的映射关系。其精度为MLP: 98.09%;使用卷积神经网络：输入层->卷积层->池化层->Dropout层->Flatten层->全连接层->输出层。使用plot_model绘制网络结构。最终的分类精度为：CNN_Small: 99.07%。

第十三个案例：图像增强（基于mnist数据集）

本代码中利用ImageDataGenerator对图像进行特征标准化、ZCA白化、旋转、移动、反转、透视操作，并且介绍了文件路径的创建(try:/except:)以及图像的自动保存。

第十四个案例：复杂CNN的应用（基于CIFAR-10数据集）

CIFAR-10中包含了60000张图片用于10分类任务。本代码中设计了大型卷积神经网络用于多分类任务。利用model.summary()对模型结构进行输出，TensorBoard记录计算过程中的训练信息，LearningRateScheduler动态调整学习率，GlobalAveragePooling2D进行平均池化处理，将每一个feature map变为一个特征点。最终的分类精度为：0.8796

第十五个案例：影评情感分类（基于IMDB数据集）

IMDB数据集包括50000部电影的评价信息，label为黑白样本。使用Embedding结合一维卷积池化可以达到0.8865的精度。参考链接：https://github.com/MoyanZitto/keras-cn/blob/master/docs/legacy/blog/word_embedding.md 使用LTSM+一维卷积+一维池化可以达到Accuracy: 87.54%

第十六个案例：时间序列分析（基于AirlinePassengers数据集）

AirlinePassengers数据集记录了1949-1960年的国际旅客人数数据集，通过构造t-3~t与t+1之间的时间序列，利用多层感知机进行预测，最终结果为：_Train Score: 456.09 MSE (21.36 RMSE)/Validation Score: 2021.68 MSE (44.96 RMSE)。_另外，通过LSTM的批次间记忆，构造神经网络模型，对数据集进行预测。最终结果为：Train Score: 30.70 MSE/Validation Score: 105.41 MSE。

第十七个案例：多变量时间序列分析（基于PRSA数据集）

PRSA数据集记录了北京五年内每天的PM2.5指数以及当天的温度、风速等情况，通过建立t-1日的各项指标与t日的PM2.5指数，构造多变量的时间序列。利用LTSM进行预测，预测结果为：val_loss: 53.3895。本代码亮点在于时间数据的处理parse_dates以及训练数据集的合成shift

Name		Name	Last commit message	Last commit date
Latest commit History 96 Commits
Banking-Marking		Banking-Marking
Boston-House-Price/code		Boston-House-Price/code
CIFAR-10/code		CIFAR-10/code
CNN_mnist/code		CNN_mnist/code
IMDB		IMDB
PRSA		PRSA
airline_passengers		airline_passengers
check_point		check_point
dropout/code		dropout/code
enhance_image		enhance_image
increment_update		increment_update
iris/code		iris/code
learning_rate_decrease/code		learning_rate_decrease/code
pima-indians		pima-indians
save_load_model		save_load_model
use_best_model		use_best_model
visualization		visualization
README.md		README.md

wzy6642/Deep_Learning_Keras

Folders and files

Latest commit

History

Repository files navigation