Skip to content

机器学习实战技能

bettermorn edited this page Aug 20, 2022 · 14 revisions

实战前提

实战目标

  • 熟悉常用平台工具,例如Pytorch
  • 熟悉机器学习项目的流程
  • 熟悉常用模型
  • 掌握选择模型的方法
  • 掌握训练模型的方法
  • 掌握评估模型的方法

实战内容

1 搭建运行环境

  • 运行环境的依赖包

2 训练模型

3 评估模型

4 部署和持续优化模型

  • 部署环境
  • 持续优化方法

实战速查清单

使用工具

编程语言为Python,运行环境Anaconda,深度学习框架Pytorch,参考依赖库 torch,numpy,csv,matplotlib等。

进行方式

  1. 使用Anaconda建立Python运行环境,并安装必要的依赖库;
  2. 使用Jupyter Notebook 编写代码,包括数据集处理、装载数据、构建深度神经网络、训练、验证和测试,设置超参数等部分,可参考开源代码;
  3. 完成训练过程,保存模型文件,绘制训练过程曲线;
  4. 使用验证集数据预测或者分类结果,绘制预测值和验证集值比较图;
  5. 使用测试集数据预测或者分类,生成预测文件pred.csv。

课程实战练习列表

编号 名称 类型 理论和技术
1 Covid-19案例预测 预测 深度学习基础知识
2 识别手写数字 多分类 深度学习基础知识
3 识别不同食物 多分类 卷积神经网络CNN、数据增强、半监督学习
4 对象检测 多分类 FasterRCNN
5 区分基本运动走和跑 时间序列分类 Transformer
6 预测家电能耗 时间序列预测 InceptionTime
7 OneMax问题 优化 遗传算法
8 机器翻译 序列转换 RNN,LSTM,Transformer
9 基于已有生成图片 生成模型 GAN
10 回答问题 序列转换 Bert模型(seq2seq的encoder)
11 识别异常 无监督学习 auto-encoder原理
12 互动游戏 强化学习 强化学习
13 知识图谱 知识图谱 知识图谱

案例名称与代码链接

编号 名称 代码链接
1 Covid-19案例预测 https://github.com/ga642381/ML2021-Spring/blob/main/HW01/HW01.ipynb
2 识别手写数字 https://github.com/pytorch/examples/tree/master/mnist
3 识别不同食物 https://github.com/bettermorn/IAICourse/blob/main/Code/MLSpringHW03/HW03.ipynb
4 对象检测 http://github.com/bubbliiiing/faster-rcnn-pytorch
5 区分基本运动走和跑 https://github.com/bettermorn/IAICourse/blob/main/Code/Ex05/07.2_Time_Series_Classification_with_Transformer_GPU.ipynb
6 预测家电能耗 https://github.com/timeseriesAI/tsai/blob/main/tutorial_nbs/04_Intro_to_Time_Series_Regression.ipynb
7 OneMax问题 https://github.com/DEAP/notebooks
8 机器翻译 https://github.com/ga642381/ML2021-Spring/blob/main/HW05/HW05_ZH.ipynb
9 基于已有生成图片 https://github.com/ga642381/ML2021-Spring/blob/main/HW06/HW06.ipynb
10 回答问题 https://github.com/ga642381/ML2021-Spring/blob/main/HW07/HW07.ipynb
11 识别异常 https://github.com/ga642381/ML2021-Spring/blob/main/HW08/HW08.ipynb
12 互动游戏 https://github.com/ga642381/ML2021-Spring/blob/main/HW12/HW12_ZH.ipynb
13 知识图谱 https://github.com/bettermorn/KGCourse/tree/master/Lab/elasticQA