keras-project

项目简介：

一个使用Keras来构建和训练深度学习模型的项目：

本项目采用数据类型为时序数据（Time Series Data），目标是在对时序数据进行分类或预测
本项目使用Keras构建和训练用于两种任务（classification和regression）的深度学习模型

classification模型

mlp、cnn、mcdcnn、encoder、tlenet、fcn、resnet、resnet_v2、resnext、inceptiontime

regression模型

CNN、DeepConvLSTM、DeepConvLSTM_2、DeepResBiLSTM、LSTM、TCN、TCN_2、 TCN_3
本项目中的模型训练流程划分为：加载数据、构建模型、训练、评估
采用Tensorboard及Comet.ml可视化训练过程
加入Microsoft NNI等超参数优化工具

项目介绍

项目结构

文件结构

keras-project-master
├─ base						- 本目录包含几个重要组成部分的抽象类
│	├─ base_data_loader.py	- data_loader的抽象类
│	├─ base_evaluater.py	- evaluater的抽象类
│	├─ base_model.py		- model的抽象类
│	└─ base_trainer.py		- trainer的抽象类
|
├─ data_loader							  - 本目录包含data_loader类，加载相应任务数据	
│	├─ uts_classification_data_loader.py  - UtsClassificationDataLoader类
│	└─ uts_regression_data_loader.py	  - UtsRegressionDataLoader类
|
├─ models						- 本目录包含model类以及所有模型各自的类
│	├─ classification				- 本目录包含classification任务的所有model类
│	│	├─ cnn.py						- cnn模型
│	│	├─ encoder.py					- encoder模型
│	│	├─ fcn.py						- fcn模型
│	│	├─ inception.py					- inceptiontime模型
│	│	├─ mcdcnn.py					- mcdcnn模型
│	│	├─ mlp.py						- mlp模型
│	│	├─ resnet.py					- resnet模型
│	│	├─ resnet_v2.py					- resnet_v2模型
│	│	├─ resnext.py					- resnext模型
│	│	└─ tlenet.py					- tlenet模型
|   |
│	├─ regression					- 本目录包含regression任务的所有model类
│	│	├─ CNN.py						- CNN模型
│	│	├─ DeepConvLSTM.py				- DeepConvLSTM模型
│	│	├─ DeepConvLSTM_2.py			- DeepConvLSTM_2模型
│	│	├─ DeepResBiLSTM.py				- DeepResBiLSTM模型
│	│	├─ LSTM.py						- LSTM模型
│	│	├─ TCN.py						- TCN模型
│	│	├─ TCN_2.py						- TCN_2模型
│	│	├─ TCN_3.py						- TCN_3模型
|   |
│	├─ uts_classification_model.py		- UtsClassificationModel类
│	└─ uts_regression_model.py			- UtsRegressionModel类
|
├─ trainers								- 本目录包含trainer类
│	├─ uts_classification_trainer.py		- UtsClassificationTrainer类
│	└─ uts_regression_trainer.py			- UtsRegressionModelTrainer类
|
├─ evaluater							- 本目录包含evaluater类						
│	├─ uts_classification_evaluater.py		- UtsClassificationEvaluater类
│	└─ uts_regression_evaluater.py			- UtsRegressionEvaluater类
|
├─ configs								- 本目录包含所有config文件	
│	├─ custom								- 本目录包含所有添加了comet api key的config文件
│	│	├─ uts_classification.json				- classification任务
│	│	└─ uts_regression.json					- regression任务
|   |
│	├─ simple_mnist_config.json				- 示例
│	└─ simple_mnist_from_config.json		- 示例
|
├─ utils					- 本目录包含所有工具类
│	├─ args.py					- run arguments的处理方法
│	├─ config.py				- json文件的处理方法，解析参数并生成实验保存目录
│	├─ dirs.py					- create_dirs方法，创建文件夹
|   |
│	├─ uts_classification的		- 本目录包含uts_classification的工具类等
│	│	├─ metric.py				- recall、precision、f1的计算方法
│	│	└─ utils.py					- classification任务的utils
|   |
│	└─ uts_regression			 - 本目录包含uts_regression的工具类等
│	 	├─ data.py					- Data_utility，进行数据的处理
│	 	├─ tools.py					- 自定义的LearnignRateScheduler
│	 	└─ utils.py					- regression任务的utils
|
├─ opt							 - 本目录包含Optimization相关内容
│	├─ BayesianOptimization			- 本目录包含BayesianOptimization相关内容
│	│	└─ ...
│	└─ nni							- 本目录包含nni相关内容
│	 	└─ ...
|
├─ datasets						 - 本目录包含所有数据集
│    ├─ mts_data					- 本目录包含所有mts多变量时序数据集
│    └─ uts_data					- 本目录包含所有uts单变量时序数据集
|
├─ experiments					 - 本目录包含所有实验结果
│    ├─ 2019-12-01					- 按日期保存
│    ├─ ...
│    ├─ 2020-01-04
│    └─ ...
|
├─ main.py							- 示例
├─ main_classification.py			- classification任务的main方法
├─ main_forecasting.py				- forecasting/regression任务的main方法	
├─ nni_config.yml					- nni的配置文件
├─ nni_main_classification.json		- nni-classification超参数优化的config文件
├─ nni_main_classification.py		- nni进行classification任务超参数优化
├─ nni_search_space.json			- nni超参数搜索空间
└─ vis_training_size.py				- 可视化评价指标随训练集大小的变化情况

主要组成部分

Data Loaders

两个Data Loader类：UtsClassificationDataLoader 、 UtsRegressionDataLoader，特点是：

所有的DataLoader都继承自BaseDataLoader
重写了BaseDataLoader中的 get_train_data() 和***get_test_data()***方法，以得到各自相应的训练数据和测试数据
在构造函数中完成主要的逻辑，包括按不同数据集读取数据，并处理成模型的标准输入形式

Models

两个Model类：UtsClassificationModel、UtsRegressionModel，特点是：

所有的Model都继承于BaseModel
重写了BaseModel中的 build_model 方法，以实现各自相应模型的构建
在构造函数中调用 build_model 方法来构建模型，该方法从config中获得所要构造的模型名称，并交由相应的模型类来构建模型

Trainers

两个Model类：UtsClassificationTrainer、UtsRegressionModelTrainer，特点是：

所有的Model都继承自BaseTrainer
重写了BaseTrainer中的 train 方法，以实现各自不同的训练方法
在构造函数中初始化训练过程中的各种指标值的list，并调用init_callbacks()方法初始化callback函数
在train方法中将callback数组传递给模型对象的fit/fit_generator函数
train方法实现模型的训练，并使用save_training_logs方法保存training logs

Evaluaters

两个Evaluater类：UtsClassificationEvaluater、UtsRegressionEvaluater，特点是：

所有的Model都继承自BaseEvaluater
重写了BaseEvaluater中的 evluate方法，以实现各自不同的评估方法
在构造函数中接受DataLoader传过来的测试数据集与Trainer传过来的best model
在evaluate方法中在测试数据集上对模型进行评估，并使用save_evaluating_result方法保存评估结果

Configs

每一个任务/实验对应一个.json文件，其中包含了实验和模型的配置，如exp_name(实验名)、dataset_name(数据集名)、model_name(模型名)、learning_rate(学习率)、num_epochs(epoch数目)等。通过改变json文件中参数的值，就可以选择不同的数据、模型以及训练参数，方便地进行不同的实验。

例子：mts_classification.json

{
  "exp": {
    "name": "mts_classification"		- 实验名称
  },
  "dataset":{							- 数据集
    "type": "mts",							- 类型：多变量时序数据
    "name": "UCI_HAR_Dataset"				- 名称：UCI_HAR_Dataset
  },
  "model":{								- 模型
    "name":"resnet",						- 名称：resnet
    "learning_rate": 0.0001,				- 学习率：0.0001
    "optimizer": "adam"						- 优化器：adam
  },
  "trainer":{							- 训练
    "num_epochs": 100,						- epoch数目：100
    "batch_size": 108,						- batch大小：108
    "validation_split":0.25,				- 验证集划分比例：0.25
    "verbose_training": true				- 显示训练过程日志：true
  },
  "callbacks":{							- callback函数
    "checkpoint_monitor": "val_loss",		- ModelCheckpoint参数
    "checkpoint_mode": "min",				- ...
    "checkpoint_save_best_only": true,		- ...
    "checkpoint_save_weights_only": true,	- ...
    "checkpoint_verbose": true,				- ...
    "tensorboard_write_graph": true			- Tensorboard参数
  },
  "comet_api_key": "..."					- comet api key

Main

整个流程pipeline的构建：

解析config文件
创建一个dataLoader的实例
创建一个model的实例
创建一个trainer的实例
调用trainer对象的***train()***方法进行训练
创建一个evaluater的实例
调用evaluater对象的***evluate()***方法进行评估

例子：main_classification

def main():

    # capture the config path from the run arguments
    # then process the json configuration file
    args = get_args()
    config = process_config_UtsClassification(args.config)
    
    # create the experiments dirs
    create_dirs([config.callbacks.tensorboard_log_dir, config.callbacks.checkpoint_dir,
                 config.log_dir, config.result_dir])

    print('Create the data generator.')
    data_loader = UtsClassificationDataLoader(config)

    print('Create the model.')

    model = UtsClassificationModel(config, data_loader.get_inputshape(), data_loader.get_nbclasses())

    print('Create the trainer')
    trainer = UtsClassificationTrainer(model.model, data_loader.get_train_data(), config)

    print('Start training the model.')
    trainer.train()

    print('Create the evaluater.')
    evaluater = UtsClassificationEvaluater(trainer.best_model, data_loader.get_test_data(), data_loader.get_nbclasses(), config)

    print('Start evaluating the model.')
    evaluater.evluate()
    print('done')

项目运行

例1.时序数据上的classification任务：

编辑uts_classification.json文件，配置实验参数
运行项目:

python main_classification.py -c configs/uts_classification.json

查看训练log、learning cruves、metrics、confusion matrix等
利用Tensorboard可视化训练过程：

tensorboard --logdir experiments/.../tensorboard_logs

例2. 使用NNI进行classification任务超参数优化：

编辑nni_config.yml文件，配置NNI实验的参数
编辑nni_main_classification.json文件，指定classification任务的固定参数
编辑nni_search_space.json文件，指定classification任务中的超参数的搜索空间
在命令行运行NNI:

nnictl create --config nni_config.yml

在浏览器打开NNI Web UI ：
查看实验进行情况：

Comet.ml设置

This template also supports reporting to Comet.ml which allows you to see all your hyper-params, metrics, graphs, dependencies and more including real-time metric.

Add your API key in the configuration file:

For example: "comet_api_key": "your key here"

You can also link your Github repository to your comet.ml project for full version control.

数据集

这里提供两个基本的时序数据集，其他数据集也可以加入到本项目的datasets文件夹下，并在data_loader里添加相应的load代码。

uts_data (Univariate Weka formatted ARFF files and .txt files)
mts_data (Multivariate Weka formatted ARFF files (and .txt files))

Future Work

完善超参数优化部分

Example Projects

一个简单的示例项目：

Toxic comments classification using Convolutional Neural Networks and Word Embedding

Contributing

Any contributions are welcome including improving the project.

Acknowledgements

This project template is based on MrGemy95's Tensorflow Project Template.

project template： https://github.com/Ahmkel/Keras-Project-Template

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
NAS		NAS
NNI		NNI
attention		attention
base		base
configs		configs
data_loader		data_loader
ensembles		ensembles
evaluater		evaluater
figures		figures
img		img
models		models
opt		opt
trainers		trainers
utils		utils
.gitignore		.gitignore
LICENSE		LICENSE
RAdam.py		RAdam.py
README.md		README.md
__init__.py		__init__.py
bayes_main_classification.py		bayes_main_classification.py
bayes_main_classification_2.py		bayes_main_classification_2.py
cuda_test.py		cuda_test.py
dataset_summary.xlsx		dataset_summary.xlsx
from_config.py		from_config.py
grid_search_hyperparamters-2.py		grid_search_hyperparamters-2.py
grid_search_hyperparamters.py		grid_search_hyperparamters.py
main.py		main.py
main_classification.py		main_classification.py
main_classification_2.py		main_classification_2.py
main_classification_3.py		main_classification_3.py
main_forecasting.py		main_forecasting.py
nni_config_1.yml		nni_config_1.yml
nni_config_2.yml		nni_config_2.yml
nni_main_classification_1.json		nni_main_classification_1.json
nni_main_classification_1.py		nni_main_classification_1.py
nni_main_classification_2.json		nni_main_classification_2.json
nni_main_classification_2.py		nni_main_classification_2.py
nni_search_space_1.json		nni_search_space_1.json
nni_search_space_2.json		nni_search_space_2.json
parallel.py		parallel.py
test_gpu.py		test_gpu.py
test_vis.py		test_vis.py
tttt.py		tttt.py
vis_overfit_trainingsize.py		vis_overfit_trainingsize.py
vis_training_size.py		vis_training_size.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

keras-project

项目简介：

classification模型

regression模型

目录

项目介绍

项目结构

文件结构

主要组成部分

Data Loaders

Models

Trainers

Evaluaters

Configs

Main

项目运行

例1.时序数据上的classification任务：

例2. 使用NNI进行classification任务超参数优化：

Comet.ml设置

数据集

Future Work

Example Projects

Contributing

Acknowledgements

About

Releases

Packages

Languages

License

Neronjust2017/DL-TSC

Folders and files

Latest commit

History

Repository files navigation

keras-project

项目简介：

classification模型

regression模型

目录

项目介绍

项目结构

文件结构

主要组成部分

Data Loaders

Models

Trainers

Evaluaters

Configs

Main

项目运行

例1.时序数据上的classification任务：

例2. 使用NNI进行classification任务超参数优化：

Comet.ml设置

数据集

Future Work

Example Projects

Contributing

Acknowledgements

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages