Switch branches/tags
Nothing to show
Find file History
huqian
Latest commit a424ef8 Sep 12, 2018

README.md

AI Challenger Sentiment Analysis Baseline

功能描述

本工程主要用于为参赛者提供一个baseline,方便参赛者快速上手比赛,主要功能涵盖完成比赛的全流程,如数据读取、分词、特征提取、模型定义以及封装、 模型训练、模型验证、模型存储以及模型预测等。baseline仅是一个简单的参考,希望参赛者能够充分发挥自己的想象,构建在该任务上更加强大的模型。

开发环境

  • 主要依赖工具包以及版本,详情见requirements.txt

项目结构

  • src/config.py 项目配置信息模块,主要包括文件读取或存储路径信息
  • src/data_process.py 数据处理模块,主要包括数据的读取以及处理等功能
  • src/model.py 模型定义模块,主要包括模型的定义以及使用封装
  • src/main_train.py 模型训练模块,模型训练流程包括 数据读取、分词、特征提取、模型训练、模型验证、模型存储等步骤
  • src/main_predict.py 模型预测模块,模型预测流程包括 数据和模型的读取、分词、模型预测、预测结果存储等步骤

使用方法

  • 配置 在config.py中配置好文件存储路径
  • 训练 运行nohup python main_train.py -mn your_model_name & 训练模型并保存,同时通过日志可以得到验证集的F1_score指标
  • 预测 运行nohup python main_predict.py -mn your_model_name $ 通过加载上一步的模型,在测试集上做预测