numpy 和pytorch 做nlp任务 先用data下的.ipynb文本可视化分析文本。得到最基本的特征种类,长度等。 执行data_processing_util.py 将data 中的文本数据,转为归一化,向量化文本,存储在文件夹sources main 中可以集成训练。 /data/data_analysis.ipynb 预处理文本--data_process_util.py 模型--model 定义类对象 main.py 中main 训练过程