GitHub - msft-vivi/SMP2020---Weibo-sentiment-classification: SMP 2020年微博情感分类评测任务第六名解决方案

SMP-2020 Weibo sentiment classification

Rank

Finally Rank 6
如果觉得有帮助，请不要吝啬您的star

Our ideas

以roberta，roberta_wwm_ext,uer提供的mixed模型为预训练基础，在上面进行模型的微调得到baseline，之后根据任务的特点进行改进，最后对多个模型进行投票集成。

Project Introduction

clean_data.py：该文件负责将给出的数据进行清洗。
k_fold: 该目录下放置了模型的训练数据，usual下的train文件为测评发布的数据通过数据清洗后得到的数据，未进行train、dev的划分，模型训练过程中会在程序中划分，eval为验证数据，virus同理。
net：该目录下放置了本次测评的model.py 文件，如bert_bilstm_attention、bert_transfer_learning等。
convert_to_submission_format.py 该文件负责将单模型的oof_test文件转化为提交的格式。
macro_weight.py 该文件负责测试usual_k_fold_model 下所有模型的k折结果性能。
train_and_eval.py 该文件下包括了模型的train、evaluate、test函数，用于对模型的训练和测试。
utils.py 该文件下包括了模型的collate函数、set_logger函数，用于Dataset加载时格式的转化、设置日志等。
roberta_k_fold.py 该文件下包括了Processor类，Dataset类等，负责对数据的处理。convert_example_to_features函数，将文本数据转化为模型的输入特征。main函数负责结合上述各个部分，进行模型的训练和预测。
voting.py 该文件负责将usual_k_fold_model 下的结果进行投票集成，并输出在dev下的结果。（投票方法为模型输出的prob概率值的均值）
usual_k_fold_model 该目录会在程序运行后生成，目录下存放着各个模型的模型文件和验证集测试机的oof结果。
virus_k_fold_model 改目录功能同上。

How to run ?

运行 run_k_fold.sh 显存不足需要调整batch size，本队训练过程中均通过软batch将size设置为64，随机种子也已经固定。
运行 run_k_fold_test.sh 预测模型的oof文件，train过程也会生成对应结果。
运行 voting.py 会根据目录下各个模型的oof文件进行投票集成，并生成最终的结果。

Download Pretrained models

Contact Us

bravezhangw@163.com, 张同学
2725958627@qq.com, 杨同学

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
baseline		baseline
img		img
.gitattributes		.gitattributes
readme.md		readme.md
usual_result.txt		usual_result.txt
virus_result.txt		virus_result.txt
炬火-SMP2020-EWECT评测技术报告.docx		炬火-SMP2020-EWECT评测技术报告.docx

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

baseline

baseline

img

img

.gitattributes

.gitattributes

readme.md

readme.md

usual_result.txt

usual_result.txt

virus_result.txt

virus_result.txt

炬火-SMP2020-EWECT评测技术报告.docx

炬火-SMP2020-EWECT评测技术报告.docx

Repository files navigation

SMP-2020 Weibo sentiment classification

Rank

Our ideas

Project Introduction

How to run ?

Download Pretrained models

Contact Us

About

Releases

Packages

Languages

msft-vivi/SMP2020---Weibo-sentiment-classification

Folders and files

Latest commit

History

Repository files navigation

SMP-2020 Weibo sentiment classification

Rank

Our ideas

Project Introduction

How to run ?

Download Pretrained models

Contact Us

About

Topics

Resources

Stars

Watchers

Forks

Languages