本项目广招有志于推动NLP竞赛的开源爱好者,共建NLP开放社区。有无NLP基础皆可,有意者请通过receive@nlper-arsenal.cn联系我们。
NLP人军火库,主要收录NLP竞赛策略实现、各任务教程、经验贴、学习资料以及会议时间等,如果对你有帮助,请给我们一个star。
本项目主要包含以下内容:
- NLPer-Arsenal-Code (2021.12)
- NLPer-Arsenal-Post(2021.03)
- 其它
项目正在不断完善,如果您有什么建议,欢迎到issue 留言,或通过问卷 ,邮箱(receive@nlper-arsenal.cn)联系我们,同时我们也欢迎大家加入我们的项目。
所有内容均由我们从网络公开资料中收集整理得到,版权归原作者所有,如有侵权请立即与我们联系,我们将及时处理。
整理不易,转载时请务必备注本项目github链接,感谢您为维护良好的开源环境出一份力。
- 2021.3:开始更新本项目
- 2021.6:开放notion界面,NLPer-Arsenal-Notion (已暂停更新该页面)
- 2021.12:NLPer-Arsenal-Code 发布
记录当前正在进行的竞赛,奖金丰厚,适合有一定基础的NLPer;结束时间为官网标准时间或会议召开时间。
领域/会议 | 竞赛 | 报名时间 | 结束时间 |
---|---|---|---|
CCKS2022 | 官网:http://sigkg.cn/ccks2022/?page_id=22 一、信息抽取: 1. 千言通用信息抽取竞赛评测 2. 多语言命名实体识别 3. 基于知识图谱的优质文章识别 二、知识图谱构建与问答 4. 带条件的分层级多答案问答 5. 开放知识图谱问答 6. 跨语言知识图谱问答评测任务 7. 教科书示意图问答 8. 化学元素知识图谱构建及应用 三、商务金融知识图谱 9. 面向金融领域的Zero-Shot事件抽取 10. 面向数字商务的知识图谱评测(1 、2 、3 ) 11. 面向金融领域的因果事件要素抽取及事件相似度计算 12. 金融NL2SQL评测任务 四、军事知识图谱 13. 开源多模态军事装备数据的事件要素抽取 14. 外军无人系统知识图谱构建评测任务 五、知识存储 15. 基于图数据库的自定义图分析算法评测 |
2022.7.25之前 | 2022.8.25~8.28 |
语言与智能技术竞赛 | 段落检索 知识对话 情感可解释评测 视频语义理解 |
2022.3.30~5.30 | 2022.8 |
推荐 | 2022搜狐校园 情感分析 × 推荐排序 算法大赛 | 2022.3.28~5.20 | 2022.6 |
NLPCC2022 | 官网:http://tcci.ccf.org.cn/conference/2022/cfpt.php 任务1:基于知识模型的智能问答 任务2:语音实体链接 任务3:多模态产品摘要 任务4:基于视频的对话生成 任务5:科技文献分类与信息抽取 |
2022.3.15~5.5 | 2022.9.22~9.23 |
检索 | “阿里灵杰”问天引擎电商搜索算法赛 | 2022.3.2-4.10 | 2022.6.1 |
机器翻译 | 2022 NAACL同传Workshop:千言 - 机器同传 CCMT2022机器翻译评测 |
2022.3.7-5.1 2022.3.15-4.30 |
2022.7.15 2022.8(离线评测)/2022.12.15(在线评测) |
图文匹配&实体识别 | 全球人工智能技术创新大赛 算法挑战赛 | 2022.2.25-4.21 | 2022.6中下旬 |
实体识别 | NBME - Score Clinical Patient Notes | 2022.2.1-4.26 | 2022.5.3 |
DravidianLangTech @ACL2022 | 官网:https://dravidianlangtech.github.io/2022/ 任务1:Toxic Span Identification in Tamil subtask 1: Supervised Offensive Span Identification subtask 2: Semi-Supervised Offensive Span Identification 任务2:Emotion Analysis in Tamil 任务3:Abusive Comment Detection in Tamil 任务4:Multi-task Learning for Dravidian Languages subtask 1: Multi-task Learning for sentiment analysis and Offensive language identification in Dravidian languages subtask 2: Meta-Learning in Dravidian languages subtask 3: Zero-shot offensive language identification in Telugu 任务5:Multimodal Sentiment Analysis in Dravidian Languages |
2021.11.21- | 2022.5.28 |
LT-EDI@ACL2022 | 官网:https://sites.google.com/view/lt-edi-2022/home 任务一:Hope Speech Detection for Equality, Diversity and Inclusion 任务二:Homophobia/Transphobia Detection in social media 任务三:Speech Recognition for Vulnerable Individuals in Tamil 任务四:Detecting Signs of Depression from Social Media Text |
2021.11.21- | 2022.5.26 |
NLGIW 2021 | 官网:http://nlgiw.cipsc.org.cn 任务一:面向事实一致性的生成评测 任务二:基于大纲的条件故事生成 任务三:面向图像描述生成自动评测方法 任务四:中文句法错误检测技术评测 |
2021.8.3-10.31 2021.10.10-10.20 2021.10.10-10.20 2021.10.20-11.1 |
会议延期至2022.4 |
中文医疗信息处理挑战榜CBLUE | 目前任务包括医学文本信息抽取(实体识别、关系抽取)、医学术语归一化、医学文本分类、医学句子关系判定和医学QA共5大类任务8个子任务,-> 官网 | 现在 | 暂无 |
记录长期进行的训练赛,有排行榜,方便刚入门的NLPer练手
这里记录整理好的竞赛,包含数据下载以及竞赛方案
学界、业界、理论、实践以及时事动态,NLPer都应该有所了解
平台 | 主要领域 | 自媒体 |
---|---|---|
微信公众号 | 技术 | Coggle数据科学、DataFunTalk |
行业信息 | 机器之心、机器之能、AI报道、AI前线、AI科技评论、机器学习研究组订阅 | |
理论 | 科学空间、PaperWeekly、智源社区、人工智能前沿讲习、专知、AINLP、AI TIME 论道 | |
BiliBili | 前沿论坛 | 智源社区、AITIME论道 |
网站 | 竞赛 | Coggle数据科学 |
学术 | Paper With Code 、AMiner学术头条 |
结合个人情况使用不同的GPU平台
平台 | 算力 | 价格 | 说明 |
---|---|---|---|
BitaHub | 1080Ti、titan xp、3090、V100 | 1080Ti(¥0.7/h)、titan xp(¥1/h)、3090(¥2.5/h)、V100(¥4.5/h) | 中科大先研院的平台,价格实惠,但一块GPU只搭配2核CPU,通过提交任务,按运行时间收取费用 |
智星云 | 1080Ti、3080、3090、V/A100等 | ¥2.1/h~¥11/h | 整机,可远程连接(pycharm/vs code) |
沣云平台 | ML270 | ¥2.8/h | 一站式AI计算平台,CPU可以增量配置,按运行时间收取费用 |
恒源云 | 2080Ti、3060、3090、V100等 | ¥1.25/h~¥5.5/h | 可以搭配完整的CPU和硬盘,相比bithub有更高的自由度,目前处于推广期,有很多优惠 |
并行云 | V100、2080Ti、P100等 | 不明 | 计算节点来自超算,可个性化定制CPU核数、GPU、存储空间,有非常简便的操作界面,并且提供远程linux桌面,灵活度优于以上三个平台。目前处于推广期,有很多优惠 |
AI Studio | V100 | 基本免费 | 由百度开发, 偶尔申请不到V100,最高可免费8卡。主要使用飞桨PaddlePaddle框架,其它框架需自行折腾,也可用X2Paddle一键转为飞桨的代码和模型,大部分比赛参与即送算力卡。 |
天池DSW | p100 | 免费,单次限时8小时,不限次数 | 阿里的一个在线平台,运行时不能关闭 |
天池实验室 | V100 | 免费,60h/年 | 相比于AI Studio不限制深度学习框架,就是时间比较短 |
Kaggle | k80 | 免费,每周限时30小时 | 外网访问 |
Google Colab | k80、T4、P4、P100 | 免费,单次限时12小时 | 外网访问,无法指定具体GPU,未订阅Colab Pro用户多数时间下估计会被分配k80 |
- 阿里天池 :阿里,奖金丰厚
- AI Studio :百度AI Studio深度学习社区,成绩优异可获得飞桨开发者技术专家(PPDE) 认证申请绿色通道。
- 讯飞开发平台 :科大讯飞
- DataFountain : CCF指定专业大数据及人工智能竞赛平台,有很多训练赛
- 图灵联邦 :NLP竞赛不多
- biendata : 国内领先的人工智能竞赛平台,包含大量NLP学术评测
- FlyAI-AI竞赛服务平台 :难度分为新手、简单、中等、精英、困难,有大量GPU算力可供获取,奖金不多,但适合练手
- 和鲸社区 :一个综合的学习平台
- ACL、EMNLP、NLPCC、CCL、CCKS、SMP等会议每年都会举办相关学术评测
- Codalab :一个可重复计算平台,很多国外的竞赛都会在上面提交代码用于检验
- DCLab :和天池比较像
- AI研习社 :很多很多NLP竞赛
中国计算机学会推荐国际学术会议和期刊目录-2019
中国计算机学会推荐中文科技期刊目录
dblp:计算机科学文献库
AI会议deadline :会议倒计时
会议时间记录表 :Updated by Jackie Tseng, Tsinghua Computer Vision and Intelligent Learning Lab
note:以下时间为官网默认时间,暂未换算成北京时间
会议 | 级别 | 摘要截稿 | 原文截稿 | 审稿通知 | 开会时间 | 说明 |
---|---|---|---|---|---|---|
ICLR(官网、dblp) | * | 2022.1.24 (final) |
2022, 4.25~4.29 | online | ||
ACL(官网、dblp) | CCF-A | 2022,5.22~5.27 | Dublin, Ireland | |||
NeurIPS(官网、dblp) | CCF-A | 2022.5.16 | 2022.5.19 | 2022.9.14 | 2022.11.28~12.9 | Hybrid |
ICML(官网、dblp) | CCF-A | 2022.3.2 & 2022.5.4 | 2022,7.17~7.23 | Baltimore, Maryland USA | ||
SIGIR(官网、dblp) | CCF-A | 2022.1.21(long paper) |
2022.1.28(long paper) |
2022.3.31(long paper) |
2022.7.11~7.15 | Madrid, Spain |
WWW(官网、dblp) | CCF-A | 2022,4.25~4.29 | Lyon,France | |||
AAAI(官网、dblp) | CCF-A | 2021.11.29 (final) |
Vancouver,Canada | |||
IJCAI(官网、dblp) | CCF-A | 2022.3.16~3.29(rebutal) 2022.4.20(final) |
2022,7.23~7.29 | Vienna, Austria | ||
EMNLP(官网、dblp) | CCF-B | 2022.6.17 | 2022.6.24、7.24(ARR paper) | 2022.8.23~8.29(rebuttal)、2022.10.6 | 2022, 12.7~12.11 | Abu Dhabi |
NAACL(官网、dblp) | CCF-C | 2022, 7.10~7.15 | Seattle, Washington | |||
COLING(官网、dblp) | CCF-B | * | 2022.5.17 | 2022.8.15 | 2022,10.12~10.17 | Gyeongju, Korea |
CoNLL(官网、dblp) | CCF-C | * | same as emnlp | |||
NLPCC(官网、dblp) | CCF-C | * | 2022.5.9 | 2022.7.4 | 2022, 9.22~9.25 | 青岛 |
ICONIP(官网) | CCF-C | * | ? | ? | 2022.11.22~11.26 | india |
ACML(官网) | CCF-C | * | ? | ? | 2022.11 | Hyderabad, India |
AACL(官网) | * | * | 2022.7.15 | 2022.8.15~21(rebutal) 2022.9.20(accept or not) |
2022.11.21~11.24 | 台北 |
EACL(官网、dblp) | * | * | * | * | * | 合并至ACL2022 |
CCL(官网、dblp) | * | * | 2022.6.1 2022.7.1(ARR投稿) |
2022.7.15 | 2022.10.14~10.16 | 南昌 |
CCKS(官网、dblp) | * | * | 2022.5.22 | 2022.7.3 | 2022.8.25~8.28 | 秦皇岛 |
SMP(官网、dblp) | * | * | 延期至2022年上半年 | 北京 | ||
CCIR(官网) (未定) | * | * | 2022.6.10 | 2022.7.10 | 2022.9.16~9.18 | 重庆 |
CCMT(官网) | * | * | 2022.6.5 | 2021.7.10 | 2022.8.6~8.10 | 西藏拉萨 |
WISE(官网) | * | Melbourne, Australia |