本仓库用于存放我个人所需要的和收集的自然语言处理以及部分其他领域的资源合集。
- CMU / CS 11-747 Spring 2019
- d2l-ai/d2l-zh - 《动手学深度学习》:面向中文读者、能运行、可讨论。
- dsgiitr/d2l-pytorch - This project reproduces the book Dive Into Deep Learning
- Deep Learning Book
- Deep Learning Book中文版
- Doraemonzzz / Learning-from-data - 记录Learning from data一书中的习题解答
- eastlakeside / Python进阶中文版
- fengdu78 / lihang-code - 《统计学习方法》的代码实现
- fly51fly / Practical_Python_Programming - 北邮《Python编程与实践》课程资料
- fly51fly / Principle-of-Web-Search - 北京邮电大学“网络搜索原理”课程资料(2019)
- huzecong / oi-slides - 信息学竞赛讲课课件
- librauee / Reptile - Python3网络爬虫实战
- NiuTrans / MTBook - 机器翻译:统计建模与深度学习方法
- npubird / KnowledgeGraphCourse - 东南大学《知识图谱》研究生课程
- 邱锡鹏 / 神经网络与深度学习
- Stanford / CS224n Spring 2019
- Stanford / Speech and Language Processing 3rd
- TingsongYu / PyTorch_Tutorial - PyTorch模型训练实用教程
- Zhiyuan Liu / research_tao - NLP研究入门之道
- Zhiyuan Liu / Representation Learning for Natural Language Processing
- zxdefying / pytorch_tricks - some tircks for PyTorch
- nlp-tutorial - 基于PyTorch的深度学习NLP入门代码
- NLP-Projects - NLP多种类型项目合集
- Pandas cookbook - pandas入门教程
- PyTorch Tutorial - PyTorch入门教程
- AllenNLP - Allen团队开发的基于PyTorch的NLP框架,其中有包括ELMo等多种模型实现
- fastNLP - 复旦大学深度学习自然语言处理框架
- flair - 轻量级NLP框架
- Jiagu - 基于BiLSTM实现的中文深度学习自然语言处理工具,提供多种中文信息处理基本功能
- Kashgari - 基于Keras的精简自然语言处理框架,可用于文本标注与文本分类任务,值得一试
- PyText - Facebook开源的基于PyTorch的自然语言处理框架
- StanfordNLP - 斯坦福大学基于PyTorch开发的自然语言处理工具,可用于分词、序列标注等任务,Stanford CoreNLP的深度学习版替代品
- tensor2tensor - Google研究团队深度学习模型和相关数据集的集中代码仓库,包含多种NLP模型
- tensorflow models - Google模型存放仓库
- TorchNLP - 基于PyTorch和TorchText实现的深度学习自然语言处理库
相关内容已另行整理至ATPapers
相关内容已另行整理至MTPapers
相关内容已另行整理至NERPapers
相关内容已另行整理至MRCPapers
相关内容已另行整理至ABSAPapers
相关内容已另行整理至MatchPapers
相关内容已另行整理至TCPapers
- pycorrector - 中文文本纠错工具
- BertQA - 斯坦福大学BertQA实现
- ChatBotCourse - 自己动手做聊天机器人教程
- kbqa - 基于知识库的问答系统实现
- OpenNRE - 清华开源的关系抽取框架(原基于TensorFlow,2.0版本已迁移到PyTorch)
- OpenNRE-PyTorch - 上一项目的PyTorch版本
- CasRel - A Novel Cascade Binary Tagging Framework for Relational Triple Extraction. Accepted by ACL 2020.
- lightKG - 他人基于PyTorch和TorchText实现的知识图谱技术框架
- AdeDZY / DeepCT - DeepCT and HDCT uses BERT to generate novel, context-aware bag-of-words term weights for documents and queries
- AimeeLee77 / keyword_extraction - 使用tfidf、TextRank和word2vec实现中文关键词抽取
- sunyilgdx / SIFRank_zh - 基于预训练模型的中文关键词抽取方法
- THUNLP / BERT-KPE - BERT for Keyphrase Extraction
- Baidu / DDParser
- yzhangcs / parser - A collection of state-of-the-art syntactic parsing models based on Biaffine Parser
- RegExr - 正则表达式在线学习、测试与分析网站
- Regex Golf - 非常好用的经典正则表达式练习网站
- Apache OpenNLP - Apache开源的Java统计自然语言处理工具包
- FudanNLP - 复旦大学开源的统计自然语言处理工具包
- HTK - 基于马尔可夫模型开发的语音识别工具包
- Jieba - 结巴分词是Python最常用中文分词
- KenLM - 统计语言模型工具
- LTP - 哈工大社会计算与信息检索研究中心开源的统计自然语言处理工具包ji
- MALLET - 马萨诸塞大学开源的Java统计自然语言处理工具包
- NLTK - 针对英文的工具包
- Pan Gu Segment - 盘古开源中文分词
- Stanford CoreNLP - 斯坦福大学开源的统计自然语言处理工具包
- 425776024 / nlpcda - 一键中文数据增强包
- attardi / wikiextractor - A tool for extracting plain text from Wikipedia dumps
- BeautifulSoup - 爬虫常用的HTML和XML数据提取工具
- Gerapy / GerapyAutoExtractor - Auto Extractor Module
- jbesomi / Texthero - Text preprocessing, representation and visualization from zero to hero
- seatgeek / FuzzyWuzzy - Fuzzy String Matching in Python
- SpeechBrain
- yongzhuo / Macropodus - 自然语言处理工具Macropodus,基于Albert+BiLSTM+CRF深度学习网络架构
此处仅提供NLP相关站点,优秀博客请链接blog.md。
- AI研习社
- NLP Progress
- NLPJob
- 专知
- 机器之心SOTA模型
- AI Deadlines - AI conference deadline countdowns
- 相关内容已另行整理至awesome_list.md
- CDCS - Chinese Data Competitions Solutions - 中国数据竞赛优胜解集锦
- AI-Sphere / Awesome-Noah - Awesome Top Solution List of Excellent AI Competitions
- datawhalechina / competition-baseline - 数据科学竞赛各种baseline代码、思路分享
- LogicJake / MLCompetitionHub - Machine learning competition information aggregation
- Smilexuhc / Data-Competition-TopSolution
- zhpmatrix / nlp-competitions-list-review - 复盘所有NLP比赛的TOP方案
相关内容已另行整理至nlp_corpus.md