Awesome Chinese NLP 这个项目整合了常用中文NLP资源,主要分为四类: 工具:对已有工具的集成或用词典等方式实现的功能,例如:DFA敏感词识别、LTP功能集成、句子相似度计算等; 模型:常用分类模型和抽取模型; 数据:词向量、数据集、词库等; 学习资源:NLP相关学习资源。 工具 TOOLS 工具按照输入文本的类型进行分类,每个类型的主要任务包括: 长文档: 敏感词识别 情感分析 文本摘要 长文档分句 两个句子: 句子相似度计算 一个句子: 敏感词识别 情感分析 ltp工具集成(分词、词性分析、命名实体识别、语义依存分析) 信息(时间、数字等) 词/字段: 输入姓名判断性别 模型 MODELS TODO 数据 DATA 词向量 词库 数据集 学习资源 STUDY 常用框架 数学基础 机器学习