Skip to content

supercoderhawk/DeepNLP

Repository files navigation

深度学习工具库

本项目基于tensorflow,实现一些论文提出的基于深度学习的分词、命名实体识别和实体关系抽取模型。

本项目是在DNN_CWS的基础上进行开发。增加了实体关系抽取。

本项目目前有重构的计划

本项目迁移至DeepLearning_NLP,故本项目暂时停止维护

项目功能

  • 中文分词
  • 命名实体识别
  • 实体关系抽取

依赖

  1. python >= 3.5
  2. tensorflow>=1.2.0
  3. matplotlib>=1.5.3

语料库

文件夹corpus下:

  1. pku_training.utf8、pku_test.utf8: sighan 2005 bakeoff 北大分词库
  2. msr_training.utf8、msr_test.utf8: sighan 2005 bakeoff 微软亚洲研究院分词库
  3. msr_ner_training.utf8: sighan 2006 bakeoff 微软亚洲研究院命名实体识别语料库
  4. semeval_relation.utf8: International Workshop on Semantic Evaluation (SemEval) 2010 task 8 关系抽取数据集

参考论文

中文分词 && 命名实体识别

实体关系抽取

TodoList

  • 支持pip