Skip to content

napoler/Chinese-relation-extraction

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Chinese-relation-extraction

This code is based on the paper: Chinese Open Relation Extraction and Knowledge Base Establishment

由于中文数据太少,一些监督学习方法往往没有足够的数据来进行训练。

这篇论文利用一些语法分析规则和实体识别结果进行实体间关系的抽取。

命名实体识别以及句法分析选择直接使用 pyltp库

具体实体标注形式和句法关系见:(https://ltp.readthedocs.io/zh_CN/latest/appendix.html)

依赖

运行

relation_extraction.py: 包含七种不同的语法分析,能够根据句子来进行匹配,再依此生成关系三元组。

utils.py: 包含从文件中读取数据以及数据预处理的函数。

test.py: 运行示例。

  • 读取键盘输入并进行关系抽取:
python3 relation_extraction.py path_to_your_model
  • 抽取一个中文维基百科的json文件,默认为当前目录下的 wiki_00 文件:
python3 test.py path_to_your_model --file[optional] path_to_your_file

所有中文维基百科语料库json版下载地址:

点此直接下载

实验结果

  • 读取键盘输入:
  • 抽取wiki_00文件中的实体关系:

About

Chinese rule based relation extraction

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%