Skip to content

经济责任审计知识图谱:网络爬虫、关系抽取、领域词汇判定

Notifications You must be signed in to change notification settings

flyrae/economic_audit_knowledge_graph

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

9 Commits
 
 
 
 
 
 

Repository files navigation

经济责任审计知识图谱

还没有整理完,后面继续整理

从具体案例了解知识图谱构建流程

程序

存放经济责任审计知识图谱构建过程中的所有程序

数据

存放最终使用的数据

说明

数据来源

所有实体数据来源于互动百科

关系数据分两部分,一部分是从wikidata中直接爬的

另一部分是使用程序抽取的事实三元组,将所有新闻数据和词条解释都进行实体关系抽取

事实三元组抽取程序传送门:基于依存分析的实体关系抽取程序

构建流程

image

效果展示

实体查询

image

image

关系查询

image

image

image

使用

数据文件夹中的数据导入neo4j数据库

实体信息导入程序:https://github.com/mengxiaoxu/economic_audit_knowledge_graph/tree/master/程序/实体信息导入程序

关系数据导入:

# 导入关系数据
LOAD CSV  WITH HEADERS FROM "file:///relation.csv" AS line
MATCH (entity1:Hudong{title:line.Hudong1}) , (entity2:Hudong{title:line.Hudong2})
CREATE (entity1)-[:RELATION { type: line.relation }]->(entity2)

# 添加索引
CREATE CONSTRAINT ON (c:Hudong)
ASSERT c.title IS UNIQUE

可以参考:农业知识图谱说明

感谢

汉语言处理包HanLP

中文文本分类

农业知识图谱

事实三元组抽取

开放中文实体关系抽取

中文自然语言处理相关资料

About

经济责任审计知识图谱:网络爬虫、关系抽取、领域词汇判定

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • JavaScript 60.4%
  • Python 16.6%
  • CSS 13.8%
  • HTML 8.7%
  • CoffeeScript 0.3%
  • Java 0.2%