Skip to content

利用pandas将excel中数据抽取,以三元组形式加载到neo4j数据库中构建相关知识图谱

Notifications You must be signed in to change notification settings

leavesyxh/neo4j-python-pandas-py2neo-v3

 
 

Repository files navigation

neo4j-python-pandas-py2neo-v3

利用pandas将excel中数据抽取,以三元组形式加载到neo4j数据库中构建相关知识图谱

Neo4j知识图谱构建

1.运行环境:

python3.6.5
windows10
具体包依赖可以参考文件requirements.txt

pip install -r requirements.txt

2.Pandas抽取excel数据

Excel数据结构如下

通过函数data_extraction和函数relation_extrantion分别抽取构建知识图谱所需要的节点数据以及联系数据,构建三元组。
数据提取主要采用pandas将excel数据转换成dataframe类型
invoice_neo4j.py

3.建立知识图谱所需节点和边数据

DataToNeo4jClass.py


2019.2.15更新

更新neo4j_matrix.py代码,将知识图谱中数据抽取转化成矩阵,为机器学习模型提供数据

Enjoy it!

About

利用pandas将excel中数据抽取,以三元组形式加载到neo4j数据库中构建相关知识图谱

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%