In [5]:
import json
import os
import pandas as pd
from py2neo import Graph, Node, Relationship

In [6]:
# 连接到Neo4j数据库
year = "2024"
graph = Graph("bolt://localhost:7687", auth=("neo4j", "gzhu@ljh12138"), name=f"crg-{year}")

# 1.添加公司节点

In [None]:
# 1.添加公司节点
# 检查节点是否存在的函数
def company_exists(CID, stock_code):
    query = """
    MATCH (c:company)
    WHERE c.CID = $CID OR c.stock_code = $stock_code
    RETURN c
    """
    result = graph.run(query, CID=CID, stock_code=stock_code).data()
    return len(result) > 0  # 如果结果列表非空，则节点已经存在

# 创建节点的函数
def add_enterprise_node(CID, stock_code, short_name, full_name):
    if company_exists(CID, stock_code):
        print(f"公司节点已存在，ID: {CID}, 股票代码: {stock_code}")
        return
    # 创建带有"企业"标签的节点，并设置属性
    enterprise_node = Node("company",
                           CID=CID,
                           stock_code=stock_code,
                           short_name=short_name,
                           full_name=full_name
                        )
    # 将节点添加到数据库
    graph.create(enterprise_node)
    print(f"企业节点 {CID} {short_name} 添加成功!")
    
company_info = pd.read_csv("/home/ljh/RGEN_A/construction/company_info_4112.csv")
for i, row in company_info.iterrows():
    add_enterprise_node(i, row['ts_code'], row['name'], row['fullname'])

企业节点 0 国华网安 添加成功!
企业节点 1 深振业A 添加成功!
企业节点 2 全新好 添加成功!
企业节点 3 神州高铁 添加成功!
企业节点 4 美丽生态 添加成功!
企业节点 5 沙河股份 添加成功!
企业节点 6 深科技 添加成功!
企业节点 7 深圳能源 添加成功!
企业节点 8 大悦城 添加成功!
企业节点 9 深桑达A 添加成功!
企业节点 10 神州数码 添加成功!
企业节点 11 中国天楹 添加成功!
企业节点 12 华联控股 添加成功!
企业节点 13 中洲控股 添加成功!
企业节点 14 京基智农 添加成功!
企业节点 15 德赛电池 添加成功!
企业节点 16 深天马A 添加成功!
企业节点 17 华锦股份 添加成功!
企业节点 18 中金岭南 添加成功!
企业节点 19 农产品 添加成功!
企业节点 20 深圳华强 添加成功!
企业节点 21 北方国际 添加成功!
企业节点 22 中国长城 添加成功!
企业节点 23 华控赛格 添加成功!
企业节点 24 华侨城A 添加成功!
企业节点 25 ST特信 添加成功!
企业节点 26 海王生物 添加成功!
企业节点 27 盐田港 添加成功!
企业节点 28 天健集团 添加成功!
企业节点 29 广聚能源 添加成功!
企业节点 30 中信海直 添加成功!
企业节点 31 TCL科技 添加成功!
企业节点 32 中成股份 添加成功!
企业节点 33 丰原药业 添加成功!
企业节点 34 川能动力 添加成功!
企业节点 35 华数传媒 添加成功!
企业节点 36 常山北明 添加成功!
企业节点 37 国际实业 添加成功!
企业节点 38 东方盛虹 添加成功!
企业节点 39 许继电气 添加成功!
企业节点 40 冀东水泥 添加成功!
企业节点 41 金融街 添加成功!
企业节点 42 派林生物 添加成功!
企业节点 43 长虹华意 添加成功!
企业节点 44 胜利股份 添加成功!
企业节点 45 藏格矿业 添加成功!
企业节点 46 云鼎科技 添加成功!
企业节点 47 沈阳机床 添加成功!
企业节点 48 英特集团 添加成功!
企业节点 49 渤海租赁 添加成功!
企业节点 50 合百集团 添加成功!
企业节点 51 通程控股 添加成功!
企业节点 52 吉林化纤 添加成功!
企业节点 53 

# 2.添加新闻关系

In [None]:
# 2. 添加新闻关系
with open(f"/home/ljh/RGEN_A/construction/CRG/extracted_triples_codes_{year}_dup.txt", 'r') as f:
    for line in f:
        code1, relation, code2 = line.strip().split('\t')
        node1 = graph.evaluate("MATCH (c:company {stock_code: $stock_code}) RETURN c", stock_code=code1)
        node2 = graph.evaluate("MATCH (c:company {stock_code: $stock_code}) RETURN c", stock_code=code2)
        if node1 and node2:
            graph.create(Relationship(node1, relation, node2))
            print(f"关系 {code1} {relation} {code2} 添加成功!")
        else:
            print(f"节点 {code1} 或 {code2} 不存在，跳过")

关系 002812.SZ 供应商 002074.SZ 添加成功!
关系 688025.SH 供应商 600031.SH 添加成功!
关系 000623.SZ 投资 600881.SH 添加成功!
关系 300124.SZ 供应商 002850.SZ 添加成功!
关系 000059.SZ 供应商 300641.SZ 添加成功!
关系 001226.SZ 供应商 000680.SZ 添加成功!
关系 600346.SH 合作 600719.SH 添加成功!
关系 000062.SZ 合作 000810.SZ 添加成功!
关系 300722.SZ 供应商 601606.SH 添加成功!
关系 838402.BJ 合作 600732.SH 添加成功!
关系 300035.SZ 供应商 300037.SZ 添加成功!
关系 300918.SZ 投资 603558.SH 添加成功!
关系 301030.SZ 供应商 688223.SH 添加成功!
关系 000951.SZ 供应商 002126.SZ 添加成功!
关系 300014.SZ 投资 600098.SH 添加成功!
关系 300021.SZ 合作 002060.SZ 添加成功!
关系 002232.SZ 投资 601127.SH 添加成功!
关系 603605.SH 收购 600315.SH 添加成功!
关系 000801.SZ 供应商 600745.SH 添加成功!
关系 000062.SZ 合作 002920.SZ 添加成功!
关系 002735.SZ 供应商 300274.SZ 添加成功!
关系 603085.SH 合作 600418.SH 添加成功!
关系 300750.SZ 投资 300174.SZ 添加成功!
关系 600867.SH 投资 603087.SH 添加成功!
关系 002074.SZ 供应商 300035.SZ 添加成功!
关系 000528.SZ 供应商 600031.SH 添加成功!
关系 688367.SH 合作 002230.SZ 添加成功!
关系 002169.SZ 供应商 600995.SH 添加成功!
关系 002920.SZ 供应商 002881.SZ 添加成功!
关系 002882.SZ 供应商 600233.SH 添加成功!
关系 601669.SH 供应商 600089.