In [1]:
from py2neo import Graph, Node, Relationship
import csv
import re
from tqdm import tqdm

In [2]:
# Kết nối đến Neo4j
graph = Graph("bolt://localhost:7687", auth=("neo4j", "12345678"))

In [7]:
# Optional: xóa toàn bộ dữ liệu cũ
graph.run("MATCH (n) DETACH DELETE n")

In [8]:
error_count = 0
CSV_FILE = "coco_kg_triplets.csv"

with open(CSV_FILE, "r", encoding="utf-8") as f:
    reader = list(csv.DictReader(f))

for i, row in tqdm(enumerate(reader), total=len(reader)):
    try:
        subj = row["subject"].strip().lower()
        rel = row["relation"].strip().lower()
        obj = row["object"].strip().lower()
        img_id = row["image_id"]
        caption = row["caption"]

        rel_type = re.sub(r"[^a-zA-Z0-9]", "_", rel.upper())
        if not rel_type or rel_type.isdigit():
            continue

        subj_node = Node("Entity", name=subj)
        obj_node = Node("Entity", name=obj)

        graph.merge(subj_node, "Entity", "name")
        graph.merge(obj_node, "Entity", "name")

        rel_obj = Relationship(subj_node, rel_type, obj_node)
        rel_obj["image_id"] = img_id
        rel_obj["caption"] = caption

        graph.create(rel_obj)

    except Exception as e:
        error_count += 1
        print(f"❌ Lỗi tại dòng {i}: {e}")
        print(f"   ↳ {subj} -[{rel_type}]-> {obj}")
        print(f"   ↳ Caption: {caption}\n")

print(f"✅ Hoàn tất insert từng dòng. Số lỗi: {error_count}")

 59%|██████████████████████████████████████████████▌                                | 971/1649 [00:17<00:10, 65.65it/s]

❌ Lỗi tại dòng 967: list index out of range
   ↳ person -[COLOR]-> umbrella
   ↳ Caption: A person holding a rainbow colored umbrella on a city street.



 60%|███████████████████████████████████████████████▏                               | 984/1649 [00:18<00:14, 44.61it/s]

❌ Lỗi tại dòng 974: list index out of range
   ↳ person -[DRINK]-> bottle
   ↳ Caption: A person with a cool tie drinks a bottle of water.



 62%|████████████████████████████████████████████████▏                             | 1018/1649 [00:18<00:13, 47.76it/s]

❌ Lỗi tại dòng 1010: list index out of range
   ↳ person -[WIH]-> dog
   ↳ Caption: a person in a field wih a dog with a frisbee



 67%|███████████████████████████████████████████████████▉                          | 1098/1649 [00:20<00:11, 49.38it/s]

❌ Lỗi tại dòng 1094: list index out of range
   ↳ person -[FIX]-> skis
   ↳ Caption: A person helping another person fix their skis. 



 69%|█████████████████████████████████████████████████████▋                        | 1136/1649 [00:21<00:11, 43.74it/s]

❌ Lỗi tại dòng 1129: list index out of range
   ↳ person -[SEE]-> dog
   ↳ Caption: While looking in the rear view mirror this person saw their dog with his head out the window.



 73%|█████████████████████████████████████████████████████████▏                    | 1210/1649 [00:22<00:10, 41.19it/s]

❌ Lỗi tại dòng 1207: list index out of range
   ↳ person -[PREPARE]-> horse
   ↳ Caption: A person is preparing a horse for a show.



 78%|████████████████████████████████████████████████████████████▍                 | 1278/1649 [00:24<00:07, 49.35it/s]

❌ Lỗi tại dòng 1268: list index out of range
   ↳ person -[PREPARE]-> sandwich
   ↳ Caption: A knife wielding person prepares a meat and cheese sandwich.



 78%|█████████████████████████████████████████████████████████████                 | 1292/1649 [00:24<00:07, 49.19it/s]

❌ Lỗi tại dòng 1284: list index out of range
   ↳ person -[PEEL]-> banana
   ↳ Caption: A person wearing lots of jewelry is peeling a banana.



 80%|██████████████████████████████████████████████████████████████▋               | 1326/1649 [00:25<00:07, 45.99it/s]

❌ Lỗi tại dòng 1320: list index out of range
   ↳ person -[PIERCE]-> apple
   ↳ Caption: A person is piercing an apple with a small, sharp knife.

❌ Lỗi tại dòng 1323: list index out of range
   ↳ person -[PEEL]-> banana
   ↳ Caption: A person is peeling a banana beside a glass of milk. 

❌ Lỗi tại dòng 1324: list index out of range
   ↳ person -[PEEL]-> banana
   ↳ Caption: The person is peeling their banana to eat with milk.

❌ Lỗi tại dòng 1326: list index out of range
   ↳ person -[PLACE]-> carrot
   ↳ Caption: A person is placing a carrot next to the small snowman. 



 85%|██████████████████████████████████████████████████████████████████▎           | 1403/1649 [00:26<00:04, 54.76it/s]

❌ Lỗi tại dòng 1394: list index out of range
   ↳ person -[OLLIE]-> skateboard
   ↳ Caption: A young person ollies his skateboard in black and white.



 91%|███████████████████████████████████████████████████████████████████████       | 1502/1649 [00:28<00:03, 42.38it/s]

❌ Lỗi tại dòng 1492: list index out of range
   ↳ person -[RID]-> surfboard
   ↳ Caption: A person approaching the beach ridding a surfboard on a small wave.



100%|██████████████████████████████████████████████████████████████████████████████| 1649/1649 [00:31<00:00, 53.17it/s]

✅ Hoàn tất insert từng dòng. Số lỗi: 14



