GitHub - awk256/neo4j-lab-semantic-model

概要

本リポジトリは、「大規模言語モデルによるナレッジグラフ自動化の概念検証」を目的とした実験コードをまとめたものです。

本シリーズは、クリエーションライン社のテックブログにて連載中です。このリポジトリでは、その第2回目の記事に対応するデータとコードを公開しています。

本検証では、テキストデータから知識構造を抽出・可視化し、企業内に点在する情報資源を「グラフ」として再構成する可能性を探っています。 LLMによるテキスト解析とコード処理を分離し、それぞれの役割を明確化する構成を試みました。実験素材として、自社テックブログをデータソースに使用し、より現実に近い構造を対象に検証を行っています。

実装を通して得られた知見としては、以下の点が挙げられます：

LLM はグラフデータモデリングに有効である
セマンティックモデル設計には人のチューニングが必要である
モデルが確立すれば、記事からのグラフ生成を自動化できる可能性が見えてきた

本リポジトリは、GraphRAG（Graph-based Retrieval-Augmented Generation）などの関連技術との連携も視野に、継続的な概念検証を進めるための基盤となります。

実行環境

本リポジトリのコードは、以下の環境で実行しています。

Ubuntu 22.04.5 LTS(Windows11のWSL)
Python 3.11
Neo4j 5.24（5.13以上）
Claude Sonnect 4
- OpenAIなど別のAPIキーの場合、AIを利用して接続部分のコード変更してください

基本パッケージのインストール

pip install -r requirements.txt

APIキー設定

echo "API_KEY=" > .env

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
cypher_output		cypher_output
files		files
graph_extract		graph_extract
script		script
semantic		semantic
source_data		source_data
.gitignore		.gitignore
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

概要

実行環境

基本パッケージのインストール

APIキー設定

About

Uh oh!

Releases

Packages

Languages

awk256/neo4j-lab-semantic-model

Folders and files

Latest commit

History

Repository files navigation

概要

実行環境

基本パッケージのインストール

APIキー設定

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages