# 1. 그래프 RAG 개요
- 그래프 RAG는 기존 RAG 시스템의 한계를 극복하기 위해 새롭게 개발된 모델로, 지식 그래프를 활용하여 정보 간의 관계를 더 깊이 이해하고 처리하는 방식입니다.
- 복잡한 데이터 간의 연결성을 파악하여 다층적인 질의응답이 가능하도록 합니다.

## 1.1 기존 RAG 방식의 한계
### 1. 정보 연결의 어려움
- 기존 RAG는 질문에 답하기 위해 개별 문서에서 정보를 검색할 수 있지만, 데이터 간의 관계를 부넉하여 새로운 통찰을 제공하는데 한계가 있습니다.
- 정보 조각을 연결하여 전체적인 의미를 도출하는 능력이 부족합니다.
- 예) 이 문서의 주요 주제는 무엇인가요?
- 기존 RAG시스템에서는 나누어진 개별 문서에서 특정 소주제나 키워드를 검색할 수 있습니다.
- 검색된 정보들은 각각 개별적으로 제공될 뿐, 데이터셋 전체에서 이러한 정보들이 어떻게 연결되고 전반적인 패턴이 무엇인지에 대해서는 알지 못합니다.
### 2. 대규모 데이터 이해의 한계
- 기존 RAG 시스템은 데이터의 규모가 클수록 개념들을 전체적으로 파악하는 데 어려움을 겪습니다. 다음 질문이 주어졌다고 생각해 봅시다.
- 예) "지난 10년간의 연간 보고서를 바탕으로 회사의 지속가능성 전략 변화를 설명해주세요."
- 기존 RAG는 연간 보고서에서 개별 문서들을 얻을수 있지만, 독립적으로 이루어져 있으며, 각 문서 안의 내용들이 다른 문서들과 어떻게 연결되는지 알 수 없습니다.

### Graph RAG
- 그래프 RAG는 전체 텍스트 코퍼스에 대한 질문에 답하기 위해 지식 그래프와 RAG를 결합한 접근 방식입니다.
- 그래프 RAG는 지식 그래프를 활용해 개별 정보 조각들 간의 관계를 모델링함으로써, 데이터셋 전체에서 연결성과 패턴을 파악할 수 있습니다.
- 대규모 데이터셋의 구조적 관계를 분석함으로써, 시간 경과에 따른 변화나 전체적인 개념을 더 효과적으로 이해할 수 있습니다.


## 1.2 지식 그래프란?
- 그래프는 개체(노드)와 그들 사이의 관계(엣지)로 구성되어 있습니다.
- 단순한 연결 구조뿐만 아니라, 방향성과 가중치도 표현할 수 있습니다.
- 지식 그래프는 정보와 지식을 보다 구조화하여 표현하는 특별한 형태의 그래프로 확장되었습니다.
- 일반 그래프는 노드와 엣지만을 사용하여 연결 구조를 나타내긴 하지만, 의미나 속성 보다는 연결되어 있다는 사실만 표현하는 경우가 많습니다.
- 지식 그래프는 개체와 관계에 의미론적 정보를 부여하여 각 요소가 무엇을 의미하는지 명확하게 정의합니다.
    - 예) "아이폰", "애플" - 연결을 "개발"이라는 명확한 관계로 정의함
- 지식 그래프는 관계에 풍부한 속성을 부여할 수 있다는 점에서 일반 그래프와 차별화됩니다.
    - 예) 아이폰 - 출시일: 2007년, 운영체제: iOS, 디스플레이 크기:3.5인치
    - 예) '개발' - 개발시기: 2007년 이후, 개발 조건: iOS기반

#### 지식그래프 특징
- 단순한 관계 연결을 넘어 복잡한 정보 구조를 표헌할 수 있다는 점입니다. 또한 속성을 통해 관계를 더 풍부하게 표현할 수 있습니다.
- 직접적으로 연결되지 않은 정보 사이의 관계를 유추할 수 있습니다.
    - 예) 스티브 잡스가 애플을 공동 창업했다. 스티브 잡스가 픽사의 CEO였다
    - 스티브 잡스라는 노드를 중심으로 애플과 픽사가 연결되어 있음을 한눈에 파악할 수 있습니다.
    - 애플과 픽사 사이의 간접적인 연관성을 쉽게 추론할 수 있으며, 두 회사의 혁신적인 기업 문화나 창의적인 제품 개발 철학과 같은 공통점을 예측해볼 수도 있습니다.
- 효율적인 정보 검색입니다.
    - 예) 애플 노드에서 시작하여 이웃 노드인 맥북, 스티브 잡스, 팀 쿡등의 정보를 쉽게 검색할 수 있습니다.

In [17]:
import mermaid as md
from mermaid.graph import Graph
render = md.Mermaid("""
%%{init: {'theme':'dark'}}%%
flowchart LR
    A((팀쿡))
    B((애플))
    C((맥북))
    D((스티브잡스))
    A ---|CEO|B ---|개발| C
    B ---|공동 창업자| D
""")
render

- 지식 그래프의 장점을 적극적으로 활용하여, 단순한 키워드 매칭을 넘어 정보간의 복잡한 관계를 고려한 고급 추론 답변 생성을 수행합니다.

## 1.3 그래프 RAG의 동작과정
- 그래프 RAG 시스템은 먼저 그래프DB를 구축한 후, 사용자 질의에 따라 적절한 검색 방식을 적용하여 답변을 생성하는 방식으로 작동합니다.
- 그래프 DB 구축 단계에서는 문서 내용을 분석하여 지식 그래프를 생성합니다.
- 이 과정에서 문서에서 추출한 주요 개념과 그들 사이의 관계를 구조화하여 그래프 형태로 저장합니다.
- 이후 구축된 그래프 내에서 서로 밀접하게 연관된 개체들의 그룹을 찾아내고, 핵심 내용을 요약하여 정보검색을 효율적으로 수행할 수 있도록 합니다.
- 사용자가 질문을 하면 질문의 성격에 따라 2가지 검색방식을 사용합니다.
    - 로컬 검색: 질문과 직접적으로 관련된 개체들을 식별하고, 이들과 연관된 정보를 수집하여 상세한 답변을 제공합니다. 특정 주제나 세부 정보를 묻는 질문에 효과적입니다.
    - 글로벌 검색: 문서 전체를 아우르는 포괄적인 질문에 대해, 여러 커뮤니티 요약을 활용하여 종합적인 답변을 제공합니다.
- 그래프RAG는 방대한 문서 컬렉션에서도 관련성 높은 정보를 빠르게 찾아내고, 이를 바탕으로 포괄적이고 정확한 답변을 생성할 수 있습니다.