# RAG(Retrieval-Augemted Generation)의 개념

- LLM이 텍스트를 생성할 때 관련 정보를 찾아보고(retrival)
- 그 정보를 활용하여 새로운 텍스트를 만드는(generation) 기술
    - 예) RAG를 사용하는 LLM은 특정 질문에 답하기 위해 인터넷에서 정보를 검색하고 그 정보를 바탕으로 상세하고 정확한 답변을 생성할 수 있음

# RAG 구현 과정

- RAG는 정보 검색 과 텍스트 생성 이라는 두 가지 단계를 결합한 기술
    - 정보 검색 : AI가 대규모 정보로부터 관련 데이터를 찾는 과정
    - 텍스트 생성 : 찾은 정보를 기반으로 새로운 텍스트를 만드는 과정

## 정보 검색

1. 질문 입력
    - 사용자가 필요한 정보를 찾기 위해 입력한 질문이나 키워드를 쿼리(query)라고 함
    
2. 검색
    - 해당 쿼리와 관련된 정보를 데이터베이스나 인터넷에서 검색
    
3. 유사도 검색
    - 검색 엔진은 쿼리와 데이터베이스에 있는 문서들 사이의 유사도를 계산
    - 키워드 검색과 시맨틱 검색을 모두 포함
    
    - 키워드 검색(keyword search)
        - 사용자가 입력한 단어나 구를 데이터베이스나 인터넷에서 직접 찾는 방식
        - 입력한 키워드가 문서 내에 명시적으로 나타나는 경우를 결과로 반환
        - 사용자의 질문 의도나 문맥을 파악하지 못하고 관련 없는 결과를 보여주는 것이 단점
        
    - 시맨틱 검색(semantic search)
        - 단어의 의미와 문맥을 이해하여 보다 관련성 높은 결과를 제공하는 기술
        - 단어의 의미, 동의어, 주제, 사용자의 검색 의도 등을 고려하기 때문에 단어가 문서에 직접적으로 나타나지 않더라도 문맥상 관련 있는 결과를 찾아낼 수 있음
        - 키워드 검색보다 훨씬 복잡하며 의미를 정확히 이해하고 문맥을 파악하기 위해 고도의 알고리즘과 자연어 처리 기술이 필요
        
4. 랭킹 처리
    - 검색 결과로 찾아낸 문서들 중에서 어떤 것이 질문과 가장 관련이 높은지를 결정
    - RAG모델에서 랭킹 처리는 생성할 텍스트와 가장 관련이 높은 정보를 선택하는 과정
        - 이 과정의 목표는 사용자의 질문이나 요구에 가장 적합하고 유용한 정보를 찾는 것
        
    - 랭킹 처리 원리
        - 유사도 계산
            - 문서나 단어 사이의 관련성이나 유사성을 수치로 표현하는 방법
            - 각 단어나 문서를 수치화된 숫자인 벡터로 변환한 후 벡터들 사이의 거리나 각도를 계산하여 두 단어가 얼마나 유사한지 측정
            
        - 문맥과 의도 파악
            - 모델은 쿼리의 문맥과 의도를 고려하여 검색된 문서가 얼마나 관련이 있는지 판단
        
        - 랭킹 산출
            - 유사도, 문맥, 정보 품질 등 다양한 요소를 종합하여 각 문서에 최종 랭킹을 매김
            
5. 텍스트 생성
    - 사용자의 질문과 검색 결과로 텍스트를 생성
    - 앞서 정보 검색을 통해 수집된 정보를 LLM에 넘기면 LLM은 주어진 정보들을 기반으로 텍스트를 생성
        - LLM은 제공된 정보를 활용하여 구체적이고 정보에 기반한 텍스트를 생성

# RAG 구현 시 필요한 것

## 데이터

- RAG에서 사용할 수 있는 데이터는 특별히 정해진 형식이 없음
    - CSV, JSON, PDF, 데이터베이스 등
    
- 중요한 것은 데이터의 형식이 아니라 규범, 규제를 고려하는 것
    - 특히 사용하려는 데이터에 개인정보가 포함되어 있는지
    - 저작권법 침해에 해당되는지를 확인
    - 외부에서 얻은 데이터를 상업적 용도로 사용할 경우, 데이터의 소유권을 가진 개인이나 기관으로부터 적절한 사용 권한을 획득해야함
    
- 임베딩
    - Word2Vec
        - 단어를 벡터로 변환하는 모델
        - 단어 사이의 관계를 이해하고 비슷한 의미를 가진 단어들을 찾을 수 있음
        
    - GloVe(Global Vectors for Word Representation)
        - 전체 텍스트에서 단어들이 얼마나 자주 함께 나타나는지를 보고 이 정보를 사용해서 각 단어를 벡터로 표현

## 벡터 데이터베이스

- 벡터를 저장하는 저장소
- 일반 데이터베이스와 달리 데이터의 정확한 값 대신 데이터 간의 유사성을 바탕으로 검색하는 데 사용됨
    - 벡터 데이터베이스에 질문을 하면 임베딩 처리 과정을 거쳐서 벡터로 변환됨
    - 변환된 벡터를 저장된 문서 벡터들과 벡터간의 유사성을 계산
        - 코사인 유사도, 유클리드 거리 등
    - 유사성 검사 결과에 따라 점수가 가장 높은 벡터들이 반환되고 사용자에게 보여짐
    
- 벡터 데이터베이스의 종류
    - 파인콘
    - 밀버스
    - 쿼드런트
    - 크로마
    - 엘라스틱서치
    - 파이스

## 프레임워크(랭체인)

- 랭체인(LangChain)은 언어 모델을 위한 프레임워크
- 랭체인을 이용하여 데이터 가져오기, 벡터 변환, 벡터 저장 및 검색, 프롬프트 전달 및 결과 반환을 손쉽게 개발할 수 있음