## RAG_Clova

#### Env

Python Version : Python 3.12.2

requirements : 
https://ssl.pstatic.net/static/clova/service/hyperclova/cookbook/rag/requirements.txt

In [1]:
# Vector DB인 Milvus와 관련된 모듈들은 모듈의 용도를 명확히 구분하기 위해 Vector DB 구축 단계에서 불러왔으며 해당 부분에서 코드를 확인하실 수 있습니다.
import json
import os
import subprocess
from langchain_community.document_loaders import UnstructuredHTMLLoader
from pathlib import Path
import base64
import http.client
from tqdm import tqdm
import requests
import dotenv
dotenv.load_dotenv()
CLOVA_api_key=os.getenv("X-NCP-CLOVASTUDIO-API-KEY")
NCP_API_api_key=os.getenv("X-NCP-APIGW-API-KEY")
clova_REQUEST_ID=os.getenv("X-NCP-CLOVASTUDIO-REQUEST-ID")

#### 1. Raw Data → Connecting

In [2]:
url_to_filename_map = {}
wget_path="/opt/homebrew/bin/wget"
with open("langchainwikiurl.txt", "r") as file:
    urls = [url.strip() for url in file.readlines()]
 
folder_path = "langchainwikiguide"
 
if not os.path.exists(folder_path):
    os.makedirs(folder_path)

for url in urls:
    filename = url.split("/")[-1] + ".html"
    file_path = os.path.join(folder_path, filename)
    subprocess.run([wget_path, "-O", file_path, url], check=True)
    url_to_filename_map[url] = filename
 
with open("url_to_filename_map.json", "w") as map_file:
    json.dump(url_to_filename_map, map_file)

--2024-08-25 23:24:39--  https://wikidocs.net/233341
Resolving wikidocs.net (wikidocs.net)... 15.165.86.219
Connecting to wikidocs.net (wikidocs.net)|15.165.86.219|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 99984 (98K) [text/html]
Saving to: ‘langchainwikiguide/233341.html’

     0K .......... .......... .......... .......... .......... 51% 6.59M 0s
    50K .......... .......... .......... .......... .......   100% 58.6M=0.008s

2024-08-25 23:24:39 (11.6 MB/s) - ‘langchainwikiguide/233341.html’ saved [99984/99984]

--2024-08-25 23:24:39--  https://wikidocs.net/233342
Resolving wikidocs.net (wikidocs.net)... 15.165.86.219
Connecting to wikidocs.net (wikidocs.net)|15.165.86.219|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 99828 (97K) [text/html]
Saving to: ‘langchainwikiguide/233342.html’

     0K .......... .......... .......... .......... .......... 51% 6.69M 0s
    50K .......... .......... .......... .......... .......   100

##### 보안 에러 나는 경우 방법

In [15]:
import os
import json
import requests
from tqdm import tqdm

url_to_filename_map = {}
folder_path = "langchainwikiguide"

with open("langchainwikiurl.txt", "r") as file:
    urls = [url.strip() for url in file.readlines()]

if not os.path.exists(folder_path):
    os.makedirs(folder_path)

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36"
}

for url in tqdm(urls, desc="Downloading"):
    filename = url.split("/")[-1] + ".html"
    file_path = os.path.join(folder_path, filename)
    
    try:
        response = requests.get(url, headers=headers)
        response.raise_for_status()
        
        with open(file_path, "wb") as file:
            file.write(response.content)
        
        url_to_filename_map[url] = filename

    except requests.RequestException as e:
        print(f"An error occurred while downloading {url}: {e}")

with open("url_to_filename_map.json", "w") as map_file:
    json.dump(url_to_filename_map, map_file, indent=4)

print("Download complete. Mapping saved to url_to_filename_map.json")


Downloading: 100%|██████████| 7/7 [00:01<00:00,  4.46it/s]

Download complete. Mapping saved to url_to_filename_map.json





##### Quote

txt 파일을 작성할 때는 한 줄에 하나의 URL을 작성해야 합니다. 이때, 각 URL은 줄바꿈으로 구분되어야 합니다.

그리고 html 데이터를 로딩하기 전, robots.txt를 통해 데이터로 활용할 사이트의 접근 허용 여부를 확인해야합니다. NCP의 클로바스튜디오 사용 가이드의 경우 User-agent: * Allow:/ 로 접근이 가능합니다.

예제에서 활용한 HTML은, 네이버클라우드 플랫폼(NCP)의 클로바스튜디오 사용 가이드중 CLOVA Studio("AI Services" → "CLOVA Studio")와 관련된 모든 안내 페이지를 데이터로 활용했습니다.

LangChain을 활용해 로딩한 html은, 파일을 저장한 디렉토리의 주소를 metadata의 'source'로 가져오게 됩니다. 추후 답변 제공시, 디렉토리 주소가 아닌 실제 URL을 제공하기 위해, LangChain이 로딩한 데이터를 수정해야합니다.

html을 로딩할 때 파일명을 URL로 할 경우, /와 : 기호로 인해 파일명이 깨지게 됩니다. 따라서 원본 URL과 로딩한 HTML 파일을 쌍으로 mapping하고, 이 정보를 json 형식으로 "url_to_filename_map"에 저장합니다.

이후, html 파일의 저장 경로가 담긴 'source'를, 이 json 파일과 연결해 실제 URL로 변환해줍니다. 위 코드는, json 파일을 저장하는 단계까지입니다.

##### LangChain 활용 HTML 로딩



In [16]:
# 폴더 이름에 맞게 수정
html_files_dir = Path('langchainwikiguide')
 
html_files = list(html_files_dir.glob("*.html"))
 
langchainwikidatas = []
 
for html_file in html_files:
    loader = UnstructuredHTMLLoader(str(html_file))
    document_data = loader.load()
    langchainwikidatas.append(document_data)
    print(f"Processed {html_file}")

Processed langchainwikiguide/233341.html
Processed langchainwikiguide/233346.html
Processed langchainwikiguide/233344.html
Processed langchainwikiguide/233345.html
Processed langchainwikiguide/250954.html
Processed langchainwikiguide/233342.html
Processed langchainwikiguide/233343.html


##### Quote

각 HTML에는 page_content에 모든 텍스트가, metadata의 'source'에는 저장 경로가 기록되어 있습니다. 위는, 로딩된 데이터 중 하나인 clovastudio-info.html의 형태입니다. metadata의 'source'에 실제 URL이 아닌 html 파일이 저장된 디렉토리 경로가 담긴 것을 확인할 수 있습니다. Mapping을 통해 이 'source'를 실제 URL로 바꾸는 작업을 다음 단계에 진행하게 됩니다.

##### Mapping 정보를 활용해 'source'를 실제 URL로 대체

In [17]:
with open("url_to_filename_map.json", "r") as map_file:
    url_to_filename_map = json.load(map_file)
 
filename_to_url_map = {v: k for k, v in url_to_filename_map.items()}
 
# langchainwikidatas 리스트의 각 Document 객체의 'source' 수정
for doc_list in langchainwikidatas:
    for doc in doc_list:
        extracted_filename = doc.metadata["source"].split("/")[-1]
        if extracted_filename in filename_to_url_map:
            doc.metadata["source"] = filename_to_url_map[extracted_filename]
        else:
            print(f"Warning: {extracted_filename}에 해당하는 URL을 찾을 수 없습니다.")

In [18]:
# 이중 리스트를 풀어서 하나의 리스트로 만드는 작업
langchainwiki_flattened = [item for sublist in langchainwikidatas for item in sublist]

In [19]:
langchainwiki_flattened 

[Document(page_content="<랭체인LangChain 노트> - LangChain 한국어 튜토리얼🇰🇷 CH01 LangChain 시작하기 01. OpenAI API 키 발급 및 테스트 02. LangSmith 추적 설정 03. OpenAI API 사용(GPT-4o 멀티모달) 04. LangChain Expression Language(LCEL) 05. LCEL 인터페이스 06. Runnable CH02 프롬프트(Prompt) 01. 프롬프트(Prompt) 02. 퓨샷 프롬프트(FewShotPromptTemplate) 03. LangChain Hub 04. 개인화된 프롬프트(Hub에 업로드) CH03 출력 파서(Output Parsers) 01. Pydantic 출력 파서(PydanticOutputParser) 02. 콤마 구분자 출력 파서(CommaSeparatedListOutputParser) 03. 구조화된 출력 파서(StructuredOuputParser) 04. JSON 출력 파서(JsonOutputParser) 05. 데이터프레임 출력 파서(PandasDataFrameOutputParser) 06. 날짜 형식 출력 파서(DatetimeOutputParser) 07. 열거형 출력 파서(EnumOutputParser) 08. 출력 수정 파서(OutputFixingParser) CH04 모델(Model) 01. 다양한 LLM 모델 활용 02. 캐싱(Cache) 03. 모델 직렬화(Serialization) - 저장 및 불러오기 04. 토큰 사용량 확인 05. 구글 생성 AI(Google Generative AI) 06. 허깅페이스 엔드포인트(HuggingFace Endpoints) 07. 허깅페이스 로컬(HuggingFace Local) 08. 허깅페이스 파이프라인(HuggingFace Pipeline) 09. 올라마(Ollama) 10. GPT4ALL CH05 메모리(Memory) 01. 대화 버퍼 메모리(ConversationBufferM

#### 2. Chunking



임베딩 모델이 처리할 수 있는 적당한 크기로 raw data를 나누는 것은 매우 중요합니다. 이는 임베딩 모델마다 한 번에 처리할 수 있는 토큰 수의 한계가 있기 때문입니다. CLOVA Studio의 문단 나누기 API는 모델이 직접 문장들간의 의미 유사도를 찾아 최적의 chunk 개수와 사용자가 원하는 1개 chunk의 크기(글자 수)를 직접 설정하여 문단을 나눌 수도 있습니다. 추가로, 후처리(postProcess = True)를 통해 chunk당 글자 수의 상한선과 하한선을 postProcessMaxSize와 postProcessMinSize로 조절할 수도 있습니다.

In [21]:
class SegmentationExecutor:
    def __init__(self, host, api_key, api_key_primary_val, request_id):
        self._host = host
        self._api_key = api_key
        self._api_key_primary_val = api_key_primary_val
        self._request_id = request_id
 
    def _send_request(self, completion_request):
        headers = {
            "Content-Type": "application/json; charset=utf-8",
            "X-NCP-CLOVASTUDIO-API-KEY": self._api_key,
            "X-NCP-APIGW-API-KEY": self._api_key_primary_val,
            "X-NCP-CLOVASTUDIO-REQUEST-ID": self._request_id
        }
 
        conn = http.client.HTTPSConnection(self._host)
        conn.request(
            "POST",
            "/testapp/v1/api-tools/segmentation/90972c6f0a784c9886f4bc6ae8a66c01", # If using Service App, change 'testapp' to 'serviceapp', and corresponding app id.
            json.dumps(completion_request),
            headers
        )
        response = conn.getresponse()
        print(response.length)
        result = json.loads(response.read().decode(encoding="utf-8"))
        print(result)
        conn.close()
        return result
 
    def execute(self, completion_request):
        res = self._send_request(completion_request)
        if res["status"]["code"] == "20000":
            return res["result"]["topicSeg"]
        else:
            raise ValueError(f"{res}")
 
 
if __name__ == "__main__":
    segmentation_executor = SegmentationExecutor(
        host="clovastudio.apigw.ntruss.com",
        api_key="NTA0MjU2MWZlZTcxNDJiY9olvu8DfBGDWQ20qeVZrRupbxCgWcs/59xl7cuRCJQ/",
        api_key_primary_val="J97Kg6j6Nrc14yhuSv1JfvgWlJ2qbcOKUsAS88BB",
        request_id=""
    )
 
    chunked_html = []
 
    for htmldata in tqdm(langchainwiki_flattened ):
        try:
            request_data = {
                "postProcessMaxSize": 100,
                "alpha": 1.5,
                "segCnt": -1,
                "postProcessMinSize": 0,
                "text": htmldata.page_content,
                "postProcess": False
            }

            request_json_string = json.dumps(request_data)
            request_data = json.loads(request_json_string, strict=False)
            print(1)
            response_data = segmentation_executor.execute(request_data)
        except Exception as e:
            print(f"Error occurred. Message: {e}")
        
        for paragraph in response_data:
            chunked_document = {
                "source": htmldata.metadata["source"],
                "text": paragraph
            }
            chunked_html.append(chunked_document)
 
print(len(chunked_html))

  0%|          | 0/7 [00:00<?, ?it/s]

1


 14%|█▍        | 1/7 [00:02<00:14,  2.41s/it]

None
{'status': {'code': '20000', 'message': 'OK'}, 'result': {'topicSeg': [['<랭체인LangChain 노트> - LangChain 한국어 튜토리얼🇰🇷 CH01 LangChain 시작하기'], ['01. OpenAI API 키 발급 및 테스트'], ['02. LangSmith 추적 설정'], ['03. OpenAI API 사용(GPT-4o 멀티모달)'], ['04. LangChain Expression Language(LCEL)'], ['05. LCEL 인터페이스'], ['06. Runnable CH02 프롬프트(Prompt)'], ['01. 프롬프트(Prompt)'], ['02. 퓨샷 프롬프트(FewShotPromptTemplate)'], ['03. LangChain Hub'], ['04. 개인화된 프롬프트(Hub에 업로드) CH03 출력 파서(Output Parsers)'], ['01. Pydantic 출력 파서(PydanticOutputParser)'], ['02. 콤마 구분자 출력 파서(CommaSeparatedListOutputParser)'], ['03. 구조화된 출력 파서(StructuredOuputParser)'], ['04. JSON 출력 파서(JsonOutputParser)'], ['05. 데이터프레임 출력 파서(PandasDataFrameOutputParser)'], ['06. 날짜 형식 출력 파서(DatetimeOutputParser)'], ['07. 열거형 출력 파서(EnumOutputParser)'], ['08. 출력 수정 파서(OutputFixingParser) CH04 모델(Model)'], ['01. 다양한 LLM 모델 활용'], ['02. 캐싱(Cache)'], ['03. 모델 직렬화(Serialization) - 저장 및 불러오기'], ['04. 토큰 사용량 확인'], ['05. 구글 생성 AI(Google Generative AI)'], ['06. 허깅페이스 엔드포

 29%|██▊       | 2/7 [00:06<00:16,  3.40s/it]

None
{'status': {'code': '20000', 'message': 'OK'}, 'result': {'topicSeg': [['<랭체인LangChain 노트> - LangChain 한국어 튜토리얼🇰🇷 CH01 LangChain 시작하기'], ['01. OpenAI API 키 발급 및 테스트'], ['02. LangSmith 추적 설정'], ['03. OpenAI API 사용(GPT-4o 멀티모달)'], ['04. LangChain Expression Language(LCEL)'], ['05. LCEL 인터페이스'], ['06. Runnable CH02 프롬프트(Prompt)'], ['01. 프롬프트(Prompt)'], ['02. 퓨샷 프롬프트(FewShotPromptTemplate)'], ['03. LangChain Hub'], ['04. 개인화된 프롬프트(Hub에 업로드) CH03 출력 파서(Output Parsers)'], ['01. Pydantic 출력 파서(PydanticOutputParser)'], ['02. 콤마 구분자 출력 파서(CommaSeparatedListOutputParser)'], ['03. 구조화된 출력 파서(StructuredOuputParser)'], ['04. JSON 출력 파서(JsonOutputParser)'], ['05. 데이터프레임 출력 파서(PandasDataFrameOutputParser)'], ['06. 날짜 형식 출력 파서(DatetimeOutputParser)'], ['07. 열거형 출력 파서(EnumOutputParser)'], ['08. 출력 수정 파서(OutputFixingParser) CH04 모델(Model)'], ['01. 다양한 LLM 모델 활용'], ['02. 캐싱(Cache)'], ['03. 모델 직렬화(Serialization) - 저장 및 불러오기'], ['04. 토큰 사용량 확인'], ['05. 구글 생성 AI(Google Generative AI)'], ['06. 허깅페이스 엔드포

 43%|████▎     | 3/7 [00:10<00:15,  3.80s/it]

None
{'status': {'code': '20000', 'message': 'OK'}, 'result': {'topicSeg': [['<랭체인LangChain 노트> - LangChain 한국어 튜토리얼🇰🇷 CH01 LangChain 시작하기'], ['01. OpenAI API 키 발급 및 테스트'], ['02. LangSmith 추적 설정'], ['03. OpenAI API 사용(GPT-4o 멀티모달)'], ['04. LangChain Expression Language(LCEL)'], ['05. LCEL 인터페이스'], ['06. Runnable CH02 프롬프트(Prompt)'], ['01. 프롬프트(Prompt)'], ['02. 퓨샷 프롬프트(FewShotPromptTemplate)'], ['03. LangChain Hub'], ['04. 개인화된 프롬프트(Hub에 업로드) CH03 출력 파서(Output Parsers)'], ['01. Pydantic 출력 파서(PydanticOutputParser)'], ['02. 콤마 구분자 출력 파서(CommaSeparatedListOutputParser)'], ['03. 구조화된 출력 파서(StructuredOuputParser)'], ['04. JSON 출력 파서(JsonOutputParser)'], ['05. 데이터프레임 출력 파서(PandasDataFrameOutputParser)'], ['06. 날짜 형식 출력 파서(DatetimeOutputParser)'], ['07. 열거형 출력 파서(EnumOutputParser)'], ['08. 출력 수정 파서(OutputFixingParser) CH04 모델(Model)'], ['01. 다양한 LLM 모델 활용'], ['02. 캐싱(Cache)'], ['03. 모델 직렬화(Serialization) - 저장 및 불러오기'], ['04. 토큰 사용량 확인'], ['05. 구글 생성 AI(Google Generative AI)'], ['06. 허깅페이스 엔드포

 57%|█████▋    | 4/7 [00:15<00:12,  4.14s/it]

None
{'status': {'code': '20000', 'message': 'OK'}, 'result': {'topicSeg': [['<랭체인LangChain 노트> - LangChain 한국어 튜토리얼🇰🇷 CH01 LangChain 시작하기'], ['01. OpenAI API 키 발급 및 테스트'], ['02. LangSmith 추적 설정'], ['03. OpenAI API 사용(GPT-4o 멀티모달)'], ['04. LangChain Expression Language(LCEL)'], ['05. LCEL 인터페이스'], ['06. Runnable CH02 프롬프트(Prompt)'], ['01. 프롬프트(Prompt)'], ['02. 퓨샷 프롬프트(FewShotPromptTemplate)'], ['03. LangChain Hub'], ['04. 개인화된 프롬프트(Hub에 업로드) CH03 출력 파서(Output Parsers)'], ['01. Pydantic 출력 파서(PydanticOutputParser)'], ['02. 콤마 구분자 출력 파서(CommaSeparatedListOutputParser)'], ['03. 구조화된 출력 파서(StructuredOuputParser)'], ['04. JSON 출력 파서(JsonOutputParser)'], ['05. 데이터프레임 출력 파서(PandasDataFrameOutputParser)'], ['06. 날짜 형식 출력 파서(DatetimeOutputParser)'], ['07. 열거형 출력 파서(EnumOutputParser)'], ['08. 출력 수정 파서(OutputFixingParser) CH04 모델(Model)'], ['01. 다양한 LLM 모델 활용'], ['02. 캐싱(Cache)'], ['03. 모델 직렬화(Serialization) - 저장 및 불러오기'], ['04. 토큰 사용량 확인'], ['05. 구글 생성 AI(Google Generative AI)'], ['06. 허깅페이스 엔드포

 71%|███████▏  | 5/7 [00:18<00:07,  3.58s/it]

None
{'status': {'code': '20000', 'message': 'OK'}, 'result': {'topicSeg': [['<랭체인LangChain 노트> - LangChain 한국어 튜토리얼🇰🇷 CH01 LangChain 시작하기'], ['01. OpenAI API 키 발급 및 테스트'], ['02. LangSmith 추적 설정'], ['03. OpenAI API 사용(GPT-4o 멀티모달)'], ['04. LangChain Expression Language(LCEL)'], ['05. LCEL 인터페이스'], ['06. Runnable CH02 프롬프트(Prompt)'], ['01. 프롬프트(Prompt)'], ['02. 퓨샷 프롬프트(FewShotPromptTemplate)'], ['03. LangChain Hub'], ['04. 개인화된 프롬프트(Hub에 업로드) CH03 출력 파서(Output Parsers)'], ['01. Pydantic 출력 파서(PydanticOutputParser)'], ['02. 콤마 구분자 출력 파서(CommaSeparatedListOutputParser)'], ['03. 구조화된 출력 파서(StructuredOuputParser)'], ['04. JSON 출력 파서(JsonOutputParser)'], ['05. 데이터프레임 출력 파서(PandasDataFrameOutputParser)'], ['06. 날짜 형식 출력 파서(DatetimeOutputParser)'], ['07. 열거형 출력 파서(EnumOutputParser)'], ['08. 출력 수정 파서(OutputFixingParser) CH04 모델(Model)'], ['01. 다양한 LLM 모델 활용'], ['02. 캐싱(Cache)'], ['03. 모델 직렬화(Serialization) - 저장 및 불러오기'], ['04. 토큰 사용량 확인'], ['05. 구글 생성 AI(Google Generative AI)'], ['06. 허깅페이스 엔드포

 86%|████████▌ | 6/7 [00:20<00:03,  3.14s/it]

None
{'status': {'code': '20000', 'message': 'OK'}, 'result': {'topicSeg': [['<랭체인LangChain 노트> - LangChain 한국어 튜토리얼🇰🇷 CH01 LangChain 시작하기'], ['01. OpenAI API 키 발급 및 테스트'], ['02. LangSmith 추적 설정'], ['03. OpenAI API 사용(GPT-4o 멀티모달)'], ['04. LangChain Expression Language(LCEL)'], ['05. LCEL 인터페이스'], ['06. Runnable CH02 프롬프트(Prompt)'], ['01. 프롬프트(Prompt)'], ['02. 퓨샷 프롬프트(FewShotPromptTemplate)'], ['03. LangChain Hub'], ['04. 개인화된 프롬프트(Hub에 업로드) CH03 출력 파서(Output Parsers)'], ['01. Pydantic 출력 파서(PydanticOutputParser)'], ['02. 콤마 구분자 출력 파서(CommaSeparatedListOutputParser)'], ['03. 구조화된 출력 파서(StructuredOuputParser)'], ['04. JSON 출력 파서(JsonOutputParser)'], ['05. 데이터프레임 출력 파서(PandasDataFrameOutputParser)'], ['06. 날짜 형식 출력 파서(DatetimeOutputParser)'], ['07. 열거형 출력 파서(EnumOutputParser)'], ['08. 출력 수정 파서(OutputFixingParser) CH04 모델(Model)'], ['01. 다양한 LLM 모델 활용'], ['02. 캐싱(Cache)'], ['03. 모델 직렬화(Serialization) - 저장 및 불러오기'], ['04. 토큰 사용량 확인'], ['05. 구글 생성 AI(Google Generative AI)'], ['06. 허깅페이스 엔드포

100%|██████████| 7/7 [00:25<00:00,  3.64s/it]

None
{'status': {'code': '20000', 'message': 'OK'}, 'result': {'topicSeg': [['<랭체인LangChain 노트> - LangChain 한국어 튜토리얼🇰🇷 CH01 LangChain 시작하기'], ['01. OpenAI API 키 발급 및 테스트'], ['02. LangSmith 추적 설정'], ['03. OpenAI API 사용(GPT-4o 멀티모달)'], ['04. LangChain Expression Language(LCEL)'], ['05. LCEL 인터페이스'], ['06. Runnable CH02 프롬프트(Prompt)'], ['01. 프롬프트(Prompt)'], ['02. 퓨샷 프롬프트(FewShotPromptTemplate)'], ['03. LangChain Hub'], ['04. 개인화된 프롬프트(Hub에 업로드) CH03 출력 파서(Output Parsers)'], ['01. Pydantic 출력 파서(PydanticOutputParser)'], ['02. 콤마 구분자 출력 파서(CommaSeparatedListOutputParser)'], ['03. 구조화된 출력 파서(StructuredOuputParser)'], ['04. JSON 출력 파서(JsonOutputParser)'], ['05. 데이터프레임 출력 파서(PandasDataFrameOutputParser)'], ['06. 날짜 형식 출력 파서(DatetimeOutputParser)'], ['07. 열거형 출력 파서(EnumOutputParser)'], ['08. 출력 수정 파서(OutputFixingParser) CH04 모델(Model)'], ['01. 다양한 LLM 모델 활용'], ['02. 캐싱(Cache)'], ['03. 모델 직렬화(Serialization) - 저장 및 불러오기'], ['04. 토큰 사용량 확인'], ['05. 구글 생성 AI(Google Generative AI)'], ['06. 허깅페이스 엔드포




In [23]:
len(chunked_html)

1486

In [24]:
chunked_html

[{'source': 'https://wikidocs.net/233341',
  'text': ['<랭체인LangChain 노트> - LangChain 한국어 튜토리얼🇰🇷 CH01 LangChain 시작하기']},
 {'source': 'https://wikidocs.net/233341',
  'text': ['01. OpenAI API 키 발급 및 테스트']},
 {'source': 'https://wikidocs.net/233341', 'text': ['02. LangSmith 추적 설정']},
 {'source': 'https://wikidocs.net/233341',
  'text': ['03. OpenAI API 사용(GPT-4o 멀티모달)']},
 {'source': 'https://wikidocs.net/233341',
  'text': ['04. LangChain Expression Language(LCEL)']},
 {'source': 'https://wikidocs.net/233341', 'text': ['05. LCEL 인터페이스']},
 {'source': 'https://wikidocs.net/233341',
  'text': ['06. Runnable CH02 프롬프트(Prompt)']},
 {'source': 'https://wikidocs.net/233341', 'text': ['01. 프롬프트(Prompt)']},
 {'source': 'https://wikidocs.net/233341',
  'text': ['02. 퓨샷 프롬프트(FewShotPromptTemplate)']},
 {'source': 'https://wikidocs.net/233341', 'text': ['03. LangChain Hub']},
 {'source': 'https://wikidocs.net/233341',
  'text': ['04. 개인화된 프롬프트(Hub에 업로드) CH03 출력 파서(Output Parsers)']},
 {'source': 'h

#### 3. Embedding

문단 나누기 API를 통해 나누어진 525개의 chunk(chunked_html)을 CLOVA Studio의 임베딩 API를 사용해 1024차원의 벡터로 변환하는 과정입니다. clir-emb-dolphin의 경우, 임베딩 과정에서 유사도 판단을 위해 벡터의 내적(Inner Product, IP)을 거리 단위로 사용합니다. 반면, clir-sts-dolphin은 코사인 거리(Cosine)를 거리 단위로 사용합니다. 이후, 벡터의 인덱싱과 검색 과정에서 사용자는 어떤 거리 단위를 사용하여 데이터와 사용자의 쿼리 간 유사도를 판단할 것인지 선택할 수 있습니다.

거리 단위를 임베딩부터 인덱싱, 검색까지 일치시켜야 데이터의 품질이 향상되므로, 임베딩 과정에서 사용한 모델(emb / sts)을 기억하는 것이 중요합니다. 임베딩 클래스에 오류가 발생시 멈추게끔 하는 로직을 일부 추가해, 다량의 데이터를 처리할 때 오류 발생시 재실행의 부담을 줄입니다.

In [28]:
class EmbeddingExecutor:
    def __init__(self, host, api_key, api_key_primary_val, request_id):
        self._host = host
        self._api_key = api_key
        self._api_key_primary_val = api_key_primary_val
        self._request_id = request_id

    def _send_request(self, completion_request):
        headers = {
            "Content-Type": "application/json; charset=utf-8",
            "X-NCP-CLOVASTUDIO-API-KEY": self._api_key,
            "X-NCP-APIGW-API-KEY": self._api_key_primary_val,
            "X-NCP-CLOVASTUDIO-REQUEST-ID": self._request_id
        }

        conn = http.client.HTTPSConnection(self._host)
        conn.request(
            "POST",
            "/testapp/v1/api-tools/embedding/v2/95709fb7cc5047b6adad8f4d8442bf24",
            json.dumps(completion_request),
            headers
        )
        response = conn.getresponse()
        result = json.loads(response.read().decode(encoding="utf-8"))
        conn.close()
        return result

    def execute(self, completion_request):
        res = self._send_request(completion_request)
        if res["status"]["code"] == "20000":
            return res["result"]["embedding"]
        else:
            error_code = res["status"]["code"]
            error_message = res.get("status", {}).get("message", "Unknown error")
            raise ValueError(f"오류 발생: {error_code}: {error_message}")

if __name__ == "__main__":
    embedding_executor = EmbeddingExecutor(
        host="clovastudio.apigw.ntruss.com",
        api_key='NTA0MjU2MWZlZTcxNDJiY9olvu8DfBGDWQ20qeVZrRupbxCgWcs/59xl7cuRCJQ/',
        api_key_primary_val='J97Kg6j6Nrc14yhuSv1JfvgWlJ2qbcOKUsAS88BB',
        request_id='1037451f-6a88-40ae-afd4-fbc4a26cb354'
    )

    for i, chunked_document in enumerate(tqdm(chunked_html)):
        if i==10:
            break
        try:
            text_content = chunked_document['text']
            if isinstance(text_content, list):
                text_content=text_content[0]
            request_json = {
                "text": text_content
            }
            response_data = embedding_executor.execute(request_json)
            chunked_document["embedding"] = response_data
        except ValueError as e:
            print(f"Embedding API Error. {e}")
            print(chunked_document['text'])
        except Exception as e:
            print(f"Unexpected error: {e}")
        


  4%|▍         | 64/1486 [00:08<01:56, 12.22it/s]

Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['02. 캐시 임베딩(CacheBackedEmbeddings)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['03. 허깅페이스 임베딩(HuggingFace Embeddings)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['04. UpstageEmbeddings']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['05. OllamaEmbeddings']


  4%|▍         | 66/1486 [00:08<01:42, 13.85it/s]

Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['06. GPT4ALL 임베딩']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['07. Llama CPP 임베딩 CH09 벡터저장소(VectorStore)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['01. Chroma']


  5%|▍         | 71/1486 [00:08<01:31, 15.52it/s]

Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['02. FAISS']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['03. Pinecone CH10 검색기(Retriever)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['01. 벡터저장소 지원 검색기(VectorStore-backed Retriever)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['02. 문맥 압축 검색기(ContextualCompressionRetriever)']


  5%|▌         | 75/1486 [00:09<01:23, 16.80it/s]

Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['03. 앙상블 검색기(EnsembleRetriever)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['04. 긴 문맥 재정렬(LongContextReorder)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['05. 상위 문서 검색기(ParentDocumentRetriever)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['06. 다중 쿼리 검색기(MultiQueryRetriever)']


  5%|▌         | 79/1486 [00:09<01:21, 17.29it/s]

Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['07. 다중 벡터저장소 검색기(MultiVectorRetriever)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['08. 셀프 쿼리 검색기(SelfQueryRetriever)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['09. 시간 가중 벡터저장소 검색기(TimeWeightedVectorStoreRetriever)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['10. 한글 형태소 분석기(Kiwi, Kkma, Okt) + BM25 검색기 CH11 리랭커(Reranker)']


  6%|▌         | 83/1486 [00:09<01:20, 17.50it/s]

Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['01. Cross Encoder Reranker']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['02. Cohere Reranker']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['03. Jina Reranker']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['04. FlashRank Reranker CH12 Retrieval Augmented Generation(RAG)']


  6%|▌         | 87/1486 [00:09<01:19, 17.65it/s]

Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['01. PDF 문서 기반 QA(Question-Answer)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['02. 네이버 뉴스기사 QA(Question-Answer)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['03. RAG 의 기능별 다양한 모듈 활용기']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['04. RAPTOR: 긴 문맥 요약(Long Context Summary)']


  6%|▌         | 89/1486 [00:09<01:16, 18.16it/s]

Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['05. 대화내용을 기억하는 RAG 체인 CH13 LangChain Expression Language(LCEL)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['01. RunnablePassthrough: 데이터 전달']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['02. Runnable 구조(그래프) 확인']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['03. RunnableLambda: 사용자 정의 함수']


  6%|▋         | 94/1486 [00:10<01:15, 18.41it/s]

Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['04. RunnableBranch: 라우팅(Routing)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['05. RunnableParallel: 병렬 처리']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['06. configurable_fields, configurable_alternatives 07. @chain 데코레이터로 Runnable 생성', '08. RunnableWithMessageHistory']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['09. 사용자 정의 제네레이터(generator)']


  7%|▋         | 98/1486 [00:10<01:17, 18.02it/s]

Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['10. Runtime Arguments 바인딩']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['11. 폴백(fallback) 모델 지정 CH14 체인(Chains)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['01. 문서 요약']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['02. SQL CH15 에이전트(Agent)']


  7%|▋         | 102/1486 [00:10<01:15, 18.32it/s]

Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['01. Agent 사용법 톺아보기']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['02. 도구를 활용한 토론 에이전트(Two Agent Debates with Tools) CH16 파인튜닝(Fine Tuning)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['CH17 LangGraph']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['01. Chain of Table for Multiple Tables']


  7%|▋         | 106/1486 [00:10<01:14, 18.47it/s]

Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['Published with WikiDocs']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['<랭체인LangChain 노트> - Lang…']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['CH01 LangChain 시작하기', '위키독스']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['CH01 LangChain 시작하기']


  7%|▋         | 110/1486 [00:11<01:15, 18.25it/s]

Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['🦜️🔗 랭체인 LangChain']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['LangChain 은 언어 모델을 활용해 다양한 애플리케이션을 개발할 수 있는 프레임워크를 말합니다.', '이 프레임워크를 통해 언어 모델은 다음과 같은 기능을 수행할 수 있게 됩니다.']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['문맥을 인식하는 기능: LangChain은 언어 모델을 다양한 문맥 소스와 연결합니다.', '여기에는 프롬프트 지시사항, 소수의 예시, 응답에 근거한 내용 등이 포함됩니다.', '이를 통해 언어 모델은 제공된 정보를 기반으로 더 정확하고 관련성 높은 답변을 생성할 수 있습니다.', '추론하는 기능: 또한, 언어 모델은 주어진 문맥을 바탕으로 어떠한 답변을 제공하거나, 어떤 조치를 취해야 할지를 스스로 추론할 수 있습니다.', '이는 언어 모델이 단순히 정보를 재생산하는 것을 넘어서, 주어진 상황을 분석하고 적절한 해결책을 제시할 수 있음을 의미합니다.', 'LangChain 을 활용하면 이전에 언급한 기능을 바탕으로 검색 증강 생성(RAG) 어플리케이션 제작, 구조화된 데이터 분석, 챗봇 등을 만들 수 있습니다.']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['더 많은 예제는 유튜브 채널 테디노트 에서 확인하실 수 있습니다.']


  8%|▊         | 114/1486 [00:11<02:28,  9.25it/s]

Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['설치']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['권장하는 파이썬 버전은 3.11 버전입니다.']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['pip 를 이용한 설치', 'pip install -r https://raw.githubusercontent.com/teddylee777/langchain-kr/main/requirements.txt']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['최소한의 기능만 설치하기 위한 mini 버전 (일부 패키지만 설치하는 경우)']


  8%|▊         | 118/1486 [00:11<01:50, 12.40it/s]

Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['pip install -r https://raw.githubusercontent.com/teddylee777/langchain-kr/main/requirements-mini.txt']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['구성']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['이 프레임워크는 여러 부분으로 구성되어 있습니다.']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['LangChain 라이브러리: Python 및 JavaScript 라이브러리.']


  8%|▊         | 122/1486 [00:12<01:31, 14.93it/s]

Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['다양한 컴포넌트의 인터페이스와 통합, 이러한 컴포넌트를 체인과 에이전트로 결합하는 기본 런타임, 그리고 즉시 사용 가능한 체인과 에이전트의 구현을 포함합니다.']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['LangChain 템플릿: 다양한 작업을 위한 쉽게 배포할 수 있는 참조 아키텍처 모음입니다.']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['LangServe: LangChain 체인을 REST API로 배포하기 위한 라이브러리입니다.']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['LangSmith: 어떤 LLM 프레임워크에도 구축된 체인을 디버그, 테스트, 평가, 모니터링할 수 있게 해주며 LangChain과 원활하게 통합되는 개발자 플랫폼입니다.']


  8%|▊         | 126/1486 [00:12<01:22, 16.51it/s]

Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['LangGraph: LLM을 사용한 상태유지가 가능한 다중 액터 애플리케이션을 구축하기 위한 라이브러리로, LangChain 위에 구축되었으며 LangChain과 함께 사용하도록 설계되었습니다.', '여러 계산 단계에서 다중 체인(또는 액터)을 순환 방식으로 조정할 수 있는 능력을 LangChain 표현 언어에 추가합니다.']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['개발 용이성✨']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['컴포넌트의 조립 및 통합 🔧', 'LangChain은 언어 모델과의 작업을 위한 조립 가능한 도구 및 통합을 제공합니다.', '컴포넌트는 모듈식으로 설계되어, 사용하기 쉽습니다.', '이는 개발자가 LangChain 프레임워크를 자유롭게 활용할 수 있게 해줍니다.', '즉시 사용 가능한 체인 🚀', '고수준 작업을 수행하기 위한 컴포넌트의 내장 조합을 제공합니다.', '이러한 체인은 개발 과정을 간소화하고 속도를 높여줍니다.']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['주요 모듈 📌', '모델 I/O 📃', '프롬프트 관리, 최적화 및 LLM과의 일반적인 인터페이스와 작업을 위한 유틸리티를 포함합니다.']


  9%|▊         | 130/1486 [00:12<01:19, 17.16it/s]

Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['검색 📚']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
["'데이터 강화 생성'에 초점을 맞춘 이 모듈은 생성 단계에서 필요한 데이터를 외부 데이터 소스에서 가져오는 작업을 담당합니다."]
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['에이전트 🤖']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['언어 모델이 어떤 조치를 취할지 결정하고, 해당 조치를 실행하며, 관찰하고, 필요한 경우 반복하는 과정을 포함합니다.']


  9%|▉         | 134/1486 [00:12<01:14, 18.10it/s]

Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['LangChain을 활용하면, 언어 모델 기반 애플리케이션의 개발을 보다 쉽게 시작할 수 있으며, 필요에 맞게 기능을 맞춤 설정하고, 다양한 데이터 소스와 통합하여 복잡한 작업을 처리할 수 있게 됩니다.']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['마지막 편집일시 : 2024년 7월 16일 2:40 오전']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['댓글 0 피드백', '※ 댓글 작성은 로그인이 필요합니다.', '(또는 피드백을 이용해 주세요.)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['이전글 : <랭체인LangChain 노트> - LangChain 한국어 튜토리얼🇰🇷']


  9%|▉         | 138/1486 [00:13<01:14, 18.21it/s]

Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['다음글 : 01.']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['OpenAI API 키 발급 및 테스트']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['책갈피']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['이 페이지에 대한 피드백을 남겨주세요']


 10%|▉         | 142/1486 [00:13<01:13, 18.17it/s]

Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['댓글을 신고합니다.']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['<랭체인LangChain 노트> - LangChain 한국어 튜토리얼🇰🇷 CH01 LangChain 시작하기']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['01. OpenAI API 키 발급 및 테스트']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['02. LangSmith 추적 설정']


 10%|▉         | 146/1486 [00:13<01:12, 18.60it/s]

Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['03. OpenAI API 사용(GPT-4o 멀티모달)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['04. LangChain Expression Language(LCEL)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['05. LCEL 인터페이스']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['06. Runnable CH02 프롬프트(Prompt)']


 10%|█         | 150/1486 [00:13<01:12, 18.54it/s]

Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['01. 프롬프트(Prompt)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['02. 퓨샷 프롬프트(FewShotPromptTemplate)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['03. LangChain Hub']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['04. 개인화된 프롬프트(Hub에 업로드) CH03 출력 파서(Output Parsers)']


 10%|█         | 154/1486 [00:13<01:10, 18.90it/s]

Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['01. Pydantic 출력 파서(PydanticOutputParser)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['02. 콤마 구분자 출력 파서(CommaSeparatedListOutputParser)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['03. 구조화된 출력 파서(StructuredOuputParser)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['04. JSON 출력 파서(JsonOutputParser)']


 11%|█         | 158/1486 [00:14<01:10, 18.78it/s]

Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['05. 데이터프레임 출력 파서(PandasDataFrameOutputParser)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['06. 날짜 형식 출력 파서(DatetimeOutputParser)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['07. 열거형 출력 파서(EnumOutputParser)']
Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['08. 출력 수정 파서(OutputFixingParser) CH04 모델(Model)']


 11%|█         | 160/1486 [00:14<01:57, 11.25it/s]

Embedding API Error. 오류 발생: 42901: Too many requests - rate exceeded
['01. 다양한 LLM 모델 활용']





KeyboardInterrupt: 

In [11]:
dimension_set = set()
 
for item in chunked_html:
    if "embedding" in item:
        dimension = len(item["embedding"])
        dimension_set.add(dimension)
 
print("임베딩된 벡터들의 차원:", dimension_set)

임베딩된 벡터들의 차원: {308}


In [14]:
chunked_html[1]

{'source': 'https://wikidocs.net/233341',
 'text': ['01. OpenAI API 키 발급 및 테스트'],
 'embedding': [['<랭체인LangChain 노트> - LangChain 한국어 튜토리얼🇰🇷 CH01 LangChain 시작하기'],
  ['01. OpenAI API 키 발급 및 테스트'],
  ['02. LangSmith 추적 설정'],
  ['03. OpenAI API 사용(GPT-4o 멀티모달)'],
  ['04. LangChain Expression Language(LCEL)'],
  ['05. LCEL 인터페이스'],
  ['06. Runnable CH02 프롬프트(Prompt)'],
  ['01. 프롬프트(Prompt)'],
  ['02. 퓨샷 프롬프트(FewShotPromptTemplate)'],
  ['03. LangChain Hub'],
  ['04. 개인화된 프롬프트(Hub에 업로드) CH03 출력 파서(Output Parsers)'],
  ['01. Pydantic 출력 파서(PydanticOutputParser)'],
  ['02. 콤마 구분자 출력 파서(CommaSeparatedListOutputParser)'],
  ['03. 구조화된 출력 파서(StructuredOuputParser)'],
  ['04. JSON 출력 파서(JsonOutputParser)'],
  ['05. 데이터프레임 출력 파서(PandasDataFrameOutputParser)'],
  ['06. 날짜 형식 출력 파서(DatetimeOutputParser)'],
  ['07. 열거형 출력 파서(EnumOutputParser)'],
  ['08. 출력 수정 파서(OutputFixingParser) CH04 모델(Model)'],
  ['01. 다양한 LLM 모델 활용'],
  ['02. 캐싱(Cache)'],
  ['03. 모델 직렬화(Serialization) - 저장 및 불러오기'],
  ['04. 토큰 

#### 4. Vector DB

CLOVA Studio의 임베딩 API를 활용하여 모든 chunked_의 text를 1024차원의 벡터로 변환한 후, 'embedding'이라는 이름의 객체로 chunked_html에 추가해 주었습니다. 이제 이 데이터를 Vector DB에 저장하고, 인덱싱을 하는 단계입니다. Vector DB로는 Milvus를 사용하였으며, 대시보드는 Docker를 사용하여 DB를 켜고(Run) 끄는(Stop) 작업을 수행하였습니다.