In [41]:
# 필요한 라이브러리 임포트
import pandas as pd
import openai
import json
import gc
import torch
from datetime import datetime
from zoneinfo import ZoneInfo
from langchain.prompts import ChatPromptTemplate
from langchain.chains import LLMChain
from langchain.vectorstores import ElasticVectorSearch
from langchain.chat_models import ChatOpenAI
from elasticsearch import Elasticsearch
from dotenv import load_dotenv
import os
from langchain.embeddings import OpenAIEmbeddings
from langchain_community.vectorstores.elasticsearch import ElasticsearchStore


In [42]:
# .env 파일에서 환경 변수 로드
load_dotenv("/data/ephemeral/home/upstage-ai-advanced-ir2-private/OPENAI_API_KEY.env")

# OpenAI API 키 가져오기
api_key = os.getenv("OPENAI_API_KEY")

# API 키 설정
if api_key:
    os.environ["OPENAI_API_KEY"] = api_key
else:
    raise ValueError("API key not found. Please check your .env file.")

In [43]:
es_username = "elastic"
es_password = "cqMxV1GNi7I1*MU9wCr*"

# Elasticsearch client 생성
es = Elasticsearch(['https://localhost:9200'], basic_auth=(es_username, es_password), ca_certs="/data/ephemeral/home/elasticsearch-8.15.2/config/certs/http_ca.crt") # TLS Error시 ca_certs의 경로 변경하기

# Elasticsearch client 정보 확인
print(es.info())

{'name': 'instance-12587', 'cluster_name': 'elasticsearch', 'cluster_uuid': '3PxwSecZTmCW-m9du-USxA', 'version': {'number': '8.15.2', 'build_flavor': 'default', 'build_type': 'tar', 'build_hash': '98adf7bf6bb69b66ab95b761c9e5aadb0bb059a3', 'build_date': '2024-09-19T10:06:03.564235954Z', 'build_snapshot': False, 'lucene_version': '9.11.1', 'minimum_wire_compatibility_version': '7.17.0', 'minimum_index_compatibility_version': '7.0.0'}, 'tagline': 'You Know, for Search'}


In [None]:
#------>>>새로운 문서 및 임베딩 모델 사용 시 주석 풀고 사용하면됨

index_name = 'langchain_index_test'

# 임베딩 함수 생성
embedding = OpenAIEmbeddings() # ("text-embedding-ada-002") # text-embedding-3-large # model="text-embedding-ada-002"

# ElasticsearchStore 설정
vector_store = ElasticsearchStore(
    #elasticsearch_url="https://localhost:9200",
    index_name=index_name,
    embedding=embedding,
    es_connection=es
)

# Elasticsearch 연결 확인
try:
    response = vector_store.client.info()
    print("Elasticsearch 연결 성공:", response)
except Exception as e:
    print("Elasticsearch 연결 실패:", e)

Elasticsearch 연결 성공: {'name': 'instance-12587', 'cluster_name': 'elasticsearch', 'cluster_uuid': '3PxwSecZTmCW-m9du-USxA', 'version': {'number': '8.15.2', 'build_flavor': 'default', 'build_type': 'tar', 'build_hash': '98adf7bf6bb69b66ab95b761c9e5aadb0bb059a3', 'build_date': '2024-09-19T10:06:03.564235954Z', 'build_snapshot': False, 'lucene_version': '9.11.1', 'minimum_wire_compatibility_version': '7.17.0', 'minimum_index_compatibility_version': '7.0.0'}, 'tagline': 'You Know, for Search'}


  embedding = OpenAIEmbeddings(model="text-embedding-ada-002") # ("text-embedding-ada-002") # text-embedding-3-large
  vector_store = ElasticsearchStore(


In [5]:
# ------>>>새로운 문서 및 임베딩 모델 사용 시 주석 풀고 사용하면됨

# 문서 데이터 로드 및 인덱싱
from langchain.document_loaders import TextLoader
from langchain.docstore.document import Document
import glob

def load_documents(file_path):
    documents = []
    with open(file_path, 'r', encoding='utf-8') as f:
        for line in f:
            json_obj = json.loads(line)
            content = json_obj.get('content', '')
            docid = json_obj.get('docid', '')
            doc = Document(page_content=content, metadata={'docid': docid})
            documents.append(doc)
    return documents

# 문서 데이터 로드
documents = load_documents('/data/ephemeral/home/upstage-ai-advanced-ir2-private/data/chunked_documents.jsonl')  # 실제 문서 경로로 변경하세요



In [6]:
# ------>>>새로운 문서 및 임베딩 모델 사용 시 주석 풀고 사용하면됨

# 임베딩을 저장할 리스트 초기화
embeddings_data = []

# 문서 데이터 인덱싱 및 임베딩 저장
for doc in documents:
    # 임베딩 생성
    embedding_vector = embedding.embed_query(doc.page_content)  # OpenAI 임베딩 생성
#    print(f"Doc ID: {doc.metadata['docid']}, Embedding: {embedding_vector}")  # 임베딩 출력
    
    # 문서와 임베딩을 리스트로 저장
    embeddings_data.append({
        'docid': doc.metadata['docid'],
        'embedding': embedding_vector,  # 이미 리스트 형태
        'content': doc.page_content  # 원본 문서 내용 추가
    })
print("리스트 저장완료")

In [6]:
from tqdm import tqdm
import time

start_time = time.time()
total_docs = len(documents)

for i, doc in enumerate(tqdm(documents, desc="문서 인덱싱 중")):
    vector_store.add_documents([doc])
    
    if (i + 1) % 100 == 0:  # 100개 문서마다 상태 출력
        elapsed = time.time() - start_time
        docs_per_sec = (i + 1) / elapsed
        print(f"\n처리된 문서: {i+1}/{total_docs}")
        print(f"평균 처리 속도: {docs_per_sec:.2f} 문서/초")

print(f"\n총 소요 시간: {time.time() - start_time:.2f}초")
print("인덱싱 완료")

문서 인덱싱 중:   2%|▏         | 100/6500 [00:41<34:42,  3.07it/s] 


처리된 문서: 100/6500
평균 처리 속도: 2.39 문서/초


문서 인덱싱 중:   3%|▎         | 200/6500 [01:23<37:04,  2.83it/s]  


처리된 문서: 200/6500
평균 처리 속도: 2.40 문서/초


문서 인덱싱 중:   5%|▍         | 300/6500 [02:06<56:05,  1.84it/s]  


처리된 문서: 300/6500
평균 처리 속도: 2.37 문서/초


문서 인덱싱 중:   6%|▌         | 400/6500 [02:52<43:21,  2.35it/s]  


처리된 문서: 400/6500
평균 처리 속도: 2.32 문서/초


문서 인덱싱 중:   8%|▊         | 500/6500 [03:32<34:32,  2.90it/s]  


처리된 문서: 500/6500
평균 처리 속도: 2.35 문서/초


문서 인덱싱 중:   9%|▉         | 600/6500 [04:16<43:07,  2.28it/s]  


처리된 문서: 600/6500
평균 처리 속도: 2.34 문서/초


문서 인덱싱 중:  11%|█         | 700/6500 [04:57<31:07,  3.11it/s]  


처리된 문서: 700/6500
평균 처리 속도: 2.36 문서/초


문서 인덱싱 중:  12%|█▏        | 800/6500 [05:36<34:53,  2.72it/s]


처리된 문서: 800/6500
평균 처리 속도: 2.38 문서/초


문서 인덱싱 중:  14%|█▍        | 900/6500 [06:20<35:19,  2.64it/s]  


처리된 문서: 900/6500
평균 처리 속도: 2.36 문서/초


문서 인덱싱 중:  15%|█▌        | 1000/6500 [07:04<34:20,  2.67it/s] 


처리된 문서: 1000/6500
평균 처리 속도: 2.36 문서/초


문서 인덱싱 중:  17%|█▋        | 1100/6500 [07:45<30:47,  2.92it/s]  


처리된 문서: 1100/6500
평균 처리 속도: 2.36 문서/초


문서 인덱싱 중:  18%|█▊        | 1200/6500 [08:30<35:00,  2.52it/s]  


처리된 문서: 1200/6500
평균 처리 속도: 2.35 문서/초


문서 인덱싱 중:  20%|██        | 1300/6500 [09:13<49:00,  1.77it/s]


처리된 문서: 1300/6500
평균 처리 속도: 2.35 문서/초


문서 인덱싱 중:  22%|██▏       | 1400/6500 [24:53<37:12,  2.28it/s]     


처리된 문서: 1400/6500
평균 처리 속도: 0.94 문서/초


문서 인덱싱 중:  23%|██▎       | 1500/6500 [25:34<30:09,  2.76it/s]


처리된 문서: 1500/6500
평균 처리 속도: 0.98 문서/초


문서 인덱싱 중:  25%|██▍       | 1600/6500 [26:18<36:18,  2.25it/s]


처리된 문서: 1600/6500
평균 처리 속도: 1.01 문서/초


문서 인덱싱 중:  26%|██▌       | 1700/6500 [27:01<27:55,  2.86it/s]


처리된 문서: 1700/6500
평균 처리 속도: 1.05 문서/초


문서 인덱싱 중:  28%|██▊       | 1800/6500 [27:43<28:05,  2.79it/s]  


처리된 문서: 1800/6500
평균 처리 속도: 1.08 문서/초


문서 인덱싱 중:  29%|██▉       | 1900/6500 [28:28<28:27,  2.69it/s]


처리된 문서: 1900/6500
평균 처리 속도: 1.11 문서/초


문서 인덱싱 중:  31%|███       | 2000/6500 [29:16<29:48,  2.52it/s]


처리된 문서: 2000/6500
평균 처리 속도: 1.14 문서/초


문서 인덱싱 중:  32%|███▏      | 2100/6500 [30:06<30:10,  2.43it/s]


처리된 문서: 2100/6500
평균 처리 속도: 1.16 문서/초


문서 인덱싱 중:  34%|███▍      | 2200/6500 [30:57<35:10,  2.04it/s]


처리된 문서: 2200/6500
평균 처리 속도: 1.18 문서/초


문서 인덱싱 중:  35%|███▌      | 2300/6500 [31:43<28:54,  2.42it/s]


처리된 문서: 2300/6500
평균 처리 속도: 1.21 문서/초


문서 인덱싱 중:  37%|███▋      | 2400/6500 [32:29<29:17,  2.33it/s]


처리된 문서: 2400/6500
평균 처리 속도: 1.23 문서/초


문서 인덱싱 중:  38%|███▊      | 2500/6500 [33:18<24:34,  2.71it/s]


처리된 문서: 2500/6500
평균 처리 속도: 1.25 문서/초


문서 인덱싱 중:  40%|████      | 2600/6500 [34:05<42:28,  1.53it/s]


처리된 문서: 2600/6500
평균 처리 속도: 1.27 문서/초


문서 인덱싱 중:  42%|████▏     | 2700/6500 [34:57<25:37,  2.47it/s]


처리된 문서: 2700/6500
평균 처리 속도: 1.29 문서/초


문서 인덱싱 중:  43%|████▎     | 2800/6500 [35:43<34:48,  1.77it/s]


처리된 문서: 2800/6500
평균 처리 속도: 1.31 문서/초


문서 인덱싱 중:  45%|████▍     | 2900/6500 [36:31<25:39,  2.34it/s]


처리된 문서: 2900/6500
평균 처리 속도: 1.32 문서/초


문서 인덱싱 중:  46%|████▌     | 3000/6500 [37:18<28:12,  2.07it/s]


처리된 문서: 3000/6500
평균 처리 속도: 1.34 문서/초


문서 인덱싱 중:  48%|████▊     | 3100/6500 [38:07<24:11,  2.34it/s]


처리된 문서: 3100/6500
평균 처리 속도: 1.35 문서/초


문서 인덱싱 중:  49%|████▉     | 3200/6500 [38:58<32:34,  1.69it/s]


처리된 문서: 3200/6500
평균 처리 속도: 1.37 문서/초


문서 인덱싱 중:  51%|█████     | 3300/6500 [39:47<28:30,  1.87it/s]


처리된 문서: 3300/6500
평균 처리 속도: 1.38 문서/초


문서 인덱싱 중:  52%|█████▏    | 3400/6500 [40:36<25:33,  2.02it/s]


처리된 문서: 3400/6500
평균 처리 속도: 1.40 문서/초


문서 인덱싱 중:  54%|█████▍    | 3500/6500 [41:22<25:31,  1.96it/s]


처리된 문서: 3500/6500
평균 처리 속도: 1.41 문서/초


문서 인덱싱 중:  55%|█████▌    | 3600/6500 [42:12<22:20,  2.16it/s]


처리된 문서: 3600/6500
평균 처리 속도: 1.42 문서/초


문서 인덱싱 중:  57%|█████▋    | 3700/6500 [43:03<25:02,  1.86it/s]


처리된 문서: 3700/6500
평균 처리 속도: 1.43 문서/초


문서 인덱싱 중:  58%|█████▊    | 3800/6500 [43:49<21:15,  2.12it/s]


처리된 문서: 3800/6500
평균 처리 속도: 1.45 문서/초


문서 인덱싱 중:  60%|██████    | 3900/6500 [44:36<18:07,  2.39it/s]


처리된 문서: 3900/6500
평균 처리 속도: 1.46 문서/초


문서 인덱싱 중:  62%|██████▏   | 4000/6500 [45:25<20:10,  2.06it/s]


처리된 문서: 4000/6500
평균 처리 속도: 1.47 문서/초


문서 인덱싱 중:  63%|██████▎   | 4100/6500 [46:14<15:35,  2.57it/s]


처리된 문서: 4100/6500
평균 처리 속도: 1.48 문서/초


문서 인덱싱 중:  65%|██████▍   | 4200/6500 [47:01<23:22,  1.64it/s]


처리된 문서: 4200/6500
평균 처리 속도: 1.49 문서/초


문서 인덱싱 중:  66%|██████▌   | 4300/6500 [47:48<17:13,  2.13it/s]


처리된 문서: 4300/6500
평균 처리 속도: 1.50 문서/초


문서 인덱싱 중:  68%|██████▊   | 4400/6500 [48:33<15:34,  2.25it/s]


처리된 문서: 4400/6500
평균 처리 속도: 1.51 문서/초


문서 인덱싱 중:  69%|██████▉   | 4500/6500 [49:19<11:41,  2.85it/s]


처리된 문서: 4500/6500
평균 처리 속도: 1.52 문서/초


문서 인덱싱 중:  71%|███████   | 4600/6500 [50:09<14:10,  2.24it/s]


처리된 문서: 4600/6500
평균 처리 속도: 1.53 문서/초


문서 인덱싱 중:  72%|███████▏  | 4700/6500 [50:57<20:00,  1.50it/s]


처리된 문서: 4700/6500
평균 처리 속도: 1.54 문서/초


문서 인덱싱 중:  74%|███████▍  | 4800/6500 [51:42<10:40,  2.65it/s]


처리된 문서: 4800/6500
평균 처리 속도: 1.55 문서/초


문서 인덱싱 중:  75%|███████▌  | 4900/6500 [52:29<17:48,  1.50it/s]


처리된 문서: 4900/6500
평균 처리 속도: 1.56 문서/초


문서 인덱싱 중:  77%|███████▋  | 5000/6500 [53:17<10:25,  2.40it/s]


처리된 문서: 5000/6500
평균 처리 속도: 1.56 문서/초


문서 인덱싱 중:  78%|███████▊  | 5100/6500 [54:07<12:18,  1.89it/s]


처리된 문서: 5100/6500
평균 처리 속도: 1.57 문서/초


문서 인덱싱 중:  80%|████████  | 5200/6500 [54:53<12:00,  1.80it/s]


처리된 문서: 5200/6500
평균 처리 속도: 1.58 문서/초


문서 인덱싱 중:  82%|████████▏ | 5300/6500 [55:44<11:10,  1.79it/s]


처리된 문서: 5300/6500
평균 처리 속도: 1.58 문서/초


문서 인덱싱 중:  83%|████████▎ | 5400/6500 [56:31<06:53,  2.66it/s]


처리된 문서: 5400/6500
평균 처리 속도: 1.59 문서/초


문서 인덱싱 중:  85%|████████▍ | 5500/6500 [57:19<06:50,  2.43it/s]


처리된 문서: 5500/6500
평균 처리 속도: 1.60 문서/초


문서 인덱싱 중:  86%|████████▌ | 5600/6500 [58:07<08:46,  1.71it/s]


처리된 문서: 5600/6500
평균 처리 속도: 1.61 문서/초


문서 인덱싱 중:  88%|████████▊ | 5700/6500 [58:52<05:53,  2.26it/s]


처리된 문서: 5700/6500
평균 처리 속도: 1.61 문서/초


문서 인덱싱 중:  89%|████████▉ | 5800/6500 [59:42<07:45,  1.50it/s]


처리된 문서: 5800/6500
평균 처리 속도: 1.62 문서/초


문서 인덱싱 중:  91%|█████████ | 5900/6500 [1:00:28<04:35,  2.18it/s]


처리된 문서: 5900/6500
평균 처리 속도: 1.63 문서/초


문서 인덱싱 중:  92%|█████████▏| 6000/6500 [1:01:13<03:55,  2.12it/s]


처리된 문서: 6000/6500
평균 처리 속도: 1.63 문서/초


문서 인덱싱 중:  94%|█████████▍| 6100/6500 [1:02:06<02:52,  2.32it/s]


처리된 문서: 6100/6500
평균 처리 속도: 1.64 문서/초


문서 인덱싱 중:  95%|█████████▌| 6200/6500 [1:02:52<02:12,  2.26it/s]


처리된 문서: 6200/6500
평균 처리 속도: 1.64 문서/초


문서 인덱싱 중:  97%|█████████▋| 6300/6500 [1:03:38<01:29,  2.23it/s]


처리된 문서: 6300/6500
평균 처리 속도: 1.65 문서/초


문서 인덱싱 중:  98%|█████████▊| 6400/6500 [1:04:27<00:52,  1.90it/s]


처리된 문서: 6400/6500
평균 처리 속도: 1.65 문서/초


문서 인덱싱 중: 100%|██████████| 6500/6500 [1:05:16<00:00,  1.66it/s]


처리된 문서: 6500/6500
평균 처리 속도: 1.66 문서/초

총 소요 시간: 3916.97초
인덱싱 완료





In [None]:
  
embeddings_data 출력
print(f"Current embeddings_data: {embeddings_data}")  # 추가된 데이터 출력

Elasticsearch에 문서 데이터 인덱싱
vector_store.add_documents(documents)  # 여기서 documents를 인덱싱
print("인덱싱 완료")

임베딩을 JSON 파일로 저장
with open('/data/ephemeral/home/upstage-ai-advanced-ir2-private/elasticsearch/embeddings.json', 'w', encoding='utf-8') as f:
    json.dump(embeddings_data, f, ensure_ascii=False, indent=4)

print("임베딩이 embeddings.json 파일에 저장되었습니다.")



### 저장해둔 인덱스 있으면 바로 실행하면 됨

In [44]:
# Elasticsearch 클라이언트 사용하여 문서 수 확인
count_response = vector_store.client.count(index=index_name)
print(f"인덱스 '{index_name}'에 있는 문서 수: {count_response['count']}")


인덱스 'langchain_index_test'에 있는 문서 수: 6500


In [45]:

from langchain.output_parsers import PydanticOutputParser
from langchain.prompts import ChatPromptTemplate
from langchain.chains import LLMChain
from langchain.retrievers import ContextualCompressionRetriever
from langchain.retrievers.document_compressors import LLMChainExtractor
from pydantic import BaseModel, Field
from typing import List

# 1. Pydantic 모델 정의
class ScienceQuery(BaseModel):
    main_query: str = Field(description="주요 검색 쿼리")
    expanded_queries: List[str] = Field(description="관련 검색 쿼리들 (최대 3개)")
    category: str = Field(description="과학 카테고리 (물리/화학/생물/지구과학/천문학/기타)")
    subtopic: str = Field(description="세부 주제")
    is_scientific: bool = Field(description="과학 관련 질문 여부")

# 2. Output Parser 설정
science_parser = PydanticOutputParser(pydantic_object=ScienceQuery)

# 3. 프롬프트 템플릿 수정
query_template = """
과학 질문을 분석하여 효과적인 검색 쿼리를 생성하세요.

{format_instructions}

대화 기록:
{chat_history}
"""

query_prompt = ChatPromptTemplate.from_template(
    template=query_template,
    partial_variables={"format_instructions": science_parser.get_format_instructions()}
)

# 4. LLM Chain 설정
query_chain = LLMChain(
    llm=llm,
    prompt=query_prompt,
    output_parser=science_parser
)

# 5. 컨텍스트 압축 검색기
def get_compression_retriever(vector_store):
    base_retriever = vector_store.as_retriever(
        search_type="similarity",
        search_kwargs={"k": 5}
    )
    
    compressor = LLMChainExtractor.from_llm(llm)
    
    return ContextualCompressionRetriever(
        base_retriever=base_retriever,
        base_compressor=compressor
    )

# 6. 검색 함수
def search(query: ScienceQuery, compression_retriever, max_k=3):
    """개선된 벡터 유사도 검색"""
    try:
        # 메인 쿼리로 검색
        main_docs = compression_retriever.get_relevant_documents(query.main_query)
        results = []
        
        # 확장 쿼리로 추가 검색
        for expanded_query in query.expanded_queries:
            additional_docs = compression_retriever.get_relevant_documents(expanded_query)
            main_docs.extend(additional_docs)
        
        # 결과 처리 및 중복 제거
        seen_ids = set()
        for doc in main_docs:
            docid = doc.metadata.get('docid', '')
            if docid not in seen_ids and len(results) < max_k:
                seen_ids.add(docid)
                results.append({
                    'docid': docid,
                    'score': doc.metadata.get('score', 0.0),
                    'content': doc.page_content
                })
        
        return results
    except Exception as e:
        print(f"Search failed: {e}")
        return []

# 7. 메인 처리 함수
def handle_query(chat_history, compression_retriever=None, references=None):
    if references is None:
        try:
            # 과학 쿼리 생성
            query_result = query_chain.run(chat_history=chat_history)
            
            # 검색 수행
            if compression_retriever:
                search_results = search(query_result, compression_retriever)
                return query_result.main_query, search_results
            return query_result.main_query, []
            
        except Exception as e:
            print(f"Error in handle_query: {e}")
            return None, []
    else:
        try:
            answer = qa_chain.run(chat_history=chat_history, references=references)
            return answer
        except Exception as e:
            print(f"Error generating answer: {e}")
            return "답변 생성 중 오류가 발생했습니다."

# 8. 평가 파일 처리 함수
def process_eval_file(eval_filename, vector_store, use_pre_query=False, max_k=3):
    current_time = datetime.now(ZoneInfo("Asia/Seoul")).strftime("%m%d-%H%M")
    output_filename = f"/data/ephemeral/home/upstage-ai-advanced-ir2-private/data_langchain/{current_time}_topk{max_k}.csv"
    
    compression_retriever = get_compression_retriever(vector_store)
    results = []

    with open(eval_filename, "r", encoding='utf-8') as f:
        for line in f:
            j = json.loads(line)
            if "msg" not in j:
                continue

            chat_history = j["msg"]
            
            # 쿼리 생성 및 검색
            standalone_query, search_results = handle_query(
                chat_history, 
                compression_retriever
            )

            if standalone_query and search_results:
                topk_results = search_results[:max_k]
                references = [{'score': res['score'], 'content': res['content']} 
                            for res in topk_results]
                references_text = '\n\n'.join([ref['content'] for ref in references])
                answer = handle_query(chat_history, None, references_text)
            else:
                answer = "정보가 부족해서 답을 할 수 없습니다."
                references = []
                topk_results = []

            results.append({
                "eval_id": j.get("eval_id"),
                "standalone_query": standalone_query,
                "topk": [res['docid'] for res in topk_results] if topk_results else [],
                "answer": answer,
                "references": references
            })

            # 메모리 관리
            gc.collect()
            torch.cuda.empty_cache()

    # 결과 저장
    with open(output_filename, 'w', encoding='utf-8') as f_out:
        for result in results:
            f_out.write(json.dumps(result, ensure_ascii=False) + '\n')
            
    print(f"결과가 {output_filename}에 저장되었습니다.")


In [46]:
eval_filename = "/data/ephemeral/home/upstage-ai-advanced-ir2-private/data/eval_copy.jsonl"
process_eval_file(eval_filename, vector_store)

KeyboardInterrupt: 

In [32]:
# # 메인 실행 부분
# if __name__ == "__main__":
#     eval_file_path = '/data/ephemeral/home/upstage-ai-advanced-ir2-private/data/eval_copy.jsonl'

#     # 평가 파일 처리 및 저장 함수 호출
#     process_eval_file(eval_file_path, use_pre_query=True, max_k=3)



Processing chat history: [{'role': 'user', 'content': '공에 힘이 주어졌을 때 공이 어떻게 움직이는지 과학적으로 설명해줘.'}]
Generated message: content='' additional_kwargs={'function_call': {'arguments': '{"standalone_query":"공에 힘이 주어졌을 때 움직임"}', 'name': 'search'}} response_metadata={'token_usage': {'completion_tokens': 23, 'prompt_tokens': 199, 'total_tokens': 222, 'completion_tokens_details': {'audio_tokens': None, 'reasoning_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': None, 'cached_tokens': 0}}, 'model_name': 'gpt-4-1106-preview', 'system_fingerprint': None, 'finish_reason': 'stop', 'logprobs': None} id='run-0963c0ab-794d-4ec8-bbc5-742248a3d3e2-0'
Generated standalone query: 공에 힘이 주어졌을 때 움직임
Searching for: 공에 힘이 주어졌을 때 움직임
Generated answer: ```json
{
  "query": "공에 힘이 주어졌을 때 움직임의 과학적 원리",
  "answer": ""
}
```
Processed result: {'eval_id': 223, 'standalone_query': '공에 힘이 주어졌을 때 움직임', 'topk': ['e2161953-e80b-41b3-a83b-5bc7d76a801c', '83f6c921-1ee7-4bd5-a124-7c71c860546a', '88e701bc-b7cf-4c1e-849a-e21