### 1.ChatEngine 기본 사용법

In [1]:
from llama_index.core import SimpleDirectoryReader, VectorStoreIndex

# 문서 로드 및 인덱스 생성
documents = SimpleDirectoryReader(input_files=["../data/pdf_example.pdf"]).load_data()
index = VectorStoreIndex.from_documents(documents)

chat_engine = index.as_chat_engine()

In [None]:
response = chat_engine.chat("rag가 뭐야?")
print(response)

RAG은 'Retrieval-Augmented Generation'의 약자로, AI가 기존 지식뿐만 아니라 관련 정보를 검색하여 답변을 제공하는 방법을 가리킵니다.


In [4]:
response = chat_engine.chat("학생이 시험을 보는 상황을 비유로 설명해줘")
print(response)

RAG은 시험을 보는 학생과 유사하다고 비유할 수 있습니다. 학생이 어려운 문제에 대답하기 전에 도서관에서 책을 참고하는 것처럼, RAG는 정보를 검색하고 해당 정보를 기반으로 응답을 생성하여 신뢰할 수 있는 답변을 제공합니다.


In [3]:
from llama_index.core import PromptTemplate
from llama_index.core.llms import ChatMessage, MessageRole
from llama_index.core.chat_engine import CondenseQuestionChatEngine

custom_prompt = PromptTemplate(
    """\
Given a conversation (between Human and Assistant) and a follow up message from Human, \
rewrite the message to be a standalone question that captures all relevant context \
from the conversation.

<Chat History>
{chat_history}

<Follow Up Message>
{question}

<Standalone question>
"""
)

# list of `ChatMessage` objects
custom_chat_history = [
    ChatMessage(
        role=MessageRole.USER,
        content="Hello assistant, we are having a insightful discussion about RAG today.",
    ),
    ChatMessage(role=MessageRole.ASSISTANT, content="Okay, sounds good."),
]

query_engine = index.as_query_engine()

chat_engine = CondenseQuestionChatEngine.from_defaults(
    query_engine=query_engine,
    condense_question_prompt=custom_prompt,
    chat_history=custom_chat_history,
    verbose=True,
)

In [None]:
from llama_index.llms.openai import OpenAI

llm = OpenAI(temperature=0.0, model="gpt-4o")


In [None]:
from llama_index.core.chat_engine import SimpleChatEngine

chat_engine = SimpleChatEngine.from_defaults(llm=llm)

===== Entering Chat REPL =====
Type "exit" to exit.



In [None]:
response = chat_engine.stream_chat(
    "Write me a poem about raining cats and dogs."
)
for token in response.response_gen:
    print(token, end="")