## Use case

챗봇은 핵심적인 LLM 사용 사례 중 하나입니다. 챗봇의 핵심 기능은 장시간 대화가 가능하고 사용자가 알고 싶어하는 정보에 액세스할 수 있다는 것입니다.

기본적인 프롬프트와 LLM 외에도 메모리와 검색은 챗봇의 핵심 구성 요소입니다. 메모리는 챗봇이 과거의 상호작용을 기억할 수 있게 해주며, 검색은 챗봇에게 도메인별 최신 정보를 제공합니다.

## Overview

채팅 모델 인터페이스는 원시 텍스트가 아닌 메시지를 기반으로 합니다. 채팅 시 고려해야 할 몇 가지 구성 요소가 중요합니다:

* `채팅 모델`: 채팅 모델은 대화형 톤이 더 강하고 기본적으로 메시지 인터페이스를 지원합니다.
* `프롬프트 템플릿`: 프롬프트 템플릿을 사용하면 기본 메시지, 사용자 입력, 채팅 기록 및 (선택 사항으로) 검색된 추가 컨텍스트를 결합하는 프롬프트를 쉽게 조합할 수 있습니다.


## Quickstart

다음은 챗봇 인터페이스를 만드는 방법에 대한 간단한 미리보기입니다. 먼저 몇 가지 종속성을 설치하고 필요한 자격 증명을 설정해 보겠습니다:

In [None]:
# !pip install langchain openai

Collecting langchain
  Downloading langchain-0.0.348-py3-none-any.whl (2.0 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m2.0/2.0 MB[0m [31m12.7 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting openai
  Downloading openai-1.3.7-py3-none-any.whl (221 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m221.4/221.4 kB[0m [31m8.1 MB/s[0m eta [36m0:00:00[0m
Collecting dataclasses-json<0.7,>=0.5.7 (from langchain)
  Downloading dataclasses_json-0.6.3-py3-none-any.whl (28 kB)
Collecting jsonpatch<2.0,>=1.33 (from langchain)
  Downloading jsonpatch-1.33-py2.py3-none-any.whl (12 kB)
Collecting langchain-core<0.1,>=0.0.12 (from langchain)
  Downloading langchain_core-0.0.12-py3-none-any.whl (181 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m181.5/181.5 kB[0m [31m14.3 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting langsmith<0.1.0,>=0.0.63 (from langchain)
  Downloading langsmith-0.0.69-py3-none-any.whl (48 kB)
[2K     [90m━━━━━━━

In [1]:
import getpass
import os

os.environ["OPENAI_API_KEY"] = getpass.getpass()

일반 채팅 모델을 사용하면 모델에 하나 이상의 메시지를 전달하여 채팅 완료를 얻을 수 있습니다.

채팅 모델은 메시지로 응답합니다.

In [2]:
from langchain.chat_models import ChatOpenAI
from langchain.schema import HumanMessage, SystemMessage

chat = ChatOpenAI()
chat(
    [
        HumanMessage(
            content="Translate this sentence from English to French: I love programming."
        )
    ]
)

  warn_deprecated(
  warn_deprecated(


AIMessage(content="J'adore programmer.")

메시지 목록을 전달하면 됩니다:

In [3]:
messages = [
    SystemMessage(
        content="You are a helpful assistant that translates English to French."
    ),
    HumanMessage(content="I love programming."),
]
chat(messages)

AIMessage(content="J'adore la programmation.")

그런 다음 채팅 모델을 과거 사용자 입력과 모델 출력을 기억하는 메모리가 내장된 '대화 체인'으로 감쌀 수 있습니다.

In [4]:
from langchain.chains import ConversationChain

conversation = ConversationChain(llm=chat)
conversation.run("Translate this sentence from English to French: I love programming.")

  warn_deprecated(


'Je adore programmer.'

In [7]:
conversation.run("Translate it to German.")

'Ich liebe Programmieren.'


위에서 언급했듯이 챗봇의 핵심 구성 요소는 메모리 시스템입니다. 가장 간단하고 일반적으로 사용되는 메모리 형태 중 하나는 `ConversationBufferMemory`입니다:
* 이 메모리는 `버퍼`에 메시지를 저장할 수 있습니다.
* 체인에서 호출하면 저장된 모든 메시지를 반환합니다.

여기서는 컨버세이션버퍼메모리에 대해 간단히 살펴보겠습니다. 다음과 같이 메모리에 몇 개의 채팅 메시지를 수동으로 추가할 수 있습니다:

In [9]:
from langchain.memory import ConversationBufferMemory

memory = ConversationBufferMemory()
memory.chat_memory.add_user_message("hi!")
memory.chat_memory.add_ai_message("whats up?")

{'history': 'Human: hi!\nAI: whats up?'}

이제 메모리에서 로드할 수 있습니다. 모든 `Memory` 클래스가 노출하는 핵심 메서드는 `load_memory_variables`입니다. 이 메서드는 초기 체인 입력을 받아 체인 입력에 추가되는 메모리 변수 목록을 반환합니다.

이 간단한 메모리 유형은 메모리를 로드할 때 실제로 체인 입력을 고려하지 않으므로 지금은 빈 입력을 전달할 수 있습니다:

In [6]:
memory.load_memory_variables({})

{'history': 'Human: hi!\nAI: whats up?'}

`대화 버퍼 창 메모리`를 사용하여 가장 최근의 `k` 상호작용을 슬라이딩 창으로 보관할 수도 있습니다.

In [10]:
from langchain.memory import ConversationBufferWindowMemory

memory = ConversationBufferWindowMemory(k=10)
memory.save_context({"input": "hi"}, {"output": "whats up"})
memory.save_context({"input": "not much you"}, {"output": "not much"})
memory.load_memory_variables({ })

{'history': 'Human: hi\nAI: whats up\nHuman: not much you\nAI: not much'}

`ConversationSummaryBufferMemory`는 이 테마의 확장입니다.

이 메모리는 시간 경과에 따른 대화의 요약을 생성합니다.

이 메모리는 전체 메시지 기록이 많은 토큰을 소모하는 긴 대화에 가장 유용합니다.

In [34]:
from langchain.llms import OpenAI
from langchain.memory import ConversationSummaryMemory

llm = OpenAI(temperature=0)
memory = ConversationSummaryMemory(llm=llm)
memory.save_context({"input": "hi"}, {"output": "whats up"})
memory.save_context(
    {"input": "im working on better docs for chatbots"},
    {"output": "oh, that sounds like a lot of work"},
)
memory.save_context(
    {"input": "yes, but it's worth the effort"},
    {"output": "agreed, good docs are important!"},
)

In [12]:
memory.load_memory_variables({})

{'history': "\nThe human greets the AI and asks what's up. The AI responds by asking what's going on. The human then shares that they are working on improving documentation for chatbots. The AI acknowledges that it sounds like a lot of work, but the human agrees that it's worth the effort. The AI also adds that good documentation is important."}

`ConversationSummaryBufferMemory`는 이를 조금 더 확장합니다:

상호작용의 개수가 아닌 토큰 길이를 사용해 상호작용을 플러시할 시기를 결정합니다.

In [13]:
!pip install tiktoken





In [15]:
from langchain.memory import ConversationSummaryBufferMemory
from langchain.llms import OpenAI
llm = OpenAI(temperature=0)
memory = ConversationSummaryBufferMemory(llm=llm, max_token_limit=10)
memory.save_context({"input": "hi"}, {"output": "whats up"})
memory.save_context({"input": "not much you"}, {"output": "not much"})
memory.load_memory_variables({})

{'history': "System: \nThe human greets the AI and asks what's up. The AI responds by asking what's going on.\nHuman: not much you\nAI: not much"}

## Conversation

`ConversationChain`으로 내부의 내용을 풀 수 있습니다.

메모리인 `ConversationSummaryMemory`를 지정하고 프롬프트를 지정할 수 있습니다.

In [18]:
from langchain.chains import LLMChain
from langchain.prompts import (
    ChatPromptTemplate,
    HumanMessagePromptTemplate,
    MessagesPlaceholder,
    SystemMessagePromptTemplate,
)

# LLM
llm = ChatOpenAI()

# Prompt
prompt = ChatPromptTemplate(
    messages=[
        SystemMessagePromptTemplate.from_template(
            "You are a nice chatbot having a conversation with a human."
        ),
        # The `variable_name` here is what must align with memory
        MessagesPlaceholder(variable_name="chat_history"),
        HumanMessagePromptTemplate.from_template("{question}"),
    ]
)

# Notice that we `return_messages=True` to fit into the MessagesPlaceholder
# Notice that `"chat_history"` aligns with the MessagesPlaceholder name
memory = ConversationBufferMemory(memory_key="chat_history", return_messages=True)
conversation = LLMChain(llm=llm, prompt=prompt, verbose=True, memory=memory)

# Notice that we just pass in the `question` variables - `chat_history` gets populated by memory
conversation.invoke({"question": "hi"})




[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3mSystem: You are a nice chatbot having a conversation with a human.
Human: hi[0m

[1m> Finished chain.[0m


{'question': 'hi',
 'chat_history': [HumanMessage(content='hi'),
  AIMessage(content='Hello! How are you doing today?')],
 'text': 'Hello! How are you doing today?'}

In [20]:
conversation(
    {"question": "Translate this sentence from English to French: I love programming."}
)



[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3mSystem: You are a nice chatbot having a conversation with a human.
Human: hi
AI: Hello! How are you doing today?
Human: Translate this sentence from English to French: I love programming.
AI: Je aime la programmation.
Human: Translate this sentence from English to French: I love programming.[0m

[1m> Finished chain.[0m


{'question': 'Translate this sentence from English to French: I love programming.',
 'chat_history': [HumanMessage(content='hi'),
  AIMessage(content='Hello! How are you doing today?'),
  HumanMessage(content='Translate this sentence from English to French: I love programming.'),
  AIMessage(content='Je aime la programmation.'),
  HumanMessage(content='Translate this sentence from English to French: I love programming.'),
  AIMessage(content="J'adore la programmation.")],
 'text': "J'adore la programmation."}

In [17]:
conversation({"question": "Now translate the sentence to German."})



[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3mSystem: You are a nice chatbot having a conversation with a human.
Human: hi
AI: Hello! How can I assist you today?
Human: Translate this sentence from English to French: I love programming.
AI: Je suis désolé, je suis un chatbot et je ne peux pas effectuer de traductions. Cependant, la traduction de "I love programming" en français serait "J'adore programmer".
Human: Now translate the sentence to German.[0m

[1m> Finished chain.[0m


{'question': 'Now translate the sentence to German.',
 'chat_history': [HumanMessage(content='hi'),
  AIMessage(content='Hello! How can I assist you today?'),
  HumanMessage(content='Translate this sentence from English to French: I love programming.'),
  AIMessage(content='Je suis désolé, je suis un chatbot et je ne peux pas effectuer de traductions. Cependant, la traduction de "I love programming" en français serait "J\'adore programmer".'),
  HumanMessage(content='Now translate the sentence to German.'),
  AIMessage(content='Entschuldigung, ich bin ein Chatbot und kann keine Übersetzungen durchführen. Die Übersetzung von "I love programming" ins Deutsche lautet jedoch "Ich liebe das Programmieren".')],
 'text': 'Entschuldigung, ich bin ein Chatbot und kann keine Übersetzungen durchführen. Die Übersetzung von "I love programming" ins Deutsche lautet jedoch "Ich liebe das Programmieren".'}

## Chat Retrieval

이제 [문서와 채팅](https://twitter.com/mayowaoshin/status/1640385062708424708?s=20) 또는 다른 지식 소스를 사용한다고 가정해 보겠습니다.

이것은 채팅과 `문서 검색`을 결합한 인기 있는 사용 사례입니다.

이를 통해 모델에 학습되지 않은 특정 정보에 대해 채팅할 수 있습니다.

In [21]:
!pip install chromadb





블로그 게시물을 로드합니다.

In [23]:
from langchain.document_loaders import WebBaseLoader

loader = WebBaseLoader("https://lilianweng.github.io/posts/2023-06-23-agent/")
data = loader.load()

이를 벡터로 분할하여 저장합니다.

In [29]:
from langchain.text_splitter import RecursiveCharacterTextSplitter

text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=0)
all_splits = text_splitter.split_documents(data)

from langchain.embeddings import OpenAIEmbeddings
from langchain.vectorstores import Chroma

vectorstore = Chroma.from_documents(documents=all_splits, embedding=OpenAIEmbeddings())

In [32]:
vectorstore

<langchain_community.vectorstores.chroma.Chroma at 0x203f65ef100>

In [30]:
all_splits

[Document(page_content="LLM Powered Autonomous Agents | Lil'Log\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\nLil'Log\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\n\nPosts\n\n\n\n\nArchive\n\n\n\n\nSearch\n\n\n\n\nTags\n\n\n\n\nFAQ\n\n\n\n\nemojisearch.app\n\n\n\n\n\n\n\n\n\n      LLM Powered Autonomous Agents\n    \nDate: June 23, 2023  |  Estimated Reading Time: 31 min  |  Author: Lilian Weng\n\n\n \n\n\nTable of Contents\n\n\n\nAgent System Overview\n\nComponent One: Planning\n\nTask Decomposition\n\nSelf-Reflection\n\n\nComponent Two: Memory\n\nTypes of Memory\n\nMaximum Inner Product Search (MIPS)", metadata={'source': 'https://lilianweng.github.io/posts/2023-06-23-agent/', 'title': "LLM Powered Autonomous Agents | Lil'Log", 'description': 'Building agents with LLM (large language model) as its core controller is a cool concept. Several proof-of-concepts demos, such as AutoGPT, GPT-Engineer and BabyAGI, serve as inspiring examples. The potentiality of

이전과 마찬가지로 메모리를 생성하되, `ConversationSummaryMemory`를 사용하겠습니다.

In [35]:
memory = ConversationSummaryMemory(
    llm=llm, memory_key="chat_history", return_messages=True
)

In [37]:
from langchain.chains import ConversationalRetrievalChain
from langchain.chat_models import ChatOpenAI

llm = ChatOpenAI()
retriever = vectorstore.as_retriever()
qa = ConversationalRetrievalChain.from_llm(llm, retriever=retriever, memory=memory)

In [38]:
qa("How do agents use Task decomposition?")

{'question': 'How do agents use Task decomposition?',
 'chat_history': [SystemMessage(content='')],
 'answer': 'The usage of task decomposition by agents is to break down large tasks into smaller, manageable subgoals. This allows agents to handle complex tasks more efficiently. By breaking down the task into smaller parts, agents can focus on completing each subgoal individually, which can lead to improved overall task performance.'}

In [26]:
qa("What are the various ways to implement memory to support it?")

{'question': 'What are the various ways to implement memory to support it?',
 'chat_history': [SystemMessage(content='The human asks how agents use task decomposition. The AI explains that agents break down large tasks into smaller subgoals, which allows them to efficiently handle complex tasks. Agents can use methods like LLM with simple prompting or task-specific instructions for task decomposition. They can also receive input from humans to assist in task decomposition.')],
 'answer': "The different methods of implementing memory to support task decomposition are:\n1. Long Term Memory (LTM) management: This involves the agent's ability to store and retrieve information from its long-term memory. The agent can use this memory to remember past experiences, learned strategies, and relevant knowledge for task decomposition.\n\n2. Internet access: The agent can have access to the internet to gather information and resources that may be needed for task decomposition. This allows the agent