# [실습1] LangChain으로 간단한 LLM 챗봇 만들기


## 실습 목표
---
- LangChain을 활용해서 Mistral 7B 모델을 사용하는 챗봇을 개발합니다.
- 짧은 Chain을 구성하고, 이를 활용해서 챗봇을 구현합니다.

## 실습 목차
---

1. **ChatOllama Agent 생성:** 사용자의 입력에 대한 Mistral 7B 모델의 답변을 받아오는 Agent를 생성합니다.

2. **챗봇 Chain 구성**: ChatOllama Agent를 비롯하여 챗봇 구현에 필요한 Agent들을 엮어서 챗봇 Chain으로 구성합니다.

3. **챗봇 사용**: 여러분이 구성하신 챗봇을 사용해봅니다.

## 실습 개요
---

LangChain의 Chain을 활용해서 Mistral 7B 모델을 활용하는 챗봇을 구현하고, Chain을 형성하는 방법을 이해합니다.


라이브러리 설명

langchain_core
핵심 모듈로, Langchain의 기본 기능을 담당합니다.
Langchain의 뼈대 역할을 하는 부분으로, 모델 호출, 체인 구성, 메모리 관리 등 주요 기능이 여기에 포함됩니다.
쉽게 말해, Langchain 전체의 작동 원리를 제공하는 기반 코드를 담고 있는 라이브러리입니다.

langchain_community
커뮤니티 주도로 만들어진 확장 모듈입니다.
Langchain이 성장하면서, 다양한 사람들이 기여한 플러그인, 템플릿, 커스터마이징된 기능 등이 포함된 공간이라고 보면 됩니다.
즉, 커뮤니티 사용자들이 필요로 하는 기능이나 새로운 아이디어를 반영한 모듈들이 여기에 속합니다. 쉽게 말하면 Langchain의 확장팩 같은 개념입니다.

Ollama란?

Ollama는 인공지능 기반의 챗봇 모델을 제공하는 플랫폼으로, ChatGPT와 유사하게 자연어 처리 기술을 활용해 
대화형 인공지능 시스템을 구축하는 데 도움을 줍니다. Ollama는 다양한 언어 모델을 지원하고, 
이를 쉽게 활용할 수 있는 API를 제공합니다. 

## 0. 환경 설정
- 필요한 라이브러리를 불러옵니다.

In [16]:
from langchain_core.messages import HumanMessage, SystemMessage
# HumanMessage: 대화형 상황에서 인간 사용자가 입력한 메시지를 나타냄
# SystemMessage: 시스템 또는 모델에서 나온 메시지를 나타내며, 주로 지시사항이나 응답을 설정하는 역할을 함

from langchain_core.output_parsers import StrOutputParser
# StrOutputParser: 모델의 출력값을 받아서 문자열 형식으로 변환하는 파서
# 모델의 응답을 일관성 있게 처리하고 구조화하는 데 유용함

from langchain_core.prompts import ChatPromptTemplate
# ChatPromptTemplate: 모델에게 입력할 프롬프트(지시사항)를 어떻게 구성할지 정의하는 템플릿
# 대화를 위한 지침이나 콘텐츠를 템플릿 형식으로 설정할 수 있게 해줌

from langchain_community.chat_models import ChatOllama
# ChatOllama: Langchain에서 지원하는 Ollama라는 이름의 커뮤니티 기반 챗봇 모델
# 이 모델은 주로 대화 상호작용을 위해 커스터마이즈되었으며, 커뮤니티에서 기여한 최적화된 모델임

- Ollama를 통해 Mistral 7B 모델을 불러옵니다.

In [None]:
# 이 실습은 nohup ollama serve & 명령어를 통해 백그라운드에서 ollama serve 명령을 실행한 상태입니다.
# 여러분이 현업에서 사용할 때에는 위 명령어를 통해 serve를 백그라운드에서 실행하는 것이 좋습니다.
!ollama pull mistral:7b

## 1. ChatOllama Agent 생성


Mistral 7B 모델을 사용하는 ChatOllama Agent를 생성합니다. 
- ChatOllama Agent는 사용자의 입력을 Ollama를 통해 로컬에서 구동한 LLM에 전송하고, 그 답변을 반환합니다.
- 본 RAG 과정에서는 LLM으로 ChatOllama와 오픈 소스 LLM을 활용할 것입니다.

In [2]:
# 먼저, mistral:7b 모델을 사용하는 ChatOllama 객체를 생성합니다.
llm = ChatOllama(model="mistral:7b")

OPEN AI API 코드

In [None]:
from langchain_openai import ChatOpenAI, OpenAIEmbeddings
OPENAI_API_KEY= 'sk'
llm  = ChatOpenAI(model='gpt-4o-mini', openai_api_key=OPENAI_API_KEY)
embeddings = OpenAIEmbeddings(openai_api_key=OPENAI_API_KEY)

Agent를 구성했으니, 이제 Agent를 사용해봅시다.

### 1-1. Runnable interface

LangChain에서 Chain으로 엮을 수 있는 대부분의 구성 요소 (Agent, Tool 등..)는 "Runnable" protocol을 공유합니다.
- 관련 LangChain API 문서: [langchain_core.runnables.base.Runnable — 🦜🔗 LangChain 0.1.4](https://api.python.langchain.com/en/stable/runnables/langchain_core.runnables.base.Runnable.html#langchain_core.runnables.base.Runnable)

Runnable protocol을 공유하는 구성 요소는 모두 아래 세 메서드를 가지고 있습니다:
- stream: 구성 요소의 답변을 순차적으로 반환한다 (stream back)
- invoke: 입력된 값으로 chain을 호출하고, 그 결과를 반환한다.
- batch: 입력값 리스트 (batch)로 chain을 호출하고, 그 결과를 반환한다.

예시로, 저희가 방금 사용한 `ChatOllama` Class는 "Runnable" 하기 때문에 `invoke` 메서드를 가지고 있습니다.
- invoke() 메서드를 통해 Agent, Chain 등에 데이터를 입력하고, 그 출력을 받아올 수 있습니다.

`invoke` 메서드를 사용해봅시다. 여기서는 "당신은 누구입니까?" 라는 질문을 입력하면 Agent가 OpenAI API를 통해 Mistral 7B 모델의 답변을 받아 출력할 것입니다.

runnable이란?

특정 작업(예: 텍스트 생성, 데이터 처리, API 호출 등)을 실행할 수 있는 객체입니다.
이런 작업들은 독립적으로 실행될 수도 있고, 여러 작업을 연결하여 하나의 흐름으로 만들 수도 있습니다.

In [None]:
llm.invoke("당신은 누구입니까?")

단순 텍스트 뿐만 아니라, 시스템, 사람, AI의 답변을 리스트로 정리하여 입력할 수 있습니다. 

여기서는 LangChain의 `SystemMessage`, `HumanMessage` Class를 활용해봅시다.

In [9]:
messages = [
    SystemMessage("당신은 친절한 AI 어시스턴트 입니다."),
    HumanMessage("한글로 당신을 소개해주세요."),
]

response = llm.invoke(messages)

시스템 프롬프트에 '친절한 AI 어시스턴트' 라는 역할을 명시하였습니다.

이제 Mistral 7B 모델이 아까와 같은 질문에 어떻게 답했는지 확인해봅시다.

In [None]:
response

같은 질문을 했음에도 자신을 소개하는 문구가 조금 달라진 것 을 확인할 수 있습니다.

### [TODO] 다양한 역할을 적용해서 어떻게 답변이 달라지는지 자유롭게 실험해보세요.

In [12]:
role = "유치원선생님"
messages = [
    SystemMessage(f"당신은 {role} 입니다."),
    HumanMessage("당신을 소개해주세요."),
]

response = llm.invoke(messages)

In [None]:
response

메타 데이터 예시
response_metadata={'token_usage': {'completion_tokens': 47, 'prompt_tokens': 14, 'total_tokens': 61, 'prompt_tokens_details': {'cached_tokens': 0}, 'completion_tokens_details': {'reasoning_tokens': 0}}, 'model_name': 'gpt-4o-mini', 'system_fingerprint': 'fp_e2bde53e6e', 'finish_reason': 'stop', 'logprobs': None}, id='run-09b38547-c5b7-4945-9e9d-b8c673decd1b-0', usage_metadata={'input_tokens': 14, 'output_tokens': 47, 'total_tokens': 61}

메타 데이터 설명
token_usage: 모델이 사용한 토큰에 대한 정보입니다.
completion_tokens: 모델이 생성한 응답에서 사용한 토큰 수입니다. 이 예시에서는 47개의 토큰을 사용했습니다.
prompt_tokens: 입력 요청에서 사용된 토큰 수입니다. 이 경우 14개의 토큰이 사용되었습니다.
total_tokens: 요청과 응답에서 사용된 총 토큰 수입니다. 여기서는 61개의 토큰이 사용되었습니다.
prompt_tokens_details.cached_tokens: 이전 대화에서 캐시된 토큰 수를 나타냅니다. 이 예시에서는 캐시된 토큰이 없었습니다 (0).
completion_tokens_details.reasoning_tokens: 모델이 추론할 때 사용한 토큰 수를 나타냅니다. 이 경우 0으로 설정되어 있습니다.
model_name: 응답을 생성하는 데 사용된 모델의 이름입니다. 이 경우 gpt-4o-mini 모델이 사용되었습니다.
system_fingerprint: 시스템 또는 모델의 고유 식별자입니다. 여기서는 fp_e2bde53e6e로 나타나 있습니다.
finish_reason: 응답이 완료된 이유를 나타냅니다. 이 경우, 'stop'은 응답이 자연스럽게 완료되었음을 의미합니다.
logprobs: 각 토큰에 대한 확률 값 로그가 기록되었는지 여부입니다. 이 경우에는 None으로 설정되어 있어, 이 정보를 기록하지 않았음을 나타냅니다.
id: 요청에 대한 고유 식별자입니다. 여기서는 run-09b38547-c5b7-4945-9e9d-b8c673decd1b-0가 요청을 나타냅니다.
usage_metadata: 입력 및 출력 토큰 사용량에 대한 메타 데이터입니다.
input_tokens: 입력 요청에 사용된 토큰 수입니다. 여기서는 14개의 토큰이 사용되었습니다.
output_tokens: 모델이 생성한 출력(응답)에서 사용된 토큰 수입니다. 여기서는 47개의 토큰이 사용되었습니다.
total_tokens: 입력과 출력에서 사용된 전체 토큰 수로, 61개입니다.

## 2. 챗봇 Chain 구성

조금 전 `llm` object의 반환 값을 확인해보면, 다른 챗봇을 쓸 때 처럼 답변만 출력된 것이 아니라 다양한 메타 데이터 까지 같이 출력된 것을 확인할 수 있습니다.

저희가 ChatGPT를 쓸 때를 생각해보면, 챗봇에 이걸 그대로 출력하는건 좀 부자연스럽습니다.

이를 방지하기 위해, 답변을 parsing하는 `StrOutputParser`를 활용해봅시다.

### 2-1. Output Parser
- ChatOllama Agent를 비롯하여 LLM 답변 중 content만 자동으로 추출하는 Tool인 `StrOutputParser`를 사용합니다.

In [14]:
parser = StrOutputParser()

`StrOutputParser`를 사용해봅시다.

In [None]:
# Parser가 제대로 답변만을 리턴하는지 확인합니다.
parsed_response = parser.invoke(response)
print(parsed_response)

response에서 의도한 대로 텍스트만 추출하는 것을 확인할 수 있습니다.

### 2-2. 간단한 체인 구성

- 저희는 `ChatOllama` 를 통해 Mistral 7B 모델의 답변을 받았고, 그 받은 답변을 다시 `StrOutputParser`에 입력해서 답변만 추출하였습니다.
- 이 과정을 Chain으로 엮어서 간략화 해봅시다.

In [16]:
# pipe (|) 연산자를 통해 두 객체를 연결해서 하나의 체인으로 만들 수 있습니다.
chain = llm | parser

이 표현식에서 파이프 기호(|)는 두 구성 요소가 연결되어 있다는 것을 의미합니다. 
첫번째 요소의 출력이 두번째 요소의 입력으로 들어가는 식으로 연결됩니다.
이렇게 파이프로 연결될 수 있는 구성요소를 runnable이라고 부릅니다.
쉽게 말해 runnable은 입력을 받아 출력을 생성할 수 있는 ‘실행가능’한 요소라고 생각하시면 됩니다.

출처 : https://elyire.github.io/posts/LCEL%EA%B3%BC-runnable-%EB%B8%94%EB%A1%9C%EA%B7%B8/

Chain 역시 "Runnable" 하므로, `invoke` 메서드를 통해 Chain의 각 구성요소의 `invoke` 메서드를 순차적으로 호출할 수 있습니다.

이때 특정 객체의 `invoke` 반환값은 Chain 상에서 연결된 다음 객체의 `invoke` 메서드에 입력됩니다.

In [None]:
# 체인을 실행하면, 체인에 포함된 모든 객체가 순차적으로 실행되며, 마지막 객체의 결과가 반환됩니다.
# 여기서는 llm 객체가 먼저 실행되고, 그 결과가 parser 객체에 전달됩니다.
chained_response = chain.invoke(messages)
print(chained_response)

별도의 절차 없이 바로 답변만 생성되는 것을 확인할 수 있습니다. 

### 2-3. 프롬프트 템플릿

이제 여러분의 챗봇에 프로그래밍 조수, 시장조사 요원, 그냥 친구 등 다양한 역할을 적용해야 하는 상황이라 가정합시다.

이를 구현할 수 있는 방법은 여러가지가 있지만, 우선 가장 간단한 방법으로 시스템 프롬프트에 '당신은 {역할} 입니다' 를 입력해 보겠습니다.

이 방법이 항상 잘 작동하는 것은 아니지만, 간단한 예시 정도는 구현할 수 있습니다.

사용자의 입력을 받고, 그에 대응하는 답변을 하기 위해서는 사용자의 입력을 적용할 수 있는 프롬프트 템플릿을 적용할 수 있습니다. 

In [18]:
# role에는 "AI 어시스턴트"가, question에는 "당신을 소개해주세요."가 들어갈 수 있습니다.
# Note. 사용한 문자열이 f-string이 아닙니다. 
# 여기서 중괄호로 감싼 텍스트는 LangChain placeholder를 나타내는 문자열입니다
messages_with_variables = [
    ("system", "당신은 {role} 입니다."),
    ("human", "{question}"),
]

In [19]:
# ChatPromptTemplate는 LangChain에서 사용하는 클래스 중 하나로,
# 사용자가 정의한 메시지를 기반으로 하나의 프롬프트를 생성하는 데 사용됩니다.
# from_messages() 메서드는 여러 메시지를 받아 프롬프트로 변환하는 역할을 합니다.
prompt = ChatPromptTemplate.from_messages(messages_with_variables)

In [None]:
prompt

앞서 저희가 정의했던 코드와 크게 두가지 차이점이 있습니다.
- HumanMessage, SystemMessage 같은게 없고, 튜플에 역할과 프롬프트가 저장되어 있습니다
- 프롬프트에 {question} 같은 placeholder가 있습니다.

messages = [
    SystemMessage("당신은 친절한 AI 어시스턴트 입니다."),
    HumanMessage("한글로 당신을 소개해주세요."),
]

In [20]:
# pipe (|) 연산자를 통해 여러 객체를 연결해서 하나의 체인으로 만들 수 있습니다.
# 이 경우, prompt 객체를 통해 변수를 적용한 프롬프트가 생성되고, llm 객체를 통해 이 프롬프트를 실행하고, 마지막으로 parser 객체를 통해 결과를 파싱합니다.
chain = prompt | llm | parser

In [None]:
chain.invoke({"role": "친절한 페어 프로그래머", "question": "당신을 소개해주세요."})

## 3. 챗봇 사용

마지막으로, 여러분이 제작하신 챗봇을 한번 사용해 봅시다.

1. 사용자의 입력을 받아 앞서 정의한 Chain을 실행하고, 그 결과를 반환하는 함수를 정의합니다.

In [22]:
# 간단한 실습이므로 앞서 사용했던 변수를 그대로 함수의 파라미터로 설정했습니다. 
# 다음 실습 부터는 이를 좀 더 고도화 해 볼 것입니다.
def simple_chat(role, question, chain):
    result = chain.invoke({"role": role, "question": question})
    return result

In [None]:
role = input("제 역할을 입력해주세요: ")
while True:
    question = input("질문을 입력해주세요 (역할을 바꾸고 싶다면 '역할 교체' 를 입력해주세요. 종료를 원하시면 '종료'를 입력해주세요.): ")
    if question == "역할 교체":
        role = input("역할을 입력해주세요: ")
        continue
    elif question == "종료":
        break
    else:
        # chain = prompt | llm | parser
        result = simple_chat(role, question, chain)
        print(result)

대부분의 경우, 입력한 역할에 맞춰 어느 정도 대답하는 것을 확인할 수 있습니다. <br>
현재 챗봇은 다음 한계점이 있습니다.
- 문서나 데이터 기반 추론이 불가능하다.
- Chat History를 기억하지 못한다.

이어지는 실습에서 두 한계를 개선하고, 시장 조사 문서 기반 QA 봇을 만들어 봅시다.

또한, 지금 구성한 챗봇은 UI가 없고 단순 표준 입출력 만을 사용합니다. 본 과정을 다 이수하시면 Streamlit을 활용해 간단히 챗봇을 만들어 볼 수 있을 것입니다.

### 추가 실습

시스템 프롬프트를 수정하면서 챗봇이 한글로 답변하는 빈도를 높여보세요.