# Overview

<img src='./images/fig_00_01.png' width=800>

#### 강의 소개
- LangChain을 사용하면 대규모 언어 모델(LLM) 애플리케이션 개발이 훨씬 빨라집니다.
- LLM을 여러 번 프롬프트하고 출력을 파싱해야 하므로 많은 코드가 필요합니다.
- LangChain은 이러한 개발 과정을 쉽게 만들어줍니다.

<img src='./images/fig_00_02.png' width=800>

#### LangChain 소개
- Harrison Chase가 만든 LangChain은 오픈 소스 프레임워크로 LLM 애플리케이션을 구축하는 데 도움을 줍니다.
- 많은 사람들이 더 복잡한 애플리케이션을 개발하면서 공통된 추상화를 발견하고 이를 바탕으로 LangChain이 탄생했습니다.
- 커뮤니티의 적극적인 참여로 빠르게 발전하고 있습니다.

#### LangChain의 성장과 커뮤니티
- LangChain은 수많은 사용자와 기여자를 보유하고 있으며, 이는 빠른 개발 속도에 크게 기여했습니다.
- 이 단기 과정을 통해 LangChain을 사용하여 멋진 애플리케이션을 빠르게 개발할 수 있게 됩니다.
- 오픈 소스 LangChain에 기여할 수도 있습니다.

#### LangChain 패키지와 구성 요소
- LangChain은 Python과 JavaScript 패키지를 제공하며, 구성 요소의 조합과 모듈성을 중점으로 합니다.
- 개별 구성 요소를 함께 또는 따로 사용할 수 있습니다.
- 주요 가치 제공은 다양한 사용 사례를 위한 체인과 모듈 구성 요소의 결합 방법입니다.

#### 강의 내용
- LangChain의 일반적인 구성 요소를 다룹니다.
- 모델, 프롬프트, 인덱스, 체인, 에이전트에 대해 설명합니다.
- 에이전트는 모델을 추론 엔진으로 사용하는 매우 흥미로운 유형의 끝단 사용 사례입니다.

<img src='./images/fig_00_03.png' width=800>

#### 감사 인사 및 기여자 소개
- LangChain 공동 창립자인 Ankush Gola가 이 자료에 많은 기여를 했습니다.
- DeepLearning.AI의 Geoff Ludwig, Eddy Shyu, Diala Ezzeddine도 이 자료에 기여했습니다.

#### 다음 비디오 예고
- 다음 비디오에서는 LangChain의 모델, 프롬프트, 파서에 대해 배웁니다.

# 모델, 프롬프트 및 출력 파서

- 첫 번째 강의에서는 모델, 프롬프트, 출력 파서에 대해 다룹니다.
    - 모델은 많은 것을 뒷받침하는 언어 모델을 의미합니다.
    - 프롬프트는 모델에 입력할 내용을 생성하는 스타일을 의미합니다.
    - 출력 파서는 이 모델의 출력을 가져와서 더 구조화된 형식으로 변환하는 작업을 의미합니다.
- LLM을 사용하여 애플리케이션을 구축할 때, 종종 재사용 가능한 모델이 필요합니다.
- 우리는 모델을 반복적으로 프롬프트하고 출력을 파싱합니다.
- LangChain은 이러한 작업을 쉽게 수행할 수 있는 추상화를 제공합니다.

## 개요

 * OpenAI에 직접 API 호출
 * LangChain을 통한 API 호출:
   * 프롬프트
   * 모델
   * 출력 파서

## [OpenAI API 키](https://platform.openai.com/account/api-keys) 받기

- 다음으로 모델, 프롬프트, 파서를 살펴보겠습니다. 시작하기 위해, 약간의 초기 코드를 제공합니다. OpenAI 라이브러리를 가져오고 비밀 키를 로드합니다. 로컬에서 실행 중이고 OpenAI가 설치되지 않은 경우, 설치해야 할 수 있습니다.
  

In [1]:
#!pip install python-dotenv
#!pip install openai

In [1]:
import os
from openai import OpenAI

참고: LLM은 항상 동일한 결과를 생성하지 않습니다. 노트북에서 코드를 실행할 때 비디오의 결과와 약간 다른 답변이 나올 수 있습니다.

In [13]:
# OpenAI 클라이언트 초기화
client = OpenAI(
    api_key=os.environ.get("OPENAI_API_KEY")
)

## 채팅 API: OpenAI

- 여기에서는 ChatGPT API를 호출하는 헬퍼 함수를 사용합니다. 이 함수는 주어진 질문에 대해 ChatGPT 모델(GPT 3.5 Turbo)로부터 응답을 받습니다.
- OpenAI에 직접 API 호출을 시작해 보겠습니다.

In [124]:
# 헬퍼 함수 정의
def get_completion(prompt, model="gpt-3.5-turbo"):
    response = client.chat.completions.create(
        messages=[
            {
                "role": "system",
                "content": "You are a helpful assistant."
            },
            {
                "role": "user",
                "content": prompt
            }
        ],
        model=model,
    )
    return response.choices[0].message.content

# 예제 호출
get_completion("1 더하기 1은?")

'1 더하기 1은 2 입니다.'

- 프롬프트는 모델에 입력할 내용을 생성하는 스타일을 의미합니다.
- LangChain의 추상화를 통해 모델 프롬프트 및 출력 파서를 동기화하는 방법을 설명합니다.
- 예를 들어, 고객이 다른 언어로 이메일을 보내는 상황을 가정합니다. 이 예제에서는 한국어 어린이 말투를 사용하여 번역을 시도합니다.

In [129]:
customer_email = """
오늘 아침, 믹서기 사용 중에 뚜껑이 갑자기 날아가 주방 벽에 스무디가 튀는 일이 발생해 매우 당황스러웠습니다. 
더욱 실망스러운 점은, 보증이 이러한 주방 청소 비용을 보장하지 않는다는 것입니다.
이 문제를 해결하는 데 귀사의 도움을 간절히 부탁드립니다.
"""

In [130]:
style = """어린아이 반말로 \
차분하고 존중하는 어조로
"""

In [131]:
prompt = f"""삼중 백틱으로 구분된 텍스트를 {style} 스타일로 번역하시오. 
텍스트: ```{customer_email}```
"""

print(prompt)

삼중 백틱으로 구분된 텍스트를 어린아이 반말로 차분하고 존중하는 어조로
 스타일로 번역하시오. 
텍스트: ```
오늘 아침, 믹서기 사용 중에 뚜껑이 갑자기 날아가 주방 벽에 스무디가 튀는 일이 발생해 매우 당황스러웠습니다. 
더욱 실망스러운 점은, 보증이 이러한 주방 청소 비용을 보장하지 않는다는 것입니다.
이 문제를 해결하는 데 귀사의 도움을 간절히 부탁드립니다.
```



In [132]:
result = get_completion(prompt)
print(result)

아이야, 오늘 아침에 믹서기를 사용하다가 갑자기 뚜껑이 날아가서 벽에 스무디가 튀는 사고가 있었어. 너무 당황스러웠지. 더 실망스러운 건, 보증이 이런 청소 비용을 보장 안 한다는 거야. 귀사의 도움으로 이 문제를 해결할 수 있을까? 부탁드릴게.


## 채팅 API: LangChain
- LangChain을 사용하여 동일한 작업을 수행하는 방법을 살펴보겠습니다.
- LLM을 사용하여 텍스트를 다른 스타일로 번역하는 방법을 보여줍니다. LangChain의 프롬프트 템플릿을 사용하여 텍스트와 스타일을 지정하고, 이를 통해 반복적으로 템플릿을 재사용할 수 있습니다.

### 모델

In [40]:
from langchain_openai import ChatOpenAI

# To control the randomness and creativity of the generated
# text by an LLM, use temperature = 0.0
chat = ChatOpenAI(temperature=0.0, model='gpt-3.5-turbo')

### 프롬프트 템플릿

<img src='./images/fig_01_01.png' width=600>

In [133]:
template_string = """삼중 백틱으로 구분된 텍스트를 {style} 스타일로 번역하시오.
텍스트: ```{text}```
"""

In [134]:
from langchain.prompts import ChatPromptTemplate

prompt_template = ChatPromptTemplate.from_template(template_string)

In [136]:
prompt_template.messages[0].prompt

PromptTemplate(input_variables=['style', 'text'], template='삼중 백틱으로 구분된 텍스트를 {style} 스타일로 번역하시오.\n텍스트: ```{text}```\n')

In [137]:
prompt_template.messages[0].prompt.input_variables

['style', 'text']

In [138]:
customer_style = """어린아이 반말로 \
차분하고 존중하는 어조로
"""

In [139]:
customer_email = """
오늘 아침, 믹서기 사용 중에 뚜껑이 갑자기 날아가 주방 벽에 스무디가 튀는 일이 발생해 매우 당황스러웠습니다. 
더욱 실망스러운 점은, 보증이 이러한 주방 청소 비용을 보장하지 않는다는 것입니다.
이 문제를 해결하는 데 귀사의 도움을 간절히 부탁드립니다."""


In [140]:
customer_messages = prompt_template.format_messages(
                    style=customer_style,
                    text=customer_email)

In [141]:
print(type(customer_messages))
print(type(customer_messages[0]))

<class 'list'>
<class 'langchain_core.messages.human.HumanMessage'>


In [142]:
print(customer_messages[0])

content='삼중 백틱으로 구분된 텍스트를 어린아이 반말로 차분하고 존중하는 어조로\n 스타일로 번역하시오.\n텍스트: ```\n오늘 아침, 믹서기 사용 중에 뚜껑이 갑자기 날아가 주방 벽에 스무디가 튀는 일이 발생해 매우 당황스러웠습니다. \n더욱 실망스러운 점은, 보증이 이러한 주방 청소 비용을 보장하지 않는다는 것입니다.\n이 문제를 해결하는 데 귀사의 도움을 간절히 부탁드립니다.```\n'


In [143]:
# Call the LLM to translate to the style of the customer message
customer_response = chat(customer_messages)

In [144]:
print(customer_response.content)

오늘 아침에 믹서기를 사용하다가 뚜껑이 갑자기 날아가서 주방 벽에 스무디가 튀어서 정말 당황했어. 더 실망스러운 건 보증이 이런 주방 청소 비용을 보장해주지 않는다는 거야. 이 문제를 해결하는 데 귀사의 도움을 간절히 부탁드려.


In [145]:
service_reply = """야,
네가 믹서기 뚜껑도 제대로 안 덮고 써서 생긴 주방 청소 비용은 보증 안 돼. 불편해도 어쩔 수 없어.
끝.
"""

In [149]:
service_style = """\
정중한 어조로, 고객 센터의 직원이 고객을 친절하게 대하는 말투로
"""

In [150]:
service_messages = prompt_template.format_messages(
    style=service_style,
    text=service_reply)

print(service_messages[0].content)

삼중 백틱으로 구분된 텍스트를 정중한 어조로, 고객 센터의 직원이 고객을 친절하게 대하는 말투로
 스타일로 번역하시오.
텍스트: ```야,
네가 믹서기 뚜껑도 제대로 안 덮고 써서 생긴 주방 청소 비용은 보증 안 돼. 불편해도 어쩔 수 없어.
끝.
```



In [151]:
service_response = chat(service_messages)
print(service_response.content)

고객님,
제품 사용 시 뚜껑을 제대로 덮지 않아 발생한 주방 청소 비용은 보증되지 않습니다. 이로 인한 불편을 드려 죄송합니다. 
감사합니다.


## 출력 파서
- LLM 출력을 원하는 형식으로 정의하는 것부터 시작해 보겠습니다.

<img src='./images/fig_01_02.png' width=600>

In [152]:
{
  "gift": False,
  "delivery_days": 5,
  "price_value": "pretty affordable!"
}

{'gift': False, 'delivery_days': 5, 'price_value': 'pretty affordable!'}

In [153]:
customer_review = """
이 낙엽 블로어는 정말 놀라워요. 네 가지 설정이 있어요:\
촛불 불어내기, 부드러운 바람, 바람의 도시, 토네이도.\
이틀 만에 도착해서 아내의 기념일 선물로 딱 맞았어요.\
아내가 너무 좋아해서 말을 잃은 것 같아요.\
지금까지는 제가 유일하게 사용하고 있는데,\
이틀에 한 번씩 우리 잔디밭의 낙엽을 치우는데 사용하고 있어요.\
다른 낙엽 블로어들보다 약간 더 비싸지만,\
추가 기능 때문에 그만한 가치가 있다고 생각해요.
"""

In [154]:
review_template = """\
다음 텍스트에서 다음 정보를 추출하세요:

gift: 해당 품목이 다른 사람을 위한 선물로 구매되었나요? \
그렇다면 True, 아니면 False 또는 알 수 없음으로 답하세요.

delivery_days: 제품이 도착하는 데 걸린 일수를 추출하세요. \
이 정보가 없으면 -1을 출력하세요.

price_value: 가격 또는 가치에 대한 문장을 추출하고,\
파이썬 리스트로 쉼표로 구분하여 출력하세요.

다음 키를 포함한 JSON 형식으로 출력하세요:
gift
delivery_days
price_value

text: {text}
"""

In [155]:
from langchain.prompts import ChatPromptTemplate

prompt_template = ChatPromptTemplate.from_template(review_template)
print(prompt_template)

input_variables=['text'] messages=[HumanMessagePromptTemplate(prompt=PromptTemplate(input_variables=['text'], template='다음 텍스트에서 다음 정보를 추출하세요:\n\ngift: 해당 품목이 다른 사람을 위한 선물로 구매되었나요? 그렇다면 True, 아니면 False 또는 알 수 없음으로 답하세요.\n\ndelivery_days: 제품이 도착하는 데 걸린 일수를 추출하세요. 이 정보가 없으면 -1을 출력하세요.\n\nprice_value: 가격 또는 가치에 대한 문장을 추출하고,파이썬 리스트로 쉼표로 구분하여 출력하세요.\n\n다음 키를 포함한 JSON 형식으로 출력하세요:\ngift\ndelivery_days\nprice_value\n\ntext: {text}\n'))]


In [156]:
messages = prompt_template.format_messages(text=customer_review)
chat = ChatOpenAI(temperature=0.0)
response = chat(messages)

In [157]:
print(response.content)

{
    "gift": true,
    "delivery_days": 2,
    "price_value": ["약간 더 비싸지만", "추가 기능 때문에 그만한 가치가 있다고 생각해요"]
}


In [159]:
type(response.content)

str

### LLM 출력 문자열을 Python 사전으로 파싱하기

- LangChain의 파서를 사용하여 LLM 출력을 Python 사전으로 파싱하는 방법을 설명합니다. 이를 통해 출력 데이터를 후속 처리에서 쉽게 사용할 수 있습니다.

In [160]:
from langchain.output_parsers import ResponseSchema
from langchain.output_parsers import StructuredOutputParser

In [161]:
gift_schema = ResponseSchema(name="gift",
                             description="해당 품목이 다른 사람을 위한 선물로 구매되었나요? 그렇다면 True, 아니면 False 또는 알 수 없음으로 답하세요.")
delivery_days_schema = ResponseSchema(name="delivery_days",
                                      description="제품이 도착하는 데 걸린 일수를 추출하세요. 이 정보가 없으면 -1을 출력하세요.")
price_value_schema = ResponseSchema(name="price_value",
                                    description="가격 또는 가치에 대한 문장을 추출하고, 파이썬 리스트로 쉼표로 구분하여 출력하세요.")


response_schemas = [gift_schema, 
                    delivery_days_schema,
                    price_value_schema]

In [162]:
output_parser = StructuredOutputParser(response_schemas=response_schemas)
format_instructions = output_parser.get_format_instructions()

In [163]:
print(format_instructions)

The output should be a markdown code snippet formatted in the following schema, including the leading and trailing "```json" and "```":

```json
{
	"gift": string  // 해당 품목이 다른 사람을 위한 선물로 구매되었나요? 그렇다면 True, 아니면 False 또는 알 수 없음으로 답하세요.
	"delivery_days": string  // 제품이 도착하는 데 걸린 일수를 추출하세요. 이 정보가 없으면 -1을 출력하세요.
	"price_value": string  // 가격 또는 가치에 대한 문장을 추출하고, 파이썬 리스트로 쉼표로 구분하여 출력하세요.
}
```


In [164]:
review_template_2 = """\
다음 텍스트에서 다음 정보를 추출하세요:

gift: 해당 품목이 다른 사람을 위한 선물로 구매되었나요? \
그렇다면 True, 아니면 False 또는 알 수 없음으로 답하세요.

delivery_days: 제품이 도착하는 데 걸린 일수를 추출하세요. \
이 정보가 없으면 -1을 출력하세요.

price_value: 가격 또는 가치에 대한 문장을 추출하고, \
파이썬 리스트로 쉼표로 구분하여 출력하세요.

다음과 같은 형식으로 JSON을 출력하세요:
{{
    "gift": true,
    "delivery_days": 2,
    "price_value": ["문장1", "문장2"]
}}

text: {text}

{format_instructions}
"""


prompt = ChatPromptTemplate.from_template(template=review_template_2)


messages = prompt.format_messages(text=customer_review, format_instructions=format_instructions)


In [165]:
print(messages[0].content)

다음 텍스트에서 다음 정보를 추출하세요:

gift: 해당 품목이 다른 사람을 위한 선물로 구매되었나요? 그렇다면 True, 아니면 False 또는 알 수 없음으로 답하세요.

delivery_days: 제품이 도착하는 데 걸린 일수를 추출하세요. 이 정보가 없으면 -1을 출력하세요.

price_value: 가격 또는 가치에 대한 문장을 추출하고, 파이썬 리스트로 쉼표로 구분하여 출력하세요.

다음과 같은 형식으로 JSON을 출력하세요:
{
    "gift": true,
    "delivery_days": 2,
    "price_value": ["문장1", "문장2"]
}

text: 
이 낙엽 블로어는 정말 놀라워요. 네 가지 설정이 있어요:촛불 불어내기, 부드러운 바람, 바람의 도시, 토네이도.이틀 만에 도착해서 아내의 기념일 선물로 딱 맞았어요.아내가 너무 좋아해서 말을 잃은 것 같아요.지금까지는 제가 유일하게 사용하고 있는데,이틀에 한 번씩 우리 잔디밭의 낙엽을 치우는데 사용하고 있어요.다른 낙엽 블로어들보다 약간 더 비싸지만,추가 기능 때문에 그만한 가치가 있다고 생각해요.


The output should be a markdown code snippet formatted in the following schema, including the leading and trailing "```json" and "```":

```json
{
	"gift": string  // 해당 품목이 다른 사람을 위한 선물로 구매되었나요? 그렇다면 True, 아니면 False 또는 알 수 없음으로 답하세요.
	"delivery_days": string  // 제품이 도착하는 데 걸린 일수를 추출하세요. 이 정보가 없으면 -1을 출력하세요.
	"price_value": string  // 가격 또는 가치에 대한 문장을 추출하고, 파이썬 리스트로 쉼표로 구분하여 출력하세요.
}
```



In [166]:
response = chat(messages)

In [167]:
print(response.content)

```json
{
	"gift": true,
	"delivery_days": 2,
	"price_value": ["이 낙엽 블로어는 정말 놀라워요.", "다른 낙엽 블로어들보다 약간 더 비싸지만, 추가 기능 때문에 그만한 가치가 있다고 생각해요."]
}
```


In [168]:
output_dict = output_parser.parse(response.content)

In [169]:
output_dict

{'gift': True,
 'delivery_days': 2,
 'price_value': ['이 낙엽 블로어는 정말 놀라워요.',
  '다른 낙엽 블로어들보다 약간 더 비싸지만, 추가 기능 때문에 그만한 가치가 있다고 생각해요.']}

In [170]:
type(output_dict)

dict

In [173]:
output_dict.get('delivery_days')

2

# 메모리

- 이 모델들과 상호작용할 때, 이전 대화 내용을 기억하지 못하는 것이 자연스럽습니다. 이는 챗봇과 같은 애플리케이션을 구축할 때 문제가 됩니다.
- 그래서 이번 섹션에서는 메모리에 대해 다룰 것입니다. 메모리는 기본적으로 이전 대화 내용을 기억하고 이를 언어 모델에 전달하여 대화의 흐름을 유지하도록 하는 방법입니다.
- LangChain은 이러한 메모리를 관리하는 여러 가지 고급 옵션을 제공합니다. 함께 살펴보겠습니다.

## 설정

In [176]:
import os

from dotenv import load_dotenv, find_dotenv
_ = load_dotenv(find_dotenv()) # read local .env file

import warnings
warnings.filterwarnings('ignore')

## ConversationBufferMemory
- `ConversationBufferMemory`는 LangChain에서 대화의 전체 내용을 메모리에 저장하는 방식입니다. 이 메모리는 대화의 모든 교환(입력 및 출력)을 저장하여, 모델이 대화의 맥락을 완전히 기억할 수 있도록 합니다. 이를 통해 대화의 흐름을 유지하고, 이전 대화 내용을 참조하여 응답을 생성할 수 있습니다.

### 주요 특징

1. **전체 대화 저장**:
   - 대화의 모든 교환을 메모리에 저장합니다.
   - 모델이 대화의 모든 맥락을 기억할 수 있도록 하여, 자연스러운 대화 흐름을 유지할 수 있습니다.

2. **대화 히스토리 유지**:
   - 대화의 모든 내용을 히스토리 형태로 저장하여, 필요할 때 언제든지 이전 대화 내용을 참조할 수 있습니다.
   - 이를 통해 모델이 사용자가 이전에 말한 내용을 기억하고, 일관성 있는 응답을 생성할 수 있습니다.

3. **적용 사례**:
   - 챗봇 및 대화형 애플리케이션에서 대화의 맥락을 완전히 기억해야 하는 경우에 유용합니다.
   - 예를 들어, 고객 지원 챗봇이 고객의 이전 문의 내용을 기억하고, 이에 따라 적절한 응답을 제공할 때 사용합니다.


### 장점

- **완전한 대화 맥락 유지**: 대화의 모든 내용을 저장하여 자연스러운 대화 흐름을 제공합니다.
- **일관성 있는 응답 생성**: 모델이 이전 대화 내용을 기억하고, 일관성 있는 응답을 생성할 수 있습니다.
- **사용자 경험 향상**: 사용자의 이전 대화 내용을 기억하여 더 나은 사용자 경험을 제공합니다.

`ConversationBufferMemory`는 이러한 특징들 덕분에 챗봇 및 대화형 애플리케이션에서 매우 유용하게 사용될 수 있습니다. 이 메모리 유형은 특히 대화의 맥락을 완전히 기억해야 하는 경우에 적합합니다.


In [177]:
from langchain_openai import ChatOpenAI
from langchain.chains import ConversationChain
from langchain.memory import ConversationBufferMemory

llm = ChatOpenAI(temperature=0.0)
memory = ConversationBufferMemory()
conversation = ConversationChain(
    llm=llm, 
    memory = memory,
    verbose=True
)

- 대화를 시작하면, `conversation.predict`를 사용하여 입력을 줍니다.

In [178]:
conversation.predict(input="Hi, my name is Andrew")



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:

Human: Hi, my name is Andrew
AI:[0m

[1m> Finished chain.[0m


"Hello Andrew! It's nice to meet you. How can I assist you today?"

In [179]:
conversation.predict(input="What is 1+1?")



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:
Human: Hi, my name is Andrew
AI: Hello Andrew! It's nice to meet you. How can I assist you today?
Human: What is 1+1?
AI:[0m

[1m> Finished chain.[0m


'1+1 equals 2. Is there anything else you would like to know?'

- 내가 "내 이름이 뭐죠?"라고 말할 때가 세 번째 턴입니다.

In [180]:
conversation.predict(input="What is my name?")



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:
Human: Hi, my name is Andrew
AI: Hello Andrew! It's nice to meet you. How can I assist you today?
Human: What is 1+1?
AI: 1+1 equals 2. Is there anything else you would like to know?
Human: What is my name?
AI:[0m

[1m> Finished chain.[0m


'Your name is Andrew. Is there anything else you would like to know or discuss?'

- 현재 대화를 다음과 같이 저장했습니다. "안녕하세요, 제 이름은 앤드류입니다", "1 더하기 1은 무엇입니까?" 등. 이렇게 대화의 메모리나 히스토리가 점점 길어집니다. 사실, 위에서 메모리 변수를 사용하여 메모리를 저장했습니다.
- `memory.buffer`를 출력하면 지금까지의 대화를 저장한 내용을 볼 수 있습니다.

In [181]:
print(memory.buffer)

Human: Hi, my name is Andrew
AI: Hello Andrew! It's nice to meet you. How can I assist you today?
Human: What is 1+1?
AI: 1+1 equals 2. Is there anything else you would like to know?
Human: What is my name?
AI: Your name is Andrew. Is there anything else you would like to know or discuss?


- 또한, `memory.loadMemoryVariables`를 출력할 수도 있습니다. 여기의 중괄호는 실제로 빈 딕셔너리입니다. 더 고급 입력을 사용할 수 있는 고급 기능이 있지만, 이번 단기 과정에서는 다루지 않겠습니다. 여기 빈 중괄호가 왜 있는지 걱정하지 마세요.
    - memory.load_memory_variables({})에서 빈 중괄호를 사용하는 이유는 이 메서드가 일반적으로 메모리 변수와 관련된 추가적인 입력 데이터를 받을 수 있도록 설계되었기 때문입니다. 빈 중괄호 {}는 아무런 추가 데이터 없이 호출된다는 것을 의미합니다.
    - 즉, 이 메서드는 기본적으로 메모리 내에 저장된 모든 데이터를 로드하지만, 필요에 따라 특정 조건이나 추가 데이터를 기반으로 메모리 변수들을 로드할 수 있는 확장성을 제공합니다. 빈 중괄호 {}는 이러한 확장성을 활용하지 않고, 기본 동작으로 모든 메모리 변수를 로드하는 경우를 나타냅니다.

In [182]:
memory.load_memory_variables({})

{'history': "Human: Hi, my name is Andrew\nAI: Hello Andrew! It's nice to meet you. How can I assist you today?\nHuman: What is 1+1?\nAI: 1+1 equals 2. Is there anything else you would like to know?\nHuman: What is my name?\nAI: Your name is Andrew. Is there anything else you would like to know or discuss?"}

## ConversationBufferWindowMemory

`ConversationBufferWindowMemory`는 LangChain에서 대화의 특정 부분만 기억하도록 설계된 메모리 유형입니다. 이 메모리는 대화 전체를 기억하는 대신, 최근의 일정한 수의 대화 교환만을 기억하도록 설정할 수 있습니다. 이를 통해 메모리 사용량을 줄이고, 모델이 이전 대화의 일부만 기억하도록 할 수 있습니다.

### 주요 특징
1. **메모리 윈도우 크기**:
   - `k`라는 파라미터를 사용하여 기억할 대화 교환의 수를 설정합니다.
   - 예를 들어, `k=1`로 설정하면 마지막 한 번의 대화(사용자 입력과 모델 응답)를 기억합니다.

2. **메모리 사용량 제어**:
   - 대화가 길어질수록 메모리 사용량이 증가할 수 있습니다.
   - `ConversationBufferWindowMemory`는 메모리 사용량을 제어하기 위해 최근 대화의 일부만 기억하므로, 모델이 더 효율적으로 작동하도록 합니다.

3. **적용 사례**:
   - 대화의 최신 상태를 유지해야 하는 챗봇이나 대화형 애플리케이션에서 유용합니다.
   - 예를 들어, 고객 지원 챗봇이 최근 몇 번의 대화만 기억하고, 이전 대화는 무시하도록 할 때 사용합니다.

### 장점
- **효율적인 메모리 사용**: 대화 내용이 길어져도 메모리 사용량을 제한하여 효율성을 유지합니다.
- **최근 대화 유지**: 최근 대화의 맥락을 유지하여 자연스러운 대화 흐름을 제공합니다.

`ConversationBufferWindowMemory`는 이러한 특징들 덕분에 챗봇 및 대화형 애플리케이션에서 효과적으로 사용될 수 있습니다.

In [187]:
from langchain.memory import ConversationBufferWindowMemory

memory = ConversationBufferWindowMemory(k=1)               
memory.save_context({"input": "Hi"},
                    {"output": "What's up"})
memory.save_context({"input": "Not much, just hanging"},
                    {"output": "Cool"})

In [188]:
memory.load_memory_variables({})

{'history': 'Human: Not much, just hanging\nAI: Cool'}

In [189]:
llm = ChatOpenAI(temperature=0.0)
memory = ConversationBufferWindowMemory(k=1)
conversation = ConversationChain(
    llm=llm, 
    memory = memory,
    verbose=False
)

In [190]:
conversation.predict(input="Hi, my name is Andrew")

"Hello Andrew! It's nice to meet you. How can I assist you today?"

In [191]:
conversation.predict(input="What is 1+1?")

'1+1 equals 2. Is there anything else you would like to know?'

In [192]:
conversation.predict(input="What is my name?")

"I'm sorry, I do not have access to personal information such as your name. Is there anything else you would like to know?"

## ConversationTokenBufferMemory

`ConversationTokenBufferMemory`는 LangChain에서 대화의 특정 부분만 기억하도록 설계된 또 다른 메모리 유형입니다. 이 메모리는 대화의 전체 내용 대신, 최근 대화의 일부를 토큰 수를 기준으로 기억합니다. 이를 통해 메모리 사용량을 효율적으로 관리하고, 모델이 중요한 최근 대화를 유지하면서 불필요한 과거 대화를 삭제할 수 있습니다.

### 주요 특징

1. **토큰 기반 메모리**:
   - `max_token_limit` 파라미터를 사용하여 기억할 토큰 수의 최대치를 설정합니다.
   - 예를 들어, `max_token_limit=100`으로 설정하면 마지막 100개의 토큰만 기억합니다.

2. **메모리 사용량 제어**:
   - 대화가 길어질수록 메모리 사용량이 증가할 수 있습니다.
   - `ConversationTokenBufferMemory`는 토큰 수를 기준으로 메모리 사용량을 제한하므로, 모델이 더 효율적으로 작동하도록 합니다.

3. **적용 사례**:
   - 대화의 최신 상태를 유지하면서도 특정 길이 이상의 대화를 기억할 필요가 없는 경우에 유용합니다.
   - 예를 들어, 고객 지원 챗봇이 최근 대화의 맥락만 유지하고, 이전 대화는 무시하도록 할 때 사용합니다.

### 장점

- **효율적인 메모리 사용**: 토큰 수를 기준으로 메모리 사용량을 제한하여 효율성을 유지합니다.
- **최근 대화 유지**: 최근 대화의 맥락을 유지하여 자연스러운 대화 흐름을 제공합니다.
- **비용 절감**: 토큰 기반의 메모리 관리는 LLM API 호출 비용을 줄이는 데 도움이 됩니다.

`ConversationTokenBufferMemory`는 이러한 특징들 덕분에 챗봇 및 대화형 애플리케이션에서 효과적으로 사용될 수 있습니다. 이 메모리 유형은 특히 대화가 길어질 때 메모리 사용량을 제한하고, 비용을 절감하는 데 유용합니다.

In [193]:
from langchain.memory import ConversationTokenBufferMemory
from langchain.llms import OpenAI
llm = ChatOpenAI(temperature=0.0)

In [194]:
memory = ConversationTokenBufferMemory(llm=llm, max_token_limit=50)
memory.save_context({"input": "AI is what?!"},
                    {"output": "Amazing!"})
memory.save_context({"input": "Backpropagation is what?"},
                    {"output": "Beautiful!"})
memory.save_context({"input": "Chatbots are what?"}, 
                    {"output": "Charming!"})

In [195]:
memory.load_memory_variables({})

{'history': 'Human: AI is what?!\nAI: Amazing!\nHuman: Backpropagation is what?\nAI: Beautiful!\nHuman: Chatbots are what?\nAI: Charming!'}

## ConversationSummaryMemory

`ConversationSummaryMemory`는 LangChain에서 제공하는 메모리 유형 중 하나로, 대화 내용을 요약하여 저장하는 방식입니다. 이 메모리는 전체 대화 내용을 저장하지 않고, 대화의 요약본을 생성하여 저장함으로써 메모리 사용량을 줄이고, 모델이 중요한 대화 내용을 유지하도록 합니다. 요약된 대화 내용은 필요한 경우 다시 모델에 제공되어 대화의 맥락을 유지할 수 있습니다.

### 주요 특징

1. **요약 기반 메모리**:
   - 대화 내용을 요약하여 저장합니다.
   - 요약본은 대화의 핵심 내용을 포함하여 모델이 중요한 정보를 유지할 수 있도록 합니다.

2. **메모리 사용량 제어**:
   - 전체 대화 내용을 저장하는 대신 요약본을 저장하여 메모리 사용량을 줄입니다.
   - 대화가 길어질수록 메모리 사용량이 증가하지 않도록 효과적으로 관리합니다.

3. **적용 사례**:
   - 대화의 핵심 내용을 유지하면서 메모리 사용량을 줄여야 하는 경우에 유용합니다.
   - 예를 들어, 고객 지원 챗봇이 긴 대화를 요약하여 중요한 정보만 기억하도록 할 때 사용합니다.

### 장점

- **효율적인 메모리 사용**: 요약본을 저장하여 메모리 사용량을 줄입니다.
- **대화 맥락 유지**: 중요한 대화 내용을 요약하여 유지함으로써 자연스러운 대화 흐름을 제공합니다.
- **비용 절감**: 요약된 대화 내용을 사용하여 LLM API 호출 비용을 줄일 수 있습니다.

`ConversationSummaryMemory`는 이러한 특징들 덕분에 긴 대화를 요약하여 중요한 정보만 유지하고, 메모리 사용량을 줄이며, 효율적인 대화 관리가 가능합니다. 이 메모리 유형은 특히 대화가 길어질 때 메모리 사용량을 제한하고, 비용을 절감하는 데 유용합니다.

In [196]:
from langchain.memory import ConversationSummaryBufferMemory

In [197]:
# 긴 문자열 생성
schedule = "오전 8시에 제품 팀과의 회의가 있습니다. \
파워포인트 프레젠테이션을 준비해야 합니다. \
오전 9시부터 12시까지는 LangChain 프로젝트 작업 시간이 있습니다. \
LangChain이 매우 강력한 도구이기 때문에 작업이 빠르게 진행될 것입니다. \
정오에는 이탈리아 레스토랑에서 고객과 점심 식사가 있습니다. \
이 고객은 최신 AI 기술을 이해하기 위해 한 시간 이상 운전해 올 예정입니다. \
최신 LLM 데모를 보여줄 수 있도록 노트북을 꼭 가져가세요."

memory = ConversationSummaryBufferMemory(llm=llm, max_token_limit=100)
memory.save_context({"input": "안녕하세요"}, {"output": "어떻게 지내세요?"})
memory.save_context({"input": "별일 없어요, 그냥 쉬고 있어요"},
                    {"output": "좋아요"})
memory.save_context({"input": "오늘 일정은 어떻게 되나요?"}, 
                    {"output": f"{schedule}"})

In [198]:
memory.load_memory_variables({})

{'history': 'System: The human greets the AI in Korean and asks about the schedule. The AI responds with a detailed schedule including a meeting with the product team, LangChain project work, and a lunch meeting with a customer interested in AI technology. The AI emphasizes the importance of bringing a laptop to showcase the latest LLM demo during the lunch meeting.'}

In [199]:
conversation = ConversationChain(
    llm=llm, 
    memory = memory,
    verbose=True
)

In [200]:
conversation.predict(input="어떤 데모를 보여주면 좋을까요?")



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:
System: The human greets the AI in Korean and asks about the schedule. The AI responds with a detailed schedule including a meeting with the product team, LangChain project work, and a lunch meeting with a customer interested in AI technology. The AI emphasizes the importance of bringing a laptop to showcase the latest LLM demo during the lunch meeting.
Human: 어떤 데모를 보여주면 좋을까요?
AI:[0m

[1m> Finished chain.[0m


' 최신 LLM 데모를 보여주는 것이 좋을 것 같아요. 이번 데모는 언어 모델링 및 번역 기술을 중점으로 한 것이에요. 이전 데모와 비교해서 더욱 정교하고 빠른 성능을 보여줄 거에요. 이번 데모를 통해 우리의 기술력을 고객에게 자랑할 수 있을 거예요.'

In [201]:
memory.load_memory_variables({})

{'history': 'System: The human greets the AI in Korean and asks about the schedule. The AI responds with a detailed schedule including a meeting with the product team, LangChain project work, and a lunch meeting with a customer interested in AI technology. The AI emphasizes the importance of bringing a laptop to showcase the latest LLM demo during the lunch meeting. The human asks what demo would be best to showcase, and the AI suggests showcasing the latest LLM demo focusing on language modeling and translation technology. The AI mentions that this demo is more advanced and faster compared to previous ones, and it will be a great opportunity to showcase their technological capabilities to the customer.'}

# Chain

#### 소개
이번 강의에서는 Harrison이 LangChain의 가장 중요한 구성 요소인 체인에 대해 가르쳐 드립니다. 체인은 보통 대형 언어 모델(LLM)과 프롬프트를 결합하여 사용합니다. 이러한 구성 요소를 여러 개 결합하여 텍스트나 다른 데이터에 대한 일련의 작업을 수행할 수 있습니다.

#### 기본 설정
환경 변수를 로드하고 사용할 데이터를 로드합니다. 이번 강의에서는 pandas DataFrame을 로드할 것입니다. pandas DataFrame은 다양한 데이터 요소를 포함하는 데이터 구조입니다. 여기서는 데이터를 로드하여 나중에 체인을 통해 사용할 것입니다. 데이터에는 제품 열과 리뷰 열이 있습니다.

In [208]:
from langchain.llms import OpenAI
from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate

LLMChain
- LLMChain은 가장 기본적인 체인으로, 대형 언어 모델과 프롬프트를 결합하여 사용합니다.
- 먼저, OpenAI 모델(LLM), 채팅 프롬프트 템플릿, LLM 체인을 임포트합니다.
- 그런 다음, 사용할 언어 모델을 초기화하고, 높은 온도로 설정하여 재미있는 설명을 생성합니다.
- 프롬프트는 제품이라는 변수를 입력으로 받아, 해당 제품을 만드는 회사의 최상의 이름을 생성하도록 LLM에 요청합니다.
- 마지막으로, 이 두 가지를 결합하여 체인을 만듭니다.

In [209]:
llm = OpenAI(temperature=0.7)
prompt = PromptTemplate(
    input_variables=["product"],
    template="What is a good name for a company that makes {product}?"
)

In [210]:
chain = LLMChain(llm=llm, prompt=prompt)

In [212]:
product = "Queen Size Sheet Set"
print(chain.run(product))



"Royal Rest Linens" or "Queen's Comfort Co."


## SimpleSequentialChain
- SimpleSequentialChain은 여러 체인을 순차적으로 실행합니다.
- 단순한 순차 체인을 사용하면 한 번에 하나의 입력과 출력을 기대하는 하위 체인을 잘 처리할 수 있습니다.
- 예를 들어, 첫 번째 체인은 제품을 입력으로 받아 회사 이름을 생성하고, 두 번째 체인은 회사 이름을 입력으로 받아 20단어로 회사 설명을 생성합니다.

<img src="./images/fig_03_01.png" width=600>

In [213]:
from langchain.chains import SimpleSequentialChain

first_chain = LLMChain(llm=llm, prompt=prompt)
second_prompt = PromptTemplate(
    input_variables=["company_name"],
    template="Write a catchphrase for the company named {company_name}"
)
second_chain = LLMChain(llm=llm, prompt=second_prompt)

overall_chain = SimpleSequentialChain(chains=[first_chain, second_chain])
print(overall_chain.run("queen-size-sheet-set"))



"Sleep like royalty with Royal Rest Bedding Co." 



## SequentialChain
- SequentialChain은 여러 입력과 출력을 처리할 수 있습니다. 예
- 를 들어, 리뷰를 영어로 번역하고, 한 문장으로 요약한 후, 원래 언어를 감지하고, 요약과 언어 정보를 기반으로 후속 응답을 생성합니다.

In [219]:
from langchain.chains import SequentialChain
from langchain_openai import ChatOpenAI
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain

llm = ChatOpenAI(temperature=0.9)

# 체인들 생성
translation_chain = LLMChain(
    llm=llm,
    prompt=PromptTemplate(
        input_variables=["review"],
        template="다음 리뷰를 한국어로 번역하세요: {review}"
    ),
    output_key="korean_review"  # 출력 키 설정
)

summary_chain = LLMChain(
    llm=llm,
    prompt=PromptTemplate(
        input_variables=["korean_review"],
        template="다음 리뷰를 한 문장으로 요약하세요: {korean_review}"
    ),
    output_key="summary"  # 출력 키 설정
)

language_detection_chain = LLMChain(
    llm=llm,
    prompt=PromptTemplate(
        input_variables=["review"],
        template="다음 리뷰의 언어를 감지하세요: {review}"
    ),
    output_key="language"  # 출력 키 설정
)

follow_up_chain = LLMChain(
    llm=llm,
    prompt=PromptTemplate(
        input_variables=["summary", "language"],
        template="요약에 대해 {language}로 후속 응답을 작성하세요: {summary}"
    ),
    output_key="follow_up"  # 출력 키 설정
)

translation_chain2 = LLMChain(
    llm=llm,
    prompt=PromptTemplate(
        input_variables=["follow_up"],
        template="다음 리뷰를 한국어로 번역하세요: {follow_up}"
    ),
    output_key="korean_follow_up"  # 출력 키 설정
)


# 순차 체인 생성
overall_chain = SequentialChain(
    chains=[
        translation_chain,
        summary_chain,
        language_detection_chain,
        follow_up_chain,
        translation_chain2
    ],
    input_variables=["review"],
    output_variables=["korean_review", "summary", "follow_up", "korean_follow_up"]
)

# 실행
review = "Cette feuille de taille reine est magnifique."
print(overall_chain({"review": review}))

{'review': 'Cette feuille de taille reine est magnifique.', 'korean_review': '이 퀸 사이즈 시트는 아름답습니다.', 'summary': '이 퀸 사이즈 시트는 매우 아름답습니다.', 'follow_up': 'Merci pour votre commentaire positif sur notre drap queen size, nous sommes ravis que vous le trouviez si beau.', 'korean_follow_up': '우리의 퀸사이즈 시트에 대해 긍정적인 리뷰를 남겨 주셔서 감사합니다. 당신이 그것을 아름다운 것으로 생각해 주셔서 우리도 기쁩니다.'}


## Router Chain
- 라우팅 체인은 입력을 특정 체인으로 라우팅하는 데 사용됩니다.
- 예를 들어, 여러 하위 체인이 각각 특정 유형의 입력에 특화되어 있다면, 라우터 체인은 먼저 어떤 하위 체인으로 라우팅할지 결정한 다음 해당 체인으로 입력을 전달합니다.

In [221]:
physics_template = """당신은 매우 똑똑한 물리학 교수입니다. \
당신은 물리에 대한 질문에 간결하고 이해하기 쉬운 방식으로 답변하는 데 능숙합니다. \
질문의 답을 모를 때는 모른다고 인정합니다.

여기 질문이 있습니다:
{input}"""

math_template = """당신은 매우 훌륭한 수학자입니다. \
당신은 수학 질문에 답하는 데 능숙합니다. \
당신은 어려운 문제를 구성 요소로 나누고, \
구성 요소를 해결한 다음 이를 결합하여 \
더 넓은 질문에 답할 수 있기 때문에 매우 뛰어납니다.

여기 질문이 있습니다:
{input}"""

history_template = """당신은 매우 훌륭한 역사학자입니다. \
당신은 다양한 역사적 시기의 사람들, 사건들 및 맥락에 대한 탁월한 지식과 이해력을 가지고 있습니다. \
당신은 과거를 생각하고, 반성하고, 토론하고, 논의하고, 평가할 수 있는 능력을 가지고 있습니다. \
당신은 역사적 증거를 존중하고, 이를 사용하여 설명과 판단을 지원할 수 있는 능력을 가지고 있습니다.

여기 질문이 있습니다:
{input}"""

computerscience_template = """당신은 성공적인 컴퓨터 과학자입니다.\
당신은 창의성, 협업, 미래 지향적 사고, 자신감, 강력한 문제 해결 능력,\
이론과 알고리즘에 대한 이해, 그리고 뛰어난 의사 소통 능력을 가지고 있습니다.\
당신은 코딩 질문에 답하는 데 매우 능숙합니다.\
당신은 문제를 기계가 쉽게 해석할 수 있는 명령형 단계로 설명하고,\
시간 복잡도와 공간 복잡도 사이의 균형을 잘 맞춘 솔루션을 선택하는 방법을 알기 때문에 매우 뛰어납니다.

여기 질문이 있습니다:
{input}"""

In [222]:
prompt_infos = [
    {
        "name": "physics", 
        "description": "물리학 질문에 답하는 데 좋습니다", 
        "prompt_template": physics_template
    },
    {
        "name": "math", 
        "description": "수학 질문에 답하는 데 좋습니다", 
        "prompt_template": math_template
    },
    {
        "name": "History", 
        "description": "역사 질문에 답하는 데 좋습니다", 
        "prompt_template": history_template
    },
    {
        "name": "computer science", 
        "description": "컴퓨터 과학 질문에 답하는 데 좋습니다", 
        "prompt_template": computerscience_template
    }
]


In [223]:
from langchain.chains.router import MultiPromptChain
from langchain.chains.router.llm_router import LLMRouterChain,RouterOutputParser
from langchain.prompts import PromptTemplate

In [224]:
llm = ChatOpenAI(temperature=0)

In [225]:
destination_chains = {}
for p_info in prompt_infos:
    name = p_info["name"]
    prompt_template = p_info["prompt_template"]
    prompt = ChatPromptTemplate.from_template(template=prompt_template)
    chain = LLMChain(llm=llm, prompt=prompt)
    destination_chains[name] = chain  
    
destinations = [f"{p['name']}: {p['description']}" for p in prompt_infos]
destinations_str = "\n".join(destinations)

In [226]:
destination_chains

{'physics': LLMChain(prompt=ChatPromptTemplate(input_variables=['input'], messages=[HumanMessagePromptTemplate(prompt=PromptTemplate(input_variables=['input'], template='당신은 매우 똑똑한 물리학 교수입니다. 당신은 물리에 대한 질문에 간결하고 이해하기 쉬운 방식으로 답변하는 데 능숙합니다. 질문의 답을 모를 때는 모른다고 인정합니다.\n\n여기 질문이 있습니다:\n{input}'))]), llm=ChatOpenAI(client=<openai.resources.chat.completions.Completions object at 0x7cb3c9d8e140>, async_client=<openai.resources.chat.completions.AsyncCompletions object at 0x7cb3c9e20f10>, temperature=0.0, openai_api_key=SecretStr('**********'), openai_proxy='')),
 'math': LLMChain(prompt=ChatPromptTemplate(input_variables=['input'], messages=[HumanMessagePromptTemplate(prompt=PromptTemplate(input_variables=['input'], template='당신은 매우 훌륭한 수학자입니다. 당신은 수학 질문에 답하는 데 능숙합니다. 당신은 어려운 문제를 구성 요소로 나누고, 구성 요소를 해결한 다음 이를 결합하여 더 넓은 질문에 답할 수 있기 때문에 매우 뛰어납니다.\n\n여기 질문이 있습니다:\n{input}'))]), llm=ChatOpenAI(client=<openai.resources.chat.completions.Completions object at 0x7cb3c9d8e140>, async_client=<openai.resour

In [227]:
destinations_str

'physics: 물리학 질문에 답하는 데 좋습니다\nmath: 수학 질문에 답하는 데 좋습니다\nHistory: 역사 질문에 답하는 데 좋습니다\ncomputer science: 컴퓨터 과학 질문에 답하는 데 좋습니다'

In [228]:
default_prompt = ChatPromptTemplate.from_template("{input}")
default_chain = LLMChain(llm=llm, prompt=default_prompt)

In [230]:
MULTI_PROMPT_ROUTER_TEMPLATE = """주어진 원시 텍스트 입력에 대해 \
언어 모델에 가장 적합한 모델 프롬프트를 선택하세요. \
사용 가능한 프롬프트의 이름과 프롬프트가 가장 적합한 설명이 제공됩니다. \
입력을 수정하여 언어 모델에서 더 나은 응답을 이끌어낼 수 있다고 생각되면 원래 입력을 수정할 수도 있습니다.

<< 포맷팅 >>
JSON 객체를 포함한 마크다운 코드 스니펫을 반환합니다:
```json
{{{{
    "destination": string \ 사용할 프롬프트의 이름 또는 "DEFAULT"
    "next_inputs": string \ 원래 입력의 잠재적으로 수정된 버전
}}}}
```

기억하세요: "destination"은 아래에 지정된 후보 프롬프트 이름 중 하나여야 하며, 입력이 어떤 후보 프롬프트에도 적합하지 않은 경우 "DEFAULT"일 수 있습니다.
기억하세요: 수정이 필요 없다고 생각되면 "next_inputs"는 원래 입력일 수 있습니다.

<< 후보 프롬프트 >>
{destinations}

<< 입력 >>
{{input}}

<< 출력 (```json을 포함해야 함을 기억하세요) >>"""

In [231]:
router_template = MULTI_PROMPT_ROUTER_TEMPLATE.format(
    destinations=destinations_str
)
router_prompt = PromptTemplate(
    template=router_template,
    input_variables=["input"],
    output_parser=RouterOutputParser(),
)

router_chain = LLMRouterChain.from_llm(llm, router_prompt)

In [232]:
chain = MultiPromptChain(router_chain=router_chain, 
                         destination_chains=destination_chains, 
                         default_chain=default_chain, verbose=True
                        )

In [236]:
chain.run("성리층의 역할은?")



[1m> Entering new MultiPromptChain chain...[0m
History: {'input': 'What was the role of the aristocracy in ancient civilizations?'}
[1m> Finished chain.[0m


'The role of the aristocracy in ancient civilizations varied depending on the specific society, but in general, the aristocracy played a significant role in governing, maintaining social order, and preserving cultural traditions. \n\nIn many ancient civilizations, such as Ancient Egypt, Mesopotamia, Greece, and Rome, the aristocracy consisted of a small, privileged class of individuals who held political power, land ownership, and wealth. They often served as advisors to the rulers, held positions of authority in government and military, and were responsible for overseeing the administration of justice and the collection of taxes.\n\nThe aristocracy also played a key role in religious ceremonies and rituals, as they were often seen as intermediaries between the gods and the common people. They were responsible for maintaining temples, performing sacrifices, and ensuring the spiritual well-being of the community.\n\nAdditionally, the aristocracy in ancient civilizations often controlled

In [234]:
chain.run("2 더하기 2는?")



[1m> Entering new MultiPromptChain chain...[0m
math: {'input': 'What is the result of 2 + 2?'}
[1m> Finished chain.[0m


'2 + 2의 결과는 4입니다.'

In [238]:
chain.run("조선은 왜 멸망 하였는가?")



[1m> Entering new MultiPromptChain chain...[0m
History: {'input': 'Why did the Joseon Dynasty collapse?'}
[1m> Finished chain.[0m


"The Joseon Dynasty collapsed for a variety of reasons, including internal strife, external invasions, and social and economic challenges. \n\nOne major factor was the weakening of the central government and the rise of factionalism within the ruling class. This led to power struggles and instability within the royal court, making it difficult for the government to effectively govern the country.\n\nAdditionally, the Joseon Dynasty faced numerous invasions from neighboring countries, such as the Japanese invasions in the late 16th century and the Manchu invasions in the 17th century. These invasions weakened the dynasty's military and economy, further contributing to its downfall.\n\nFurthermore, the Joseon Dynasty struggled with social and economic issues, such as corruption, famine, and peasant uprisings. These challenges undermined the stability of the dynasty and eroded public trust in the government.\n\nOverall, a combination of internal conflicts, external threats, and social and

# Q&A

## 시스템 개요

- 사람들이 LLM을 사용하여 구축하는 가장 일반적이고 복잡한 응용 프로그램 중 하나는 문서 위에서 또는 문서에 대해 질문에 답할 수 있는 시스템입니다.
- 예를 들어 PDF 파일이나 웹페이지 또는 회사의 내부 문서 컬렉션에서 추출한 텍스트를 제공받으면, LLM을 사용하여 해당 문서의 내용에 대한 질문에 답변할 수 있을까요?
- 이는 사용자가 더 깊이 이해하고 필요한 정보에 접근하는 데 도움을 줄 수 있습니다.
- 이는 매우 강력한 기능입니다. 왜냐하면 언어 모델을 원래 훈련되지 않은 데이터와 결합함으로써 훨씬 더 유연하고 사용 사례에 맞게 조정될 수 있기 때문입니다.
- 또한 언어 모델, 프롬프트, 출력 파서 이상으로 나아가 LangChain의 중요한 구성 요소 중 일부인 임베딩 모델과 벡터 스토어를 도입하기 시작할 것입니다.

<img src='./images/fig_04_01.png' width=600>

## 임베딩과 벡터 스토어

### 임베딩
- 임베딩은 텍스트 조각에 대한 수치 표현을 생성합니다.
- 이 수치 표현은 해당 텍스트 조각의 의미론적 의미를 캡처합니다.
- 유사한 내용의 텍스트 조각은 유사한 벡터를 가집니다.
- 이는 벡터 공간에서 텍스트 조각을 비교할 수 있게 해줍니다.
- 예를 들어, 애완동물에 관한 두 문장은 유사한 벡터를 가지지만, 자동차에 관한 문장은 다릅니다.

<img src='./images/fig_04_02.png' width=600>


### 벡터 데이터베이스
- 벡터 데이터베이스는 이러한 벡터 표현을 저장하는 방법입니다.
- 큰 문서를 작은 조각으로 나눈 후, 각 조각에 대한 임베딩을 생성하고 이를 벡터 데이터베이스에 저장합니다.
- 이는 질문에 답하기 위해 관련 텍스트 조각을 선택하는 데 사용됩니다.

<img src='./images/fig_04_03.png' width=600>



In [20]:
# !pip install langchain[docarray]
# !pip install --upgrade docarray
# !pip install "pydantic<2"
# !pip install faiss-gpu

In [33]:
### 환경 설정 및 라이브러리 로드
import os
from dotenv import load_dotenv, find_dotenv
_ = load_dotenv(find_dotenv()) # read local .env file
from langchain.chains import RetrievalQA
from langchain.chat_models import ChatOpenAI
from langchain.document_loaders import CSVLoader
from langchain.vectorstores import DocArrayInMemorySearch
from IPython.display import display, Markdown
from langchain.llms import OpenAI
from langchain.indexes import VectorstoreIndexCreator
from langchain.embeddings import OpenAIEmbeddings
from langchain.vectorstores import FAISS

In [68]:
### CSV 로더 설정
file = 'OutdoorClothingCatalog_1000.csv'
loader = CSVLoader(file_path=file)

In [69]:
import pandas as pd

df = pd.read_csv(file)
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 999 entries, 0 to 998
Data columns (total 2 columns):
 #   Column       Non-Null Count  Dtype 
---  ------       --------------  ----- 
 0   name         999 non-null    object
 1   description  999 non-null    object
dtypes: object(2)
memory usage: 15.7+ KB


In [70]:
df.head()

Unnamed: 0,name,description
0,Women's Campside Oxfords,This ultracomfortable lace-to-toe Oxford boast...
1,"Recycled Waterhog Dog Mat, Chevron Weave",Protect your floors from spills and splashing ...
2,Infant and Toddler Girls' Coastal Chill Swimsu...,"She'll love the bright colors, ruffles and exc..."
3,"Refresh Swimwear, V-Neck Tankini Contrasts",Whether you're going for a swim or heading out...
4,EcoFlex 3L Storm Pants,Our new TEK O2 technology makes our four-seaso...


### 벡터 스토어 인덱스 생성

In [71]:
# 임베딩 객체 생성
embeddings = OpenAIEmbeddings()

In [72]:
# 벡터 스토어 인덱스 생성
index = VectorstoreIndexCreator(
    vectorstore_cls=FAISS,
    embedding=embeddings
).from_loaders([loader])

In [73]:
query ="Please list all your shirts with sun protection in a table in markdown and summarize each one."
llm_replacement_model = OpenAI(temperature=0, model='gpt-3.5-turbo-instruct')
response = index.query(query, llm=llm_replacement_model)
display(Markdown(response))



| Name | Description | Summary |
| --- | --- | --- |
| Men's Tropical Plaid Short-Sleeve Shirt | Rated UPF 50+ for superior sun protection. Made of 100% polyester, wrinkle-resistant. Front and back cape venting, two front bellows pockets. Imported. | Lightweight and breathable shirt with high sun protection. |
| Men's Plaid Tropic Shirt, Short-Sleeve | Rated UPF 50+ for extended travel. SunSmart technology blocks 98% of UV rays. Made of 52% polyester and 48% nylon, machine washable and dryable. Front and back cape venting, two front bellows pockets. Imported. | Lightweight and quick-drying shirt with high sun protection. |
| Sun Shield Shirt | Rated UPF 50+ for superior sun protection. Made of 78% nylon and 22% Lycra Xtra Life fiber. Handwash, line dry. Moisture-wicking and abrasion resistant. Imported. | High-performance shirt with SPF 50+ sun protection and recommended by The Skin Cancer Foundation. |
| Men's TropicVibe Shirt, Short-Sleeve | Built-in UPF 50+ for lightweight and breathable sun protection.

### 임베딩 생성 및 벡터 데이터베이스 설정

In [74]:
docs = loader.load()

In [75]:
docs[0]

Document(page_content="name: Women's Campside Oxfords\ndescription: This ultracomfortable lace-to-toe Oxford boasts a super-soft canvas, thick cushioning, and quality construction for a broken-in feel from the first time you put them on. \r\n\r\nSize & Fit: Order regular shoe size. For half sizes not offered, order up to next whole size. \r\n\r\nSpecs: Approx. weight: 1 lb.1 oz. per pair. \r\n\r\nConstruction: Soft canvas material for a broken-in feel and look. Comfortable EVA innersole with Cleansport NXT® antimicrobial odor control. Vintage hunt, fish and camping motif on innersole. Moderate arch contour of innersole. EVA foam midsole for cushioning and support. Chain-tread-inspired molded rubber outsole with modified chain-tread pattern. Imported. \r\n\r\nQuestions? Please contact us for any inquiries.", metadata={'source': 'OutdoorClothingCatalog_1000.csv', 'row': 0})

In [76]:
from langchain.embeddings import OpenAIEmbeddings
embeddings = OpenAIEmbeddings()

In [77]:
embed = embeddings.embed_query("Hi my name is Harrison")
print(len(embed))

1536


In [78]:
print(embed[:5])

[-0.021935116222567923, 0.006751196839312801, -0.01825834973933523, -0.03915192509902945, -0.013979244800643545]


In [79]:
db = DocArrayInMemorySearch.from_documents(docs, embeddings)

### 유사성 검색

In [80]:
query = "Please suggest a shirt with sunblocking"
docs = db.similarity_search(query)
len(docs)

4

In [81]:
docs[0]

Document(page_content='name: Sun Shield Shirt by\ndescription: "Block the sun, not the fun ??our high-performance sun shirt is guaranteed to protect from harmful UV rays. \r\n\r\nSize & Fit: Slightly Fitted: Softly shapes the body. Falls at hip.\r\n\r\nFabric & Care: 78% nylon, 22% Lycra Xtra Life fiber. UPF 50+ rated ??the highest rated sun protection possible. Handwash, line dry.\r\n\r\nAdditional Features: Wicks moisture for quick-drying comfort. Fits comfortably over your favorite swimsuit. Abrasion resistant for season after season of wear. Imported.\r\n\r\nSun Protection That Won\'t Wear Off\r\nOur high-performance fabric provides SPF 50+ sun protection, blocking 98% of the sun\'s harmful rays. This fabric is recommended by The Skin Cancer Foundation as an effective UV protectant.', metadata={'source': 'OutdoorClothingCatalog_1000.csv', 'row': 255})

### 질문 응답 체인 설정

In [82]:
from langchain_openai import ChatOpenAI

retriever = db.as_retriever()
llm = ChatOpenAI(temperature = 0.0)

In [83]:
qdocs = "".join([docs[i].page_content for i in range(len(docs))])
qdocs

'name: Sun Shield Shirt by\ndescription: "Block the sun, not the fun ??our high-performance sun shirt is guaranteed to protect from harmful UV rays. \r\n\r\nSize & Fit: Slightly Fitted: Softly shapes the body. Falls at hip.\r\n\r\nFabric & Care: 78% nylon, 22% Lycra Xtra Life fiber. UPF 50+ rated ??the highest rated sun protection possible. Handwash, line dry.\r\n\r\nAdditional Features: Wicks moisture for quick-drying comfort. Fits comfortably over your favorite swimsuit. Abrasion resistant for season after season of wear. Imported.\r\n\r\nSun Protection That Won\'t Wear Off\r\nOur high-performance fabric provides SPF 50+ sun protection, blocking 98% of the sun\'s harmful rays. This fabric is recommended by The Skin Cancer Foundation as an effective UV protectant.name: Men\'s Plaid Tropic Shirt, Short-Sleeve\ndescription: Our Ultracomfortable sun protection is rated to UPF 50+, helping you stay cool and dry. Originally designed for fishing, this lightest hot-weather shirt offers UPF 5

In [84]:
response = llm.invoke(f"{qdocs} Question: Please list all your shirts with sun protection in a table in markdown and summarize each one.|") 

In [85]:
response

AIMessage(content='| Name                        | Description                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                          

In [86]:
response.content

'| Name                        | Description                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            

In [59]:
response.response_metadata

{'token_usage': {'completion_tokens': 105,
  'prompt_tokens': 683,
  'total_tokens': 788},
 'model_name': 'gpt-3.5-turbo',
 'system_fingerprint': None,
 'finish_reason': 'stop',
 'logprobs': None}

In [53]:
display(Markdown(response.content))

| Name                           | Description                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                

<img src='./images/fig_04_04.png' width=600>

### Stuff 방법
- Stuffing은 가장 단순한 데이터 처리 방법입니다.
- 모든 데이터를 프롬프트에 문맥으로 넣어 언어 모델에 전달합니다.
#### 장점
- 한 번의 호출로 LLM(대형 언어 모델)에 접근할 수 있습니다.
- LLM이 한 번에 모든 데이터를 이용할 수 있습니다.
#### 단점
- LLM은 문맥 길이에 제한이 있으며, 문서가 크거나 많은 경우 이 방법은 작동하지 않습니다. 문맥 길이를 초과하는 프롬프트가 될 수 있습니다.

In [87]:
qa_stuff = RetrievalQA.from_chain_type(
    llm=llm, 
    chain_type="stuff", 
    retriever=retriever, 
    verbose=True
)

In [88]:
query =  "Please list all your shirts with sun protection in a table \
in markdown and summarize each one."

In [93]:
response = qa_stuff.invoke(query)



[1m> Entering new RetrievalQA chain...[0m

[1m> Finished chain.[0m


In [95]:
response

{'query': 'Please list all your shirts with sun protection in a table in markdown and summarize each one.',
 'result': '| Shirt Name                           | Description                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                            

In [94]:
display(Markdown(response))

TypeError: Markdown expects text, not {'query': 'Please list all your shirts with sun protection in a table in markdown and summarize each one.', 'result': '| Shirt Name                           | Description                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                '}

In [96]:
index = VectorstoreIndexCreator(
    vectorstore_cls=DocArrayInMemorySearch,
    embedding=embeddings,
).from_loaders([loader])

In [97]:
response = index.query(query, llm=llm)

In [98]:
response

'| Shirt Name                           | Description                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                   

### Additional Methods

<img src='./images/fig_04_05.png' width=600>


#### 1. Map_reduce
- 이 방법은 데이터를 청크로 나눈 후, 각 청크를 LLM(대형 언어 모델)에 보내 처리합니다. 처리된 결과를 모아 최종 답변을 생성합니다.
- 장점
    - 대량의 데이터를 효과적으로 처리할 수 있습니다.
    - 병렬 처리를 통해 속도를 높일 수 있습니다.
- 단점
    - 모든 청크의 결과를 모아야 하므로 복잡성이 증가합니다.
    - 개별 청크가 잘못 처리되면 최종 결과에 영향을 미칠 수 있습니다.

#### 2. Refine
- 이 방법은 데이터를 청크로 나누고, 각 청크를 LLM에 보내 처리한 후, 이전 청크의 결과를 바탕으로 다음 청크를 처리하는 방식입니다. 이렇게 각 단계에서 결과를 점진적으로 개선하여 최종 답변을 생성합니다.
- 장점
    - 각 단계에서 이전 결과를 반영하여 점진적으로 개선된 답변을 생성할 수 있습니다.
    - 문맥을 유지하며 처리할 수 있습니다.
- 단점
    - 각 단계에서 이전 결과를 바탕으로 하기 때문에 시간이 많이 소요될 수 있습니다.
    - 오류가 누적될 가능성이 있습니다.
#### 3. Map_rerank
- 이 방법은 데이터를 청크로 나누고, 각 청크를 LLM에 보내 처리한 후, 각각의 결과에 점수를 매깁니다. 가장 높은 점수를 받은 결과를 선택하여 최종 답변으로 사용합니다.
- 장점
    - 다양한 결과 중에서 가장 신뢰할 수 있는 답변을 선택할 수 있습니다.
    - 결과의 품질을 향상시킬 수 있습니다.
- 단점
    - 모든 결과를 평가하고 점수를 매겨야 하므로 추가적인 계산이 필요합니다.
    - 높은 점수를 매기는 기준이 중요합니다.

# Evaluation

## Create our QandA application

In [105]:
from langchain.chains import RetrievalQA
from langchain_openai import ChatOpenAI
from langchain.document_loaders import CSVLoader
from langchain.indexes import VectorstoreIndexCreator
from langchain.vectorstores import DocArrayInMemorySearch

In [106]:
file = 'OutdoorClothingCatalog_1000.csv'
loader = CSVLoader(file_path=file)
data = loader.load()

In [107]:
from langchain.embeddings import OpenAIEmbeddings
embeddings = OpenAIEmbeddings()

index = VectorstoreIndexCreator(
    vectorstore_cls=DocArrayInMemorySearch,
    embedding=embeddings,
).from_loaders([loader])

In [108]:
llm = ChatOpenAI(temperature = 0.0)

qa = RetrievalQA.from_chain_type(
    llm=llm, 
    chain_type="stuff", 
    retriever=index.vectorstore.as_retriever(), 
    verbose=True,
    chain_type_kwargs = {
        "document_separator": "<<<<>>>>>"
    }
)

In [109]:
data[10]

Document(page_content="name: Cozy Comfort Pullover Set, Stripe\ndescription: Perfect for lounging, this striped knit set lives up to its name. We used ultrasoft fabric and an easy design that's as comfortable at bedtime as it is when we have to make a quick run out.\r\n\r\nSize & Fit\r\n- Pants are Favorite Fit: Sits lower on the waist.\r\n- Relaxed Fit: Our most generous fit sits farthest from the body.\r\n\r\nFabric & Care\r\n- In the softest blend of 63% polyester, 35% rayon and 2% spandex.\r\n\r\nAdditional Features\r\n- Relaxed fit top with raglan sleeves and rounded hem.\r\n- Pull-on pants have a wide elastic waistband and drawstring, side pockets and a modern slim leg.\r\n\r\nImported.", metadata={'source': 'OutdoorClothingCatalog_1000.csv', 'row': 10})

In [110]:
data[11]

Document(page_content='name: Ultra-Lofty 850 Stretch Down Hooded Jacket\ndescription: This technical stretch down jacket from our DownTek collection is sure to keep you warm and comfortable with its full-stretch construction providing exceptional range of motion. With a slightly fitted style that falls at the hip and best with a midweight layer, this jacket is suitable for light activity up to 20° and moderate activity up to -30°. The soft and durable 100% polyester shell offers complete windproof protection and is insulated with warm, lofty goose down. Other features include welded baffles for a no-stitch construction and excellent stretch, an adjustable hood, an interior media port and mesh stash pocket and a hem drawcord. Machine wash and dry. Imported.', metadata={'source': 'OutdoorClothingCatalog_1000.csv', 'row': 11})

In [111]:
examples = [
    {
        "query": "Do the Cozy Comfort Pullover Set\
        have side pockets?",
        "answer": "Yes"
    },
    {
        "query": "What collection is the Ultra-Lofty \
        850 Stretch Down Hooded Jacket from?",
        "answer": "The DownTek collection"
    }
]

In [112]:
from langchain.evaluation.qa import QAGenerateChain

In [114]:
example_gen_chain = QAGenerateChain.from_llm(ChatOpenAI())

In [115]:
new_examples = example_gen_chain.apply_and_parse(
    [{"doc": t} for t in data[:5]]
)



In [116]:
new_examples[0]

{'qa_pairs': {'query': "What is the approximate weight of the Women's Campside Oxfords per pair?",
  'answer': "The approximate weight of the Women's Campside Oxfords per pair is 1 lb. 1 oz."}}

In [117]:
data[0]

Document(page_content="name: Women's Campside Oxfords\ndescription: This ultracomfortable lace-to-toe Oxford boasts a super-soft canvas, thick cushioning, and quality construction for a broken-in feel from the first time you put them on. \r\n\r\nSize & Fit: Order regular shoe size. For half sizes not offered, order up to next whole size. \r\n\r\nSpecs: Approx. weight: 1 lb.1 oz. per pair. \r\n\r\nConstruction: Soft canvas material for a broken-in feel and look. Comfortable EVA innersole with Cleansport NXT® antimicrobial odor control. Vintage hunt, fish and camping motif on innersole. Moderate arch contour of innersole. EVA foam midsole for cushioning and support. Chain-tread-inspired molded rubber outsole with modified chain-tread pattern. Imported. \r\n\r\nQuestions? Please contact us for any inquiries.", metadata={'source': 'OutdoorClothingCatalog_1000.csv', 'row': 0})

In [118]:
examples += new_examples

In [119]:
qa.run(examples[0]["query"])



[1m> Entering new RetrievalQA chain...[0m

[1m> Finished chain.[0m


'Yes, the Cozy Comfort Pullover Set does have side pockets.'

In [120]:
import langchain
langchain.debug = True

In [121]:
qa.run(examples[0]["query"])

[32;1m[1;3m[chain/start][0m [1m[chain:RetrievalQA] Entering Chain run with input:
[0m{
  "query": "Do the Cozy Comfort Pullover Set        have side pockets?"
}
[32;1m[1;3m[chain/start][0m [1m[chain:RetrievalQA > chain:StuffDocumentsChain] Entering Chain run with input:
[0m[inputs]
[32;1m[1;3m[chain/start][0m [1m[chain:RetrievalQA > chain:StuffDocumentsChain > chain:LLMChain] Entering Chain run with input:
[0m{
  "question": "Do the Cozy Comfort Pullover Set        have side pockets?",
  "context": "name: Cozy Comfort Pullover Set, Stripe\ndescription: Perfect for lounging, this striped knit set lives up to its name. We used ultrasoft fabric and an easy design that's as comfortable at bedtime as it is when we have to make a quick run out.\r\n\r\nSize & Fit\r\n- Pants are Favorite Fit: Sits lower on the waist.\r\n- Relaxed Fit: Our most generous fit sits farthest from the body.\r\n\r\nFabric & Care\r\n- In the softest blend of 63% polyester, 35% rayon and 2% spandex.\r\n\

'Yes, the Cozy Comfort Pullover Set does have side pockets.'

In [122]:
langchain.debug = False

## LLM assisted evaluation

In [126]:
predictions = qa.apply(examples)



[1m> Entering new RetrievalQA chain...[0m

[1m> Finished chain.[0m


[1m> Entering new RetrievalQA chain...[0m

[1m> Finished chain.[0m


[1m> Entering new RetrievalQA chain...[0m


ValueError: Missing some input keys: {'query'}