# [실습] LangChain 기초

LangChain(랭체인)은 LLM 어플리케이션을 효율적으로 개발할 수 있게 해주는 라이브러리입니다.   
공식 홈페이지는 https://python.langchain.com/docs/get_started/introduction 입니다.   


---
이번 실습에서는 OpenAI의 LLM 모델을 사용하지만, LangChain은 [다양한 LLM 모델](https://integrations.langchain.com/llms)과 연동됩니다.   

LangChain의 OpenAI도, 기능을 활용하기 위해서는 OpenAI API 키가 필요합니다.   
[여기](https://platform.openai.com/account/api-keys)를 클릭하여 키를 생성할 수 있습니다.   




In [4]:
!pip install langchain_community openai langchain langchain_openai # -q
# -q : 조용히 설치하기

Defaulting to user installation because normal site-packages is not writeable
Collecting aiohttp<4.0.0,>=3.8.3
  Downloading aiohttp-3.11.13-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (1.6 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.6/1.6 MB[0m [31m22.4 MB/s[0m eta [36m0:00:00[0m00:01[0m0:01[0m
Collecting jsonpatch<2.0,>=1.33
  Downloading jsonpatch-1.33-py2.py3-none-any.whl (12 kB)
Collecting async-timeout<5.0.0,>=4.0.0
  Downloading async_timeout-4.0.3-py3-none-any.whl (5.7 kB)
Collecting frozenlist>=1.1.1
  Downloading frozenlist-1.5.0-cp310-cp310-manylinux_2_5_x86_64.manylinux1_x86_64.manylinux_2_17_x86_64.manylinux2014_x86_64.whl (241 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m241.9/241.9 KB[0m [31m23.6 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting aiohappyeyeballs>=2.3.0
  Downloading aiohappyeyeballs-2.4.6-py3-none-any.whl (14 kB)
Collecting propcache>=0.2.0
  Downloading propcache-0.3.0-cp310-cp310-manyl

In [5]:
import os
import json

with open("api_key.json", "r") as f:
    config = json.load(f)

api_key = config["OPENAI_API_KEY"]

# OpenAI API 키 설정
os.environ["OPENAI_API_KEY"] = api_key


## LLM

LangChain의 최신 버전에서는 OpenAI를 langchain_openai 라이브러리로 따로 분리해 두었습니다. <br> 
Token Limit : https://platform.openai.com/settings/organization/limits

chat 모델 사용을 위해 ChatOpenAI를 불러오겠습니다.

In [6]:
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(model = 'gpt-4o-mini', temperature=0.5, max_tokens=1024)

LangChain의 구성 요소는 `invoke()`를 통해 실행합니다.

In [7]:
question = '''전 세계적으로 흥행한 영화에 나오는 유명한 명대사를 하나 알려주세요.
대사가 나온 배경과 의미도 설명해 주세요.'''

llm.invoke(question)
# print(llm.invoke(question))

AIMessage(content='영화 "타이타닉"에서 잭 도슨(레오나르도 디카프리오)이 로즈(케이트 윈슬렛)에게 말하는 유명한 대사 중 하나는 "I\'m the king of the world!"입니다. \n\n### 배경\n이 대사는 잭이 타이타닉의 앞쪽 난간에 서서 두 팔을 벌리고 외치는 장면에서 나옵니다. 이 장면은 잭이 로즈와 함께 자유롭고 행복한 순간을 만끽하는 상징적인 순간으로, 두 사람의 사랑이 시작되는 중요한 시점입니다. \n\n### 의미\n이 대사는 단순히 잭이 세상의 정점에 서 있다는 감정을 표현하는 것뿐만 아니라, 젊음과 자유, 그리고 삶의 가능성을 상징합니다. 잭은 사회적 지위나 재산이 없는 평범한 청년이지만, 그 순간에는 모든 것을 초월한 듯한 자신감을 느끼고 있습니다. 또한, 이 대사는 영화 전체에서 잭과 로즈의 사랑이 어떻게 불가능한 상황 속에서도 피어나는지를 보여주는 중요한 테마와 연결됩니다. \n\n이 대사는 영화의 상징적인 순간을 잘 나타내며, 많은 사람들에게 감동을 주는 명대사로 남아 있습니다.', response_metadata={'token_usage': {'completion_tokens': 282, 'prompt_tokens': 39, 'total_tokens': 321, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini', 'system_fingerprint': 'fp_06737a9306', 'finish_reason': 'stop', 'logprobs': None}, id='run-99707af5-67b0-4116-850d-ba61f24b9eb0-0')

출력 형식은 AIMessage 클래스로 정의됩니다.

In [8]:
question = '''울림을 주는 고전 영화 명대사를 하나 알려주세요.
대사가 나온 배경과 의미도 설명해 주세요.'''

# llm.invoke(question).content
print(llm.invoke(question).content)

고전 영화 "카사블랑카" (Casablanca, 1942)에서 나오는 명대사 중 하나는 "여기서 우리가 해야 할 일은, 오늘을 잊고 내일을 생각하는 것이다."입니다.

### 배경
"카사블랑카"는 제2차 세계대전 중의 모로코 카사블랑카를 배경으로 한 로맨스 영화로, 주인공 릭 블레인(헨프리 보가트 분)과 그의 옛 사랑인 일사(잉그리드 버그만 분) 간의 복잡한 관계를 중심으로 전개됩니다. 영화는 전쟁과 정치적 갈등 속에서 인간의 사랑과 희생을 다루고 있습니다.

### 의미
이 대사는 전쟁의 혼란 속에서도 인간의 삶이 계속되어야 한다는 메시지를 담고 있습니다. 릭은 과거의 아픔과 상처를 안고 있지만, 결국에는 현재와 미래를 생각해야 한다는 것을 깨닫게 됩니다. 이는 관객에게도 힘든 상황 속에서도 희망을 잃지 않고 앞으로 나아가야 한다는 교훈을 주며, 인간의 삶의 본질적인 가치인 사랑과 희생을 강조합니다.

"카사블랑카"는 그 자체로도 많은 사랑을 받는 영화지만, 이 대사는 특히 많은 사람들에게 울림을 주며 여전히 회자되고 있습니다.


In [None]:
# 모두 llm.invoke로 업데이트 됨 
# 아래는 Deprecated 목록

# llm.predict(question)
# llm.run(question)
# llm(question)

OpenAI의 최신 모델 o1은 아래와 같이 사용합니다.

In [9]:
o1 = ChatOpenAI(model = 'o1-mini', temperature=1.0,
                model_kwargs={'max_completion_tokens':25000})
response = o1.invoke("BERT와 같은 인코더 기반 모델이 이후 어떻게 임베딩 모델로 진화했는지 알려주세요.")
print(response.content)

BERT(Bidirectional Encoder Representations from Transformers)는 2018년 구글에서 발표한 혁신적인 인코더 기반의 사전 학습 언어 모델로, 양방향 컨텍스트를 효과적으로 활용하여 다양한 자연어 처리(NLP) 작업에서 뛰어난 성능을 발휘했습니다. 이후 BERT는 다양한 방식으로 발전하며 임베딩 모델로서의 활용도 더욱 강화되었습니다. 다음은 BERT와 같은 인코더 기반 모델이 이후 임베딩 모델로 어떻게 진화했는지에 대한 주요 흐름과 주요 모델들을 소개합니다.

### 1. **BERT의 한계와 응용**
BERT는 단어 단위의 임베딩을 주로 생성하며, 문장 전체의 의미를 포착하는 데에는 제한적일 수 있습니다. 특히 문장 간 유사도 계산이나 문장 분류와 같은 작업에서는 추가적인 처리나 모델 수정이 필요했습니다.

### 2. **Sentence-BERT (SBERT)**
BERT의 한계를 극복하기 위해 개발된 대표적인 모델이 **Sentence-BERT (SBERT)**입니다. SBERT는 문장 수준의 임베딩을 효율적으로 생성하기 위해 BERT의 인코더를 수정하여 두 문장을 동시에 입력받아 임베딩을 생성합니다. 이를 통해 문장 간의 유사도 계산, 정보 검색, 군집화 등의 작업에서 BERT보다 훨씬 빠르고 효율적으로 동작할 수 있습니다.
- **핵심 아이디어:** 트립렛(triplet) 손실 함수나 시암 네트워크 구조를 도입하여 문장 간의 유사도를 학습.

### 3. **RoBERTa**
Facebook AI에서 개발한 **RoBERTa**는 BERT의 학습 방식을 개선하여 더 큰 데이터와 더 긴 학습 시간을 통해 성능을 향상시킨 모델입니다. RoBERTa는 임베딩 품질을 높여 다양한 다운스트림 작업에서 BERT를 능가하는 성능을 보입니다.
- **주요 특징:** 마스킹된 단어 예측에서의 동적 마스킹, 학습 배치 크기와 학습 기간의 증가.

### 4. **ALBERT**
**ALBERT(A Lite BERT)**는 파라

실제 환경에서는 프롬프트의 형태를 사전에 설정하고,   
같은 형태로 입력 변수가 주어질 때마다 프롬프트를 작성하게 하는 것이 효율적입니다.

## Prompt Template

LangChain은 프롬프트의 템플릿을 구성할 수 있습니다.

In [10]:
from langchain.prompts import PromptTemplate
from langchain.prompts import ChatPromptTemplate

PromptTemplate을 이용하여, 프롬프트의 기본적인 형태를 만들 수 있습니다.   


In [13]:
explain_template = """당신은 어려운 용어를 초등학생 수준의 레벨로 쉽게 설명하는 챗봇입니다.
{term}에 대해 설명해 주세요."""
print(explain_template)

당신은 어려운 용어를 초등학생 수준의 레벨로 쉽게 설명하는 챗봇입니다.
{term}에 대해 설명해 주세요.


기본 라이브러리에서는 문자열 뒤에 .format()을 붙이고 필드의 정보를 입력하여 포맷팅을 수행합니다.

In [14]:
print(explain_template.format(term = '트랜스포머 네트워크'))

당신은 어려운 용어를 초등학생 수준의 레벨로 쉽게 설명하는 챗봇입니다.
트랜스포머 네트워크에 대해 설명해 주세요.


Langchain도 비슷한 방식으로 작동합니다.

In [15]:
explain_prompt = PromptTemplate.from_template(template = explain_template)

explain_prompt.format(term = "트랜스포머 네트워크")

'당신은 어려운 용어를 초등학생 수준의 레벨로 쉽게 설명하는 챗봇입니다.\n트랜스포머 네트워크에 대해 설명해 주세요.'

In [18]:
#lm.invoke(explain_prompt.format(term = "트랜스포머 네트워크")).content
print(llm.invoke(explain_prompt.format(term = "트랜스포머 네트워크")).content)

트랜스포머 네트워크는 컴퓨터가 언어를 이해하고 처리하는 데 도움을 주는 특별한 도구예요. 쉽게 말해서, 트랜스포머는 사람의 말을 이해하고, 대답을 잘 할 수 있도록 도와주는 똑똑한 기계예요.

이 트랜스포머는 두 가지 중요한 기능이 있어요:

1. **주의기능 (Attention)**: 이 기능은 컴퓨터가 문장에서 어떤 단어가 중요한지 알아내는 거예요. 예를 들어, "고양이가 나무 위에 있어요."라는 문장에서 '고양이'와 '나무'가 중요하다는 걸 알 수 있게 해줘요. 그래서 더 좋은 대답을 할 수 있게 도와줘요.

2. **병렬 처리 (Parallel Processing)**: 트랜스포머는 한 번에 여러 단어를 동시에 처리할 수 있어요. 마치 여러 사람이 동시에 대화하는 것처럼, 빠르게 많은 정보를 이해할 수 있게 해줘요.

결국 트랜스포머 네트워크는 컴퓨터가 사람의 말을 잘 이해하고 대답할 수 있도록 도와주는 똑똑한 방법이에요!


두 개의 매개변수를 받아 프롬프트를 만들어 보겠습니다.

In [19]:
translate_template = "{topic}에 대해 {language}로 설명하세요."

translate_prompt = PromptTemplate.from_template(template = translate_template)

translate_prompt.format(topic='torschlusspanik', language='한국어')

'torschlusspanik에 대해 한국어로 설명하세요.'

In [20]:
X = translate_prompt.format(topic='torschlusspanik', language='한국어')
# llm.invoke(X)
print(llm.invoke(X).content)

"Torschlusspanik"은 독일어에서 유래된 용어로, 직역하면 "문이 닫히는 공포"라는 의미입니다. 이 용어는 주로 인생의 중요한 기회나 선택이 사라질 것이라는 두려움을 표현하는 데 사용됩니다. 예를 들어, 나이가 들면서 결혼, 직업, 자녀 등과 같은 중요한 결정을 내리지 못할까 두려워하는 감정을 나타낼 때 사용됩니다.

이런 감정은 종종 시간이 흐르면서 느끼는 불안감이나 압박감에서 비롯되며, 사람들은 자신이 원하는 삶의 목표를 이루지 못할까 걱정하게 됩니다. Torschlusspanik은 개인의 심리적 상태에 영향을 미칠 수 있으며, 때로는 급하게 결정을 내리게 하거나 스트레스를 유발할 수 있습니다.


채팅 메시지의 경우, ChatPromptTemplate이라는 형태를 사용합니다.    
또한, format()이 아닌 format_messages()를 쓰는 것이 특징입니다.


In [21]:
prompt = ChatPromptTemplate.from_messages([
    ("system", '당신은 항상 부정적인 말만 하는 챗봇입니다. 첫 문장은 항상 사용자의 의견을 반박하세요.'),
    ("user", '{A}를 배우면 어떤 유용한 점이 있나요?')
]
)
# 'system', 'user' = 'human' , 'assistant' = 'ai' 5개 역할 가능
prompt.format_messages(A='LangChain')

[SystemMessage(content='당신은 항상 부정적인 말만 하는 챗봇입니다. 첫 문장은 항상 사용자의 의견을 반박하세요.'),
 HumanMessage(content='LangChain를 배우면 어떤 유용한 점이 있나요?')]

In [22]:
# 비교) 잘못된 예시
prompt.format(A='LangChain')

'System: 당신은 항상 부정적인 말만 하는 챗봇입니다. 첫 문장은 항상 사용자의 의견을 반박하세요.\nHuman: LangChain를 배우면 어떤 유용한 점이 있나요?'

In [23]:
llm.invoke(prompt.format_messages(A='LangChain')).content

'LangChain을 배우면 유용한 점이 많다고 하지만, 사실 그만큼 복잡하고 학습 곡선이 가파르기 때문에 대부분의 사람들에게는 실질적인 이점이 크지 않을 수 있습니다. 많은 경우, 다른 간단한 도구들이 더 효과적일 수 있습니다.'

# LangChain으로 댓글 자동 분류하기

ChatOpenAI와 프롬프트 템플릿을 이용하여,    
댓글의 긍정/부정 여부를 분류하는 기능을 구현해 보겠습니다.   

In [23]:
#pip install pandas



In [24]:
import pandas as pd
reviews = pd.read_csv('./data/1_1.data_reviews.csv')
print(reviews.shape)
reviews.head()

(50, 3)


Unnamed: 0,Num,Review,Label
0,1,그닥 맛있고 좋은 고기인지는 모르겠내요 테이블 나누어서 두팀 받는데 옆 테이블 시끄...,-1
1,2,적당히 좋은 소고기를 싸지 않은 가격에 맛볼 수 있다. 하지만 인기나 리뷰에 비해선...,-1
2,3,기름진맛 역시맛있네요 많이먹긴 힘들지만 맛있는 소고기집인건 틀림없어요,1
3,4,"지인이 추천하고 짬뽕맛집이래서 찾아갔는데, 주차도 골목길에 해야되고 맛도 별로네요",-1
4,5,매운단계별짬뽕과 불향가득짜장 직접만든소스가별미인탕수육 제입맛에는딱맞아서자주찾게되요^^*,1


주어진 리뷰 데이터는 다음의 column으로 구성되어 있습니다.
- Num : 리뷰 인덱스 번호
- Review: 리뷰 텍스트
- Label: 긍정/부정 레이블 (-1:부정, 1:긍정)



가장 단순한 형태로 프롬프트를 만들어 보겠습니다.

- 지시사항이 먼저 입력되고, 줄바꿈 후 리뷰를 입력합니다.
- 리뷰의 분류 결과는 1(긍정)과 -1(부정) 중 하나로만 출력되게 합니다.

In [25]:
system_prompt='''
주어지는 입력이 긍정/부정 중 어떤 내용을 담고 있는지 분류하세요.

분류 결과: 부정, 혹은 분류 결과: 긍정 을 출력하면 됩니다.
위 형식을 지키고, 분류 결과 뒤에는 별도의 내용을 출력하지 마세요.
'''
prompt = ChatPromptTemplate.from_messages([
    ("system", system_prompt),
    ("user", '{review}')
]
)

# 분류 문제는 temprature를 0으로 넣는 것이 일반적
llm = ChatOpenAI(model = 'gpt-4o-mini', temperature=0, max_tokens=1024) 


In [26]:
correct = 0
incorrect = 0
for idx, review, label in zip(reviews['Num'],reviews['Review'], reviews['Label']):
    print(f'#{idx} : ({correct}/{incorrect})')
    print(review)
    response = llm.invoke(prompt.format_messages(review=review)).content
    print(response, '/', label)

    if label == -1:
        if '분류 결과: 부정' in response:
            correct+=1
        else:
            incorrect += 1
            print('Misclassification!')
    else:
        if '분류 결과: 긍정' in response:
            correct+=1
        else:
            incorrect += 1
            print('Misclassification!')
    print()

print('Correct:', correct)
print('Incorrect:', incorrect)
print('Accuracy:', correct / (correct + incorrect))


#1 : (0/0)
그닥 맛있고 좋은 고기인지는 모르겠내요 테이블 나누어서 두팀 받는데 옆 테이블 시끄러워서 짜증이 많이 나내요
분류 결과: 부정 / -1

#2 : (1/0)
적당히 좋은 소고기를 싸지 않은 가격에 맛볼 수 있다. 하지만 인기나 리뷰에 비해선 평범한 수준. 이런 맛과 가성비의 소고기집은 동네마다 아주아주 많다.
분류 결과: 부정 / -1

#3 : (2/0)
기름진맛 역시맛있네요 많이먹긴 힘들지만 맛있는 소고기집인건 틀림없어요
분류 결과: 긍정 / 1

#4 : (3/0)
지인이 추천하고 짬뽕맛집이래서 찾아갔는데, 주차도 골목길에 해야되고 맛도 별로네요
분류 결과: 부정 / -1

#5 : (4/0)
매운단계별짬뽕과 불향가득짜장 직접만든소스가별미인탕수육 제입맛에는딱맞아서자주찾게되요^^*
분류 결과: 긍정 / 1

#6 : (5/0)
신맛나지 않는 달콤한 탕수육도 맛있다 친절한 사장님도 추가 당분간 맛없는 배달짬뽕 먹을 생각하니 슬프다 사장님 쾌차하세요
분류 결과: 부정 / 1
Misclassification!

#7 : (5/1)
식당규모가조금작아서점심시간에는대기했다가식사를해야됨니다.짬봉맛이정말좋아요.
분류 결과: 긍정 / 1

#8 : (6/1)
미슐렝 가이드 원스타에 선정된 셰프의 세컨 브랜드. 음식들을 베어무는 순간 '신선하다'는 감탄사가 저절로 나왔던건 우연이 아니었던것. 너무 좋았던 곳.
분류 결과: 긍정 / 1

#9 : (7/1)
인스타에서 뇨끼 맛집이라고 갔으나.. 뭐 특출나게 맛있지는 않고 아직 홀이 정리가 안돼서 직원들이 우왕좌왕… 옆테이블이고 저테이블이고 컴플레인하느라 밥을 먹는건지 마는건지 뒤숭숭한 분위기. 1년 전에 방문했던 친구도 똑.같.은. 느낌을 받았다고 하니.. 음식은 나쁘지 않은데 이런부분은 개선이 필요함.
분류 결과: 부정 / -1

#10 : (8/1)
이탈리아 로마 까르보나라의 쿰쿰함까지 모두 구현한 집, 다른 것도 먹어보고싶어졌어요.
분류 결과: 긍정 / 1

#11 : (9/1)
크림파스타 너무 맛없었

전반적으로 잘 맞추지만, 가끔 틀리기도 합니다.    
앞에서 배운 프롬프트 엔지니어링을 고려하면, 성능을 올릴 수 있을까요?

# 실습) 프롬프트 엔지니어링으로 분류 성능 높이기   

리뷰를 분류하기 위한 프롬프트를 작성하여 분류 성능을 개선하세요.     
채점을 용이하게 하기 위해, 아래 내용을 반드시 마지막에 붙이세요.

```python
답변의 마지막에 분류 결과: 부정, 혹은 분류 결과: 긍정 을 출력하면 됩니다.
위 형식을 지키고, 분류 결과 뒤에는 별도의 내용을 출력하지 마세요.
```

**힌트**: 성능을 높이는 방법에는 두 가지가 있습니다.   
1. CoT(Chain-of-Thought) 방식의 출력 유도하기   
 - 추론 과정을 통해 분류 능력이 향상됩니다.
2. CoT 없이, 자세한 지시사항 프롬프트 작성하기   
 - 비용 효율적이지만, 프롬프트 구성이 어렵습니다.



In [27]:
good_system_prompt='''
식당에 대한 리뷰 결과를 보고 분류하는 문제입니다. 천천히 생각하세요. 이 평가 결과는 나에게 매우 중요한 일입니다.
너무 맛있을 때 기절했다고 표현하기도 합니다. 단어만 파악하지 말고 문맥을 보고 판단하세요.
맛에 대한 언급이 없더라도, 문맥에서 사장 또는 식당에 대해 전문성을 표현한다면 긍정입니다.
가격이 불만족스럽더라도, 문맥에서 맛이나 식당 전문성 등을 표현한다면 긍정입니다.

답변의 마지막에 분류 결과: 부정, 혹은 분류 결과: 긍정 을 출력하면 됩니다.
위 형식을 지키고, 분류 결과 뒤에는 별도의 내용을 출력하지 마세요.

'''

# 천천히 생각하세요, 이 평가 결과는 나에게 매우 중요한 일입니다. -> 이런 멘트들이 CoT 유도가 됨.

In [28]:
# 채점 간략화를 위해, 어려운 리뷰만 분리

hard_reviews = reviews.iloc[[1,5,6,13,16,34,38,45,46]]
hard_reviews

Unnamed: 0,Num,Review,Label
1,2,적당히 좋은 소고기를 싸지 않은 가격에 맛볼 수 있다. 하지만 인기나 리뷰에 비해선...,-1
5,6,신맛나지 않는 달콤한 탕수육도 맛있다 친절한 사장님도 추가 당분간 맛없는 배달짬뽕 ...,1
6,7,식당규모가조금작아서점심시간에는대기했다가식사를해야됨니다.짬봉맛이정말좋아요.,1
13,14,떡볶이 두 입 먹고 기절했습니다. 다시 깨어나서 쫄면 한 입 먹고 다시 기절했습니다...,1
16,17,이제 여기아닌 다른데서 탕수육 못먹겠음..,1
34,35,좋은점. 중급 뷔페의 미덕을 충분히 갖췄다. 카테고리 위치가 적절해 동선이 꼬이지 ...,1
38,39,칵테일 덕후 사장님께서 운영하시는 칵테일 바. 좋은 말로 얘기하면 알아서 해주는 칵...,1
45,46,주인이 거만하지만 음식을 보니 좀 이해됨,1
46,47,이 식당 알바 쓰는 듯,-1


In [29]:
def evaluate(system_prompt, reviews):

    prompt = ChatPromptTemplate.from_messages([
        ("system", system_prompt),
        ("user", '{review}')
    ])
    correct = 0
    incorrect = 0
    for idx, review, label in zip(reviews['Num'],reviews['Review'], reviews['Label']):
        print(f'#{idx} : ({correct}/{incorrect})')
        print(review)
        response = llm.invoke(prompt.format_messages(review=review)).content
        print(response, '/', label)

        if label == -1:
            if '분류 결과: 부정' in response:
                correct+=1
            else:
                incorrect += 1
                print('Misclassification!')
        else:
            if '분류 결과: 긍정' in response:
                correct+=1
            else:
                incorrect += 1
                print('Misclassification!')
        print()

    print('Correct:', correct)
    print('Incorrect:', incorrect)
    print('Accuracy:', correct / (correct + incorrect))


In [30]:
evaluate(good_system_prompt, hard_reviews)

#2 : (0/0)
적당히 좋은 소고기를 싸지 않은 가격에 맛볼 수 있다. 하지만 인기나 리뷰에 비해선 평범한 수준. 이런 맛과 가성비의 소고기집은 동네마다 아주아주 많다.
분류 결과: 부정 / -1

#6 : (1/0)
신맛나지 않는 달콤한 탕수육도 맛있다 친절한 사장님도 추가 당분간 맛없는 배달짬뽕 먹을 생각하니 슬프다 사장님 쾌차하세요
이 리뷰는 탕수육의 맛에 대한 긍정적인 언급이 있으며, 사장님에 대한 친절함도 언급하고 있습니다. 비록 배달짬뽕에 대한 불만이 있지만, 전반적으로 긍정적인 요소가 더 많습니다. 

분류 결과: 긍정 / 1

#7 : (2/0)
식당규모가조금작아서점심시간에는대기했다가식사를해야됨니다.짬봉맛이정말좋아요.
짬뽕 맛이 정말 좋다는 긍정적인 언급이 있으며, 식당의 전문성도 느껴집니다. 대기하는 불편함이 언급되었지만, 맛에 대한 긍정적인 평가가 더 두드러집니다. 

분류 결과: 긍정 / 1

#14 : (3/0)
떡볶이 두 입 먹고 기절했습니다. 다시 깨어나서 쫄면 한 입 먹고 다시 기절했습니다. 사장님 들숨에 건강을 날숨에 재물을 기원합니다
분류 결과: 긍정 / 1

#17 : (4/0)
이제 여기아닌 다른데서 탕수육 못먹겠음.. 
이 리뷰는 탕수육에 대한 강한 애정을 표현하고 있으며, 다른 곳에서는 이 맛을 느낄 수 없다는 점에서 긍정적인 감정을 드러내고 있습니다. 따라서 긍정적인 평가로 분류할 수 있습니다. 

분류 결과: 긍정 / 1

#35 : (5/0)
좋은점. 중급 뷔페의 미덕을 충분히 갖췄다. 카테고리 위치가 적절해 동선이 꼬이지 않는다. 광어와 연어, 젤라또가 훌륭했다. 개선할점. 와인 무제한에 화이트 와인도 서빙해야한다고 봄. 육류 중 한가지라도 구우면서 서빙되면 좋겠음.
분류 결과: 긍정 / 1

#39 : (6/0)
칵테일 덕후 사장님께서 운영하시는 칵테일 바. 좋은 말로 얘기하면 알아서 해주는 칵테일, 다른 말로 하면 얼마인지 모르고 나중에 계산할 때 깜놀
이 리뷰는 칵테일 바의 사장님이 전문성을 가지고 운영하고

In [36]:
# 임의의 리뷰를 분석하고 싶다면?
prompt = ChatPromptTemplate.from_messages([
    ("system", good_system_prompt),
    ("user", '{review}')
])
sample_review = ''''''

llm.invoke(prompt.format_messages(review = sample_review))

AIMessage(content='분류 결과: 부정', response_metadata={'token_usage': {'completion_tokens': 7, 'prompt_tokens': 175, 'total_tokens': 182, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini', 'system_fingerprint': 'fp_06737a9306', 'finish_reason': 'stop', 'logprobs': None}, id='run-b9dfc5fa-369d-42c3-a380-99a42dcede5b-0')

In [37]:
# 좋은 프롬프트 예시
example_system_prompt='''
음식점에 대한 리뷰가 주어지면, 사용자의 의도를 파악하여
50자 이내로 설명하고, 음식점에 대한 긍정/부정 여부를 분류하여 출력하세요.

답변의 마지막에 분류 결과: 부정, 혹은 분류 결과: 긍정 을 출력하면 됩니다.
위 형식을 지키고, 분류 결과 뒤에는 별도의 내용을 출력하지 마세요.
---

'''


In [38]:
# 좋은 프롬프트 예시
example_system_prompt2='''
음식점에 대한 리뷰가 주어지면, 아래의 요소에 대한 견해를 각각 30자 이내로 출력하고,
이를 바탕으로 '긍정/부정'중 하나로 최종 분류 결과를 출력하세요.
각 요소에 대한 언급이 없는 경우 생략하세요.
일반적으로, 부정에서 긍정으로 끝나는 경우 긍정 리뷰입니다.
긍정에서 부정으로 끝나는 경우 부정 리뷰입니다.
답변의 마지막에 분류 결과: 부정, 혹은 분류 결과: 긍정 을 출력하면 됩니다.
위 형식을 지키고, 분류 결과 뒤에는 별도의 내용을 출력하지 마세요.
---
1. 음식
2. 서비스
3. 가격 대비 만족도
4. 다른 식당과의 비교
5. 분위기와 음악 등
6. 분류 결과
'''

## 부록) GPT-4 VS GPT-3.5


<img src="https://github.com/NotoriousH2/img_container/assets/4037207/de39d8d4-e3bf-4a81-9a60-969fa240334f" height="80%" width="80%">
<br><br>

## Few-Shot Prompting
Few-Shot Prompt Template은 example을 쉽게 추가할 수 있도록 도와줍니다.

In [39]:
# 예시 : Prompt Example 2개

from langchain.prompts.few_shot import FewShotPromptTemplate

examples = [
    {
        "question": "Who lived longer, Muhammad Ali or Alan Turing?",
        "answer": """
Are follow up questions needed here: Yes.
Follow up: How old was Muhammad Ali when he died?
Intermediate answer: Muhammad Ali was 74 years old when he died.
Follow up: How old was Alan Turing when he died?
Intermediate answer: Alan Turing was 41 years old when he died.
So the final answer is: Muhammad Ali
""",
    },
    {
        "question": "Are both the directors of Jaws and Casino Royale from the same country?",
        "answer": """
Are follow up questions needed here: Yes.
Follow up: Who is the director of Jaws?
Intermediate Answer: The director of Jaws is Steven Spielberg.
Follow up: Where is Steven Spielberg from?
Intermediate Answer: The United States.
Follow up: Who is the director of Casino Royale?
Intermediate Answer: The director of Casino Royale is Martin Campbell.
Follow up: Where is Martin Campbell from?
Intermediate Answer: New Zealand.
So the final answer is: No
""",
    },
]

Example 데이터를 구성할 템플릿을 만듭니다.

In [40]:
example_prompt = PromptTemplate.from_template(
    template="Question: {question}\n{answer}")

print(example_prompt.format(**examples[0]))

Question: Who lived longer, Muhammad Ali or Alan Turing?

Are follow up questions needed here: Yes.
Follow up: How old was Muhammad Ali when he died?
Intermediate answer: Muhammad Ali was 74 years old when he died.
Follow up: How old was Alan Turing when he died?
Intermediate answer: Alan Turing was 41 years old when he died.
So the final answer is: Muhammad Ali



위에서 만든 Examples와 템플릿, prefix와 suffix를 이용해 전체 템플릿을 만들 수 있습니다.

In [41]:
prompt = FewShotPromptTemplate(

    examples=examples,
    example_prompt=example_prompt,

    prefix="질문-답변 형식의 예시가 주어집니다. 같은 방식으로 답변하세요.",
    suffix="Question: {input}",
    #prefix, suffix : Optional

    input_variables=["input"]
)

print(prompt.format(input="This is Mar 2025. What is the current age of the director of a movie which got a best international film in Oscar in 2010?"))

질문-답변 형식의 예시가 주어집니다. 같은 방식으로 답변하세요.

Question: Who lived longer, Muhammad Ali or Alan Turing?

Are follow up questions needed here: Yes.
Follow up: How old was Muhammad Ali when he died?
Intermediate answer: Muhammad Ali was 74 years old when he died.
Follow up: How old was Alan Turing when he died?
Intermediate answer: Alan Turing was 41 years old when he died.
So the final answer is: Muhammad Ali


Question: Are both the directors of Jaws and Casino Royale from the same country?

Are follow up questions needed here: Yes.
Follow up: Who is the director of Jaws?
Intermediate Answer: The director of Jaws is Steven Spielberg.
Follow up: Where is Steven Spielberg from?
Intermediate Answer: The United States.
Follow up: Who is the director of Casino Royale?
Intermediate Answer: The director of Casino Royale is Martin Campbell.
Follow up: Where is Martin Campbell from?
Intermediate Answer: New Zealand.
So the final answer is: No


Question: This is Mar 2025. What is the current age of the d

In [45]:
llm = ChatOpenAI(model = 'gpt-4o-mini', temperature=0, max_tokens=1024)

question = "This is Mar 2025. What is the current age of the director of a movie which got a best international film in Oscar in 2010?\n"
X = prompt.format(input=question)
print(llm.invoke(X).content)

Are follow up questions needed here: Yes.  
Follow up: Which movie won the Best International Feature Film Oscar in 2010?  
Intermediate Answer: The movie that won the Best International Feature Film Oscar in 2010 is "The Secret in Their Eyes."  
Follow up: Who is the director of "The Secret in Their Eyes"?  
Intermediate Answer: The director of "The Secret in Their Eyes" is Juan José Campanella.  
Follow up: When was Juan José Campanella born?  
Intermediate Answer: Juan José Campanella was born on July 19, 1953.  
Follow up: How old is Juan José Campanella as of March 2025?  
Intermediate Answer: As of March 2025, Juan José Campanella is 71 years old.  
So the final answer is: 71


In [46]:
question = "스티븐 스필버그의 영화 중 가장 많은 상을 받은 영화의 주연 배우는?"
X = prompt.format(input=question)
print(llm.invoke(X).content)

Are follow up questions needed here: Yes.  
Follow up: 스티븐 스필버그의 영화 중 가장 많은 상을 받은 영화는 무엇인가요?  
Intermediate Answer: 스티븐 스필버그의 영화 중 가장 많은 상을 받은 영화는 '쉰들러 리스트'입니다.  
Follow up: '쉰들러 리스트'의 주연 배우는 누구인가요?  
Intermediate Answer: '쉰들러 리스트'의 주연 배우는 리암 니슨입니다.  
So the final answer is: 리암 니슨
