# LangChain 시작하기

## LangChain Provider 
* https://python.langchain.com/docs/integrations/providers/

## .env 파일 생성
* OPENAI_API_KEY=your_openai_api_key
* LANGSMITH_TRACING=true
* LANGSMITH_API_KEY=your_langchain_api_key
* LANGCHAIN_PROJECT=your_project_name

## 작업 추적
LangSmith에서 이 프로젝트의 작업과 **비용**을 추적할 수 있습니다.
* [smith.langchain.com](https://smith.langchain.com)

### 패키지 설치

In [1]:
%pip install -qU langchain langchain-groq python-dotenv langchain-openai


[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m24.3.1[0m[39;49m -> [0m[32;49m25.0.1[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m
Note: you may need to restart the kernel to use updated packages.


In [4]:
import os
from dotenv import load_dotenv, find_dotenv

load_dotenv(find_dotenv())

True

## OpenAI 객체 생성

In [8]:
from langchain_openai import OpenAI

llmModel = OpenAI()

In [10]:
print(llmModel.model_name)

gpt-3.5-turbo-instruct


###  LLM 모델 호출 

In [11]:
response = llmModel.invoke(
    "케네디 가족에 대한 재밌는 사실 하나를 말해 보세요."
)

In [12]:
response

'\n\n존 F. 케네디는 존 F. 케네디와 미국 대통령 존 F. 케네디의 아버지로, 미국 대통령 존 F. 케네디의 아버지이기도합니다.'

In [13]:
print(response)



존 F. 케네디는 존 F. 케네디와 미국 대통령 존 F. 케네디의 아버지로, 미국 대통령 존 F. 케네디의 아버지이기도합니다.


#### Streaming

In [14]:
for chunk in llmModel.stream("케네디 가족에 대한 재밌는 사실 하나를 말해 보세요."):
    print(chunk, end="", flush=True)



케네디 가족의 존재는 미국에서 가장 유명한 정치적 가문 중 하나입니다. 그들은 미국의 역사적인 사건들과 밀접한 관련이 있었는데요, 그 중 하나가 존 F. 케네디가 미국의 최초의 우주 비행사인 앨런 셰퍼드와 우연한 만남을 한 것입니다. 존 F. 케네디는 앨런 셰퍼드의 이웃이었고, 셰퍼드는 케네디의 아들들을 자주 우주 비행에 초대했으며, 그들과 함께 우주 비행 장난감을 만들기도 했다고 합니다. 이는 미국 우주 비행사들의 역사에서 가장 재

#### Temperature

In [74]:
creativeLlmModel = OpenAI(
    temperature=0.9
)

In [75]:
response = llmModel.invoke(
    "JFK에 대한 5줄짜리 짧은 시를 쓰세요"
)

In [77]:
print(response)




젊음과 열정의 상징
무대 위에서 꿈을 이루다
강렬한 미소와 우아한 모습
세상을 놀라게 한 그녀의 매력
영원히 기억될 나의 JFK


## ChatOpenAI 객체 생성

In [82]:
from langchain_openai import ChatOpenAI

chatModel = ChatOpenAI(model="gpt-4o-mini")

In [83]:
messages = [
    ("system", "당신은 케네디 가문의 역사 전문가입니다."),
    ("human", "JFK에 대한 흥미로운 사실 하나 말해보세요."),
]
response = chatModel.invoke(messages)

In [84]:
response

AIMessage(content='존 F. 케네디(JFK)는 미국 역사에서 두 번째로 젊은 대통령으로, 1960년 11월에 43세의 나이로 대통령에 취임했습니다. 또한, 그는 미국의 첫 번째 카톨릭 대통령이기도 합니다. JFK는 취임 이후 "우리가 할 수 있는 일"이 아닌 "우리가 할 수 있는 일에 대해서 묻지 말고, 당신이 할 수 있는 일에 대해 묻고, 그것을 하라"는 유명한 연설로 많은 이들에게 영감을 주었습니다. 이 연설은 개인의 책임과 시민의 참여를 강조하며, 그의 임기 동안의 많은 정책과 프로그램의 기초가 되었습니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 152, 'prompt_tokens': 39, 'total_tokens': 191, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_b376dfbbd5', 'id': 'chatcmpl-BFVZuMvw0QaizbfAXN2NkMGlRZD7D', 'finish_reason': 'stop', 'logprobs': None}, id='run-539bf0f8-8b87-47c9-b52a-47e1d8bf5385-0', usage_metadata={'input_tokens': 39, 'output_tokens': 152, 'total_tokens': 191, 'input_token_details': {'audio': 0, 'cache_read': 0}, '

In [85]:
response.content

'존 F. 케네디(JFK)는 미국 역사에서 두 번째로 젊은 대통령으로, 1960년 11월에 43세의 나이로 대통령에 취임했습니다. 또한, 그는 미국의 첫 번째 카톨릭 대통령이기도 합니다. JFK는 취임 이후 "우리가 할 수 있는 일"이 아닌 "우리가 할 수 있는 일에 대해서 묻지 말고, 당신이 할 수 있는 일에 대해 묻고, 그것을 하라"는 유명한 연설로 많은 이들에게 영감을 주었습니다. 이 연설은 개인의 책임과 시민의 참여를 강조하며, 그의 임기 동안의 많은 정책과 프로그램의 기초가 되었습니다.'

In [87]:
response.response_metadata

{'token_usage': {'completion_tokens': 152,
  'prompt_tokens': 39,
  'total_tokens': 191,
  'completion_tokens_details': {'accepted_prediction_tokens': 0,
   'audio_tokens': 0,
   'reasoning_tokens': 0,
   'rejected_prediction_tokens': 0},
  'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}},
 'model_name': 'gpt-4o-mini-2024-07-18',
 'system_fingerprint': 'fp_b376dfbbd5',
 'id': 'chatcmpl-BFVZuMvw0QaizbfAXN2NkMGlRZD7D',
 'finish_reason': 'stop',
 'logprobs': None}

#### 이전에는 아래와 같은 방법을 사용했고, 아직 많이 사용하고 있습니다.

In [93]:
from langchain_core.messages import HumanMessage, SystemMessage
from langchain_core.prompts import ChatPromptTemplate

In [94]:
messages = [
    SystemMessage(content="당신은 케네디 가문에 대한 역사 전문가입니다."),
    HumanMessage(content="조셉 P. 케네디는 몇 명의 자녀를 낳았습니까?"),
]

response = chatModel.invoke(messages)

In [95]:
response

AIMessage(content='조셉 P. 케네디는 총 9명의 자녀를 두었습니다. 그 중에서 가장 유명한 자녀는 존 F. 케네디(35대 미국 대통령), 로버트 F. 케네디(상원의원 및 대통령 후보), 에드워드 M. 케네디(상원의원) 등이 있습니다. 다른 자녀로는 유진 케네디, 존 케네디 주니어, 제이파리, 패트리샤 케네디, 킴벌리 케네디, 그리고 두 개의 자녀는 유아 사망으로 세상을 떠났습니다. 조셉 P. 케네디는 제2차 세계대전과 미국 정치에서 큰 영향을 미친 가족을 형성했습니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 171, 'prompt_tokens': 47, 'total_tokens': 218, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_b376dfbbd5', 'id': 'chatcmpl-BFVfpvyqrrfuCQDy12VboHtfMZ8rJ', 'finish_reason': 'stop', 'logprobs': None}, id='run-66d547ec-923e-4cd8-982f-b8abf24b039b-0', usage_metadata={'input_tokens': 47, 'output_tokens': 171, 'total_tokens': 218, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {

#### 스트리밍

In [96]:
for chunk in chatModel.stream(messages):
    print(chunk.content, end="", flush=True)

조셉 P. 케네디는 총 9명의 자녀를 낳았습니다. 그의 자녀들은 다음과 같습니다:

1. 조지프 P. 케네디 주니어 (Joseph P. Kennedy Jr.)
2. 존 F. 케네디 (John F. Kennedy)
3. 로버트 F. 케네디 (Robert F. Kennedy)
4. 에드워드 M. "테드" 케네디 (Edward M. "Ted" Kennedy)
5. 패트리시아 케네디 (Patricia Kennedy)
6. 유니스 케네디 (Eunice Kennedy)
7. 제인 케네디 (Jean Kennedy)
8. 케리 케네디 (Kerry Kennedy)
9. 자넷 케네디 (Rosemary Kennedy)

이 중 조지프 P. 케네디 주니어는 제2차 세계 대전 중 전사하였고, 로즈메리 케네디는 정신적 장애를 가지고 태어났습니다.

#### 또 다른 예전 방법

In [98]:
prompt = ChatPromptTemplate.from_messages(
    [
        (
            "system",
            "당신은 이 {topic} 에 대한 전문적인  {profession} 입니다.",
        ),
        ("human", "{input}"),
    ]
)

chain = prompt | chatModel

response = chain.invoke(
    {
        "topic": "케네디 가족",
        "profession": "역사가",
        "input": "JFK에 대한 재밌는 사실 하나 말해주세요.",
    }
)

In [99]:
response

AIMessage(content='존 F. 케네디(JFK)는 대통령 재직 중, 바다에서의 해양 탐사와 보호에 큰 관심을 가지고 있었습니다. 1961년, 그는 "감독관 관광"을 제안하여 미국의 해양 자원을 보호하고 발전시키기 위한 노력의 일환으로 미국 해양 탐사 및 연구를 지원했습니다. JFK는 또한 마르틴 루터 킹을 만나도록 마음을 열고, 인권 문제를 해결하기 위한 여러 가지 조치를 취했습니다. 그러나 그의 해양 탐사에 대한 열정 중 하나는 그가 바다에서 개인 요트인 "마르타"를 소유하고 있다는 점입니다. 이 요트는 가족과 함께 즐거운 시간을 보내는 장소로 사용되었고, JFK는 해양 스포츠와 낚시를 매우 좋아했습니다. यह खाली बैनर का विधेयक नहीं था, बल्कि यह व्यक्तिगत प्रेम और पारिवारिक गतिविधियों का प्रतीक था.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 206, 'prompt_tokens': 42, 'total_tokens': 248, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_b376dfbbd5', 'id': 'chatcmpl-BFViCoBuMIhLcVvdATse6CmJ6zRM4', 'finish_reason': 'stop', 'logprobs': None}, id='run-057e5560-49c5-40b4-a001-617f

# 다른 LLM 사용
* Llama3 및 Mixtral과 같은 오픈 소스 LLM 사용


## Groq 소개
* Groq는 AI 스타트업 기업입니다. **일론 머스크의 LLM인 Grok과는 다릅니다.**
* LLM을 더 빠르고 저렴하게 실행하도록 특별히 설계된 새로운 칩인 LPU(언어 처리 장치)를 개발했습니다.
* Llama3 와 같은 오픈 소스 LLM을 시도할 수 있는 Groq 클라우드를 제공합니다.
* **Rate Limit이 있는 Groq API 키를 사용하여 앱에서 Llama3 또는 Mixtral을 무료로 사용할 수 있습니다.**
* Groq Rate limits : https://console.groq.com/dashboard/limits

## 무료 Groq API 키를 얻는 방법
* Groq Cloud에 로그인: [https://console.groq.com/login](https://console.groq.com/login)
* 로그인 후 API Keys를 클릭합니다.
* 새 API 키를 만듭니다.
* API 키를 복사하여 .env 파일에 붙여넣습니다.

In [100]:
import os
from dotenv import load_dotenv, find_dotenv

load_dotenv(find_dotenv())

True

In [101]:
from langchain_groq import ChatGroq

llamaChatModel = ChatGroq(
    model="llama3-70b-8192"
)

In [102]:
messages = [
    ("system", "당신은 케네디 가문의 역사 전문가입니다."),
    ("human", "가족 중 몇 명이 비극적으로 죽었습니까? 한글로 답변해주세요."),
]

In [103]:
llamaResponse = llamaChatModel.invoke(messages)

In [104]:
print(llamaResponse.content)

케네디 가문은 미국의 정치 왕조로 알려져 있으며, 그들의 역사에는 비극적인 죽음이 여러 번 일어났습니다.

1. 조지프 P. 케네디 주니어 (Joseph P. Kennedy Jr.) - 제2차 세계대전 중에 항공기 사고로 사망 (1944년)
2. 캐서린 케네디 (Kathleen Kennedy) - 제2차 세계대전 중에 항공기 사고로 사망 (1948년)
3. 존 F. 케네디 (John F. Kennedy) - 대통령 재임 중에 암살 (1963년)
4. 로버트 F. 케네디 (Robert F. Kennedy) - 대통령 선거 캠페인 중에 암살 (1968년)
5. 데이비드 케네디 (David Kennedy) - 약물 과다 복용으로 사망 (1984년)
6. 마이클 케네디 (Michael Kennedy) - 스키 사고로 사망 (1997년)
7. 존 F. 케네디 주니어 (John F. Kennedy Jr.) - 비행기 사고로 사망 (1999년)
8. 마라 케네디 (Mara Kennedy) - 약물 과다 복용으로 사망 (2014년)

케네디 가문은 이러한 비극적인 죽음으로 인해 "케네디의 저주" (Kennedy Curse)라는 표현이 생겨났습니다.


## 프롬프트와 프롬프트 템플릿
**프롬프트**는 언어 모델에 제공하는 입력입니다. 이 입력은 언어 모델이 응답하는 방식을 안내합니다.
프롬프트에는 여러 유형이 있습니다.
* Instruction : 일반 지침
* Few-shot examples : 몇 가지 예가 있는 지침
* 주어진 작업에 적합한 특정 컨텍스트와 질문
* 기타

**프롬프트 템플릿**은 완성하기 위해 몇 가지 추가 부분이 필요한 미리 정의된 프롬프트 레시피입니다. 추가 부분은 사용자가 제공하는 변수입니다.
* 프롬프트 템플릿: 변수 및 기타 요소가 있는 정교한 프롬프트를 사용하려는 경우. 프롬프트 템플릿에는 다음이 포함될 수 있습니다.
    * Instruction
    * Few-shot example
    * 주어진 작업에 적합한 특정 컨텍스트와 질문

In [105]:
from langchain_core.prompts import PromptTemplate

prompt_template = PromptTemplate.from_template(
    "{topic}에 대한 {adjective} 이야기를 들려주세요."
)

llmModelPrompt = prompt_template.format(
    topic="케네디 가족",
    adjective="호기심 나는" 

)

llmModel.invoke(llmModelPrompt)

'\n\n케네디 가족은 미국의 정치적인 가문으로 알려져 있습니다. 그들의 가계는 조지타운 대학을 졸업한 조셉 P. 케네디와 그의 아내 로즈 케네디의 결혼으로 시작되었습니다. 이들의 아들들이 미국의 정치계에서 큰 영향력을 행사하면서 케네디 가족의 이름은 더욱 유명해졌습니다.\n\n케네디 가족의 첫 번째 아들인 존 F. 케네디는 미국 대통령으로 당선된 최초의 로마 가톨릭 신자였습니다. 그는 1960년 대통령 선거에서 당선되었지만 1963년 암살당해 생을 마감'

In [106]:
from langchain_core.prompts import ChatPromptTemplate

chat_template = ChatPromptTemplate.from_messages(
    [
        ("system", "당신은 {topic}의 {profession} 전문가입니다."),
        ("human", "안녕하세요, {profession} 님, 이 질문에 답해 주시겠습니까?"),
        ("ai", "물론입니다!"),
        ("human", "{user_input}"),
    ]
)

messages = chat_template.format_messages(
    profession="역사가",
    topic="케네디 가족",
    user_input="조셉 P. 케네디의 손자는 몇 명이었습니까?"
)

response = chatModel.invoke(messages)

In [107]:
print(response.content)

조셉 P. 케네디의 손자는 네 명입니다. 그의 아들인 로버트 F. 케네디와 에드워드 M. 케네디의 자녀들 중에서 손자들이 태어났습니다. 로버트 F. 케네디는 세 명의 아들을 두었고, 에드워드 M. 케네디는 두 명의 아들을 두었습니다. 이 외에도 조셉 P. 케네디의 다른 자녀들에서도 손주가 태어났으며, 이 전체를 아우르면 손자의 수는 더 늘어납니다.


## 프롬프팅 기본 전략

* Zero Shot Prompt: "이 리뷰의 감정을 분류하세요."
* Few Shot Prompt: "이러한 예시를 바탕으로 이 리뷰의 감정을 분류하세요."
* Chain Of Thought Prompt: "이러한 예시와 추론에 대한 설명을 기반으로 이 리뷰의 감정을 분류하십시오."

## Few Shot Prompting

In [130]:
from langchain_core.prompts import FewShotChatMessagePromptTemplate

In [131]:
examples = [
    {"input": "hi!", "output": "¡hola!"},
    {"input": "bye!", "output": "¡adiós!"},
]

example_prompt = ChatPromptTemplate.from_messages(
    [
        ("human", "{input}"),
        ("ai", "{output}"),
    ]
)

few_shot_prompt = FewShotChatMessagePromptTemplate(
    example_prompt=example_prompt,
    examples=examples,
)

final_prompt = ChatPromptTemplate.from_messages(
    [
        ("system", "You are an English-Spanish translator."),
        few_shot_prompt,
        ("human", "{input}"),
    ]
)

In [132]:
messages = final_prompt.format_messages(
    input="historian"
)

response = chatModel.invoke(messages)

In [133]:
response.content

'historiador'

# Chains
* 여러 작업을 특정 순서로 수행합니다.

In [None]:
chain = final_prompt | chatModel

chain.invoke({"input": "Who was JFK?"})

AIMessage(content='JFK fue el presidente de los Estados Unidos, John F. Kennedy.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 16, 'prompt_tokens': 52, 'total_tokens': 68, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'id': 'chatcmpl-BFVzQBZx4tDt3qoU9SQLtsjKrPkVi', 'finish_reason': 'stop', 'logprobs': None}, id='run-24fde4f8-07a3-44e5-ad9a-7e6a96783df9-0', usage_metadata={'input_tokens': 52, 'output_tokens': 16, 'total_tokens': 68, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

# Ouput Parser
* LLM의 응답 형식 지정

## 출력 파싱
* 언어 모델은 텍스트를 출력합니다. 때로는 JSON 사전이나 XML 문서와 같이 다른 형식으로 답변을 원할 수 있습니다. 이를 위해 Output Parsers를 사용합니다.

In [139]:
from langchain_core.prompts import PromptTemplate
from langchain.output_parsers.json import SimpleJsonOutputParser

json_prompt = PromptTemplate.from_template(
    "다음 질문 : {question} 에 답하는 `answer` 키가 포함된 JSON 객체를 반환합니다."
)

json_parser = SimpleJsonOutputParser()

json_chain = json_prompt | llmModel | json_parser

#### 이전 프롬프트 템플릿에는 parser 지침이 포함되어 있습니다.

In [140]:
json_parser.get_format_instructions()

'Return a JSON object.'

In [141]:
json_chain.invoke({"question": "가장 큰 나라는 어디인가요?"})

{'answer': '러시아'}

#### Pydantic을 사용하여 사용자 정의 출력 형식을 정의할 수 있습니다.
* Pydantic은 데이터 검증과 설정 관리를 위한 Python 라이브러리입니다.
* 데이터 모델을 정의할 때 Python 타입 힌트를 활용하여 유효성 검사(Validation)와 Parsing을 자동으로 수행해 줍니다.

In [143]:
from langchain_core.output_parsers import JsonOutputParser
from langchain_core.prompts import PromptTemplate
from pydantic import BaseModel, Field
from langchain_openai import ChatOpenAI

In [145]:
# 원하는 출력 형식으로 Pydantic 객체를 정의
class Joke(BaseModel):
    setup: str = Field(description="농담을 설정하는 질문")
    punchline: str = Field(description="농담을 해결하는 답변")

In [148]:
# Pydantic 객체를 참조하는 parser 정의
parser = JsonOutputParser(pydantic_object=Joke)

# 프롬프트 정의에 parser format instruction을 추가
prompt = PromptTemplate(
    template="사용자 query에 답변합니다.\n{format_instructions}\n{query}\n",
    input_variables=["query"],
    partial_variables={"format_instructions": parser.get_format_instructions()},
)

# 프롬프트와 파서로 체인 구성
chain = prompt | chatModel | parser

chain.invoke({"query": "재미있는 농담을 들려주세요."})

{'setup': "Why couldn't the bicycle stand up by itself?",
 'punchline': 'Because it was two tired!'}