# LangChain 시작하기

## LangChain Provider 
* https://python.langchain.com/docs/integrations/providers/

## .env 파일 생성
* OPENAI_API_KEY="your-openai-api-key"  
* LANGSMITH_TRACING=true  
* LANGSMITH_ENDPOINT="https://api.smith.langchain.com"
* LANGSMITH_API_KEY="your-langsmith-api-key"  
* LANGSMITH_PROJECT="your-project-name"  

## 작업 추적
LangSmith에서 이 프로젝트의 작업과 **비용**을 추적할 수 있습니다.
* [smith.langchain.com](https://smith.langchain.com)

### 패키지 설치

In [1]:
%pip install -qU langchain langchain-groq python-dotenv langchain-openai


[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m24.3.1[0m[39;49m -> [0m[32;49m25.0.1[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m
Note: you may need to restart the kernel to use updated packages.


In [2]:
import os
from dotenv import load_dotenv, find_dotenv

load_dotenv(find_dotenv())

True

## OpenAI 객체 생성

In [3]:
from langchain_openai import OpenAI

llmModel = OpenAI()

In [4]:
print(llmModel.model_name)

gpt-3.5-turbo-instruct


###  LLM 모델 호출 

In [5]:
response = llmModel.invoke(
    "케네디 가족에 대한 재밌는 사실 하나를 말해 보세요."
)

In [6]:
response

'\n\n존 F. 케네디 대통령의 딸 캐롤라인 케네디는 고등학교 시절 여자 교사로부터 학교에서 가장 불량한 학생으로 선정된 바 있습니다.'

In [7]:
print(response)



존 F. 케네디 대통령의 딸 캐롤라인 케네디는 고등학교 시절 여자 교사로부터 학교에서 가장 불량한 학생으로 선정된 바 있습니다.


#### Streaming

In [8]:
for chunk in llmModel.stream("케네디 가족에 대한 재밌는 사실 하나를 말해 보세요."):
    print(chunk, end="", flush=True)



존 F. 케네디 대통령은 전설적인 피트니스 열정을 가졌으며, 매일 아침 30분에서 1시간 정도 자전거를 타고 몸을 운동했다고 합니다. 그리고 그가 자전거를 타는 것을 좋아하는 이유 중 하나는 자연을 즐기는 것이었습니다. 그는 매일 아침 이전에 자전거를 타고 자연을 즐기며 휴식을 취했습니다.

#### Temperature

In [9]:
creativeLlmModel = OpenAI(
    temperature=0.9
)

In [10]:
response = llmModel.invoke(
    "JFK에 대한 5줄짜리 짧은 시를 쓰세요"
)

In [11]:
print(response)



In the land of the free,
A leader rose with grace and glee.
With words that inspired and moved,
He captured hearts and minds, it's proved.
JFK, forever remembered, his legacy lives on, unmoved.


## ChatOpenAI 객체 생성

In [12]:
from langchain_openai import ChatOpenAI

chatModel = ChatOpenAI(model="gpt-4o-mini")

In [13]:
messages = [
    ("system", "당신은 케네디 가문의 역사 전문가입니다."),
    ("human", "JFK에 대한 흥미로운 사실 하나 말해보세요."),
]
response = chatModel.invoke(messages)

In [14]:
response

AIMessage(content='존 F. 케네디(JFK)는 미국 역사상 최연소 대통령으로 알려져 있지만, 그는 또한 20세기 초 이전의 미국 대통령 중 가장 오랫동안 선장 경험이 있는 인물입니다. 제2차 세계대전 동안 그는 미국 해군에서 PT 보트를 지휘하며 전투 임무를 수행하였습니다. 그의 배는 일본 해군에 의해 공격받았고, 그는 승무원들을 구하기 위해 위험을 무릅쓰고 그들을 안전한 곳으로 인도했습니다. 이 경험은 그의 리더십과 결정적인 행동에 큰 영향을 미쳤습니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 131, 'prompt_tokens': 39, 'total_tokens': 170, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_44added55e', 'id': 'chatcmpl-BKhaEhPnxnXUUFGDynP30cdnQ54Bm', 'finish_reason': 'stop', 'logprobs': None}, id='run-0415c80c-bbdd-43f3-a677-01c03100fd37-0', usage_metadata={'input_tokens': 39, 'output_tokens': 131, 'total_tokens': 170, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio':

In [15]:
response.content

'존 F. 케네디(JFK)는 미국 역사상 최연소 대통령으로 알려져 있지만, 그는 또한 20세기 초 이전의 미국 대통령 중 가장 오랫동안 선장 경험이 있는 인물입니다. 제2차 세계대전 동안 그는 미국 해군에서 PT 보트를 지휘하며 전투 임무를 수행하였습니다. 그의 배는 일본 해군에 의해 공격받았고, 그는 승무원들을 구하기 위해 위험을 무릅쓰고 그들을 안전한 곳으로 인도했습니다. 이 경험은 그의 리더십과 결정적인 행동에 큰 영향을 미쳤습니다.'

In [16]:
response.response_metadata

{'token_usage': {'completion_tokens': 131,
  'prompt_tokens': 39,
  'total_tokens': 170,
  'completion_tokens_details': {'accepted_prediction_tokens': 0,
   'audio_tokens': 0,
   'reasoning_tokens': 0,
   'rejected_prediction_tokens': 0},
  'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}},
 'model_name': 'gpt-4o-mini-2024-07-18',
 'system_fingerprint': 'fp_44added55e',
 'id': 'chatcmpl-BKhaEhPnxnXUUFGDynP30cdnQ54Bm',
 'finish_reason': 'stop',
 'logprobs': None}

#### 이전에는 아래와 같은 방법을 사용했고, 아직 많이 사용하고 있습니다.

In [17]:
from langchain_core.messages import HumanMessage, SystemMessage
from langchain_core.prompts import ChatPromptTemplate

In [18]:
messages = [
    SystemMessage(content="당신은 케네디 가문에 대한 역사 전문가입니다."),
    HumanMessage(content="조셉 P. 케네디는 몇 명의 자녀를 낳았습니까?"),
]

response = chatModel.invoke(messages)

In [19]:
response

AIMessage(content='조셉 P. 케네디는 총 9명의 자녀를 두었습니다. 그의 자녀들은 다음과 같습니다:\n\n1. 조지프 P. 케네디 2세 (Joseph P. Kennedy II)\n2. 존 F. 케네디 (John F. Kennedy)\n3. 로버트 F. 케네디 (Robert F. Kennedy)\n4. 에드워드 M. 케네디 (Edward M. "Ted" Kennedy)\n5. 킴벌리 케네디 (Kathleen "Kick" Kennedy)\n6. 이브 케네디 (Eunice Kennedy)\n7. 패트리샤 케네디 (Patricia Kennedy)\n8. 제인 케네디 (Jean Kennedy)\n9. 마리안 케네디 (Mary "Rosemary" Kennedy)\n\n이들 중 존 F. 케네디, 로버트 F. 케네디, 에드워드 M. 케네디는 미국 정치에서 중요한 역할을 한 인물들입니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 224, 'prompt_tokens': 47, 'total_tokens': 271, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_64e0ac9789', 'id': 'chatcmpl-BKhaHYK0tIqJrE2idbyNGNYEWRFdE', 'finish_reason': 'stop', 'logprobs': None}, id='run-a5ec894e-6c69-4a30-b81d-dd

#### 스트리밍

In [20]:
for chunk in chatModel.stream(messages):
    print(chunk.content, end="", flush=True)

조셉 P. 케네디는 총 9명의 자녀를 두었습니다. 그의 자녀들은 존 F. 케네디, 로버트 F. 케네디, 에드워드 M. 케네디, 재키 케네디(Onassis), 패트리샤 케네디, 유제니 케네디, 도로시 케네디, 조셉 P. 케네디 주니어, 그리고 킴벌리 케네디입니다. 이들 중 일부는 미국 정치와 사회에 중요한 영향을 미친 인물들입니다.

#### 또 다른 예전 방법

In [21]:
prompt = ChatPromptTemplate.from_messages(
    [
        (
            "system",
            "당신은 이 {topic} 에 대한 전문적인  {profession} 입니다.",
        ),
        ("human", "{input}"),
    ]
)

chain = prompt | chatModel

response = chain.invoke(
    {
        "topic": "케네디 가족",
        "profession": "역사가",
        "input": "JFK에 대한 재밌는 사실 하나 말해주세요.",
    }
)

In [22]:
response

AIMessage(content='존 F. 케네디(JFK)에 대한 흥미로운 사실 중 하나는 그가 대통령직에 있을 때 "뉴프론티어(New Frontier)"라는 용어를 제시하여 미국의 미래에 대한 비전을 제시했다는 것입니다. 이는 우주 개발, 인권, 빈곤 퇴치 등 다양한 분야에서 새로운 도전과 기회를 강조하는 개념으로, 당시의 사회적, 경제적 문제에 대한 해결책을 모색하기 위한 비전이었습니다. JFK는 특히 우주 경쟁에서 미국이 소련에 뒤지지 않도록 하기 위해 아폴로 프로그램을 추진하였고, 이는 1969년 인간이 달에 착륙하는 성과로 이어졌습니다. 그의 뉴프론티어는 오늘날에도 여전히 많은 사람들에게 영감을 주고 있습니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 177, 'prompt_tokens': 42, 'total_tokens': 219, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_b376dfbbd5', 'id': 'chatcmpl-BKhaObW7Gd3bAK9Yp4H1486RIFig0', 'finish_reason': 'stop', 'logprobs': None}, id='run-1b73f38a-2fa0-4667-9664-ea658f450cc9-0', usage_metadata={'input_tokens': 42, 'output_tokens': 177, 'total_tokens': 219, 'i

# 다른 LLM 사용
* Llama3 및 Mixtral과 같은 오픈 소스 LLM 사용


## Groq 소개
* Groq는 AI 스타트업 기업입니다. **일론 머스크의 LLM인 Grok과는 다릅니다.**
* LLM을 더 빠르고 저렴하게 실행하도록 특별히 설계된 새로운 칩인 LPU(언어 처리 장치)를 개발했습니다.
* Llama3 와 같은 오픈 소스 LLM을 시도할 수 있는 Groq 클라우드를 제공합니다.
* **Rate Limit이 있는 Groq API 키를 사용하여 앱에서 Llama3 또는 Mixtral을 무료로 사용할 수 있습니다.**
* Groq Rate limits : https://console.groq.com/dashboard/limits

## 무료 Groq API 키를 얻는 방법
* Groq Cloud에 로그인: [https://console.groq.com/login](https://console.groq.com/login)
* 로그인 후 API Keys를 클릭합니다.
* 새 API 키를 만듭니다.
* API 키를 복사하여 .env 파일에 붙여넣습니다. : GROQ_API_KEY="your-groq-api-key"

In [23]:
import os
from dotenv import load_dotenv, find_dotenv

load_dotenv(find_dotenv())

True

In [24]:
from langchain_groq import ChatGroq

llamaChatModel = ChatGroq(
    model="llama3-70b-8192"
)

In [25]:
messages = [
    ("system", "당신은 케네디 가문의 역사 전문가입니다."),
    ("human", "가족 중 몇 명이 비극적으로 죽었습니까? 한글로 답변해주세요."),
]

In [26]:
llamaResponse = llamaChatModel.invoke(messages)

In [27]:
print(llamaResponse.content)

케네디 가문은 미국 역사상 가장 유명한 정치가문 중 하나이지만, 그들의 삶은 비극적인 죽음으로 얼룩져 있습니다. 다음과 같은 ケ네디 family 구성원이 비극적으로 죽었습니다.

1. 조셉 P. 케네디 주니어 (Joseph P. Kennedy Jr., 1915-1944) - 제2차 세계대전 중에 폭탄을 搬送하는 임무 중 추락하여 사망했습니다.
2. 캐서린 케네디 (Kathleen Kennedy, 1920-1948) - 비행기 추락사고로 사망했습니다.
3. 존 F. 케네디 (John F. Kennedy, 1917-1963) - 미국 35대 대통령으로 재임 중 달라스에서 암살당했습니다.
4. 로버트 F. 케네디 (Robert F. Kennedy, 1925-1968) - 미국 상원의원으로 재임 중 캘리포니아 주에서 암살당했습니다.
5. 데이비드 케네디 (David Kennedy, 1955-1984) - 약물 과다 복용으로 사망했습니다.
6. 마이클 케네디 (Michael Kennedy, 1958-1997) - 스키링 사고로 사망했습니다.
7. 존 F. 케네디 주니어 (John F. Kennedy Jr., 1960-1999) - 비행기 추락사고로 사망했습니다.
8. 매리 케네디 (Mary Kennedy, 1960-2012) - 자살로 사망했습니다.

케네디 가문은 이러한 비극적인 죽음으로 인해 '케네디의 저주'라 불리는 운명을 타고 있다고 합니다.


## 프롬프트와 프롬프트 템플릿
**프롬프트**는 언어 모델에 제공하는 입력입니다. 이 입력은 언어 모델이 응답하는 방식을 안내합니다.
프롬프트에는 여러 유형이 있습니다.
* Instruction : 일반 지침
* Few-shot examples : 몇 가지 예가 있는 지침
* 주어진 작업에 적합한 특정 컨텍스트와 질문
* 기타

**프롬프트 템플릿**은 완성하기 위해 몇 가지 추가 부분이 필요한 미리 정의된 프롬프트 레시피입니다. 추가 부분은 사용자가 제공하는 변수입니다.
* 프롬프트 템플릿: 변수 및 기타 요소가 있는 정교한 프롬프트를 사용하려는 경우. 프롬프트 템플릿에는 다음이 포함될 수 있습니다.
    * Instruction
    * Few-shot example
    * 주어진 작업에 적합한 특정 컨텍스트와 질문

In [28]:
from langchain_core.prompts import PromptTemplate

prompt_template = PromptTemplate.from_template(
    "{topic}에 대한 {adjective} 이야기를 들려주세요."
)

llmModelPrompt = prompt_template.format(
    topic="케네디 가족",
    adjective="호기심 나는" 

)

llmModel.invoke(llmModelPrompt)

'\n\n존 F. 케네디는 미국의 경제학자이며, 케네디 가족의 조상인 존 F. 케네디와 그의 아내 로즈 엘리자베스 피츠제럴드의 아들로 태어났습니다. 그는 하버드 대학교와 런던스쿨 오브 에코노믹스에서 경제학을 공부하고, 미국의 최초의 민간 경제 연구 기관인 미국 경제 연구소를 설립했습니다.\n\n존 F. 케네디는 1934년에 로스앤젤레스에서 결혼한 아내 로즈와 함께 9명의 자녀를 두었습니다. 그 중 가장 유명한 것은 미국의 35번째 대통령 존 F. 케'

In [29]:
from langchain_core.prompts import ChatPromptTemplate

chat_template = ChatPromptTemplate.from_messages(
    [
        ("system", "당신은 {topic}의 {profession} 전문가입니다."),
        ("human", "안녕하세요, {profession} 님, 이 질문에 답해 주시겠습니까?"),
        ("ai", "물론입니다!"),
        ("human", "{user_input}"),
    ]
)

messages = chat_template.format_messages(
    profession="역사가",
    topic="케네디 가족",
    user_input="조셉 P. 케네디의 손자는 몇 명이었습니까?"
)

response = chatModel.invoke(messages)

In [30]:
print(response.content)

조셉 P. 케네디는 세 아들, 즉 존 F. 케네디, 로버트 F. 케네디, 에드워드 M. 케네디를 두었고, 이들 각각은 자녀를 둡니다. 따라서 조셉 P. 케네디의 손자는 여러 명이 있습니다.

소속된 가족의 세부 사항을 말씀드리면:

1. **존 F. 케네디**는 세 자녀가 있습니다: 캐롤라인, 존(JFK Jr.), 패트릭.
2. **로버트 F. 케네디**는 11명의 자녀를 두었습니다.
3. **에드워드 M. 케네디**는 3명의 자녀가 있습니다.

따라서 조셉 P. 케네디의 손자들은 총 17명 이상입니다. 정확한 수치는 가족 내 개인적인 상황에 따라 달라질 수 있습니다. 추가로 궁금한 점이 있다면 말씀해 주세요!


## 프롬프팅 기본 전략

* Zero Shot Prompt: "이 리뷰의 감정을 분류하세요."
* Few Shot Prompt: "이러한 예시를 바탕으로 이 리뷰의 감정을 분류하세요."
* Chain Of Thought Prompt: "이러한 예시와 추론에 대한 설명을 기반으로 이 리뷰의 감정을 분류하십시오."

## Few Shot Prompting

In [31]:
from langchain_core.prompts import FewShotChatMessagePromptTemplate

In [32]:
examples = [
    {"input": "hi!", "output": "¡hola!"},
    {"input": "bye!", "output": "¡adiós!"},
]

example_prompt = ChatPromptTemplate.from_messages(
    [
        ("human", "{input}"),
        ("ai", "{output}"),
    ]
)

few_shot_prompt = FewShotChatMessagePromptTemplate(
    example_prompt=example_prompt,
    examples=examples,
)

final_prompt = ChatPromptTemplate.from_messages(
    [
        ("system", "You are an English-Spanish translator."),
        few_shot_prompt,
        ("human", "{input}"),
    ]
)

In [33]:
messages = final_prompt.format_messages(
    input="historian"
)

response = chatModel.invoke(messages)

In [34]:
response.content

'historiador'

# Chains
* 여러 작업을 특정 순서로 수행합니다.

In [35]:
chain = final_prompt | chatModel

chain.invoke({"input": "Who was JFK?"})

AIMessage(content="John F. Kennedy, commonly referred to as JFK, was the 35th President of the United States, serving from January 20, 1961, until his assassination on November 22, 1963. He was born on May 29, 1917, in Brookline, Massachusetts. Kennedy was a member of the Democratic Party and the first Catholic president in U.S. history.\n\nHis presidency is notable for several key events and policies, including the Cuban Missile Crisis, the establishment of the Peace Corps, and efforts towards civil rights legislation. JFK's vision for America included the goal of landing a man on the Moon, which ultimately became a reality in 1969. His assassination in Dallas, Texas, marked a tragic and pivotal moment in U.S. history and has been the subject of extensive investigation and numerous conspiracy theories.", additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 170, 'prompt_tokens': 50, 'total_tokens': 220, 'completion_tokens_details': {'accepted_pre

# Ouput Parser
* LLM의 응답 형식 지정

## 출력 파싱
* 언어 모델은 텍스트를 출력합니다. 때로는 JSON 사전이나 XML 문서와 같이 다른 형식으로 답변을 원할 수 있습니다. 이를 위해 Output Parsers를 사용합니다.

In [36]:
from langchain_core.prompts import PromptTemplate
from langchain.output_parsers.json import SimpleJsonOutputParser

json_prompt = PromptTemplate.from_template(
    "다음 질문 : {question} 에 답하는 `answer` 키가 포함된 JSON 객체를 반환합니다."
)

json_parser = SimpleJsonOutputParser()

json_chain = json_prompt | llmModel | json_parser

#### 이전 프롬프트 템플릿에는 parser 지침이 포함되어 있습니다.

In [37]:
json_parser.get_format_instructions()

'Return a JSON object.'

In [38]:
json_chain.invoke({"question": "가장 큰 나라는 어디인가요?"})

{'answer': '러시아'}

#### Pydantic을 사용하여 사용자 정의 출력 형식을 정의할 수 있습니다.
* Pydantic은 데이터 검증과 설정 관리를 위한 Python 라이브러리입니다.
* 데이터 모델을 정의할 때 Python 타입 힌트를 활용하여 유효성 검사(Validation)와 Parsing을 자동으로 수행해 줍니다.

In [39]:
from langchain_core.output_parsers import JsonOutputParser
from langchain_core.prompts import PromptTemplate
from pydantic import BaseModel, Field
from langchain_openai import ChatOpenAI

In [40]:
# 원하는 출력 형식으로 Pydantic 객체를 정의
class Joke(BaseModel):
    setup: str = Field(description="농담을 설정하는 질문")
    punchline: str = Field(description="농담을 해결하는 답변")

In [41]:
# Pydantic 객체를 참조하는 parser 정의
parser = JsonOutputParser(pydantic_object=Joke)

# 프롬프트 정의에 parser format instruction을 추가
prompt = PromptTemplate(
    template="사용자 query에 답변합니다.\n{format_instructions}\n{query}\n",
    input_variables=["query"],
    partial_variables={"format_instructions": parser.get_format_instructions()},
)

# 프롬프트와 파서로 체인 구성
chain = prompt | chatModel | parser

chain.invoke({"query": "재미있는 농담을 들려주세요."})

{'setup': '왜 컴퓨터는 바다에서 수영을 하지 않나요?',
 'punchline': "왜냐하면 그들이 만나는 모든 물고기를 '바이러스'라고 부르기 때문이죠!"}