In [None]:
# LangChain 개요
# LangChain은 LLM 애플리케이션 개발 프레임워크이다.

# LangChain의 다양한 컴포넌트를 제공하는 패키지 그룹
# 1. langchain-core
# LangChain의 기반이 되는 추상화와 LangChain Expression Language(LCEL)를 제공하는 패키지

# 2. partners(langchain-openai 등)와 langchain-community
# LangChain에는 OpenAI나 Anthropic 등의 언어 모델을 비롯해 다양한 서비스나 OSS와의 통합이 구현되어 있다.
# langchain-core가 제공하는 추상 기본 클래스에 대한 구현 클래스를 설치해서 사용한다.
# partners 패키지로 독립되지 않은 각종 통합에 대해서는 langchain-community라는 패키지에서 함께 제공된다.

# langchain·langchain-text-splitters·langchain-experimental
# langchain 패키지는 LLM 애플리케이션의 특정 유스케이스에 특화된 기능을 제공한다.
# 또한  LangChain의 기능 중 텍스트를 '청크'라고 불리는 단위로 분할하는 Text splitter라는 기능은
# langchain-text-splitters라는 별도의 패키지로 제공한다.
# 연구·실험 목적의 코드나 알려진 취약점(CVE)을 포함하는 코드는 langchain-experimental이라는 패키지로 분리됨.

In [None]:
# LangChain 설치
!pip install langchain-core==0.3.0 langchain-openai==0.2.0 pydantic==2.9.2

Collecting langchain-core==0.3.0
  Downloading langchain_core-0.3.0-py3-none-any.whl.metadata (6.2 kB)
Collecting langchain-openai==0.2.0
  Downloading langchain_openai-0.2.0-py3-none-any.whl.metadata (2.6 kB)
Collecting pydantic==2.9.2
  Downloading pydantic-2.9.2-py3-none-any.whl.metadata (149 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m149.4/149.4 kB[0m [31m3.0 MB/s[0m eta [36m0:00:00[0m
Collecting langsmith<0.2.0,>=0.1.117 (from langchain-core==0.3.0)
  Downloading langsmith-0.1.147-py3-none-any.whl.metadata (14 kB)
Collecting packaging<25,>=23.2 (from langchain-core==0.3.0)
  Downloading packaging-24.2-py3-none-any.whl.metadata (3.2 kB)
Collecting pydantic-core==2.23.4 (from pydantic==2.9.2)
  Downloading pydantic_core-2.23.4-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (6.6 kB)
Downloading langchain_core-0.3.0-py3-none-any.whl (405 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m405.1/405.1 kB[0m [31m10.9 MB/s

In [None]:
import os
from google.colab import userdata

# LangSmith 설정
os.environ['LANGCHAIN_TRACING_V2'] = "true"
os.environ['LANGCHAIN_ENDPOINT'] = "https://api.smith.langchain.com"
os.environ['LANGCHAIN_API_KEY'] = userdata.get('LANGCHAIN_API_KEY')
os.environ['LANGCHAIN_PROJECT'] = "default"

os.environ['OPENAI_API_KEY'] = userdata.get('OPENAI_API_KEY')

In [None]:
# LangChain의 주요 컴포넌트 개요
# 1. LLM/Chat model: 다양한 언어 모델과의 통합
# 2. Prompt template: 프롬프트의 템플릿
# 3. Example selector: Few-shot 프롬프팅의 예시를 동적으로 선택
# 4. Output parser: 언어 모델의 출력을 지정한 형식으로 변환
# 5. Chain: 각종 컴포넌트를 사용한 처리의 연쇄
# 6. Document loader: 데이터 소스에서 문서를 읽어 들임
# 7. Document transformer: 문서에 어떤 변환을 가함
# 8. Embedding model: 문서를 벡터화함
# 9. Vector store: 벡터화한 문서의 저장소
# 10. Retriever: 입력 텍스트와 관련된 문서를 검색
# 11. Tool: Function calling 등에서 모델이 사용하는 함수를 추상화
# 12. Toolkit: 함께 사용하는 것을 가정한 Tool의 컬렉션
# 13. Chat history: 대화 이력의 저장소로서의 각종 데이터베이스와의 통합

In [None]:
# LLM/Chat model - Completions API
from langchain_openai import ChatOpenAI

model = OpenAI(model="gpt-3.5-turbo-instruct", temperature=0)
output = model.invoke("안녕하세요.")
print(output)

ModuleNotFoundError: No module named 'langchain_openai'

In [None]:
# LLM/Chat model - Chat Completions API
from langchain_core.messages import AIMessage, HumanMessage, SystemMessage
from langchain_openai import ChatOpenAI

model = ChatOpenAI(model="gpt-4o-mini", temperature=0)

messages = [
    # "role": "system"
    SystemMessage("You are a helpful assistant."),
    # "role": "user"
    HumanMessage("안녕하세요! 저는 Edward라고 합니다."),
    # "role": "assistent"
    AIMessage(content="안녕하세요, Edward님! 어떤 도움이 필요하신가요?"),
    # "role": "user"
    HumanMessage(content="제 이름을 아시나요?")
]

ai_message = model.invoke(messages)

print(ai_message.content)

네, Edward님이라고 말씀하셨습니다. 어떻게 도와드릴까요?
[SystemMessage(content='You are a helpful assistant.', additional_kwargs={}, response_metadata={}), HumanMessage(content='안녕하세요! 저는 Edward라고 합니다.', additional_kwargs={}, response_metadata={}), AIMessage(content='안녕하세요, Edward님! 어떤 도움이 필요하신가요?', additional_kwargs={}, response_metadata={}), HumanMessage(content='제 이름을 아시나요?', additional_kwargs={}, response_metadata={})]


In [None]:
# 스트리밍 응답
from langchain_core.messages import AIMessage, HumanMessage, SystemMessage
from langchain_openai import ChatOpenAI

model = ChatOpenAI(model="gpt-4o-mini", temperature=0)

messages = [
    SystemMessage("You are a helpful assistant."),
    HumanMessage("안녕하세요!")
]

for chunk in model.stream(messages):
  print(chunk.content, end="", flush=True)

# 참고로, LangChain에서는 Callback 기능을 사용하여 스트리밍 구현 가능
# 처리 시작(on_llm_start)
# 새로운 토큰 생성(on_llm_new_token)
# LLM 처리 종료(on_llm_end)

안녕하세요! 어떻게 도와드릴까요?

In [None]:
# PromptTemplate
from langchain_core.prompts import ChatPromptTemplate

prompt = ChatPromptTemplate.from_messages(
    [
        ("system", "사용자가 입력한 요리의 레시피를 생각해 주세요."),
        ("human",  "{dish}")
    ]
)

prompt_value = prompt.invoke({"dish": "카레"})
print(prompt_value)

messages=[SystemMessage(content='사용자가 입력한 요리의 레시피를 생각해 주세요.', additional_kwargs={}, response_metadata={}), HumanMessage(content='카레', additional_kwargs={}, response_metadata={})]


In [None]:
# MessagesPlaceholder
from langchain_core.messages import AIMessage, HumanMessage
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder

prompt = ChatPromptTemplate.from_messages(
    [
        ("system", "You are a helpful assistant."),
        MessagesPlaceholder("chat_history", optional=True),
        ("human", "{input}")
    ]
)

prompt_value = prompt.invoke(
    {
        "chat_history": [
            HumanMessage(content="안녕하세요! 저는 Edward라고 합니다."),
            AIMessage("안녕하세요, Edward님! 어떻게 도와드릴까요?")
        ],
        "input": "제 이름을 아시나요?",
    }
)
print(prompt_value)

messages=[SystemMessage(content='You are a helpful assistant.', additional_kwargs={}, response_metadata={}), HumanMessage(content='안녕하세요! 저는 Edward라고 합니다.', additional_kwargs={}, response_metadata={}), AIMessage(content='안녕하세요, Edward님! 어떻게 도와드릴까요?', additional_kwargs={}, response_metadata={}), HumanMessage(content='제 이름을 아시나요?', additional_kwargs={}, response_metadata={})]


In [None]:
# Output parser
# LLM에 특정 형식으로 출력하도록 하고, 그 출력을 프로그램적으로 다루고 싶은 경우가 있다.
# 이때 사용할 수 있는 것이 'Output parser'이다.
# Json 등의 출력 형식을 지정하는 프롬프트 작성과 응답 텍스트를 Python 객체로 변환하는 기능을 제공한다.

# Pydantic 모델로 정의한다.
from pydantic import BaseModel, Field

class Recipe(BaseModel):
  ingredients: list[str] = Field(description="ingredients of the dish")
  step:list[str] = Field(description="steps to make the dish")

# Recipe 클래스를 제공해 PydanticOutputParser를 생성한다.
from langchain_core.output_parsers import PydanticOutputParser

output_parser = PydanticOutputParser(pydantic_object=Recipe)

format_instructions = output_parser.get_format_instructions()

print(format_instructions)

# 이어서 format_instructions를 사용한 ChatPromptTemplate을 생성한다.
from langchain_core.prompts import ChatPromptTemplate

prompt = ChatPromptTemplate.from_messages(
    [
        (
            "system",
            "사용자가 입력한 요리의 레시피를 생각해 주세요.\n\n"
            "{format_instructions}"
        ),
        ("human", "{dish}")
    ]
)

prompt_with_format_instructions = prompt.partial(
    format_instructions=format_instructions
)

prompt_value = prompt_with_format_instructions.invoke({"dish": "카레"})

print("=== role: system ===")
print(prompt_value.messages[0].content)
print("=== role: user ===")
print(prompt_value.messages[1].content)

print(prompt_value)

# 위 텍스트를 LLM의 입력으로 실행
from langchain_openai import ChatOpenAI

model = ChatOpenAI(model="gpt-4o-mini", temperature=0)
ai_message = model.invoke(prompt_value)

print(ai_message.content)

# Pydantic 모델의 인스턴스로 변환
recipe = output_parser.invoke(ai_message)

print(type(recipe))
print(recipe)

The output should be formatted as a JSON instance that conforms to the JSON schema below.

As an example, for the schema {"properties": {"foo": {"title": "Foo", "description": "a list of strings", "type": "array", "items": {"type": "string"}}}, "required": ["foo"]}
the object {"foo": ["bar", "baz"]} is a well-formatted instance of the schema. The object {"properties": {"foo": ["bar", "baz"]}} is not well-formatted.

Here is the output schema:
```
{"properties": {"ingredients": {"description": "ingredients of the dish", "items": {"type": "string"}, "title": "Ingredients", "type": "array"}, "step": {"description": "steps to make the dish", "items": {"type": "string"}, "title": "Step", "type": "array"}}, "required": ["ingredients", "step"]}
```
=== role: system ===
사용자가 입력한 요리의 레시피를 생각해 주세요.

The output should be formatted as a JSON instance that conforms to the JSON schema below.

As an example, for the schema {"properties": {"foo": {"title": "Foo", "description": "a list of strings", "t

In [None]:
# StrOutputParser
# LLM의 출력을 텍스트로 변환하는 데 사용한다.

from langchain_core.messages import AIMessage
from langchain_core.output_parsers import StrOutputParser

output_parser = StrOutputParser()

ai_message = AIMessage(content="안녕하세요. 저는 AI 어시스턴트입니다.")
ai_message = output_parser.invoke(ai_message)

print(type(ai_message))
print(ai_message)

<class 'str'>
안녕하세요. 저는 AI 어시스턴트입니다.


In [None]:
# Chain-LangChain Expression Language(LCEL)
# LCEL에서는 프롬프트나 LLM을 '|'로 연결하여 작성하고 처리의 연쇄(Chain)를 구현한다.

from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI

prompt = ChatPromptTemplate.from_messages(
    [
        ("system", "사용자가 입력한 요리의 레시피를 생각해 주세요."),
        ("human", "{dish}")
    ]
)

model = ChatOpenAI(model="gpt-4o-mini", temperature=0)

chain = prompt | model

ai_message = chain.invoke({"dish": "카레"})
print(ai_message.content)

카레는 다양한 재료와 향신료를 사용하여 만드는 맛있는 요리입니다. 아래는 기본적인 카레 레시피입니다.

### 재료
- 고기 (닭고기, 소고기, 돼지고기 등) 300g
- 양파 1개
- 감자 1개
- 당근 1개
- 카레 가루 2-3 큰술
- 코코넛 밀크 또는 물 2컵
- 식용유 2 큰술
- 소금, 후추 약간
- 마늘 2쪽 (다진 것)
- 생강 1 작은 조각 (다진 것)
- 선택 재료: 피망, 버섯, 완두콩 등

### 조리 방법
1. **재료 손질**: 고기는 한 입 크기로 자르고, 양파는 다지고, 감자와 당근은 깍둑썰기 합니다.

2. **양파 볶기**: 큰 냄비에 식용유를 두르고 중불에서 다진 양파를 넣고 투명해질 때까지 볶습니다.

3. **마늘과 생강 추가**: 다진 마늘과 생강을 넣고 향이 올라올 때까지 볶습니다.

4. **고기 추가**: 손질한 고기를 넣고 겉면이 익을 때까지 볶습니다.

5. **채소 추가**: 감자와 당근을 넣고 함께 볶습니다.

6. **카레 가루 추가**: 카레 가루를 넣고 잘 섞어줍니다. 이때 향신료의 향이 나기 시작합니다.

7. **액체 추가**: 코코넛 밀크 또는 물을 부어주고, 소금과 후추로 간을 맞춥니다.

8. **끓이기**: 끓어오르면 불을 줄이고 뚜껑을 덮고 20-30분 정도 끓입니다. 중간에 저어주면서 재료가 골고루 익도록 합니다.

9. **마무리**: 원하는 경우 마지막에 피망, 버섯, 완두콩 등을 추가하고 5분 정도 더 끓입니다.

10. **서빙**: 밥과 함께 따뜻하게 서빙합니다.

맛있게 드세요! 카레는 취향에 따라 다양한 재료와 향신료를 추가하여 변형할 수 있습니다.


In [None]:
# Chain-LangChain Expression Language(LCEL)
# StrOutputParser를 연결에 추가
from langchain_core.output_parsers import StrOutputParser

chain = prompt | model | StrOutputParser()

output = chain.invoke({"dish": "카레"})
print(output)

카레는 다양한 재료와 향신료를 사용하여 만드는 맛있는 요리입니다. 아래는 기본적인 카레 레시피입니다.

### 재료
- 고기 (닭고기, 소고기, 돼지고기 등) 300g
- 양파 1개
- 감자 1개
- 당근 1개
- 카레 가루 2-3 큰술
- 식용유 2 큰술
- 물 3컵
- 소금, 후추 약간
- 선택 재료: 피망, 버섯, 완두콩 등

### 조리 방법
1. **재료 손질**: 고기는 한 입 크기로 자르고, 양파는 다지고, 감자와 당근은 깍둑썰기 합니다.

2. **양파 볶기**: 큰 냄비에 식용유를 두르고 중불에서 다진 양파를 넣어 투명해질 때까지 볶습니다.

3. **고기 추가**: 양파가 볶아지면 고기를 넣고 겉면이 익을 때까지 볶습니다.

4. **채소 추가**: 감자와 당근을 넣고 함께 볶아줍니다.

5. **물 붓기**: 재료가 잘 섞이면 물을 붓고 끓입니다. 끓기 시작하면 불을 줄이고 중약불로 15-20분 정도 끓입니다.

6. **카레 가루 추가**: 카레 가루를 넣고 잘 섞은 후, 다시 10분 정도 끓입니다. 필요에 따라 소금과 후추로 간을 맞춥니다.

7. **완성**: 카레가 걸쭉해지면 불을 끄고, 밥과 함께 서빙합니다.

### 팁
- 카레는 시간이 지날수록 맛이 깊어지므로, 하루 정도 숙성시키면 더욱 맛있습니다.
- 다양한 채소나 해산물을 추가하여 나만의 카레를 만들어 보세요.

맛있게 드세요!


In [None]:
from langchain_core.output_parsers import PydanticOutputParser
from pydantic import BaseModel, Field

class Recipe(BaseModel):
  ingredients: list[str] = Field(description="ingredients of the dish")
  step: list[str] = Field(description="steps to make the dish")

output_parser = PydanticOutputParser(pydantic_object=Recipe)

from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI

prompt = ChatPromptTemplate.from_messages(
    [
        (
            "system",
            "사용자가 입력한 요리의 레시피를 생각해 주세요.\n\n{format_instructions}"
        ),
        ("human", "{dish}")
    ]
)

prompt_with_format_instructions = prompt.partial(
    format_instructions=output_parser.get_format_instructions()
)

model = ChatOpenAI(model="gpt-4o-mini", temperature=0)

chain = prompt_with_format_instructions | model | output_parser

recipe = chain.invoke({"dish": "카레"})
print(type(recipe))
print(recipe)

<class '__main__.Recipe'>
ingredients=['닭고기 500g', '양파 1개', '당근 1개', '감자 2개', '카레 가루 3큰술', '식용유 2큰술', '소금 약간', '후추 약간', '물 4컵'] step=['닭고기를 한 입 크기로 썰고, 소금과 후추로 간을 한다.', '양파, 당근, 감자를 깍둑썰기로 준비한다.', '팬에 식용유를 두르고 양파를 볶아 투명해질 때까지 볶는다.', '닭고기를 넣고 겉면이 익을 때까지 볶는다.', '당근과 감자를 넣고 함께 볶는다.', '물 4컵을 붓고 끓인다.', '끓기 시작하면 불을 줄이고 카레 가루를 넣는다.', '잘 섞은 후 중약불에서 20분 정도 끓인다.', '소스가 걸쭉해지면 불을 끄고, 밥과 함께 서빙한다.']
