# 모델(LLM)

LLM(대규모 언어 모델)은 사람처럼 텍스트를 해석하고 생성할 수 있는 강력한 AI 도구입니다. 각 작업에 대한 전문적인 훈련 없이도 콘텐츠 작성, 언어 번역, 요약 및 질문 응답에 사용할 수 있습니다.

텍스트 생성 외에도 많은 모델이 다음을 지원합니다

- 도구 호출 - 외부 도구(데이터베이스 쿼리 또는 API 호출 등)를 호출하고 결과를 응답에 사용
- 구조화된 출력 - 모델의 응답이 정의된 형식을 따르도록 제한
- 멀티모달리티 - 이미지, 오디오, 비디오 등 텍스트가 아닌 데이터 처리 및 반환
- 추론 - 결론에 도달하기 위한 다단계 추론 수행

모델은 에이전트의 추론 엔진입니다. 에이전트의 의사 결정 프로세스를 주도하여 어떤 도구를 호출할지, 결과를 해석하는 방법, 최종 답변을 제공할 시기를 결정합니다.

## 환경 설정

In [None]:
from dotenv import load_dotenv
from langchain_teddynote import logging

# 환경 변수 로드
load_dotenv(override=True)
# 추적을 위한 프로젝트 이름 설정
logging.langsmith("LangChain-Advanced-Tutorial")

### 모델 (Model)

에이전트의 추론 엔진인 LLM 은 간단하게 `provider:model` 형식의 문자열로 지정할 수 있습니다.

In [None]:
from langchain.chat_models import init_chat_model

# 모델 식별자 문자열을 사용한 간단한 방법
model = init_chat_model("openai:gpt-4.1-mini")

하지만, 모델의 세부 설정을 위해서 다음과 같이 다양한 옵션을 사용할 수 있습니다.

In [None]:
from langchain.agents import create_agent
from langchain_openai import ChatOpenAI

# 모델 인스턴스를 직접 초기화하여 더 세밀한 제어
model = ChatOpenAI(
    model="gpt-4.1-mini",
    temperature=0.1,  # 응답의 무작위성 제어
    max_tokens=1000,  # 최대 생성 토큰 수
    timeout=30,  # 요청 타임아웃(초)
)

Anthropic 모델 사용 예시 (환경 변수가 `.env` 파일에 설정되어야 합니다.)

```
ANTHROPIC_API_KEY="sk-ant-api03-..."
```

In [None]:
from langchain.chat_models import init_chat_model

model = init_chat_model("anthropic:claude-sonnet-4-5")

### 그 밖에 지원되는 모델 제공자

| 제공자 | 패키지 |
|:---|:---|
| `openai` | [`langchain-openai`](https://docs.langchain.com/oss/python/integrations/providers/openai) |
| `anthropic` | [`langchain-anthropic`](https://docs.langchain.com/oss/python/integrations/providers/anthropic) |
| `azure_openai` | [`langchain-openai`](https://docs.langchain.com/oss/python/integrations/providers/openai) |
| `azure_ai` | [`langchain-azure-ai`](https://docs.langchain.com/oss/python/integrations/providers/microsoft) |
| `google_vertexai` | [`langchain-google-vertexai`](https://docs.langchain.com/oss/python/integrations/providers/google) |
| `google_genai` | [`langchain-google-genai`](https://docs.langchain.com/oss/python/integrations/providers/google) |
| `bedrock` | [`langchain-aws`](https://docs.langchain.com/oss/python/integrations/providers/aws) |
| `bedrock_converse` | [`langchain-aws`](https://docs.langchain.com/oss/python/integrations/providers/aws) |
| `cohere` | [`langchain-cohere`](https://docs.langchain.com/oss/python/integrations/providers/cohere) |
| `fireworks` | [`langchain-fireworks`](https://docs.langchain.com/oss/python/integrations/providers/fireworks) |
| `together` | [`langchain-together`](https://docs.langchain.com/oss/python/integrations/providers/together) |
| `mistralai` | [`langchain-mistralai`](https://docs.langchain.com/oss/python/integrations/providers/mistralai) |
| `huggingface` | [`langchain-huggingface`](https://docs.langchain.com/oss/python/integrations/providers/huggingface) |
| `groq` | [`langchain-groq`](https://docs.langchain.com/oss/python/integrations/providers/groq) |
| `ollama` | [`langchain-ollama`](https://docs.langchain.com/oss/python/integrations/providers/ollama) |
| `google_anthropic_vertex` | [`langchain-google-vertexai`](https://docs.langchain.com/oss/python/integrations/providers/google) |
| `deepseek` | [`langchain-deepseek`](https://docs.langchain.com/oss/python/integrations/providers/deepseek) |
| `ibm` | [`langchain-ibm`](https://docs.langchain.com/oss/python/integrations/providers/deepseek) |
| `nvidia` | [`langchain-nvidia-ai-endpoints`](https://docs.langchain.com/oss/python/integrations/providers/nvidia) |
| `xai` | [`langchain-xai`](https://docs.langchain.com/oss/python/integrations/providers/xai) |
| `perplexity` | [`langchain-perplexity`](https://docs.langchain.com/oss/python/integrations/providers/perplexity) |

## ChatOpenAI 클래스

OpenAI의 chat model API를 사용하기 위한 인터페이스입니다.

**주요 초기화 파라미터**

| 파라미터 | 타입 | 설명 |
|:---|:---|:---|
| `model` | `str` | 사용할 OpenAI 모델 이름 |
| `temperature` | `float` | 샘플링 온도 |
| `max_tokens` | `int \| None` | 생성할 최대 토큰 수 |
| `logprobs` | `bool \| None` | logprobs 반환 여부 |
| `stream_options` | `dict` | 스트리밍 출력 설정 (예: `{"include_usage": True}`) |
| `use_responses_api` | `bool \| None` | Responses API 사용 여부 |
| `timeout` | `float \| Tuple[float, float] \| Any \| None` | 요청 타임아웃 |
| `max_retries` | `int \| None` | 최대 재시도 횟수 |
| `api_key` | `str \| None` | OpenAI API 키 (미지정시 `OPENAI_API_KEY` 환경변수 사용) |
| `base_url` | `str \| None` | API 요청 base URL (proxy 또는 emulator 사용시) |
| `organization` | `str \| None` | OpenAI organization ID (미지정시 `OPENAI_ORG_ID` 환경변수 사용) |

In [None]:
from langchain_openai import ChatOpenAI

model = ChatOpenAI(
    model="gpt-4.1-mini",
    temperature=0,
    max_tokens=None,
    timeout=None,
    max_retries=2,
)

#### 메시지 호출

In [None]:
messages = [
    ("system", "You are a helpful assistant."),
    ("human", "대한민국의 수도는 어디야?"),
]
response = model.invoke(messages)
print(response)

In [None]:
response.content

In [None]:
response.usage_metadata

In [None]:
response.response_metadata

### 스트리밍(Streaming)

In [None]:
for chunk in model.stream(messages):
    print(chunk.content, end="")

좀 더 간단한 방식으로 `stream_response` 함수를 사용할 수 있습니다.

In [None]:
from langchain_teddynote.messages import stream_response

stream_response(model.stream(messages))

### 비동기 처리(Async)

In [None]:
# 비동기 호출
response = model.ainvoke(messages)
# 비동기 호출 대기
await response

In [None]:
# 비동기 스트리밍
async for chunk in model.astream(messages):
    print(chunk.content, end="")

### Batch

독립적인 요청 모음을 일괄 처리하면 처리가 병렬로 수행될 수 있으므로 다량의 데이터를 처리해야하는 상황에 유용합니다.

In [None]:
# 여러 요청을 일괄 처리
responses = model.batch(
    [
        "Why do parrots have colorful feathers?",
        "How do airplanes fly?",
        "What is quantum computing?",
    ]
)

for response in responses:
    print(response)
    print("---")

배치 중 작업이 완료되는대로 결과를 출력하는 `batch_as_completed` 메서드를 사용할 수 있습니다.

In [None]:
# 완료 시 일괄 응답 산출
for response in model.batch_as_acompleted(
    ["대한민국의 수도는 어디야?", "대한민국", "What is quantum computing?"]
):
    print(response)
    print("---")

### Tool Calling

`bind_tools` 도구를 binding 하거나, pydantic 모델을 사용하여 답변을 정형화 할 수 있습니다.

In [None]:
from pydantic import BaseModel, Field


class GetWeather(BaseModel):
    """Get the current weather in a given location"""

    location: str = Field(..., description="The city and state, e.g. San Francisco, CA")


model_with_tools = model.bind_tools([GetWeather])
response = model_with_tools.invoke("서울의 날씨는 어때?")
print(response)

In [None]:
# 도구 호출
response.tool_calls

### Structured Output

정형화된 답변 출력을 위해서는 `with_structured_output` 메서드를 사용을 권장합니다.

In [None]:
from pydantic import BaseModel, Field


class ResponseFormat(BaseModel):
    """답변 형식"""

    name: str = Field(description="Name of the person")
    email: str = Field(description="Email address of the person")
    phone: str | None = Field(description="Phone number of the person")


structured_model = model.with_structured_output(ResponseFormat)
result = structured_model.invoke(
    "다음의 정보로부터 답변을 출력하세요: 이름: 홍길동, 이메일: hong@example.com, 전화번호: 010-1234-5678"
)
result

### 토큰 사용량

많은 모델 제공자가 호출 응답의 일부로 토큰 사용량 정보를 반환합니다. 사용 가능한 경우 이 정보는 해당 모델이 생성한 AIMessage 객체에 포함됩니다.

In [None]:
from langchain.chat_models import init_chat_model
from langchain_core.callbacks import UsageMetadataCallbackHandler

model_1 = init_chat_model(model="openai:gpt-4.1-mini")
model_2 = init_chat_model(model="openai:gpt-4.1-nano")

# 콜백 핸들러를 사용하여 토큰 사용량 추적
callback = UsageMetadataCallbackHandler()

# config에 콜백 핸들러를 추가하여 토큰 사용량 추적
result_1 = model_1.invoke("Hello", config={"callbacks": [callback]})
result_2 = model_2.invoke("Hello", config={"callbacks": [callback]})

callback.usage_metadata

In [None]:
for i in range(3):
    model_1.invoke("Hello", config={"callbacks": [callback]})
    model_2.invoke("Hello", config={"callbacks": [callback]})

    print("토큰 사용량은 callback.usage_metadata에 누적됩니다.")
    print(callback.usage_metadata)

### 호출시 config 전달

모델을 호출할 때 `config` 매개변수를 통해 추가 구성을 전달할 수 있습니다. 이를 통해 실행 동작, 콜백 및 메타데이터 추적을 런타임에 제어할 수 있습니다.

In [None]:
# 구성을 사용한 호출
response = model.invoke(
    "안녕! 반가워.",
    config={
        "run_name": "greetings",  # 이 실행의 커스텀 이름
        "tags": ["hi", "hello"],  # 분류를 위한 태그
        "metadata": {"user_id": "teddy"},  # 커스텀 메타데이터
    },
)

print(response.content)

Trace 링크: https://smith.langchain.com/public/d610868a-266b-46d2-929d-5a09677c56ce/r

### 추론

최신 모델은 결론에 도달하기 위해 다단계 추론을 수행할 수 있습니다. 기본 모델에서 지원되는 경우 이 추론 프로세스를 표시하여 모델이 최종 답변에 도달한 방법을 더 잘 이해할 수 있습니다.

In [None]:
# 추론 출력 스트리밍
for chunk in model.stream("Why do parrots have colorful feathers?"):
    reasoning_steps = [r for r in chunk.content_blocks if r.get("type") == "reasoning"]
    if reasoning_steps:
        print(reasoning_steps)
    else:
        print(chunk.content)

## 멀티모달 LLM

image 를 입력으로 받는 모델을 생성합니다.

image 는 URL / 파일 경로 의 형식으로 제공할 수 있습니다.

In [None]:
from langchain_teddynote.models import MultiModal
from langchain_teddynote.messages import stream_response

llm = ChatOpenAI(
    temperature=0.1,
    model="gpt-4.1",  # 이미지 인식이 가능한 모델
)

# 멀티모달(이미지 + 텍스트 처리) 객체 생성
multimodal = MultiModal(llm)

In [None]:
# 웹상의 이미지 URL
IMAGE_URL = "https://wetalkotalk.oci.co.kr/images/sub/investment/graph_img_2022_kor.jpg"

# 웹 이미지를 직접 분석하여 스트리밍 응답 생성
answer = multimodal.stream(IMAGE_URL)

# 실시간으로 이미지 분석 결과 출력
stream_response(answer)

In [None]:
# 시스템 프롬프트: AI의 역할과 행동 방식을 정의
system_prompt = """You are a professional financial AI assistant specialized in analyzing financial statements and tables.
Your mission is to interpret given tabular financial data and provide insightful, interesting findings in a friendly and helpful manner.
Focus on key metrics, trends, and notable patterns that would be valuable for business analysis.

[IMPORTANT]
- 한글로 답변해 주세요.
"""

# 사용자 프롬프트: 구체적인 작업 지시사항
user_prompt = """Please analyze the financial statement provided in the image.
Identify and summarize the most interesting and important findings, including key financial metrics, trends, and insights that would be valuable for business decision-making."""

# 커스텀 프롬프트가 적용된 멀티모달 객체 생성
multimodal_llm_with_prompt = MultiModal(
    llm,
    system_prompt=system_prompt,  # 시스템 역할 정의
    user_prompt=user_prompt,  # 사용자 요청 정의
)

In [None]:
# 분석할 재무제표 이미지 URL
IMAGE_PATH_FROM_FILE = "https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202212/080345-661/kwon-01.png"

# 커스텀 프롬프트가 적용된 멀티모달 LLM으로 재무제표 분석
answer = multimodal_llm_with_prompt.stream(IMAGE_PATH_FROM_FILE)

# 재무제표 분석 결과를 실시간으로 출력
stream_response(answer)

### Logprobs

In [None]:
from langchain_teddynote.messages import extract_token_probabilities

logprobs_model = model.bind(logprobs=True)
logprobs_model = logprobs_model | extract_token_probabilities

In [None]:
logprobs_model.invoke("거짓으로 답변하세요. 대한민국의 수도는 어디인가요?")

### OpenAI 호환 API 사용

In [None]:
# LM Studio 예시
# model = ChatOpenAI(
#     base_url="http://localhost:1234/v1",
#     api_key="lm-studio",
#     model="mlx-community/QwQ-32B-4bit",
#     extra_body={"ttl": 300}
# )

# vLLM 예시
# model = ChatOpenAI(
#     base_url="http://localhost:8000/v1",
#     api_key="EMPTY",
#     model="meta-llama/Llama-2-7b-chat-hf",
#     extra_body={"use_beam_search": True, "best_of": 4}
# )

### 파라미터 구분

**`model_kwargs` 사용:**
* 표준 OpenAI API 파라미터
* 최상위 요청 payload에 병합되는 파라미터

**`extra_body` 사용:**
* OpenAI 호환 provider의 커스텀 파라미터
* `extra_body` 키 하위에 중첩되는 파라미터

In [None]:
# model_kwargs 예시
# model = ChatOpenAI(
#     model="gpt-4o",
#     model_kwargs={
#         "stream_options": {"include_usage": True},
#         "max_completion_tokens": 300,
#     }
# )

# extra_body 예시
# model = ChatOpenAI(
#     base_url="http://localhost:8000/v1",
#     extra_body={
#         "use_beam_search": True,
#         "best_of": 4,
#     }
# )