## 랭스미스 추적 설정

LangSmith는 LLM 애플리케이션 개발, 모니터링 및 테스트 를 위한 플랫폼입니다. 프로젝트나 LangChain 학습을 시작하시는 분들이라면 LangSmith는 꼭 설정 후 진행하는 것을 추천 드립니다.

In [1]:
from dotenv import load_dotenv
load_dotenv()

import os
project_name = "langchain_basic"
os.environ["LANGSMITH_PROJECT"] = project_name

## ChatOpenAI

In [7]:
from langchain_openai import ChatOpenAI

model = ChatOpenAI(
    temperature=0.1, # 창의력 정도
    model = "gpt-4.1-mini",
    verbose=True,
)

In [None]:
question = "일년에 한국에 오는 관광객 수는?"
response = model.invoke(question)

In [12]:
response.response_metadata

{'token_usage': {'completion_tokens': 188,
  'prompt_tokens': 17,
  'total_tokens': 205,
  'completion_tokens_details': {'accepted_prediction_tokens': 0,
   'audio_tokens': 0,
   'reasoning_tokens': 0,
   'rejected_prediction_tokens': 0},
  'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}},
 'model_name': 'gpt-4.1-mini-2025-04-14',
 'system_fingerprint': 'fp_6d7dcc9a98',
 'id': 'chatcmpl-CLKAMaVTt3gl7dhhrv3H8BjVUIsco',
 'service_tier': 'default',
 'finish_reason': 'stop',
 'logprobs': None}

In [7]:
print(response)

content='한국을 방문하는 연간 관광객 수는 해마다 변동이 있지만, 최근 몇 년간의 데이터를 참고하면 대략적인 추이를 알 수 있습니다.\n\n- 2019년: 약 1,740만 명의 외국인 관광객이 한국을 방문했습니다. 이는 코로나19 팬데믹 이전의 최고 기록 중 하나입니다.\n- 2020년~2021년: 코로나19 팬데믹으로 인해 입국 제한과 여행 감소로 관광객 수가 크게 줄어들어 수백만 명 수준에 머물렀습니다.\n- 2022년 이후: 방역 완화와 국제 여행 재개로 관광객 수가 점차 회복되고 있습니다.\n\n정확한 최신 수치는 한국관광공사나 문화체육관광부의 공식 통계를 참고하는 것이 좋습니다. 필요하시면 최신 자료를 찾아드릴 수도 있습니다.' additional_kwargs={'refusal': None} response_metadata={'token_usage': {'completion_tokens': 188, 'prompt_tokens': 17, 'total_tokens': 205, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4.1-mini-2025-04-14', 'system_fingerprint': 'fp_6d7dcc9a98', 'id': 'chatcmpl-CLKAMaVTt3gl7dhhrv3H8BjVUIsco', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None} id='run--95512980-9ea5-43b4-addb-f1f4749b17ec-0' usage_metadata={'input_tokens': 17, 'output

In [8]:
print(response.content)

한국을 방문하는 연간 관광객 수는 해마다 변동이 있지만, 최근 몇 년간의 데이터를 참고하면 대략적인 추이를 알 수 있습니다.

- 2019년: 약 1,740만 명의 외국인 관광객이 한국을 방문했습니다. 이는 코로나19 팬데믹 이전의 최고 기록 중 하나입니다.
- 2020년~2021년: 코로나19 팬데믹으로 인해 입국 제한과 여행 감소로 관광객 수가 크게 줄어들어 수백만 명 수준에 머물렀습니다.
- 2022년 이후: 방역 완화와 국제 여행 재개로 관광객 수가 점차 회복되고 있습니다.

정확한 최신 수치는 한국관광공사나 문화체육관광부의 공식 통계를 참고하는 것이 좋습니다. 필요하시면 최신 자료를 찾아드릴 수도 있습니다.


### LogProb 활성화

주어진 텍스트에 대한 모델의 **토큰 확률의 로그 값** 을 의미합니다. 토큰이란 문장을 구성하는 개별 단어나 문자 등의 요소를 의미하고, 확률은 **모델이 그 토큰을 예측할 확률**을 나타냅니다.

In [3]:
from langchain_openai import ChatOpenAI

llm_with_logprob = ChatOpenAI(
    temperature=0.1,  # 창의성 (0.0 ~ 2.0)
    max_tokens=2048,  # 최대 토큰수
    model="gpt-4.1-mini",  # 모델명
).bind(logprobs=True)

In [4]:
# 질의내용
question = "대한민국의 수도는 어디인가요?"

# 질의
response = llm_with_logprob.invoke(question)

In [5]:
# 결과 출력
response.response_metadata

{'token_usage': {'completion_tokens': 11,
  'prompt_tokens': 16,
  'total_tokens': 27,
  'completion_tokens_details': {'accepted_prediction_tokens': 0,
   'audio_tokens': 0,
   'reasoning_tokens': 0,
   'rejected_prediction_tokens': 0},
  'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}},
 'model_name': 'gpt-4.1-mini-2025-04-14',
 'system_fingerprint': 'fp_c064fdde7c',
 'id': 'chatcmpl-CQuQTiYT8XJTOGPEWPP0vPjNbsKGa',
 'service_tier': 'default',
 'finish_reason': 'stop',
 'logprobs': {'content': [{'token': '대한',
    'bytes': [235, 140, 128, 237, 149, 156],
    'logprob': 0.0,
    'top_logprobs': []},
   {'token': '민국',
    'bytes': [235, 175, 188, 234, 181, 173],
    'logprob': -3.128163257315464e-07,
    'top_logprobs': []},
   {'token': '의',
    'bytes': [236, 157, 152],
    'logprob': -1.2664456789934775e-06,
    'top_logprobs': []},
   {'token': ' 수도',
    'bytes': [32, 236, 136, 152, 235, 143, 132],
    'logprob': -7.822646693966817e-06,
    'top_logprobs': []},
   

### 스트리밍 출력

In [8]:
answer = model.stream(question)

for token in answer:
    print(token.content, end="", flush=True)

대한민국의 수도는 서울특별시입니다.

## 멀티모달 모델(이미지 인식)

In [9]:
import base64, os

def encode_image_from_file(file_path):
        with open(file_path, "rb") as image_file:
            image_content = image_file.read()
            file_ext = os.path.splitext(file_path)[1].lower()
            if file_ext in [".jpg", ".jpeg"]:
                mime_type = "image/jpeg"
            elif file_ext == ".png":
                mime_type = "image/png"
            else:
                mime_type = "image/unknown"
            return f"data:{mime_type};base64,{base64.b64encode(image_content).decode('utf-8')}"

In [10]:
from langchain_openai import ChatOpenAI

model = ChatOpenAI(
    temperature=0.1, # 창의력 정도
    model = "gpt-4.1-mini",
    verbose=True,
)

In [11]:
encoded_image = encode_image_from_file("../data/tom.png")

In [12]:
system_prompt = ""
user_prompt = ""

In [14]:
result = model.invoke([
            {
                "role": "system",
                "content": system_prompt,
            },
            {
                "role": "user",
                "content": [
                    {
                        "type": "text",
                        "text": user_prompt,
                    },
                    {
                        "type": "image_url",
                        "image_url": {"url": f"{encoded_image}"},
                    },
                ],
            },
        ])

In [16]:
result.content

'This image depicts the classic cartoon characters Tom and Jerry. Tom, the gray cat, appears to be running away with a surprised or scared expression, while Jerry, the brown mouse, is chasing him with an angry or determined look. The background is a simple beige color, emphasizing the characters and their dynamic interaction. This scene captures the typical chase and comedic conflict that is central to the "Tom and Jerry" series.'