# LangSmith API Key 로드

In [1]:
from dotenv import load_dotenv

load_dotenv()

True

# LangSmith 추적 설정

In [2]:
import os

os.environ["LANGCHAIN_TRACING_V2"] = "true"
os.environ["LANGCHAIN_PROJECT"] = "ChatOpenAI"

# ChatOpenAI

## invoke

모델이 요청된 텍스트에 대한 전체 응답을 생성한 후 최종결과를 한 번에 반환합니다. 

결과를 반환해야 langsmith의 project에서 결과를 확인할 수 있습니다.

응답이 짧고 실시간으로 받을 필요가 없는 경우에 사용합니다.

In [3]:
from langchain_openai import ChatOpenAI

# 객체 생성
llm = ChatOpenAI(
    temperature=0.1, # 창의성 (0.0 ~ 2.0)
    model_name="gpt-4o")

# 질의 내용
# question = "대한민국의 수도는 어디인가요?"
question = "대한민국이 올림픽을 개최한 해는 언제일까요?"

# 응답 내용
response = llm.invoke(question)
print(response)

content='대한민국은 1988년에 서울에서 하계 올림픽을 개최했습니다.' additional_kwargs={'refusal': None} response_metadata={'token_usage': {'completion_tokens': 18, 'prompt_tokens': 22, 'total_tokens': 40, 'completion_tokens_details': {'audio_tokens': None, 'reasoning_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': None, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-2024-08-06', 'system_fingerprint': 'fp_a20a4ee344', 'finish_reason': 'stop', 'logprobs': None} id='run-0a6e3db3-2e3c-46ba-874e-be8ed2a887fa-0' usage_metadata={'input_tokens': 22, 'output_tokens': 18, 'total_tokens': 40, 'input_token_details': {'cache_read': 0}, 'output_token_details': {'reasoning': 0}}


# LogProb 활성화

주어진 텍스트에 대한 모델의 토큰 확률의 로그 값 을 의미합니다. 

확률은 모델이 그 토큰을 예측할 확률을 나타냅니다.

## bind

주어진 함수들을 OpenAI 모델에 연결하고, OpenAI의 함수 호출 API를 사용하여 특정 함수를 호출(function_call)하는 기능을 설정하는 역할을 합니다. 

이 방식은 Deprecated(사용 중단 예정) 상태입니다.

In [5]:
# 객체 생성
llm_with_logprob = ChatOpenAI(
    temperature=0.1, # 창의성(0.0 ~ 0.2)
    max_tokens=2048, # 최대 토큰 수
    model_name="gpt-3.5-turbo", # 모델명
).bind(logprobs=True)

In [6]:
# 질의내용
question = "대한민국의 수도는 어디인가요?"

# 응답내용
response = llm_with_logprob.invoke(question)

In [7]:
# 결과 출력
response.response_metadata

{'token_usage': {'completion_tokens': 15,
  'prompt_tokens': 24,
  'total_tokens': 39,
  'completion_tokens_details': {'audio_tokens': None, 'reasoning_tokens': 0},
  'prompt_tokens_details': {'audio_tokens': None, 'cached_tokens': 0}},
 'model_name': 'gpt-3.5-turbo-0125',
 'system_fingerprint': None,
 'finish_reason': 'stop',
 'logprobs': {'content': [{'token': '대',
    'bytes': [235, 140, 128],
    'logprob': -0.022742305,
    'top_logprobs': []},
   {'token': '한',
    'bytes': [237, 149, 156],
    'logprob': -3.1281633e-07,
    'top_logprobs': []},
   {'token': '\\xeb\\xaf',
    'bytes': [235, 175],
    'logprob': -1.8624639e-06,
    'top_logprobs': []},
   {'token': '\\xbc', 'bytes': [188], 'logprob': 0.0, 'top_logprobs': []},
   {'token': '\\xea\\xb5',
    'bytes': [234, 181],
    'logprob': -3.1281633e-07,
    'top_logprobs': []},
   {'token': '\\xad', 'bytes': [173], 'logprob': 0.0, 'top_logprobs': []},
   {'token': '의',
    'bytes': [236, 157, 152],
    'logprob': -4.1273333e-0

# 스트리밍 출력

스트리밍 옵션은 질의에 대한 답변을 실시간으로 받을 때 유용합니다.

In [8]:
# 스트림 방식으로 질의
# answer 에 스트리밍 답변의 결과를 받습니다.
answer = llm.stream("대한민국의 아름다운 관광지 10곳과 주소를 알려주세요!")

# print(answer)

In [9]:
# 스트리밍 방식으로 각 토큰을 출력합니다. (실시간 출력)
from utils.messages import stream_response
# def stream_response(answer):
#     for token in answer:
#         print(token.content, end="", flush=True)
    
stream_response(answer)

대한민국에는 아름다운 관광지가 많이 있습니다. 아래는 그 중 10곳과 해당 주소입니다.

1. **경복궁**
   - 주소: 서울특별시 종로구 사직로 161

2. **부산 해운대 해수욕장**
   - 주소: 부산광역시 해운대구 우동

3. **제주 성산일출봉**
   - 주소: 제주특별자치도 서귀포시 성산읍 일출로 284-12

4. **경주 불국사**
   - 주소: 경상북도 경주시 불국로 385

5. **설악산 국립공원**
   - 주소: 강원도 속초시 설악산로 833

6. **전주 한옥마을**
   - 주소: 전라북도 전주시 완산구 기린대로 99

7. **남이섬**
   - 주소: 강원도 춘천시 남산면 남이섬길 1

8. **안동 하회마을**
   - 주소: 경상북도 안동시 풍천면 전서로 186

9. **서울 남산타워 (N서울타워)**
   - 주소: 서울특별시 용산구 남산공원길 105

10. **순천만 습지**
    - 주소: 전라남도 순천시 순천만길 513-25

이곳들은 각기 다른 매력을 가지고 있어 다양한 경험을 제공할 것입니다. 여행 계획에 참고하시기 바랍니다!