#### 환경변수 확인

In [1]:
from dotenv import load_dotenv
import sys

sys.path.append("../common")
load_dotenv()

True

### ChatOpenAI

OpenAI 사의 채팅 전용 Large Language Model(LLM) 입니다.
객체를 생성할때 필요한 매개변수는 다음과 같습니다.

`temperature`
- 사용할 샘플링의 온도는 0.0 ~ 2.0 사이의 값을 가지며, 0.0 이면 창의성이 없고, 2.0 이면 창의성이 높아집니다.  

`model_name: 모델명`  
- gpt-4o
- gpt-3.5-turbo  

`max_tokens: 최대 토큰수`  
- 채팅 완성에서 생성할 토큰의 최대 개수입니다.

In [None]:
from dotenv import load_dotenv
import os

# .env 파일 로드
load_dotenv()


env_vars = {
    "OPENAI_API_KEY": os.getenv("OPENAI_API_KEY"),
    "LANGCHAIN_TRACING_V2": os.getenv("LANGCHAIN_TRACING_V2"),
    "LANGCHAIN_ENDPOINT": os.getenv("LANGCHAIN_ENDPOINT"),
    "LANGCHAIN_API_KEY": os.getenv("LANGCHAIN_API_KEY"),
    "LANGCHAIN_PROJECT": os.getenv("LANGCHAIN_PROJECT"),
}
print(env_vars)

In [3]:
import os
from langsmith_logging import langsmith

# 인스턴스를 생성할 때 필요한 매개변수를 전달합니다.
langsmith(project_name=os.getenv("LANGCHAIN_PROJECT"))

Langsmith 추적이 활성화되었습니다. [프로젝트명: langchain_note_2024]


In [None]:
ChatOpenAI?

In [None]:
from langchain_openai import ChatOpenAI

# 객체 생성
llm = ChatOpenAI(
    temperature=0.1,  # 창의성 (0.0 ~ 2.0)
    model_name="gpt-4o",  # 모델명
)

# 질의내용
question = "대한민국의 수도는 어디인가요?"

# 질의
print(f"[답변]: {llm.invoke(question)}")

In [None]:
# 질의내용
question = "대한민국의 수도는 어디인가요?"

# 질의
response = llm.invoke(question)

response

In [None]:
response.content

In [None]:
response.response_metadata

#### LogProb 활성화
토큰: 문장을 구성하는 작은 단위로, 단어나 글자 같은 요소. 예를 들어, "안녕하세요"라는 문장이 있을 때, 이 문장을 여러 개의 토큰으로 나눌 수 있다.  
확률: 인공지능 모델이 각 토큰을 예상할 확률을 의미 예를 들어, 모델이 "안녕" 다음에 올 단어로 "하세요"를 예상할 때, "하세요"가 나올 가능성에 대한 확률을 말한다.  
로그 값: 이 확률을 다루기 쉽게 만들기 위해 **로그(logarithm)**라는 수학적인 변환을 하는 것인데, 보통 아주 작은 숫자를 더 쉽게 다루기 위해 사용된다.  

In [None]:
# 객체 생성
llm_with_logprob = ChatOpenAI(
    temperature=0.1,  # 창의성 (0.0 ~ 2.0)
    max_tokens=2048,  # 최대 토큰수
    model_name="gpt-3.5-turbo",  # 모델명
).bind(logprobs=True)

# 질의내용
question = "대한민국의 수도는 어디인가요?"

# 질의
response = llm_with_logprob.invoke(question)

# 결과 출력
response.response_metadata

#### 스트리밍 출력
질의의 대한 답변을 실시간으로 받는 것

In [None]:
# 스트림 방식으로 질의
# answer 에 스트리밍 답변의 결과를 받습니다.
answer = llm.stream("서울에서 가을에 산책하기 좋은 장소는? (10곳 추천)")

# 스트리밍 방식으로 각 토큰을 출력합니다. (실시간 출력)
for token in answer:
    print(token.content, end="", flush=True)

#### 멀티모달 모델(이미지 인식)
"모달(modal)"은 보통 "모드(mode)" 또는 "형태(form)"라는 의미를 지니며, **멀티 모달(multimodal)** 에서 "모달"은 정보나 데이터를 전달하는 다양한 형태나 방식을 뜻 함

멀티모달의 뜻은 여러가지 형태의 정보를 통합하여 처리하는 기술이나 접근 방식

- 텍스트: 문서, 책, 웹 페이지 등의 글자로 된 정보  
- 이미지: 사진, 그래픽, 그림 등 시각적 정보  
- 오디오: 음성, 음악, 소리 효과 등의 청각적 정보  
- 비디오: 동영상 클립, 실시간 스트리밍 등 시각적 및 청각적 정보의 결합  

In [None]:
from langchain_openai import ChatOpenAI
from multimodal import MultiModal

# 객체 생성
llm = ChatOpenAI(
    temperature=0.1,  # 창의성 (0.0 ~ 2.0)
    max_tokens=2048,  # 최대 토큰수
    model_name="gpt-4o",  # 모델명
)

multimodal_llm = MultiModal(llm)

IMAGE = ("../images/sample.png", "image")

# 로컬 PC 에 저장되어 있는 이미지의 경로 입력
IMAGE_PATH_FROM_FILE = "../images/sample.png"

# 이미지 파일로 부터 질의(스트림 방식)
answer = multimodal_llm.stream(IMAGE_PATH_FROM_FILE)

# 스트리밍 방식으로 각 토큰을 출력
for token in answer:
    print(token.content, end="", flush=True)

In [None]:
from langchain_openai import ChatOpenAI
from multimodal import MultiModal

# 객체 생성
llm = ChatOpenAI(
    temperature=0.1,  # 창의성 (0.0 ~ 2.0)
    max_tokens=2048,  # 최대 토큰수
    model_name="gpt-4o",  # 모델명
)

system_prompt = """당신은 UI/UX를 디자인하는 기획 AI 어시스턴트 입니다. 
당신의 임무는 주어진 화면을 바탕으로 보안되어야 할 점들을 찾아 친절하게 답변하는 것입니다."""

user_prompt = """당신에게 주어진 이미지는 웹 디자인 화면입니다. 좀 더 개선되었으면 하는 것을 알려주세요."""

multimodal_llm = MultiModal(llm, system_prompt, user_prompt)

IMAGE = ("../images/sample.png", "image")

# 로컬 PC 에 저장되어 있는 이미지의 경로 입력
IMAGE_PATH_FROM_FILE = "../images/sample.png"

# 이미지 파일로 부터 질의(스트림 방식)
answer = multimodal_llm.stream(IMAGE_PATH_FROM_FILE)

# 스트리밍 방식으로 각 토큰을 출력
for token in answer:
    print(token.content, end="", flush=True)