# 01. LangChain

- `LangChain`은 언어 모델을 활용해 다양한 애플리케이션을 개발할 수 있는 프레임워크
  - 문맥을 인식하는 기능: `LangChain`은 언어 모델을 다양한 문맥 소스와 연결
    - 여기에는 프롬프트 지시사항, 소수의 예시, 응답에 근거한 내용 등이 포함
    - 이를 통해 언어 모델은 제공된 정보를 기반으로 더 정확하고 관련성 높은 답변을 생성
  - 추론하는 기능: 언어 모델은 주어진 문맥을 바탕으로 어떠한 답변을 제공하거나, 어떤 조치를 취해야 할지를 스스로 추론
    - 언어 모델이 단순히 정보를 재생산하는 것을 넘어서, 주어진 상황을 분석하고 적절한 해결책을 제시할 수 있음을 의미

<br>

### 설치

```bash
$ pip install -r https://raw.githubusercontent.com/teddylee777/langchain-kr/main/requirements.txt
```

<br>

### 구성
- [**LangChain 라이브러리**](https://python.langchain.com/v0.2/docs/introduction/) : Python 및 JavaScript 라이브러리. 다양한 컴포넌트의 인터페이스와 통합, 이러한 컴포넌트를 체인과 에이전트로 결합하는 기본 런타임, 그리고 즉시 사용 가능한 체인과 에이전트의 구현을 포함
- [**LangChain 템플릿**](https://templates.langchain.com/) : 다양한 작업을 위한 쉽게 배포할 수 있는 참조 아키텍처 모음
- [**LangServe**](https://github.com/langchain-ai/langserve) : LangChain 체인을 REST API로 배포하기 위한 라이브러리
- [**LangSmith**](https://smith.langchain.com/) : 어떤 LLM 프레임워크에도 구축된 체인을 디버그, 테스트, 평가, 모니터링할 수 있게 해주며 LangChain과 원활하게 통합되는 개발자 플랫폼
- [**LangGraph**](https://langchain-ai.github.io/langgraph/) : LLM을 사용한 상태유지가 가능한 다중 액터 애플리케이션을 구축하기 위한 라이브러리로, LangChain 위에 구축되었으며 LangChain과 함께 사용하도록 설계
  - 여러 계산 단계에서 다중 체인(또는 액터)을 순환 방식으로 조정할 수 있는 능력을 LangChain 표현 언어에 추가

<br>

### 개발 용이성

<br>

#### **컴포넌트의 조립 및 통합**
- LangChain은 언어 모델과의 작업을 위한 조립 가능한 도구 및 통합을 제공
- 컴포넌트는 모듈식으로 설계되어, 사용하기 쉬우며, 이는 개발자가 LangChain 프레임워크를 자유롭게 활용
  
#### **즉시 사용 가능한 체인**
- 고수준 작업을 수행하기 위한 컴포넌트의 내장 조합을 제공
- 이러한 체인은 개발 과정을 간소화하고 속도를 높임

<br>

### 주요 모듈

<br>

- **모델 I/O** : 프롬프트 관리, 최적화 및 LLM과의 일반적인 인터페이스와 작업을 위한 유틸리티를 포함
* **검색** : '데이터 강화 생성'에 초점을 맞춘 이 모듈은 생성 단계에서 필요한 데이터를 외부 데이터 소스에서 가져오는 작업을 담당
- **에이전트** : 언어 모델이 어떤 조치를 취할지 결정하고, 해당 조치를 실행하며, 관찰하고, 필요한 경우 반복하는 과정을 포함

<br>

<hr>

<br>



<br>

## 01-01. OpenAI AI 

<br>

### 1. OpenAI API 웹 사이트 : https://platform.openai.com/docs/overview
- Your profile

<img src='https://wikidocs.net/images/page/233342/capture-20240611-212254.png' width='500'>

- API Key 관리 메뉴 (https://platform.openai.com/api-keys) $\rightarrow$ Create new secret key

<img src='https://wikidocs.net/images/page/233342/capture-20240611-212634.png' width='500'>

- Name과 프로젝트 입력

<img src='https://wikidocs.net/images/page/233342/capture-20240611-212716.png' width='500'>

- Key Copy
  - 키가 유출되면 다른 사람이 내 API KEY 를 사용하여 GPT 를 사용할 수 있으며, 결제는 제 지갑에서 결제

<img src='https://wikidocs.net/images/page/233342/capture-20240611-212824.png' width='500'>

- 환경 (`.env`) 설정
  - 프로젝트 루트 디렉토리에 `.env` 파일을 생성
  - `.env` 파일에 방금복사한 키를 입력 한 뒤 저장
  
<img src='https://wikidocs.net/images/page/233342/capture-20240611-213141.png' width='500'>


<br>

- LangChain 업데이트

```bash
$ pip install -r https://raw.githubusercontent.com/teddylee777/langchain-kr/main/requirements.txt
```

In [4]:
from dotenv import load_dotenv

- API KEY 정보로드

In [5]:
load_dotenv()

True

- API Key 가 잘 설정되었는지 확인

In [6]:
import os

In [None]:
print(f"[API KEY]\n{os.environ['OPENAI_API_KEY']}")

<br>

<hr>

<br>

## 01-03. LangSmith 추적 설정

<br>

### LangSmith 추적 설정
- LangSmith는 LLM 애플리케이션 개발, 모니터링 및 테스트 를 위한 플랫폼
- 프로젝트나 LangChain 학습을 시작하시는 분들이라면 LangSmith는 꼭 설정 후 진행하는 것을 추천

#### LangSmith 추적 기능
- 추적은 LLM 애플리케이션의 동작을 이해하기 위한 강력한 도구
- LangSmith는 LangChain 사용 여부와 관계없이 동급 최고의 추적 기능을 제공
- 추적은 다음과 같은 문제를 추적하는 데 도움
  - 예상치 못한 최종 결과
  - 에이전트가 루핑되는 이유
  - 체인이 예상보다 느린 이유
  - 에이전트가 각 단계에서 사용한 토큰 수

<br>

#### 프로젝트 단위 추적
- 프로젝트 단위로 실행 카운트, Error 발생률, 토큰 사용량, 과금 정보등을 확인 가능

<img src='https://wikidocs.net/images/page/250954/capture-20240617-192525.png' width='500'>

<img src='https://wikidocs.net/images/page/250954/capture-20240617-193239.png' width='500'>

<br>

- 1개의 실행에 대한 세부 단계별 추적
  - 1개의 실행을 한 뒤 retrieve 된 문서의 검색 결과 뿐만 아니라, GPT 의 입출력 내용에 대해서 자세하게 기록
     
    $\rightarrow$ 문서의 검색된 내용을 확인 후 검색 알고리즘을 변경해야할지 혹은 프롬프트를 변경해야할지 판단하는데 도움

  - 상단에는 1개의 실행(Run) 이 걸린 시간(약 30초)와 사용된 토큰(5,104) 등이 표기가 되고, 토큰에 마우스 호버를 하게 되면 청구 금액까지 표기
  
<img src='https://wikidocs.net/images/page/250954/capture-20240617-192921.png' width='500'>

<br>

### LangSmith 추적 사용

<br>

#### LangSmith API Key 발급

1. https://smith.langchain.com 으로 접속
2. 가입후 이메일 인증
3. 왼쪽 톱니바퀴(Setting) - 가운데 "Personal" - "Create API Key" 를 눌러 API 키를 발급

<img src='https://wikidocs.net/images/page/250954/capture-20240617-194107.png' width='500'>

<img src='https://wikidocs.net/images/page/250954/capture-20240617-194249.png' width='500'>

<img src='https://wikidocs.net/images/page/250954/capture-20240617-194345.png' width='500'>

<br>

#### `.env` 에 LangSmith 키 설정
1. `.env` 파일에 LangSmith 에서 발급받은 키와 프로젝트 정보를 입력
  - `LANGCHAIN_TRACING_V2`: "true" 로 설정하면 추적을 시작
  - `LANGCHAIN_ENDPOINT`: https://api.smith.langchain.com 
  - `LANGCHAIN_API_KEY`: 이전 단계에서 발급받은 키 를 입력
  - `LANGCHAIN_PROJECT`: 프로젝트 명 을 기입하면 해당 프로젝트 그룹으로 모든 실행(Run) 이 추적

<img src='https://wikidocs.net/images/page/250954/capture-20240617-193540.png' width='500'>

<br>

### Jupyter Notebook 혹은 코드에서 추적을 활성화
- .env 에 설정한 내용을 불러옴



In [7]:
load_dotenv()

True

<br>

- 혹은 직접 설정

```python
import os

os.environ["LANGCHAIN_TRACING_V2"] = "true"
os.environ["LANGCHAIN_ENDPOINT"] = "https://api.smith.langchain.com"
os.environ["LANGCHAIN_PROJECT"] = "LangChain 프로젝트명"
os.environ["LANGCHAIN_API_KEY"] = "LangChain API KEY 입력"

```

<br>

## 01-04. OpenAI API

<br>

- `temperature` : 사용할 샘플링 온도는 0과 2 사이에서 선택 
  - 0.8과 같은 높은 값은 출력을 더 무작위하게 만들고, 0.2와 같은 낮은 값은 출력을 더 집중되고 결정론적으로
  
- `max_tokens` : 채팅 완성에서 생성할 토큰의 최대 개수
- `model_name` : [적용 가능한 모델](https://platform.openai.com/docs/pricing)

In [6]:
from langchain_openai import ChatOpenAI
from langsmith import Client

In [None]:
llm = ChatOpenAI(
    temperature=0.1,  # 창의성 (0.0 ~ 2.0)
    model_name="gpt-4o"
)

question = "대한민국의 수도는 어디인가요?"
llm.invoke(question)

In [None]:
# LangSmith 클라이언트 생성
client = Client()

# 가장 최근 실행(run) 불러오기
runs = client.list_runs(project_name="langsmith-openai", limit=1)
run = next(runs)

# 실행 메타데이터 확인
print("Run ID:", run.id)
print("입력:", run.inputs)
print("출력:", run.outputs)
print("실행 시간:", run.end_time - run.start_time)
print("토큰 사용량:", run.extra.get("usage"))

Run ID: eff473cc-48f0-4196-89b6-cd062ae2e5df
입력: {'messages': [[{'lc': 1, 'type': 'constructor', 'id': ['langchain', 'schema', 'messages', 'HumanMessage'], 'kwargs': {'content': '대한민국의 수도는 어디인가요?', 'type': 'human'}}]]}
출력: {'generations': [[{'text': '대한민국의 수도는 서울입니다.', 'generation_info': {'finish_reason': 'stop', 'logprobs': None}, 'type': 'ChatGeneration', 'message': {'lc': 1, 'type': 'constructor', 'id': ['langchain', 'schema', 'messages', 'AIMessage'], 'kwargs': {'content': '대한민국의 수도는 서울입니다.', 'additional_kwargs': {'refusal': None}, 'response_metadata': {'token_usage': {'completion_tokens': 8, 'prompt_tokens': 16, 'total_tokens': 24, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-2024-08-06', 'system_fingerprint': 'fp_f33640a400', 'id': 'chatcmpl-CLgvyzD8FdU6wKtDEU9TWr99BWNt6', 'service_tier': 'default', 

<br>

### 답변의 형식(AI Message)

In [16]:
# 질의내용
question = "대한민국의 수도는 어디인가요?"

# 질의
response = llm.invoke(question)
response

AIMessage(content='대한민국의 수도는 서울입니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 8, 'prompt_tokens': 16, 'total_tokens': 24, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-2024-08-06', 'system_fingerprint': 'fp_f33640a400', 'id': 'chatcmpl-CLgy6onUVYLXv4q58xLIueHioefW3', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--318fea6a-f906-4794-9345-c93b511ebf00-0', usage_metadata={'input_tokens': 16, 'output_tokens': 8, 'total_tokens': 24, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

In [18]:
response.content

'대한민국의 수도는 서울입니다.'

In [19]:
response.response_metadata

{'token_usage': {'completion_tokens': 8,
  'prompt_tokens': 16,
  'total_tokens': 24,
  'completion_tokens_details': {'accepted_prediction_tokens': 0,
   'audio_tokens': 0,
   'reasoning_tokens': 0,
   'rejected_prediction_tokens': 0},
  'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}},
 'model_name': 'gpt-4o-2024-08-06',
 'system_fingerprint': 'fp_f33640a400',
 'id': 'chatcmpl-CLgy6onUVYLXv4q58xLIueHioefW3',
 'service_tier': 'default',
 'finish_reason': 'stop',
 'logprobs': None}

<br>

### LogProb 활성화
- 주어진 텍스트에 대한 모델의 **토큰 확률의 로그 값** 을 의미
- 토큰이란 문장을 구성하는 개별 단어나 문자 등의 요소를 의미하고, **확률은 모델이 그 토큰을 예측할 확률**을 나타냄

In [20]:
llm_with_logprob = ChatOpenAI(
    temperature=0.1,  # 창의성 (0.0 ~ 2.0)
    max_tokens=2048,  # 최대 토큰수
    model_name="gpt-4o-mini",  # 모델명
).bind(logprobs=True)

In [21]:
question = "대한민국의 수도는 어디인가요?"
response = llm_with_logprob.invoke(question)

In [22]:
response.response_metadata

{'token_usage': {'completion_tokens': 8,
  'prompt_tokens': 16,
  'total_tokens': 24,
  'completion_tokens_details': {'accepted_prediction_tokens': 0,
   'audio_tokens': 0,
   'reasoning_tokens': 0,
   'rejected_prediction_tokens': 0},
  'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}},
 'model_name': 'gpt-4o-mini-2024-07-18',
 'system_fingerprint': 'fp_560af6e559',
 'id': 'chatcmpl-CLgzER7uGylaAKaOQ7PdrGKKaia2G',
 'service_tier': 'default',
 'finish_reason': 'stop',
 'logprobs': {'content': [{'token': '대한',
    'bytes': [235, 140, 128, 237, 149, 156],
    'logprob': -3.845798710244708e-05,
    'top_logprobs': []},
   {'token': '민국',
    'bytes': [235, 175, 188, 234, 181, 173],
    'logprob': -6.704273118884885e-07,
    'top_logprobs': []},
   {'token': '의',
    'bytes': [236, 157, 152],
    'logprob': -2.7968066206085496e-05,
    'top_logprobs': []},
   {'token': ' 수도',
    'bytes': [32, 236, 136, 152, 235, 143, 132],
    'logprob': -4.0126840758603066e-05,
    'top_l

<br>

### 스트리밍 출력
- 스트리밍 옵션은 질의에 대한 답변을 실시간으로 받을 때 유용

In [23]:
answer = llm.stream("대한민국의 아름다운 관광지 10곳과 주소를 알려주세요!")

In [24]:
for token in answer:
    print(token.content, end="", flush=True)

대한민국에는 아름다운 관광지가 많이 있습니다. 아래는 그 중 10곳과 해당 주소입니다.

1. **경복궁**
   - 주소: 서울특별시 종로구 사직로 161

2. **부산 해운대 해수욕장**
   - 주소: 부산광역시 해운대구 우동

3. **제주 성산일출봉**
   - 주소: 제주특별자치도 서귀포시 성산읍 일출로 284-12

4. **경주 불국사**
   - 주소: 경상북도 경주시 불국로 385

5. **설악산 국립공원**
   - 주소: 강원도 속초시 설악산로 833

6. **전주 한옥마을**
   - 주소: 전라북도 전주시 완산구 기린대로 99

7. **남이섬**
   - 주소: 강원도 춘천시 남산면 남이섬길 1

8. **안동 하회마을**
   - 주소: 경상북도 안동시 풍천면 전서로 186

9. **서울 남산타워 (N서울타워)**
   - 주소: 서울특별시 용산구 남산공원길 105

10. **순천만 습지**
    - 주소: 전라남도 순천시 순천만길 513-25

이곳들은 각기 다른 매력을 가지고 있어 다양한 경험을 제공할 것입니다. 여행 계획에 참고하시기 바랍니다!

<br>

### 멀티모달 모델(이미지 인식)
- 멀티모달은 여러 가지 형태의 정보(모달)를 통합하여 처리하는 기술이나 접근 방식을 의미
  - 텍스트: 문서, 책, 웹 페이지 등의 글자로 된 정보
  - 이미지: 사진, 그래픽, 그림 등 시각적 정보
  - 오디오: 음성, 음악, 소리 효과 등의 청각적 정보
  - 비디오: 동영상 클립, 실시간 스트리밍 등 시각적 및 청각적 정보의 결합


In [28]:
llm = ChatOpenAI(
    temperature=0.1,  # 창의성 (0.0 ~ 2.0)
    max_tokens=2048,  # 최대 토큰수
    model_name="gpt-4o",  # 모델명
)

In [30]:
IMAGE_URL = "https://t3.ftcdn.net/jpg/03/77/33/96/360_F_377339633_Rtv9I77sSmSNcev8bEcnVxTHrXB4nRJ5.jpg"

<img src='https://t3.ftcdn.net/jpg/03/77/33/96/360_F_377339633_Rtv9I77sSmSNcev8bEcnVxTHrXB4nRJ5.jpg' width='500'>

In [36]:
for chunk in llm.stream([
        {
            "role": "user",
            "content": [
                {"type": "text", "text": "이 이미지를 보고 무엇이 보이는지 설명해줘."},
                {"type": "image_url", "image_url": {"url": IMAGE_URL}}
            ]
        }
    ]):
    
    if chunk.content:
        print(chunk.content, end="", flush=True)

이 이미지는 표 형식의 데이터 테이블입니다. 

- 표의 제목은 "TABLE 001: LOREM IPSUM DOLOR AMIS ENIMA ACCUMER TUNA"입니다.
- 표는 다섯 개의 열로 구성되어 있으며, 각 열의 제목은 "Loremis", "Amis terim", "Gato lepis", "Tortores"입니다.
- 각 행에는 다양한 데이터가 포함되어 있으며, 숫자, 백분율, "YES"/"NO", "N/A"와 같은 값들이 있습니다.
- 표 아래에는 작은 글씨로 된 설명문이 있습니다. 

이 표는 예시 데이터로 보이며, 실제 의미 있는 정보를 제공하지 않습니다.

<br>

### System, User 프롬프트 수정

In [37]:
system_prompt = """당신은 표(재무제표) 를 해석하는 금융 AI 어시스턴트 입니다. 
당신의 임무는 주어진 테이블 형식의 재무제표를 바탕으로 흥미로운 사실을 정리하여 친절하게 답변하는 것입니다."""

user_prompt = """당신에게 주어진 표는 회사의 재무제표 입니다. 흥미로운 사실을 정리하여 답변하세요."""

In [38]:
IMAGE_PATH_FROM_FILE = "https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202212/080345-661/kwon-01.png"

<img src='https://storage.googleapis.com/static.fastcampus.co.kr/prod/uploads/202212/080345-661/kwon-01.png' width='500'>

In [40]:
for chunk in llm.stream(
    [
        {"role": "system", "content": system_prompt},
        {
            "role": "user",
            "content": [
                {"type": "text", "text": user_prompt},
                {"type": "image_url", "image_url": {"url": IMAGE_PATH_FROM_FILE}}
            ]
        }
    ]):
    
    if chunk.content:
        print(chunk.content, end="", flush=True)

주어진 재무상태표를 분석해보면 다음과 같은 흥미로운 사실을 발견할 수 있습니다:

1. **유동자산 감소**: 
   - 제 19기(2019년) 유동자산은 8,349,633백만원으로, 제 18기(2018년) 8,602,837백만원에 비해 감소했습니다. 이는 현금 및 현금성 자산의 감소가 주요 원인으로 보입니다.

2. **현금 및 현금성 자산 감소**:
   - 제 19기에는 1,002,263백만원으로, 제 18기 1,690,862백만원에 비해 크게 감소했습니다. 이는 회사의 유동성에 영향을 미칠 수 있습니다.

3. **매출채권 감소**:
   - 매출채권은 제 19기에 3,981,935백만원으로, 제 18기 4,004,920백만원에 비해 소폭 감소했습니다.

4. **기타유동자산 증가**:
   - 제 19기 기타유동자산은 207,596백만원으로, 제 18기 156,538백만원에 비해 증가했습니다. 이는 회사의 단기 자산 관리 전략 변화로 볼 수 있습니다.

5. **비유동자산 증가**:
   - 비유동자산은 제 19기에 18,677,453백만원으로, 제 18기 15,127,741백만원에 비해 크게 증가했습니다. 이는 장기적인 투자나 자산 취득이 있었음을 시사합니다.

6. **재고자산 증가**:
   - 재고자산은 제 19기에 2,670,294백만원으로, 제 18기 2,426,364백만원에 비해 증가했습니다. 이는 생산 증가나 판매 감소의 가능성을 나타낼 수 있습니다.

이러한 변화들은 회사의 재무 전략이나 시장 상황에 따른 결과일 수 있으며, 추가적인 분석이 필요할 수 있습니다.

<br>

<hr>

<br>

## 01-05. LangChain Explression Language (LCEL)

<br>

### 프롬프트 + 모델 + 출력 파서
- 가장 기본적이고 일반적인 사용 사례는 prompt 템플릿과 모델을 함께 연결하는 것

<br>

### 프롬프트 템플릿의 활용
- 사용자의 입력 변수를 사용하여 완전한 프롬프트 문자열을 만드는 데 사용되는 템플릿
  - `template`: 템플릿 문자열. 이 문자열 내에서 중괄호 {}는 변수
  - `input_variables`: 중괄호 안에 들어갈 변수의 이름을 리스트로 정의



In [41]:
from langchain_core.prompts import PromptTemplate

- `from_template()` 메소드를 사용하여 `PromptTemplate` 객체 생성

In [42]:
# template 정의
template = "{country}의 수도는 어디인가요?"

# from_template 메소드를 이용하여 PromptTemplate 객체 생성
prompt_template = PromptTemplate.from_template(template)
prompt_template

PromptTemplate(input_variables=['country'], input_types={}, partial_variables={}, template='{country}의 수도는 어디인가요?')

In [None]:
# prompt 생성
prompt = prompt_template.format(country="대한민국")
prompt

'대한민국의 수도는 어디인가요?'

In [44]:
llm = ChatOpenAI(
    temperature=0.1,  # 창의성 (0.0 ~ 2.0)
    max_tokens=2048,  # 최대 토큰수
    model_name="gpt-4o",  # 모델명
)

<br>

### Chain 생성

<br>

#### LCEL(LangChain Expression Language)

<img src='https://wikidocs.net/images/page/233344/lcel.png' width='700'>

- LCEL을 사용하여 다양한 구성 요소를 단일 체인으로 결합
    - `|` 기호는 unix 파이프 연산자와 유사하며, 서로 다른 구성 요소를 연결하고 한 구성 요소의 출력을 다음 구성 요소의 입력으로 전달
  
```python
chain = prompt | model | output_parser

```

- 체인에서 사용자 입력은 프롬프트 템플릿으로 전달 $\rightarrow$ 프롬프트 템플릿 출력은 모델로 전달

In [None]:
# prompt 를 PromptTemplate 객체로 생성
prompt = PromptTemplate.from_template("{topic} 에 대해 쉽게 설명해주세요.")

model = ChatOpenAI()

chain = prompt | model

<br>

#### `invoke()`호출
- python 딕셔너리 형태로 입력값을 전달
- `invoke()` 함수 호출 시, 입력값을 전달

<br>

- input 딕셔너리에 주제를 설정

In [None]:
input = {"topic": "인공지능 모델의 학습 원리"}

- `prompt` 객체와 `model` 객체를 파이프(|) 연산자로 연결하고 `invoke` 메서드를 사용하여 `input`을 전달
  
  이를 통해 모델이 생성한 메시지를 반환합니다.

In [49]:
for chunk in chain.stream(input):
    if chunk.content:
        print(chunk.content, end="", flush=True)

인공지능 모델의 학습 원리는 데이터를 입력하여 모델이 일정한 패턴이나 규칙을 학습하는 과정입니다.

일반적으로 학습 과정은 다음과 같은 단계로 이루어집니다.

1. 데이터 수집: 학습에 필요한 데이터를 수집하고 준비합니다.

2. 데이터 전처리: 수집한 데이터를 모델에 입력할 수 있는 형태로 변환합니다.

3. 모델 구성: 학습하고자 하는 목표에 맞는 모델을 선택하고 구성합니다.

4. 모델 학습: 입력 데이터를 모델에 주고, 모델이 예측한 결과와 실제 결과를 비교하여 오차를 줄여나가는 과정을 반복합니다.

5. 모델 평가: 모델의 성능을 평가하고 필요에 따라 수정합니다.

6. 예측: 학습된 모델을 사용하여 새로운 데이터에 대한 예측을 수행합니다.

이러한 과정을 통해 인공지능 모델은 입력 데이터와 출력 데이터 사이의 패턴이나 규칙을 학습하여 원하는 작업을 수행할 수 있게 됩니다.

<br>

### 출력파서(Output Parser)

In [50]:
from langchain_core.output_parsers import StrOutputParser

In [51]:
output_parser = StrOutputParser()

- Chain 에 출력파서를 추가

In [52]:
chain = prompt | model | output_parser

- chain 객체의 invoke 메서드를 사용하여 input을 전달

In [None]:
input = {"topic": "인공지능 모델의 학습 원리"}

for chunk in chain.stream(input):
    if chunk:
        print(chunk, end="", flush=True)

인공지능 모델의 학습 원리는 데이터를 입력으로 받아서 패턴을 학습하는 과정입니다. 이 과정은 크게 입력층, 은닉층, 출력층으로 이루어진 신경망 구조를 사용합니다.

먼저, 입력층에서 모델에 데이터를 입력하면, 이 데이터는 은닉층을 거쳐 출력층으로 전달됩니다. 은닉층은 입력층의 데이터를 가중치와 활성화 함수를 통해 변환하고, 출력층은 최종 예측 값을 출력합니다.

이때, 모델은 예측 값과 실제 값 사이의 차이(오차)를 계산하고, 이 오차를 최소화하기 위해 가중치를 조정하는 과정을 반복합니다. 이때 가중치를 조정하는 방법은 역전파 알고리즘을 사용합니다. 역전파 알고리즘은 오차를 출력층부터 입력층으로 거꾸로 전파하면서 가중치를 업데이트하는 방법입니다.

이렇게 반복해서 모델이 데이터의 패턴을 학습하고, 최적의 가중치를 찾아내는 과정이 인공지능 모델의 학습 원리입니다.

<br>

### 템플릿을 변경하여 적용

In [58]:
template = """
당신은 영어를 가르치는 10년차 영어 선생님입니다. 상황에 [FORMAT]에 영어 회화를 작성해 주세요.

상황:
{question}

FORMAT:
- 영어 회화:
- 한글 해석:
"""

- 프롬프트 템플릿을 이용하여 프롬프트를 생성

In [57]:
prompt = PromptTemplate.from_template(template)

# ChatOpenAI 챗모델을 초기화
model = ChatOpenAI(model_name="gpt-4-turbo")

# 문자열 출력 파서를 초기화
output_parser = StrOutputParser()

- Chain 구성

In [59]:
chain = prompt | model | output_parser

In [60]:
answer = chain.stream({"question": "저는 식당에 가서 음식을 주문하고 싶어요"})

for chunk in answer:
    if chunk:
        print(chunk, end="", flush=True)

영어 회화:
- Hello, I'd like a table for one, please.
- Could I see the menu, please?
- I think I'm ready to order. I'll have the grilled chicken with vegetables.
- Could I get a glass of water as well, please?
- Thank you!

한글 해석:
- 안녕하세요, 혼자 사용할 테이블을 부탁합니다.
- 메뉴판 좀 볼 수 있을까요?
- 주문할게요. 그릴에 구운 닭고기와 야채를 주세요.
- 물 한 잔도 주실 수 있나요?
- 감사합니다!


<br>

<hr>

<br>

## 01-06. LCEL 인터페이스
- 사용자 정의 체인을 가능한 쉽게 만들 수 있도록, `Runnable` 프로토콜을 구현
- `Runnable` 프로토콜은 대부분의 컴포넌트에 구현되어 있음

<br>

- 사용자 정의 체인을 정의하고 표준 방식으로 호출하는 것을 쉽게 만들 수 있음

- **표준 인터페이스**
  - `stream` : 응답의 청크를 스트리밍
  - `invoke` : 입력에 대해 체인을 호출
  - `batch` : 입력 목록에 대해 체인을 호출

<br>

- **비동기 메소드**
  - `astream` : 비동기적으로 응답의 청크를 스트리밍
  - `ainvoke` : 비동기적으로 입력에 대해 체인을 호출
  - `abatch` : 비동기적으로 입력 목록에 대해 체인을 호출
  - `astream_log` : 최종 응답뿐만 아니라 발생하는 중간 단계를 스트리밍


<br>

- LCEL문법을 사용하여 chain 생성

In [62]:
model = ChatOpenAI(model="gpt-4o-mini")
prompt = PromptTemplate.from_template("{topic} 에 대하여 3문장으로 설명해줘.")
chain = prompt | model | StrOutputParser()

<br>

#### `stream`: 실시간 출력
- 이 함수는 `chain.stream` 메서드를 사용하여 주어진 토픽에 대한 데이터 스트림을 생성하고, 이 스트림을 반복하여 각 데이터의 내용(`content`)을 즉시 출력
- `end=""` 인자는 출력 후 줄바꿈을 하지 않도록 설정하며, `flush=True` 인자는 출력 버퍼를 즉시 비움

In [65]:
# chain.stream 메서드를 사용하여 '멀티모달' 토픽에 대한 스트림을 생성하고 반복
for token in chain.stream({"topic": "멀티모달"}):
    # 스트림에서 받은 데이터의 내용을 출력 
    # 줄바꿈 없이 이어서 출력하고, 버퍼를 즉시 비움
    print(token, end="", flush=True)

멀티모달은 여러 가지 유형의 데이터를 통합하여 처리하고 분석하는 접근 방식을 의미합니다. 예를 들어, 텍스트, 이미지, 오디오 등 다양한 형식을 동시에 고려하여 보다 풍부한 정보를 제공할 수 있습니다. 이러한 기술은 인공지능, 머신러닝, 자연어 처리 등에서 더욱 효과적이고 실용적인 결과를 얻기 위해 활용되고 있습니다.

<br>

#### `invoke`: 호출
- `chain` 객체의 `invoke` 메서드는 주제를 인자로 받아 해당 주제에 대한 처리를 수행

In [67]:
print(chain.invoke({"topic": "ChatGPT"}))

ChatGPT는 OpenAI에서 개발한 대화형 인공지능 모델로, 자연어 처리 기술을 기반으로 합니다. 사용자의 질문이나 요청에 대해 인간처럼 자연스러운 언어로 응답할 수 있도록 설계되었습니다. 학습된 데이터에 기반하여 다양한 주제에 대한 정보 제공 및 대화 지원이 가능합니다.


<br>

#### `batch`: 배치(단위 실행)
- 함수 `chain.batch`는 여러 개의 딕셔너리를 포함하는 리스트를 인자로 받아, 각 딕셔너리에 있는 `topic` 키의 값을 사용하여 일괄 처리를 수행


In [68]:
chain.batch(
    [
        {"topic": "ChatGPT"}, 
        {"topic": "Instagram"}
    ]
)

['ChatGPT는 OpenAI에서 개발한 대화형 인공지능 모델로, 자연어 처리 기술을 기반으로 사용자와의 대화를 생성합니다. 다양한 주제에 대한 질문에 응답하고, 정보 제공 및 대화 지원을 통해 사용자와 소통할 수 있습니다. 이 모델은 대규모 텍스트 데이터로 학습되어 높은 수준의 언어 이해와 생성 능력을 갖추고 있습니다.',
 '인스타그램은 사용자가 사진과 비디오를 공유할 수 있는 소셜 미디어 플랫폼입니다. 사용자는 다양한 필터와 편집 도구를 활용해 콘텐츠를 꾸미고, 다른 사용자와 상호작용하며 팔로우할 수 있습니다. 또한, 스토리 기능과 IGTV를 통해 일상적인 순간이나 긴 형식의 콘텐츠를 더욱 쉽게 공유할 수 있습니다.']

- **`max_concurrency` 매개변수를 사용하여 동시 요청 수를 설정**
  - `config` 딕셔너리는 `max_concurrency` 키를 통해 동시에 처리할 수 있는 최대 작업 수를 설정

In [69]:
chain.batch(
    [
        {"topic": "ChatGPT"},
        {"topic": "Instagram"},
        {"topic": "멀티모달"},
        {"topic": "프로그래밍"},
        {"topic": "머신러닝"},
    ],
    config={"max_concurrency": 3},
)

['ChatGPT는 OpenAI가 개발한 인공지능 언어 모델로, 자연어 처리 기술을 기반으로 사용자의 질문이나 요청에 대해 적절한 응답을 생성합니다. 이 모델은 방대한 양의 텍스트 데이터를 학습하여 다양한 주제에 대해 유용한 정보를 제공할 수 있습니다. 사용자와의 상호작용을 통해 질문에 답하거나 대화를 이어가는 능력을 가지고 있습니다.',
 '인스타그램은 사용자들이 사진과 동영상을 공유할 수 있는 소셜 미디어 플랫폼입니다. 사용자들은 다양한 필터와 편집 도구를 사용하여 콘텐츠를 꾸밀 수 있으며, 해시태그를 통해 관심 있는 주제를 탐색할 수 있습니다. 또한, 인스타그램은 친구와 소통할 수 있는 기능뿐만 아니라 브랜드와 기업들에게 마케팅 기회를 제공하는 중요한 플랫폼으로 성장했습니다.',
 '멀티모달은 다양한 형태의 데이터를 동시에 처리하고 분석하는 개념으로, 텍스트, 이미지, 음성 등 여러 유형의 정보가 결합되어 나타납니다. 이러한 방식은 데이터 간의 상호작용을 통해 보다 깊이 있는 이해를 가능하게 하며, 인공지능 모델들의 성능을 향상시킵니다. 예를 들어, 멀티모달 기술은 이미지 설명 생성, 감정 분석 및 추천 시스템 등 다양한 응용 분야에서 활용됩니다.',
 '프로그래밍은 컴퓨터가 수행할 수 있는 명령어를 작성하는 과정입니다. 이를 통해 다양한 소프트웨어와 애플리케이션을 개발할 수 있으며, 문제 해결 및 자동화를 가능하게 합니다. 프로그래밍 언어를 사용하여 코드로 표현하며, 논리적 사고와 창의력이 중요한 역할을 합니다.',
 '머신러닝은 데이터를 기반으로 패턴을 학습하고 예측을 수행하는 인공지능의 한 분야입니다. 알고리즘을 사용하여 경험을 통해 성능을 향상시키며, 지도학습, 비지도학습, 강화학습 등의 다양한 접근 방식을 포함합니다. 이를 통해 이미지 인식, 자연어 처리, 추천 시스템 등 다양한 응용 분야에서 활용되고 있습니다.']

<br>

#### `async stream`: 비동기 스트림
- 함수 `chain.astream`은 비동기 스트림을 생성하며, 주어진 토픽에 대한 메시지를 비동기적으로 처리
- 비동기 `for` 루프(`async for`)를 사용하여 스트림에서 메시지를 순차적으로 받아오고, print 함수를 통해 메시지의 내용(`s.content`)을 즉시 출력

In [70]:
async for token in chain.astream({"topic": "YouTube"}):
    print(token, end="", flush=True)

YouTube는 사용자들이 비디오를 업로드, 공유 및 시청할 수 있는 온라인 플랫폼입니다. 2005년에 설립된 이 플랫폼은 콘텐츠 제작자와 소비자 간의 소통과 창작의 장이 되어 다양한 주제의 영상이 포함되어 있습니다. 현재 YouTube는 세계에서 가장 큰 비디오 공유 사이트 중 하나로, 광고, 구독 및 슈퍼챗 등을 통해 수익을 창출하는 시스템을 운영하고 있습니다.

<br>

#### `async invoke`: 비동기 호출
- `chain` 객체의 `ainvoke` 메서드는 비동기적으로 주어진 인자를 사용하여 작업을 수행

In [71]:
my_process = chain.ainvoke({"topic": "NVDA"})
await my_process

'NVIDIA Corporation (NVDA)는 그래픽 처리 장치(GPU) 및 인공지능(AI) 기술의 선도적인 제조업체입니다. 게임, 데이터 센터, 자율주행차 등 다양한 분야에서 활용되는 고성능 칩셋을 개발하여, 컴퓨터 비전과 머신 러닝 분야에서 중요성을 잘 인정받고 있습니다. 최근에는 AI 기술의 발전으로 인해 NVIDIA의 제품 수요가 급증하며 주목받고 있습니다.'

<br>

#### `async batch`: 비동기 배치
- 함수 `abatch`는 비동기적으로 일련의 작업을 일괄 처리

In [72]:
my_abatch_process = chain.abatch(
    [{"topic": "YouTube"}, {"topic": "Instagram"}, {"topic": "Facebook"}]
)

await my_abatch_process

['YouTube는 사용자들이 동영상을 업로드, 공유 및 시청할 수 있는 세계 최대의 비디오 플랫폼입니다. 이 플랫폼은 다양한 콘텐츠, 즉 음악, 게임, 교육, 리뷰 등 여러 분야의 동영상을 제공하며, 크리에이터들이 광고 수익을 통해 수익을 창출할 수 있는 기회를 제공합니다. 또한, 사용자간의 소통을 장려하고, 좋아요, 댓글, 구독 등의 기능을 통해 커뮤니티 형성이 가능합니다.',
 'Instagram은 사용자가 사진과 동영상을 공유할 수 있는 소셜 미디어 플랫폼입니다. 다양한 필터와 편집 도구를 제공하여 사용자가 자신의 콘텐츠를 창의적으로 표현할 수 있도록 도와줍니다. 또한, 친구와의 소통뿐만 아니라, 관심사를 기반으로 한 다양한 콘텐츠를 탐색할 수 있는 기능도 제공합니다.',
 'Facebook은 2004년 마크 저커버그가 설립한 소셜 미디어 플랫폼으로, 사용자들이 친구 및 가족과 소통하고, 정보를 공유하며, 다양한 콘텐츠를 탐색할 수 있는 공간입니다. 사용자들은 개인 프로필을 만들고, 사진과 게시물을 공유하며, 그룹이나 페이지에 참여하여 관심 있는 주제에 대해 논의할 수 있습니다. 또한 Facebook은 광고 및 마케팅 도구를 제공하여 기업과 개인이 더 넓은 청중에게 다가갈 수 있도록 지원합니다.']

<br>

### Parallel: 병렬성
- `RunnableParallel` 클래스를 사용하여 이 두 체인을 키로 결합하여 동시에 실행할 수 있는 `combined` 객체를 생성

In [73]:
from langchain_core.runnables import RunnableParallel

- {country} 의 수도를 물어보는 체인

In [None]:
chain1 = (
    PromptTemplate.from_template("{country} 의 수도는 어디야?")
    | model
    | StrOutputParser()
)

- {country} 의 면적을 물어보는 체인

In [75]:
chain2 = (
    PromptTemplate.from_template("{country} 의 면적은 얼마야?")
    | model
    | StrOutputParser()
)

- 2개 체인을 동시에 생성하는 병렬 실행 체인을 생성

In [76]:
combined = RunnableParallel(capital=chain1, area=chain2)

In [77]:
chain1.invoke({"country": "대한민국"})

'대한민국의 수도는 서울입니다.'

In [78]:
chain2.invoke({"country": "미국"})

'미국의 총 면적은 약 9,826,675 평방 킬로미터(3,796,742 평방 마일)입니다. 이 면적에는 주와 영토가 모두 포함됩니다. 미국은 세계에서 세 번째로 큰 나라입니다.'

<br>

- `combined` 객체의 `invoke` 메서드는 주어진 country에 대한 처리를 수행

In [79]:
combined.invoke({"country": "대한민국"})

{'capital': '대한민국의 수도는 서울입니다.',
 'area': '대한민국의 면적은 약 100,210 평방킬로미터입니다. 이는 한반도의 남쪽에 위치한 지역의 규모를 나타내며, 다양한 지형과 자연환경을 포함하고 있습니다.'}

<br>

#### 배치에서의 병렬 처리
- `combined.batch` 함수는 주어진 데이터를 배치로 처리하는 데 사용

In [82]:
combined.batch([{"country": "대한민국"}, {"country": "미국"}])

[{'capital': '대한민국의 수도는 서울입니다.',
  'area': '대한민국의 면적은 약 100,210 평방킬로미터(약 38,691 평방 마일)입니다.'},
 {'capital': '미국의 수도는 워싱턴 D.C.입니다.',
  'area': '미국의 면적은 약 9,831,510 평방킬로미터(약 3,796,742 평방마일)입니다. 이는 세계에서 세 번째로 큰 나라로, 러시아와 캐나다에 이어서 면적이 가장 큰 국가입니다.'}]

<br>

<hr>

<br>

## 01-07. `Runnable`

<br>

### 데이터를 효과적으로 전달하는 방법
- `RunnablePassthrough` 는 입력을 변경하지 않거나 추가 키를 더하여 전달할 수 있음
- `RunnablePassthrough()` 가 단독으로 호출되면, 단순히 입력을 받아 그대로 전달
- `RunnablePassthrough.assign(...)` 방식으로 호출되면, 입력을 받아 assign 함수에 전달된 추가 인수를 추가

<br>

#### `RunnablePassthrough`

In [83]:
from langchain_core.prompts import PromptTemplate
from langchain_openai import ChatOpenAI

In [85]:
prompt = PromptTemplate.from_template("{num} 의 10배는?")
llm = ChatOpenAI(temperature=0, model='gpt-4o-mini')

chain = prompt | llm

- 1개의 변수만 템플릿에 포함하고 있다면, 값만 전달하는 것도 가능

In [None]:
chain.invoke({"num": 5})
# chain.invoke(5)

AIMessage(content='5의 10배는 50입니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 10, 'prompt_tokens': 14, 'total_tokens': 24, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_560af6e559', 'id': 'chatcmpl-CLjkxG1ASlQaTQsMkbMohaXazZGS6', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--10738ce4-79a1-48a2-89ec-cd2ccd0f6ad9-0', usage_metadata={'input_tokens': 14, 'output_tokens': 10, 'total_tokens': 24, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

<br>

- `RunnablePassthrough` 는 `runnable` 객체이며, `runnable` 객체는 `invoke()` 메소드를 사용하여 별도 실행이 가능

In [87]:
from langchain_core.runnables import RunnablePassthrough

In [88]:
# runnable
RunnablePassthrough().invoke({"num": 10})

{'num': 10}

* `RunnablePassthrough` 로 체인을 구성

In [89]:
runnable_chain = {"num": RunnablePassthrough()} | prompt | ChatOpenAI()

runnable_chain.invoke(10)

AIMessage(content='100', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 1, 'prompt_tokens': 16, 'total_tokens': 17, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'id': 'chatcmpl-CLjnhlTWN02pyhzeGGQgZRE36avaI', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--45f61073-72ea-41f0-9fb3-d59a7a5b4b5b-0', usage_metadata={'input_tokens': 16, 'output_tokens': 1, 'total_tokens': 17, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

- `RunnablePassthrough.assign()` 을 사용하는 경우

In [90]:
RunnablePassthrough().invoke({"num": 1})

{'num': 1}

In [91]:
(RunnablePassthrough.assign(new_num=lambda x: x["num"] * 3)).invoke({"num": 1})

{'num': 1, 'new_num': 3}

<br>

#### `RunnableParallel`

In [92]:
from langchain_core.runnables import RunnableParallel

- `RunnableParallel` 인스턴스를 생성
  - 이 인스턴스는 여러 `Runnable` 인스턴스를 병렬로 실행할 수 있음

In [95]:
runnable = RunnableParallel(
    # RunnablePassthrough 인스턴스를 'passed' 키워드 인자로 전달
    # 이는 입력된 데이터를 그대로 통과시키는 역할
    passed=RunnablePassthrough(),
    
    # 'extra' 키워드 인자로 RunnablePassthrough.assign을 사용하여, 'mult' 람다 함수를 할당
    # 이 함수는 입력된 딕셔너리의 'num' 키에 해당하는 값을 3배로 증가
    extra=RunnablePassthrough.assign(mult=lambda x: x["num"] * 3),
    
    # 'modified' 키워드 인자로 람다 함수를 전달
    # 이 함수는 입력된 딕셔너리의 'num' 키에 해당하는 값에 1을 더함
    modified=lambda x: x["num"] + 1,
)

- `runnable` 인스턴스에 `{'num': 1}` 딕셔너리를 입력으로 전달하여 `invoke` 메소드를 호출

In [96]:
runnable.invoke({"num": 1})

{'passed': {'num': 1}, 'extra': {'num': 1, 'mult': 3}, 'modified': 2}

<br>

#### `RunnableLambda`
- `RunnableLambda` 를 사용하여 사용자 정의 함수를 맵핑

In [97]:
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import PromptTemplate
from langchain_openai import ChatOpenAI
from datetime import datetime

In [99]:
def get_today(a):
    return datetime.today().strftime("%b-%d")

In [100]:
from langchain_core.runnables import RunnableLambda, RunnablePassthrough

In [107]:
prompt = PromptTemplate.from_template(
    "{today} 가 생일인 유명인 {n} 명을 나열하세요. 생년월일을 표기해 주세요."
)

llm = ChatOpenAI(temperature=0, model_name="gpt-4o")

- chain 생성

In [108]:
chain = (
    {"today": RunnableLambda(get_today), "n": RunnablePassthrough()}
    | prompt
    | llm
    | StrOutputParser()
)

In [109]:
print(chain.invoke(3))

10월 1일이 생일인 유명인 세 명은 다음과 같습니다.

1. 줄리 앤드류스 (Julie Andrews) - 1935년 10월 1일
2. 지미 카터 (Jimmy Carter) - 1924년 10월 1일
3. 자카리 레비 (Zachary Levi) - 1980년 10월 1일

이들은 각각 영화, 정치, 엔터테인먼트 분야에서 잘 알려진 인물들입니다.


<br>

- `itemgetter` 를 사용하여 특정 키를 추출

In [110]:
from operator import itemgetter

from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import RunnableLambda
from langchain_openai import ChatOpenAI

In [111]:
# 문장의 길이를 반환하는 함수
def length_function(text):
    return len(text)


# 두 문장의 길이를 곱한 값을 반환하는 함수
def _multiple_length_function(text1, text2):
    return len(text1) * len(text2)


# _multiple_length_function 함수를 사용하여 두 문장의 길이를 곱한 값을 반환하는 함수
def multiple_length_function(_dict):
    return _multiple_length_function(_dict["text1"], _dict["text2"])

In [112]:
prompt = ChatPromptTemplate.from_template("{a} + {b} 는 무엇인가요?")
model = ChatOpenAI()

chain1 = prompt | model

In [113]:
chain = (
    {
        "a": itemgetter("word1") | RunnableLambda(length_function),
        "b": {"text1": itemgetter("word1"), "text2": itemgetter("word2")}
        | RunnableLambda(multiple_length_function),
    }
    | prompt
    | model
)

In [114]:
chain.invoke({"word1": "hello", "word2": "world"})

AIMessage(content='5 + 25 = 30 입니다.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 10, 'prompt_tokens': 22, 'total_tokens': 32, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'id': 'chatcmpl-CLk4ybKrAnGXwSrgGU9ndeL729qZ9', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--cfd06bd9-0216-4550-a34a-6a935d7ca32f-0', usage_metadata={'input_tokens': 22, 'output_tokens': 10, 'total_tokens': 32, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})