## 다양한 LLM활용방법

#### OpenAI(gpt-4o) - 1 OpenAI API 직접 활용, 2 LangChain활용
#### Anthropic(claude3.5-haiku) - 2 Anthropic API 직접활용,  2 LangChain활용
#### Ollama(오픈소스+로컬) - 1 Ollama API직접활용,  2 LangChain활용
#### Groq(오픈소스+로컬) - 1 Groq API 직접활용,  2 LangChain활용
#### 즉, 각각의 API 활용하거나, wrapping된 LangChain라이브러리 사용하거나 2가지 방법

### 1-1. OpenAI 라이브러리 활용 API호출

#### https://platform.openai.com/docs/guides/streaming-responses?api-mode=chat 참고

In [3]:
from openai import OpenAI

client = OpenAI()

stream = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "system", "content": "You are a helpful assistant"},
              {"role": "user", "content": "who is the president of the US?"}
             ],
    stream=True,
 )

for chunk in stream:
    if chunk.choices[0].delta.content is not None:
        print(chunk.choices[0].delta.content, end="")

As of my last knowledge update in October 2023, Joe Biden is the President of the United States. He took office on January 20, 2021. Please verify with a current source to ensure this information is still accurate.

In [4]:
response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "system", "content": "You are a helpful assistant"},
              {"role": "user", "content": "who is the president of the US?"}
             ]
)
response

ChatCompletion(id='chatcmpl-BZqR8mL5CTE91SdUGeEOUzL79Ir1o', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='As of my last update in October 2023, the President of the United States is Joe Biden. He took office on January 20, 2021. Please verify with a current source to ensure this information is still accurate, as my data may not reflect recent changes.', refusal=None, role='assistant', audio=None, function_call=None, tool_calls=None, annotations=[]))], created=1747882746, model='gpt-4o-mini-2024-07-18', object='chat.completion', service_tier='default', system_fingerprint='fp_54eb4bd693', usage=CompletionUsage(completion_tokens=56, prompt_tokens=24, total_tokens=80, completion_tokens_details=CompletionTokensDetails(accepted_prediction_tokens=0, audio_tokens=0, reasoning_tokens=0, rejected_prediction_tokens=0), prompt_tokens_details=PromptTokensDetails(audio_tokens=0, cached_tokens=0)))

In [5]:
response.dict()

{'id': 'chatcmpl-BZqR8mL5CTE91SdUGeEOUzL79Ir1o',
 'choices': [{'finish_reason': 'stop',
   'index': 0,
   'logprobs': None,
   'message': {'content': 'As of my last update in October 2023, the President of the United States is Joe Biden. He took office on January 20, 2021. Please verify with a current source to ensure this information is still accurate, as my data may not reflect recent changes.',
    'refusal': None,
    'role': 'assistant',
    'audio': None,
    'function_call': None,
    'tool_calls': None,
    'annotations': []}}],
 'created': 1747882746,
 'model': 'gpt-4o-mini-2024-07-18',
 'object': 'chat.completion',
 'service_tier': 'default',
 'system_fingerprint': 'fp_54eb4bd693',
 'usage': {'completion_tokens': 56,
  'prompt_tokens': 24,
  'total_tokens': 80,
  'completion_tokens_details': {'accepted_prediction_tokens': 0,
   'audio_tokens': 0,
   'reasoning_tokens': 0,
   'rejected_prediction_tokens': 0},
  'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}}

In [7]:
response.choices[0].message.content

'As of my last update in October 2023, the President of the United States is Joe Biden. He took office on January 20, 2021. Please verify with a current source to ensure this information is still accurate, as my data may not reflect recent changes.'

### 1-2. Langchain의 OpenAI API호출
#### Lnagchain에 wrapping된 OpenAI 라이브러리 활용 API호출
#### AIMessage는 Langchain에서 사용하는 표현 assistant message라고 보면 된다. 단일 메세지 다중 메세지 모두 처리 가능

In [12]:
from langchain_openai import ChatOpenAI

model = ChatOpenAI(model="gpt-4o-mini")

lo_resp = model.invoke("who is the president of the US?")
lo_resp

AIMessage(content='As of my last update in October 2023, the President of the United States is Joe Biden. He took office on January 20, 2021. Please verify with up-to-date sources to confirm if he is still the current president.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 50, 'prompt_tokens': 15, 'total_tokens': 65, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_54eb4bd693', 'finish_reason': 'stop', 'logprobs': None}, id='run-269897e1-2026-406b-853e-f04cc76ce76e-0', usage_metadata={'input_tokens': 15, 'output_tokens': 50, 'total_tokens': 65, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

In [13]:
lo_resp.content

'As of my last update in October 2023, the President of the United States is Joe Biden. He took office on January 20, 2021. Please verify with up-to-date sources to confirm if he is still the current president.'

#### AIMessage는 langchain에서 사용되는 객체
##### 다중메세지도 처리 가능

In [14]:
messages=[{"role": "system", "content": "You are a helpful assistant"},
              {"role": "user", "content": "who is the president of the US?"}
             ]

In [15]:
response = model.invoke(messages)
response

AIMessage(content='As of my last knowledge update in October 2023, the President of the United States is Joe Biden. He took office on January 20, 2021. Please verify with up-to-date sources, as my information may not reflect the latest developments.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 52, 'prompt_tokens': 24, 'total_tokens': 76, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_54eb4bd693', 'finish_reason': 'stop', 'logprobs': None}, id='run-3d88e561-ccb5-45ad-9990-d0036cf53b89-0', usage_metadata={'input_tokens': 24, 'output_tokens': 52, 'total_tokens': 76, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

#### openai와 dict의 구조가 약간 다르다. openai는 choice로 시작 langchain은 content부터 시작

In [16]:
response.dict()

{'content': 'As of my last knowledge update in October 2023, the President of the United States is Joe Biden. He took office on January 20, 2021. Please verify with up-to-date sources, as my information may not reflect the latest developments.',
 'additional_kwargs': {'refusal': None},
 'response_metadata': {'token_usage': {'completion_tokens': 52,
   'prompt_tokens': 24,
   'total_tokens': 76,
   'completion_tokens_details': {'accepted_prediction_tokens': 0,
    'audio_tokens': 0,
    'reasoning_tokens': 0,
    'rejected_prediction_tokens': 0},
   'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}},
  'model_name': 'gpt-4o-mini-2024-07-18',
  'system_fingerprint': 'fp_54eb4bd693',
  'finish_reason': 'stop',
  'logprobs': None},
 'type': 'ai',
 'name': None,
 'id': 'run-3d88e561-ccb5-45ad-9990-d0036cf53b89-0',
 'example': False,
 'tool_calls': [],
 'invalid_tool_calls': [],
 'usage_metadata': {'input_tokens': 24,
  'output_tokens': 52,
  'total_tokens': 76,
  'input_token

#### message의 내용출력

In [17]:
response.content

'As of my last knowledge update in October 2023, the President of the United States is Joe Biden. He took office on January 20, 2021. Please verify with up-to-date sources, as my information may not reflect the latest developments.'

#### 토큰의 사용량등을 표현하는 meta데이터도 출력가능하다

In [18]:
response.usage_metadata

{'input_tokens': 24,
 'output_tokens': 52,
 'total_tokens': 76,
 'input_token_details': {'audio': 0, 'cache_read': 0},
 'output_token_details': {'audio': 0, 'reasoning': 0}}

### 2-1. Anthropic 라이브러리 API호출
#### Anthropic 라이브러리 활용 API호출
#### https://docs.anthropic.com/en/docs/initial-setup

In [19]:
import anthropic

client = anthropic.Anthropic()

message = client.messages.create(
    model="claude-3-7-sonnet-20250219",
    max_tokens=1000,
    temperature=1,
    system="You are a world-class poet. Respond only with short poems.",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "Why is the ocean salty?"
                }
            ]
        }
    ]
)
print(message.content)


[TextBlock(citations=None, text="# Tears of Time\n\nEarth's ancient tears,\nMinerals dissolved through years,\nRivers carry tales to sea,\nSalt remains eternally.", type='text')]


In [20]:
message.dict()

{'id': 'msg_01PkzW19M53x8KHXGotm86hV',
 'content': [{'citations': None,
   'text': "# Tears of Time\n\nEarth's ancient tears,\nMinerals dissolved through years,\nRivers carry tales to sea,\nSalt remains eternally.",
   'type': 'text'}],
 'model': 'claude-3-7-sonnet-20250219',
 'role': 'assistant',
 'stop_reason': 'end_turn',
 'stop_sequence': None,
 'type': 'message',
 'usage': {'cache_creation_input_tokens': 0,
  'cache_read_input_tokens': 0,
  'input_tokens': 29,
  'output_tokens': 34}}

In [21]:
message.content[0].text

"# Tears of Time\n\nEarth's ancient tears,\nMinerals dissolved through years,\nRivers carry tales to sea,\nSalt remains eternally."

In [22]:
print(message.content[0].text)

# Tears of Time

Earth's ancient tears,
Minerals dissolved through years,
Rivers carry tales to sea,
Salt remains eternally.


### 2-2. Langchain의 Anthropic 라이브러리 API호출 v0.2 기준

In [23]:
from langchain_anthropic import ChatAnthropic

model = ChatAnthropic(model="claude-3-7-sonnet-20250219")

In [24]:
answer = model.invoke('Why is the ocean salty?')

In [25]:
answer.dict()

{'content': 'The ocean is salty primarily because of dissolved minerals that have been carried into it by rivers over billions of years. When rainwater flows over land, it weathers rocks and soil, picking up minerals like sodium and chloride (which form salt). These minerals accumulate in the oceans while the water cycles back into the atmosphere through evaporation, leaving the salt behind. Underwater volcanic activity and hydrothermal vents also contribute minerals to the ocean. Over time, this continuous process has resulted in our oceans containing about 35 grams of salt per liter of seawater on average.',
 'additional_kwargs': {},
 'response_metadata': {'id': 'msg_0155GXr7WZMjxxkKLPjk5YuL',
  'model': 'claude-3-7-sonnet-20250219',
  'stop_reason': 'end_turn',
  'stop_sequence': None,
  'usage': {'cache_creation_input_tokens': 0,
   'cache_read_input_tokens': 0,
   'input_tokens': 14,
   'output_tokens': 128}},
 'type': 'ai',
 'name': None,
 'id': 'run-b0097739-d7b8-4ff7-bdc7-b1f31

In [26]:
answer.content

'The ocean is salty primarily because of dissolved minerals that have been carried into it by rivers over billions of years. When rainwater flows over land, it weathers rocks and soil, picking up minerals like sodium and chloride (which form salt). These minerals accumulate in the oceans while the water cycles back into the atmosphere through evaporation, leaving the salt behind. Underwater volcanic activity and hydrothermal vents also contribute minerals to the ocean. Over time, this continuous process has resulted in our oceans containing about 35 grams of salt per liter of seawater on average.'

### 2-2. Langchain의 Anthropic 라이브러리 API호출 v0.3 기준

In [28]:
from langchain.chat_models import init_chat_model
model = init_chat_model("claude-3-7-sonnet-20250219", model_provider="anthropic")

In [29]:
model.invoke("Hello, world!")

AIMessage(content="Hello there! It's great to connect with you. How can I help you today? I'm ready to answer questions, have a conversation, or assist with information on a wide variety of topics. What would you like to talk about?", additional_kwargs={}, response_metadata={'id': 'msg_018K1hYfNMN1QmcEr6yc3Uh9', 'model': 'claude-3-7-sonnet-20250219', 'stop_reason': 'end_turn', 'stop_sequence': None, 'usage': {'cache_creation_input_tokens': 0, 'cache_read_input_tokens': 0, 'input_tokens': 11, 'output_tokens': 51}}, id='run-6d1861d9-5302-4d9e-835b-42e06f52ef08-0', usage_metadata={'input_tokens': 11, 'output_tokens': 51, 'total_tokens': 62, 'input_token_details': {'cache_read': 0, 'cache_creation': 0}})

#### OpenAI message형식을 그대로 사용하도록 wrapping되어 있다.
#### 즉, anthropic 자체에서는 system 메세지를 별도로 분리해두었지만 langchain에서는 통합하면서 그대로 사용하도록 되어 있다.

In [30]:
messages=[{"role": "system", "content": "You are a helpful assistant"},
              {"role": "user", "content": "who is the president of the US?"}
             ]

In [31]:
model.invoke(messages)

AIMessage(content='The current President of the United States is Joe Biden. He was inaugurated as the 46th President on January 20, 2021, following his victory in the 2020 presidential election.', additional_kwargs={}, response_metadata={'id': 'msg_01NxSro3B3RwysGvPdEjRxW2', 'model': 'claude-3-7-sonnet-20250219', 'stop_reason': 'end_turn', 'stop_sequence': None, 'usage': {'cache_creation_input_tokens': 0, 'cache_read_input_tokens': 0, 'input_tokens': 20, 'output_tokens': 45}}, id='run-4e66ca57-64fd-4f40-ae8b-48fcb6a2e222-0', usage_metadata={'input_tokens': 20, 'output_tokens': 45, 'total_tokens': 65, 'input_token_details': {'cache_read': 0, 'cache_creation': 0}})

### 3-1. Ollama를 이용한 로컬모델 사용방법

In [32]:
!ollama list

NAME               ID              SIZE      MODIFIED     
mistral:latest     f974a74358d6    4.1 GB    3 months ago    
llama3.2:latest    a80c4f17acd5    2.0 GB    3 months ago    


#### ollama내 모델을 사용할때는 endpoint url을 통해 api로 호출하여 사용할수 있다. 11434포트를 기본포트를 사용한다. generate모드과 chat모드의 차이는 입력문장이 하나, 메세지 여러개 나누어서 입력가능한 형태 차이

In [33]:
model

ChatAnthropic(model='claude-3-7-sonnet-20250219', anthropic_api_url='https://api.anthropic.com', anthropic_api_key=SecretStr('**********'), model_kwargs={})

In [34]:
import requests

def ollama_chat(model='llama3.2', messages=[]):
    response = requests.post(
        "http://localhost:11434/api/chat",
        json = {"model": model, "messages": messages, "stream": False},
    )
    response.raise_for_status()

    return response.json()

response = ollama_chat(
    model="llama3.2",
    messages = [
        {"role": "system", "content": "You are a helpful assistant"},
        {"role": "user", "content":"LLM은 어떤 원리로 작동하나요?"},
    ]
    
)

response

{'model': 'llama3.2',
 'created_at': '2025-05-22T03:12:28.721126Z',
 'message': {'role': 'assistant',
  'content': 'Large Language Model (LLM)은深層 신경망을 사용하여 natural language processing(보조 언어 처리)과 text generation에 대한 성능이 높은 기계학習 알고리즘입니다. LLM의 동기는 특정 텍스트 데이터에 학습된 후, 해당 데이터를 기반으로 다른-text 또는 new-text의 생성을 가능하게 만듭니다.\n\nLLM은 크게 세 가지 주요 부분으로 구성됩니다:\n\n1.  **데이터セット**: LLM은 텍스트 데이터セット을 사용하여 학습합니다. 이 데이터erset은 신경망이 학습할 수 있는 텍스트를 포함합니다.\n2.  **인퍼런스**: 텍스트에 대한 인퍼런스는 LLM의 텍스트 generation 성능을 향상시키는 데 중요한 역할을 합니다. 이는 텍스트의 단어 순서, 문장 구조 및 의미를 예측하는 데 사용됩니다.\n3.  **학습**: LLM은 데이터セット과 인퍼런스를 sử dụng하여 학습합니다. 이 학습 과정에서는 신경망이 데이터セット에 대한 지식을 acquisition하는 process가 있습니다.\n\nLLM의 동기는 텍스트 generation, natural language understanding 및 text-to-text task에 대해 매우 높은 성능을 제공합니다. LLM은 다음과 같은 특징을 가집니다:\n\n*   **Natural Language Understanding(NLU)**: LLM은 텍스트에서 의미를 이해하는 데 사용됩니다.\n*   1  **Text Generation(TG)**: LLM은 텍스트를 생성하는 데 사용됩니다.\n*   **Chatbot 및 conversational AI**: LLM은 chatbot 및 conversational AI에 대한 성능을 향상시키는 데 wid

### 3-2. Langchain의 Ollama를 이용한 로컬모델 사용방법
#### https://python.langchain.com/docs/integrations/chat/ollama/ 참고

In [35]:
from langchain_ollama import ChatOllama

llm = ChatOllama(
    model="llama3.2",
    temperature=0,
    num_predict = 1024, #max token
    # other params...
)

In [36]:
from langchain_core.messages import AIMessage

messages = [
        {"role": "system", "content": "You are a helpful assistant"},
        {"role": "user", "content":"LLM은 어떤 원리로 작동하나요? 한글로 답변부탁드립니다."},
    ]
ai_msgs = llm.invoke(messages)
ai_msgs

AIMessage(content='LLM(Large Language Model)은 인공지능 기술 중 하나입니다. LLM은 대규모 언어 데이터를 기반으로 작동하며, 자연어 처리 task에 대한 성능이 매우 높습니다.\n\nLLM의 원리는 다음과 같습니다.\n\n1. **대규모 언어 데이터**: LLM은 대규모 언어 데이터를 기반으로 작동합니다. 이 데이터는 millions 또는 billions 개의 텍스트 데이터가 포함되어 있습니다.\n2. **네트워크 구조**: LLM은 특정 네트워크 구조를 사용하여 데이터를 처리합니다. 일반적으로, LLM은 transformers와 같은 Self-Attention Mechanism을 사용합니다.\n3. **Self-Attention Mechanism**: Self-Attention Mechanism은 각 단어의 의미를 다른 단어와 비교하여 파악하는 mechanism입니다. 이 mechanism은 각 단어가 다른 단어와 어떻게 관련이 있는지 파악하여 문장을 이해하는 데 도움이 됩니다.\n4. **다양한 task에 대한 성능**: LLM은 다양한 자연어 처리 task에 대해 매우 높은 성능을 보여줍니다. 예를 들어, Natural Language Processing (NLP), Text Classification, Sentiment Analysis, Question Answering, etc.\n\nLLM의 작동 원리는 다음과 같습니다.\n\n1. **문장 입력**: 사용자가 LLM에게 문장을 입력합니다.\n2. **문장 파싱**: LLM은 문장을 파싱하여 단어를 분리합니다.\n3. **Self-Attention Mechanism**: LLM은 Self-Attention Mechanism을 사용하여 각 단어의 의미를 다른 단어와 비교합니다.\n4. **문장 이해**: LLM은 문장을 이해하기 위해 Self-Attention Mechanism과 다른 mechanism을 사용합니다.\n5. **output**: LLM은 output

In [37]:
ai_msgs.content

'LLM(Large Language Model)은 인공지능 기술 중 하나입니다. LLM은 대규모 언어 데이터를 기반으로 작동하며, 자연어 처리 task에 대한 성능이 매우 높습니다.\n\nLLM의 원리는 다음과 같습니다.\n\n1. **대규모 언어 데이터**: LLM은 대규모 언어 데이터를 기반으로 작동합니다. 이 데이터는 millions 또는 billions 개의 텍스트 데이터가 포함되어 있습니다.\n2. **네트워크 구조**: LLM은 특정 네트워크 구조를 사용하여 데이터를 처리합니다. 일반적으로, LLM은 transformers와 같은 Self-Attention Mechanism을 사용합니다.\n3. **Self-Attention Mechanism**: Self-Attention Mechanism은 각 단어의 의미를 다른 단어와 비교하여 파악하는 mechanism입니다. 이 mechanism은 각 단어가 다른 단어와 어떻게 관련이 있는지 파악하여 문장을 이해하는 데 도움이 됩니다.\n4. **다양한 task에 대한 성능**: LLM은 다양한 자연어 처리 task에 대해 매우 높은 성능을 보여줍니다. 예를 들어, Natural Language Processing (NLP), Text Classification, Sentiment Analysis, Question Answering, etc.\n\nLLM의 작동 원리는 다음과 같습니다.\n\n1. **문장 입력**: 사용자가 LLM에게 문장을 입력합니다.\n2. **문장 파싱**: LLM은 문장을 파싱하여 단어를 분리합니다.\n3. **Self-Attention Mechanism**: LLM은 Self-Attention Mechanism을 사용하여 각 단어의 의미를 다른 단어와 비교합니다.\n4. **문장 이해**: LLM은 문장을 이해하기 위해 Self-Attention Mechanism과 다른 mechanism을 사용합니다.\n5. **output**: LLM은 output을 생성합니다.\n\nLLM은 매

In [38]:
ai_msgs.usage_metadata

{'input_tokens': 49, 'output_tokens': 410, 'total_tokens': 459}

### 4-1. groq api를 이용한 다양한 모델 사용방법
#### groq은 추론전용서비스 npu groq자체 하드웨어를 가지고 있어 빠른게 장점

In [39]:
from groq import Groq

client = Groq()

chat_completion = client.chat.completions.create(
    model="llama3-8b-8192",
    messages=[{"role": "system", "content": "You are a helpful assistant"},
              {"role": "user", "content": "who is the president of the US?"}
             ]
)
response

{'model': 'llama3.2',
 'created_at': '2025-05-22T03:12:28.721126Z',
 'message': {'role': 'assistant',
  'content': 'Large Language Model (LLM)은深層 신경망을 사용하여 natural language processing(보조 언어 처리)과 text generation에 대한 성능이 높은 기계학習 알고리즘입니다. LLM의 동기는 특정 텍스트 데이터에 학습된 후, 해당 데이터를 기반으로 다른-text 또는 new-text의 생성을 가능하게 만듭니다.\n\nLLM은 크게 세 가지 주요 부분으로 구성됩니다:\n\n1.  **데이터セット**: LLM은 텍스트 데이터セット을 사용하여 학습합니다. 이 데이터erset은 신경망이 학습할 수 있는 텍스트를 포함합니다.\n2.  **인퍼런스**: 텍스트에 대한 인퍼런스는 LLM의 텍스트 generation 성능을 향상시키는 데 중요한 역할을 합니다. 이는 텍스트의 단어 순서, 문장 구조 및 의미를 예측하는 데 사용됩니다.\n3.  **학습**: LLM은 데이터セット과 인퍼런스를 sử dụng하여 학습합니다. 이 학습 과정에서는 신경망이 데이터セット에 대한 지식을 acquisition하는 process가 있습니다.\n\nLLM의 동기는 텍스트 generation, natural language understanding 및 text-to-text task에 대해 매우 높은 성능을 제공합니다. LLM은 다음과 같은 특징을 가집니다:\n\n*   **Natural Language Understanding(NLU)**: LLM은 텍스트에서 의미를 이해하는 데 사용됩니다.\n*   1  **Text Generation(TG)**: LLM은 텍스트를 생성하는 데 사용됩니다.\n*   **Chatbot 및 conversational AI**: LLM은 chatbot 및 conversational AI에 대한 성능을 향상시키는 데 wid

### 4-2. Langchain의 groq api를 이용한 다양한 모델 사용방법

In [40]:
from langchain_groq import ChatGroq

llm = ChatGroq(
    model="gemma2-9b-it",
    temperature=0,
    max_tokens=None,
    timeout=None,
    max_retries=2,
    # other params...
)

messages = [
    (
        "system",
        "You are a helpful assistant that translates English to Korean. Translate the user sentence.",
    ),
    ("user", "I love programming."),
]
ai_msg = llm.invoke(messages)
ai_msg

AIMessage(content='나는 프로그래밍을 사랑해요. \n\n(naneun peurogeuraemingeul saranghaeyo.)\n', additional_kwargs={}, response_metadata={'token_usage': {'completion_tokens': 32, 'prompt_tokens': 29, 'total_tokens': 61, 'completion_time': 0.058181818, 'prompt_time': 0.002188435, 'queue_time': 0.016512953, 'total_time': 0.060370253}, 'model_name': 'gemma2-9b-it', 'system_fingerprint': 'fp_10c08bf97d', 'finish_reason': 'stop', 'logprobs': None}, id='run-3ebc4fb7-679e-4da7-9ac8-d2290097fc97-0', usage_metadata={'input_tokens': 29, 'output_tokens': 32, 'total_tokens': 61})

In [41]:
print(ai_msg.content)

나는 프로그래밍을 사랑해요. 

(naneun peurogeuraemingeul saranghaeyo.)

