# ChatModel

In [1]:
from langchain_ollama import ChatOllama

llm = ChatOllama(model="llama3.1:8b", temperature=0.1)

user_message = "Что такое самолёт?"

answer = llm.invoke(user_message)

print(answer.content)

Самолет - это летательный аппарат, способный взлетать и приземляться.


Метод invoke возвращает не просто текст ответа, а объект класса AIMessage, содержащий довольно много различной информации, которую мы уже могли наблюдать, когда обращались к Ollama через API. Фактически под капотом метода invoke выполняется вызов указанной модели.

In [2]:
print(answer)

content='Самолет - это летательный аппарат, способный взлетать и приземляться.' additional_kwargs={} response_metadata={'model': 'llama3.1:8b', 'created_at': '2025-08-18T14:53:15.03922012Z', 'done': True, 'done_reason': 'stop', 'total_duration': 3699309021, 'load_duration': 1039332128, 'prompt_eval_count': 16, 'prompt_eval_duration': 563668267, 'eval_count': 21, 'eval_duration': 2094460360, 'model_name': 'llama3.1:8b'} id='run--0a34c786-0fb4-4ba0-9e62-61d39c6461d7-0' usage_metadata={'input_tokens': 16, 'output_tokens': 21, 'total_tokens': 37}


# Messages

Во фреймворке LangChain сообщения выделены в отдельные классы: AIMessage, HumanMessage и SystemMessage, соответствующие различным ролям и наследующиеся от класса BaseMessage. При вызове модели мы можем передать список сообщений, чтобы модель могла учитывать его при ответе. Например, в коде ниже модель переводит сообщения пользователя с русского на английский язык.

In [3]:
from langchain_ollama import ChatOllama
from langchain_core.messages import SystemMessage, HumanMessage


llm = ChatOllama(model="llama3.1:8b", temperature=0)
messages = [
    SystemMessage(content="You translate Russian to English. Translate the user sentence and write only result:"),
    HumanMessage(content="Я создам успешный AI-продукт!")
]

answer = llm.invoke(messages)

print(answer)

content='I will create a successful AI product!' additional_kwargs={} response_metadata={'model': 'llama3.1:8b', 'created_at': '2025-08-18T14:53:17.295884357Z', 'done': True, 'done_reason': 'stop', 'total_duration': 2193697107, 'load_duration': 28463509, 'prompt_eval_count': 40, 'prompt_eval_duration': 1309666152, 'eval_count': 9, 'eval_duration': 855107802, 'model_name': 'llama3.1:8b'} id='run--19d7b382-e2a3-490b-aa5f-2a0f4048d9f3-0' usage_metadata={'input_tokens': 40, 'output_tokens': 9, 'total_tokens': 49}


# Дополнительные методы stream, batch

In [4]:
messages_1 = [
    SystemMessage(content="You translate Russian to English. Translate the user sentence and write only result:"),
    HumanMessage(content="Я создам успешный AI-продукт!")
]
messages_2 = [
    SystemMessage(content="You translate Russian to English. Translate the user sentence and write only result:"),
    HumanMessage(content="У меня ничего не получится!")
]

In [5]:
# Stream
# ChatModel поддерживает стриминговый или потоковый тип исполнения, при котором ответ модели возвращается по мере его генерации.
# В качестве ответа возвращается объект класса AIMessageChunk. Попробуем заменить вывод модели из прошлого примера следующими двумя строчками.
# Это может быть полезно, когда мы не хотим дожидаться конца ответа модели, а хотим видеть результат сразу же.
for message_chunk in llm.stream(messages_1):
    print(message_chunk.content, end="")

I will create a successful AI product!

In [6]:
# Batch или пакетный, при котором модель может почти одновременно обрабатывать несколько запросов, что повышает эффективность обработки данных.
ai_message_1, ai_message_2 = llm.batch([messages_1, messages_2])
print(ai_message_1.content)
print(ai_message_2.content)

I will create a successful AI product!
Nothing is working out for me!
