# LangChain ChatOllama로 대화형 모델 사용하기

이 노트북에서는 **ChatOllama**를 사용하여 대화형 LLM을 실행하는 방법을 알아봅니다.

## LLM vs Chat Model 차이점

| 구분 | LLM (OllamaLLM) | Chat Model (ChatOllama) |
|------|-----------------|------------------------|
| 입력 | 단순 문자열 | 메시지 객체 리스트 |
| 출력 | 문자열 | AIMessage 객체 |
| 용도 | 텍스트 완성 | 대화형 상호작용 |
| 역할 구분 | 없음 | System, Human, AI 역할 지원 |

> Chat Model은 대화 맥락을 유지하고, 역할별 메시지를 구분할 수 있어 챗봇 개발에 적합합니다.

---

# 1. Ollama 설치 및 서버 실행

Colab/Linux 환경에서 Ollama를 설치하고 백그라운드에서 서버를 실행합니다.

In [2]:
import subprocess
import time

# zstd 설치 (Ollama 설치의 사전 요구 사항)
!apt-get install -y zstd

# Ollama 설치
!curl -fsSL https://ollama.com/install.sh | sh

# 백그라운드에서 Ollama 서버 실행
subprocess.Popen(['ollama', 'serve'])

time.sleep(3)

Reading package lists... Done
Building dependency tree... Done
Reading state information... Done
The following NEW packages will be installed:
  zstd
0 upgraded, 1 newly installed, 0 to remove and 2 not upgraded.
Need to get 603 kB of archives.
After this operation, 1,695 kB of additional disk space will be used.
Get:1 http://archive.ubuntu.com/ubuntu jammy/main amd64 zstd amd64 1.4.8+dfsg-3build1 [603 kB]
Fetched 603 kB in 1s (402 kB/s)
Selecting previously unselected package zstd.
(Reading database ... 117540 files and directories currently installed.)
Preparing to unpack .../zstd_1.4.8+dfsg-3build1_amd64.deb ...
Unpacking zstd (1.4.8+dfsg-3build1) ...
Setting up zstd (1.4.8+dfsg-3build1) ...
Processing triggers for man-db (2.10.2-1) ...
>>> Cleaning up old version at /usr/local/lib/ollama
>>> Installing ollama to /usr/local
>>> Downloading ollama-linux-amd64.tar.zst
######################################################################## 100.0%
>>> Creating ollama user...
>>> Adding

# 2. 모델 다운로드 & 패키지 설치

- `ollama pull llama3.2` - Llama 3.2 모델을 로컬에 다운로드
- `pip install langchain-ollama` - LangChain의 Ollama 통합 패키지 설치 (`-q` 옵션으로 출력 최소화)

In [3]:
!ollama pull llama3.2
!pip install -q langchain-ollama

[?2026h[?25l[1G[?25h[?2026l[?2026h[?25l[1G[?25h[?2026l[?2026h[?25l[1G[?25h[?2026l[?2026h[?25l[1G[?25h[?2026l[?2026h[?25l[1G[?25h[?2026l[?2026h[?25l[1G[?25h[?2026l[?2026h[?25l[1G[?25h[?2026l[?2026h[?25l[1G[?25h[?2026l[?2026h[?25l[1G[?25h[?2026l[?2026h[?25l[1G[?25h[?2026l[?2026h[?25l[1G[?25h[?2026l[?2026h[?25l[1G[?25h[?2026l[?2026h[?25l[1G[?25h[?2026l[?2026h[?25l[1G[?25h[?2026l[?2026h[?25l[1G[?25h[?2026l[?2026h[?25l[1G[?25h[?2026l[?2026h[?25l[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l

# 3. ChatOllama 코드 실행

**코드 설명:**

1. **ChatOllama** - 대화형 모델 클래스 (LLM이 아닌 Chat 인터페이스)
2. **HumanMessage** - 사용자 메시지를 나타내는 클래스
3. **prompt** - 메시지 리스트 형태로 전달 (여러 메시지로 대화 맥락 구성 가능)
4. **response.content** - AIMessage 객체에서 텍스트 내용만 추출

**메시지 타입:**
- `SystemMessage` - AI의 역할/성격 설정
- `HumanMessage` - 사용자 입력
- `AIMessage` - AI 응답

In [4]:
from langchain_ollama import ChatOllama
from langchain_core.messages import HumanMessage

model = ChatOllama(model='llama3.2')
prompt = [HumanMessage('프랑스의 수도는 어디인가요?')]

response = model.invoke(prompt)
print(response.content)

프랑스의 수도는 파리(Paris)입니다.


---

## 참고사항

- ChatOllama는 기본적으로 `http://localhost:11434`에 접속합니다
- Colab에서 `ollama serve`를 실행하면 해당 주소로 서버가 실행되어 그대로 동작합니다
- 다른 호스트를 사용하려면: `ChatOllama(model='llama3.2', base_url='http://다른주소:11434')`

## 다음 단계

- 여러 메시지로 대화 맥락 구성하기
- SystemMessage로 AI 페르소나 설정하기
- 스트리밍 응답 받기 (`stream()` 메서드)