# LangChain + Ollama로 로컬 LLM 사용하기

이 노트북에서는 OpenAI API 대신 **Ollama**를 사용하여 로컬에서 LLM을 실행하는 방법을 알아봅니다.

## Ollama란?

Ollama는 로컬 컴퓨터에서 대규모 언어 모델(LLM)을 쉽게 실행할 수 있게 해주는 도구입니다.

**장점:**
- 무료로 사용 가능 (API 비용 없음)


- 데이터가 로컬에서 처리되어 프라이버시 보장
- 다양한 오픈소스 모델 지원 (Llama, Mistral, Gemma 등)


# 1. Ollama 설치 및 서버 실행

아래 코드는 다음 작업을 수행합니다:
1. **zstd 설치** - Ollama 압축 해제에 필요한 도구
2. **Ollama 설치** - 공식 설치 스크립트 실행
3. **서버 실행** - `ollama serve`로 백그라운드에서 API 서버 시작
4. **대기** - 서버가 완전히 시작될 때까지 3초 대기

> Google Colab이나 리눅스 환경에서 실행하세요. 로컬 Mac/Windows의 경우 [ollama.com](https://ollama.com)에서 데스크톱 앱을 설치하면 됩니다.

In [2]:
# zstd 설치 (Ollama 설치 전 필요)
!apt-get update && apt-get install -y zstd

# Ollama 설치
!curl -fsSL https://ollama.com/install.sh | sh

# 백그라운드에서 Ollama 서버 실행
import subprocess
subprocess.Popen(['ollama', 'serve'])

# 서버가 시작될 때까지 잠시 대기
import time
time.sleep(3)

0% [Working]            Get:1 https://cli.github.com/packages stable InRelease [3,917 B]
Get:2 https://cloud.r-project.org/bin/linux/ubuntu jammy-cran40/ InRelease [3,632 B]
Get:3 https://r2u.stat.illinois.edu/ubuntu jammy InRelease [6,555 B]
Get:4 https://cli.github.com/packages stable/main amd64 Packages [356 B]
Hit:5 http://archive.ubuntu.com/ubuntu jammy InRelease
Get:6 http://security.ubuntu.com/ubuntu jammy-security InRelease [129 kB]
Get:7 https://cloud.r-project.org/bin/linux/ubuntu jammy-cran40/ Packages [83.8 kB]
Get:8 http://archive.ubuntu.com/ubuntu jammy-updates InRelease [128 kB]
Get:9 https://r2u.stat.illinois.edu/ubuntu jammy/main all Packages [9,650 kB]
Hit:10 https://ppa.launchpadcontent.net/deadsnakes/ppa/ubuntu jammy InRelease
Get:11 https://r2u.stat.illinois.edu/ubuntu jammy/main amd64 Packages [2,882 kB]
Get:12 http://archive.ubuntu.com/ubuntu jammy-backports InRelease [127 kB]
Get:13 http://security.ubuntu.com/ubuntu jammy-security/universe amd64 Packages [1,2

# 2. 모델 다운로드

Ollama에서 사용할 모델을 다운로드합니다. `ollama pull` 명령어로 원하는 모델을 로컬에 저장합니다.

**사용 가능한 모델 예시:**
- `llama3.2` - Meta의 Llama 3.2 모델 (약 2GB)
- `llama3.2:1b` - 더 가벼운 1B 파라미터 버전
- `gemma2:2b` - Google의 Gemma 2B 모델
- `mistral` - Mistral AI의 7B 모델

> 처음 실행 시에만 다운로드가 필요하며, 이후에는 로컬에 캐시된 모델을 사용합니다.

In [3]:
# llama3.2 모델 pull (처음 한 번만)
!ollama pull llama3.2

[?2026h[?25l[1G[?25h[?2026l[?2026h[?25l[1G[?25h[?2026l[?2026h[?25l[1G[?25h[?2026l[?2026h[?25l[1G[?25h[?2026l[?2026h[?25l[1G[?25h[?2026l[?2026h[?25l[1G[?25h[?2026l[?2026h[?25l[1G[?25h[?2026l[?2026h[?25l[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h[?25l[A[1G[?25h[?2026l[?2026h

# 3. LangChain 패키지 설치

LangChain에서 Ollama를 사용하기 위한 `langchain-ollama` 패키지를 설치합니다.

이 패키지는 다음 기능을 제공합니다:
- `OllamaLLM` - 텍스트 생성용 LLM 클래스
- `ChatOllama` - 대화형 채팅 모델 클래스
- `OllamaEmbeddings` - 텍스트 임베딩 생성 클래스

In [4]:
!pip install langchain-ollama

Collecting langchain-ollama
  Downloading langchain_ollama-1.0.1-py3-none-any.whl.metadata (2.5 kB)
Collecting ollama<1.0.0,>=0.6.0 (from langchain-ollama)
  Downloading ollama-0.6.1-py3-none-any.whl.metadata (4.3 kB)
Downloading langchain_ollama-1.0.1-py3-none-any.whl (29 kB)
Downloading ollama-0.6.1-py3-none-any.whl (14 kB)
Installing collected packages: ollama, langchain-ollama
Successfully installed langchain-ollama-1.0.1 ollama-0.6.1


# 4. 코드 실행

이제 LangChain을 통해 Ollama 모델을 사용해봅니다.

**코드 설명:**
1. `OllamaLLM` 클래스를 import
2. `model='llama3.2'`로 사용할 모델 지정
3. `invoke()` 메서드로 프롬프트 전송 및 응답 받기

> `invoke()`는 LangChain의 표준 인터페이스로, 다른 LLM 제공자(OpenAI, Anthropic 등)로 쉽게 전환할 수 있습니다.

In [5]:
from langchain_ollama import OllamaLLM

model = OllamaLLM(model='llama3.2')

response = model.invoke('하늘이')
print(response)

하늘은 어떤 특성을 가지고 있습니다.

1. **색상**: 하늘의 색은 가운다 blue, 흰색, 노란색으로 변할 수 있습니다. 가운다는 blue는 하늘의 가장 일반적인 màu이고, 흰색은 달이 있는 밤에 나타납니다. 노란색은 일출과 일몰 때 나타납니다.
2. **각도**: 하늘에는 여러 개의 고정한 각이 있습니다. These angles은 하늘의 방향을 지시합니다. 가장 일반적인 것은 동쪽(가운다 blue), 서쪽(노란색), 북쪽(하얀색), 남쪽(가운다 brown)입니다.
3. **고정 항성**: 하늘에는 다양한 고정 항성이 있습니다. These 항성은 지구의 기전에 따라서 고정된ตำแหน성을 가지고 있습니다. 가장 유명한 ones는 Sirius, Alpha Centauri, Beta Centauri, Aldebaran 등으로, 이들 항성은 고정된 위치를 가지며 보는 시간이 오래되면 다시 나타나게 됩니다.
4. **화星과 달**: 화성과 달은 하늘에서 가장 눈에 띄는_object_입니다. 화성은 가운다 red color의 반지하로, 달은 흰색의 기울임을 가지고 있습니다.

하늘은 많은 사람들에게 매력적인 곳이며, 이곳에서nature와ธรรม이 교부되는 경험을 할 수 있습니다.


참고사항:

Colab 무료 버전에서도 작동하지만, llama3.2는 약 2GB 정도라 다운로드에 시간이 걸림
더 가벼운 모델을 원하면 llama3.2:1b나 gemma2:2b 같은 작은 모델도 가능
Colab 세션이 끊기면 매번 다시 설치/pull 해야 함