# [Ollama](https://ollama.com/)
- 오픈소스 대형 언어 모델(LLM)을 내 컴퓨터에서 직접 실행할 수 있게 해주는 도구입니다.
- 간단히 말하면: ChatGPT 같은 AI를 인터넷 없이 내 PC에서 무료로 사용할 수 있습니다.

## 장단점
- 장점 
    - 완전 무료: 토큰 비용 없음
    - 프라이버시: 데이터가 로컬에 남아서 개인정보 보호
    - 오프라인 가능: 인터넷 없이도 사용
    - 빠른 응답: 서버 왕복 없음
    - 커스터마이징: 모델 설정 자유롭게 변경
- 단점
    - 컴퓨터 성능 필요 (RAM, GPU)
    - 클라우드 모델보다 성능이 떨어질 수 있음
    

## [Install Ollama](https://ollama.com/download/windows)

![image.png](attachment:image.png)

- 설치 결과 확인 
    ```shell
    ollama --version
    ```

![image.png](attachment:image.png)

## Ollama CLI 명령어 

| 명령어                                        | 설명                               | 사용 예                                                      |
| ------------------------------------------ | -------------------------------- | --------------------------------------------------------- |
| `ollama --help`                            | 전체 명령어 도움말 보기                    | `ollama --help`                                           |
| `ollama serve`                             | Ollama 서버 실행                     | `ollama serve` — 기본적으로 로컬 API 서버가 켜짐 ([Geshan's Blog][1]) |
| `ollama run <model>`                       | 모델을 실행 (다운로드 안 됐으면 자동으로 pull 포함) | `ollama run llama3.2` ([KodeKloud Notes][2])              |
| `ollama pull <model>`                      | 모델만 다운로드 (실행하지 않음)               | `ollama pull qwen2.5:0.5b` ([Geshan's Blog][1])           |
| `ollama list` 또는 `ollama ls`               | 로컬에 다운로드된 모델 목록 보기               | `ollama list` ([glukhov.org][3])                          |
| `ollama ps`                                | 현재 실행 중인 모델 보기                   | `ollama ps` ([glukhov.org][3])                            |
| `ollama stop <model>`                      | 실행 중인 모델 종료                      | `ollama stop llama3.2` ([glukhov.org][3])                 |
| `ollama rm <model>`                        | 모델 삭제 (디스크 공간 확보용)               | `ollama rm qwen2.5:0.5b` ([Geshan's Blog][1])             |
| `ollama show <model>`                      | 모델의 메타 정보 보기 (파라미터, 양자화 등)       | `ollama show llama3.2` ([GitHub][4])                      |
| `ollama cp <src> <dest>`                   | 모델 복사 / 이름 바꾸기                   | `ollama cp llama3.2 mymodel` ([GitHub][4])                |
| `ollama create <new_model> -f <Modelfile>` | Modelfile 기반으로 새 커스텀 모델 생성       | `ollama create mymodel -f Modelfile` ([GitHub][4])        |
| `ollama push <model>`                      | 모델을 Ollama 레지스트리에 업로드 (공유)       | — (push 기능이 문서에서 언급됨) ([Geshan's Blog][1])                |

[1]: https://geshan.com.np/blog/2025/02/ollama-commands/?utm_source=chatgpt.com "Ollama commands: How to use Ollama in the command line [Part 2]"
[2]: https://notes.kodekloud.com/docs/Running-Local-LLMs-With-Ollama/Getting-Started-With-Ollama/Essential-Ollama-CLI-Commands?utm_source=chatgpt.com "Essential Ollama CLI Commands - KodeKloud Notes"
[3]: https://www.glukhov.org/post/2024/12/ollama-cheatsheet/?utm_source=chatgpt.com "Ollama Cheatsheet - Rost Glukhov | Personal site and technical blog"
[4]: https://github.com/ollama/ollama?utm_source=chatgpt.com "ollama/ollama: Get up and running with Llama 3.3, DeepSeek-R1 ..."


## [Ollama Models](https://ollama.com/search)

![image.png](attachment:image.png)

## 주요 파라미터 

| 파라미터 이름                  | 타입                                     | 설명                                 | 기본값 / 비고                                        |          |                               |
| ------------------------ | -------------------------------------- | ---------------------------------- | ----------------------------------------------- | -------- | ----------------------------- |
| `model`                  | `str`                                  | 사용할 Ollama 모델 이름 (예: `"llama3.1"`) | 필수                                              |          |                               |
| `temperature`            | `Optional[float]`                      | 샘플링 온도 (값이 높을수록 다양성 증대)            | 기본값 없음 / 모델 디폴트 따름 ([python.langchain.com][1])  |          |                               |
| `num_predict`            | `Optional[int]`                        | 생성할 최대 토큰 수                        | 기본값 있음 (예: 128) ([python.langchain.com][1])     |          |                               |
| `top_k`                  | `Optional[int]`                        | 다음 토큰 후보를 K개로 제한                   | — ([python.langchain.com][1])                   |          |                               |
| `top_p`                  | `Optional[float]`                      | 누적 확률 기반 샘플링 (nucleus sampling)    | — ([api.python.langchain.com][2])               |          |                               |
| `mirostat`               | `Optional[int]`                        | Mirostat 샘플링 방식 사용 여부 / 모드         | — ([python.langchain.com][1])                   |          |                               |
| `seed`                   | `Optional[int]`                        | 랜덤 시드 (재현성 확보용)                    | — ([python.langchain.com][1])                   |          |                               |
| `base_url`               | `Optional[str]`                        | Ollama 서버의 기본 URL (호스트 + 포트 등)     | 기본값 없음: 로컬 기본 서버 사용 ([python.langchain.com][1]) |          |                               |
| `keep_alive`             | `Optional[Union[int, str]]`            | 모델을 메모리에 유지할 시간 (예: `"5m"`)        | — ([python.langchain.com][1])                   |          |                               |
| `format`                 | `Literal["", "json"]`                  | 출력 형식 지정 (예: JSON)                 | 기본값 `""` (일반 텍스트) ([python.langchain.com][1])   |          |                               |
| `validate_model_on_init` | `bool`                                 | 초기화 시 모델이 로컬에 있는지 검증할지 여부          | 기본값 `False` ([python.langchain.com][1])         |          |                               |
| `num_ctx`                | `Optional[int]`                        | 컨텍스트 윈도우 크기 (입력 문맥 길이)             | 기본값 있음 (예: 2048) ([python.langchain.com][1])    |          |                               |
| `num_gpu`                | `Optional[int]`                        | 사용할 GPU 수                          | — ([python.langchain.com][1])                   |          |                               |
| `num_thread`             | `Optional[int]`                        | CPU 스레드 수                          | — ([python.langchain.com][1])                   |          |                               |
| `client_kwargs`          | `Optional[dict]`                       | 동기 HTTP 클라이언트용 추가 인자 (예: 헤더)       | — ([python.langchain.com][1])                   |          |                               |
| `async_client_kwargs`    | `Optional[dict]`                       | 비동기 HTTP 클라이언트용 추가 인자              | — ([python.langchain.com][1])                   |          |                               |
| `custom_get_token_ids`   | `Optional[Callable[[str], list[int]]]` | 토큰화 함수 커스텀                         | — ([python.langchain.com][1])                   |          |                               |
| `cache`                  | `BaseCache                             | bool                               | None`                                           | 응답 캐싱 설정 | — ([python.langchain.com][1]) |
| `metadata`               | `Optional[dict[str, Any]]`             | 런(trace) 메타데이터                     | — ([python.langchain.com][1])                   |          |                               |

[1]: https://python.langchain.com/api_reference/ollama/llms/langchain_ollama.llms.OllamaLLM.html?utm_source=chatgpt.com "OllamaLLM — 🦜🔗 LangChain documentation"
[2]: https://api.python.langchain.com/en/latest/llms/langchain_ollama.llms.OllamaLLM.html?utm_source=chatgpt.com "langchain_ollama.llms.OllamaLLM — LangChain 0.2.17"


### 모델 다운로드 하기 
```shell
ollama pull gemma3:4b
```

![image.png](attachment:image.png)

### 다운로드한 모델 확인 
```shell
ollama list
```

![image.png](attachment:image.png)

# [Langchain with Ollama Model](https://docs.langchain.com/oss/python/integrations/providers/ollama)
- 대형 언어 모델(Large Language Model)을 LangChain 프레임워크 내에서 사용하기 위한 객체 또는 인터페이스를 말합니다.

![image.png](attachment:image.png)

## 창작용 (Creative Writing)

### OllamaLLM
| 파라미터          | 값            | 설명                            |
| ------------- | ------------ | ----------------------------- |
| `temperature` | `0.8 ~ 1.0`  | 무작위성 높여 창의적인 결과 생성            |
| `top_p`       | `0.9`        | 확률 분포 상위 90% 토큰만 사용 (다양성 유지)  |
| `num_predict` | `512`        | 충분한 길이의 텍스트 생성 허용             |
| `model`       | `"llama3.1"` | 일반적인 창작용 모델                   |
| `keep_alive`  | `"10m"`      | 모델을 10분간 메모리에 유지 (반복 생성 시 빠름) |


In [1]:
from langchain_ollama.chat_models import ChatOllama 

creative_llm = ChatOllama(
    model="gemma3:4b",
    temperature=0.9,
    top_p=0.9,
    num_predict=512,
    keep_alive="10m"
)

In [2]:
# 사용자 입력에 대한 응답 생성
# response는 AI가 생성한 이야기
response = creative_llm.invoke("시간 여행자가 조선을 방문하는 5문장의 짧은 소설을 써줘."
)

In [3]:
response

AIMessage(content='알겠습니다. 시간 여행자가 조선을 방문하는 5문장 짧은 소설입니다.\n\n"침묵하는 고층 건물이 눈 앞에 나타났다. 21세기 서울의 모습이 아니었다. 낡은 기와집과 댓돌로 덮인 마을에서 나는 혼란스러움에 말을 잃었다. \'이곳은 어디지?\' 라는 질문은 조선 시대의 낯선 사람들에게 적합하지 않았다. 한 노인이 낡은 갓을 쓰고 나를 바라보며 말했다. \'신의 뜻이 이곳에 온 자는 분명 특별한 존재일 것이다.\'"', additional_kwargs={}, response_metadata={'model': 'gemma3:4b', 'created_at': '2025-10-14T04:15:46.978184Z', 'done': True, 'done_reason': 'stop', 'total_duration': 16431864200, 'load_duration': 5482626300, 'prompt_eval_count': 28, 'prompt_eval_duration': 743837700, 'eval_count': 129, 'eval_duration': 10079982800, 'model_name': 'gemma3:4b'}, id='run--672ec903-0f8a-4c49-9fcf-b46829b3f1bd-0', usage_metadata={'input_tokens': 28, 'output_tokens': 129, 'total_tokens': 157})

In [4]:
print(response.content)

알겠습니다. 시간 여행자가 조선을 방문하는 5문장 짧은 소설입니다.

"침묵하는 고층 건물이 눈 앞에 나타났다. 21세기 서울의 모습이 아니었다. 낡은 기와집과 댓돌로 덮인 마을에서 나는 혼란스러움에 말을 잃었다. '이곳은 어디지?' 라는 질문은 조선 시대의 낯선 사람들에게 적합하지 않았다. 한 노인이 낡은 갓을 쓰고 나를 바라보며 말했다. '신의 뜻이 이곳에 온 자는 분명 특별한 존재일 것이다.'"


## 정확한 답변용 (Fact-based)

### OllamaLLM
| 파라미터          | 값            | 설명                    |
| ------------- | ------------ | --------------------- |
| `temperature` | `0.0 ~ 0.2`  | 무작위성 최소화, 항상 같은 결과 유도 |
| `top_p`       | `1.0`        | 전체 확률 분포 사용 (안정성 중심)  |
| `num_predict` | `256`        | 간결한 답변 생성             |
| `model`       | `"llama3.1"` | 정확도 중심 모델             |
| `keep_alive`  | `"5m"`       | 짧게 유지 (리소스 절약)        |


In [5]:
from langchain_ollama.chat_models import ChatOllama 

fact_llm = ChatOllama(
    model="gemma3:4b",
    temperature=0.1,
    top_p=1.0,
    num_predict=256,
    keep_alive="5m"
)

In [6]:
response = fact_llm.invoke("지구에서 가장 깊은 바다는 어디야?"
)

In [7]:
print(response.content)

지구에서 가장 깊은 바다는 **마리아나 해구**입니다. 

마리아나 해구의 가장 깊은 지점인 챌린저 해연(Challenger Deep)의 깊이는 약 10,929미터(35,853피트)로, 해수면에서 약 6km 깊이입니다. 이는 지구상의 모든 호수보다 깊은 깊이입니다.

마리아나 해구는 태평양에 위치하며, 판 구조 운동으로 인해 형성된 해저 산맥입니다.
