# 利用 Google Colab 部署 Ollama 服務
Ollama 服務提供一個統一的介面，讓你能夠輕鬆管理與呼叫各式語言模型，無論是在測試環境還是實際應用中，都能發揮極佳效能。對於手上沒有 GPU 運算資源，卻又想試玩地端大型語言模型的朋友，利用 Colab 平台進行概念驗證不失為一個好方法。透過 Colab 的免費運算資源，你可以快速驗證 Ollama 的功能與表現，進而應用於開發或原型設計。

## 下載與安裝 Ollama
在 Colab Notebook 中，首先我們要下載並安裝 Ollama。可以透過以下指令輕鬆完成安裝：

In [1]:
!curl -fsSL https://ollama.com/install.sh | sh

>>> Installing ollama to /usr/local
>>> Downloading Linux amd64 bundle
############################################################################################# 100.0%
>>> Creating ollama user...
>>> Adding ollama user to video group...
>>> Adding current user to ollama group...
>>> Creating ollama systemd service...
>>> The Ollama API is now available at 127.0.0.1:11434.
>>> Install complete. Run "ollama" from the command line.


## 手動背景執行 Ollama
由於 Colab 只有單一畫面，我們需要利用背景運行機制來啟動 Ollama 服務。這裡採用 `nohup` 指令，將原本在終端機上輸出的 log 訊息轉存至 `ollama.log` 檔案中，方便日後查閱運行紀錄。請使用以下指令：

In [4]:
!nohup ollama serve > ollama.log 2>&1 &

## 安裝 LLM 模型
服務順利啟動後，接下來便可下載第一個開源的語言模型。此處以 Google 的 gemma2:9b 模型為例進行說明。請輸入以下指令：

In [5]:
!ollama pull gemma2:9b

[?25lpulling manifest ⠋ [?25h[?25l[2K[1Gpulling manifest ⠙ [?25h[?25l[2K[1Gpulling manifest ⠹ [?25h[?25l[2K[1Gpulling manifest ⠸ [?25h[?25l[2K[1Gpulling manifest ⠼ [?25h[?25l[2K[1Gpulling manifest ⠴ [?25h[?25l[2K[1Gpulling manifest 
pulling ff1d1fc78170...   0% ▕▏    0 B/5.4 GB                  [?25h[?25l[2K[1G[A[2K[1Gpulling manifest 
pulling ff1d1fc78170...   0% ▕▏    0 B/5.4 GB                  [?25h[?25l[2K[1G[A[2K[1Gpulling manifest 
pulling ff1d1fc78170...   0% ▕▏    0 B/5.4 GB                  [?25h[?25l[2K[1G[A[2K[1Gpulling manifest 
pulling ff1d1fc78170...   0% ▕▏ 4.8 MB/5.4 GB                  [?25h[?25l[2K[1G[A[2K[1Gpulling manifest 
pulling ff1d1fc78170...   1% ▕▏  42 MB/5.4 GB                  [?25h[?25l[2K[1G[A[2K[1Gpulling manifest 
pulling ff1d1fc78170...   1% ▕▏  62 MB/5.4 GB                  [?25h[?25l[2K[1G[A[2K[1Gpulling manifest 
pulling ff1d1fc78170...   1% ▕▏  80 MB/5.4 GB                  [?25h

## 使用 Ollama API 整合 OpenAI Python 函式庫
Ollama 提供了與 OpenAI API 部分功能的相容，協助現有應用程式連接到 Ollama。接下來，我們示範如何使用 Chat Completion API 聊天。此範例中，使用 gemma2:9b 模型，並傳送一則文字訊息。

In [6]:
from openai import OpenAI

client = OpenAI(
    base_url='http://localhost:11434/v1/',  # 設定 API 伺服器的 URL，這裡使用本機端點
    api_key='ollama',                      # API 金鑰（此例中為 'ollama'）
)

In [7]:
# 使用 chat API 建立一個聊天請求
chat_completion = client.chat.completions.create(
    messages=[
        {
            'role': 'user',  # 設定角色為「使用者」
            'content': '法國的首都在哪?',  # 提供要詢問的問題（提示詞）
        }
    ],
    model='gemma2:9b',  # 指定模型
)

# 取得模型回應的內容
print(chat_completion.choices[0].message.content)

法國的首都是**巴黎**。 



## 檢查 Ollama 運作狀態
若你需要確認 Ollama 是否正在運行，或想查看是否使用了 CPU 或 GPU 等運算資源，可以使用以下指令來檢查服務狀態：

In [8]:
!ollama ps

NAME         ID              SIZE      PROCESSOR    UNTIL              
gemma2:9b    ff02c3702f32    9.4 GB    100% GPU     4 minutes from now    
