### NVIDIA 驅動程式

1. 查看可以安裝的 Driver 版本：

In [None]:
%%bash

apt search nvidia-driver
# 或者 
apt-cache search nvidia-driver

2. 透過 apt 直接安裝即可：

**安裝完之後重新開機，然後開始祈禱電腦能順利重開。**

In [None]:
%%bash

# 以安裝 535 版為例
sudo apt install nvidia-driver-535

In [None]:
%%bash

# 可以考慮將驅動程式的版本鎖定起來，避免自動更新
sudo apt-mark hold nvidia-driver-535
sudo apt-mark hold libnvidia-compute-535

3. 確認是否安裝成功：

In [1]:
%%bash

# 如果你的電腦能夠順利重開
nvidia-smi 

Thu May 15 16:57:33 2025       
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 570.133.20             Driver Version: 570.133.20     CUDA Version: 12.8     |
|-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|   0  NVIDIA RTX A6000               Off |   00000000:47:00.0 Off |                  Off |
| 30%   45C    P0             88W /  300W |    3684MiB /  49140MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+
|   1  NVIDIA RTX A6000               Off |   00

### 使用 Anaconda / Miniconda / Condaforge 建立虛擬環境管理
Conda 不僅能用來管理 Python 套件，也能管理 Python 本身的版本以及 CUDA 的版本之類的。
* Anaconda：
    * 安裝路徑：https://github.com/conda-forge/miniforge/releases/latest/download/
    * 檔案格式：`Anaconda3-2024.10-1-Linux-${ARCH}.sh`
* Miniconda
    * 安裝路徑：https://repo.anaconda.com/miniconda/
    * 檔案格式：`Miniconda3-latest-Linux-${ARCH}.sh`
* Condaforge
    * 安裝路徑：https://github.com/conda-forge/miniforge/releases/latest/download/
    * 檔案格式：`Miniforge3-Linux-${ARCH}.sh`

1. 安裝 Conda

In [None]:
%%bash

# Download the Conda installation script
wget https://github.com/conda-forge/miniforge/releases/latest/download/Miniforge3-Linux-x86_64.sh

# Grant execution permissions to the installation script
chmod +x Miniforge3-Linux-x86_64.sh

# Install Conda (-b: 背景執行，-p 指定安裝路徑)
./Miniforge3-Linux-x86_64.sh -b
# ./Miniforge3-Linux-x86_64.sh -b -p "/opt/miniforge3" 

2. 啟用 Conda 並進行初始化

In [None]:
%%bash

# Activate Conda 
source ~/miniforge3/etc/profile.d/conda.sh

# Initialize Conda 
conda init

# Load the .bashrc configuration.
source ~/.bashrc 

# 會自動進入 conda (base) 環境，可以離開 base 環境
conda deactivate

# 可以關閉自動開啟 base 環境
conda config --set auto_activate_base false

3. 創建虛擬環境

In [None]:
%%bash

# 創建虛擬環境： (llm_env_py311)
conda create -n llm_env_py311 python=3.11

# 查看已建立的虛擬環境：
conda env list

4. 啟用創建好的虛擬環境

In [None]:
%%bash

# 啟用 base
conda activate

# 啟用 llm_env_py311
conda activate llm_env_py311

### 使用 python 的 venv 套件

1. 安裝套件

In [None]:
%%bash
sudo apt update
# 根據目前 Python 版本安裝對應的 venv 套件
sudo apt install python3.12-venv -y

2. 建立虛擬環境

In [None]:
%%bash
# make sure you the venv folder was created at project root.
python -m venv ./venv
# or
python3 -m venv ./venv

3. 執行虛擬環境

In [None]:
%%bash
./venv/Scripts/activate
# or
source venv/bin/activate

  如果出現錯誤
```
+ .\venv\Scripts\activate
+ ~~~~~~~~~~~~~~~~~~~~~~~
   + CategoryInfo          : SecurityError: (:) [], PSSecurityException
   + FullyQualifiedErrorId : UnauthorizedAccess
```
可以先將執行政策改為允許啟動虛擬環境腳本，然後再啟動虛擬環境：

In [None]:
# （臨時更改）— 最安全建議
Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope Process

In [None]:
# （永久更改）— 如果你常使用虛擬環境
Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope CurrentUser

4. 測試

In [None]:
print("Hello World!")

: 

### 安裝 CUDA
* 推薦可以參考 [PyTorch 官網](https://pytorch.org/get-started/locally/)目前支援到哪個版本，來決定要安裝哪個 CUDA 版本。
    * 因為很多套件開發者也都是跟隨 PyTorch 的版本在跑。
    * 只是參考，一切以應用需求為主。
* 可以在 Anaconda 的[頁面](https://anaconda.org/nvidia/cuda-toolkit)上查看目前可以安裝哪些版本的 CUDA 可以安裝。
* 除了 `cuda` 以外，還有個名稱為 `cuda-toolkit` 的套件，兩者其實都會幫你安裝 CUDA 函式庫。
    * 選擇安裝 `cuda` 套件的話，會比 `cuda-toolkit` 多出 `cuda`, `cuda-demo-suite`, `cuda-runtime` 等三個項目。
    * 實際上只有 `cuda-demo-suite` 套件會多安裝一些新檔案。
    * 不管安裝 `cuda` 或 `cuda-toolkit` 都是可以的，但推薦按照 [NVIDIA 官方文件](https://docs.nvidia.com/cuda/cuda-installation-guide-linux/index.html#conda-installation)的建議安裝 `cuda` 套件即可。

In [2]:
%%bash

# 安裝標籤為 nvidia/label/cuda-12.1.1 的 cuda 套件。
conda install -y nvidia/label/cuda-12.1.1::cuda

Channels:
 - conda-forge
 - nvidia/label/cuda-12.1.1
Platform: linux-64
Collecting package metadata (repodata.json): ...working... done
Solving environment: ...working... done




    current version: 25.3.0
    latest version: 25.3.1

Please update conda by running

    $ conda update -n base -c conda-forge conda





## Package Plan ##

  environment location: /home/ann/.conda/envs/llm_env

  added / updated specs:
    - nvidia/label/cuda-12.1.1::cuda


The following packages will be downloaded:

    package                    |            build
    ---------------------------|-----------------
    alsa-lib-1.2.14            |       hb9d3cd8_0         553 KB  conda-forge
    attr-2.5.1                 |       h166bdaf_1          69 KB  conda-forge
    binutils-2.43              |       h4852527_4          34 KB  conda-forge
    binutils_impl_linux-64-2.43|       h4bf12b8_4         5.8 MB  conda-forge
    binutils_linux-64-2.43     |       h4852527_4          35 KB  conda-forge
    c-compiler-1.9.0           |       h2b85faf_0           6 KB  conda-forge
    cuda-12.1.1                |                0           1 KB  nvidia/label/cuda-12.1.1
    cuda-cccl_linux-64-12.9.27 |       ha770c72_0         1.1 MB  conda-forge
    cuda-command-line-tools-12.9.0|       ha770c72_0          20 KB  conda-forg