# 実践演習 Day 1：streamlitとFastAPIのデモ
このノートブックでは以下の内容を学習します。

- 必要なライブラリのインストールと環境設定
- Hugging Faceからモデルを用いたStreamlitのデモアプリ
- FastAPIとngrokを使用したAPIの公開方法

演習を始める前に、HuggingFaceとngrokのアカウントを作成し、
それぞれのAPIトークンを取得する必要があります。


演習の時間では、以下の3つのディレクトリを順に説明します。

1. 01_streamlit_UI
2. 02_streamlit_app
3. 03_FastAPI

2つ目や3つ目からでも始められる様にノートブックを作成しています。

復習の際にもこのノートブックを役立てていただければと思います。

### 注意事項
「02_streamlit_app」と「03_FastAPI」では、GPUを使用します。

これらを実行する際は、Google Colab画面上のメニューから「編集」→ 「ノートブックの設定」

「ハードウェアアクセラレーター」の項目の中から、「T4 GPU」を選択してください。

このノートブックのデフォルトは「CPU」になっています。

---

# 環境変数の設定（1~3共有）


GitHubから演習用のコードをCloneします。

In [None]:
#!git clone https://github.com/matsuolab/lecture-ai-engineering.git

必要なAPIトークンを.envに設定します。

「lecture-ai-engineering/day1」の配下に、「.env_template」ファイルが存在しています。

隠しファイルのため表示されていない場合は、画面左側のある、目のアイコンの「隠しファイルの表示」ボタンを押してください。

「.env_template」のファイル名を「.env」に変更します。「.env」ファイルを開くと、以下のような中身になっています。


```
HUGGINGFACE_TOKEN="hf-********"
NGROK_TOKEN="********"
```
ダブルクオーテーションで囲まれた文字列をHuggingfaceのアクセストークンと、ngrokの認証トークンで書き変えてください。

それぞれのアカウントが作成済みであれば、以下のURLからそれぞれのトークンを取得できます。

- Huggingfaceのアクセストークン
https://huggingface.co/docs/hub/security-tokens

- ngrokの認証トークン
https://dashboard.ngrok.com/get-started/your-authtoken

書き換えたら、「.env」ファイルをローカルのPCにダウンロードしてください。

「01_streamlit_UI」から「02_streamlit_app」へ進む際に、CPUからGPUの利用に切り替えるため、セッションが一度切れてしまいます。

その際に、トークンを設定した「.env」ファイルは再作成することになるので、その手間を減らすために「.env」ファイルをダウンロードしておくと良いです。

「.env」ファイルを読み込み、環境変数として設定します。次のセルを実行し、最終的に「True」が表示されていればうまく読み込めています。

In [2]:
#!pip install python-dotenv
from dotenv import load_dotenv, find_dotenv

#%cd /content/lecture-ai-engineering/day1
load_dotenv(find_dotenv())

True

# 01_streamlit_UI

ディレクトリ「01_streamlit_UI」に移動します。

In [6]:
#%cd /content/lecture-ai-engineering/day1/01_streamlit_UI
%cd 01_streamlit_UI

C:\Users\Ur451\Desktop\lecture-ai-engineering\day1\01_streamlit_UI


必要なライブラリをインストールします。

In [None]:
%%capture
#!pip install -r requirements.txt

ngrokのトークンを使用して、認証を行います。

In [8]:
#!ngrok authtoken $$NGROK_TOKEN
import os
!ngrok authtoken {os.getenv("NGROK_TOKEN")}

Authtoken saved to configuration file: C:\Users\Ur451\AppData\Local/ngrok/ngrok.yml


アプリを起動します。

In [9]:
from pyngrok import ngrok

public_url = ngrok.connect(8501).public_url
print(f"公開URL: {public_url}")
!streamlit run app.py

公開URL: https://2cab-125-12-140-192.ngrok-free.app
^C


公開URLの後に記載されているURLにブラウザでアクセスすると、streamlitのUIが表示されます。

app.pyのコメントアウトされている箇所を編集することで、UIがどの様に変化するか確認してみましょう。

streamlitの公式ページには、ギャラリーページがあります。

streamlitを使うとpythonという一つの言語であっても、様々なUIを実現できることがわかると思います。

https://streamlit.io/gallery

後片付けとして、使う必要のないngrokのトンネルを削除します。

In [10]:
from pyngrok import ngrok
ngrok.kill()

# 02_streamlit_app


ディレクトリ「02_streamlit_app」に移動します。

In [23]:
#%cd /content/lecture-ai-engineering/day1/02_streamlit_app
%cd ../02_streamlit_app

C:\Users\Ur451\Desktop\lecture-ai-engineering\day1\02_streamlit_app


必要なライブラリをインストールします。

In [None]:
%%capture
#!pip install -r requirements.txt

ngrokとhuggigfaceのトークンを使用して、認証を行います。

In [24]:
#!ngrok authtoken $$NGROK_TOKEN
#!huggingface-cli login --token $$HUGGINGFACE_TOKEN

import os
!ngrok authtoken {os.getenv("NGROK_TOKEN")}
!huggingface-cli login --token {os.getenv("HUGGINGFACE_TOKEN")}

Authtoken saved to configuration file: C:\Users\Ur451\AppData\Local/ngrok/ngrok.yml


The token has not been saved to the git credentials helper. Pass `add_to_git_credential=True` in this function directly or `--add-to-git-credential` if using via `huggingface-cli` if you want to set the git credential as well.
Token is valid (permission: fineGrained).
The token `final_task` has been saved to C:\Users\Ur451\.cache\huggingface\stored_tokens
Your token has been saved to C:\Users\Ur451\.cache\huggingface\token
Login successful.
The current active token is: `final_task`


stramlitでHuggingfaceのトークン情報を扱うために、streamlit用の設定ファイル（.streamlit）を作成し、トークンの情報を格納します。

In [25]:
# .streamlit/secrets.toml ファイルを作成
import os
import toml

# 設定ファイルのディレクトリ確保
os.makedirs('.streamlit', exist_ok=True)

# 環境変数から取得したトークンを設定ファイルに書き込む
secrets = {
    "huggingface": {
        "token": os.environ.get("HUGGINGFACE_TOKEN", "")
    }
}

# 設定ファイルを書き込む
with open('.streamlit/secrets.toml', 'w') as f:
    toml.dump(secrets, f)

アプリを起動します。

02_streamlit_appでは、Huggingfaceからモデルをダウンロードするため、初回起動には2分程度時間がかかります。

この待ち時間を利用して、app.pyのコードを確認してみましょう。

In [26]:
from pyngrok import ngrok

public_url = ngrok.connect(8501).public_url
print(f"公開URL: {public_url}")
!streamlit run app.py

公開URL: https://71c9-125-12-140-192.ngrok-free.app
^C


アプリケーションの機能としては、チャット機能や履歴閲覧があります。

これらの機能を実現するためには、StreamlitによるUI部分だけではなく、SQLiteを使用したチャット履歴の保存やLLMのモデルを呼び出した推論などの処理を組み合わせることで実現しています。

- **`app.py`**: アプリケーションのエントリーポイント。チャット機能、履歴閲覧、サンプルデータ管理のUIを提供します。
- **`ui.py`**: チャットページや履歴閲覧ページなど、アプリケーションのUIロジックを管理します。
- **`llm.py`**: LLMモデルのロードとテキスト生成を行うモジュール。
- **`database.py`**: SQLiteデータベースを使用してチャット履歴やフィードバックを保存・管理します。
- **`metrics.py`**: BLEUスコアやコサイン類似度など、回答の評価指標を計算するモジュール。
- **`data.py`**: サンプルデータの作成やデータベースの初期化を行うモジュール。
- **`config.py`**: アプリケーションの設定（モデル名やデータベースファイル名）を管理します。
- **`requirements.txt`**: このアプリケーションを実行するために必要なPythonパッケージ。

後片付けとして、使う必要のないngrokのトンネルを削除します。

In [22]:
from pyngrok import ngrok
ngrok.kill()

# 03_FastAPI

ディレクトリ「03_FastAPI」に移動します。

In [27]:
#%cd /content/lecture-ai-engineering/day1/03_FastAPI
%cd ../03_FastAPI

C:\Users\Ur451\Desktop\lecture-ai-engineering\day1\03_FastAPI


必要なライブラリをインストールします。

In [None]:
%%capture
#!pip install -r requirements.txt

ngrokとhuggigfaceのトークンを使用して、認証を行います。

In [30]:
#!ngrok authtoken $$NGROK_TOKEN
#!huggingface-cli login --token $$HUGGINGFACE_TOKEN

import os
!ngrok authtoken {os.getenv("NGROK_TOKEN")}
!huggingface-cli login --token {os.getenv("HUGGINGFACE_TOKEN")}

Authtoken saved to configuration file: C:\Users\Ur451\AppData\Local/ngrok/ngrok.yml


The token has not been saved to the git credentials helper. Pass `add_to_git_credential=True` in this function directly or `--add-to-git-credential` if using via `huggingface-cli` if you want to set the git credential as well.
Token is valid (permission: fineGrained).
The token `final_task` has been saved to C:\Users\Ur451\.cache\huggingface\stored_tokens
Your token has been saved to C:\Users\Ur451\.cache\huggingface\token
Login successful.
The current active token is: `final_task`


アプリを起動します。

「02_streamlit_app」から続けて「03_FastAPI」を実行している場合は、モデルのダウンロードが済んでいるため、すぐにサービスが立ち上がります。

「03_FastAPI」のみを実行している場合は、初回の起動時にモデルのダウンロードが始まるので、モデルのダウンロードが終わるまで数分間待ちましょう。

In [32]:
!python app.py

モデル名を設定: google/gemma-2-2b-jpn-it
FastAPIエンドポイントを定義しました。
アクティブなngrokトンネルはありません。
ポート8501に新しいngrokトンネルを開いています...
---------------------------------------------------------------------
✅ 公開URL:   https://c479-125-12-140-192.ngrok-free.app
📖 APIドキュメント (Swagger UI): https://c479-125-12-140-192.ngrok-free.app/docs
---------------------------------------------------------------------
(APIクライアントやブラウザからアクセスするためにこのURLをコピーしてください)
load_model_task: モデルの読み込みを開始...
使用デバイス: cuda
モデル 'google/gemma-2-2b-jpn-it' の読み込みに成功しました
load_model_task: モデルの読み込みが完了しました。
起動時にモデルの初期化が完了しました。


        on_event is deprecated, use lifespan event handlers instead.

        Read more about it in the
        [FastAPI docs for Lifespan Events](https://fastapi.tiangolo.com/advanced/events/).
        
  @app.on_event("startup")
INFO:     Started server process [19196]
INFO:     Waiting for application startup.

Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]
Loading checkpoint shards:  50%|█████     | 1/2 [00:00<00:00,  3.85it/s]
Loading checkpoint shards: 100%|██████████| 2/2 [00:00<00:00,  7.64it/s]
Device set to use cuda
INFO:     Application startup complete.
ERROR:    [Errno 10048] error while attempting to bind on address ('0.0.0.0', 8501): [winerror 10048] 通常、各ソケット アドレスに対してプロトコル、ネットワーク アドレス、またはポートのどれか 1 つのみを使用できます。
INFO:     Waiting for application shutdown.
INFO:     Application shutdown complete.
Task exception was never retrieved
future: <Task finished name='Task-1' coro=<Server.serve() done, defined at C:\Users\Ur451\Desktop\lecture-ai-engineering\.venv\L

FastAPIが起動すると、APIとクライアントが通信するためのURL（エンドポイント）が作られます。

URLが作られるのと合わせて、Swagger UIというWebインターフェースが作られます。

Swagger UIにアクセスすることで、APIの仕様を確認できたり、APIをテストすることができます。

Swagger UIを利用することで、APIを通してLLMを動かしてみましょう。

後片付けとして、使う必要のないngrokのトンネルを削除します。

In [33]:
from pyngrok import ngrok
ngrok.kill()