# AI・機械学習 基礎 ステップ

## Webシステム開発 ～機械学習Webアプリ構築～

© 2022 LiberCraft Co.,Ltd.

## デフォルト予測モデルのWebアプリケーション構築
### 以下の問題を解きなさい。
「ベーシック機械学習｜教師あり学習（分類問題）編 〜ローンデフォルト予測モデル構築〜」の結果を基に、他のメンバーが簡単に操作できるWebアプリケーションをStreamlitを用いて構築してください。\
アプリケーションは、学習済みモデルを用いてユーザーに対する予測を行い、その結果を視覚的に表示することを目的としています。

#### アプリケーションの要件
アプリケーションは3つのタブ（tab1, tab2, tab3）から成ります。

- tab1: バッチ予測
    - 目的: ユーザーが「実行」ボタンを押すことで、Testデータに対する予測確率を一括で算出し、表示する機能。
    - 操作: ユーザーが「バッチ予測を実行」ボタンを押すと、dataset/train.csv と dataset/test.csv のデータが読み込まれ、データの前処理が行われた後、学習済みモデルを使って予測確率が算出される。
    - 結果: 予測確率の高い順に、ユーザーIDとその予測確率をStreamlitのUI上に表示する。
    - リセット機能: ユーザーが「バッチ予測結果リセット」ボタンを押すと、表示された予測結果がクリアされる。

- tab2: 個別予測
    - 目的: ユーザーが特徴量の値を入力し、その入力に基づいて予測確率を計算する個別予測機能。
    - 操作: ユーザーが各特徴量（例えば「契約の種類」や「性別」など）を入力するためのフォームが表示され、フォームには、カテゴリカルデータの場合は選択肢が表示され、数値型データの場合はデフォルトで中央値が表示される。
    - 結果: 入力された特徴量に基づいて、デフォルト確率が計算され、その結果が表示される。

- tab3: 特徴量の重要度分析
    - 目的: 学習済みモデルにおける特徴量の重要度を視覚的に表示し、カテゴリカル変数の解釈を行う。
    - 特徴量の重要度: モデルの係数を基に、特徴量の重要度を降順で表示し、Altairを使用してバーグラフで視覚化する。
    - カテゴリカル変数の解釈: ユーザーがカテゴリカル変数を選択し、相対的な影響を解釈する機能を提供する。

#### 実装の概要
Streamlitは、PythonスクリプトのみでWebアプリケーションを構築できるため、HTMLやJavaScriptのコーディングは不要です。そのため、今回の演習ではFlaskなどを使用せず、Streamlitを活用してシンプルに実装します。

#### 必要な機能
以下の機能をメインスクリプト（app.py）に実装します。

- バッチ予測 (tab1)
st.button() を使用して「実行」ボタンを作成します。\
学習済みのモデル（dataset/model.pkl）を読み込み、Testデータに対して予測を行います。\
予測結果をpandasデータフレームとして管理し、st.dataframe() を使って予測結果を表示します。

- 個別予測 (tab2)
ユーザーが入力した特徴量（例：「契約の種類」、「性別」など）に基づいて予測確率を計算します。\
モデルを利用して、入力された特徴量から予測確率を算出し、結果を表示します。

- 特徴量の重要度分析 (tab3)
モデルの係数を基に特徴量の重要度を計算し、それを降順で表示します。\
Altairを使用して、特徴量の重要度を視覚化するバーグラフを作成します。\
カテゴリカル変数の解釈: ユーザーがカテゴリカル変数を選択し、そのカテゴリに対する基準カテゴリと対象カテゴリを指定することで、その変数の相対的な影響を解釈します。

#### アプリケーションの実行と確認

- streamlit run app.py コマンドを使用してローカル環境で実行します。
- st.write() などを活用し、出力結果を整理して表示します。

#### 実行の確認方法
ローカル環境で以下のコマンドを実行し、ブラウザでアプリを確認してください。

```bash
streamlit run app.py
```

（以下のようなメッセージが表示されるはず）
```
  You can now view your Streamlit app in your browser.
  Network URL: http://xxx.xxx.xxx.xxx:8501
```

#### 提出方法
- 実装が完了したら、Google Classroomに記載された方法の通りに提出してください。

Streamlitを活用することで、簡単にインタラクティブなWebアプリを構築できます。
学習・予測の流れを整理しながら、実装を進めていきましょう！

---------

#### ＜データのダウンロード＞

以下のリンクをクリックすることで使用データをダウンロードできます。
- [Download dataset](https://drive.google.com/file/d/146ukNesXoLjjpd7WYb6oCZiFINIuF1XV/view?usp=sharing)

ダウンロード後に、zipファイルを解凍し、datasetフォルダを下記ディレクトリ（staticやtemplatesと同階層）に配置してください

---- **dataset**\
　　|- train.csv\
　　|- test.csv\
　　|- model.pkl\
---- app.py\
---- requirements.txt