機械学習・数理統計モデルの構築のためのMLops
<目的> MLopsのクイックスタートを行うテンプレート作成。プロジェクト段階・案件タイプ別にテンプレートを作成し、機動的に以下の目標を達成するレポジトリを作成する。
-
クイックな結果の出力
- PoCやプロジェクトの初期において最初のアウトプットの出力を数時間以内に完了すること
- 前処理・学習・評価・推論における各手法の組み合わせをクイックに実行して結果の比較を行う
-
クイックなモデルのチューニング
- Optunaなどの標準的なモデル選択ライブラリの利用
- 実験管理を無意識に利用できるように作成
-
拡張性の高いベースラインの作成
- 各プロセスを定型化しつつ後から微調整がクラスの継承・yamlファイルで可能なように修正を行う
├─data
│ ├─experiments
│ ├─models
│ ├─output
│ ├─parameters
│ └─raw
├─documents
├─notebook
├─query
└─src
-
クイックな手法の実験ができるようにテンプレートの準備
- 問題意識:簡単なテーブルデータなどのサンプル問題に対してクイックに試す方法がない
- 解決方法:
- 各分野の基本的な手法についてある程度同じフォーマットで動かせるように作成
- プロセスごとの動作を切り離して実行できるように実装
-
学習方法の組み合わせの一般化
- 問題意識:モデルと学習方法の組み合わせについては複数あるものの、実験などで動的にそれらの組み合わせを試すのは難しい。
- 解決方法:継承するモデルと学習方法のメソッドを動的に切り替えて動かせるようにする。
- 状態:
- 参照: