* 「今すぐ試したい!機械学習・深層学習(ディープラーニング)画像認識プログラミングレシピ」強制ではありませんが、こちらの本をお持ちですとスムーズかもしれません。
- Google Colaboratoryの有効化(有効化していない人のみ) (2分)
- Google Colaboratory Notebookの作成 (2分)
- Pythonのバージョンの設定、確認、HelloWorld (2分)
print "Hello world!"
- Google Colaboratory Notebookへのファイルアップロード (2分)
from google.colab import files
uploaded = files.upload()
-
Google Colaboratory Notebookでのパッケージのインストール (2分)
- 例
!pip install -U tensorflow !pip install -U scikit-learn !pip install -U sklearn !pip install -U scipy !pip install -U numpy !pip install -U matplotlib !pip install -U pandas
- 04-03(scikit-learn iris).ipynb : https://github.com/Kokensha/book-ml/blob/master/Colaboratory/04_03(scikit_learn_iris).ipynb
Pythonプログラムの解説もします。
- scikit-learn URL https://scikit-learn.org/stable/
- scikit-learn バージョンの確認
import sklearn
print(sklearn.__version__)
データに慣れることがとても重要! データの構造、意味が分からないと、良い結果に繋がる処理ができない
-
Andersonが採取、整理し、Fisherが1936年論文で使用
-
データセットの中身
- iris.feature_names(いわゆる教師ラベル)
- Sepal Length(がく片の長さ)
- Sepal Width(がく片の幅)
- Petal Length(花びらの長さ)
- Petal Width(花びらの幅)
- iris.target種類
- setosa
- versicolor
- virginic
- iris.data
- 四列の数値
- iris.feature_names(いわゆる教師ラベル)
-
アヤメデータの用意
iris = datasets.load_iris()
1回目は、グラフを描きながら、解説を丁寧に行う
* 分類と回帰 (2分)
- 分類の例
- 回帰の例
-
サポートベクターマシンの紹介と理論の解説、1,2列のデータを使う (2分)
- SVMは重要は分類と回帰のアルゴリズムである
- 超平面を求める手法である
- 回帰係数と誤差(グラフで、クラスの間の境界線)
-
超平面(Hyper-plane) (2分)
-
交差検証、3,4列のデータを使う(5分)
- 交差検証とは
- 学習データ(train_data)と検証データ(test_data)を分ける
- 検証データは、学習に使わない
- Mlxtend (machine learning extensions) http://rasbt.github.io/mlxtend/
- 交差検証とは
-
分類(predict)
2回目は、グラフなし、コンパクトなプログラム
- 学習と検証
- 分類(predict)
- https://scikit-learn.org/stable/auto_examples/datasets/plot_iris_dataset.html
- アヤメデータセットについて(Fisher's アヤメデータセット、Anderson's アヤメデータセット):https://en.wikipedia.org/wiki/Iris_flower_data_set
- 今後は「じっくりハンズオンクラス」と「ビジネスオリエントクラス」開講も検討しています。「じっくりハンズオンクラス」は、初心者向けでゆっくりしっかり基礎から、大量のレシピをクリアしていくことで、機械学習と深層学習の重要基本をしっかり身に着けるコースです。「ビジネスオリエントクラス」は機械学習、深層学習の実際の業務をイメージして、特訓する中級学習コースとなります。(内容変更、調整することがあります。)