Skip to content

Latest commit

 

History

History
139 lines (102 loc) · 5.18 KB

File metadata and controls

139 lines (102 loc) · 5.18 KB

ハンズオン参考書籍

* 「今すぐ試したい!機械学習・深層学習(ディープラーニング)画像認識プログラミングレシピ」強制ではありませんが、こちらの本をお持ちですとスムーズかもしれません。

Colaboratoryの使用準備と使い方の説明 (10分)

  • Google Colaboratoryの有効化(有効化していない人のみ) (2分)
  • Google Colaboratory Notebookの作成 (2分)
  • Pythonのバージョンの設定、確認、HelloWorld (2分)
print "Hello world!"
  • Google Colaboratory Notebookへのファイルアップロード (2分)
from google.colab import files
uploaded = files.upload()
  • Google Colaboratory Notebookでのパッケージのインストール (2分)

    !pip install -U tensorflow
    !pip install -U scikit-learn
    !pip install -U sklearn
    !pip install -U scipy
    !pip install -U numpy
    !pip install -U matplotlib
    !pip install -U pandas

書籍のJupyter NotebookファイルをGoogle Colaboratoryにインポートする

import to colab

「あやめの分類」にチャレンジしよう (40分)

Pythonプログラムの解説もします。

機械学習向けフレームワークscikit-learnの紹介 (5分)

import sklearn
print(sklearn.__version__)

機械学習のはじめの第一歩「あやめの分類」の概要 (2分)

- 目的:アヤメの花びらや萼片のサイズの関連性を見つけ出す

アヤメデータの説明(データに慣れる) (10分)

データに慣れることがとても重要! データの構造、意味が分からないと、良い結果に繋がる処理ができない

  • Andersonが採取、整理し、Fisherが1936年論文で使用

  • データセットの中身

    • iris.feature_names(いわゆる教師ラベル)
      • Sepal Length(がく片の長さ)
      • Sepal Width(がく片の幅)
      • Petal Length(花びらの長さ)
      • Petal Width(花びらの幅)
    • iris.target種類
      • setosa
      • versicolor
      • virginic
    • iris.data
      • 四列の数値
  • アヤメデータの用意

iris = datasets.load_iris()
  • 表形式でデータを見る
  • データ全件をみる
  • 一つの特徴量を見てみる
  • データの可視化
    • 1列目、2列目のデータを使う場合
    • 3列目、4列目のデータを使う場合
    • 3Dグラフ(次元削減)

1回目の学習プロセス

1回目は、グラフを描きながら、解説を丁寧に行う

* 分類と回帰 (2分)

  • 分類の例
  • 回帰の例
  • サポートベクターマシンの紹介と理論の解説、1,2列のデータを使う (2分)

    • SVMは重要は分類と回帰のアルゴリズムである
    • 超平面を求める手法である
    • 回帰係数と誤差(グラフで、クラスの間の境界線)
  • 超平面(Hyper-plane) (2分)

  • 交差検証、3,4列のデータを使う(5分)

    • 交差検証とは
      • 学習データ(train_data)と検証データ(test_data)を分ける
      • 検証データは、学習に使わない
    • Mlxtend (machine learning extensions) http://rasbt.github.io/mlxtend/
  • 分類(predict)

2回目の学習プロセス(5分)

2回目は、グラフなし、コンパクトなプログラム

  • 学習と検証
  • 分類(predict)

実際に「あやめの分類」をやってみよう (2分)

参考リンク

今後(5分)

  • 今後は「じっくりハンズオンクラス」と「ビジネスオリエントクラス」開講も検討しています。「じっくりハンズオンクラス」は、初心者向けでゆっくりしっかり基礎から、大量のレシピをクリアしていくことで、機械学習と深層学習の重要基本をしっかり身に着けるコースです。「ビジネスオリエントクラス」は機械学習、深層学習の実際の業務をイメージして、特訓する中級学習コースとなります。(内容変更、調整することがあります。)

質疑応用(0-30分)

アンケート回収

スタッフ片付け、解散