In [None]:
import tensorflow as tf
import tensorflow.keras as keras
from sklearn.model_selection import train_test_split
import pandas as pd
import numpy as np

# アヤメデータの読み込み
iris_data = pd.read_csv("iris.csv", encoding="utf-8")

# アヤメデータをラベルと入力データに分離する
y_labels = iris_data.loc[:,"Name"]
x_data = iris_data.loc[:,["SepalLength","SepalWidth","PetalLength","PetalWidth"]]

# ラベルデータをone-hotベクトルに直す
labels = {
    'Iris-setosa': [1, 0, 0], 
    'Iris-versicolor': [0, 1, 0], 
    'Iris-virginica': [0, 0, 1]
}
y_nums = np.array(list(map(lambda v : labels[v] , y_labels)))
x_data = np.array(x_data)

# 学習用とテスト用に分割する
x_train, x_test, y_train, y_test = train_test_split(
    x_data, y_nums, train_size=0.8)

# モデル構造を定義
# Dense→全結合ニューラルネットワーク
Dense = keras.layers.Dense
# Sequential→逐次実行
model = keras.models.Sequential()
# tf.keras.layers.Dense(ユニット数(中間層の数), 活性化関数,入力層の数)
model.add(Dense(10, activation='relu', input_shape=(4,)))
# tf.keras.layers.Dense(ユニット数(出力層の数), 活性化関数)
model.add(Dense(3, activation='softmax'))

# モデルを構築
model.compile(
    # 損失関数(交差エントロピー誤差) categorical_crossentropy は通常 One-Hotになっている
    # sparse→ラベルエンコーディング
    loss='categorical_crossentropy',
    # 勾配降下法
    optimizer='adam',
    metrics=['accuracy'])

# 学習を実行
model.fit(x_train, y_train,
    batch_size=20,
    epochs=300)

# モデルを評価
score = model.evaluate(x_test, y_test, verbose=1)
print('正解率=', score[1], 'loss=', score[0])

# ワインデータを使った練習

In [None]:
# ワインのデータセットデータを読み込み、ワインの品質を予測するディープラーニングを実装してみましょう。
# ワインデータを使った機械学習の方法（P84）を参考に、機械学習のアルゴリズムを
# 深層学習のアルゴリズムに変更しましょう。

# 必要なライブラリのインポート
import tensorflow as tf
import tensorflow.keras as keras
from sklearn.model_selection import train_test_split
import pandas as pd
import numpy as np

# ワインデータの読み込み
df = pd.read_csv('winequality-white.csv', sep=';')

# データの内容を確認するため、先頭から5行を表示する
df.head()

Unnamed: 0,fixed acidity,volatile acidity,citric acid,residual sugar,chlorides,free sulfur dioxide,total sulfur dioxide,density,pH,sulphates,alcohol,quality
0,7.0,0.27,0.36,20.7,0.045,45.0,170.0,1.001,3.0,0.45,8.8,6
1,6.3,0.3,0.34,1.6,0.049,14.0,132.0,0.994,3.3,0.49,9.5,6
2,8.1,0.28,0.4,6.9,0.05,30.0,97.0,0.9951,3.26,0.44,10.1,6
3,7.2,0.23,0.32,8.5,0.058,47.0,186.0,0.9956,3.19,0.4,9.9,6
4,7.2,0.23,0.32,8.5,0.058,47.0,186.0,0.9956,3.19,0.4,9.9,6


In [None]:
# ワインデータを目的変数と説明変数に分離
# y = df['quality']
# x = df.drop('quality', axis = 1)
y = df.iloc[:,-1]
x = df.iloc[:, :-1]


# 学習用とテスト用に分割する
x_train, x_test, y_train, y_test = train_test_split(x, y, train_size = 0.8, random_state = 0)

In [None]:
# モデル構造を定義
Dense = keras.layers.Dense
model = keras.models.Sequential()
model.add(Dense(20, activation='relu', input_shape=(11,)))
model.add(Dense(11, activation='softmax'))

# モデルを構築
model.compile(
    loss='sparse_categorical_crossentropy',
    optimizer='adam',
    metrics=['accuracy'])

# 学習を実行
# batch_size=16,epochs=256とすること
model.fit(x_train, y_train,
    batch_size=16,
    epochs=256)

# モデルを評価
score = model.evaluate(x_test, y_test, verbose = 1)
print('正解率=', score[1], 'loss=', score[0])

Epoch 1/256
Epoch 2/256
Epoch 3/256
Epoch 4/256
Epoch 5/256
Epoch 6/256
Epoch 7/256
Epoch 8/256
Epoch 9/256
Epoch 10/256
Epoch 11/256
Epoch 12/256
Epoch 13/256
Epoch 14/256
Epoch 15/256
Epoch 16/256
Epoch 17/256
Epoch 18/256
Epoch 19/256
Epoch 20/256
Epoch 21/256
Epoch 22/256
Epoch 23/256
Epoch 24/256
Epoch 25/256
Epoch 26/256
Epoch 27/256
Epoch 28/256
Epoch 29/256
Epoch 30/256
Epoch 31/256
Epoch 32/256
Epoch 33/256
Epoch 34/256
Epoch 35/256
Epoch 36/256
Epoch 37/256
Epoch 38/256
Epoch 39/256
Epoch 40/256
Epoch 41/256
Epoch 42/256
Epoch 43/256
Epoch 44/256
Epoch 45/256
Epoch 46/256
Epoch 47/256
Epoch 48/256
Epoch 49/256
Epoch 50/256
Epoch 51/256
Epoch 52/256
Epoch 53/256
Epoch 54/256
Epoch 55/256
Epoch 56/256
Epoch 57/256
Epoch 58/256
Epoch 59/256
Epoch 60/256
Epoch 61/256
Epoch 62/256
Epoch 63/256
Epoch 64/256
Epoch 65/256
Epoch 66/256
Epoch 67/256
Epoch 68/256
Epoch 69/256
Epoch 70/256
Epoch 71/256
Epoch 72/256
Epoch 73/256
Epoch 74/256
Epoch 75/256
Epoch 76/256
Epoch 77/256
Epoch 78