<h3>機械学習課題 10 : Logistic Regression ロジスティック回帰 Part 3 - Practice 練習</h3><br/>

<h4>注意 : pythonコードを実行しながら読んでください!</h4><br/>

今回は、今まで皆さんが作成したロジスティック回帰(Logistic Regression)処理用のソースコードを活用して、機械学習で実際の問題を解決する練習をしてみましょう。

<h3>これから皆さんはある会社のプロダクト品質管理マネージャーです。</h3>

プロダクトの高い品質を維持するにはたくさんの種類のテストが必要で、かなりの費用が発生しています。多分、マネージャーであるあなたは上司からのテスト費用削減の圧迫で、毎晩眠れない日々を過ごしていると思います。

ある日、あなたは一つ面白いことに着目します。もし、たくさんのテストの中で、一部だけでも良品と不良品の判別が十分可能であれば、それ以外のテストは全部無くしてもいいのではないかと。

早速、あなたは今までのテストデータの分析を始めます。そして、一つ面白いことを見つけます。色んなテスト項目の中、$X1$と$X2$という二つのテストのスコアの組み合わせと、良品・不良品データと比較してみたら、あるパターンが見えて来ました。データをグラフで可視化して見るとその意味が分かります。

<h4>以下のコードを実行してグラフを確認してください。（マルは良品、バツは不良品です。）</h4>

In [None]:
#import required libraries
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
from scipy.optimize import minimize
from sklearn.preprocessing import PolynomialFeatures

#read learning data X and Y
data = np.loadtxt('ex10data1.txt', delimiter=',')

negative = data[:,2] == 0
positive = data[:,2] == 1

plt.scatter(data[positive][:,0],data[positive][:,1], marker = 'o', c = 'r')
plt.scatter(data[negative][:,0],data[negative][:,1], marker = 'x', c = 'b')
plt.xlabel('X1')
plt.ylabel('X2')

<h4>これ、確かに面白い形ですね。</h4>

良品のデータ（赤いマル）がグラフの真ん中に集まっています。それを不良品データ（青いバツ）が囲む形で集まっていますね。ここで、もし良品データと不良品データが分離できる決定境界 (decision boundary)が見つかるのであれば、$X1$と$X2$のテスト結果だけでも良品か不良品かの判断ができるようになります。

<h4>これはすごいことです。</h4>

あなたは決定境界 (decision boundary)を見つけるために、前回の課題で実施していた内容を思い出します。しかし、前回作成したコードをそのまま使ってみようとしたら、一つの課題にぶつかります。

前回は一次方程式で表現した直線の形の決定境界 (decision boundary)だったとすると、今回は円の形、しかもキレイな円でもなく、凸凹が含まれそうな形にならないと良品のグループと不良品のグループを分離することができないことに気づきました。これは残念ですね。

でもここで諦めることはしません。あなたは数学が得意な友達のKikiちゃん（一回目の課題以来、久しぶりです。）に聞いてみることにします。早速電話し、彼女から一つのヒントをもらいました。

このヒントというのは、多項式を使って、インプットから生成されるアウトプットがもっと色んな値になれるようにしてあげることで解決できるかもしれないことです。具体的には、$X1$、$X2$から

$$1, X1, X2, X1X2, X1^{2}, X2^{2}, X1^{2}X2, X1X2^{2}, X1^{2}X2^{2}, ... , X1^{n}X2^{n}$$

のような$n$乗までの変数の組み合わせで式（$n$次方程式）を構築することです。つまり、方程式の計算結果のパターンが、単純な直線或いは曲線ではなく、もっと色んな形になれる意味です。

上のように、ある変数のグループから$n$次方程式に必要な変数の組み合わせに変換するのはsklearnライブラリーのPolynomialFeaturesという関数を使えば簡単にできます。問題を解決する決定境界 (decision boundary)を見つけるために、今回は6次方程式で進めてみましょう。もともと2次元の$X1$、$X2$の二つの変数から6次方程式を作ろうとするとPolynomialFeatures関数は28次元に変換してくれます。

In [None]:
# Change data form for matrix calculation
# Get X with transformed features degree of 6 -> Generates 28 demensional data from 2 demensions
poly = PolynomialFeatures(6)
X = poly.fit_transform(data[:,0:2])
# Get Y
Y = np.c_[data[:,2]]

print("Previsou demension : ",data[:,0:2].shape)
print("New demension : ",X.shape)

いかがでしょうか。118個のデータが全部28次元に変換されていることが確認できましたか。この新しい$X$と既存の$Y$をこれから学習処理で使う予定です。

ちなみに、皆さんが上のコードを正しく理解したのか簡単にテストしてみます。

<h3>ここで課題です。PolynomialFeatures関数のアウトプットを自分で計算してみてください。</h3>

必要なライブラリは最初にimportしておきますので、使ってください。<br/>

<h4>コード作成後、実行すると、自動採点を行います。$Correct$が表示されると成功です。</h4>

<h4>注意：</h4>

- 以下の部分にコードを書いてください。（yourAnswer Listの値を自分で計算してコードに入力してください。）

#------- Coding Start -------
#------- Coding End -------

- yourAnswer Listの値の順番はtestResultと一致しなくてもいいことにします。

In [None]:
testInput = [[3,4]]
testPoly = PolynomialFeatures(2)
testResult = testPoly.fit_transform(testInput)

yourAnswer = [0, 0, 0, 0, 0, 0]

#------- Coding Start -------
yourAnswer[0] = 0     # <-- replace this value
yourAnswer[1] = 0     # <-- replace this value
yourAnswer[2] = 0     # <-- replace this value
yourAnswer[3] = 0     # <-- replace this value
yourAnswer[4] = 0     # <-- replace this value
yourAnswer[5] = 0     # <-- replace this value
#------- Coding End -------

#-----------------------------------------------------------
# Evaluation
#-----------------------------------------------------------
print("Your Answer : Correct") if sorted(testResult[0]) == sorted(yourAnswer) else print("Your Answer : Wrong")

結果はいかがでしょうか。簡単でしょう。

<h3>これから、本格的に機械学習コードを作成してみます。前回作成した以下の3個の関数を全部こちらに持ってきてください。</h3>

- sigmoid
- costFunction
- gradientDescentForMinimize

<h4>コード作成後、実行すると、自動採点を行います。$Correct$が表示されると成功です。</h4>

<h4>注意：</h4>

- 以下の部分にコードを書いてください。

#------- Coding Start -------
#------- Coding End -------

In [None]:
# Sigmoid Function
# ------- Coding Start ------- 

# ------- Coding End -------

# Cost Function
# ------- Coding Start -------

# ------- Coding End -------

# Gradient Descent Function
# ------- Coding Start -------

# ------- Coding End -------

# Call minimize function - Learning by minimize function from Scikit
init_theta = np.zeros(X.shape[1])
res = minimize(costFunction, init_theta, args=(X,Y), method=None, jac=gradientDescentForMinimize, options={'maxiter':3000})

print("Learning result -> theta : ", res.x)

#-----------------------------------------------------------
# Evaluation
#-----------------------------------------------------------
def evaluate(theta0, min, max):
    print("theta0 = ", theta0, " => Correct") if theta0 >= min and theta0 <= max else print("theta0 = ", theta0, " => Wrong")
    
evaluate(res.x[0],35.101910585768,35.101910585769)

いかがでしょうか。これで仮定関数の作成に必要なパラメーター$theta$が揃えました。$theta$もインプット$X$と同じ28次元です。これで仮定関数は以下のような形になるでしょう。

$$h(X) = \theta_0 + \theta_1 * X1 + \theta_2 * X2 + \theta_3 * X1X2 + \theta_4 * X1^{2} + \theta_5 * X2^{2} + ... $$

そして、$h(X)$はsigmoid関数のインプット値として利用され、$0$或いは$1$の判別の推論を行うことになります。

<h4>実際に決定境界 (decision boundary)も可視化してみましょう。</h4>

グラフの形がかなり複雑なイメージになりそうですので、簡単にはグラフが描けそうではありません。でもpythonのmatplotlibライブラリーで簡単にできる方法があります。

多分良品データの$h(X)$のアウトプットと不良品のアウトプットはそれぞれsigmoidにより$1$もしくは$0$のどちらかに判定されやすいレンジに収まっているはずですので、その二つのグループのアウトプットの間にはかなりの差が存在する可能性が高いです。そのため、とてもいい方法は等高線を活用することです。matplotlibのcontourグラフで差が大きい二つのグループの間に等高線を引くことが可能です。

<h4>以下のコードを実行してみてください。</h4>

In [None]:
# draw scatter graph
negative = data[:,2] == 0
positive = data[:,2] == 1

plt.scatter(data[positive][:,0],data[positive][:,1], marker = 'o', c = 'r')
plt.scatter(data[negative][:,0],data[negative][:,1], marker = 'x', c = 'b')

plt.xlabel("X1 : Exam 1 Score")
plt.ylabel("X2 : Exam 2 Score")

# draw contour graph
#create a meshgrid of theta0 and theta1
X1 = np.linspace(-1, 1.2, 50) # range of X1 from -1 to 1.2
X2 = np.linspace(-1, 1.2, 50) # range of X2 from -1 to 1.2
xx, yy = np.meshgrid(X1, X2, indexing='xy')

#get h(x) result from all possible values of X1 and X2
zz = np.zeros((X1.size, X2.size))
for (i,j),v in np.ndenumerate(zz):
    temp = np.array([xx[i,j], yy[i,j]], ndmin=2)
    poly = PolynomialFeatures(6)
    zz[i,j] = poly.fit_transform(temp).dot(res.x)
    
plt.contour(xx,yy,zz,0,colors='g')
plt.show()

いかがでしょうか。$sigmoid$関数の判定結果も実際に可視化してみましょう。3Dで描いてみるとても分かりやすいと思います。

<h4>以下のコードを実行してみてください。</h4>

In [None]:
#draw 3D graph
fig = plt.figure(figsize=(6,6))
zz3d = sigmoid(zz)
ax = Axes3D(fig)
ax.plot_surface(xx, yy, zz3d, rstride=1, cstride=1, alpha=0.6, cmap=plt.cm.jet)

ax.set_xlabel("X1 : Exam 1 Score")
ax.set_ylabel("X2 : Exam 2 Score")
ax.set_zlabel(r'$\hat{Y} = sigmoid(z)$')

グラフは分かりやすいですか。

<h4>ここまでくると、推論モデルの作成はほぼ完成です。</h4>
    
最後にこの推論モデルの正答率を定量的に評価してみましょう。

<h3>ここで課題です。推論モデルの正答率を評価する$accuracy$関数を作成してください。</h3>

<h4>コード作成後、実行すると、自動採点を行います。$Correct$が表示されると成功です。</h4>

<h4>注意：</h4>

- 以下の部分にコードを書いてください。

#------- Coding Start -------
#------- Coding End -------

- 前回作成したコードを持ってきてもいいです。

In [None]:
def accuracy(theta, X, Y, threshold = 0.5):
    accu = 0.0
    
    #------- Coding Start -------

    
    
    #------- Coding End -------
    
    return accu

#-----------------------------------------------------------
# Evaluation
#-----------------------------------------------------------
def evaluateAccuracy(value, result):
    print("Accuracy = %3.2f%%"%(value * 100), " => Correct") if value >= result else print("Accuracy = %3d%%"%(value * 100), " => Wrong")
        
evaluateAccuracy(accuracy(res.x, X, Y),0.91)

<h4>あなたは、もうちょっと正答率が高ければいいけど、この程度でも十分実際のプロダクトテスト工程で導入しても問題はないと判断しました。</h4>

<h3>最後の課題です。</h3>
    
今回作成した推論モデルを使って、プロダクトの品質を判定する人工知能エンジン（$predict$関数）を作成してください。

<h4>コード作成後、実行すると、自動採点を行います。5回$Correct$が表示されると完成です。</h4>

注意：
以下の部分にコードを書いてください。
#------- Coding Start -------
#------- Coding End -------

In [None]:
def predict(theta, X, threshold = 0.5):
    p = 0

    #------- Coding Start -------

    
    
    #------- Coding Start -------
  
    return p.astype('int')

#-----------------------------------------------------------
# Evaluation
#-----------------------------------------------------------
def evaluatePredict(value, result):
    print("Predicted Result = ", value, " => Correct") if value == result else print("Predicted Result = ", value, " => Wrong")

evaluatePredict(predict(res.x, np.array([[0, 0]])),1)
evaluatePredict(predict(res.x, np.array([[-0.25, 0.25]])),1)
evaluatePredict(predict(res.x, np.array([[-0.3, -0.25]])),0)
evaluatePredict(predict(res.x, np.array([[0.6, 0.0]])),0)
evaluatePredict(predict(res.x, np.array([[-0.25, 0.8]])),1)

<h4>大変お疲れ様でした。</h4>

この結果をあなたの上司に報告してください。これで、高いボーナスゲットしてください。そして、あなたを助けてくれたKikiちゃんにも感謝の言葉を伝えてください。食事に誘うのも良いと思います。