<h3>機械学習課題 2 : Linear Regression 回帰分析 Part 1 - Cost Function 目的関数</h3><br/>

<h4>注意 : pythonコードを実行しながら読んでください!</h4><br/>

前回の課題を一度復習しましょう。

前回我々がやってきた作業は以下のことでした。

1. 仮定関数を意識
2. 学習させたいデータの可視化（テーブル、グラフ）
3. データの分布パターンを目で確認し、パターンに一番合う線グラフを発見
4. 上記グラフを方程式で表現
5. この方程式を仮定関数とする。

<br/>
今回の課題では上記の中で,ステップ3、4について深掘りして行きたいと思います。
実際に統計学では連続しているデータ分布パターンに対して、$Y = f(X)$のようなモデルをデータに当てはめることを回帰分析(Linear Regression)と言います。

ワウ！これなんでしょう。頭が痛くなる方もいると思います。こんなの何年ぶりなんだろう。<br/>
でも、安心してください。前回の課題で、既にに一度やっていましたね。タイトルがすごい物のように見えますが、思ったより簡単です。
<br/>
まず、前回の最後に使っていたデータを持ってきて、グラフを書いてみましょう。

In [None]:
#import required libraries
import numpy as np
import matplotlib.pyplot as plt

data = np.loadtxt('ex1data1.txt', delimiter=',')

# ------- Coding Start -------

# ------- Coding End -------

<h4>グラフは表示されましたか。</h4>

$(X, Y)$点々の分布をみると、おそらく前回と同様の線形方程式でパターンを表すことができそうな気がしますが、形が綺麗な線形ではない為、どうすれば正しい方程式になるのか、よくわからない状況です。前回みたいに方程式のパラメーターが簡単に決まらないので、今回は仮定関数を以下のような一次方程式に表してみました。

$$\hat{Y} = h(X) = \theta_0 + \theta_1 * X$$

まだ決まらない値を$\theta_0$、$\theta_1$にしました。これから我々のミッションはデータの分布のパターンに当てはまる方程式の最適な$\theta_0$、$\theta_1$を見つけることです。しかし、データがたくさん増えると人間はこの値を決めることができません。どうすればいいでしょう。それは、コンピューターに任すしかないです。

最適な$\theta_0$、$\theta_1$を見つけるというのは、もう少し具体的には、上のコードで読み込んだ$(X,Y)$の全ての点と、仮定関数 $\hat{Y} = \theta_0 + \theta_1 * X$の線との間の平均距離が一番小さくなる$\theta_0$、$\theta_1$の値を見つける意味です。

平均距離が小さいか大きいかを確認するには何かの手法が必要です。ここではその距離を計算する手法を目的関数（Cost Function）$J$と呼ぶことにします。<br/>
これから目的関数を作ってみましょう。まず、$(X, Y)$と仮定関数$\hat{Y}$との距離を次のように表してみます。

$$(Y - \hat{Y})^2$$

2乗を計算したのは$Y - \hat{Y}$の結果が$0$より小さくなる可能性があるからです。ある$\theta_0$、$\theta_1$の値に対して、全ての$(X, Y)$のデータと仮定関数$\hat{Y}$との距離の平均値$J(\theta_0,\theta_1)$は以下のように表すことが出来ます。（ここで$m$はデータ$Y$の数と考えれば良いです。）

$$J(\theta_0,\theta_1) = \frac{1}{2m}\sum_{i=1}^m(\hat{Y} - Y)^2$$

これを少し形を変えると以下のようにも表すことが出来ます。

$$J(\theta_0,\theta_1) = \frac{1}{2m}\sum_{i=1}^m((\theta_0 + \theta_1 * X) - Y)^2$$

<h3>ここで課題です。目的関数$J(\theta_0,\theta_1)$をpythonで書いてみましょう。</h3>

numpyライブラリを利用して簡単に作成できるはずです。numpyはコードの最初にimportしておきますので、使ってください。<br/>

<h4>注意：</h4>

- 以下の部分のみコードを書いてください。他の部分は修正しないでください。

#------- Coding Start -------
#------- Coding End -------

<h4>コード作成後、実行すると、自動採点を行います。6回$Correct$が表示されると成功です。</h4>

In [None]:
# Cost Function
def costFunction(X, Y, theta0, theta1):
    J = 0
    
    # ------- Coding Start -------

    # ------- Coding End -------
    return J


# Evaluation
def evaluate(J, min, max):
    print("J = ", J, " => Correct") if J > min and J < max else print("J = ", J, " => Wrong")

evaluate(costFunction(X, Y, 1, 2), 75.20, 75.21)
evaluate(costFunction(X, Y, 1, 1), 10.26, 10.27)
evaluate(costFunction(X, Y, 1, 0.5), 8.32, 8.33)
evaluate(costFunction(X, Y, 1, 0.7), 6.65, 6.66)
evaluate(costFunction(X, Y, 0.5, 0.7), 6.34, 6.35)
evaluate(costFunction(X, Y, -1, 1), 5.62, 5.63)

<h4>いかがですか。良い結果が出ましたか。</h4>

採点結果をみると$J$の計算結果が表示されます。ちょっと注意してみると$J$の値が減っていくことが見えますか。$costFunction$のパラメーターの$\theta_0$、$\theta_1$を少しづつ変えていくと、$J$が減っていきます。これから$\theta_0$、$\theta_1$が変わると仮定関数 $\hat{Y} = \theta_0 + \theta_1 * X$の形がどう変わっていくのか見てみましょう。

以下のコードを順番で実行しながら、グラフの形を見てください。

<h4>1回目の採点 : $\theta_0 = 1$、$\theta_1 = 2$</h4>

In [None]:
# Graph for the first evaluation
theta0 = 1
theta1 = 2

print("J =", costFunction(X, Y, theta0, theta1))
plt.scatter(X, Y)
xx = np.arange(4.5,22.5)
yy = theta0 + theta1 * xx
plt.plot(xx,yy, c='r') 
plt.xlabel("X")
plt.ylabel("Y")

<h4>2回目の採点 : $\theta_0 = 1$、$\theta_1 = 1$</h4>

In [None]:
# Graph for the second evaluation
theta0 = 1
theta1 = 1

print("J =", costFunction(X, Y, theta0, theta1))
plt.scatter(X, Y)
xx = np.arange(4.5,22.5)
yy = theta0 + theta1 * xx
plt.plot(xx,yy, c='r') 
plt.xlabel("X")
plt.ylabel("Y")

<h4>3回目の採点 : $\theta_0 = 1$、$\theta_1 = 0.5$</h4>

In [None]:
# Graph for the third evaluation
theta0 = 1
theta1 = 0.5

print("J =", costFunction(X, Y, theta0, theta1))
plt.scatter(X, Y)
xx = np.arange(4.5,22.5)
yy = theta0 + theta1 * xx
plt.plot(xx,yy, c='r') 
plt.xlabel("X")
plt.ylabel("Y")

<h4>4回目の採点 : $\theta_0 = 1$、$\theta_1 = 0.7$</h4>

In [None]:
# Graph for the fourth evaluation
theta0 = 1
theta1 = 0.7

print("J =", costFunction(X, Y, theta0, theta1))
plt.scatter(X, Y)
xx = np.arange(4.5,22.5)
yy = theta0 + theta1 * xx
plt.plot(xx,yy, c='r') 
plt.xlabel("X")
plt.ylabel("Y")

<h4>5回目の採点 : $\theta_0 = 0.5$、$\theta_1 = 0.7$</h4>

In [None]:
# Graph for the fifth evaluation
theta0 = 0.5
theta1 = 0.7

print("J =", costFunction(X, Y, theta0, theta1))
plt.scatter(X, Y)
xx = np.arange(4.5,22.5)
plt.plot(xx,yy, c='r') 
plt.xlabel("X")
plt.ylabel("Y")

<h4>6回目の採点 : $\theta_0 = -1$、$\theta_1 = 1$</h4>

In [None]:
# Graph for the sixth evaluation
theta0 = -1
theta1 = 1

print("J =", costFunction(X, Y, theta0, theta1))
plt.scatter(X, Y)
xx = np.arange(4.5,22.5)
yy = theta0 + theta1 * xx
plt.plot(xx,yy, c='r') 
plt.xlabel("X")
plt.ylabel("Y")

<h4>いかがでしょうか。</h4>

$\theta_0$、$\theta_1$が変わると$J$がどう変わるのか、そして仮定関数の線形グラフの形がどう変わるのか確認しましたか。

これで今回の最後ですが、終わる前にもう一つやって見ましょう。

<h3>ここで本当の最後の課題です。目的関数$J(\theta_0,\theta_1)$を$4.5$以下まで減らしてみましょう。</h3>

適切な$\theta_0$、$\theta_1$の値を調べてみましょう。<br/>

<h4>注意：</h4>

- 以下の部分のみコードを書いてください。他の部分は修正しないでください。

#------- Coding Start -------
#------- Coding End -------

<h4>コード作成後、実行すると、自動採点を行います。$Correct$が表示されると成功です。</h4>

In [None]:
#------- Coding Start -------
theta0 = 0  # replace zero with other value
theta1 = 0  # replace zero with other value
#------- Coding End -------

evaluate(costFunction(X, Y, theta0, theta1), 0, 4.5)
plt.scatter(X, Y)
xx = np.arange(4.5,22.5)
yy = theta0 + theta1 * xx
plt.plot(xx,yy, c='r') 
plt.xlabel("X")
plt.ylabel("Y")

<h3>お疲れ様でした。次に進めましょう。</h3>