In [None]:
import numpy as np
import pickle
import matplotlib.pyplot as plt

In [None]:
%matplotlib inline

In [None]:
# データ読み込み
notepc_data = pickle.load(open("notepc_data.pkl", "br"))

# カラム
# 0: price
# 1: num_of_cores
# 2: clock
# 3: memory
# 4: disk
# 5: weight
# 6: months

In [None]:
notepc_data

In [None]:
# データのサイズ・形は？
notepc_data.shape

In [None]:
# 値段 (prices) の列を取り出す
price = notepc_data[:, 0]

In [None]:
price

In [None]:
# 入力変数（値段以外）の列を取り出す
data_x = notepc_data[:, 1:]

In [None]:
data_x[:3]

In [None]:
# クロック数（clock, カラム 2）だけ取り出す
clock = notepc_data[:, 2]

In [None]:
clock[:3]

In [None]:
# クロック数とメモリ容量を取り出す
clock_memory = notepc_data[:, 2:4]

In [None]:
clock_memory[:3]

In [None]:
# 散布図プロット
plt.scatter(clock, price)

In [None]:
# モデルの計算対象とする 入力変数
x = np.linspace(1.0, 3.0, 21)

In [None]:
x

In [None]:
# 適当なモデル
price_pred = 20000. * x + 30000.

In [None]:
plt.scatter(clock, price)
plt.plot(x, price_pred, color="red")

In [None]:
# データに基づく係数
price_pred = 119334. * x - 120506

In [None]:
plt.scatter(clock, price)
plt.plot(x, price_pred, color="red")

In [None]:
# 以下の係数を使い、price_pred_2 = w2 * x^2 + w1 * x + b で予測
# w2: 105885.
# w1: -315584.
# b: 287738.

x2 = np.stack([x ** 2., x], axis=1)
w2 = np.array([105885., -315584.], dtype=np.float32)
b = np.array(287738., dtype=np.float32)

price_pred_2 = np.dot(x2, w2) + b

In [None]:
plt.scatter(clock, price)
plt.plot(x, price_pred_2, color="red")

In [None]:
# 以下の係数を使い、price_pred_3 = w3 * x^3 + w2 * x^2 + w1 * x + b で予測
# w3: 102021.
# w2: -535402.
# w1: 964848.
# b: -508880.

x3 = np.stack([x ** 3., x ** 2., x], axis=1)
w3 = np.array([102021., -535402., 964848.])
b = -508880.
price_pred_3 = np.dot(x3, w3) + b

In [None]:
plt.scatter(clock, price)
plt.plot(x, price_pred_3, color="red")

In [None]:
# 1件目のデータのclock
clock[0]

In [None]:
# 1つのデータポイントの予測値
price_pred = 119334. * clock[0] - 120506

print("予測： {:>6}".format(int(price_pred)))
print("実際： {:>6}".format(int(price[0])))

In [None]:
# 全てのデータポイントの予測値

price_pred = 119334. * clock - 120506

for y, t in zip(price_pred, price):
    print("予測： {:>6}、実際： {:>6}".format(int(y), int(t)))
    
cost = 0.5 * np.sum((price_pred - price) ** 2.) / len(clock)
print("")
print("誤差： {}".format(int(cost)))

In [None]:
# 1件目の clock, memory
clock_memory[0]

In [None]:
# 以下の係数を使い、price_pred = w0 * clock + w1 * memory + b で予測
# w0: 76896.
# w1: 5484.
# b: -77242.

w = np.array([76896., 5484.], dtype=np.float32)
b = np.array(-77242., dtype=np.float32)

y = np.dot(clock_memory[0], w) + b

print("予測： {:>6}".format(int(y)))
print("実際： {:>6}".format(int(price[0])))

In [None]:
# 全ての clock_memoryのデータポイントについて まとめて計算するには

w = np.array([76896., 5484.], dtype=np.float32)
b = np.array(-77242., dtype=np.float32)

price_pred = np.dot(clock_memory, w) + b

for y, t in zip(price_pred, price):
    print("予測： {:>6}、実際： {:>6}".format(int(y), int(t)))
    
cost = 0.5 * np.sum((price_pred - price) ** 2.) / len(clock_memory)
print("")
print("誤差： {:>6}".format(int(cost)))

In [None]:
# 1件目の入力変数 全て（num_of_cores, clock, memory, disk, weight, months）

In [None]:
data_x[0]

In [None]:
# 以下の係数を使い、
#   price_pred = w0 * num_of_cores + w1 * clock + w2 * memory
#    + w3 * disk + w4 * weight + w5 * months
# で 1件目について予測
# 
# w0: 23596.
# w1: 58164.
# w2: 2491.
# w3: 61.74
# w4: -20707.
# w5: 763.5
# b: -61109.

w = np.array([23596., 58164., 2491., 61.74, -20707., 763.5], dtype=np.float32)
b = np.array(-61109., dtype=np.float32)

price_pred = np.dot(data_x[0], w) + b

print("予測： {:>6}".format(int(price_pred)))
print("実際： {:>6}".format(int(price[0])))

In [None]:
# 全ての data_x のデータポイントについて まとめて計算するには

w = np.array([23596., 58164., 2491., 61.74, -20707., 763.5], dtype=np.float32)
b = np.array(-61109., dtype=np.float32)

price_pred = np.dot(data_x, w) + b

for y, t in zip(price_pred, price):
    print("予測： {:>6}、実際： {:>6}".format(int(y), int(t)))
    
cost = 0.5 * np.sum((price_pred - price) ** 2.) / len(data_x)
print("")
print("誤差： {:>6}".format(int(cost)))