# 5. より高度な分析2：気温から売り上げを予測する

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import calendar
import japanize_matplotlib
import seaborn as sns 
from sklearn.metrics import r2_score

### データの読み込み

In [None]:
df = pd.read_csv("choco_ice.csv", encoding="sjis")
df

### コード5.1：線形単回帰

In [None]:
x_name = '日最高気温の平均(℃)'
y_name = 'アイスクリーム・シャーベット【円/日】'

x = df[x_name].values
y = df[y_name].values
a, b = np.polyfit(x, y, deg=1)
r2 = r2_score(y, a*x + b)

print(f"y = {a:.4f}x + {b:.4f}")
print(f"R^2: {r2:.4f}")

### 図5.2：アイスクリームの回帰直線

In [None]:
plt.scatter(x, y, alpha=0.5)
x_minmax = np.array([x.min(), x.max()])
y_pred = a * x_minmax + b
plt.plot(x_minmax, y_pred, linewidth=2)
plt.xlabel(x_name)
plt.ylabel(y_name)
plt.show()

### コード5.2：次数2の単回帰

In [None]:
x_name = '日最高気温の平均(℃)'
y_name = 'アイスクリーム・シャーベット【円/日】'

x = df[x_name].values
y = df[y_name].values
a2, a1, b = np.polyfit(x, y, deg=2)
r2 = r2_score(y, a2 * x**2 + a1 * x + b)

print(f"y = {a2:.4f}x^2 + {a1:.4f}x + {b:.4f}")
print(f"R^2: {r2:.4f}")

### 図5.3：アイスクリームの回帰曲線

In [None]:
plt.scatter(x, y, alpha=0.5)
x_minmax = np.linspace(x.min(), x.max(), 100)
y_pred = a2 * x_minmax**2 + a1 * x_minmax + b
plt.plot(x_minmax, y_pred, linewidth=2)
plt.xlabel(x_name)
plt.ylabel(y_name)
plt.show()

### コード5.3：説明変数が2つの場合の重回帰

In [None]:
from sklearn.linear_model import LinearRegression

x = df[['日最高気温の平均(℃)', 'feb']].values
y = df['チョコレート【円/日】'].values

lr = LinearRegression()
lr.fit(x, y)
a1, a2 = lr.coef_
b = lr.intercept_
r2 = r2_score(y, a1 * x[:,0] + b + a2 * x[:,1])

print(f"y = {a:.4f}x + {b:.4f}v + {a2:.4f}")
print(f"R^2: {r2:.4f}")

### 図5.4：ダミー変数を導入したチョコレートの回帰直線

In [None]:
x_minmax = np.array([x[:,0].min(), x[:,0].max()])
y_pred = a1 * x_minmax + b
x_name = "日最高気温の平均(℃)"
y_name = "チョコレート【円/日】"
ax = df[df.feb==0].plot(kind='scatter', x=x_name, y=y_name, alpha=0.5)
df[df.feb==1].plot(kind='scatter', x=x_name, y=y_name, marker='^', ax=ax, alpha=0.5, color="orange")
plt.plot(x_minmax, y_pred, linewidth=2)
plt.plot(x_minmax, y_pred + a2, linewidth=2, linestyle="dashed", color="orange")
plt.show()