# 多項式回帰分析
Rデータセットのcarsのデータを用いる。
carsの説明 : 次のサイトからcarsを検索  
https://stat.ethz.ch/R-manual/R-devel/library/datasets/html/00Index.html <br>
このデータを予め取得して、下記のように置いた。<br>
これを読み込み、多項式回帰分析を説明する。<br>

本Notebookと類似のREG_Poly_R_cars.ipynbはRデータセットを読込むために、別途、必要なパッケージを予めインストールして、この上で、Rデータセットを読込む。このインストールを省くことを行ったのが本Notebookである。

In [None]:
# -*- coding: utf-8 -*-
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

import statsmodels.formula.api as smf

FLAG_fig = False

In [None]:
url = "https://sites.google.com/site/datasciencehiro/datasets/cars_R_datasets.csv"
df = pd.read_csv(url)  # read datasets of cars
x = df.speed
df.head()

#### 1次モデル
$y = b_0 + b_1 x$

In [None]:
result1 = smf.ols('dist ~ speed', data=df).fit()
print(result1.summary())
b0, b1 = result1.params

In [None]:
df.plot(kind='scatter', x='speed', y='dist')
plt.plot(x, b0+b1*x)

if FLAG_fig: plt.savefig('fig_REG_poy_R_cars_01.eps')
plt.show()

#### 2次モデル
$y = b_0 + b_1 x + b_2 x^2$

df.plot(kind='scatter', x='speed', y='dist')
plt.plot(x, b0+x*b1)

In [None]:
result2 = smf.ols('dist ~ np.power(speed,2) + speed', data=df).fit()
print(result2.summary())
b0, b2, b1 = result2.params

In [None]:
df.plot(kind='scatter', x='speed', y='dist')
plt.plot(x, b0+b1*x+b2*(x**2))

if FLAG_fig: plt.savefig('fig_REG_poy_R_cars_02.eps')
plt.show()

#### 3次モデル
$y = b_0 + b_1  + b_2 x^2 + b_3 x^3$

In [None]:
result3 = smf.ols('dist ~ np.power(speed,3) + np.power(speed,2) + speed', data=df).fit()
print(result3.summary())
b0, b3, b2, b1 = result3.params

In [None]:
df.plot(kind='scatter', x='speed', y='dist')
plt.plot(x, b0+b1*x+b2*(x**2) + b3*(x**3))

if FLAG_fig: plt.savefig('fig_REG_poy_R_cars_03.eps')
plt.show()

## nupmy.polyfit（）を用いたカーブフィッティングの例

In [None]:
x = df.speed
y = df.dist
degree = 2
fit = np.polyfit(x, y, degree)
print(fit)
est = np.poly1d(fit)
print(est)
plt.scatter(x,y)
plt.plot(x,est(x))
plt.title('degree = %d' % degree)

In [None]:
degree = 3
fit = np.polyfit(x, y, degree)
print(fit)
est = np.poly1d(fit)
print(est)
plt.scatter(x,y)
plt.plot(x,est(x))
plt.title('degree = %d' % degree)

#### 次の例は，オーバーフィッティング（over fitting）を示す

In [None]:
degree = 9
fit = np.polyfit(x, y, degree)
print(fit)
est = np.poly1d(fit)
print(est)
plt.scatter(x,y)
plt.plot(x,est(x))
plt.title('degree = %d' % degree)