**Python入門（その2）：Pythonで単回帰**

このColabのノートブック「Python入門（その2）」では「statsmodels.formula.apiを使って単回帰（回帰分析）をする方法」を解説します（重回帰は別に説明します）。
すでに「[Python入門](https://colab.research.google.com/github/chainer/tutorials/blob/master/ja/02_Basics_of_Python.ipynb)」を読んでいることを前提に説明します。

> 注：このノートブックは駒澤大学経済学部で開講している「経済統計a/b」で「Excel以外の手法を学ぶ意欲がある履修生向け」に**最低限の知識**だけ解説する**補助資料**です

> このノートブックでは「statsmodels.formula.apiを使う」方法を解説します（Rに慣れている人はこちらの「~」を使う表記の方が馴染みがあるはず）。以下の公式サイトを参考にしました。
<br>
https://www.statsmodels.org/
<br>
https://www.statsmodels.org/devel/example_formulas.html


In [None]:
# 最初に重要な呪文を唱えます。
# 初心者の間は何をしているのかわからなくても構いません。
import pandas as pd
import statsmodels.formula.api as smf
# 注釈：statsmodelsのメソッドを使う場合は、以下のように
# statsmodels.apiのimportが必要となります。
# import statsmodels.api as sm


データ分析（回帰分析）を使うため、データ（CSVファイル）をインターネットから読み込みます。ここではread_csvというメソッドを使ってインターネット上にあるデータをPythonに読み込み、ice_dataという名前で保存します。head()というメソッドはデータを上から5行表示するメソッドです。

In [None]:
ice_data = pd.read_csv("https://www.dropbox.com/s/2ky13qi387j8b05/kion_iceCream.csv?raw=1",encoding="utf_8")
ice_data.head()

Unnamed: 0,年月,気温,アイスクリーム支出金額
0,2005年4月,15.1,541
1,2005年5月,17.7,666
2,2005年6月,23.2,801
3,2005年7月,25.6,1033
4,2005年8月,28.1,1175


ice_dataはデータフレームという形式で保存されています。<br>
<br>
回帰分析（最小二乗法）にはメソッドols()とfit()を使います。

In [None]:
# 回帰モデルを作成
sm_model  = smf.ols('アイスクリーム支出金額 ~ 気温', data=ice_data)
# 最小二乗法で回帰モデルを推定
result = sm_model.fit()

print(result.params)

Intercept    16.639928
気温           35.074078
dtype: float64


メソッドsummary()を使うと回帰結果をまとめて表示してくれます。

In [None]:
print(result.summary())


                            OLS Regression Results                            
Dep. Variable:            アイスクリーム支出金額   R-squared:                       0.807
Model:                            OLS   Adj. R-squared:                  0.804
Method:                 Least Squares   F-statistic:                     243.3
Date:                Mon, 22 Mar 2021   Prob (F-statistic):           2.06e-22
Time:                        12:34:12   Log-Likelihood:                -374.43
No. Observations:                  60   AIC:                             752.9
Df Residuals:                      58   BIC:                             757.0
Df Model:                           1                                         
Covariance Type:            nonrobust                                         
                 coef    std err          t      P>|t|      [0.025      0.975]
------------------------------------------------------------------------------
Intercept     16.6399     40.652      0.409      0.6