# ハンバーガー統計学 with Python 第9章

第６回講義（2017年10月17日講義、10月20日課題提出締切）

このページは、<a href="http://kogolab.chillout.jp/elearn/hamburger/index.html" target="_blank">ハンバーガー統計学にようこそ！</a>を終えた学生向けに、復習と補足のために私が追記したものです。

<h1 STYLE="background: #c2edff;padding: 0.5em;">第９章 ここまでの復習</h1>

今まで、カイ２乗検定、t検定、分散分析などを勉強してきました。これらの手法は広く使われているので、Python含め、多くのプログラミング言語で汎用ライブラリがあります。計算方法やその意味は既に会得したことと思いますので、今後はこれらのライブラリを使ってみましょう。

<h2 STYLE="background: #c2edff;padding: 0.5em;">9.1 カイ２乗検定</h2>

<a href="HamburgerStatistics03.ipynb">第３章</a>の復習です。

カイ２乗検定は、観測データの分布が理論値の分布に従うかどうかを検定するときにも用いる手法です。

サイコロを60回ふり、各目が出た回数を数えたところ、次のようになりました。

<table border=1>
<tr><td>サイコロの目</td>
<td>１</td><td>２</td><td>３</td><td>４</td><td>５</td><td>６</td></tr>
<tr><td>出現回数</td>
<td>17</td><td>10</td><td>6</td><td>7</td><td>15</td><td>5</td></tr>
</table>

このとき、理論値の分布に従うかどうかを検定してみましょう。

In [1]:
from scipy import stats

significance = 0.05 # 有意水準
o = [17, 10, 6, 7, 15, 5] # 実測値（観測度数）
e = [10, 10, 10, 10, 10, 10] # 理論値（期待度数）

chi2, p = stats.chisquare(o, f_exp = e)

print( "chi2 値は %(chi2)s" %locals() )
print( "確率は %(p)s" %locals() )

if p < significance:
    print("有意水準 %(significance)s で、有意な差があります" %locals())
else:
    print("有意水準 %(significance)s で、有意な差がありません" %locals())

chi2 値は 12.4
確率は 0.0296994592035
有意水準 0.05 で、有意な差があります


<h4 style="border-bottom: solid 1px black;">２次元配列（行列）の場合のカイ２乗検定</h4>

２次元配列（行列）の例として、第３章で用いた表でカイ２乗検定してみましょう。

<TABLE BORDER="1" BGCOLOR="#FFFFFF" cellpadding="0" cellspacing="0">
  <TR> 
    <th WIDTH="100" HEIGHT="30" BGCOLOR="#CCCC99"> お店 </th>
    <th WIDTH="81" HEIGHT="30" BGCOLOR="#FFFFCC"> ポテト </th>
    <th WIDTH="100" HEIGHT="30" BGCOLOR="#FFCCCC"> チキン </th>
    <th WIDTH="100" HEIGHT="30" BGCOLOR="#CCCCCC"> 合計 </th>
  </TR>
  <TR align="center"> 
    <TD WIDTH="100" HEIGHT="30" BGCOLOR="#CCCC99"> ワクワク </TD>
    <TD WIDTH="100" HEIGHT="30" BGCOLOR="#FFFFFF"> 435</TD>
    <TD WIDTH="100" HEIGHT="30" BGCOLOR="#FFFFFF"> 165</TD>
    <TD WIDTH="100" HEIGHT="30" BGCOLOR="#CCCCCC"> 600</TD>
  </TR>
  <TR align="center"> 
    <TD WIDTH="119" HEIGHT="30" BGCOLOR="#CCCC99"> モグモグ </TD>
    <TD WIDTH="81" HEIGHT="30" BGCOLOR="#FFFFFF"> 265</TD>
    <TD WIDTH="100" HEIGHT="30" BGCOLOR="#FFFFFF"> 135</TD>
    <TD WIDTH="100" HEIGHT="30" BGCOLOR="#CCCCCC"> 400</TD>
  </TR>
</TABLE>

２次元配列（行列）の場合のカイ２乗検定は、下記のようにちょっとした工夫が必要になります。

In [2]:
from scipy import stats

significance = 0.05 # 有意水準
observed = [[435, 165], [265, 135]] # 実測値（観測度数）
expected = stats.contingency.expected_freq(observed) # 理論値（期待度数）
o = [item for sublist in observed for item in sublist] # 平滑化した実測値（観測度数）
e = [item for sublist in expected for item in sublist] # 平滑化した理論値（期待度数）
dof = (len(observed) - 1) * (len(observed[0]) - 1) # 自由度

chi2, p = stats.chisquare(o, f_exp = e, ddof = dof)

print( "chi2 値は %(chi2)s" %locals() )
print( "p 値は %(p)s" %locals() )

if p < significance:
    print("有意水準 %(significance)s で、有意な差があります" %locals())
else:
    print("有意水準 %(significance)s で、有意な差がありません" %locals())

chi2 値は 4.46428571429
p 値は 0.107298258771
有意水準 0.05 で、有意な差がありません


<h4 style="padding: 0.25em 0.5em;color: #494949;background: transparent;border-left: solid 5px #7db4e6;">課題9.1</h4>

ある野菜をＡ方式で育てたものとＢ方式で育てたものの出荷時の等級が次の表のようになったとき，これらの育て方と製品の等級には関連があると見るべきかどうか検定しなさい。

<table border="1" bgcolor="#FFFFFF" cellpadding="0" cellspacing="0" align="center">
  <tr> 
    <th width="100" height="30" bgcolor="#CCCC99"> 栽培方法 </th>
    <th width="100" height="30" bgcolor="#FFFFCC"> 優 </th>
    <th width="100" height="30" bgcolor="#FFCCCC"> 良 </th>
    <th width="100" height="30" bgcolor="#99FFCC"> 可 </th>
    <th width="100" height="30" bgcolor="#CCCCCC">合計</th>
  </tr>
  <tr align="center"> 
    <td width="100" height="30" bgcolor="#CCCC99"> Ａ方式 </td>
    <td width="100" height="30">435</td>
    <td width="100" height="30">165</td>
    <td width="100" height="30">650</td>
    <td width="100" height="30" bgcolor="#CCCCCC">1250</td>
  </tr>
  <tr align="center"> 
    <td width="100" height="30" bgcolor="#CCCC99"> Ｂ方式 </td>
    <td width="100" height="30">265</td>
    <td width="100" height="30">135</td>
    <td width="100" height="30">350</td>
    <td width="100" height="30" bgcolor="#CCCCCC">750</td>
  </tr>
  <tr align="center" bgcolor="#CCCCCC"> 
    <td width="119" height="30">合計</td>
    <td width="81" height="30">700</td>
    <td width="100" height="30">300</td>
    <td width="100" height="30">1000</td>
    <td width="100" height="30">2000</td>
  </tr>
</table>

In [3]:
# 課題9.1
from scipy import stats

significance = 0.05 # 有意水準
observed = [[435, 165, 650], [265, 135, 350]] # 実測値（観測度数）
expected = stats.contingency.expected_freq(observed) # 理論値（期待度数）
o = [item for sublist in observed for item in sublist] # 平滑化した実測値（観測度数）
e = [item for sublist in expected for item in sublist] # 平滑化した理論値（期待度数）
dof = (len(observed) - 1) * (len(observed[0]) - 1) # 自由度

chi2, p = stats.chisquare(o, f_exp = e, ddof = dof)

print( "chi2 値は %(chi2)s" %locals() )
print( "p 値は %(p)s" %locals() )

if p < significance:
    print("有意水準 %(significance)s で、有意な差があります" %locals())
else:
    print("有意水準 %(significance)s で、有意な差がありません" %locals())

chi2 値は 9.90476190476
p 値は 0.0193932860268
有意水準 0.05 で、有意な差があります


In [4]:
# 有意水準 5% において、異なる育て方により等級が異なるという結果が得られた。
# すなわち、これらの育て方と製品の等級にはある程度関連があると見るべきである。
# （ただし、有意水準 1% においては有意な差ではない）

<h2 STYLE="background: #c2edff;padding: 0.5em;">9.2 t検定</h2>

<a href="HamburgerStatistics04.ipynb">第４章</a>と<a href="HamburgerStatistics05.ipynb">第５章</a>の復習です。t検定も同様に、Pythonで使えるライブラリがあります。

<h4 style="border-bottom: solid 1px black;">対応のない t検定</h4>

In [5]:
# 対応のないt検定
import numpy as np
import scipy as sp
from scipy import stats

significance = 0.05
X = [68, 75, 80, 71, 73, 79, 69, 65]
Y = [86, 83, 76, 81, 75, 82, 87, 75]

t, p = stats.ttest_ind(X, Y)

print( "t 値は %(t)s" %locals() )
print( "確率は %(p)s" %locals() )

if p < significance:
    print("有意水準 %(significance)s で、有意な差があります" %locals())
else:
    print("有意水準 %(significance)s で、有意な差がありません" %locals())

t 値は -3.21404314682
確率は 0.0062436950143
有意水準 0.05 で、有意な差があります


<h4 style="padding: 0.25em 0.5em;color: #494949;background: transparent;border-left: solid 5px #7db4e6;">課題9.2</h4>

<a href="HamburgerStatistics04.ipynb">第４章</a>の復習。ある野菜をＡ方式で育てたものとＢ方式で育てたものについて、ある栄養素の含有量は下表のようであった。これらの育て方と含有量には関連があると見るべきかどうか検定しなさい。

<table border="1" bgcolor="#FFFFFF" cellpadding="0" cellspacing="0" align="center">
  <tr align="center"> 
    <th width="120" height="30" bgcolor="#ffffcc"> A方式 </th>
    <th width="120" height="30" bgcolor="#ffffcc"> 含有量 </th>
    <th width="120" height="30" bgcolor="#ffcccc"> B方式 </th>
    <th width="120" height="30" bgcolor="#ffcccc"> 含有量 </th>
  </tr>
  <tr align="center"> 
    <td width="120" height="30" bgcolor="#cccccc"> 1</td>
    <td width="120" height="30"> 70</td>
    <td width="120" height="30" bgcolor="#cccccc"> 1</td>
    <td width="120" height="30"> 85</td>
  </tr>
  <tr align="center"> 
    <td width="120" height="30" bgcolor="#cccccc">2</td>
    <td width="120" height="30">75</td>
    <td width="120" height="30" bgcolor="#cccccc">2</td>
    <td width="120" height="30">80</td>
  </tr>
  <tr align="center"> 
    <td width="120" height="30" bgcolor="#cccccc">3</td>
    <td width="120" height="30">70</td>
    <td width="120" height="30" bgcolor="#cccccc">3</td>
    <td width="120" height="30">95</td>
  </tr>
  <tr align="center"> 
    <td width="120" height="30" bgcolor="#cccccc">4</td>
    <td width="120" height="30">85</td>
    <td width="120" height="30" bgcolor="#cccccc">4</td>
    <td width="120" height="30">70</td>
  </tr>
  <tr align="center"> 
    <td width="120" height="30" bgcolor="#cccccc">5</td>
    <td width="120" height="30">90</td>
    <td width="120" height="30" bgcolor="#cccccc">5</td>
    <td width="120" height="30">80</td>
  </tr>
  <tr align="center"> 
    <td width="120" height="30" bgcolor="#cccccc">6</td>
    <td width="120" height="30">70</td>
    <td width="120" height="30" bgcolor="#cccccc">6</td>
    <td width="120" height="30">75</td>
  </tr>
  <tr align="center"> 
    <td width="120" height="30" bgcolor="#cccccc">7</td>
    <td width="120" height="30">80</td>
    <td width="120" height="30" bgcolor="#cccccc">7</td>
    <td width="120" height="30">80</td>
  </tr>
  <tr align="center"> 
    <td width="120" height="30" bgcolor="#cccccc">8</td>
    <td width="120" height="30">75</td>
    <td width="120" height="30" bgcolor="#cccccc">8</td>
    <td width="120" height="30">90</td>
  </tr>
</table>

In [6]:
X = [70, 75, 70, 85, 90, 70, 80, 75]
Y = [85, 80, 95, 70, 80, 75, 80, 90] 

In [7]:
# 課題9.2
t, p = stats.ttest_ind(X, Y)

print( "t 値は %(t)s" %locals() )
print( "確率は %(p)s" %locals() )

if p < significance:
    print("有意水準 %(significance)s で、有意な差があります" %locals())
else:
    print("有意水準 %(significance)s で、有意な差がありません" %locals())

t 値は -1.28812237744
確率は 0.218587022202
有意水準 0.05 で、有意な差がありません


In [8]:
# これらの育て方と含有量には関連があるとは言えない。

<h4 style="border-bottom: solid 1px black;">対応のある t検定</h4>

In [9]:
# 対応のあるt検定
import numpy as np
import scipy as sp
from scipy import stats

significance = 0.05
X = [68, 75, 80, 71, 73, 79, 69, 65]
Y = [86, 83, 76, 81, 75, 82, 87, 75]

t, p = stats.ttest_rel(X, Y)

print( "t 値は %(t)s" %locals() )
print( "確率は %(p)s" %locals() )

if p < significance:
    print("有意水準 %(significance)s で、有意な差があります" %locals())
else:
    print("有意水準 %(significance)s で、有意な差がありません" %locals())

t 値は -2.99232037543
確率は 0.0201600161737
有意水準 0.05 で、有意な差があります


<h4 style="padding: 0.25em 0.5em;color: #494949;background: transparent;border-left: solid 5px #7db4e6;">課題9.3</h4>

<a href="HamburgerStatistics05.ipynb">第５章</a>の復習。マウス８匹に対し行動テストを行なって点数を得た後、ある学習を施し、再び行動テストを行なった。その結果が下表である。その学習に効果があったかどうか検定しなさい。

<table border="1" bgcolor="#FFFFFF" cellpadding="0" cellspacing="0" align="center">
  <tr align="center"> 
    <th width="120" height="30" bgcolor="#ffffcc"> マウス </th>
    <th width="120" height="30" bgcolor="#ffffcc"> 学習前の点数 </th>
    <th width="120" height="30" bgcolor="#ffcccc"> 学習後の点数 </th>
  </tr>
  <tr align="center"> 
    <td width="120" height="30" bgcolor="#cccccc"> 1</td>
    <td width="120" height="30"> 90</td>
    <td width="120" height="30"> 95</td>
  </tr>
  <tr align="center"> 
    <td width="120" height="30" bgcolor="#cccccc">2</td>
    <td width="120" height="30">75</td>
    <td width="120" height="30">80</td>
  </tr>
  <tr align="center"> 
    <td width="120" height="30" bgcolor="#cccccc">3</td>
    <td width="120" height="30">75</td>
    <td width="120" height="30">80</td>
  </tr>
  <tr align="center"> 
    <td width="120" height="30" bgcolor="#cccccc">4</td>
    <td width="120" height="30">75</td>
    <td width="120" height="30">80</td>
  </tr>
  <tr align="center"> 
    <td width="120" height="30" bgcolor="#cccccc">5</td>
    <td width="120" height="30">80</td>
    <td width="120" height="30">75</td>
  </tr>
  <tr align="center"> 
    <td width="120" height="30" bgcolor="#cccccc">6</td>
    <td width="120" height="30">65</td>
    <td width="120" height="30">75</td>
  </tr>
  <tr align="center"> 
    <td width="120" height="30" bgcolor="#cccccc">7</td>
    <td width="120" height="30">75</td>
    <td width="120" height="30">80</td>
  </tr>
  <tr align="center"> 
    <td width="120" height="30" bgcolor="#cccccc">8</td>
    <td width="120" height="30">80</td>
    <td width="120" height="30">85</td>
  </tr>
</table>

In [10]:
X = [90, 75, 75, 75, 80, 65, 75, 80]
Y = [95, 80, 80, 80, 75, 75, 80, 85]

In [11]:
# 課題9.3
t, p = stats.ttest_rel(X, Y)

print( "t 値は %(t)s" %locals() )
print( "確率は %(p)s" %locals() )

if p < significance:
    print("有意水準 %(significance)s で、有意な差があります" %locals())
else:
    print("有意水準 %(significance)s で、有意な差がありません" %locals())

t 値は -2.96561491008
確率は 0.0209375702069
有意水準 0.05 で、有意な差があります


In [12]:
def average(list):
    sum = 0
    for x in list:
        sum += x
    return sum / len(list)

In [13]:
print(average(X), average(Y))

76.875 81.25


In [14]:
# 学習前の行動テストの点数の平均値よりも、学習後の行動テストの点数の平均値が高く、
# その差は 有意水準 5% において有意な差がある（有意水準 1% においては差がない）ことが分かった。
# すなわち、その学習にはある程度の効果があったと見なせるかも知れない。
# ただし、どのような行動テストだったかという詳しい内容が分からないので、
# その学習を施した効果なのか、その行動テストが２度目だったからなのかについては何とも言えない。

<h2 STYLE="background: #c2edff;padding: 0.5em;">9.3 分散分析</h2>

<a href="HamburgerStatistics06.ipynb">第６章</a>と<a href="HamburgerStatistics07.ipynb">第７章</a>の復習です。分散分析も同様に、Pythonで使えるライブラリがあります。

<h4 style="border-bottom: solid 1px black;">１要因の分散分析</h4>

In [15]:
# 1要因の分散分析
import numpy as np
import scipy as sp
from scipy import stats

significance = 0.05
a = [34, 39, 50, 72, 54, 50, 58, 64, 55, 62]
b = [63, 75, 50, 54, 66, 31, 39, 45, 48, 60]
c = [49, 36, 46, 56, 52, 46, 52, 68, 49, 62]
f, p = stats.f_oneway(a, b, c)

print( "f 値は %(f)s" %locals() )
print( "確率は %(p)s" %locals() )

if p < significance:
    print("有意水準 %(significance)s で、有意な差があります" %locals())
else:
    print("有意水準 %(significance)s で、有意な差がありません" %locals())

f 値は 0.0986151666715
確率は 0.906416171656
有意水準 0.05 で、有意な差がありません


<h4 style="padding: 0.25em 0.5em;color: #494949;background: transparent;border-left: solid 5px #7db4e6;">課題9.4</h4>

<a href="HamburgerStatistics06.ipynb">第６章</a>の復習です。ある野菜をＡ方式で育てたもの、Ｂ方式で育てたもの、C方式で育てたものについて、ある栄養素の含有量は下のようであった。これらの育て方と含有量には関連があると見るべきかどうか検定しなさい。

In [16]:
a = [80, 75, 80, 90, 95, 80, 80, 85, 85, 80, 90, 80, 75, 90, 85, 85, 90, 90, 85, 80]
b = [75, 70, 80, 85, 90, 75, 85, 80, 80, 75, 80, 75, 70, 85, 80, 75, 80, 80, 90, 80]
c = [80, 80, 80, 90, 95, 85, 95, 90, 85, 90, 95, 85, 98, 95, 85, 85, 90, 90, 85, 85]

In [17]:
# 課題9.4
f, p = stats.f_oneway(a, b, c)

print( "f 値は %(f)s" %locals() )
print( "確率は %(p)s" %locals() )

if p < significance:
    print("有意水準 %(significance)s で、有意な差があります" %locals())
else:
    print("有意水準 %(significance)s で、有意な差がありません" %locals())

f 値は 12.2231101945
確率は 3.82482645839e-05
有意水準 0.05 で、有意な差があります


In [18]:
# 少なくともどれか１つの育て方は含有量に影響するらしい。

<h4 style="border-bottom: solid 1px black;">２要因の分散分析</h4>

２要因の分散分析については、Pythonで汎用ライブラリがないようですので私が自作してみました（ひょっとしたらバグがあるかも知れません）。以下のコードを、もし読んで理解できそうなら読んでみてください。理解できそうでなければ、今はとりあえず、ただ単にコピペして実行すれば結構です。

In [19]:
import numpy as np
#２要因２水準の分散分析で要因A、要因B、交互作用のF値を計算する関数
def stats_f_twoway(a1b1, a1b2, a2b1, a2b2):
    ave11 = np.average(a1b1) # a1b1群の平均
    ave12 = np.average(a1b2) # a1b2群の平均
    ave21 = np.average(a2b1) # a2b1群の平均
    ave22 = np.average(a2b2) # a2b2群の平均
    
    avea1 = np.average(a1b1 + a1b2) # 水準a1の平均
    avea2 = np.average(a2b1 + a2b2) # 水準a2の平均
    aveb1 = np.average(a1b1 + a2b1) # 水準b1の平均
    aveb2 = np.average(a1b2 + a2b2) # 水準b2の平均
    
    ave = np.average(a1b1 + a1b2 + a2b1 + a2b2) # 全体の平均
    
    #要因Aによる残差（偏差平方和）
    zure1 = np.power((avea1 - ave), 2) * len(a1b1 + a1b2) + \
            np.power((avea2 - ave), 2) * len(a2b1 + a2b2)
        
    #要因Bによる残差（偏差平方和）
    zure2 = np.power((aveb1 - ave), 2) * len(a1b1 + a2b1) + \
            np.power((aveb2 - ave), 2) * len(a1b2 + a2b2)
    
    # 各群の平均の残差（偏差平方和）
    zure3 = np.power((ave11 - ave), 2) * len(a1b1) + \
            np.power((ave12 - ave), 2) * len(a1b2) + \
            np.power((ave21 - ave), 2) * len(a2b1) + \
            np.power((ave22 - ave), 2) * len(a2b2)
    
    # 交互作用による残差（偏差平方和）
    zure4 = zure3 - zure1 - zure2
    
    # 残りの残差（偏差平方和）
    zure5 = np.var(a1b1) * len(a1b1) + \
            np.var(a1b2) * len(a1b2) + \
            np.var(a2b1) * len(a2b1) + \
            np.var(a2b2) * len(a2b2)
    
    freedoma = 1 # 要因Aの自由度
    freedomb = 1 # 要因Bの自由度 
    freedomx = freedoma * freedomb # 交互作用の自由度
    freedom = len(a1b1 + a1b2 + a2b1 + a2b2) - 1 # 全体の自由度
    freedomz = freedom - freedoma - freedomb - freedomx # 残差の自由度
    
    mean_square_a = zure1 / freedoma # 要因Aの平均平方
    mean_square_b = zure2 / freedomb # 要因Bの平均平方
    mean_square_x = zure4 / freedomx # 交互作用の平均平方
    mean_square_z = zure5 / freedomz # 残差の平均平方
    
    f_a = mean_square_a / mean_square_z # 要因AのF値
    f_b = mean_square_b / mean_square_z # 要因BのF値
    f_x = mean_square_x / mean_square_z # 交互作用のF値
        
    return f_a, f_b, f_x, freedoma, freedomb, freedomx, freedomz

In [20]:
import numpy as np
# F分布に従うランダム分布を作り、それに基づいて棄却域の境目を返す
# dfnum : 群間の自由度
# dfden : 群内の自由度
def check_f_dist(dfnum, dfden, significance = 0.05, sample_size=1000000):
    dist = np.random.f(dfnum, dfden, sample_size)
    return sorted(dist)[int(-1 * sample_size * significance)]

In [21]:
import numpy as np
import scipy as sp

significance = 0.05 # 有意水準
a1b1 = [80, 85, 75, 70, 75, 60, 70, 75, 85, 70, 75, 85, 75, 85, 90] 
a1b2 = [85, 65, 80, 75, 85, 65, 75, 60, 80, 70, 75, 80, 65, 85, 75] 
a2b1 = [60, 70, 80, 75, 65, 60, 70, 75, 80, 65, 65, 75, 70, 85, 60] 
a2b2 = [55, 65, 50, 70, 50, 65, 75, 65, 75, 65, 70, 55, 65, 70, 65] 

f_a, f_b, f_x, freedoma, freedomb, freedomx, freedomz = stats_f_twoway(a1b1, a1b2, a2b1, a2b2)
threshold = check_f_dist(freedoma, freedomz, significance)

print( "要因Aのf値は %(f_a)s" %locals() )    
if f_a > threshold:
    print("　有意水準 %(significance)s で、有意な差があります" %locals())
else:
    print("　有意水準 %(significance)s で、有意な差がありません" %locals())

print( "要因Bのf値は %(f_b)s" %locals() )
if f_b > threshold:
    print("　有意水準 %(significance)s で、有意な差があります" %locals())
else:
    print("　有意水準 %(significance)s で、有意な差がありません" %locals())


print( "交互作用のf値は %(f_x)s" %locals() )
if f_x > threshold:
    print("　有意水準 %(significance)s で、有意な差があります" %locals())
else:
    print("　有意水準 %(significance)s で、有意な差がありません" %locals())

要因Aのf値は 17.5421686747
　有意水準 0.05 で、有意な差があります
要因Bのf値は 4.38554216867
　有意水準 0.05 で、有意な差があります
交互作用のf値は 0.934198331789
　有意水準 0.05 で、有意な差がありません


In [22]:
freedoma, freedomz

(1, 56)

<h4 style="padding: 0.25em 0.5em;color: #494949;background: transparent;border-left: solid 5px #7db4e6;">課題9.5</h4>

<a href="HamburgerStatistics07.ipynb">第７章</a>の復習。ある野菜を、異なる圃場（A1とA2）にてそれぞれ異なる栽培手法（B1とB2）を用いて栽培し、ある栄養素の含有量を測定したのが下の数値である。その栄養素の含有量に関して、圃場による違いの影響、栽培手法による違いの影響、そして両者の相互作用による影響を考察しなさい。

In [23]:
a1b1 = [65, 85, 75, 85, 75, 80, 90, 75, 85, 65, 75, 85, 80, 85, 90] 
a1b2 = [65, 70, 80, 75, 70, 60, 65, 70, 85, 60, 65, 75, 70, 80, 75] 
a2b1 = [70, 65, 85, 80, 75, 65, 75, 60, 85, 65, 75, 70, 65, 80, 75] 
a2b2 = [70, 70, 85, 80, 65, 75, 65, 85, 80, 60, 70, 75, 70, 80, 85]

In [24]:
# 課題9.5
f_a, f_b, f_x, freedoma, freedomb, freedomx, freedomz = stats_f_twoway(a1b1, a1b2, a2b1, a2b2)
threshold = check_f_dist(freedoma, freedomz, significance)

print( "要因Aのf値は %(f_a)s" %locals() )    
if f_a > threshold:
    print("　有意水準 %(significance)s で、有意な差があります" %locals())
else:
    print("　有意水準 %(significance)s で、有意な差がありません" %locals())

print( "要因Bのf値は %(f_b)s" %locals() )
if f_b > threshold:
    print("　有意水準 %(significance)s で、有意な差があります" %locals())
else:
    print("　有意水準 %(significance)s で、有意な差がありません" %locals())


print( "交互作用のf値は %(f_x)s" %locals() )
if f_x > threshold:
    print("　有意水準 %(significance)s で、有意な差があります" %locals())
else:
    print("　有意水準 %(significance)s で、有意な差がありません" %locals())

要因Aのf値は 0.837784371909
　有意水準 0.05 で、有意な差がありません
要因Bのf値は 3.05341246291
　有意水準 0.05 で、有意な差がありません
交互作用のf値は 6.65380811078
　有意水準 0.05 で、有意な差があります


In [25]:
print(average(a1b1), average(a1b2))
print(average(a2b1), average(a2b2))

79.66666666666667 71.0
72.66666666666667 74.33333333333333


In [26]:
# ある栄養素の含有量に関して、圃場や栽培手法それぞれの違いは単独では影響があるとは言えない。
# 両者の相互作用による影響はありそうである。
# すなわち、ある栄養素を多く含む野菜を育てようとした場合、
# 圃場A1では栽培法B1が、圃場A2では栽培法B2が適している。

<h2 STYLE="background: #c2edff;padding: 0.5em;">ハンバーガー統計学 第９章 課題</h2>

__課題9.1__、__課題9.2__、__課題9.3__、__課題9.4__、および __課題9.5__ を解いて、指定のメールアドレスまでメールしてください。メール送信後は、エラーが帰ってきてないことを確認してください（メールアドレスを間違える人がときどき居ます）。
* 締切：10月20日（今すぐでなくても結構です）
* メールタイトル：「ハンバーガー統計学 第９章」
* 学籍番号と氏名を明記すること。
* 感想などがあれば書いてくれると嬉しいです。次回以降の講義の改善につながるかも知れません。

In [27]:
# ハンバーガー統計学 第９章 課題

お疲れ様でした。これでハンバーグ統計学は終了です。
<h2 STYLE="background: #c2edff;padding: 0.5em;">次は、<a href="IceCreamStatistics01.ipynb">アイスクリーム統計学</a> に進みましょう。</h2>
（2017年10月20日講義、10月24日課題提出締切）