# トリム平均

全データから最小値付近のデータと最大値付近のデータを取り除いたデータで平均をとった値をトリム平均と言います．
取り除くデータの個数に規定はありませんが，データ全体の件数と比較して少ない件数です．
最も単純な方法は，最小値と最大値を1つずつ取り除く方法です．

何かのノイズの影響を排除するために最小値側か最大値側のどちらかのデータを多く取り除くことも考えられます．
しかし，その場合は恣意的データ選択となるので，明確な説明を付随することが前提となります．

データを $x_1 \le x_2 \le \cdots \le x_n$ として，ここから上下の $k$個ずつ削除したトリム平均は次の計算式になります．

> $$ \text{トリム平均} = \frac{1}{n-2k} \sum_{i=k+1}^{n-k} x_i $$

取り除くデータ件数を増やしていき，残りのデータが1個か2個になったときのトリム平均は中央値に一致します．

> $$ \text{平均値} \xrightarrow[]{\,k=1,{\cdots},{\lceil}\frac{n}{2}{\rceil}-1\,} \text{中央値} $$

*****
## Pythonによるトリム平均

Pythonにてトリム平均を求めるには，SciPyライブラリーの<font color=green>trim_mean()</font>関数を使用します．
まずは，SciPyライブラリーのstatsを搬入します．
また，平均値および中央値を計算するためにNumPyライブラリーも搬入します．

```Python
from scipy import stats
import numpy as np
```

In [1]:
from scipy import stats
import numpy as np

テスト用のデータとして10個の値を持つリスト配列を用意します．

```Python
sample = [10,120,130,140,150,260,370,480,5900,7000]
```

In [2]:
sample = [10,120,130,140,150,260,370,480,5900,7000]

トリム平均は次の関数によって求めることができます．

>  
<font face='courier new' color='green'>
stats.trim_mean(data,proportionToCut)
</font>

> <font face='courier new'>data </font> : 配列データ  
> <font face='courier new'>proportionToCut </font> : 排除するデータの<font color='blue'>片側の割合で0以上0.5未満</font>の値 　

proportionToCut=0.1とすると最小値側の10%および最大値側の10%の合わせて20%のデータを排除します．

データsampleについて，両端を10%ずつ取り除いたトリム平均は次式となります．

```Python
stats.trim_mean(sample,0.1)
```

In [3]:
stats.trim_mean(sample,0.1)

943.75

次のプログラムでは，平均値からトリムの片側の割合を10%ずつ増やしていくと中央値に近づいて行くことを確認します．

```Python
print(f'平均値\t\t：{np.mean(sample)}')
for i in range(0,50,10):
    print(f'{i:2d}%トリム平均\t：{stats.trim_mean(sample,i/100)}')
print(f'中央値\t\t：{np.median(sample)}')
```

In [4]:
print(f'平均値\t\t：{np.mean(sample)}')
for i in range(0,50,10):
    print(f'{i:2d}%トリム平均\t：{stats.trim_mean(sample,i/100)}')
print(f'中央値\t\t：{np.median(sample)}')

平均値		：1456.0
 0%トリム平均	：1456.0
10%トリム平均	：943.75
20%トリム平均	：255.0
30%トリム平均	：230.0
40%トリム平均	：205.0
中央値		：205.0


トリム平均は，外れ値を除いた平均を求めるために使用します．
しかし，外れ値の指定が恣意的になる危険性があるので注意が必要です．

*****