# その他の代表値

重要な代表値を説明しましたが，その他にもよく使われる代表値があります．

- 最大値，最小値
- トリム平均

*****
## 最大値，最小値

最大値は，そのデータ集合の中で最大の値です．
最小値は，そのデータ集合の中で最小の値です．

ここでデータを $x_1,x_2,\cdots,x_n$ とします．
最大値を $x_{max}$，最小値を $x_{min}$ とすると，

> $$ x_{max} \ge x_i \ (i=1,\cdots,n) $$

> $$ x_{min} \le x_i \ (i=1,\cdots,n) $$

が成り立ちます．

データを昇順にソートして，$x_1 \le x_2 \le \cdots \le x_n$ とすると，

> $$ x_{max} = x_n $$

> $$ x_{min} = x_1 $$

となります．

*****
## トリム平均

全データから最小値付近のデータと最大値付近のデータを取り除いたデータで平均をとった値をトリム平均と言います．
取り除くデータの個数に規定はありませんが，データ全体の件数と比較して少ない件数です．
最も単純な方法は，最小値と最大値を1つずつ取り除く方法です．

何かのノイズの影響を排除するために最小値側か最大値側のどちらかのデータを多く取り除くことも考えられます．
しかし，その場合は恣意的データ選択となるので，明確な説明を付随することが前提となります．

データを $x_1 \le x_2 \le \cdots \le x_n$ として，ここから上下の $k$個ずつ削除したトリム平均は次の計算式になります．

> $$ \text{トリム平均} = \frac{1}{n-2k} \sum_{i=k+1}^{n-k} x_i $$

取り除くデータ件数を増やしていき，残りのデータが1個か2個になったときのトリム平均は中央値に一致します．

*****
## Pythonによるトリム平均

Pythonにてトリム平均を求めるには，SciPyライブラリーの<font color=green>trim_mean()</font>関数を使用します．
まずは，SciPyライブラリーのstatsを搬入します．

```Python
from scipy import stats
```

In [1]:
from scipy import stats

テスト用のデータとして10個の値を持つリスト配列を用意します．

```Python
pretrim = [10,120,130,140,150,260,370,480,5900,7000]
```

In [2]:
pretrim = [10,120,130,140,150,260,370,480,5900,7000]

トリム平均は次の関数によって求めることができます．

> 
<font face='courier new'>
stats.trim_mean(data,proportionToCut)
</font>

引数の<font face='courier new'>proportionToCut</font>は，排除するデータの割合で0以上0.5未満の値です．
proportionToCut=0.1とすると最小値側の10%および最大値側の10%の合わせて20%のデータを排除します．

```Python
print(stats.trim_mean(pretrim,0))
print(stats.trim_mean(pretrim,0.1))
print(stats.trim_mean(pretrim,0.2))
print(stats.trim_mean(pretrim,0.3))
print(stats.trim_mean(pretrim,0.4))
```

In [3]:
print(stats.trim_mean(pretrim,0))
print(stats.trim_mean(pretrim,0.1))
print(stats.trim_mean(pretrim,0.2))
print(stats.trim_mean(pretrim,0.3))
print(stats.trim_mean(pretrim,0.4))

1456.0
943.75
255.0
230.0
205.0


トリム平均は，外れ値を除いた平均を求めるために使用します．
しかし，外れ値の指定が恣意的になる危険性があるので注意が必要です．

*****