# 基本統計処理

## はじめに

### 開始前に行うこと（重要）

まず，Chrome 等のブラウザを利用して，本教材の URL にアクセスし，画面の指示に従い Google アカウントにログインしてください．その後，ブラウザ表示画面左上の「ファイル」をクリックし，さらにポップアップで出てくる項目から「ドライブにコピーを保存」をクリックしてください．これにより，本教材のコピーが自分のGoogleドライブに保存され，自分で書いたプログラムを実行できるようになります．

また，多くのセルが非表示になっていると思われるため，同じくブラウザ表示画面上の「表示」をクリックし，さらにその項目から「セクションを展開」をクリックし，非表示のセルを表示させてください．

```{hint}
各ページの上部にロケットのアイコン <i class="fa fa-rocket" aria-hidden="true"></i> があるのでこれをクリックして各ページのファイルを Google Colaboratory 上で開いて利用してください．
```

### 到達目標

NumPy を利用して基本的な統計処理ができるようになること目標とします．


### NumPy とは

NumPy は，Python で科学技術などを行う際に使用する基本的なライブラリです．ベクトルや行列を扱えるほか，線形代数や統計の基本処理や離散フーリエ変換を行うこともできます．C言語でコンパイルされているため，C言語並みに高速に動作します．使い方の概要や詳細については，[NumPyユーザーガイド](https://numpy.org/doc/stable/user/index.html)をご覧ください．

### NumPy のインポート

NumPy は以下のようにインポートします．NumPy には np という略称を与えて利用するのが普通です．その都度 `numpy` とタイピングするのが面倒だからです．

In [None]:
import numpy as np

### 学習の進め方

上から順に読み進み，<font color="blue">【実習】</font>と書いてある箇所でコードを書いて実行してください．基本的に入力するコードの前に見本のコードが書かれており，見本と同じコードを書けば正しく動作するようになっています（見本コードの上下に入っている区切り線は入力する必要ありません）．理解を深めるには，見本とは異なるコードを書いて試してみることも役立つと思います．
なお， Colab では，コードが書かれている領域をコードセル，説明文等が書かれている領域をテキストセルといいます．

## ベクトルの基本操作

### ベクトルの生成

NumPy の ndarray クラスを用いてベクトルを生成するには NumPy の array 関数にリストを渡します．


<font color="blue">【実習】numpy をインポート後，ベクトル `x=[6 7 8]` を生成する</font>

```
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
import numpy as np

x = np.array([6, 7, 8])
print(x)
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
```

```{note}
リストを `print` すると，`[6, 7, 8]`のように要素間にカンマ(,)が入りますが，ndarray のベクトルを `print` すると`[6 7 8]`のようにカンマが入りません．これによりリストとベクトルを区別することができます．
```

生成したベクトル `x` のデータ型を確認するには，`type(x)`と書きます．

<font color="blue">【実習】 ベクトル `x` の型を確認する．</font>

```
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
type(x)
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
```

生成したベクトル`x`の形（要素数）を確認するには，`x.shape`と書きます．

<font color="blue">【実習】 ベクトル `x` の形(要素数)を確認する．</font>

```
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
print(x.shape)
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
```

```{note}
ベクトルの`shape`は要素数1のタプルになります．値は3になっていますが，これは，１次元配列でその要素数が3であるという意味です．
```

### ベクトルの基本演算

ベクトル `x,y` の足し算は`x + y`，引き算は`x - y` とすれば計算できます．

<font color="blue">【実習】 ベクトル `x=[6 7 8]` と`y = [1 2 3]` に対して， `x + y`と`x - y` を計算する．</font>

```
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
import numpy as np

x = np.array([6, 7, 8])
y = np.array([1, 2, 3])
print(x + y)
print(x - y)
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
```

掛け算や割り算についても同じ位置の要素ごとに演算が行われます．通常のベクトルの演算と異なるので注意が必要です．

<font color="blue">【実習】 ベクトル `x=[6 7 8]` と`y = [1 2 3]` に対して， `x`と `y` の要素ごとの掛け算と割り算を計算する．</font>

```
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
print(x * y)
print(x / y)
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
```

```{note}
同じ位置の要素ごとの積のことは，他の積と区別してアダマール積と呼ばれます．
```

ベクトル`u,v`の内積を行うには`np.dot(u,v)`，外積を行うには`np.cross(u,v)`とします．

<font color="blue">【実習】 ベクトル `u=[3 4 0]` と`y = [-4 3 0]` に対して， `u`と `v` の内積と外積を計算する．</font>

```
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
u = np.array([3, 4, 0])
v = np.array([-4, 3, 0])
print(np.dot(u, v))
print(np.cross(u, v))
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
```

```{note}
ndarrayによるベクトルには縦ベクトル（列ベクトル），横ベクトル（行ベクトル）といった方向の概念がないので注意しましょう．ベクトルと呼んでいますが，単にベクトル等の演算をサポートする１次元配列のことです．方向が必要な時は，ベクトルでなく行列(２次元配列)を使えばよいですが，ベクトルと行列は別物(ベクトルは１次元配列で行列は２次元配列)なので注意しましょう．詳細は[NumPyユーザガイド](https://numpy.org/doc/stable/user/absolute_beginners.html#how-to-convert-a-1d-array-into-a-2d-array-how-to-add-a-new-axis-to-an-array)を参照ください．
```

### ブロードキャスト

ベクトルにスカラーをかけると，ベクトルの各要素にスカラー値が掛け算されます．このようにある演算をベクトル（や行列）の全要素に適用することをブロードキャストといいます．NumPyでは，乗算だけでなく，除算，加算，減算，べき乗などもブロードキャストできます．

<font color="blue">【実習】 ブロードキャストを利用してベクトル`x`の各要素を2倍する</font>

```
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
import numpy as np

x = np.array([6, 7, 8])
print(x * 2)
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
```

<font color="blue">【実習】 ブロードキャストを利用してベクトル`x`の各要素に10を足す</font>

```
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
print(10 + x)
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
```

<font color="blue">【実習】 ブロードキャストを利用してベクトル`x`の各要素を2乗する</font>

```
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
print(x ** 2)
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
```

### 算術関数

NumPyの算術関数をベクトルに適用すると，基本的には要素ごとに計算します．
* `np.exp(x)`: eのべき乗
* `np.log(x)`: 対数（底はe）
* `np.sqrt(x)`: 平方根

使用可能な算術関数については，[NumPy API ReferenceのMathematical functions](https://numpy.org/doc/stable/reference/routines.math.html)をご覧ください．

<font color="blue">【実習】 ベクトルの各要素の平方根をとる</font>

```
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
import numpy as np

z = np.array([2, 3, 4])
print(np.sqrt(z))
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
```

### 要素の確認と変更

リストと同様の書き方でベクトルの要素にアクセスできます．

<font color="blue">【実習】 ベクトル `x = [6 7 8]` の2番目（index 1）の要素にアクセスする．</font>

```
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
import numpy as np

x = np.array([6, 7, 8])
print(x[1])
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
```

リストと同様，スライスを使って複数の要素にアクセスすることもできます．

<font color="blue">【実習】 ベクトル `x = [6 7 8]` の先頭2要素にアクセスする．</font>

```
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
print(x[0:2])
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
```

```{note}
`x[0:2]` と書いた時，インデックス 0 は含まれるが，インデックス 2 は含まれないことに注意しましょう．つまりこの書き方ではインデックスが 0 以上 1 以下の要素が抜き出されます．
```

要素の値を変更するには，指定要素に値を代入します．

<font color="blue">【実習】 ベクトル `x = [6 7 8]` の3番目(index 2)の要素の値を20に変更する．</font>

```
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
x[2] = 20
print(x)
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
```

スライスを使って複数要素に同時に値を代入することもできます．

<font color="blue">【実習】 ベクトル `x = [6 7 20]` の先頭2要素の値を30, 31に変更する．</font>

```
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
x[0:2] = 30, 31
print(x)
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
```

### ベクトルのコピー

ベクトル`x`をベクトル`y`にコピーする際は，`y = np.copy(x)` と書きます．
決して `y = x` と書いてはいけません．

<font color="blue">【実習】 ベクトル `x = [6 7 8]` の値をベクトル `y` にコピーする．</font>

```
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
import numpy as np

x = np.array([6, 7, 8])
#y = x # Wrong
y = np.copy(x)
x[1] = 100
print(y)
#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#--#
```

```{note}
`y = x` と書いてしまうと，変数`y`と変数`x`が同じオブジェクトIDを持つことになり，`y`は`x`の別名を表すことになってしまいます．つまり，`x`の値を変更すると勝手に`y`の値も変わってしまいします．リストでは，`y = x[:]`という書き方でコピーができましたが，NumPy の ndarray ではできません（これも`y`が`x`の別名になってしまう）ので注意しましょう．
```

## 行列の基本操作
