# NumPy

Pythonでベクトルや行列といった配列の計算を効率よく行うには、リストではなくNumPyライブラリを使う方が便利である（[教材5-3](https://utokyo-ipp.github.io/5/5-3.html)も参照）。標準ライブラリではないので以下のようにインポートして使う。

In [None]:
import numpy as np

as 以降はなんでもよいが、普通は np を使うのでそうしよう。

numpy で配列を作るには np.array() 関数を用いる。例えば

In [None]:
a = np.array([1, 2, 3, 4, 5])

とするとリスト [1,2,3,4,5] から numpyの配列（numpy.ndarray）が作れる。

In [None]:
a

リストと異なり、array()がついていることに注意。numpy.ndarray として定義するといろんな演算が簡単にできて便利である。例えば

In [None]:
a**2

は a の全要素を2乗した配列を与える。同様に、

In [None]:
a+1

In [None]:
a*2

のような計算も全要素に対して行われる。2つのnumpy.ndarrayに対しても同様な計算ができる。例えば

In [None]:
b = np.array([-1, -2, -3, -4, -5])

に対して

In [None]:
a + b

In [None]:
a * b

は要素ごとの和や積を与える。ちなみに上の b は a の各要素を -1 倍したものなので

In [None]:
-a

と書いても同じものが定義できる。これらの操作はリスト（[教材2-2](https://utokyo-ipp.github.io/2/2-2.html)参照）ではそのままはできない。リストにfor文（[教材3-2](https://utokyo-ipp.github.io/3/3-2.html)）を適用すればできないことはないが、numpy.ndarray を使った方が速いしコードも短くて済む。

真理値の配列も作れる。例えば

In [None]:
a > 0

はaの各要素が全部正なので全部がTrueの配列になる。

## numpyの関数

numpy には様々な関数が用意されている。例えば上の　a = np.array([1, 2, 3, 4, 5])　は次のようにしても作れる。

In [None]:
np.arange(1, 6)

最初の1は含まれるが、6は含まれないことに注意する。Pythonではいつもそういうルールになっている。

簡単な演算を行う関数もnumpyに入っている。例えば

In [None]:
np.sqrt(a)

とすると各要素の正の平方根が計算できる。他にも例えば

In [None]:
np.sum(a)

とすると配列の全要素の和が得られる。これを使うと、aの要素の平均（mean）は

In [None]:
a_mean = np.sum(a) / len(a)

In [None]:
a_mean

となる。len(a)はaの要素数（今の場合は5）を返す関数である。実は平均のようなよく使う演算であれば関数が用意されており、

In [None]:
np.mean(a)

とすれば上のようにしなくても一発で計算できる。平均以外の統計量（中央値や標準偏差など）についても大体関数が用意されている。

## スライス

がうまく使えるとできることが増える。

In [None]:
a

に対して、

In [None]:
a[1:3]

とすると、aの1番目以降、3番目より前（上のnp.arange関数の場合と同様3番目は入らない）の要素が取り出せる。最初は0番目と数えるのがPythonのルールである。これ以外に真理値の配列も使える。例えばさっきの

In [None]:
a

に対して、3より大きい要素だけ取り出したいとする。そのためには

In [None]:
a > 3

という配列を使って

In [None]:
a[a > 3]

とすればよい。もう少し複雑な例として、aと同じ長さの配列cを

In [None]:
c = np.array([1, 0, 0, 1, 0])

で定義し、cが1のところだけ（つまり0番目と3番目）で<u>aの要素について</u>和をとってみる。そのためには

In [None]:
np.sum(a[c==1])

などとすればよい。

# Matplotlib によるプロット

グラフを作成するための標準的なモジュールである　matplotlib.pyplot を使ってみる。以下のようにインポートする。

In [None]:
import matplotlib.pyplot as plt

plt.plot() の引数にデータを入れるとプロットが表示される。例えば

In [None]:
x, y = [1, 2, 3], [0, 0, 5]

In [None]:
plt.xlabel("x") # x軸のラベル
plt.ylabel("y") # y軸のラベル
plt.plot(x, y);

このように plt.plot() はデフォルトだと折れ線になる。以下のようにすると点にもできる。

In [None]:
plt.xlabel("x") # x軸のラベル
plt.ylabel("y") # y軸のラベル
plt.plot(x, y, ".");

点以外のシンボル（マーカー marker という）を使う、点の大きさや色を変える、点を透明にする、線で繋ぐ、数字・文字のフォントを変えるなどなど大抵のことはできる。何かやりたい操作があったら検索してみるとよい。[教材](https://utokyo-ipp.github.io/appendix/5-matplotlib.html)にも説明がある。[seaborn](https://seaborn.pydata.org) などのパッケージを使ってグラフの見た目を向上（個人の感想）させることもできる。このリンクのように公式ドキュメントは英語の場合も多いが、検索すれば大体日本語の解説も出てくる。もちろん変なことが書いてある場合もないわけではないが、ちょっと使う分には十分なことも多い。

## グラフの例

例として、$y=x^2+1$ のグラフを $-5 < x < 5$ の範囲で描いてみよう。データ点が必要だが、上のように配列を自分で書くのは面倒である。そこでnumpyを用いて

In [None]:
x = np.linspace(-5, 5, 100)

としてみよう。こうすると -5 から 5 まで等間隔で 100 要素を持った numpy の配列が作られる。

In [None]:
x

In [None]:
len(x)

この配列を使うと以下のようにグラフがすぐ書ける。

In [None]:
y = 2 * x**2 + 1 # 2x^2 + 1

In [None]:
plt.xlim(-5, 5) # xの範囲を-5から5に制限した
plt.xlabel("x") # x軸のラベル
plt.ylabel("y") # y軸のラベル
plt.plot(x, y);