
#  numpy
* numpy は数値計算を行うのに必要な機能を多数揃えたライブラリ(モジュール)
* 特にnumpyの__配列(array)__を使うとベクトルや行列の計算が色々と簡単にできる
* <a href="https://pmp.eidos.ic.i.u-tokyo.ac.jp/slides/pdf/visual_numpy_matplotlib.pdf" target="_blank">Visual Python, Numpy, Matplotlib スライド</a> 3 NumpyとScipy を参照
* <a href="https://numpy.org/doc/stable/"  target="_blank"> 詳細</a>

* 使うためのおまじない(import文)


In [None]:
import numpy as np


もちろん "as np" はなくても良いが, 世の中のnumpyについて説明しているページや本はことごとくこのようにしているのでこの授業でもそれに習う



# 1. 配列の基本
* 配列は数をいくつでも並べたもの.

<img src="img/array.svg" />

* 以下は 1.0, 1.2, 1.4, 1.6, 1.8, 2.0 6つの数を並べた配列を作る


In [None]:
np.array([1.0, 1.2, 1.4, 1.6, 1.8, 2.0])


* これを見て「リストと何が違うのだ?」と思ったらその疑問はもっともである. おいおいわかるので読み進めて下さい
* 上記は, 文法として新しいことは何もない. 上の式のうち, `[1.0, 1.2, 1.4, 1.6, 1.8, 2.0]`の部分はすでに習ったリスト式であり, np.array(...) はnpモジュールのarrayという関数を呼び出しているに過ぎない
* まとめるとここで重要なのは配列を作るのに, リストを渡してそれを元に配列を作るのが np.array という関数だということ
* 実際以下のように書いても同じことが起きる


In [None]:
l = [1.0, 1.2, 1.4, 1.6, 1.8, 2.0]
np.array(l)


* for文を使えば大きなリストを自在に作ることが出来た
* それと np.array を組み合わせれば大きな配列を自在に作ることが出来ることがわかるだろう
* 例 (表示しきれなくならないよう, 大きさ(n)は控えめにしてある):


In [None]:
n = 10
l = []
for i in range(n):
    l.append(i * i)
np.array(l)


* リストを作るのにリスト内包表記が便利だった
* それを使えば色々な配列もスッキリと作れる
* 以下は上記と同じ配列を1行で作る例


In [None]:
np.array([ i * i for i in range(10) ])


* もちろん配列もリスト同様, 一つの値であって, 変数に代入したり他の関数にわたしたりできる


In [None]:
x = np.array([1.0, 1.2, 1.4, 1.6, 1.8, 2.0])

In [None]:
x


# 2. 配列に関する関数・操作
## 2-1. リストと同じ操作
* 配列とリストは概念的にも似ており, 出来る操作(要素の取り出しや要素の変更など)も似ている
* そしてPythonでは似た操作は同じ表記(関数名)でできるようにことが多く, その意味でますますリストと配列の区別がつきにくい(わかるまでもう少しの辛抱)


* __配列の要素数 (len)__

* リストと同じくlenでその要素数


In [None]:
len(x)


* __配列の要素__ 
* $x$[$i$] で配列$x$の$i$番目の要素(0番目から始まる)を取り出せる


In [None]:
x[0]

In [None]:
x[1]


要素数$n$として$n$以上の数を添え字に指定すると(当然)エラーになる


In [None]:
# error
x[6]


* 一旦作った配列の要素をあとから変更することも出来る 
* 普通に代入文で代入すれば良い


In [None]:
x[1] = 20.0

In [None]:
x


* 配列を受け取る関数などももちろん書ける
* 以下は配列を受取り, その要素の和を返す関数 sum_of_array


In [None]:
def sum_of_array(a):
    n = len(a)
    s = 0
    for i in range(n):
        s = s + a[i]
    return s

sum_of_array(x)


* 実はそんなのは自分で書かなくても最初から備わっている


In [None]:
x.sum()


## 2-2. 配列ならではの操作
* 配列ならではの操作, またはリストと同じ記法でも異なる動作をする操作を述べる



* 「配列 + 配列」
は対応する要素を加算してできた値を要素とする新しい配列


In [None]:
x = np.array([1,2,3,4])
y = np.array([0.1, 0.1, 0.1, 0.1])

x + y


* 「配列 * 数」
* 「数 * 配列」
は各要素を「数」倍した新しい配列


In [None]:
x * 4

In [None]:
4 * x


* 「配列 * 配列」
は対応する要素毎に掛け算をした新しい配列


In [None]:
x * y


* numpy に備わっているsin, exp, logなどの関数は, 配列に対しても適用でき, それは配列の各要素にそれぞれの関数をかけた配列という意味になる


In [None]:
np.sin(x)

In [None]:
np.log(x)


* 配列のパワーの源はこれらの, 「配列に対して一見普通の式を書くだけで全要素に対する計算をしてくれる」ことだと言ってよい
* もし np.log(x) と同じことをこれなしで(自分で)やれと言われたら, きっと以下のような関数を自分で書くことになる(新しい配列を作り, xの各要素x[i]のlogを計算)


In [None]:
import math

def np_log(x):
    n = len(x)
    y = np.zeros(n)
    for i in range(n):
        y[i] = math.log(x[i])
    return y

np_log(x)


* リストに出来て配列にできないこともある
* その代表は, 「後から大きさを変更すること」
* リストには append でそれができたが, 配列は出来ない
* 配列の大きさは「生まれた瞬間に決まる」


In [None]:
# error
l = [1,2,3]
l.append(4)
a = np.array([1,2,3])
a.append(4)


ここまでのまとめ

```
import numpy as np
```

* `np.array(リスト)` で配列を作る
* `x[i]` で要素の参照
* `x[i] = 式` で要素の更新
* x * y, x + y, k * x などで各要素ごとに掛け算, 足し算など
* np.sin(x), np.log(x), などで各要素に関数を適用して新しい配列を返す
* 配列の大きさは後から変更できない



# 3. 配列の作り方色々
* 小さな配列なら np.array([1.0, 1.2, ... ]) のように全要素をプログラム内で並べて作ることもできる
* 大きな配列(100要素以上)を作る場合, まずそのリストをfor文やリスト内包表記で作ればよいのだが, 直接大きな配列を作る方法も色々ある



#  zeros(n)
* 0がn個並んだ配列


In [None]:
n = 20
np.zeros(n)


#  ones(n)
* 1がn個並んだ配列


In [None]:
np.ones(n)


#  linspace(a,b,n)
* aからbまで要素数nの等差数列
* 要素が (b-a)/(n-1) の間隔で並ぶことになる
* linspace (linear spaceの略? 線型空間?) という, どうにも覚えにくい名前は, きっと, 「スペース(間隔)が線形にならんでいる」ということなのだろう. 個人的には「スペースが一定」なのだから constspace とでも言うべきじゃないかと思うが


In [None]:
np.linspace(0.2, 4.0, n)


#  arange(a, b, d)
* aからb未満まで間隔dの等差数列
* 要素数は(b - a)/d くらいになるが, 半端が出る場合に誤差ギリギリのところで$\pm 1$する可能性があるので決めつけると危険


In [None]:
np.arange(3.5, 4.0, 0.1)


#  random.random(n)
* n個の乱数の配列


In [None]:
np.random.random(n)


# 4. 部分配列(スライス)記法
* 配列の1要素を取り出すのに添字記法($x[i]$)が使えるが似た記法で「複数の要素」を取り出すことが出来る
 * $x[i:j]$ で $x[i], x[i+1], ..., x[j-1]$を同時に取り出せる
* 複数の要素なので結果もまた配列になる
* 複数の要素を同時に更新することも出来る
 * $x[i:j] = ...$ で$x[i], x[i+1], ..., x[j-1]$を同時に更新できる
 * 右辺は同じ要素数の配列(実はリストでも良い)か, 1つの数の場合は全ての要素を同じ値で更新するという意味になる

* $i$:$j$ という式のことを「スライス」と呼ぶ


In [None]:
x = np.linspace(0, 1, 11)
x


* $x[i:j]$ で $i$番目から$j$の一つ手前まで ($(j-i)$要素)


In [None]:
x[1:4]


* 左側を省略すると0 (先頭から)の意味
* つまり x[:j] は「最初の$j$要素」


In [None]:
x[:3]


* 右側を省略すると要素数 (終わりまで)の意味
* つまり x[i:] は「$i$番目およびそれ以降の要素」


In [None]:
x[3:]


* 当然, 両方を省略すると配列まるごとという意味になる


In [None]:
x[:]


* 更新


In [None]:
x[1:4] = 100 * x[1:4]
x


* 右辺はリストでもOK


In [None]:
x[1:4] = [ -10, -20, -30 ]
x


* 左辺と右辺の要素数があわないとエラーになるので注意


In [None]:
# error
x[1:4] = 10 * x[2:6]


* 右辺が1つの数の場合, 左辺の全要素をそれで更新という意味になる


In [None]:
x[1:4] = 100
x


# 5. 2次元配列, 3次元配列, 多次元配列
* これまで扱ってきた配列は1次元の配列
* 実は任意次元の配列を作ることが出来る
* 例えば1次元配列はある時点における棒の温度分布とか, 糸の上を伝わる波の振幅を表すのに使える. またある一つの数の時系列を全て記録するのにも使える
* ある平面上の温度分布, 平面を伝わる波, 糸の上を伝わる波の時系列を全て記録するには2次元の配列が必要になることが想像できるだろう
* 1次元配列にまつわる関数名や記法を覚えれば, 2次元以上の配列でどうすればよいかは容易に想像がつく



## 5-1. 多次元配列を作る


#  np.array(リストのリスト)

In [None]:
np.array([ [1,2,3], [4,5,6] ])


* 上記の`[ [1,2,3], [4,5,6] ]`は「リストのリスト」
* リストの要素は何でも良いのだからこういうことが書けても当然



#  zeros
* 全部0



* 0が 2x3 並んだ2次元の配列

In [None]:
np.zeros((2,3))


* 0が 2x3x4 並んだ3次元の配列

In [None]:
np.zeros((2,3,4))


#  ones 
* 全部1


In [None]:
np.ones((2,3))

In [None]:
np.ones((2,3,4))


#  random
* 乱数


In [None]:
np.random.random((2,3))


#  reshape
* 配列の形を変形
* 例えば 3x4 の配列を 4x3 にしたり 2x2x3 にしたり, 合計要素数が変わらない範囲で, 変形が可能
* 一旦1次元の配列を作ってからそれを2次元に変形するというのは多次元配列を作ると気に割とよく使うパターン


In [None]:
np.arange(0, 15, 1).reshape((3,5))


* reshapeは一般に, 任意の配列を, それと同数の要素数を持つ任意の次元の配列に変形することが出来る


In [None]:
np.array([ [1,2,3], [4,5,6] ]).reshape((3,2))


## 5-2. 多次元配列の len と shape


* もちろん多次元配列に対しても len という関数が使えるが, それが返すのは, 「最初の軸に沿った要素数」であり, 全ての要素数ではないので注意


In [None]:
a = np.zeros((5,8))  # 5x8 の配列
len(a)               # (40ではなく) 5


* 全要素数は a.size
* 各軸の要素数は a.shape


In [None]:
a.size

In [None]:
a.shape


* なおここで返された (2,3) という値は, 説明を省略した「タプル」というものなのだが, さしあたり以下のようにして各要素を取り出せることだけを覚えておけば事足りる


In [None]:
m,n = a.shape

In [None]:
m

In [None]:
n


## 5-3. 要素とスライス


* 2次元配列であれば$x[i,j]$, 3次元配列であれば$x[i,j,k]$のように, 添字を複数指定することで1要素を取り出せる
* ある添字を1つの数ではなくスライスにすれば, ある範囲の要素を取り出すことが出来る. 要するに任意の矩形を切り取ることが出来る
* 要素や範囲の更新を行うことが出来るのも, 改めて説明の必要はないくらいだろう


In [None]:
a = np.arange(0, 40, 1).reshape((5,8))
a


* 1要素の取り出し. 当然ながら2次元配列であれば2つの添字, 3次元配列であれば3つの添字で一要素を指定する


In [None]:
a[1,2]


* 矩形の取り出し. それぞれの添字をスライスにすれば矩形を取り出すことが出来る


In [None]:
a[2:4,3:6]


* とくに2つめの軸のスライスを : にすれば行まるごとということになるし, 1つめを : にすれば列まるごとということになる


In [None]:
a[2,:]

In [None]:
a[:,2]


* 2次元配列にも sum が使える


In [None]:
a.sum()


* axis= という引数を渡すことで, どちらの軸に沿って和を取るかを指定できる
* a.sum(axis=0) は最初の軸に沿って和を取る --- a[0,j] + ... + a[4,j] を各jに対して計算する --- ということになる


In [None]:
a.sum(axis=0)

In [None]:
a.sum(axis=1)