# ★Numpyについて

In [1]:
# インポート
import numpy as np

### 1次元配列

In [2]:
a = np.array([1,2,3])
a 

array([1, 2, 3])

In [3]:
print(a)

# 型
print(type(a))

# 一次元配列で要素が3つある
print(a.shape)

[1 2 3]
<class 'numpy.ndarray'>
(3,)


### 2次元配列

In [4]:
b = np.array([[1, 2, 3], [4, 5, 6]])
b

array([[1, 2, 3],
       [4, 5, 6]])

In [5]:
# 2行3列の配列
print(b.shape)

(2, 3)


### 変形

In [6]:
c1 = np.array(range(6))
c1

array([0, 1, 2, 3, 4, 5])

In [7]:
# 2行3列の配列に変形
c2 = c1.reshape(2, 3) # ((2, 3))
c2

array([[0, 1, 2],
       [3, 4, 5]])

In [8]:
# もとに戻す
c3 = c2.ravel()
c3

array([0, 1, 2, 3, 4, 5])

In [9]:
c4 = c2.flatten()
c4

array([0, 1, 2, 3, 4, 5])

In [10]:
# お試し 変わらなかった…
cc1 = np.array([[1, 2, 3], [4, 5, 6]])
print("ravel:", cc1.ravel())
print("flatten:", cc1.flatten())

ravel: [1 2 3 4 5 6]
flatten: [1 2 3 4 5 6]


### データ型

In [11]:
a = np.array([1,2,3])
a.dtype

dtype('int32')

In [12]:
d = np.array([1, 2], dtype=np.int16)
d

array([1, 2], dtype=int16)

In [13]:
d.dtype

dtype('int16')

In [14]:
# 型の変更
d.astype(np.float16)

array([1., 2.], dtype=float16)

### インデックスとスライス

In [15]:
a = np.array([1,2,3])
a[0]

1

In [16]:
a[1:]

array([2, 3])

In [17]:
a[-1]

3

In [18]:
b = np.array([[1, 2, 3], [4, 5, 6]])
b[1]

array([4, 5, 6])

In [19]:
b[1,0]

4

In [20]:
b[1][0]

4

In [21]:
# 列を取り出す。この場合は3列目を取り出している。
b[:, 2]

array([3, 6])

In [22]:
# 行の取り出し
b[1, :]

array([4, 5, 6])

In [23]:
# 1行目の配列をスライスで取り出す。
b[0, 1:]

array([2, 3])

In [24]:
# すべての行0と2番目の要素を取り出す。
b[:, [0, 2]]

array([[1, 3],
       [4, 6]])

### データ再代入

In [25]:
a = np.array([1,2,3])
a[2] = 4
a

array([1, 2, 4])

In [26]:
b = np.array([[1, 2, 3], [4, 5, 6]])
b[1, 2] = 7
b

array([[1, 2, 3],
       [4, 5, 7]])

In [27]:
# 列の再代入
b[:, 2] = 8
b

array([[1, 2, 8],
       [4, 5, 8]])

### 深いコピー

In [28]:
a = np.array([1,2,3])
a1 = a
a

array([1, 2, 3])

In [29]:
a1[1] = 5
a1

array([1, 5, 3])

In [30]:
# 通常の代入では代入先で値を変更すると、コピー元も変わってしまう。
a

array([1, 5, 3])

In [31]:
a2 = a.copy()
a2

array([1, 5, 3])

In [32]:
# copy()を用いることで、値を変更してもコピー元の値は変わらない。
a2[0] = 100
a2

array([100,   5,   3])

In [33]:
a

array([1, 5, 3])

In [34]:
c2

array([[0, 1, 2],
       [3, 4, 5]])

In [35]:
c3 = c2.ravel()
c4 = c2.flatten()
c3[0] = 6
c4[1] = 7

In [36]:
# ravelはコピー元も変わるが、flattenはコピー元は変わらない。
print("ravel:", c3)
print("flatten:", c4)
print("original:\n", c2)

ravel: [6 1 2 3 4 5]
flatten: [0 7 2 3 4 5]
original:
 [[6 1 2]
 [3 4 5]]


In [37]:
# リストの場合はコピー元は変わらない。
py_list1 = [0, 1]
py_list2 = py_list1[:]
py_list2[0] = 2
print("list1:", py_list1)
print("list2:", py_list2)

list1: [0, 1]
list2: [2, 1]


In [38]:
# numpy adarrayの場合はコピー元も変わる。
np_array1 = np.array([0, 1])
np_array2 = np_array1[:]
np_array2[0] = 2
print("list1:", np_array1)
print("list2:", np_array2)

list1: [2 1]
list2: [2 1]


### 数列を返す

In [39]:
np.arange(10)

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [40]:
# 同じ
np.array(range(10))

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [41]:
# range()と使い方は同じ。
np.arange(1, 11)

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

In [42]:
np.arange(1, 10, 2)

array([1, 3, 5, 7, 9])

### 乱数

In [43]:
# 引数にはタプルを渡す必要がある。
f = np.random.random((3, 2))
f

array([[0.80290938, 0.71916586],
       [0.38620267, 0.29310297],
       [0.01070679, 0.07126365]])

In [44]:
#乱数固定の方法 ↑のままだと実行するたびに値が変わる。
np.random.seed(123)
np.random.random((3, 2))

array([[0.69646919, 0.28613933],
       [0.22685145, 0.55131477],
       [0.71946897, 0.42310646]])

In [45]:
# 同一セル内に書く必要がある　or　直後の乱数にのみ適用している ⇒　同一セル内であれば同じだった。
np.random.random((3, 2))

array([[0.9807642 , 0.68482974],
       [0.4809319 , 0.39211752],
       [0.34317802, 0.72904971]])

In [46]:
# 1以上10未満の整数を発生させる。
np.random.randint(1, 10)

4

In [47]:
# 1以上10未満の整数で3×3の配列を生成する。
np.random.randint(1, 10, (3, 3))

array([[5, 1, 1],
       [5, 2, 8],
       [4, 3, 5]])

In [48]:
# 小数点以下も含む場合
np.random.uniform(0, 5, size=(2, 3))

array([[2.65775687, 2.65913794, 3.17200479],
       [4.24715897, 3.62227662, 3.05511755]])

In [49]:
# 正規分布に従った乱数を発生させる （標準正規分布）
np.random.randn(4, 2)

array([[-0.93583387,  1.17582904],
       [-1.25388067, -0.6377515 ],
       [ 0.9071052 , -1.4286807 ],
       [-0.14006872, -0.8617549 ]])

In [50]:
# 正規分布に従った乱数発生　（パラメータ指定）
np.random.normal(4, 10, size=(2, 2))

array([[  1.44380629, -23.98589105],
       [-13.71533105,  -2.99877235]])

In [51]:
# 同じ要素の数列を作る 引数はタプル
np.zeros((3, 3))

array([[0., 0., 0.],
       [0., 0., 0.],
       [0., 0., 0.]])

In [52]:
np.ones((3, 3))

array([[1., 1., 1.],
       [1., 1., 1.],
       [1., 1., 1.]])

### 単位行列

In [53]:
np.eye(3)

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

### 指定値で埋める

In [54]:
# 第一引数がサイズ、第二引数が値  np.piでも円周率が出せる。
np.full((3, 3), 3.14)

array([[3.14, 3.14, 3.14],
       [3.14, 3.14, 3.14],
       [3.14, 3.14, 3.14]])

In [55]:
# nan値
np.array([1, 2, np.nan])

array([ 1.,  2., nan])

### 範囲指定で均等割りデータを作る

In [56]:
np.linspace(0, 1, 5)

array([0.  , 0.25, 0.5 , 0.75, 1.  ])

In [57]:
np.linspace(0, np.pi, 21)

array([0.        , 0.15707963, 0.31415927, 0.4712389 , 0.62831853,
       0.78539816, 0.9424778 , 1.09955743, 1.25663706, 1.41371669,
       1.57079633, 1.72787596, 1.88495559, 2.04203522, 2.19911486,
       2.35619449, 2.51327412, 2.67035376, 2.82743339, 2.98451302,
       3.14159265])

### 要素間の差分

In [58]:
# 要素前後の差分が計算されている。
l = np.array([2, 2, 6, 1, 3])
np.diff(l)

array([ 0,  4, -5,  2])

### 連結

In [59]:
a = np.array([1, 2, 3])
a1 = np. array([4, 5, 6])
np.concatenate((a, a1))  # np.concatenate([a, a1])でも○

array([1, 2, 3, 4, 5, 6])

In [60]:
b = np.array([[1, 2, 3], [4, 5, 6]])
b1 = np.array([[10], [20]])
np.concatenate([b, b1], axis=1)

array([[ 1,  2,  3, 10],
       [ 4,  5,  6, 20]])

In [61]:
# ↑と同じ
np.hstack([b, b1])

array([[ 1,  2,  3, 10],
       [ 4,  5,  6, 20]])

In [62]:
# 行を増やす
b2 = np.array([[7, 8, 9], [10, 11, 12]])
b3 = np.vstack([b, b2])
b3

array([[ 1,  2,  3],
       [ 4,  5,  6],
       [ 7,  8,  9],
       [10, 11, 12]])

### 分割

In [63]:
# 列の分割
first, second = np.hsplit(b3, [2])
first

array([[ 1,  2],
       [ 4,  5],
       [ 7,  8],
       [10, 11]])

In [64]:
second

array([[ 3],
       [ 6],
       [ 9],
       [12]])

In [65]:
# 行の分割
first1, second1 = np.vsplit(b3, [2])
first1

array([[1, 2, 3],
       [4, 5, 6]])

In [66]:
second1

array([[ 7,  8,  9],
       [10, 11, 12]])

### 転置

In [67]:
b

array([[1, 2, 3],
       [4, 5, 6]])

In [68]:
b.T

array([[1, 4],
       [2, 5],
       [3, 6]])

### 次元追加

In [69]:
a

array([1, 2, 3])

In [70]:
a[np.newaxis, :]

array([[1, 2, 3]])

In [71]:
a[:, np.newaxis]

array([[1],
       [2],
       [3]])

### グリッドデータの生成

In [72]:
m = np.arange(0, 4)
m

array([0, 1, 2, 3])

In [73]:
n = np.arange(4, 7)
n

array([4, 5, 6])

In [74]:
xx, yy = np.meshgrid(m, n)
xx

array([[0, 1, 2, 3],
       [0, 1, 2, 3],
       [0, 1, 2, 3]])

In [75]:
yy

array([[4, 4, 4, 4],
       [5, 5, 5, 5],
       [6, 6, 6, 6]])

### Numpy の各機能

In [76]:
x = np.arange(10)
x

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [77]:
x.reshape(2, 5)

array([[0, 1, 2, 3, 4],
       [5, 6, 7, 8, 9]])

In [78]:
x.ravel()

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [79]:
y = np.linspace(1, 100, 12)
y

array([  1.,  10.,  19.,  28.,  37.,  46.,  55.,  64.,  73.,  82.,  91.,
       100.])

### ユニバーサルファンクション

In [82]:
# 絶対値
a = np.array([[-1, -2, -3], [1, 2, 3]])
np.abs(a)

array([[1, 2, 3],
       [1, 2, 3]])

In [85]:
# sin関数
np.sin(a)

array([[-0.84147098, -0.90929743, -0.14112001],
       [ 0.84147098,  0.90929743,  0.14112001]])

In [86]:
# cos関数
np.cos(a)

array([[ 0.54030231, -0.41614684, -0.9899925 ],
       [ 0.54030231, -0.41614684, -0.9899925 ]])

In [90]:
# log関数
np.log(a[1, :])

array([0.        , 0.69314718, 1.09861229])

In [93]:
# 常用対数関数
c = np.array([1, 10, 100])
np.log10(c)

array([0., 1., 2.])

In [95]:
# exp関数
np.exp(a)

array([[ 0.36787944,  0.13533528,  0.04978707],
       [ 2.71828183,  7.3890561 , 20.08553692]])

### ブロードキャスト

In [96]:
a

array([[-1, -2, -3],
       [ 1,  2,  3]])

In [101]:
# スカラーと1次元配列の和
a + 10

array([[ 9,  8,  7],
       [11, 12, 13]])

In [99]:
c

array([  1,  10, 100])

In [102]:
# 1次元配列と2次元配列の和
a + c

array([[  0,   8,  97],
       [  2,  12, 103]])

In [110]:
c1 = c[:, np.newaxis] 
c1[:2, :]

array([[ 1],
       [10]])

In [114]:
# 列ベクトルと2次元配列の和は行のすべての要素に列ベクトルの数値が足される。
a + c1[:2, :]

array([[ 0, -1, -2],
       [11, 12, 13]])

In [116]:
# (1, 3)と(3, 1)の行列の和
c + c1

array([[  2,  11, 101],
       [ 11,  20, 110],
       [101, 110, 200]])

In [119]:
# 平均値
np.mean(c)

37.0

In [120]:
# 行列とスカラーの掛け算
10 * c

array([  10,  100, 1000])

In [121]:
# べき乗
c ** 2

array([    1,   100, 10000], dtype=int32)

In [129]:
# 行列の積
# dot積 ⇒ np.dot(c, c1)
c * c1

array([[    1,    10,   100],
       [   10,   100,  1000],
       [  100,  1000, 10000]])

### ドット積

In [137]:
# (2, 3)行列と(3, 2)行列のドット積
np.dot(a, a.T)

array([[ 14, -14],
       [-14,  14]])

In [140]:
# dot()は@で代替可能
a @ a.T

array([[ 14, -14],
       [-14,  14]])

In [141]:
a.T @ a

array([[ 2,  4,  6],
       [ 4,  8, 12],
       [ 6, 12, 18]])

### 判定・論理値

In [151]:
# 各要素の真偽値
print(a, "\n")
print(a > 1)

[[-1 -2 -3]
 [ 1  2  3]] 

[[False False False]
 [False  True  True]]


In [162]:
# 0でない要素のカウント
d = np.array([0, 1, 2, -1])
print(np.count_nonzero(d))

# Trueの数のカウント
print(np.sum(d > 1))

3
1


In [166]:
# Trueがあるかどうか
print(np.any(d < -1))
print(np.any(d > 0))

False
True


In [169]:
# 全ての要素について
print(np.all(d >= -1))
print(np.all(d > 0))

True
False


In [171]:
# 条件を満たす要素のみ抽出する
d[d > 0]

array([1, 2])

In [177]:
print(a, "\n")
print(c, "\n")
a == c

[[-1 -2 -3]
 [ 1  2  3]] 

[  1  10 100] 



array([[False, False, False],
       [ True, False, False]])

In [185]:
x = a * c
x *= 10
print(x, "\n")
print(a == c, "\n")
x[a == c]

[[  -10  -200 -3000]
 [   10   200  3000]] 

[[False False False]
 [ True False False]] 



array([10])

In [191]:
# 配列同士が同じ要素かどうか
print(a[1], "\n\n", b[0])
np.allclose(a[1], b[0])

[1 2 3] 

 [1 2 3]


True

In [194]:
# 誤差の範囲を指定
print(a, "\n\n", b)
np.allclose(a, b, atol=10)

[[-1 -2 -3]
 [ 1  2  3]] 

 [[1 2 3]
 [4 5 6]]


True

### 関数とメソッド

In [197]:
print(a)
# aの要素の合計
np.sum(a)

[[-1 -2 -3]
 [ 1  2  3]]


0