# NumPyメモ
参考：https://deepage.net/features/numpy/  
参考：Udemy「米国データサイエンティストがやさしく教えるデータサイエンスのためのPythonの講座」

In [2]:
import numpy as np

In [5]:
# numpyのモジュールの場所を表示
np.__file__

'/opt/anaconda3/lib/python3.7/site-packages/numpy/__init__.py'

## NumPy Arrays(ndarray)
N次元行列(ndarray)を作成するメソッド  
ndarrayの特徴は以下。  
* 同じ型を持つ要素しか格納することができない
* 各次元ごとの(2次元なら列ごとや行ごと)の要素数は必ず一定
* C言語を元に、最適化された行列演算を行うため効率的な処理をすることができる


In [8]:
# 3次元ベクトルが一つのイメージ
np.array([1, 2, 3])

array([1, 2, 3])

In [12]:
# ３×３の行列を定義
matrix = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

In [18]:
# numpy.arrayの要素はnumpy独自のデータタイプであることに注意
print(type(matrix[0][0]))

# 普通の1の場合
print(type(1))

<class 'numpy.int64'>
<class 'int'>


ndarrayのデータ型としては下記をよく使う  
・uint8: 0-255（８ビット）の整数  
・float32または64: 32,64ビットの小数点型。機械学習に使うデータを保存するときに使う　　

In [21]:
# 使用例
ndarray = np.array([1, 2, 3], dtype=np.float32)
ndarray

array([1., 2., 3.], dtype=float32)

In [22]:
# 行数が足りなくても補完して演算を行う(broadcasting)
array1 = np.array([1, 2, 3])
array2 = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(array1 + array2)

print(array2 + 3)

[[ 2  4  6]
 [ 5  7  9]
 [ 8 10 12]]
[[ 4  5  6]
 [ 7  8  9]
 [10 11 12]]



ndarray.shapeで（行、列）が分かる

In [30]:
array2.shape

(1, 3)

In [23]:
array3 = np.array([[1, 2], [4, 5], [7, 8]])
array3

array([[1, 2],
       [4, 5],
       [7, 8]])

In [24]:
# tupleの形（行、列）で返ってくる
array3.shape

(3, 2)

In [25]:
array3.reshape(2, 3)

array([[1, 2, 4],
       [5, 7, 8]])

## 次元について

In [26]:
array1 = np.array([1, 2, 3])
array2 = np.array([[1, 2, 3]])
print(array1)
# array1の書き方だと、単に3つの要素の1次元配列になる(ベクトル)
print(array1.shape)
print(array1.ndim)

print()

# array2の書き方だと、1行しかない2次元配列の扱い（行列）
print(array2)
print(array2.ndim)
print(array2.shape)

[1 2 3]
(3,)
1

[[1 2 3]]
2
(1, 3)


In [27]:
# ndarrayの次元を行方向（縦）に増やす。axisにはshapeのタプルのインデックスを指定するイメージ
array1_expand = np.expand_dims(array1, axis=0)
print(array1_expand.shape)
print(array1_expand)

print()
# ndarrayの次元を列方向（横）に増やす
array2_expand = np.expand_dims(array1, axis=1)
print(array2_expand.shape)
print(array2_expand)



(1, 3)
[[1 2 3]]

(3, 1)
[[1]
 [2]
 [3]]


In [38]:
# 3次元配列
a1 = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
a2 = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
# 奥行2、縦3、横3
a3 = np.array([a1, a2])


print(a3)
print('次元数：{}'.format(a3.ndim))
print('シェイプ：{}'.format(a3.shape))

[[[1 2 3]
  [4 5 6]
  [7 8 9]]

 [[1 2 3]
  [4 5 6]
  [7 8 9]]]
次元数：3
シェイプ：(2, 3, 3)


## 行列のスライシング
普通のリストと同じ要領でスライシングできる。


In [40]:
ndarray = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12], [13, 14, 15, 16]])

In [41]:
ndarray[:2, :2]

array([[1, 2],
       [5, 6]])

In [43]:
ndarray[:, 2:]

array([[ 3,  4],
       [ 7,  8],
       [11, 12],
       [15, 16]])

## 1DArrayの生成
np.arange(), np.linspce(),np.logspace()で1DArrayを作成することができる。

In [55]:
# arange(始点、終点、公差)　→使い方はrange()関数と同じ
np.arange(1, 10, 2)


array([1, 3, 5, 7, 9])

In [58]:
# np.linspace（始点、終点、要素数） *lin = linearのこと
# 終点/(要素数 -1)が公差となる。
np.linspace(0, 10, 5)

array([ 0. ,  2.5,  5. ,  7.5, 10. ])

In [60]:
# endpoint=Falseをつけることで終点の値は含まなくする。
# この場合、公差は終点/要素数
np.linspace(0, 10, 5, endpoint=False)

array([0., 2., 4., 6., 8.])

In [62]:
# 10を底として、（始点0、終点3、要素数10）、10 ** (3/9)が公差の配列を生成
np.logspace(0, 3, 10)


array([   1.        ,    2.15443469,    4.64158883,   10.        ,
         21.5443469 ,   46.41588834,  100.        ,  215.443469  ,
        464.15888336, 1000.        ])