# Day1-3 Numpy

## ①Numpyとは？
https://numpy.org/
- 数値計算を高速に行うことができるPythonのライブラリ
- 特に多次元配列が扱いやすくなるので、データ分析や機械学習の分野で多く使われています  

【参考】
https://tutorials.chainer.org/ja/08_Introduction_to_NumPy.html

## ②インストール
- この講義では1.22.4を使います。

In [11]:
!pip install numpy==1.22.4



## ③多次元配列
- arrayを使って多次元配列を定義します
- .shapeで形、.ndimで次元数、.sizeで要素数を取得できます

In [12]:
import numpy as np

a = np.array([0,1,2,3,4])
a

array([0, 1, 2, 3, 4])

In [21]:
print("形:{}".format(a.shape))
print("次元数:{}".format(a.ndim))
print("要素数:{}".format(a.size))

形:(5,)
次元数:1
要素数:5


In [27]:
b = np.array([[1,2,3],[4,5,6]])
b

array([[1, 2, 3],
       [4, 5, 6]])

In [28]:
print("形:{}".format(b.shape))
print("次元数:{}".format(b.ndim))
print("要素数:{}".format(b.size))

形:(2, 3)
次元数:2
要素数:6


## ④arrayのソート、結合
- np.sortでソート
- np.concatenateでarrayの結合(axisで方向の指定)

In [32]:
a = np.array([3,1,2])
b = np.array([4,5,6])

a = np.sort(a)
a

array([1, 2, 3])

In [35]:
c = np.concatenate((a,b))
c

array([1, 2, 3, 4, 5, 6])

In [36]:
a = np.array([[1,2],[3,4]])
b = np.array([[5,6],[7,8]])

c = np.concatenate((a,b),axis=0)
c

array([[1, 2],
       [3, 4],
       [5, 6],
       [7, 8]])

In [38]:
d = np.concatenate((a,b),axis=1)
d

array([[1, 2, 5, 6],
       [3, 4, 7, 8]])

## ⑤array同士の計算
- array同士で四則演算ができます

In [39]:
a = np.array([3,1,2])
b = np.array([4,5,6])

c = a+b
c

array([7, 6, 8])

In [40]:
d = a*3
d

array([9, 3, 6])

## ⑥行列計算
行列積の計算はnp.dot()もしくはA.dot(B)を使います
![image.png](attachment:image.png)
https://atarimae.biz/archives/23930

In [43]:
a = np.array([
    [1, 2],
    [3, 4],
])

b = np.array([
    [5, 6],
    [7, 8],
])

c = np.dot(a,b)
c

array([[19, 22],
       [43, 50]])

In [44]:
a = np.array([
    [0, 1],
    [2, 3],
    [4, 5]
])

b = np.array([
    [0, 1, 2, 3],
    [4, 5, 6, 7],
])

c = a.dot(b)
c

array([[ 4,  5,  6,  7],
       [12, 17, 22, 27],
       [20, 29, 38, 47]])

## ⑦統計量を求める
- 合計: .sum()
- 平均: .mean()
- 分散: .var()
- 標準偏差: .std()
- 最大値: .max()
- 最小値: .min()

In [45]:
x = np.random.randint(0, 10, (8, 10))
x

array([[7, 5, 5, 3, 0, 6, 4, 7, 0, 2],
       [4, 6, 7, 6, 1, 5, 1, 5, 8, 6],
       [9, 9, 0, 8, 2, 1, 1, 2, 2, 8],
       [6, 8, 8, 4, 9, 2, 7, 0, 0, 4],
       [4, 9, 5, 2, 6, 4, 7, 8, 8, 5],
       [8, 4, 7, 1, 4, 6, 0, 6, 0, 1],
       [0, 3, 8, 5, 9, 2, 0, 7, 4, 0],
       [6, 2, 1, 3, 1, 6, 4, 8, 8, 9]])

In [50]:
# すべての合計
print("すべての合計: {}".format(x.sum()))
# 列の合計
print("行の合計: {}".format(x.sum(axis=0)))
# 行の合計
print("列の合計: {}".format(x.sum(axis=1)))

すべての合計: 359
行の合計: [44 46 41 32 32 32 24 43 30 35]
列の合計: [39 49 42 48 58 37 38 48]


In [51]:
# すべての平均
print("すべての平均: {}".format(x.mean()))
# 列の平均
print("行の平均: {}".format(x.mean(axis=0)))
# 行の平均
print("列の平均: {}".format(x.mean(axis=1)))

すべての平均: 4.4875
行の平均: [5.5   5.75  5.125 4.    4.    4.    3.    5.375 3.75  4.375]
列の平均: [3.9 4.9 4.2 4.8 5.8 3.7 3.8 4.8]


In [53]:
# 分散
print("分散: {}".format(x.var()))
# 標準偏差
print("標準偏差: {}".format(x.std()))
# 最大値
print("最大値: {}".format(x.max()))
# 最小値
print("最小値: {}".format(x.min()))

分散: 8.549843749999999
標準偏差: 2.9240115851343678
最大値: 9
最小値: 0


## ⑧arrayから値を取り出す

In [57]:
a = np.array([1,2,3,4,5])
a

array([1, 2, 3, 4, 5])

In [58]:
# 1番目以降
a[1:]

array([2, 3, 4, 5])

In [60]:
# 2番目から4番目
a[2:4]

array([3, 4])

In [64]:
a = np.array([[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]])
a

array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]])

In [65]:
#0行目のすべての列
a[0,:]

array([1, 2, 3, 4])

In [66]:
# すべての行の0列目
a[:,0]

array([1, 5, 9])

In [69]:
# 1行目以降の2～4列目
a[1:,2:4]

array([[ 7,  8],
       [11, 12]])