# numpy-基本功能

## 教學目標

這份教學的目標是介紹基本的 numpy 功能，並學習快速操作大量數值型態的資料。

## 適用對象

適用於有程式基礎，且擁有 python 基礎的人。
若沒有先學過 python，請參考 [python-入門語法](./python-入門語法.ipynb) 教學。

## 大綱

- [簡介](#簡介)
- [陣列宣告](#陣列宣告)
- [陣列取值](#陣列取值)
- [陣列運算](#陣列運算)
- [其他函數](#其他函數)

## 簡介

根據 [Numpy 官方網站](https://numpy.org/):

> NumPy is the fundamental package for scientific computing with Python.
> 
> NumPy 是設計用於進行科學計算的 Python 工具
> 
> It contains among other things:
>
> 包含了以下內容:
>
> - a powerful N-dimensional array object
>
> N 維度的矩陣運算功能
>
> - sophisticated (broadcasting) functions
>
> 方便的運算傳播功能
>
> - tools for integrating C/C++ and Fortran code
>
> 能夠跟 C/C++/Fortran 程式碼整合的工具
>
> - useful linear algebra, Fourier transform, and random number capabilities
>
> 包含線性代數、傅利葉轉換、隨機變數的功能

In [None]:
# import 的功能為匯入模組，在這裡我們匯入 numpy 模組
# 為了程式撰寫方便，在程式中可以用別稱來取代模組名稱
# 使用方式為 import 模組名稱 as 別稱

import numpy as np

## 陣列宣告

在 `numpy` 中陣列稱為 `ndarray`，創造陣列的語法為 `numpy.array([value1, value2, ...])`。

- 每個 `numpy.ndarray` 都有不同的**數值型態屬性** `numpy.ndarray.dtype`
    - 必須透過 `numpy.ndarray.dtype` 取得，無法透過 `type()` 取得

|`numpy` 型態|C 型態|範圍|
|-|-|-|
|`numpy.int8`|`int_8`|-128~127|
|`numpy.int16`|`int_16`|-32768~32767|
|`numpy.int32`|`int_32`|-2147483648~2147483647|
|`numpy.int64`|`int_64`|-9223372036854775808~9223372036854775807|
|`numpy.uint8`|`uint_8`|0~255|
|`numpy.uint16`|`uint_16`|0~65535|
|`numpy.uint32`|`uint_32`|0~4294967295|
|`numpy.uint64`|`uint_64`|0~18446744073709551615|
|`numpy.float32`|`float`||
|`numpy.float64`|`double`||

- 每個 `numpy.ndarray` 都有**維度屬性** `numpy.ndarray.shape`
    - `numpy.ndarray.shape` 本質是 `tuple`
    - 陣列為度愈高，`len(numpy.ndarray.shape)` 數字愈大
- 可以使用 `numpy.ndarray.reshape` 進行維度變更
    - 變更後的維度必須要與變更前的維度乘積相同
    - 變更後的內容為 **shallow copy**

In [None]:
# 陣列宣告

arr1 = np.array([1, 2, 3])                    # 宣告 ndarray 變數
print(arr1)                                   # 輸出 ndarray
print(type(arr1) == np.ndarray)               # 輸出 True
print(arr1.dtype)                             # 輸出 int64
print()

arr2 = np.array([1., 2., 3.])                 # 宣告 ndarray 變數
print(arr2)                                   # 輸出 ndarray
print(type(arr2) == np.ndarray)               # 輸出 True
print(arr2.dtype)                             # 輸出 float64
print()

# 各種 dtype
print(np.array(arr1, dtype=np.int8).dtype)    # 輸出 int8
print(np.array(arr1, dtype=np.int16).dtype)   # 輸出 int16
print(np.array(arr1, dtype=np.int32).dtype)   # 輸出 int32
print(np.array(arr1, dtype=np.int64).dtype)   # 輸出 int64
print(np.array(arr1, dtype=np.uint8).dtype)   # 輸出 uint8
print(np.array(arr1, dtype=np.uint16).dtype)  # 輸出 uint16
print(np.array(arr1, dtype=np.uint32).dtype)  # 輸出 uint32
print(np.array(arr1, dtype=np.uint64).dtype)  # 輸出 uint64
print(np.array(arr2, dtype=np.float32).dtype) # 輸出 float32
print(np.array(arr2, dtype=np.float64).dtype) # 輸出 float64

In [None]:
# shape 屬性

arr3 = np.array([                  # 宣告 ndarray 變數
    [1, 2, 3],
    [4, 5, 6],
    [7, 8, 9],
    [10, 11, 12],
])

print(arr3)                        # 輸出 ndarray
print(arr3.shape)                  # 輸出 arr3.shape (4, 3)
print()

print(arr3.reshape(3, 4))          # 重新更改 arr3.shape
print(arr3.reshape(3, 4).shape)    # 輸出更改後的維度 (3, 4)
print()

print(arr3.reshape(2, 6))          # 重新更改 arr3.shape
print(arr3.reshape(2, 6).shape)    # 輸出更改後的維度 (2, 6)
print()

print(arr3.reshape(2, 3, 2))       # 重新更改 arr3.shape
print(arr3.reshape(2, 3, 2).shape) # 輸出更改後的維度 (2, 3, 2)

## 陣列取值

與 `list` 語法概念相似。

- 使用 `numpy.ndarray[位置]` 來取得 `numpy.ndarray` 中指定位置的值
    - 若為**多個維度**的陣列，則使用 `tuple` 來取得指定位置的值
    - 若位置為**負數**，則等同於反向取得指定位置的值
    - 取出的值會以 `numpy.ndarray.dtype` 的形式保留
- 使用 `numpy.ndarray[起始位置:結束位置]` 來取得 `numpy.ndarray` 中的部分**連續**值
    - **包含起始位置**的值
    - **不包含結束位置**的值
    - 取出的值會以 `numpy.ndarray` 的形式保留
- 使用 `numpy.ndarray[iterable]`（例如 `list`, `tuple` 等）來取得**多個** `numpy.ndarray` 中的值
    - 取出的值會以 `numpy.ndarray` 的形式保留
- 使用判斷式來取得 `numpy.ndarray` 中的部份資料
    - 經由判斷式所得結果也為 `numpy.ndarray`
    - 判斷式所得結果之 `numpy.ndarray.dtype` 為**布林值** `bool`（`True` 或 `False`）
    - 取出的值會以 `numpy.ndarray` 的形式保留

In [None]:
# 陣列取值

arr4 = np.array([   # 宣告 ndarray 變數
    0, 10, 20, 30, 40, 
    50, 60, 70, 80, 90
])

print(arr4[0])      # 輸出 arr4 中的第 0 個位置的值 0
print(arr4[1])      # 輸出 arr4 中的第 1 個位置的值 10
print(arr4[2])      # 輸出 arr4 中的第 2 個位置的值 20
print(arr4[-2])     # 輸出 arr4 中的第 -2 個位置的值 80
print(arr4[-1])     # 輸出 arr4 中的第 -1 個位置的值 90
print()

# 多維陣列取值

arr5 = np.array([   # 宣告 ndarray 變數
    [0, 1, 2],
    [3, 4, 5],
    [6, 7, 8],
    [9, 10, 11],
])

print(arr5[0])      # 輸出 arr5 中的第 0 個位置的值 [0, 1, 2]
print(arr5[1])      # 輸出 arr5 中的第 1 個位置的值 [3, 4, 5]
print(arr5[2])      # 輸出 arr5 中的第 1 個位置的值 [6, 7, 8]
print(arr5[-2])     # 輸出 arr5 中的第 -2 個位置的值 [6, 7, 8]
print(arr5[-1])     # 輸出 arr5 中的第 -1 個位置的值 [9, 10, 11]
print()

print(arr5[0, 0])   # 輸出 arr5 中的第 [0, 0] 個位置的值 0
print(arr5[0, 1])   # 輸出 arr5 中的第 [0, 1] 個位置的值 1
print(arr5[1, 1])   # 輸出 arr5 中的第 [1, 1] 個位置的值 4
print(arr5[1, 2])   # 輸出 arr5 中的第 [1, 2] 個位置的值 5
print(arr5[-1, -1]) # 輸出 arr5 中的第 [-1, -1] 個位置的值 11
print(arr5[-1, -2]) # 輸出 arr5 中的第 [-1, -2] 個位置的值 10
print(arr5[-2, -1]) # 輸出 arr5 中的第 [-2, -1] 個位置的值 8

In [None]:
# 取連續值

arr6 = np.array([ # 宣告 ndarray 變數
    0, 10, 20, 30, 40, 
    50, 60, 70, 80, 90
])

print(arr6[0:3])  # 輸出 arr6 位置 0, 1, 2 但是不含位置 3 的值 [0, 10, 20]
print(arr6[7:])   # 輸出 arr6 位置 7, 8, 9 的值 [70, 80, 90]
print(arr6[:2])   # 輸出 arr6 位置 0, 1 但是不含位置 2 的值 [0, 10]
print(arr6[:])    # 輸出 arr6 所有位置的值 [0, 10, 20, 30, 40, 50, 60, 70, 80, 90]
print()

# 多維陣列取連續值

arr7 = np.array([ # 宣告 ndarray 變數
    [0, 1, 2],
    [3, 4, 5],
    [6, 7, 8],
    [9, 10, 11],
])

print(arr7[0:2])  # 輸出 arr7 位置 0, 1, 但是不含位置 2 的值 [[0, 1, 2], [3, 4, 5]]
print()
print(arr7[1:])   # 輸出 arr7 位置 1, 2, 3 的值 [[3, 4, 5], [6, 7, 8], [9, 10, 11]]
print()
print(arr7[:1])   # 輸出 arr7 位置 0 但是不含位置 1 的值 [[0, 1, 2]]
print()
print(arr7[:])    # 輸出 arr7 位置 0 但是不含位置 1 的值 [[0, 1, 2], [3, 4, 5], [6, 7, 8], [9, 10, 11]]

In [None]:
# 使用 iterable 取得多個值

arr8 = np.array([            # 宣告 ndarray 變數
    0, 10, 20, 30, 40, 
    50, 60, 70, 80, 90
])

print(arr8[[0, 2, 4, 6, 8]]) # 輸出 arr8 中偶數位置的值 [0, 20, 40, 60, 80]
print()
print(arr8[[1, 3, 5, 7, 9]]) # 輸出 arr8 中奇數位置的值 [10, 30, 50, 70, 90]
print()

# 多維陣列使用 iterable 取得多個值

arr9 = np.array([            # 宣告 ndarray 變數
    [1, 2, 3, 4],
    [5, 6, 7, 8],
    [9, 10, 11, 12]
])

print(arr9[[0, 1]])          # 輸出 arr9[0] 與 arr8[1] 的值 [[1, 2, 3, 4] [5, 6, 7, 8]]
print()
print(arr9[[0, 1], [2, 3]])  # 輸出 arr9[0, 2] 與 arr9[1, 3] 的值 [3, 8]

In [None]:
# 判斷式取值

arr10 = np.array([            # 宣告 ndarray 變數
    0, 10, 20, 30, 40, 
    50, 60, 70, 80, 90
])

print(arr10 > 50)             # 輸出每個值是否大於 50 的 `numpy.ndarray`
print((arr10 > 50).dtype)     # 輸出 bool
print(arr10[arr10 > 50])      # 輸出大於 50 的值 [60, 70, 80, 90]
print(arr10[arr10 % 20 == 0]) # 輸出除以 20 餘數為 0 的值 [0, 20, 40, 60, 80]

## 陣列運算

### 純量運算（Scalar Operation）

對陣列內所有數值與單一純量（Scalar）進行相同計算。

|符號|意義|
|-|-|
|`numpy.ndarray + scalar`|陣列中的每個數值加上 `scalar`|
|`numpy.ndarray - scalar`|陣列中的每個數值減去 `scalar`|
|`numpy.ndarray * scalar`|陣列中的每個數值乘上 `scalar`|
|`numpy.ndarray / scalar`|陣列中的每個數值除以 `scalar`|
|`numpy.ndarray % scalar`|陣列中的每個數值除以 `scalar` 所得餘數|
|`numpy.ndarray ** scalar`|陣列中的每個數值取 `scalar` 次方|

### 個別數值運算（Element-wised Operation）

若兩個陣列想要進行運算，則兩個陣列的**維度必須相同**（即兩陣列之 `numpy.ndarray.shape` 相同）。

|符號|意義|
|-|-|
|`A + B`|陣列 `A` 中的每個數值加上陣列 `B` 中相同位置的數值|
|`A - B`|陣列 `A` 中的每個數值減去陣列 `B` 中相同位置的數值|
|`A * B`|陣列 `A` 中的每個數值乘上陣列 `B` 中相同位置的數值|
|`A / B`|陣列 `A` 中的每個數值除以陣列 `B` 中相同位置的數值|
|`A % B`|陣列 `A` 中的每個數值除以陣列 `B` 中相同位置的數值所得餘數|
|`A ** B`|陣列 `A` 中的每個數值取陣列 `B` 中相同位置的數值之次方|

### 個別數值函數運算（Element-wised Functional Operation）

若想對陣列中的**所有數值**進行**相同函數運算**，必須透過 `numpy` 提供的介面進行。

|函數|意義|
|-|-|
|`numpy.sin`|陣列中的每個數值 $x$ 計算 $\sin(x)$|
|`numpy.cos`|陣列中的每個數值 $x$ 計算 $\cos(x)$|
|`numpy.tan`|陣列中的每個數值 $x$ 計算 $\tan(x)$|
|`numpy.exp`|陣列中的每個數值 $x$ 計算 $e^{x}$|
|`numpy.log`|陣列中的每個數值 $x$ 計算 $\log x$
|`numpy.ceil`|陣列中的每個數值 $x$ 計算 $\left\lceil x \right\rceil$
|`numpy.floor`|陣列中的每個數值 $x$ 計算 $\left\lfloor x \right\rfloor$

### Broadcasting

若陣列 `A` 的維度為 `(a1, a2, ..., an)`（即 `A.shape == (a1, a2, ..., an)`），則陣列 `B` 在滿足以下其中一種條件時即可與陣列 `A` 進行運算：

- 陣列 `B` 與陣列 `A` 維度相同（即 `B.shape == (a1, a2, ..., an)`）
- 陣列 `B` 為純量（即 `B.shape == (1,)`）
- 陣列 `B` 的維度為 `(b1, b2, ..., bn)`，若 `ai != bi`，則 `ai == 1` 或 `bi == 1`

In [None]:
print(a)         # 取得 a
print(a + 1)     # 對 a 所有元素同加 1
print(a - 3)     # 對 a 所有元素同減 3
print(a * 2)     # 對 a 所有元素同乘 2
print(a / 10)    # 對 a 所有元素同除以 10

In [None]:
print(a + a)                      # 矩陣加法
print(a - a)                      # 矩陣減法
print(a * np.array([4, 5, 6, 7])) # 兩陣列相對應元素相乘
print(a / a)                      # 兩陣列相對應元素相除

# 二維陣列

### 陣列宣告
- 同一維陣列宣告方式

### 陣列取值
- 同一維陣列取值方式
- 可使用 `[列,行]` 來取得 array 中第幾列第幾行的元素

### 陣列運算
- `dot` **矩陣乘法**
- 矩陣乘法之交換律不成立

In [None]:
b = np.array([[1, 2],[4, 5]]) # 宣告二維陣列 b

print(b)                      # 輸出 b 的所有內容
print(b.shape)                # 取得 b 為 幾（列）乘幾（行）的矩陣，輸出為 (2, 2)
print(b.dtype)                # 取得 b 的資料型態，輸出 int64

In [None]:
print(b[0,1])    # 取得 b 中第 0 列,第 1 行資料，輸出為 2
print(b[1])      # 取得 b 中第 1 列的資料
print(b[0:2])    # 取得 b 中第 0, 1 列但是不包含第 2 列的資料
print(b[1:])     # 取得 b 中第 1 列但是不包含第 0 列的資料
print(b[:2])     # 取得 b 中第 0, 1 列但是不包含第 2 列的資料
print(b[:,1])    # 取得 b 所有列中第 1 行的資料
print(b[1:, 1:]) # 取得 b 中第 1 列但是不包含第 0 列，且為第 1 行但是不包含第 0 行的資料

In [None]:
c = np.array([[6, 7],[8, 9]])  # 宣告二維陣列 c

#矩陣乘法之交換律不成立
print(b.dot(c))                # 計算 b 陣列乘上 c 陣列
print(c.dot(b))                # 計算 c 陣列乘上 b 陣列

# 其他函數

- 宣告 array
- 數學運算

In [None]:
# 宣告 array

# initialize zeros and ones array
e = np.zeros((2, 3))                           # 宣告一個 2 X 3 且元素皆為 0 的 array
print(e)
f = np.ones((3,4))                             # 宣告一個 3 X 4 且元素皆為 1 的 array
print(f)

# initialize random array
print(np.random.randint(5, 15, size = 10))     # 輸出一個長度為 10，元素數值介於 5 至 15(不包含) 隨機產生的 array
print(np.random.randn(2, 4))                   # 輸出一個 2 X 4 的矩陣，並且隨機給它數值

# spaced values in interval
print(np.arange(0, 20, 2))                     # 輸出一個從 0 至 20(不包含)，元素成等差為 2 的 array
print(np.linspace(0, 20, 11))                  # 輸出一個從 0 至 20(包含)，　元素成等差且長度為 11 的 array 

In [None]:
# 數學運算

d = np.array([[1,2,3],[4,5,6],[7,8,9]])        # 宣告陣列
print(d.sum())                                 # 計算陣列元素總和
print(d.mean())                                # 計算陣列元素平均數
print(d.max())                                 # 取得陣列中最大元素
print(d.argmax())                              # 取得陣列元素中最大元素的位置
print(np.log(d))                               # 對陣列中每一元素取 以自然常數 e 為底的 log 函數
print(np.exp(d))                               # 對陣列中每一元素取 以自然常數 e 為底的指數函數
print(np.sin(d))                               # 對陣列中每一元素取 sin 函數

print(d.T)                                     # 取得轉置矩陣
print(np.linalg.inv(d))                        # 取得反矩陣

# reshape
D = d.reshape(1, 9)                            # 改變陣列形狀成為 (1, 9) 的 array
print("shape: {0}, D: {1}".format(D.shape, D))