# Numpy 介紹

NumPy 是 Python 中一個強大的**數值計算套件庫**，它具有以下特點
1. 高效率的多維陣列和矩陣運算：NumPy 提供了高效的多維陣列和矩陣運算功能，能夠快速處理大規模的數據計算。
2. 快速運算速度：NumPy 的底層使用 C 語言編寫，能夠跳過 Python 的全域解譯器鎖（GIL），因此運算速度遠超過純 Python 代碼。
3. 支持向量化運算：NumPy 支持向量化運算，可以在單一指令下對整個陣列進行操作，減少了循環的需要。
4. 與其他庫的整合：NumPy 可以與其他 Python 科學計算庫（如 Pandas、SciPy、Matplotlib 等）整合，提供全面性的數據分析和科學計算功能。

NumPy 能夠高效地計算大量數據，尤其是在科學計算和數據分析領域。相比於 Python 原生的列表(L)，NumPy 的陣列（ndarray）在存儲和運算效率上有明顯優勢，NumPy 擅長解決的計算問題包括
1. 大規模數據處理：NumPy 可以快速高效地處理大量數據，適合於機器學習和深度學習等領域。
2. 多維陣列和矩陣運算：NumPy 提供了豐富的多維陣列和矩陣運算功能，適合於線性代數和矩陣計算。
3. 科學計算和數學建模：NumPy 提供了大量的數學函數和運算工具，適合於科學計算和數學建模. 

根據 numpy 的數值計算能力，非常適合在以下的應用中使用 numpy 來處理數據計算的問題
1. 數值計算和數據分析
    - 科學研究和工程：NumPy 在科學研究和工程領域中被廣泛用於數值計算和數據分析，尤其是在物理、化學和生物學等領域。
    - 機器學習和數據科學：NumPy 是機器學習和數據科學的基礎庫，常用於數據預處理和算法實現。
2. 信號處理
    - NumPy 在信號處理中被用於過濾、Fourier 分析和時間域分析等任務。
3. 圖像處理
    - NumPy 用於圖像處理任務，如過濾、變換和控圖像數據。
4. 模擬和建模
    - 科學模擬：NumPy 用於物理、化學和生物學等領域的模擬和建模。
    - 金融和經濟建模：NumPy 用於風險分析、期權定價和經濟建模。
5. 其他領域
    - 天文學：NumPy 用於處理和控天文數據，如望遠鏡圖像或光譜。
    - 生物信息學：NumPy 用於分析基因數據、蛋白質結構預測和計算生物學。
    - 遊戲開發：NumPy 用於物理模擬、碰撞檢測和處理大型數據集。
6. 教育和研究
    - NumPy 在教育和研究環境中被廣泛用於教學和實驗。

接下來的課程，先介紹 numpy 的基本操作及有用的函數，再來展示二個可以運用 numpy 來處理的技術，即影像基礎處理與線性回歸模型基礎矩陣運算。 

### 展示影像處理

In [None]:
from PIL import Image
import numpy as np

# 載入影像
image = Image.open('2024game.jpg')

# 將影像資料轉為numpy陣列資料
image_array = np.array(image)

# 讀取影像dimension
print(image_array.shape)

# 顯示影像
image.show()

# 在陣列中將影像顏色反轉
inverted_image_array = 255 - image_array

# 將陣列轉為影像
inverted_image = Image.fromarray(inverted_image_array)

# 儲存影像檔並顯示
inverted_image.save('inv_2024.jpg')  
inverted_image.show()  

(533, 800, 3)


### 導入 numpy

In [None]:
import numpy as np

### 檢查 python 與 numpy 版本

In [None]:
import platform
print('Python version: ' + platform.python_version())
print('Numpy version: ' + np.__version__)

# 0. Numpy Data Types

### Numpy 資料型別列表

In [None]:
import pandas as pd
dtypes = pd.DataFrame(
    {
        'Type': ['int8', 'uint8', 'int16', 'uint16', 'int32', 'uint32', 'int64', 'uint64', 'float16', 'float32', 'float64', 'float128', 'complex64', 'complex128', 'bool', 'object', 'string_', 'unicode_'],
        'Type Code': ['i1', 'u1', 'i2', 'u2', 'i4', 'u4', 'i8', 'u8', 'f2', 'f4 or f', 'f8 or d', 'f16 or g', 'c8', 'c16', '', 'O', 'S', 'U']
    }
)

dtypes

### 字串型別

In [None]:
# 設定字串最大長度 S + number, 如 'S3'
# 大於設定長度部分將被刪除
s = np.array(['abc', 'defg'], dtype='S3')
print(s)
print(s.dtype)

In [None]:
# numpy string and unicode data types 長度固定，以陣列中最長字串為準
arr = np.array(['a', 'ab', 'abc'], dtype=np.string_)
print(arr.dtype)

arr = np.array(['a', 'ab', 'abc'], dtype=np.unicode_)
print(arr.dtype)

# 1. 建立陣列

### 以 python list 建立 numpy 陣列

In [None]:
arr = np.array(range(10))
print(arr)

In [None]:
arr = np.array([1,2,3,4,5])
print(arr)

### 設定新陣列的資料型別

In [None]:
arr = np.array([[1,2,3], [4,5,6]], dtype='i2') # 2 維陣列
print(arr)

### 設定固定間隔數值陣列

In [None]:
# np.arange(start, stop, step)
arr = np.arange(0, 20, 2)
print(arr)

### 設定數值範圍固定資料個數

In [None]:
# np.linspace(start, stop, num_of_elements, endpoint=True, retstep=False)
arr = np.linspace(0, 10, 20)
print(arr)

### 新建隨機陣列 3x3

In [None]:
arr = np.random.rand(3, 3)
print(arr)

### 新建2x3的整數0陣列

In [None]:
zeros = np.zeros((2,3), dtype='i4')
print(zeros)

### 利用已知陣列來定義0陣列

In [None]:
zeros = np.zeros_like(arr)
print(zeros)

### 建立已知維度1陣列

In [None]:
ones = np.ones((2,3))
print(ones)

### 利用已知陣列來定義1陣列

In [None]:
ones = np.ones_like(arr)
print(ones)

### 建立已知維度empty陣列

In [None]:
empty = np.empty((2,3))
print(empty)

### 利用已知陣列來定義empty陣列

In [None]:
empty = np.empty_like(arr)
print(empty)

### 建立已知維度陣列並設定每個元素值=5  

In [None]:
p = np.full((2,3), 5)
print(p)

### 利用已知陣列來定義固定維度陣列設定每個元素值=5


In [None]:
p = np.full_like(arr, 5)
print(p)

### 建立對角線為 1 的 identity matrix

In [None]:
identity_matrix = np.eye(3)
print(identity_matrix)

In [None]:
identity_matrix = np.identity(3)
print(identity_matrix)

### 求取對角線值/建立對角線矩陣

In [None]:
arr = np.random.rand(5,5)
print(arr)

In [None]:
# extract the diagonal
print(np.diag(arr))

In [None]:
# create a matrix with a specified diagonal array
arr = np.diag([1,2,3,4,5])
print(arr)

# 2. 檢查陣列

In [None]:
arr = np.array([[1,2,3], [4,5,6]], dtype=np.int64)

### 陣列資訊

In [None]:
print(np.info(arr))

### 陣列資料型別

In [None]:
print(arr.dtype)

### 陣列的列/行數

In [None]:
print(arr.shape)

### 陣列維度

In [None]:
print(len(arr))

In [None]:
print(arr.ndim)

### 陣列元素個數

In [None]:
print(arr.size)

### 陣列元素佔記憶體大小

In [None]:
print(arr.itemsize)

### 陣列佔記憶體大小

In [None]:
# arr.nbytes = arr.size * arr.itemsize
print(arr.nbytes)

# 3. 隨機抽樣

### 設定亂數子

In [None]:
np.random.seed(123)

### 設定亂數起始位置

In [None]:
rs = np.random.RandomState(321)
rs.rand(10)

### 產生一個[0, 1)間亂數值

In [None]:
# generate a random scalar
print(np.random.rand())

In [None]:
# generate a 1-D array
print(np.random.rand(3))

In [None]:
# generate a 2-D array
print(np.random.rand(3,3))

### 產生一個[low, high)間的亂數值陣列，設定數量

In [None]:
# np.ranodm.randint(low, high, size, dtype)
print(np.random.randint(1, 10, 3, 'i8'))

### 產生一個[0.0, 1.0)間陣列，數量10個元素

In [None]:
# the following methods are the same as np.random.rand()
print(np.random.random_sample(10))
print(np.random.random(10))
print(np.random.ranf(10))
print(np.random.sample(10))

### 已知一個陣列，賦予陣列每個值得機率，抽取10個元素

In [None]:
# np.random.choice(iterable_or_int, size, replace=True, p=weights)
print(np.random.choice(range(3), 10, replace=True, p=[0.1, 0.8, 0.1]))

In [None]:
print(np.random.choice(3, 10))

In [None]:
print(np.random.choice([1,2,3], 10))

### 洗牌

In [None]:
arr = np.array(range(10))
print(arr)

In [None]:
np.random.shuffle(arr)
print(arr)

### 產生依亂數排列

In [None]:
# similar to np.random.shuffle(), but it returns a copy rather than making changes in place
arr = np.array(range(10))
print('The initial array: ', arr)
print('A permutation of the array: ', np.random.permutation(arr))

# 4. 數學函數

In [None]:
arr = np.random.rand(5,5)

### 元素加，減，乘，除

In [None]:
print(arr + 10)
print()
print(arr - 10)
print()
print(arr * 10)
print()
print(arr / 10)

In [None]:
arr1 = np.array([1,2,3])
# the above operations can be performed using numpy built-in functions
# which can save memory as the output can be stored in the original array rather than assigning new memoryarr = np.array([1,2,3])
np.add(arr1, [8,9,10], out=arr1)
print(arr1)

np.subtract(arr1, [8,9,10], out=arr1)
print(arr1)

np.multiply(arr1, [1,2,3], out=arr1)
print(arr1)

### 指數函數

In [None]:
print(np.exp(arr))

### 對數函數

In [None]:
# natural log
print(np.log(arr))

In [None]:
# base 2
print(np.log2(arr))

In [None]:
# base 10
print(np.log10(arr))

### 平方根

In [None]:
print(np.sqrt(arr))

### 三角函數




In [None]:
print(np.sin(arr))

In [None]:
print(np.cos(arr))

### 列或行總合

In [None]:
# sum along the row
print(np.sum(arr, axis=0))

In [None]:
# sum along the column
print(np.sum(arr, axis=1))

### 列或行的最大/小值

In [None]:
# calculate min along the row
print(np.min(arr, axis=0))

In [None]:
# calculate max along the column
print(np.max(arr, axis=1))

In [None]:
# if axis not specified, calculate the max/min value of all elements
print(np.max(arr))
print(np.min(arr))

### 求取二陣列元素的最大/最小值

In [None]:
arr1 = np.array([1, 3, 5, 7, 9])
arr2 = np.array([0, 4, 3, 8, 7])
print(np.maximum(arr1, arr2))
print(np.minimum(arr1, arr2))

### 將浮點數整數及小數分離

In [None]:
arr1 = np.random.rand(10) * 10
re, intg = np.modf(arr1)
print('fractional: ', re)
print('integral: ', intg)

### 計算平均值



In [None]:
# compute the overall mean
print(np.mean(arr))

In [None]:
# compute the mean along the row
print(np.mean(arr, axis=0))

In [None]:
# compute the mean along the column
print(np.mean(arr, axis=1))

### 中位數

In [None]:
# compute the overall median
print(np.median(arr))

In [None]:
# compute the median along the row
print(np.median(arr, axis=0))

In [None]:
# compute the median along the column
print(np.median(arr, axis=1))

### percentile

In [None]:
arr1 = np.random.rand(100)
# compute 5, 65, and 95 percentiles of the array
print(np.percentile(arr1, [5, 65, 95]))

### 標準差/變異數

In [None]:
# compute the overall standard deviation
print(np.std(arr))

In [None]:
# compute the standard deviation along the row
print(np.std(arr, axis=0))

In [None]:
# compute the standard deviation along the column
print(np.std(arr, axis=1))

In [None]:
# compute the overall variance
print(np.var(arr))

In [None]:
# compute the variance along the row
print(np.var(arr, axis=0))

In [None]:
# compute the variance along the column
print(np.var(arr, axis=1))

### 共變異數及相關係數

In [None]:
arr = np.random.rand(5,8)
print(arr)

In [None]:
print(np.cov(arr))

In [None]:
print(np.corrcoef(arr[:,0], arr[:,1]))

### 比較

In [None]:
arr1 = np.array([1,2,3,4,5])
arr2 = np.array([5,4,3,2,1])

In [None]:
# return an array of bools
print(arr1 == arr2)
print(arr1 < 3)

# 5. 陣列切割及索引

In [None]:
arr = np.array(range(100)).reshape((10,10))

### 以行、列值選取

In [None]:
print(arr[5][5])
# or more concisely
print(arr[5,5])

### 以行、列標號切割陣列

In [None]:
print(arr[1:3, 4:6])

### 利用 bool 選取

In [None]:
arr1 = np.arange(25).reshape((5,5))
bools = np.array([True, True, False, True, False])
print(arr1)
print()
print(arr1[bools])

In [None]:
# negate the condition
print(arr1[~bools])

# 6. 陣列排序

In [None]:
arr = np.random.rand(5,5)

### 依行/列排序

In [None]:
# sort along the row and return a copy
print(np.sort(arr, axis=0))

In [None]:
# sort along the row in place
arr.sort(axis=0)
print(arr)

In [None]:
# sort along the column and return a copy
print(np.sort(arr, axis=1))

In [None]:
# sort along the column in place
arr.sort(axis=1)
print(arr)

# 7. 矩陣運算



### 轉置矩陣

In [None]:
# the following methods return a copy
print(arr.T)
# or
print(np.transpose(arr))
# or
print(arr.transpose())

### 附加矩陣元素

In [None]:
arr = np.array([1,2,3])

In [None]:
# append a scalar and return a copy
arr1 = np.append(arr, 4)
print(arr1)

In [None]:
# append an array and return a copy
arr2 = np.append(arr, [4,5,6])
print(arr2)

### 插入矩陣元素

In [None]:
# np.insert(array, position, element)

# insert a scalar at a certain position
arr3 = np.insert(arr, 0, 100)
print(arr3)

In [None]:
# insert multiple values at a certain position
arr3 = np.insert(arr, 0, [1,2,3])
print(arr3)

### 刪除矩陣元素

In [None]:
# remove the element at position 0
arr4 = np.delete(arr, 0)
print(arr4)

In [None]:
# remove the element at multiple positions
arr4 = np.delete(arr, [0,2])
print(arr4)

### 拷貝矩陣

In [None]:
arr = np.array([1,2,3])

In [None]:
# the following methods are all deep copy
arr1 = np.copy(arr)
# or
arr1 = arr.copy()
# or
arr1 = np.array(arr, copy=True)

# 8. 矩陣合併

In [None]:
arr1 = np.array([[1,2,3,4], [1,2,3,4]])
arr2 = np.array([[5,6,7,8], [5,6,7,8]])

### ```np.concatenate((a, b), axis=0)```

In [None]:
# concat along the row
cat = np.concatenate((arr1, arr2), axis=0)
print(cat)

In [None]:
# concat along the column
cat = np.concatenate((arr1, arr2), axis=1)
print(cat)

# 9. 矩陣集合運作

### 唯一值

In [None]:
arr = np.array([1,1,2,2,3,3,4,5,6])
print(np.unique(arr))

In [None]:
# return the number of times each unique item appears
arr = np.array([1,1,2,2,3,3,4,5,6])
uniques, counts = np.unique(arr, return_counts=True)
print(uniques)
print(counts)

### 兩陣列的交集與聯集

In [None]:
arr1 = np.array([1,2,3,4,5])
arr2 = np.array([3,4,5,6,7])

In [None]:
# intersection
print(np.intersect1d(arr1, arr2))

In [None]:
# union
print(np.union1d(arr1, arr2))

# 10. 線性代數

In [None]:
arr1 = np.random.rand(5,5)
arr2 = np.random.rand(5,5)

### 矩陣乘積

In [None]:
print(arr1.dot(arr2))
# or
print(np.dot(arr1, arr2))
# or
print(arr1 @ arr2)

### QR factorization

In [None]:
arr = np.random.rand(5,5)

q, r = np.linalg.qr(arr)
print(q)
print(r)

### singular value decomposition (SVD)

In [None]:
arr = np.random.rand(5,5)

u, s, v = np.linalg.svd(arr)
print(u)
print(s)
print(v)

### compute eigen values

In [None]:
arr = np.random.rand(5,5)
print(np.linalg.eigvals(arr))

### eigen value decomposition

In [None]:
arr = np.random.rand(5,5)

w, v = np.linalg.eig(arr)
print(w)    # eigen values
print(v)    # eigen vectors

### compute the trace & determinant

In [None]:
# nxn矩陣對角線上元素總合
print(np.trace(arr))

In [None]:
# 行列式值
print(np.linalg.det(arr))

### 反矩陣

In [None]:
arr = np.random.rand(5,5)

In [None]:
# compute the inverse of a matrix
print(np.linalg.inv(arr))

### 解聯立方程

In [None]:
# solve a linear system in closed form
y = [1,2,3,4,5]
print(np.linalg.solve(arr, y))