## 什麼是 Numpy？

Numpy 是 Python 的一個重要模組（Python 是一個高階語言也是一種膠水語言，可以透過整合其他低階語言同時擁有效能和高效率的開發），主要用於資料處理上。Numpy 底層以 C 和 Fortran 語言實作，所以能快速操作多重維度的陣列。當 Python 處理龐大資料時，其原生 list 效能表現並不理想（但可以動態存異質資料），而 Numpy 具備平行處理的能力，可以將操作動作一次套用在大型陣列上。此外 Python 其餘重量級的資料科學相關套件（例如：Pandas、SciPy、Scikit-learn 等）都幾乎是奠基在 Numpy 的基礎上。因此學會 Numpy 對於往後學習其他資料科學相關套件打好堅實的基礎。


![image.png](attachment:image.png)

## 1. Numpy 陣列

Numpy 的重點在於陣列的操作，其所有功能特色都建築在同質且多重維度的 ndarray（N-dimensional array）上。ndarray 的關鍵屬性是維度（ndim）、形狀（shape）和數值類型（dtype）。 一般我們稱一維陣列為 vector 而二維陣列為 matrix。一開始我們會引入 numpy模組，透過傳入 list 到 numpy.array() 創建陣列。

In [23]:
# 引入 numpy 模組
import numpy as np
np1 = np.array([1., 2., 3.])  # 將串列轉成陣列
np2 = np.array([3, 4, 5])

In [24]:
# 陣列相加
print(np1 + np2) # [4 6 8]

[4. 6. 8.]


In [25]:
# 顯示相關資訊
print("維度：", np1.ndim ,"\n", "矩陣維數：", np1.shape,"\n", "資料型別：", np1.dtype) # 一維陣列, 三個元素, 資料型別


維度： 1 
 矩陣維數： (3,) 
 資料型別： float64


In [8]:
# 從檔案取資料
npd = np.genfromtxt('data.csv', delimiter=':')  # delimiter 分隔符號
print(npd)

[[1. 2. 3. 4. 5. 6.]
 [2. 3. 4. 5. 6. 7.]
 [3. 4. 5. 6. 7. 8.]
 [4. 5. 6. 7. 8. 9.]]


In [27]:
# 改變陣列維度
np3 = np.array([1, 2, 3, 4, 5, 6]) # 1 row
print("原來的 np3：", np3)
np3 = np3.reshape([2, 3])  # 改變陣列維度， 2 rows、3 columns
print("改變維度後的 np3：", "\n", np3)
print("維度：", np3.ndim ,"\n", "矩陣維數：", np3.shape,"\n", "資料型別：", np3.dtype) 

原來的 np3： [1 2 3 4 5 6]
改變維度後的 np3： 
 [[1 2 3]
 [4 5 6]]
維度： 2 
 矩陣維數： (2, 3) 
 資料型別： int32


改變陣列型別（bool、int、float、string）：

bool 可以包含 True、False，int 可以包含 int16、int32、int64。其中數字是指 bits。float 可以包含 16、32、64 表示小數點後幾位。string 可以是 string、unicode。nan 則表示遺失值。

In [29]:
# 改變陣列型別
print("np3 原資料型別：", np3.dtype)
np3 = np3.astype('int64')
print("np3 改變後的資料型別：", np3.dtype)

np3 原資料型別： int32
np3 改變後的資料型別： int64


## 2. 建立陣列

In [30]:
# 建立填滿 0 或 1 的陣列
np1 = np.zeros([2, 3])
np2 = np.ones([2, 3])
print("np1", "\n", np1)
print("np2", "\n", np2)

np1 
 [[0. 0. 0.]
 [0. 0. 0.]]
np2 
 [[1. 1. 1.]
 [1. 1. 1.]]


![image.png](attachment:image.png)

In [34]:
a = np.array([0,1,2,3,4,5,10,11,12,13,14,15,20,21,22,23,24,25,30,31,32,33,34,35,40,41,42,43,44,45,50,51,52,53,54,55])
a = a.reshape(6,6)          
print(a)

[[ 0  1  2  3  4  5]
 [10 11 12 13 14 15]
 [20 21 22 23 24 25]
 [30 31 32 33 34 35]
 [40 41 42 43 44 45]
 [50 51 52 53 54 55]]


In [35]:
print(a[(0,1,2,3,4),(1,2,3,4,5)]) # a[0,1] = 1, a[1,2] = 12, a[2,3] = 23, a[3,4] = 34, a[4,5] = 45

[ 1 12 23 34 45]


In [36]:
print(a[3:,[0,2,5]]) # 從第 3 列起，取第 0、2、5 行的資料

[[30 32 35]
 [40 42 45]
 [50 52 55]]


## 3. 陣列索引與切片

In [37]:
# 一維陣列操作和 Python 原生 list 類似：
np3 = np.array([1, 2, 3, 4, 5, 6])
print(np3[2])

3


In [38]:
# 二維陣列：
np3 = np3.reshape([2, 3])
print(np3[1, 0])

4


![image.png](attachment:image.png)

## 4. 基本操作

In [39]:
# 使用布林遮罩來取值
np3 = np.array([1, 2, 3, 4, 5, 6])
print(np3 > 3) # [False False False  True  True  True]
print(np3[np3 > 3]) # [4 5 6]

[False False False  True  True  True]
[4 5 6]


In [43]:
# 加總
np3 = np3.reshape([2, 3])
print("np3", "\n", np3)
print("np3 橫向加總", "\n", np3.sum(axis=1)) # 將 axis=1 橫向加總 [6 15]

np3 
 [[1 2 3]
 [4 5 6]]
np3 橫向加總 
 [ 6 15]
