## $\Large{Numpy\; Tutorial \;(part1)}$

Numpy 是使用Python進行科學運算中最基礎的模組，主要的功能環繞在**ndarray (n-dimensional array，中文為多維陣列)**物件上。

最直覺的想法可以將它看成是一維的列表(list)或是二維矩陣(matrix)，然而由於ndarray可以表示超過二維的資料，因此即使在讀取圖片或影像等資料上也非常地依賴Numpy這個套件。因此這個部分我們將帶大家了解Numpy所提供的功能與函式。


In [1]:
!pip install flake8 pycodestyle_magic
%load_ext pycodestyle_magic
%pycodestyle_on



### 本章節內容大綱
* [事前準備](#事前準備)
    - [載入Numpy套件](#載入Numpy套件)
    - [Numpy中的「維度」概念](#Numpy中的「維度」概念)
* [創建多維陣列(Array Creation)](#創建多維陣列)
    - [將List轉換為ndarray](#將List轉換為ndarray)
    - [其他創建陣列的方法](#其他創建陣列的方法)
* [多維陣列的屬性(Array Attributes)](#多維陣列的屬性)
    - [陣列維度與大小](#陣列維度與大小)
    - [陣列中的資料型態](#陣列中的資料型態)
* [陣列運算](#陣列運算)
    - [基本數學運算](#基本數學運算)
    - [描述性統計](#描述性統計)

---
<a name="事前準備"></a>
## 事前準備

<a name="載入Numpy套件"></a>
- ### 載入Numpy套件
Numpy所提供的函數都是原本在Python內沒有的，如果想使用的話，需要先輸入**import numpy as np**才能使用這些函數。

 如果後續往下執行時看到錯誤訊息 **NameError: name 'np' is not defined**，就代表你可能忘了載入套件(或是打錯字)，Python當下不知道np是甚麼東西喔。

<img src='https://drive.google.com/uc?export=view&id=1nytKHePOSQs6-_6SLYXqH7dUpeswIOxj'/>

In [2]:
import numpy as np

<a name="Numpy中的「維度」概念"></a>
- ### Numpy中的「維度」概念
既然numpy提供的物件類型叫做**n維陣列**，我們首先就得來說說在numpy裡面的維度代表的意義以及如何計算。

<img src='https://drive.google.com/uc?export=view&id=1NXFWlt1Qz81sl-3wCkadZb_1ehRF-cTT'/>

In [3]:
# 一個維度的陣列
# 這個陣列內有3個元素，因此我們說這個陣列是一維陣列，長度是 3
[1, 3, 5]

# 兩個維度的陣列
# 這個陣列內有2個子陣列，每個子陣列內又有3個元素，因此我們說這個陣列是二維陣列，的第一個維度長度是 2 ，第二個維度長度是 3
# [[ 1, 3, 5],
#  [ 2, 4, 6]]

[1, 3, 5]

---
<a name="創建多維陣列"></a>
## 創建多維陣列
在numpy中，我們可以將一個列表轉換為陣列型態，也可以使用numpy所提供的函數創建一些常見的陣列

<a name="將List轉換為ndarray"></a>
- ### 將List轉換為ndarray

In [4]:
# 一個已經被定義好的list
existed_list = [18, 15, 21, 10, 88, 76, 29, 20]

# 印出來看看
print(existed_list)
print(type(existed_list))

[18, 15, 21, 10, 88, 76, 29, 20]
<class 'list'>


In [5]:
# 將這個list轉換為ndarray的型態
np_array = np.array(existed_list)

# 印出來看看
print(np_array)
print(type(np_array))
# 可以發現雖然看起來也很像原本的list，但它的類型已經是ndarray了

[18 15 21 10 88 76 29 20]
<class 'numpy.ndarray'>


In [6]:
# list of lists 可以轉換為 2d array
list_of_lists = [[1, 2, 3], [4, 5, 6]]

# 將這個物件轉為ndarray的型態
np_array = np.array(list_of_lists)

# 印出來看看
print(np_array)

[[1 2 3]
 [4 5 6]]


In [7]:
print(type(np_array))

<class 'numpy.ndarray'>


<a name="其他創建陣列的方法"></a>
- ### 其他創建陣列的方法

In [8]:
# 產生從0到2的一維陣列
print(np.arange(3))

# array([0., 1., 2.])

[0 1 2]


In [9]:
# 給定長度，產生元素皆為0的陣列
print(np.zeros(3))

# array([ 0.,  0.,  0.])


# 給定矩陣大小，產生元素皆為0的陣列
print(np.zeros((2, 3)))

# array([[ 0.,  0.,  0.],
#        [ 0.,  0.,  0.]])

[0. 0. 0.]
[[0. 0. 0.]
 [0. 0. 0.]]


In [10]:
# 給定矩陣大小，產生元素皆為1的陣列
print(np.ones((2, 3)))

# array([[ 1.,  1.,  1.],
#        [ 1.,  1.,  1.]])

[[1. 1. 1.]
 [1. 1. 1.]]


In [11]:
# 參照陣列
reference_array = np.array([[1., 2., 3.], [4., 5., 6.]])

# 建立一個跟參照陣列相同大小且元素都是0的陣列
print(np.zeros_like(reference_array))

# array([[0., 0., 0.],
#         0., 0., 0.]])

# 建立一個跟參照陣列相同大小且元素都是1的陣列
print(np.ones_like(reference_array))

# array([[1., 1., 1.],
#         1., 1., 1.]])

[[0. 0. 0.]
 [0. 0. 0.]]
[[1. 1. 1.]
 [1. 1. 1.]]


In [12]:
print(reference_array)

[[1. 2. 3.]
 [4. 5. 6.]]


In [13]:
# 從 1 到 10 均勻地找 10 個點
print(np.linspace(start=1, stop=10, num=10))

# array([ 1.,  2.,  3.,  4.,  5.,  6.,  7.,  8.,  9., 10.])

[ 1.  2.  3.  4.  5.  6.  7.  8.  9. 10.]


---
<a name="多維陣列的屬性"></a>
## 多維陣列的屬性

<a name="陣列維度與大小"></a>
- ### 陣列維度與大小

<img src='https://drive.google.com/uc?export=view&id=1neC0Q9FGiazEeIL4bfgZ4fFusexg6-dV'/>

In [14]:
# 創建一個陣列
x = np.arange(3)
print(x)

[0 1 2]


In [15]:
# ndim - 呈現這個陣列的維度
print(x.ndim)  # 1 dim

1


In [16]:
# shape - 呈現這個陣列每個維度的大小
print(x.shape)  # (3, )

(3,)


In [17]:
# size - 呈現陣列總共的元素數量
print(x.size)  # 3

3


<a name="陣列中的資料型態"></a>
- ### 陣列中的資料型態
我們上面到陣列裡面最常見的是放入數字，但也可以接受文字或其他資料型態。不過即使是數字也有整數、浮點數、以及精度的差異，這個部份我們就來看一下在numpy中要如何查看以及改變陣列的資料型態。

```小提醒，如果陣列中的元素是無法被轉成數字的文字，即使強制想要改變陣列資料型態為數值類型(ex.int32)也會報錯唷```

In [18]:
# 創建一個陣列
x = np.arange(3)

# 印出這個陣列的資料型態
print(x.dtype)

int64


In [19]:
x

array([0, 1, 2])

In [20]:
# 改變資料型態
x = x.astype('float32')
print(x.dtype)

float32


In [21]:
x

array([0., 1., 2.], dtype=float32)

In [22]:
# 在創建時也可以指定資料的型態
y = np.arange(3, dtype='float64')  # [ 0.  1.  2.]
print(y.dtype)

float64


In [23]:
y

array([0., 1., 2.])

---
<a name="陣列運算"></a>
## 陣列運算

有了這樣的好幫手之後，我們總得看一下陣列可以幫助我們做甚麼事情。

```(大家也可以試著想想看如果我們只有list可以使用的話要如何下面的事情呢)```

<a name="基本數學運算"></a>
- ### 基本數學運算

In [24]:
a = np.array([[1, 2], [3, 4]])
b = np.array([[5, 6], [7, 8]])

print(a)
print('---------')
print(b)

[[1 2]
 [3 4]]
---------
[[5 6]
 [7 8]]


In [25]:
print(a + b)  # array([[6, 8], [10, 12]])

[[ 6  8]
 [10 12]]


In [26]:
print(a - b)  # array([[-4, -4], [-4, -4]])

[[-4 -4]
 [-4 -4]]


In [27]:
print(a * b)  # array([[5, 12], [21, 32]])
print(a / b)  # array([[0.2, 0.33333333], [0.42857143, 0.5]]

[[ 5 12]
 [21 32]]
[[0.2        0.33333333]
 [0.42857143 0.5       ]]


In [28]:
# broadcasting - https://docs.scipy.org/doc/numpy/user/basics.broadcasting.html

print(a - 1)  # array([[0, 1], [2, 3]])
print(a * 2)  # array([[2, 4], [6, 8]])

[[0 1]
 [2 3]]
[[2 4]
 [6 8]]


<a name="描述性統計"></a>
- ### 描述性統計

In [29]:
# 創建一個ndarray
x = np.array([[0, 1, 2], [3, 4, 5]])
print(x)

[[0 1 2]
 [3 4 5]]


In [30]:
# 陣列中元素的最大值
print(x.max())
# 5

5


In [31]:
# 陣列中元素的總和
print(x.sum())
# 15

15


In [32]:
# 陣列中元素的平均數
print(x.mean())
# 2.5

2.5


還記得一開始提到的陣列維度嗎? Numpy另一個厲害的地方是我們可以沿著某一個特定的軸去做運算。但甚麼叫做"沿著某一個特定的軸"呢? 讓我們看一下以下的例子。

<img src='https://drive.google.com/uc?export=view&id=1CMmjgsYG4YH_Ig8YisfLvVTSgXSP8RL3'/>

[[0,1,2],[3,4,5]] 這個矩陣有兩個軸，第一個軸長度為2，第二個軸長度為3 (可以從陣列的shape來確認這件事情)

如果我們沿著第一個軸(記得第一個軸是axis = 0 唷)去做總和，就代表我們將第一個軸上的元素當作同一組來做加總，因此在這個例子會產生3個總和的數字。

如果我們沿著第二個軸做總和的計算，代表我們將第二個軸上的元素當作同一組來作加總，在這個例子會產生2個總和的數字。

<img src='https://drive.google.com/uc?export=view&id=1MMGFNEQrWJgS2jXSCG21NNQ_zpBxKpt3'/>

```除了對陣列做總和之外，計算最大值、平均數等函數也都可以加入axis這個參數唷```

In [33]:
# 創建一個shape為(2,3)的陣列
x = np.array([[0, 1, 2], [3, 4, 5]])
print(x)

[[0 1 2]
 [3 4 5]]


In [34]:
# 沿著第一個軸做總和
print(x.sum(axis=0))
# [3, 5, 7]

[3 5 7]


In [35]:
# 沿著第二個軸做總和
print(x.sum(axis=1))
# [3, 12]

[ 3 12]
