<img width=150 src="https://upload.wikimedia.org/wikipedia/commons/thumb/1/1a/NumPy_logo.svg/200px-NumPy_logo.svg.png"></img>

# Day-02 NumPy 陣列中不同的資料型態

### NumPy 型態介紹

* NumPy 提供一個同類型元素的多維容器型態，稱為是數組或陣列。陣列的全名是 N-dimensional Array，習慣簡寫為 NdArray 或 Array。型態：

|  | 型態 |
|-----|-----|
| number, inexact, floating | float |
| complexfloating       | cfloat |
| integer, signedinteger   | int_  |
| unsignedinteger       | unit  |
| character          | string |
| generic, flexible     | void |

* 除了更多樣的型態之外，每一種型態也增加了範圍大小的彈性

| 型態 | 說明 |
|-----|-----|
| bool_   | Boolean (True or False) stored as a byte      |
| int_   | Default integer type                   |
| intc   | Identical to C int e.g int32 in64          |
| intp   | Integer used for indexing                |
| int8   | Byte (-128 to 127)                   |
| int16   | Integer (-32768 to 32767)               |
| int32   | Integer (-2147483648 to 2147483647)          |
| int64   | Integer (-9223372036854775808 to 9223372036854775807) |
| uint8   | Unsigned integer (0 to 255)              |
| uint16  | Unsigned integer (0 to 65535)             |
| uint32  | Unsigned integer (0 to 4294967295)           |
| uint64  | Unsigned integer (0 to 18446744073709551615)      |
| float16  | Half precision float: sign bit, 5 bits exponent, 10 bits mantissa |
| float32  | Single precision float: sign bit, 8 bits exponent, 23 bits mantissa |
| float64  | Double precision float: sign bit,11 bits exponent, 52 bits mantissa |
| complex64 | Complex number, represented by two 32-bit floats (real and imaginary components) |
| complex128 | Complex number, represented by two 64-bit floats (real and imaginary components) |

## Numpy 與 Python 資料型態的差異

* NumPy 的型態與 Python 內建的型態比起來更多細緻（尤其是數字型態），其目的是為了「更好的操作」與「更佳的儲存」

|資料型別|字母|Python資料型別|NumPy資料型別|NumPy類型|說明|
|---|---|---|---|---|---|
|boolean | '?'|bool|np.bool_||True/False values|
|signed byte | 'b'|bytes|np.bytes_|||
|unsigned byte | 'B'|bytes|np.bytes_|||
|signed integer | 'i'|int|np.int_|int8, int16, int32, int64|Integer numbers|
|unsigned integer | 'u'||np.uint|uint8, uint16, uint32, uint64|Integer numbers|
|floating-point | 'f'|float|np.float_|float16, float32, float64|Floating point numbers|
|complex-floating point | 'c'|complex|np.cfloat|||
|timedelta | 'm'|datetime.timedelta|np.timedelta64||Differences between two datetimes|
|datetime | 'M'|datetime.datetime|np.datetime64||Date and time values|
|string|'S', 'a'|str|np.str_||Text or mixed numeric and non-numeric values|
|Unicode string | 'U'|str|np.str_||Text or mixed numeric and non-numeric values|


## 匯入套件

In [None]:
import numpy as np
print(np.__version__)  # 1.16.5

1.22.4


## 進階函式

### `dtype` 與 `itemsize`

* `dtype`：陣列中的資料型態
* `itemsize`：陣列中每個元素佔用空間

In [None]:
a = np.arange(15).reshape(3, 5)
print(a.dtype)        
print(a.itemsize)     

int64
8


→ int32 代表的是 32 個位元長度的 int，每個元素佔用 4 Bytes

### 型態判斷

* 在 NumPy 中有幾種表示型態的方法：
  * 'int'：字串
  * 'int64'：字串
  * np.int64：物件 
  * np.dtype('float64')：物件

實際上，NumPy 型態的定義是一個 np.dtype 的物件，包含「型態名稱」、「表示範圍」及「儲存空間」等等的資訊
* is 是強比較，必須要所有規格都相同，包含是哪一種物件，要跟 np.dtype 物件來相比
* == 的比較只會考慮自定義的規則，如只需要物件的表現形式，可以接受的字串或物件的形式

In [None]:
print(a.dtype == 'int32') 
print(a.dtype is 'int32')
print(a.dtype is np.int32) 
print(a.dtype is np.dtype('int32')) 

False
False
False
False


  print(a.dtype is 'int32')


* int 代表「執行電腦中最大可表示的範圍」，會取決於電腦不同而產生不同的結果

In [None]:
print(a.dtype == 'int') 
print(a.dtype == np.int) 
print(a.dtype == np.dtype('int')) 

True
True
True


Deprecated in NumPy 1.20; for more details and guidance: https://numpy.org/devdocs/release/1.20.0-notes.html#deprecations
  print(a.dtype == np.int)


### 型態縮寫

* 不建議這樣寫，非常容易造成誤導跟錯誤

In [None]:
np.dtype('i4') # int4

dtype('int32')

## 陣列重塑

### `flatten()` 與 `ravel()`

* 相同處：透過 `flatten()` 與 `ravel()` 均可將多維陣列轉形為一維陣列，使用透過下列兩種方法得到的結果都是完全一樣：
<br>

|np.函式|陣列物件.函式|
|---|---|
|np.flatten(a, order='C')|a.flatten(order='C')|
|np.ravel(a, order='C')|a.ravel(order='C')|


In [None]:
a = np.array([[ 0,  1,  2,  3], 
              [ 4,  5,  6,  7],
              [ 8,  9, 10, 11]])
a

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])

In [None]:
a.flatten()

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])

* 不同處：`ravel()` 建立的是原來陣列的 view，在 `ravel()` 回傳物件中做的元素值變更，「將會影響原陣列的元素值」

In [None]:
b = a.ravel()
b

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])

如果我們改變 b 陣列的元素值，原陣列 a 對應的元素值也會被改變

In [None]:
b[3] = 100

In [None]:
b

array([  0,   1,   2, 100,   4,   5,   6,   7,   8,   9,  10,  11])

In [None]:
a

array([[  0,   1,   2, 100],
       [  4,   5,   6,   7],
       [  8,   9,  10,  11]])

* `flatten()` 與 `ravel()` 引數 order 預設值為 C，常用的引數值有 C 和 F。C 的意義是 C-style，展開時是以 row 為主的順序展開；而 F 是 Fortran-style，展開時是以 column 為主的順序展開。

In [None]:
a.ravel(order='C')

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])

In [None]:
a.ravel(order='F')

array([ 0,  4,  8,  1,  5,  9,  2,  6, 10,  3,  7, 11])

### `reshape()`

* 指定新的形狀 (shape)，可將陣列重塑為該形狀
* 可透過 `np.reshape(a, new_shape)` 或 `a.reshape(new_shape, refcheck=True)` 來執行

In [None]:
a = np.arange(15)

In [None]:
a

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14])

In [None]:
a.reshape((3, 5))

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])

* 如果新的總數與原先 shape 總數不一致的話，則會產生錯誤

In [None]:
a.size

15

In [None]:
a.reshape((3, 6))

ValueError: ignored

* Reshape 時，新的形狀可以採用模糊指定為 -1，讓 NumPy 自動計算

In [None]:
a.reshape((5, -1))

array([[ 0,  1,  2],
       [ 3,  4,  5],
       [ 6,  7,  8],
       [ 9, 10, 11],
       [12, 13, 14]])

* 若 reshape 後的陣列元素值改變，「將會影響原陣列對應的元素值也跟著改變」

In [None]:
b = a.reshape((3, 5))
b[0, 2] = 100
b

array([[  0,   1, 100,   3,   4],
       [  5,   6,   7,   8,   9],
       [ 10,  11,  12,  13,  14]])

a[2] 值被改變了

In [None]:
a

array([  0,   1, 100,   3,   4,   5,   6,   7,   8,   9,  10,  11,  12,
        13,  14])

### `resize()`

* 與 `reshape()`相同處：
  * `resize()` 可透過 `np.resize(a, new_shape)` 或 `a.resize(new_shape, refcheck=True)` 來執行。要改變被 reference 的陣列時有可能會產生錯誤，這時候可以將 `refcheck` 引數設為 `False` (預設為 `True`)。

In [None]:
b = np.arange(15)
b

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14])

* 與 `reshape()` 不同處：
  * 如果 resize 的大小超過總元素值，則會在後面的元素值的指定為 0

In [None]:
b.size

15

In [None]:
b.resize((3, 6), refcheck=False)
b

array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13, 14,  0,  0,  0]])

* 重要：如果 resize 的大小小於總元素值，則會依照 C-style 的順序，取得 resize 後的陣列元素

In [None]:
b.resize(3, refcheck=False)
b

array([0, 1, 2])

## 軸 (axis) 與維度 (dimension)

* 軸 (axis) 的數目也就是 NumPy 陣列的維度 (dimension) 數，軸的順序編號從 0 開始，下面例子用圖示來解說。

### 一維陣列的軸

* 一維陣列：只有一個軸， axis 為 0。

In [None]:
a = np.array([1, 2, 3])
a

array([1, 2, 3])

以圖示來說明一維陣列的軸。

![一維陣列](https://github.com/sueshow/Data_Science_Marathon/blob/main/picture/2d_axis.png)

### 二維陣列的軸

* 二維陣列： ndim 為 2，軸 0 就是沿著 row 的軸，而軸 1 是沿著 column 的軸。

In [None]:
a = np.arange(6).reshape(3, 2)
a

array([[0, 1],
       [2, 3],
       [4, 5]])

以圖示來說明二維陣列的軸。

![二維陣列](https://github.com/sueshow/Data_Science_Marathon/blob/main/picture/2d_axis.png)

### 三維陣列的軸

* 三維陣列：有 3 個軸，可理解軸的順序是「由外而內」、「由row而column」。

以前一天範例程式中三維陣列的例子來看，可以理解為 2 個 4 $\times$ 3 的二維陣列排在一起。

In [None]:
a = np.array([[[1, 2, 3], [4, 5, 6],
              [7, 8, 9], [10, 11, 12]],
              [[1, 2, 3], [4, 5, 6],
              [7, 8, 9], [10, 11, 12]]])
a

array([[[ 1,  2,  3],
        [ 4,  5,  6],
        [ 7,  8,  9],
        [10, 11, 12]],

       [[ 1,  2,  3],
        [ 4,  5,  6],
        [ 7,  8,  9],
        [10, 11, 12]]])

以圖示來說明三維陣列的軸。

![三維陣列](https://github.com/sueshow/Data_Science_Marathon/blob/main/picture/3d_axis.png)

從 `shape` 屬性來看也可以協助理解在多維陣列中的軸。

In [None]:
a.shape

(2, 4, 3)

若我們要沿軸對元素做加總，呼叫 `sum()` 函式並指定 axis。

In [None]:
a.sum(axis=0)

array([[ 2,  4,  6],
       [ 8, 10, 12],
       [14, 16, 18],
       [20, 22, 24]])

### `np.newaxis` 增加軸數

* 與 `reshape()` 類似的應用。
* 若要增加軸數的話，可使用 `np.newaxis` 物件。將 `np.newaxis` 加到要增加的軸的位置即可。
* 與 `reshape()` 不同：`np.newaxis` 新增的維度為 1，而 `reshape()` 可以指定要改變的形狀 (不一定為 1)。

In [None]:
a = np.arange(12).reshape(2, 6)
a

array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11]])

In [None]:
a[:,np.newaxis,:].shape

## 陣列的合併與分割

In [None]:
a = np.arange(10).reshape(5, 2)
b = np.arange(6).reshape(3, 2)

In [None]:
a

array([[0, 1],
       [2, 3],
       [4, 5],
       [6, 7],
       [8, 9]])

In [None]:
b

array([[0, 1],
       [2, 3],
       [4, 5]])

### 合併：`concatenate()`, `stack()`, `hstack()`, `vstack()`
* 重要：使用 `concatenate()` 進行陣列的合併時，須留意除了指定的軸之外 (預設為 axis 0)，其他軸的形狀必須完全相同，合併才不會發生錯誤

```python
numpy.concatenate((a1, a2, ...), axis=0, out=None)
```

In [None]:
np.concatenate((a, b))

array([[0, 1],
       [2, 3],
       [4, 5],
       [6, 7],
       [8, 9],
       [0, 1],
       [2, 3],
       [4, 5]])

* 不同處：
  * `stack()` 回傳的陣列維度會是合併前的維度 +1
  * `hstack()` 與 `vstack()` 回傳的陣列維度則是依合併的陣列而定
  * 合併原則：
    * `stack()` 必須要所有陣列的形狀都一樣
    * `hstack()` 與 `vstack()` 則跟上述的規則一樣，除了指定的軸之外，其他軸的形狀必須完全相同才可以合併

|函式|說明|
|---|---|
|numpy.stack(arrays, axis=0, out=None)|根據指定的軸進行合併|
|numpy.hstack(tup)|根據水平軸進行合併|
|numpy.vstack(tup)|根據垂直軸進行合併|

In [None]:
# stack() 範例
c = np.arange(10).reshape(5, 2)
np.stack((a, c), axis=1)

array([[[0, 1],
        [0, 1]],

       [[2, 3],
        [2, 3]],

       [[4, 5],
        [4, 5]],

       [[6, 7],
        [6, 7]],

       [[8, 9],
        [8, 9]]])

In [None]:
# hstack() 範例
np.hstack((a, c))

array([[0, 1, 0, 1],
       [2, 3, 2, 3],
       [4, 5, 4, 5],
       [6, 7, 6, 7],
       [8, 9, 8, 9]])

In [None]:
# vstack() 範例
np.vstack((a, b))

array([[0, 1],
       [2, 3],
       [4, 5],
       [6, 7],
       [8, 9],
       [0, 1],
       [2, 3],
       [4, 5]])

### 分割：`split()`、`hsplit()`、`vsplit()`

In [None]:
a = np.arange(10).reshape(5, 2)
a

array([[0, 1],
       [2, 3],
       [4, 5],
       [6, 7],
       [8, 9]])

* `split()` 的語法：

```python
numpy.split(array, indices_or_sections, axis=0)
```

* indices_or_sections 
  * 給定單一整數的話，那就會按照軸把陣列等分
  * 給定一個 List 的整數值的話，就會按照區段去分割
  * 範例：
    * `indices_or_sections=[2, 3]` 依照下列方式做分割 (一樣是照按照軸把陣列分割)
```
ary[0:2]
ary[2:3]
ary[3:n]
```

* 與 `split` 很類似的是 `hsplit` 與 `vsplit`，分別是依照水平軸和垂直軸去做分割。

In [None]:
# 依 axis 0 等分 split
np.split(a, 5)

[array([[0, 1]]),
 array([[2, 3]]),
 array([[4, 5]]),
 array([[6, 7]]),
 array([[8, 9]])]

In [None]:
# split 為 (2,2), (1,2), (2,2) 三個陣列，並回傳含 3 個陣列的 List
np.split(a, [2,3])

[array([[0, 1],
        [2, 3]]), array([[4, 5]]), array([[6, 7],
        [8, 9]])]

In [None]:
b = np.arange(30).reshape(5, 6)
b

array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13, 14, 15, 16, 17],
       [18, 19, 20, 21, 22, 23],
       [24, 25, 26, 27, 28, 29]])

In [None]:
# 依水平軸去做等分分割
np.hsplit(b, 3)

[array([[ 0,  1],
        [ 6,  7],
        [12, 13],
        [18, 19],
        [24, 25]]), array([[ 2,  3],
        [ 8,  9],
        [14, 15],
        [20, 21],
        [26, 27]]), array([[ 4,  5],
        [10, 11],
        [16, 17],
        [22, 23],
        [28, 29]])]

In [None]:
# 依水平軸照區段去分割
np.hsplit(b, [2, 3, 5])

[array([[ 0,  1],
        [ 6,  7],
        [12, 13],
        [18, 19],
        [24, 25]]), array([[ 2],
        [ 8],
        [14],
        [20],
        [26]]), array([[ 3,  4],
        [ 9, 10],
        [15, 16],
        [21, 22],
        [27, 28]]), array([[ 5],
        [11],
        [17],
        [23],
        [29]])]

In [None]:
# 依垂直軸按照區段去分割，超出的區段則傳回空陣列
np.vsplit(b, [2, 4, 6])

[array([[ 0,  1,  2,  3,  4,  5],
        [ 6,  7,  8,  9, 10, 11]]), array([[12, 13, 14, 15, 16, 17],
        [18, 19, 20, 21, 22, 23]]), array([[24, 25, 26, 27, 28, 29]]), array([], shape=(0, 6), dtype=int64)]

## 迭代

* 一維陣列的迭代：跟 Python 集合型別 (例如 List) 的迭代相同。

In [None]:
a = np.arange(5)
a

array([0, 1, 2, 3, 4])

In [None]:
for i in a:
    print(i)

0
1
2
3
4


* 多維陣列的迭代：以 axis 0 為準，列出各 row 的元素。

In [None]:
b = np.arange(6).reshape(2, 3)
b

array([[0, 1, 2],
       [3, 4, 5]])

In [None]:
for row in b:
    print(row)

[0 1 2]
[3 4 5]


* 如果要列出多維陣列所有元素的話，可以配合 `flat` 屬性。

In [None]:
for i in b.flat:
    print(i)

0
1
2
3
4
5


## 搜尋與排序

### 顯示最大值和最小值：`amax()`、`amin()`、`max()`、`min()`

* 陣列元素最大值和最小值：可透過 `amax()`、`amin()`、`max()`、`min()`，也可依照軸列出各軸的最大/最小元素值。

* 基本語法：

|np.函式|陣列物件.函式|
|---|---|
|numpy.amax(array, axis=None, keepdims=<no value>)|ndarray.max(axis=None, keepdims=False)|
|numpy.amin(array, axis=None, keepdims=<no value>)|ndarray.min(axis=None, keepdims=False)|

In [None]:
a = np.random.randint(1, 20, 10)
a

array([12, 12, 11,  9,  6, 14,  5, 10,  3, 15])

In [None]:
# 陣列中最大的元素值
np.amax(a)

15

In [None]:
# 陣列中最小的元素值
np.amin(a)

3

* 多維陣列：用法相同可依照軸列出最大或最小值。

In [None]:
b = a.reshape(2, 5)
b

array([[12, 12, 11,  9,  6],
       [14,  5, 10,  3, 15]])

In [None]:
# 若設定 keepdims=True，結果會保留原陣列的維度來顯示。
np.amax(b, keepdims=True)

array([[15]])

In [None]:
# 列出各 row 最大值
b.max(axis=1)

array([12, 15])

In [None]:
# 同樣的 amax 也可以依軸列出各 row 最大值
np.amax(b, axis=1)

array([12, 15])

In [None]:
# 列出各 column 最小值
b.min(axis=0)

array([12,  5, 10,  3,  6])

### 顯示最大值和最小值的索引：`argmax()` 與 `argmin()`

* 與上述不同處：`argmax` / `argmin` 回傳的是最大值和最小值的索引，也可依軸找出各軸最大值和最小值的索引。

基本語法：

|np.函式|陣列物件.函式|
|---|---|
|numpy.argmax(array, axis=None)|ndarray.argmax(axis=None)|
|numpy.argmin(array, axis=None)|ndarray.argmin(axis=None)|

In [None]:
np.random.seed(0)
a = np.random.randint(1, 20, size=(3, 4))
a

array([[13, 16,  1,  4],
       [ 4,  8, 10, 19],
       [ 5,  7, 13,  2]])

若沒有指定軸的話，`argmax()` 與 `argmin()` 會回傳多維陣列展平後的索引。

In [None]:
np.argmax(a)

7

In [None]:
# 列出各 column 的最大值索引, 分別為 [0, 0, 2, 1]
np.argmax(a, axis=0)

array([0, 0, 2, 1])

In [None]:
# 元素值 1 為最小值，展平後的索引值為 2。
a.argmin()

2

### 找出符合條件的元素：`where`

* 語法：
```python
numpy.where(condition[, x, y])
```

In [None]:
a

array([[13, 16,  1,  4],
       [ 4,  8, 10, 19],
       [ 5,  7, 13,  2]])

傳入條件式，回傳值為符合條件的元素索引，不過這邊留意的是，以下面二維陣列為例，回傳的索引陣列要合併一起看，也就是說
```
(array([0, 0, 1, 2]), 
 array([0, 1, 3, 2]))
```

a[0, 0] 值為 13<br />
a[0, 1] 值為 16<br />
a[1, 3] 值為 19<br />
a[2, 2] 值為 13

以上索引值對應的元素，其值都符合「大於 10」的條件。

In [None]:
np.where(a > 10)

(array([0, 0, 1, 2]), array([0, 1, 3, 2]))

若是設定 x, y 引數的話，可將各元素取代掉。以下面的例子來解釋，如果元素值大於 10 的話就用「Y」來替代，反之則是「N」。

In [None]:
np.where(a > 10, 'Y', 'N')

array([['Y', 'Y', 'N', 'N'],
       ['N', 'N', 'N', 'Y'],
       ['N', 'N', 'Y', 'N']], dtype='<U1')

### `nonzero`

* `nonzero` 等同於 `np.where(array != 0)` 的語法，同樣的也是回傳符合非 0 條件的元素索引值。

* 語法：

|np.函式|陣列物件.函式|
|---|---|
|numpy.nonzero(array)|ndarray.nonzero()|

In [None]:
np.random.seed(2)
a = np.random.randint(0, 5, 10)
a

array([0, 0, 3, 2, 3, 0, 2, 1, 3, 2])

In [None]:
np.nonzero(a)

(array([2, 3, 4, 6, 7, 8, 9]),)

In [None]:
a.nonzero()

(array([2, 3, 4, 6, 7, 8, 9]),)

### 排序：`sort()` 與 `argsort()`

* 差異處：
  * `sort()` 回傳的是排序後的陣列
  * `argsort()` 回傳的是排序後的陣列索引值
* 語法：

|np.函式|陣列物件.函式|
|---|---|
|numpy.sort(a, axis=-1, kind=None, order=None)|ndarray.sort()|
|numpy.argsort(a, axis=-1, kind=None, order=None)|ndarray.argsort()|

In [None]:
np.random.seed(3)
a = np.random.randint(0, 20, 10)
a

array([10,  3,  8,  0, 19, 10, 11,  9, 10,  6])

In [None]:
np.sort(a)

array([ 0,  3,  6,  8,  9, 10, 10, 10, 11, 19])

In [None]:
a.argsort()

array([3, 1, 9, 2, 7, 0, 5, 8, 6, 4])

* 與 `np.sort()` 不同處：`陣列物件.sort()` 的語法會進行 in-place 排序，也就是「原本的陣列內容會跟著改變」。

In [None]:
a.sort()
a

array([ 0,  3,  6,  8,  9, 10, 10, 10, 11, 19])

* 多維陣列在排序時可以指定要依據的軸。

In [None]:
b = np.random.randint(0, 20, size=(5, 4))
b

array([[ 0, 12,  7, 14],
       [17,  2,  2,  1],
       [19,  5,  8, 14],
       [ 1, 10,  7, 11],
       [ 1, 15, 16,  5]])

In [None]:
np.sort(b, axis=0)

array([[ 0,  2,  2,  1],
       [ 1,  5,  7,  5],
       [ 1, 10,  7, 11],
       [17, 12,  8, 14],
       [19, 15, 16, 14]])

* 排序支援多種不同的排序算法，包括 quicksort (預設)、heapsort、mergesort、timesort，在 `kind` 引數指定即可。依照官網文件指出排序速度是以 quicksort 最快，mergesort / timesort 其次，之後是 heapsort。

In [None]:
c = np.random.randint(0, 100000000, 1000000)
np.sort(c, kind='heapsort')

array([      64,       96,      310, ..., 99999479, 99999561, 99999830])

## 參考資料

* [Python for Data Analysis Ch12](https://www.oreilly.com/library/view/python-for-data/9781449323592/ch12.html)