還是來我們標準的起手式。

In [1]:
%matplotlib inline

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

### 01. 串列是數據分析基本型態

我們說過, 在深度學習中, 輸入輸出都是一個 tensor。

有可能只是單純一個數字。

例如我們的訓練資料:

$$x_1 = 3, y_1=8; x_2 = 5, y_2 = 9; x_3 = 6, y_3=3$$

把輸入輸出分開放就是這樣。

In [2]:
x = [3, 5, 6]
y = [8, 9, 3]

很多深度學習套件, 都希望明確的把一筆輸入要做成一個 list, 就算輸入其實只有一個數字也要! 所以我們會把 $x$ 改成這樣。

In [3]:
x = [[3], [5], [6]]

如果輸入是一個向量呢? 比如說

$$x_1 = (9, 4); x_2 = (8, 7); x_3 = (6, 6)$$

In [4]:
x = [[9, 4], [8, 7], [6, 6]]

反正有幾筆輸入, $x$ 就是有幾個元素的 list, 只是每個元素長像依輸入的樣子而不同。

同理, 如果輸入是個矩陣 (2 階 tensor) 也是這樣。我們先來練習如果 $x$ 裡的每個元素長得像這樣:

$$x_1 = \begin{bmatrix} 9 & 4 \\ 8 & 7 \end{bmatrix}$$

對於 Python 就是一列一列的放上去, 所以會變成這樣。

In [5]:
x1 = [[9, 4], [8, 7]]

假設輸入有 3 筆, 那會長得類似這樣。

In [6]:
x = [[[9, 4], [8, 7]], [[1, 2], [3, 4]], [[5, 6], [7, 8]]]

注意 $x$ 還是 3 個元素, 只是每個元素都是個 2 階的 tensor (矩陣)。

#### 【小挑戰】

知道如果每筆資料是 3 階的 tensor (可以想成立體的矩陣) 該怎麼做嗎?

### 02. 其實是 `numpy` array 不是 list

我們真的用在深度學習、數據分析的其實是 `numpy` array, 而不是 list。不過好在轉換很簡單。

In [7]:
x = np.array([3, 5, 6])

In [8]:
x = np.array([[9, 4], [8, 7], [6, 6]])

In [9]:
x = np.array([[[9, 4], [8, 7]], [[1, 2], [3, 4]], [[5, 6], [7, 8]]])

就是像這樣, 前面加上 `np.array` 就好了!

變成 array 有很多好處, 其中一個是我們可以清楚資料的型態, 也很容易改變。比如說, 目前我們的 $x$ 是這樣。

In [10]:
x

array([[[9, 4],
        [8, 7]],

       [[1, 2],
        [3, 4]],

       [[5, 6],
        [7, 8]]])

我們可以看 $x$ 整個資料集的型式。

In [11]:
x.shape

(3, 2, 2)

這意思是說, $x$ 有 $3$ 筆資料, 每一筆都是 $2 \times 2$ 的矩陣! 比如拿出其中一個:

In [13]:
x0 = x[1]

再看它是不是 (2,2) 的 shape。

In [14]:
x0.shape

(2, 2)

### 03. `pandas` 的 DataFrame

我們常會用到一個叫 `pandas` 的套件去整理資料。你可以把它想成 Python 裡的 Excel, 而 Excel 的一張表單就是一個 DataFrame。

用到時我們再來介紹基本運用的方式。

### 04. 字典資料型態

Python 還有個很重要的型態叫字典資料型態, 用途就是... 當字典用。

定義上很容易。

In [15]:
egg = {'a':3, 'b':5, 'c':9}

這樣子 a 就對應到 3, b 對應到 5, 等等。

In [16]:
egg['a']

3

我們可以找目前字典裡所有的 keys。

In [19]:
egg.keys()

dict_keys(['a', 'b', 'c'])

之後會用到, 我們想檢查 'd' 是不是一個 key。

In [20]:
'd' in egg.keys()

False

因為不在裡面, 我們再加進去。

In [21]:
egg['d'] = 5

In [22]:
egg

{'a': 3, 'b': 5, 'c': 9, 'd': 5}

我們當然也可調整裡面的數值, 比方說 c 要再加 1。

In [23]:
egg['c'] = egg['c'] + 1

In [24]:
egg

{'a': 3, 'b': 5, 'c': 10, 'd': 5}