# 歡迎來到深度學習！ #

歡迎來到 Kaggle 的 *深度學習簡介* 課程！我們將學習構建我們自己的深度神經網絡所需的一切。使用 Keras 和 Tensorflow，我們將學習如何：
- 創建一個**全連接(fully-connected)**神經網絡架構
- 將神經網絡應用於兩個經典的機器學習問題：**迴歸(regression)**和**分類(classification)**
- 使用**隨機梯度下降(stochastic gradient descent)**訓練神經網絡
- 使用**dropout**、**batch normalization**和其他技術提高性能

這些教程將通過完整的範例向我們介紹這些主題，然後在練習中，我們將更深入地探索這些主題並將它們應用於現實世界的數據集。

讓我們開始吧！

# 什麼是深度學習？ #

近年來，人工智慧領域最令人印象深刻的一些進步發生在*深度學習*領域。自然語言翻譯、圖像辨識和遊戲玩法都是深度學習模型已經接近甚至超過人類水平的表現。

那麼什麼是深度學習？ **深度學習**是一種機器學習方法，其特點是深度計算堆棧(stack)。這種計算深度使深度學習模型能夠解開在最具挑戰性的現實世界數據集中發現的各種複雜和分層模式。

通過其強大的功能和可擴展性(scalability)，**神經網絡**已成為深度學習的定義模型。神經網絡由神經元(neurons)組成，其中每個神經元單獨執行一個簡單的計算。相反，神經網絡的力量來自這些神經元可以形成的連接的複雜性。

# 線性單元(Linear Unit) #

因此，讓我們從神經網絡的基本組成部分開始：單個神經元。如圖所示，帶有一個輸入的 **neuron**（或 **unit**）如下所示：

<figure style="padding: 1em;">
<img src="https://i.imgur.com/mfOlDR6.png" width="250" alt="線性單位圖。">
<figcaption style="textalign: center; font-style: italic"><center>線性單位：$y = w x + b$
</center></figcaption>
</figure>

輸入是`x`。它與神經元的連接有一個**權重**，即`w`。每當一個值流過一個連接時，我們將該值乘以該連接的權重。對於輸入`x`，到達神經元的是`w * x`。**神經網絡透過修改其權重來“學習”**。

`b` 是一種特殊的權重，我們稱之為 **bias**。偏差**沒有任何與之關聯的輸入數據**；相反，我們在圖中放置了一個“1”，這樣到達神經元的值就是“b”（因為“1 * b = b”）。偏差使神經元能夠**獨立於其輸入來修改輸出**。

`y` 是神經元最終輸出的值。為了獲得輸出，神經元將通過其連接接收到的所有值相加。這個神經元的激活是`y = w * x + b`，或者公式$y = w x + b$。

<blockquote style="margin-right:auto; margin-left:auto; background-color: #000000; padding: 1em; margin:24px;">
    <strong>$y=w x + b$ 這個公式是不是很眼熟？</strong><br>
這是一個直線方程！這是斜率截距方程，其中 $w$ 是斜率，$b$ 是 y 截距。
</blockquote>

# 範例 - 作為模型的線性單元 #

儘管單個神經元通常僅作為更大網絡的一部分發揮作用，但從單個神經元模型作為基線開始通常很有用。單神經元模型是*線性*模型。

讓我們想想這如何在像 [80 Cereals](https://www.kaggle.com/crawford/80-cereals) 這樣的數據集上工作。以`糖`（每份糖的克數）作為輸入和`卡路里`（每份的卡路里）作為輸出來訓練模型，我們可能會發現偏差為`b=90`，權重為`w=2.5`。我們可以這樣估算每份含 5 克糖的穀物的卡路里含量：

<figure style="padding: 1em;">
<img src="https://i.imgur.com/yjsfFvY.png" width="1000" alt="使用線性單位計算。">
<figcaption style="textalign: center; font-style: italic"><center>以線性單位計算。
</center></figcaption>
</figure>

而且，檢查我們的公式，我們有 $calories = 2.5 \times 5 + 90 = 102.5$，就像我們預期的那樣。

# 多個輸入 #

*80 Cereals* 數據集具有更多的功能，而不僅僅是“糖”。如果我們想擴展我們的模型以包括纖維或蛋白質含量之類的東西怎麼辦？這很容易。我們可以為神經元添加更多輸入連接，每個附加特徵一個。為了找到輸出，我們將每個輸入乘以它的連接權重，然後將它們加在一起。

<figure style="padding: 1em;">
<img src="https://i.imgur.com/vyXSnlZ.png" width="300" alt="三個輸入連接：x0、x1 和 x2，以及偏置。">
<figcaption style="textalign: center; font-style: italic"><center>具有三個輸入的線性單元。
</center></figcaption>
</figure>

這個神經元的公式是 $y = w_0 x_0 + w_1 x_1 + w_2 x_2 + b$。具有兩個輸入的線性單元將適合一個平面(plane)，而一個具有更多輸入的單元將適合一個超平面(hyperplane)。

# Keras 中的線性單元#

在 Keras 中創建模型的最簡單方法是通過 `keras.Sequential`，它將神經網絡創建為*層*堆棧。我們可以使用 *dense* 層創建像上面那樣的模型（我們將在下一課中了解更多信息）。

我們可以定義一個接受三個輸入特徵（`糖`、`纖維`和`蛋白質`）並產生單個輸出（`卡路里`）的線性模型，如下：

In [None]:
%tensorflow_version 1.x

TensorFlow 1.x selected.


In [None]:
from tensorflow import keras
from tensorflow.keras import layers

# Create a network with 1 linear unit
model = keras.Sequential([
    layers.Dense(units=1, input_shape=[3])
])

Instructions for updating:
If using Keras pass *_constraint arguments to layers.


使用第一個參數`units`，我們定義了我們想要的輸出數量。在這種情況下，我們只是預測`卡路里`，所以我們將使用`單位=1`。

使用第二個參數 `input_shape`，我們告訴 Keras 輸入的維度。設置 `input_shape=[3]` 確保模型將接受三個特徵作為輸入（`'sugars'`、`'fiber'` 和 `'protein'`）。

這個模型現在可以適應訓練數據了！

<blockquote style="margin-right:auto; margin-left:auto; background-color: #000000; padding: 1em; margin:24px;">
    <strong>為什麼 <code>input_shape</code> 是 Python 列表？</strong><br>
我們將在本課程中使用的數據將是表格數據，就像在 Pandas 數據框中一樣。我們將為數據集中的每個特徵提供一個輸入。特徵按列排列，所以我們總是有 <code>input_shape=[num_columns]</code>。

Keras 在這裡使用列表的原因是允許使用更複雜的數據集。例如，圖像數據可能需要三個維度：<code>[height, width, channels]</code>。
</blockquote>

# EXERSIZE 
[**定義一個線性模型**](https://www.kaggle.com/kernels/fork/11887334)，用於*紅酒質量*數據集。