<a href="https://colab.research.google.com/github/hank199599/data_science_from_scratch_reading_log/blob/main/Chapter19.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 深度學習(Deep learning)
原本指的是「深度」神經網路，現被用來泛指各種神經網路。

# 張量
在神經網路函示庫中，n維振烈被稱為**張量(tensor)**  
理想情況下，可以使用：

```python
# 張量Tensor要不是一個浮點數，就是一個張量列表
Tensor = Union[float,List[Tensor]]
```


In [1]:
#如同我們說：
Tensor = list

### 輔助函式：找出張量的形狀

In [2]:
from typing import List

def shape(tensor:Tensor) ->List[int]:
  sizes:List[int] = []
  while isinstance(tensor,list):
    sizes.append(len(tensor))
    tensor = tensor[0]
  return sizes

In [3]:
assert shape([1,2,3]) == [3]

In [4]:
assert shape([[1,2],[3,4],[5,6]]) == [3,2]

由於張量可能具有任意數量的維度，  
因此在使用張量時，通常需要採用**遞迴**的作法。

In [5]:
def is_1d(tensor:Tensor) ->bool:
  """
  如果tensor[0]是一個列表，他就是一個高維張量
  否則就是一個一維向量
  """
  return not isinstance(tensor[0],list)

In [6]:
assert is_1d([1,2,3])

In [7]:
assert not is_1d([[1,2],[3,4]])

### 輔助函式：tensor_sum 函數

In [8]:
def tensor_sum(tensor:Tensor)->float:
  """把張量的所有值加總起來"""
  if is_1d(tensor):
    return sum(tensor) #只是一個浮點數列表，就用Python的sum函式
  else:
    return sum(tensor_sum(tensor_i) for tensor_i in tensor)

In [9]:
assert tensor_sum([1,2,3]) == 6

In [10]:
assert tensor_sum([[1,2],[3,4]]) == 10

### 輔助函式：把某個函數套用到單一張量中的每個元素

In [14]:
from typing import Callable

def tensor_apply(f:Callable[[float],float],tensor:Tensor) ->Tensor:
  """把函式f套用到每個元素"""
  if is_1d(tensor):
    return [f(x) for x in tensor]
  else:
    return [tensor_apply(f,tensor_i) for tensor_i in tensor]

In [15]:
assert tensor_apply(lambda x:x+1,[1,2,3]) == [2,3,4]

In [18]:
assert tensor_apply(lambda x:2*x,[[1,2],[3,4]]) == [[2,4],[6,8]]

### 輔助函式：依據張量形狀，建立另一個形狀一樣的零張量

In [19]:
def zero_like(tensor:Tensor) ->Tensor:
  return tensor_apply(lambda _: 0.0,tensor)

In [20]:
assert zero_like([1,2,3]) == [0,0,0]

In [22]:
assert zero_like([[1,2],[3,4]]) == [[0,0],[0,0]]

### 輔助函式：將某個函式套用到兩個張量

In [23]:
def temsor_combine(f:Callable[[float,float],float],t1:Tensor,t2:Tensor) ->Tensor:
  """把函式f套用到t1與t2的相應元素"""
  if is_1d(t1):
    return [f(x,y) for x,y in zip(t1,t2)]
  else:
    return [temsor_combine(f,t1_i,t2_i) for t1_i,t2_i in zip(t1,t2)]

In [24]:
import operator
assert temsor_combine(operator.add,[1,2,3],[4,5,6]) == [5,7,9]
assert temsor_combine(operator.mul,[1,2,3],[4,5,6]) == [4,10,18]

# 層的抽象概念

建立一種機制，能用來時做出各式各樣的神經網路。
最基本的概念是「Layer」。  
他知道如何把輸入套入某種函數，亦能夠進行**反向傳播**的方式計算梯度。


```python
from typing import Iterable,Tuple

class Layer:
  """
  我們的神經網路是由許多層組成，其中每一層都知道
  如何以正向傳播的方式對輸入進行某些計算
  以及如何以反向傳播的方式計算梯度
  """
  def forward(self,input):
    """
    可以注意到，這裡缺了型別可以設定。
    我們並不打算限定各層的輸入是什麼型別。
    也不限定return的輸入是甚麼型別
    """
    raise NotImplementedError
  
  def backward(self,gradient):
    """
    同樣地，我們並不打算限定梯度應該是什麼型別，
    這完全由你自己決定，
    只要確定合理即可
    """
    raise NotImplementedError
  
  def params(self)->Iterable[Tensor]:
    """
    返回此層的參數，預設的實作方式不會回送任何東西。
    如果你的Layer沒有任何參數，
    並不需要實做這個方法
    """
    return ()
  def grads(self) ->Iterable[Tensor]:
    """
    送回梯度，順序與params相同
    """
    return ()
```



# 線性層

# 把神經網路視為一系列的層

# 損失與最佳化

# 範例：XOR再次嘗試

# 其他激活函數

# **範例**：FizzBuzz 再次嘗試

# Softmax與交叉熵

# Deopout隨機拋棄

# 範例：MNIST

# 模型的儲存與載入