* DL基础
* CNN - LeNet, AlexNet, VGG, Inception, ResNet
* RNN - ENN, GRU, LSTM, Seq2Seq
* Attention - Attention, Transformer
* Optimization - SGD, Momentum, Adam
* 高性能计算 - parallel, multiGPU, distributed
* CV - 目标检测, 语义分割
* NLP - 词嵌入, BERT

### 02 Introduction of DL
#### Model
* 符号学-》概率模型-》机器学习
* 自然语言处理：一般只停留在感知
* 计算机视觉：能做到感知和推理
* 深度学习：已经能做到知识和规划了
#### 问题领域
* 感知：了解是什么，感知到物体
* 推理：基于看到的物体，推测未来
* 知识：根据看到的数据形成知识
* 规划：根据知识，长远规划
#### 应用
* 图片分类
* 物体检测和分割
* 样式迁移
* 人脸合成
* 文字生成图片
* 文本生成
* 无人驾驶
* 广告点击
#### 广告点击率
特征提取：广告主，描述，图片 $\rightarrow$ 设计模型 $\rightarrow$ 预测点击率


### 04 数据操作

In [9]:
import torch

In [10]:
x = torch.arange(12)
x

tensor([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])

In [13]:
# numel：元素的数量
print(x.shape, x.numel())
# reshape：改变形状
print(x.reshape(3, 4))

torch.Size([12]) 12
tensor([[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]])


In [15]:
# +,-,*,/,**是按照元素运算
# 合并
X = torch.arange(12, dtype=torch.float32).reshape((3, 4))
Y = torch.tensor([[2, 3, 4, 1], [1, 2, 3, 4], [4, 3, 2, 1]])
# dim = 0: 按照行堆叠，dim = 1: 按照列堆叠
torch.cat((X, Y), dim=0), torch.cat((X, Y), dim=1)

(tensor([[ 0.,  1.,  2.,  3.],
         [ 4.,  5.,  6.,  7.],
         [ 8.,  9., 10., 11.],
         [ 2.,  3.,  4.,  1.],
         [ 1.,  2.,  3.,  4.],
         [ 4.,  3.,  2.,  1.]]),
 tensor([[ 0.,  1.,  2.,  3.,  2.,  3.,  4.,  1.],
         [ 4.,  5.,  6.,  7.,  1.,  2.,  3.,  4.],
         [ 8.,  9., 10., 11.,  4.,  3.,  2.,  1.]]))

In [16]:
# 也可以构建bool张量
X == Y

tensor([[False, False, False, False],
        [False, False, False, False],
        [False, False, False, False]])

In [17]:
# 广播机制
a = torch.arange(3).reshape(3, 1)
b = torch.arange(2).reshape(1, 2)
a, b

(tensor([[0],
         [1],
         [2]]),
 tensor([[0, 1]]))

In [19]:
# 将少的那一列复制一遍后相加
a + b

tensor([[0, 1],
        [1, 2],
        [2, 3]])

#### 数据预处理

In [30]:
import os
os.makedirs(os.path.join('..', 'data'), exist_ok = True)
data_file = os.path.join('..', 'data', 'house_tiny.csv')
with open(data_file, 'w') as f:
    f.write('NumRooms, Alley, Price\n')
    f.write('NA, Pave, 127500\n')
    f.write('2, NaN, 106000\n')
    f.write('4, NaN, 178100\n')
    f.write('NA, NaN, 140000\n')

In [31]:
import pandas as pd
data = pd.read_csv(data_file)
print(data)

   NumRooms  Alley   Price
0       NaN   Pave  127500
1       2.0    NaN  106000
2       4.0    NaN  178100
3       NaN    NaN  140000


In [32]:
# 填补缺失值，数值用均值填充
inputs, outputs = data.iloc[:, 0:2], data.iloc[:, 2]
inputs = inputs.fillna(inputs.mean())
print(inputs)

   NumRooms  Alley
0       3.0   Pave
1       2.0    NaN
2       4.0    NaN
3       3.0    NaN


In [34]:
# 对于离散值或者字符串，变成一个类别
inputs = pd.get_dummies(inputs, dummy_na = True)# dummy_na = True: NAN也是一个类别
print(inputs)

   NumRooms   Alley_ NaN   Alley_ Pave   Alley_nan
0       3.0            0             1           0
1       2.0            1             0           0
2       4.0            1             0           0
3       3.0            1             0           0


In [36]:
X, y = torch.tensor(inputs.values), torch.tensor(outputs.values)
X, y

(tensor([[3., 0., 1., 0.],
         [2., 1., 0., 0.],
         [4., 1., 0., 0.],
         [3., 1., 0., 0.]], dtype=torch.float64),
 tensor([127500, 106000, 178100, 140000]))

### 07 自动求导
* 正向求导
* $\frac{\delta y}{\delta x} = \frac{\delta y}{\delta u_n}(\frac{\delta u_n}{\delta u_{n-1}}(...(\frac{\delta u_2}{\delta u_1} \frac{\delta u_1}{\delta x})))$
* O(n)计算一个变量的复杂度，计算两个就要两个O(n)，O(1)内存复杂度，不需要存储中间变量
* 反向求导
* $\frac{\delta y}{\delta x} = (((\frac{\delta y}{\delta u_n}\frac{\delta u_n}{\delta u_{n-1}})...)\frac{\delta u_2}{\delta u_1}) \frac{\delta u_1}{\delta x}$
* O(n)计算复杂度，O(n)内存复杂度，需要存储所有的中间结果


In [37]:
x = torch.arange(4.0)
x

tensor([0., 1., 2., 3.])

In [40]:
# 存储梯度
x.requires_grad_(True) # 需要求导数
x.grad

In [41]:
# 内积
y = 2 * torch.dot(x, x)
y

tensor(28., grad_fn=<MulBackward0>)

In [42]:
y.backward()
x.grad

tensor([ 0.,  4.,  8., 12.])

In [43]:
# 默认情况下，torch会累计梯度，重启梯度计算前需要清除之前的值
x.grad.zero_()

tensor([0., 0., 0., 0.])

In [64]:
# 阻断，当不希望对一个变量求导时，用detach阻断
x.grad.zero_()
y.grad.zero_()
x = torch.arange(4.0, requires_grad = True)
y = torch.tensor(2.0, requires_grad = True)
Y = y * 2
c = x * Y
Y.detach()
c.sum().backward()
y.grad

tensor(12.)

### 08 线性回归
#### 放假预测
