### 基础

In [None]:
import tensorflow as tf

In [None]:
# 查看版本
tf.__version__

## 线性回归
### 建立一个单层的模型

In [None]:
import pandas as pd

In [None]:
# 读取数据
data = pd.read_csv('E:\我的学习笔记\\tensorflow\education.csv')
data.pop(' ')
data.head()

In [None]:
x = data.Education  # x是输入数据
y = data.Income     # y是目标数据

In [None]:
# 初始化一个模型
# Sequential代表是一个顺序模型
model = tf.keras.Sequential()

- 顺序模型：一个输入和一个输出的模型，单个积木一层一层搭建。

In [None]:
# 在模型中添加一层
model.add(tf.keras.layers.Dense(1, input_shape = (1,)))

- 这一层是dense层，第一个参数1表示这一层的输出数据的维度，这里是1维，第二个参数表示输入数据的维度，是元组形式，这里是1维。

In [None]:
# 查看这个模型的整体信息
model.summary()

- 其中Output Shape中，None是指输入样本的个数，1表示输出的维度。Param表示参数的个数。

In [None]:
# 给这个模型进行配置
model.compile(optimizer = 'adam',
             loss = 'mse'
             )

- 告诉这个模型我们要用adam的梯度下降法以及用mse的损失函数。

In [None]:
# 训练模型并记录模型训练过程
history = model.fit(x, y, epochs = 5000)

- 输入数据是x，目标数据是y，epochs代表迭代次数，history可以存储运行过程。

In [None]:
# 使用模型进行预测
model.predict(pd.Series([20]))

### 建立一个两层的模型

In [None]:
model_2 = tf.keras.Sequential([tf.keras.layers.Dense(10, input_shape = (2,), activation = 'relu'),
                               tf.keras.layers.Dense(1)])

- 这里可以直接在Sequential中使用列表的形式来添加层，第一层我们添加10个神经元，因此输出也是10，输入数据是一个2维的数据，需要一个激活函数，使用relu；第二层输出为1个，因为只需要第一个隐藏层有输入就可以了，因此第二层不需要配置input_shape

In [None]:
model_2.summary()

- 第一层有30个参数，因为对于每个神经元，每个输入维度都有一个权值，所以每个神经元都有2个权值，再加一个偏置，就是3个，一共10个神经元，则一共有30个
- 同样对于第二层，有10个输入，每个输入一个权重，再加一个偏置，一共11个。

In [None]:
model_2.compile(optimizer = 'adam',
                loss = 'mse'
               )

In [None]:
data = pd.read_csv('E:\data\second hand car price prediction\\used_car_train_20200313.csv',sep = ' ', nrows = 10000)

In [None]:
data.head()

In [None]:
import matplotlib.pyplot as plt

In [None]:
data.columns

In [None]:
plt.scatter(data['power'], y)

In [None]:
x = data[['power', 'v_8']]
x.head()

In [None]:
y = data[['price']]
y.head()

In [None]:
history_2 = model_2.fit(x, y, epochs = 100)

In [None]:
test_x = x.iloc[:10,:]
test_y = y.iloc[:10,:]
model_2.predict(test_x)

In [None]:
test_y

- 当然这里只是举一个例子，因此预测并不准确

## 逻辑回归

In [None]:
# 如果是二分类问题，我们可以在最后的一层使用sigmoid函数进行激活
model_3.add(tf.keras.layers.Dense(1, activation = 'sigmoid'))

In [None]:
# 在使用sigmoid激活函数时，其损失函数最好使用交叉熵
# metrics参数代表计算什么，是一个列表，这里输入acc，即计算正确率
model_3.compile(optimizer = 'adam'
              loss = 'binary_crossentropy'
              metrics = ['acc']
             )

In [None]:
# 在模型训练完成后，我们可以查看模型中计算的变量有哪些
history.history.keys()


In [None]:
# 可以通过plt来进行画图
# history.epoch就是迭代数， 通过get可以得到loss每个迭代的值
plt.plot(history.epoch, history.history.get('loss'))

## softmax
### 顺序编码

In [None]:
# 加载自带的数据集，注意需要网络
fashion_mnist = tf.keras.datasets.fashion_mnist.load_data()

In [None]:
# 这里我们使用mnist数据集
data = pd.read_csv('E:\我的学习笔记\统计学习方法\实战\训练数据\\mnist_train.csv')

In [None]:
data.head()

In [None]:
train_x = data.iloc[0:55000,1:]
train_y = data.iloc[0:55000,0:1]
test_x = data.iloc[55000:,1:]
test_y = data.iloc[55000:,0:1]

In [None]:
# 归一化
train_x = train_x/255
test_x = test_x/255

In [None]:
model_4 = tf.keras.Sequential()

# 对二维输入数据flatten至一维，但因为mnist中本来就已经为一维数据
# 因此不需要flatten
# model_4.add(tf.keras.layers.Flatten(input_shape = (28, 28)))

# 第二层
model_4.add(tf.keras.layers.Dense(128, activation = 'relu'))

# 第三层，使用softmax
model_4.add(tf.keras.layers.Dense(10, activation = 'softmax'))

In [None]:
# 当最后的分类为数字顺序编码，我们的loss使用sparse_categorical_crossentropy
model_4.compile(optimizer = 'adam',
              loss = 'sparse_categorical_crossentropy',
              metrics = ['acc']
             )

In [None]:
# 因为tensorflow无法直接handle dataframe的数据，因此将其转换成ndarray
train_x = train_x.to_numpy()
train_y = train_y.to_numpy()
test_x = test_x.to_numpy()
test_y = test_y.to_numpy()

In [None]:
model_4.fit(train_x, train_y, epochs = 5)

In [None]:
# 通过测试集对模型进行测试
model_4.evaluate(test_x, test_y)

### 独热编码

In [None]:
# 将train_y改成独热编码
train_y_onehot = tf.keras.utils.to_categorical(train_y)
test_y_onehot = tf.keras.utils.to_categorical(test_y)
print(train_y_onehot.shape, test_y_onehot.shape)

In [None]:
model_5 = tf.keras.Sequential()

# 第一层
model_5.add(tf.keras.layers.Dense(128, activation = 'relu'))

# 第二层，使用softmax
model_5.add(tf.keras.layers.Dense(10, activation = 'softmax'))

# 当最后的分类为独热编码，我们的loss使用categorical_crossentropy
model_5.compile(optimizer = 'adam',
              loss = 'categorical_crossentropy',
              metrics = ['acc']
             )

In [None]:
model_5.fit(train_x, train_y_onehot, epochs = 5)

In [None]:
model_5.evaluate(test_x, test_y_onehot)

### 如何改变优化器的学习速率等参数

In [None]:
# 改变学习速率，可以在对模型进行compile的过程中改变
model_5.compile(optimizer = tf.keras.optimizers.Adam(learning_rate = 0.01),
              loss = 'categorical_crossentropy',
              metrics = ['acc']
             )

### 如何提高网络拟合能力
- 可以增加神经元个数
- 可以增加层数
- 一般增加层数可以更好的提高拟合能力，但是有可能过拟合

### 使用dropout抑制过拟合

In [None]:
# 我们可以在训练模型的每一次迭代中都对测试集进行预测
model_6 = tf.keras.Sequential()

# 这里我们多加几层，造成过拟合
model_6.add(tf.keras.layers.Dense(128, input_shape = (784, ), 
                                  activation = 'relu')
           )
model_6.add(tf.keras.layers.Dense(128, activation = 'relu'))
model_6.add(tf.keras.layers.Dense(128, activation = 'relu'))
model_6.add(tf.keras.layers.Dense(128, activation = 'relu'))
# 第二层，使用softmax
model_6.add(tf.keras.layers.Dense(10, activation = 'softmax'))

# 当最后的分类为独热编码，我们的loss使用categorical_crossentropy
model_6.compile(optimizer = 'adam',
              loss = 'categorical_crossentropy',
              metrics = ['acc']
             )

# 在这里加入validation_data就可以得到每次迭代的预测结果
history = model_6.fit(train_x, train_y_onehot, epochs = 10,
            validation_data = (test_x, test_y_onehot))

- 可以看到结果中出现了val_loss和val_acc

In [None]:
history.history.keys()

In [None]:
plt.plot(history.epoch, history.history.get('loss'), label = 'loss')
plt.plot(history.epoch, history.history.get('val_loss'), label = 'val_loss')
plt.legend()

In [None]:
plt.plot(history.epoch, history.history.get('acc'), label = 'acc')
plt.plot(history.epoch, history.history.get('val_acc'), label = 'acc')
plt.legend()

- 这时发现loss一直在降低，但是validation_data的loss并没有
- 发现acc一直在上升，但是validation_data的acc并没有
- 这是过拟合

In [None]:
# 现在我们在上一个模型的基础上，添加dropout
model_7 = tf.keras.Sequential()

# 这里层数过多，造成过拟合
model_7.add(tf.keras.layers.Dense(128, input_shape = (784, ), 
                                  activation = 'relu')
           )
model_7.add(tf.keras.layers.Dense(128, activation = 'relu'))

# 我们可以随意的在各层之间添加dropout，0.5表示dropout的概率
model_7.add(tf.keras.layers.Dropout(0.5))
model_7.add(tf.keras.layers.Dense(128, activation = 'relu'))
model_7.add(tf.keras.layers.Dropout(0.5))
model_7.add(tf.keras.layers.Dense(128, activation = 'relu'))
model_7.add(tf.keras.layers.Dropout(0.5))
model_7.add(tf.keras.layers.Dense(10, activation = 'softmax'))

# 当最后的分类为独热编码，我们的loss使用categorical_crossentropy
model_7.compile(optimizer = 'adam',
              loss = 'categorical_crossentropy',
              metrics = ['acc']
             )

# 在这里加入validation_data就可以得到每次迭代的预测结果
history = model_7.fit(train_x, train_y_onehot, epochs = 10,
            validation_data = (test_x, test_y_onehot))

In [None]:
plt.plot(history.epoch, history.history.get('loss'), label = 'loss')
plt.plot(history.epoch, history.history.get('val_loss'), label = 'val_loss')
plt.legend()

In [None]:
plt.plot(history.epoch, history.history.get('acc'), label = 'acc')
plt.plot(history.epoch, history.history.get('val_acc'), label = 'acc')
plt.legend()

 - 我们发现val_loss下降了，同时val_acc也上升了
 - 当然我们也可以通过减少神经网络的规模规避过拟合

### 函数式API
- 可以将每一层当作一个函数来建立模型

In [None]:
inputs = tf.keras.Input(shape = (784, ))
x = tf.keras.layers.Dense(32, activation = 'relu')(inputs)
x = tf.keras.layers.Dropout(0.5)(x)
x = tf.keras.layers.Dense(64, activation = 'relu')(x)
outputs = tf.keras.layers.Dense(10, activation = 'softmax')(x)
model = tf.keras.Model(inputs = inputs, outputs = outputs)

In [None]:
model.summary()

- 函数式API可以得到一个更复杂的模型

In [None]:
# 比如可以有两个输入，一个输出
input1 = tf.keras.Input(shape = (784, ))
input2 = tf.keras.Input(shape = (784, ))
x = tf.keras.layers.concatenate([input1, input2])
x = tf.keras.layers.Dense(32, activation = 'relu')(x)
outputs = tf.keras.layers.Dense(1, activation = 'sigmoid')(x)
model = tf.keras.Model(inputs = [input1, input2], outputs = outputs)

In [None]:
model.summary()