In [1]:
import tensorflow as tf

# 建立一个线性回归的模型
class MyLinearRegression(object):
    """实现一个线性回归的训练"""
    def __init__(self):
        # 自己设定的学习率，如果学习率过大，那损失不会减小反而会增大，一般 0~1
        self.learning_rate = 0.005
        pass
    
    def inputs(self):
        """获取需要训练的数据"""
        # 因为要进行张量运算（矩阵）所以这里特指值定义成二维的
        # x:[100, 1]; y_true  x * 0.7 + 0.8
        x_data = tf.random_normal(shape=[100, 1], mean=0.0, stddev=1.0, name='x_data')
        # 假设不知道这个矩阵
        y_true = tf.matmul(x_data, [[0.7]]) + 0.8
        return x_data, y_true

    def inference(self, feature):
        """根据数据特征值建立线性回归模型，feature是特征值"""
        # 先定义一个命名空间避免混乱
        with tf.variable_scope("linear_model"):
            # w,b : x[100, 1] * w + b = y_predict
            # 随机初始化权重和偏置，注意，权重和偏置必须使用tf.Variable变量OP去定义，因为只有Variable才能被梯度下降（模型）所训练
            # 权重w应该是[1, 1]形状的矩阵，因为它参与了矩阵的乘法
            self.weight = tf.Variable(tf.random_normal(shape=[1, 1], mean=0.0, stddev=1.0), name="weight")
            # 偏置是直接加的，所以应该是[1]的形状
            self.bias = tf.Variable(tf.random_normal(shape=[1], mean=0.0, stddev=1.0), name="bias")
            # 建立模型预测
            y_predict = tf.matmul(feature, self.weight) + self.bias
        return y_predict
    
    def loss(self, y_true, y_predict):
        """根据预测值和真实值求出均方误差"""
        # 定义一个命名空间
        # sum((y_true-y_predict)^2)mean()
        with tf.variable_scope("losses"):
            # 求出损失
            # tf.reduce_mean()：对列表中的数据求和之后求平均值
            loss = tf.reduce_mean(tf.square(y_true - y_predict))       
        return loss
    
    def sgd_op(self, loss):
        """利用梯度下降优化器去优化损失(优化模型参数)"""
        # 定义一个命名空间
        with tf.variable_scope("train_op"):
            train_op = tf.train.GradientDescentOptimizer(self.learning_rate).minimize(loss)
        return train_op
    
    def merge_summary(self, loss):
        """定义收集张量的函数"""
        # 收集一些单值变量
        tf.summary.scalar("losses", loss)
        # 收集高维度的张量值
        tf.summary.histogram("w", self.weight)
        tf.summary.histogram("b", self.bias)
        # 合并变量（OP）
        merged = tf.summary.merge_all()
        return merged
    
    
    def train(self):
        """用于训练的函数"""
        # 获取默认的图
        g = tf.get_default_graph()
        # 在默认的图中进行操作
        with g.as_default():
            # 进行训练
            # 1.获取数据
            x_data, y_true = self.inputs()
            # 2.利用模型得出预测结果
            y_predict = self.inference(x_data)
            # 3.损失计算
            loss = self.loss(y_true, y_predict)
            # 4.优化损失
            train_op = self.sgd_op(loss)
            
            # 收集要观察的张量值
            merged = self.merge_summary(loss)
            
            
            # 开启会话运行训练
            with tf.Session() as sess:
                # 初始化变量
                sess.run(tf.global_variables_initializer())
                
                # 创建events文件
                file_writer = tf.summary.FileWriter("C:\\Users\\Administrator\\Git\\CFturb\\Deep_Learning\\tensorboard\\", graph=sess.graph)
                
                # 打印模型没有训练的初始化的参数
                print("模型初始化的参数权重：%f, 偏置为：%f" % (self.weight.eval(), self.bias.eval()))
                
                """由于只训练一次所以没有什么效果，那我们让它训练多次"""
                for i in range(2000):
                    # 接下来调用运行
                    _, summary = sess.run([train_op, merged])
                    # 把summary添加到文件
                    file_writer.add_summary(summary, i)
                    # 再打印一遍优化之后的参数 
                    print("第%d次模型优化后的参数权重：%f, 偏置为：%f, 损失为：%f" % (i, self.weight.eval(), self.bias.eval(), loss.eval()))
                    


# 运行整个程序
if __name__ == '__main__':
    lr = MyLinearRegression()
    lr.train()

模型初始化的参数权重：0.502186, 偏置为：-0.071469
第0次模型优化后的参数权重：0.503215, 偏置为：-0.062896, 损失为：0.775692
第1次模型优化后的参数权重：0.504635, 偏置为：-0.054455, 损失为：0.737698
第2次模型优化后的参数权重：0.505573, 偏置为：-0.046084, 损失为：0.744641
第3次模型优化后的参数权重：0.506334, 偏置为：-0.037857, 损失为：0.672910
第4次模型优化后的参数权重：0.507551, 偏置为：-0.029676, 损失为：0.761395
第5次模型优化后的参数权重：0.509552, 偏置为：-0.021449, 损失为：0.618334
第6次模型优化后的参数权重：0.510548, 偏置为：-0.013442, 损失为：0.733983
第7次模型优化后的参数权重：0.511887, 偏置为：-0.005486, 损失为：0.695136
第8次模型优化后的参数权重：0.512213, 偏置为：0.002242, 损失为：0.663681
第9次模型优化后的参数权重：0.514131, 偏置为：0.010268, 损失为：0.677152
第10次模型优化后的参数权重：0.516223, 偏置为：0.018216, 损失为：0.667566
第11次模型优化后的参数权重：0.518100, 偏置为：0.026074, 损失为：0.586683
第12次模型优化后的参数权重：0.520654, 偏置为：0.033989, 损失为：0.607408
第13次模型优化后的参数权重：0.521731, 偏置为：0.041486, 损失为：0.610786
第14次模型优化后的参数权重：0.524105, 偏置为：0.049166, 损失为：0.589500
第15次模型优化后的参数权重：0.526970, 偏置为：0.056871, 损失为：0.575301
第16次模型优化后的参数权重：0.528587, 偏置为：0.064320, 损失为：0.620825
第17次模型优化后的参数权重：0.529153, 偏置为：0.071480, 损失为：0.585533
第18次模型优化后的参数权重：0.531860, 偏置为：0.

第208次模型优化后的参数权重：0.677944, 偏置为：0.693789, 损失为：0.012063
第209次模型优化后的参数权重：0.678030, 偏置为：0.694825, 损失为：0.011533
第210次模型优化后的参数权重：0.678333, 偏置为：0.695880, 损失为：0.011587
第211次模型优化后的参数权重：0.678343, 偏置为：0.696879, 损失为：0.011101
第212次模型优化后的参数权重：0.678418, 偏置为：0.697862, 损失为：0.010617
第213次模型优化后的参数权重：0.678774, 偏置为：0.698906, 损失为：0.010601
第214次模型优化后的参数权重：0.678921, 偏置为：0.699915, 损失为：0.010661
第215次模型优化后的参数权重：0.679153, 偏置为：0.700923, 损失为：0.010770
第216次模型优化后的参数权重：0.679199, 偏置为：0.701881, 损失为：0.009788
第217次模型优化后的参数权重：0.679481, 偏置为：0.702884, 损失为：0.010775
第218次模型优化后的参数权重：0.679512, 偏置为：0.703818, 损失为：0.009525
第219次模型优化后的参数权重：0.679716, 偏置为：0.704776, 损失为：0.009544
第220次模型优化后的参数权重：0.679948, 偏置为：0.705731, 损失为：0.009812
第221次模型优化后的参数权重：0.680151, 偏置为：0.706681, 损失为：0.009230
第222次模型优化后的参数权重：0.680436, 偏置为：0.707631, 损失为：0.009016
第223次模型优化后的参数权重：0.680860, 偏置为：0.708606, 损失为：0.009186
第224次模型优化后的参数权重：0.681055, 偏置为：0.709517, 损失为：0.009081
第225次模型优化后的参数权重：0.680962, 偏置为：0.710366, 损失为：0.008031
第226次模型优化后的参数权重：0.681117, 偏置为：0.711251, 损失为：0.

第422次模型优化后的参数权重：0.697592, 偏置为：0.787646, 损失为：0.000168
第423次模型优化后的参数权重：0.697614, 偏置为：0.787769, 损失为：0.000153
第424次模型优化后的参数权重：0.697623, 偏置为：0.787889, 损失为：0.000149
第425次模型优化后的参数权重：0.697655, 偏置为：0.788013, 损失为：0.000142
第426次模型优化后的参数权重：0.697695, 偏置为：0.788135, 损失为：0.000145
第427次模型优化后的参数权重：0.697705, 偏置为：0.788252, 损失为：0.000155
第428次模型优化后的参数权重：0.697713, 偏置为：0.788368, 损失为：0.000136
第429次模型优化后的参数权重：0.697757, 偏置为：0.788487, 损失为：0.000132
第430次模型优化后的参数权重：0.697773, 偏置为：0.788602, 损失为：0.000139
第431次模型优化后的参数权重：0.697795, 偏置为：0.788715, 损失为：0.000133
第432次模型优化后的参数权重：0.697824, 偏置为：0.788830, 损失为：0.000129
第433次模型优化后的参数权重：0.697835, 偏置为：0.788940, 损失为：0.000122
第434次模型优化后的参数权重：0.697879, 偏置为：0.789056, 损失为：0.000122
第435次模型优化后的参数权重：0.697910, 偏置为：0.789166, 损失为：0.000128
第436次模型优化后的参数权重：0.697931, 偏置为：0.789275, 损失为：0.000122
第437次模型优化后的参数权重：0.697933, 偏置为：0.789378, 损失为：0.000119
第438次模型优化后的参数权重：0.697970, 偏置为：0.789487, 损失为：0.000118
第439次模型优化后的参数权重：0.697994, 偏置为：0.789593, 损失为：0.000111
第440次模型优化后的参数权重：0.698000, 偏置为：0.789695, 损失为：0.

第646次模型优化后的参数权重：0.699797, 偏置为：0.798709, 损失为：0.000002
第647次模型优化后的参数权重：0.699798, 偏置为：0.798722, 损失为：0.000002
第648次模型优化后的参数权重：0.699797, 偏置为：0.798734, 损失为：0.000002
第649次模型优化后的参数权重：0.699796, 偏置为：0.798746, 损失为：0.000002
第650次模型优化后的参数权重：0.699799, 偏置为：0.798759, 损失为：0.000002
第651次模型优化后的参数权重：0.699800, 偏置为：0.798771, 损失为：0.000002
第652次模型优化后的参数权重：0.699800, 偏置为：0.798783, 损失为：0.000001
第653次模型优化后的参数权重：0.699803, 偏置为：0.798795, 损失为：0.000001
第654次模型优化后的参数权重：0.699804, 偏置为：0.798807, 损失为：0.000002
第655次模型优化后的参数权重：0.699805, 偏置为：0.798819, 损失为：0.000001
第656次模型优化后的参数权重：0.699807, 偏置为：0.798831, 损失为：0.000001
第657次模型优化后的参数权重：0.699807, 偏置为：0.798842, 损失为：0.000001
第658次模型优化后的参数权重：0.699809, 偏置为：0.798854, 损失为：0.000001
第659次模型优化后的参数权重：0.699811, 偏置为：0.798866, 损失为：0.000001
第660次模型优化后的参数权重：0.699813, 偏置为：0.798877, 损失为：0.000001
第661次模型优化后的参数权重：0.699815, 偏置为：0.798888, 损失为：0.000001
第662次模型优化后的参数权重：0.699816, 偏置为：0.798899, 损失为：0.000001
第663次模型优化后的参数权重：0.699817, 偏置为：0.798910, 损失为：0.000001
第664次模型优化后的参数权重：0.699818, 偏置为：0.798921, 损失为：0.

第870次模型优化后的参数权重：0.699976, 偏置为：0.799864, 损失为：0.000000
第871次模型优化后的参数权重：0.699976, 偏置为：0.799865, 损失为：0.000000
第872次模型优化后的参数权重：0.699977, 偏置为：0.799867, 损失为：0.000000
第873次模型优化后的参数权重：0.699977, 偏置为：0.799868, 损失为：0.000000
第874次模型优化后的参数权重：0.699977, 偏置为：0.799869, 损失为：0.000000
第875次模型优化后的参数权重：0.699977, 偏置为：0.799871, 损失为：0.000000
第876次模型优化后的参数权重：0.699978, 偏置为：0.799872, 损失为：0.000000
第877次模型优化后的参数权重：0.699978, 偏置为：0.799873, 损失为：0.000000
第878次模型优化后的参数权重：0.699978, 偏置为：0.799874, 损失为：0.000000
第879次模型优化后的参数权重：0.699979, 偏置为：0.799876, 损失为：0.000000
第880次模型优化后的参数权重：0.699979, 偏置为：0.799877, 损失为：0.000000
第881次模型优化后的参数权重：0.699979, 偏置为：0.799878, 损失为：0.000000
第882次模型优化后的参数权重：0.699979, 偏置为：0.799879, 损失为：0.000000
第883次模型优化后的参数权重：0.699980, 偏置为：0.799881, 损失为：0.000000
第884次模型优化后的参数权重：0.699980, 偏置为：0.799882, 损失为：0.000000
第885次模型优化后的参数权重：0.699980, 偏置为：0.799883, 损失为：0.000000
第886次模型优化后的参数权重：0.699980, 偏置为：0.799884, 损失为：0.000000
第887次模型优化后的参数权重：0.699980, 偏置为：0.799885, 损失为：0.000000
第888次模型优化后的参数权重：0.699980, 偏置为：0.799886, 损失为：0.

第1087次模型优化后的参数权重：0.699997, 偏置为：0.799985, 损失为：0.000000
第1088次模型优化后的参数权重：0.699997, 偏置为：0.799985, 损失为：0.000000
第1089次模型优化后的参数权重：0.699997, 偏置为：0.799985, 损失为：0.000000
第1090次模型优化后的参数权重：0.699997, 偏置为：0.799985, 损失为：0.000000
第1091次模型优化后的参数权重：0.699997, 偏置为：0.799985, 损失为：0.000000
第1092次模型优化后的参数权重：0.699997, 偏置为：0.799985, 损失为：0.000000
第1093次模型优化后的参数权重：0.699997, 偏置为：0.799985, 损失为：0.000000
第1094次模型优化后的参数权重：0.699997, 偏置为：0.799986, 损失为：0.000000
第1095次模型优化后的参数权重：0.699997, 偏置为：0.799986, 损失为：0.000000
第1096次模型优化后的参数权重：0.699997, 偏置为：0.799986, 损失为：0.000000
第1097次模型优化后的参数权重：0.699997, 偏置为：0.799986, 损失为：0.000000
第1098次模型优化后的参数权重：0.699997, 偏置为：0.799986, 损失为：0.000000
第1099次模型优化后的参数权重：0.699998, 偏置为：0.799986, 损失为：0.000000
第1100次模型优化后的参数权重：0.699998, 偏置为：0.799986, 损失为：0.000000
第1101次模型优化后的参数权重：0.699998, 偏置为：0.799986, 损失为：0.000000
第1102次模型优化后的参数权重：0.699998, 偏置为：0.799987, 损失为：0.000000
第1103次模型优化后的参数权重：0.699998, 偏置为：0.799987, 损失为：0.000000
第1104次模型优化后的参数权重：0.699998, 偏置为：0.799987, 损失为：0.000000
第1105次模型优化后的参数权重：0.699998, 偏

第1277次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1278次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1279次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1280次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1281次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1282次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1283次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1284次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1285次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1286次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1287次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1288次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1289次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1290次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1291次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1292次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1293次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1294次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1295次模型优化后的参数权重：0.699999, 偏

第1443次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1444次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1445次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1446次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1447次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1448次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1449次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1450次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1451次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1452次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1453次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1454次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1455次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1456次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1457次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1458次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1459次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1460次模型优化后的参数权重：0.699999, 偏置为：0.799997, 损失为：0.000000
第1461次模型优化后的参数权重：0.699999, 偏

第1602次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1603次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1604次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1605次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1606次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1607次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1608次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1609次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1610次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1611次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1612次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1613次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1614次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1615次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1616次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1617次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1618次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1619次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1620次模型优化后的参数权重：0.699999, 偏

第1814次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1815次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1816次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1817次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1818次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1819次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1820次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1821次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1822次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1823次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1824次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1825次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1826次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1827次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1828次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1829次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1830次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1831次模型优化后的参数权重：0.699999, 偏置为：0.799998, 损失为：0.000000
第1832次模型优化后的参数权重：0.699999, 偏

### 实现线性回归
1. **学习率、步长和梯度爆炸**
    * 学习率不应该设置过大、0~1之间的数，如果过大，导致梯度爆炸（损失、参数优化成nan）
    * 学习率越大，达到最终比较好的效果步长越小
    * 学习率越小，达到最终比较好的效果步长越大
    * 一般选择较小的学习率
    
2. **在极端条件下，权重的值变得非常大，以至于溢出，导致`NaN`值。以下是梯度爆炸解决方案（深度神经网络当中更容易出现）**
    * 重新设计网络
    * 调整学习率
    * 使用梯度截断（在训练过程中检查和限制梯度的大小）
    * 使用激活函数
    
3. **模型要优化的参数必须选择`tf.Variable`定义，并且指定`trainable`参数为可训练**


4. **增加命名空间**

    使代码结构更加清晰，TensorBoard图结构清楚

### 增加变量显示

目的：在TensorBoard当中观察模型的参数、损失值等变量值的变化

1. 收集变量

    * `tf.summary.scalar(name=" ", tensor)`收集损失函数和准确率等单值变量，name为变量的名字，tensor为值
    
    * `tf.summary.histogram(name=" ",  tensor)`收集高维度的变化参数
    
    * `tf.summary.image(name=" ", tensor)`收集输入的图片张量能显示图片
    
2. 合并变量写入事件文件

    * `merge = tf.summary.merge_all()`
    
    * 运行合并：`summary = sess.run(merged)`，每次迭代都需要运行
    
    * 添加：`FileWriter.add_summary(summary, i)` i表示第几次的值