In [2]:
import tensorflow as tf
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'

# 训练参数问题：trainable
   * 决定你在训练过程中参数是否可变

# 学习率和步数设置
   * tf.train.GradientDescentOptimizer(0.1)
       * 学习率太大会导致训练结果误差太大
       * 同时也会影响到学习的步数
       
   * 在极端情况下，权重的值变得非常大，以至于溢出，导致NaN值
## 解决问题
       * 1.重新设计网络
       * 2.调整学习率
       * 3.使用梯度截断（在训练过程中检查和限制梯度的大小）
       * 4.使用激活函数


In [57]:
def myregression1():
    """
    线性回归预测
    """
    
    #1.准备数据 x：特征值【100,1】 y：目标值【100】
    x = tf.random_normal([100,1],mean=1.75,stddev=0.5,name='x_data')

    #矩阵相乘必须是二维的（预设好的数据）
    y_true = tf.matmul(x,[[0.7]]) + 0.8
    
    #2.建立线性回归模型 1个特征，1个权重  一个偏置 y= x*w + b
    #随机给一个权重和偏置的值，去计算损失，然后在当前状态下优化
    #用变量定义才能优化（数据可变）
    #trainable决定训练过程中的值是否被改变
    weight = tf.Variable(
        tf.random_normal([1,1],mean=0.0,stddev=1.0),
        name='w',
        trainable=True
    )
    
    
    bias = tf.Variable(
        0.0,
        name='b',
        trainable=True
    )
    y_predict = tf.matmul(x,weight) + bias
    
    #3.建立损失函数，均分误差
    loss = tf.reduce_mean(tf.square(y_true - y_predict))
    
    #4.梯度下降优化损失:leaning_rate：0~1，2,3...
    train_op = tf.train.GradientDescentOptimizer(0.1).minimize(loss)
    
    #定义一个初始化变量的op
    init_op = tf.global_variables_initializer()
    
    #通过会话运行程序
    with tf.Session() as sess:
        #初始化变量
        sess.run(init_op)
        
        #打印随机最先初始化的权重和偏置
        print("随机初始化的参数权重：%f,偏置为：%f" %(weight.eval(),bias.eval() ))
        
        #建立事件文件
        fileWriter = tf.summary.FileWriter('./summary/',graph=sess.graph)
        
        #循环训练，运行优化
        for i in range(200):
            sess.run(train_op)
            print("第%d次优化的参数权重：%f,偏置为：%f" %(i,weight.eval(),bias.eval() ))
        
        
myregression1()
    

随机初始化的参数权重：0.518544,偏置为：0.000000
第0次优化的参数权重：0.922748,偏置为：0.224117
第1次优化的参数权重：0.980659,偏置为：0.263653
第2次优化的参数权重：0.982259,偏置为：0.271975
第3次优化的参数权重：0.976425,偏置为：0.277254
第4次优化的参数权重：0.975374,偏置为：0.283694
第5次优化的参数权重：0.973736,偏置为：0.291567
第6次优化的参数权重：0.968410,偏置为：0.295210
第7次优化的参数权重：0.965288,偏置为：0.301872
第8次优化的参数权重：0.965738,偏置为：0.309954
第9次优化的参数权重：0.961791,偏置为：0.313587
第10次优化的参数权重：0.960776,偏置为：0.321359
第11次优化的参数权重：0.950439,偏置为：0.323262
第12次优化的参数权重：0.953016,偏置为：0.331072
第13次优化的参数权重：0.949341,偏置为：0.335632
第14次优化的参数权重：0.942202,偏置为：0.340055
第15次优化的参数权重：0.941453,偏置为：0.345515
第16次优化的参数权重：0.941202,偏置为：0.350676
第17次优化的参数权重：0.946031,偏置为：0.361681
第18次优化的参数权重：0.939659,偏置为：0.364452
第19次优化的参数权重：0.937218,偏置为：0.369839
第20次优化的参数权重：0.930589,偏置为：0.373527
第21次优化的参数权重：0.929957,偏置为：0.379253
第22次优化的参数权重：0.930942,偏置为：0.385848
第23次优化的参数权重：0.919942,偏置为：0.385224
第24次优化的参数权重：0.924065,偏置为：0.392051
第25次优化的参数权重：0.918091,偏置为：0.394302
第26次优化的参数权重：0.920832,偏置为：0.402369
第27次优化的参数权重：0.908099,偏置为：0.402299
第28次优化的参数权重：0.911634,偏置为：

# 包含作用域
* 添加作用域
* 添加权重参数，损失值等在tensorboard观察的情况
    * 1.收集变量
    * 2.合并变量写入事件文件

In [63]:
def myregression2():
    """
    线性回归预测
    """
    
    with tf.variable_scope("data"):
        #1.准备数据 x：特征值【100,1】 y：目标值【100】
        x = tf.random_normal([100,1],mean=1.75,stddev=0.5,name='x_data')

        #矩阵相乘必须是二维的（预设好的数据）
        y_true = tf.matmul(x,[[0.7]]) + 0.8
    
    with tf.variable_scope("model"):
        #2.建立线性回归模型 1个特征，1个权重  一个偏置 y= x*w + b
        #随机给一个权重和偏置的值，去计算损失，然后在当前状态下优化
        #用变量定义才能优化（数据可变）
        #trainable决定训练过程中的值是否被改变
        weight = tf.Variable(tf.random_normal([1,1],mean=0.0,stddev=1.0),name='w',trainable=True)


        bias = tf.Variable(0.0,name='b',trainable=True)
        y_predict = tf.matmul(x,weight) + bias

    
    with tf.variable_scope("loss"):
        #3.建立损失函数，均分误差
        loss = tf.reduce_mean(tf.square(y_true - y_predict))

    with tf.variable_scope("optimizer"):
        #4.梯度下降优化损失:leaning_rate：0~1，2,3...
        train_op = tf.train.GradientDescentOptimizer(0.1).minimize(loss)
    
    #1.收集tensor
    tf.summary.scalar('losses',loss)
    tf.summary.histogram('weights',weight)
    #定义合并tensor的op
    merged = tf.summary.merge_all()
    
    
    #定义一个初始化变量的op
    init_op = tf.global_variables_initializer()
    
    #通过会话运行程序
    with tf.Session() as sess:
        #初始化变量
        sess.run(init_op)
        
        #打印随机最先初始化的权重和偏置
        print("随机初始化的参数权重：%f,偏置为：%f" %(weight.eval(),bias.eval() ))
        
        #建立事件文件
        fileWriter = tf.summary.FileWriter('./summary/',graph=sess.graph)
        
        #循环训练，运行优化
        for i in range(500):
            sess.run(train_op)
            
            #运行合并的tensor(用于tensorboard显示)
            summary = sess.run(merged)
            fileWriter.add_summary(summary,i)
            
            print("第%d次优化的参数权重：%f,偏置为：%f" %(i,weight.eval(),bias.eval() ))

       
        
        
myregression2()
    

随机初始化的参数权重：0.668326,偏置为：0.000000
第0次优化的参数权重：0.959516,偏置为：0.170744
第1次优化的参数权重：1.008501,偏置为：0.206515
第2次优化的参数权重：1.007720,偏置为：0.214728
第3次优化的参数权重：1.009693,偏置为：0.228538
第4次优化的参数权重：0.994029,偏置为：0.229760
第5次优化的参数权重：0.995027,偏置为：0.242108
第6次优化的参数权重：0.999464,偏置为：0.252973
第7次优化的参数权重：0.988155,偏置为：0.257474
第8次优化的参数权重：0.983368,偏置为：0.264147
第9次优化的参数权重：0.976515,偏置为：0.268479
第10次优化的参数权重：0.989306,偏置为：0.283242
第11次优化的参数权重：0.980525,偏置为：0.287187
第12次优化的参数权重：0.974650,偏置为：0.291573
第13次优化的参数权重：0.970582,偏置为：0.295579
第14次优化的参数权重：0.966989,偏置为：0.304318
第15次优化的参数权重：0.962134,偏置为：0.308437
第16次优化的参数权重：0.953683,偏置为：0.311028
第17次优化的参数权重：0.955121,偏置为：0.320534
第18次优化的参数权重：0.957241,偏置为：0.328833
第19次优化的参数权重：0.954684,偏置为：0.336254
第20次优化的参数权重：0.953132,偏置为：0.342047
第21次优化的参数权重：0.948316,偏置为：0.346507
第22次优化的参数权重：0.944186,偏置为：0.351604
第23次优化的参数权重：0.941071,偏置为：0.356461
第24次优化的参数权重：0.941061,偏置为：0.364720
第25次优化的参数权重：0.936288,偏置为：0.368563
第26次优化的参数权重：0.933166,偏置为：0.373246
第27次优化的参数权重：0.925009,偏置为：0.375917
第28次优化的参数权重：0.924984,偏置为：

第383次优化的参数权重：0.703457,偏置为：0.793587
第384次优化的参数权重：0.703356,偏置为：0.793642
第385次优化的参数权重：0.703467,偏置为：0.793823
第386次优化的参数权重：0.703293,偏置为：0.793834
第387次优化的参数权重：0.703226,偏置为：0.793897
第388次优化的参数权重：0.703202,偏置为：0.793975
第389次优化的参数权重：0.703089,偏置为：0.794010
第390次优化的参数权重：0.703180,偏置为：0.794162
第391次优化的参数权重：0.703013,偏置为：0.794167
第392次优化的参数权重：0.703154,偏置为：0.794341
第393次优化的参数权重：0.702961,偏置为：0.794315
第394次优化的参数权重：0.703002,偏置为：0.794426
第395次优化的参数权重：0.702933,偏置为：0.794483
第396次优化的参数权重：0.702966,偏置为：0.794576
第397次优化的参数权重：0.702901,偏置为：0.794640
第398次优化的参数权重：0.702875,偏置为：0.794704
第399次优化的参数权重：0.702894,偏置为：0.794767
第400次优化的参数权重：0.702838,偏置为：0.794833
第401次优化的参数权重：0.702757,偏置为：0.794864
第402次优化的参数权重：0.702751,偏置为：0.794945
第403次优化的参数权重：0.702653,偏置为：0.794989
第404次优化的参数权重：0.702667,偏置为：0.795065
第405次优化的参数权重：0.702676,偏置为：0.795132
第406次优化的参数权重：0.702584,偏置为：0.795166
第407次优化的参数权重：0.702608,偏置为：0.795260
第408次优化的参数权重：0.702529,偏置为：0.795291
第409次优化的参数权重：0.702382,偏置为：0.795281
第410次优化的参数权重：0.702441,偏置为：0.795406
第411次优化的参数权重：0.70242

# 模型保存与加载

In [111]:
def myregression3():
    """
    线性回归预测
    """
    
    with tf.variable_scope("data"):
        #1.准备数据 x：特征值【100,1】 y：目标值【100】
        x = tf.random_normal([100,1],mean=1.75,stddev=0.5,name='x_data')

        #矩阵相乘必须是二维的（预设好的数据）
        y_true = tf.matmul(x,[[0.7]]) + 0.8
    
    with tf.variable_scope("model"):
        #2.建立线性回归模型 1个特征，1个权重  一个偏置 y= x*w + b
        #随机给一个权重和偏置的值，去计算损失，然后在当前状态下优化
        #用变量定义才能优化（数据可变）
        #trainable决定训练过程中的值是否被改变
        weight = tf.Variable(tf.random_normal([1,1],mean=0.0,stddev=1.0),name='w',trainable=True)


        bias = tf.Variable(0.0,name='b',trainable=True)
        y_predict = tf.matmul(x,weight) + bias

    
    with tf.variable_scope("loss"):
        #3.建立损失函数，均分误差
        loss = tf.reduce_mean(tf.square(y_true - y_predict))

    with tf.variable_scope("optimizer"):
        #4.梯度下降优化损失:leaning_rate：0~1，2,3...
        train_op = tf.train.GradientDescentOptimizer(0.1).minimize(loss)
    
    #1.收集tensor
    tf.summary.scalar('losses',loss)
    tf.summary.histogram('weights',weight)
    #定义合并tensor的op
    merged = tf.summary.merge_all()
    
    
    #定义一个初始化变量的op
    init_op = tf.global_variables_initializer()
    
    #定义一个保存模型的实例
    saver = tf.train.Saver()
    
    
    #通过会话运行程序
    with tf.Session() as sess:
        #初始化变量
        sess.run(init_op)
        
        #打印随机最先初始化的权重和偏置
        print("随机初始化的参数权重：%f,偏置为：%f" %(weight.eval(),bias.eval() ))
        
        #建立事件文件
        fileWriter = tf.summary.FileWriter('./summary/',graph=sess.graph)
        
        #加载模型，覆盖模型当中随机定义的参数，从上一次训练的参数结果开始
        ckpt = tf.train.get_checkpoint_state('./ckpt/')
        print(ckpt)
        print(ckpt.model_checkpoint_path)
        if ckpt and ckpt.model_checkpoint_path:
            saver.restore(sess, ckpt.model_checkpoint_path)
        
        #循环训练，运行优化
        for i in range(500):
            sess.run(train_op)

            #运行合并的tensor(用于tensorboard显示)
            summary = sess.run(merged)
            fileWriter.add_summary(summary,i)

            print("第%d次优化的参数权重：%f,偏置为：%f" %(i,weight.eval(),bias.eval() ))
            
        saver.save(sess,'./ckpt/model')
               
        
        
myregression3()
    

随机初始化的参数权重：-0.776513,偏置为：0.000000
model_checkpoint_path: "./ckpt/model"
all_model_checkpoint_paths: "./ckpt/model"

./ckpt/model
INFO:tensorflow:Restoring parameters from ./ckpt/model


NotFoundError: Restoring from checkpoint failed. This is most likely due to a Variable name or other graph key that is missing from the checkpoint. Please ensure that you have not altered the graph expected based on the checkpoint. Original error:

Key model_47/b not found in checkpoint
	 [[node save_43/RestoreV2 (defined at <ipython-input-111-57236a452229>:44) ]]

Original stack trace for 'save_43/RestoreV2':
  File "/usr/lib/python3.6/runpy.py", line 193, in _run_module_as_main
    "__main__", mod_spec)
  File "/usr/lib/python3.6/runpy.py", line 85, in _run_code
    exec(code, run_globals)
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/ipykernel_launcher.py", line 16, in <module>
    app.launch_new_instance()
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/traitlets/config/application.py", line 658, in launch_instance
    app.start()
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/ipykernel/kernelapp.py", line 563, in start
    self.io_loop.start()
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/tornado/platform/asyncio.py", line 148, in start
    self.asyncio_loop.run_forever()
  File "/usr/lib/python3.6/asyncio/base_events.py", line 438, in run_forever
    self._run_once()
  File "/usr/lib/python3.6/asyncio/base_events.py", line 1451, in _run_once
    handle._run()
  File "/usr/lib/python3.6/asyncio/events.py", line 145, in _run
    self._callback(*self._args)
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/tornado/ioloop.py", line 690, in <lambda>
    lambda f: self._run_callback(functools.partial(callback, future))
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/tornado/ioloop.py", line 743, in _run_callback
    ret = callback()
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/tornado/gen.py", line 787, in inner
    self.run()
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/tornado/gen.py", line 748, in run
    yielded = self.gen.send(value)
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/ipykernel/kernelbase.py", line 365, in process_one
    yield gen.maybe_future(dispatch(*args))
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/tornado/gen.py", line 209, in wrapper
    yielded = next(result)
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/ipykernel/kernelbase.py", line 272, in dispatch_shell
    yield gen.maybe_future(handler(stream, idents, msg))
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/tornado/gen.py", line 209, in wrapper
    yielded = next(result)
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/ipykernel/kernelbase.py", line 542, in execute_request
    user_expressions, allow_stdin,
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/tornado/gen.py", line 209, in wrapper
    yielded = next(result)
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/ipykernel/ipkernel.py", line 294, in do_execute
    res = shell.run_cell(code, store_history=store_history, silent=silent)
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/ipykernel/zmqshell.py", line 536, in run_cell
    return super(ZMQInteractiveShell, self).run_cell(*args, **kwargs)
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/IPython/core/interactiveshell.py", line 2855, in run_cell
    raw_cell, store_history, silent, shell_futures)
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/IPython/core/interactiveshell.py", line 2881, in _run_cell
    return runner(coro)
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/IPython/core/async_helpers.py", line 68, in _pseudo_sync_runner
    coro.send(None)
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/IPython/core/interactiveshell.py", line 3058, in run_cell_async
    interactivity=interactivity, compiler=compiler, result=result)
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/IPython/core/interactiveshell.py", line 3249, in run_ast_nodes
    if (await self.run_code(code, result,  async_=asy)):
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/IPython/core/interactiveshell.py", line 3326, in run_code
    exec(code_obj, self.user_global_ns, self.user_ns)
  File "<ipython-input-111-57236a452229>", line 79, in <module>
    myregression3()
  File "<ipython-input-111-57236a452229>", line 44, in myregression3
    saver = tf.train.Saver()
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/tensorflow/python/training/saver.py", line 825, in __init__
    self.build()
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/tensorflow/python/training/saver.py", line 837, in build
    self._build(self._filename, build_save=True, build_restore=True)
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/tensorflow/python/training/saver.py", line 875, in _build
    build_restore=build_restore)
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/tensorflow/python/training/saver.py", line 508, in _build_internal
    restore_sequentially, reshape)
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/tensorflow/python/training/saver.py", line 328, in _AddRestoreOps
    restore_sequentially)
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/tensorflow/python/training/saver.py", line 575, in bulk_restore
    return io_ops.restore_v2(filename_tensor, names, slices, dtypes)
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/tensorflow/python/ops/gen_io_ops.py", line 1696, in restore_v2
    name=name)
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/tensorflow/python/framework/op_def_library.py", line 788, in _apply_op_helper
    op_def=op_def)
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/tensorflow/python/util/deprecation.py", line 507, in new_func
    return func(*args, **kwargs)
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/tensorflow/python/framework/ops.py", line 3616, in create_op
    op_def=op_def)
  File "/home/tang/mnt/F/学习/人工智能/venv/lib/python3.6/site-packages/tensorflow/python/framework/ops.py", line 2005, in __init__
    self._traceback = tf_stack.extract_stack()


# 定义命令行参数
    * 1.首先定义有哪些参数需要在运行时指定
    * 2.程序中获取定义命令行参数
    
* 如下通过命令行执行
    * python xx.py --max_step=500

In [None]:
#参数：名字，默认值，说明
tf.app.flags.DEFINE_integer("max_step",100,'模型训练的步数')
tf.app.flags.DEFINE_string("model_dir",'','模型文件的加载路径')

#定义获取命令行参数名字
FLAGS = tf.app.flags.FLAGS

def myregression4():
    """
    线性回归预测
    """
    
    with tf.variable_scope("data"):
        #1.准备数据 x：特征值【100,1】 y：目标值【100】
        x = tf.random_normal([100,1],mean=1.75,stddev=0.5,name='x_data')

        #矩阵相乘必须是二维的（预设好的数据）
        y_true = tf.matmul(x,[[0.7]]) + 0.8
    
    with tf.variable_scope("model"):
        #2.建立线性回归模型 1个特征，1个权重  一个偏置 y= x*w + b
        #随机给一个权重和偏置的值，去计算损失，然后在当前状态下优化
        #用变量定义才能优化（数据可变）
        #trainable决定训练过程中的值是否被改变
        weight = tf.Variable(tf.random_normal([1,1],mean=0.0,stddev=1.0),name='w',trainable=True)


        bias = tf.Variable(0.0,name='b',trainable=True)
        y_predict = tf.matmul(x,weight) + bias

    
    with tf.variable_scope("loss"):
        #3.建立损失函数，均分误差
        loss = tf.reduce_mean(tf.square(y_true - y_predict))

    with tf.variable_scope("optimizer"):
        #4.梯度下降优化损失:leaning_rate：0~1，2,3...
        train_op = tf.train.GradientDescentOptimizer(0.1).minimize(loss)
    
    #1.收集tensor
    tf.summary.scalar('losses',loss)
    tf.summary.histogram('weights',weight)
    #定义合并tensor的op
    merged = tf.summary.merge_all()
    
    
    #定义一个初始化变量的op
    init_op = tf.global_variables_initializer()
    
    #通过会话运行程序
    with tf.Session() as sess:
        #初始化变量
        sess.run(init_op)
        
        #打印随机最先初始化的权重和偏置
        print("随机初始化的参数权重：%f,偏置为：%f" %(weight.eval(),bias.eval() ))
        
        #建立事件文件
        fileWriter = tf.summary.FileWriter('./summary/',graph=sess.graph)
        
        #循环训练，运行优化
        for i in range(FLAGS.max_step):
            sess.run(train_op)
            
            #运行合并的tensor(用于tensorboard显示)
            summary = sess.run(merged)
            fileWriter.add_summary(summary,i)
            
            print("第%d次优化的参数权重：%f,偏置为：%f" %(i,weight.eval(),bias.eval() ))

       
        
        
myregression4()