# 什么是数据流图？
    数据流图是一种将表示系统中数据流动的图结构。它由节点与边构成，节点表示运算单元，边表示数据的输入输出关系。


# 数据流图有什么优势？
    (1)并行处理。 通过使用明确的边缘来表示操作之间的依赖关系，系统可以轻松识别能够并行执行的操作。

    (2)分布式执行。 通过使用明确的边缘来表示操作之间流动的值，TensorFlow 可以将您的程序划分到连接至不同机器的多台设备上
      （CPU、GPU 和 TPU）。TensorFlow 将在这些设备之间进行必要的通信和协调。

    (3)编译。 TensorFlow 的 XLA 编译器可以使用数据流图中的信息生成更快的代码，例如将相邻的操作融合到一起。

    (4)可移植性。 数据流图是一种不依赖于语言的模型代码表示法。您可以使用 Python 构建数据流图，将其存储在 SavedModel 中，
       并使用 C++ 程序进行恢复，从而实现低延迟的推理。

    

# tensorflow 1.0的计算过程
    （1）赋值初始数据
    （2）创建运算节点（初始数据包含在节点中），运算节点之间的联系要正确反映运算关系，完成计算流图的构建。
    （3）创建会话，运行计算流图
    （4）关闭回话，回收计算资源
    可见在1.0中，需要先自行构建运算图，然后再创建会话执行。因为不能立即执行代码所以称为静态图。
    在2.0中，可以像Python一样直接执行，也就是 Eager Execution(立刻执行),所以被称为动态图。

# tf.function & tf.autograph
    tf.function是tensorflow提供的将Python代码转换为tensorflow的图的方法。
    而tf.autograph是如何进行这种转化的机制。


## tf.function()
    func:将一个函数编译成数据流图的格式。
    para：一个Python函数。
    
    在函数被用@tf.function装饰以后，会多出一些属性。
        python_function -> 返回原本的python代码
        get_concrete_function -> 可以返回一些属性，但是还不知道用在哪
        
     注意：不能再被转化的python函数内部定义变量，只能在外部定义变量，否则会报错
    
## tf.autograph模块（知道就行）
    将普通Python代码转为tensorflow图代码
    
    tf.autograph.to_code:以字符串的形式返回Autograph源代码    
    
    
    
# other_functions    
    
## tf.math.greater_equal(x,y)
    func:逐元素地返回x>=y的布尔值。
    para:x,y为同类型地张量。
    
    例子：
    x = tf.constant([5, 4, 6, 7])
    y = tf.constant([5, 2, 5, 10])
    tf.math.greater_equal(x, y) ==> [True, True, True, False]

    x = tf.constant([5, 4, 6, 7])
    y = tf.constant([5])
    tf.math.greater_equal(x, y) ==> [True, False, True, True]
    
## tf.where(condition, x = none, y = none)
    func:根据condition返回x,y中的元素
    para：
        condition：一个bool类型的张量(Tensor).
        x，y：具有相同数据类型的张量，shape不一定相同。
        （1）当x，y都为none时，以二维array的形式返回condition中的True的位置，其中第一维中的元素个数表示True的个数，
            第二维数据表示元素所在位置。
        （2）当x与condition有相同形状时，根据condition中的值返回x or y中的元素（True返回x中的值，False返回y中的值）；
            当x与condition的shape不同（但condition的维度必须与x前部维度相同），根据condition返回x or y的部分维度。

## tf.nn.elu(feature)
    当feature小于0，返回exp(feature)-1;当feature >= 0，返回feature。




In [3]:
#导入包
from sklearn.datasets import fetch_california_housing
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
import numpy as np
import pandas as pd
from matplotlib import pyplot as plt
import tensorflow as tf
from tensorflow import keras

In [4]:
# 处理数据
housing = fetch_california_housing()

x_train_all, x_test_raw, y_train_all, y_test = train_test_split(
    housing.data, housing.target, random_state = 7)
x_train_raw, x_valid_raw, y_train, y_valid = train_test_split(
    x_train_all, y_train_all, random_state = 11)

#对数据进行标准化处理
sca = StandardScaler()
x_train = sca.fit_transform(x_train_raw)
x_valid = sca.transform(x_valid_raw)
x_test = sca.transform(x_test_raw)


# tf.fuction
    方法1：通过tf.function()函数将python函数转化为tf中的图结构
    方法2：通过标注的方法
    

In [7]:
# 方法1：
def scaled_elu(z, scale=1.0, alpha=1.0):
    # z >= 0 ? scale * z : scale * alpha * tf.nn.elu(z)
    is_positive = tf.greater_equal(z, 0.0)
    return scale * tf.where(is_positive, z, alpha * tf.nn.elu(z))

print('原始python代码的计算结果：',scaled_elu(tf.constant(-3.)))
print('原始python代码的计算结果：',scaled_elu(tf.constant([-3., -2.5])))

scaled_elu_tf = tf.function(scaled_elu)
print('转化为graph的计算结果：',scaled_elu_tf(tf.constant(-3.)))
print('转化为graph的计算结果：',scaled_elu_tf(tf.constant([-3., -2.5])))

print(scaled_elu_tf.python_function is scaled_elu) #转化之后的图会有一个python_function属性，其代表了原来的python代码

# 比较两者之间的计算速度
%timeit scaled_elu(tf.random.normal((1000, 1000)))
%timeit scaled_elu_tf(tf.random.normal((1000, 1000)))

原始python代码的计算结果： tf.Tensor(-0.95021296, shape=(), dtype=float32)
原始python代码的计算结果： tf.Tensor([-0.95021296 -0.917915  ], shape=(2,), dtype=float32)
转化为graph的计算结果： tf.Tensor(-0.95021296, shape=(), dtype=float32)
转化为graph的计算结果： tf.Tensor([-0.95021296 -0.917915  ], shape=(2,), dtype=float32)
True
24.1 ms ± 3.07 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)
21.7 ms ± 818 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [None]:
# 方法2：通过标住
# 1 + 1/2 + 1/2^2 + ... + 1/2^n

@tf.function
def converge_to_2(n_iters):
    total = tf.constant(0.)
    increment = tf.constant(1.)
    for _ in range(n_iters):
        total += increment
        increment /= 2.0
    return total

print(converge_to_2(20))

In [None]:
# tf.function(input_signiture = ~~~)
# 通过使用input_signature参数，限定函数输入类型防止函数调用错误
# 而且只有使用了input_signature参数，才能使用tf中的savemodel
@tf.function(input_signature=[tf.TensorSpec([None], tf.int32, name='x')])
def cube(z):
    return tf.pow(z, 3)

try:
    print(cube(tf.constant([1., 2., 3.])))
except ValueError as ex:
    print(ex)
    
print(cube(tf.constant([1, 2, 3])))
    

In [None]:
#构建模型
model = keras.models.Sequential()

model.add(keras.layers.Dense(8,activation='relu', input_shape = x_train.shape[1:]))
model.add(keras.layers.Dense(1))

model.compile(loss = 'mean_squared_error', optimizer = 'adam')  

history = model.fit(x_train, y_train,
          validation_data = (x_valid, y_valid),
          callbacks = [keras.callbacks.EarlyStopping(patience = 5, min_delta = 1e-3)],
          epochs = 20)


In [None]:
def plot_learning_curves(history):
    pd.DataFrame(history.history).plot(figsize=(8, 5))
    plt.grid(True)
    plt.gca().set_ylim(0, 2)
    plt.show()
plot_learning_curves(history)


In [None]:
model.evaluate(x_train, y_train, verbose = False)

In [None]:
im