In [1]:
import tensorflow as tf

# tf.Variable()
```python
tf.Variable(
    initial_value=None,
    trainable=None,
    validate_shape=True,
    caching_device=None,
    name=None,
    variable_def=None,
    dtype=None,
    import_scope=None,
    constraint=None,
    synchronization=VariableSynchronization.AUTO,
    aggregation=VariableAggregation.NONE,
    shape=None)
```


__Docstring__

见[variable guide](https://tensorflow.org/guide/variable).

用于声明一个由程序操作的、保持着共享性和持久性的`Variable`对象。

__Args__
    
    
- initial_value: 张量或可转换为张量的 Python 对象，是`Variable`的初始化取值；除`validate_shape`被指明为`False`外，需指明初始值的形状；`initial_value`也可以是也可以是不带参数的可调用函数，其在调用时返回初始值，这种情况下`dtype`必须被指明。(注意`init_ops.py`的初始化函数在调用前必须首先绑定到一个形状上)

- trainable: 当 `synchronization`被设定为`ON_READ`时，其默认值为`False`，否则默认值为`True`；当其取值为`True`时，`GradientTapes`将自动记录这个变量的使用情况。

- validate_shape: 取值为`False`时，该变量可以用一个形状未知的值初始化，否则变量形状必须被指明

- caching_device: 字符串型变量，用于指明应在何处缓存变量以进行读取，默认为变量所在的设备；取值不为`None`时则缓存到另一个设备上，典型的用法是在使用变量驻留的Ops设备(where the Ops using the Variable reside)上缓存，以能够通过`Switch`和其他条件语句来减少重复的拷贝(deduplicate copying)

- name: 变量的名称，默认为`'Variable'`并自动实现实例唯一化(uniquified)

- variable_def: `VariableDef`协议缓冲区(protocol buffer)；若取值不为`None`，则根据该变量在计算图中的节点，重新创建变量对象及其内容；这要求其在计算图中的节点应必须存在，但不会对计算图进行更改。`variable_def`和其他参数是互斥的，当其与`inital_value`同时被指明时会报错

- dtype: 当没有指明类型时，即其取值为`None`时，若`initial_value`为一张量，则该变量的数据类型将被保留；若`initial_value`不为张量，则数据类型由`convert_to_tensor`决定

- import_scope: `Variable`的名称作用域，仅在从协议缓冲区初始化时使用

- constraint: 被`Optimizer`更新后作用在变量上的投影函数，如用于对该层权重的范数约束或值约束的函数；该函数必须以表示变量值的未投影张量作为输入，并返回投影值的张量，返回张量应与原张量形状相同。在进行异步分布式训练时，使用约束并不安全

- synchronization: 用于指明分布式变量是什么时候被聚合(aggregated)的。支持由`tf.VariableSynchronization`类定义的变量；默认情况下，同步状态设置为`AUTO`，并由当前的`DistributionStrategy`决定何时同步

- aggregation: 用于指明分布式变量是如何被聚合的，支持由`tf.VariableAggregation`类定义的变量

- shape: `None`时使用`initial_value`的形状，当设定为`tf.TensorShape(None)`时，即表示一个未指定的形状，该变量可被设定为任意形状

See the `tf.function` documentation for details.


__WARNING__：有些参数已被弃用`(caching_device)`，这些参数在未来版本中将被移除。

__Instructions for updating__

- 可以通过在tf.device作用域下调用tf.Variable.read_value()来手动缓存变量的值。

- caching_device参数有时不能正常工作。


__Type__: VariableMetaclass

__Subclasses__: VariableV1, DistributedVariable, AggregatingVariable, AutoCastVariable

`Variable()`构造函数要求变量有一个初始值，该变量类型可以为任意形状任意类型的 `Tensor`，这个初始值定义了该变量的类型和形状，构造完成后其类型和形状便已固定，其值可以通过 assign 方法修改。

In [27]:
x = tf.Variable(1.)
print(x.assign(2.))
print(x.assign_add(0.5))  # 注意输出为 tf.Variable
x = x + 1  # 该操作使 x 变为 tf.Tensor 类型，进而无法使用assign修改及赋值

tf.Tensor(2.0, shape=(), dtype=float32)
<tf.Variable 'Variable:0' shape=() dtype=float32, numpy=1.0>
<tf.Variable 'UnreadVariable' shape=() dtype=float32, numpy=2.0>
<tf.Variable 'UnreadVariable' shape=() dtype=float32, numpy=2.5>


声明一个形状未完全定义的变量

In [None]:
x = tf.Variable(1., shape=tf.TensorShape(None))
print(x)
print(x.assign([[1.]]))

所有为`Tensor`类重载的运算符都被转移到variables中

In [None]:
w = tf.Variable([[1.], [2.]])
x = tf.constant([[3., 4.]])
y = tf.matmul(w, x)
z = tf.sigmoid(w + x)
print(w, x, y, z, sep="\n\n")

`trainable`和`tf.GradientTape`

In [None]:
with tf.GradientTape(persistent=True) as tape:
    trainable = tf.Variable(1.)
    non_trainable = tf.Variable(2., trainable=False)
    x1 = trainable * 2.
    x2 = non_trainable * 3.
print(tape.gradient(x1, trainable))
print(tape.gradient(x2, non_trainable))

当变量包含有继承`tf.Module`类型的属性时，变量会被自动跟踪；该追踪允许将变量值保存到包括了序列化的计算图的
[training checkpoints](https://www.tensorflow.org/guide/checkpoint)或
[SavedModels](https://www.tensorflow.org/guide/saved_model)中

In [None]:
m = tf.Module()
m.v = tf.Variable([1.])
print(m.trainable_variables)
print(m.__dict__)

Variables经常被‘tf.function’捕获和操纵。这与未修饰函数的工作方式相同

In [28]:
v = tf.Variable(0.)
read_and_decrement = tf.function(lambda: v.assign_sub(0.1))
print(read_and_decrement())
print(read_and_decrement())

tf.Tensor(-0.1, shape=(), dtype=float32)
tf.Tensor(-0.2, shape=(), dtype=float32)


在`tf.function`中创建的变量必须在函数外部拥有，并且只创建一次

In [None]:
class M(tf.Module):
    @tf.function
    def __call__(self, x):
        if not hasattr(self, "v"):  # Or set self.v to None in __init__
        self.v = tf.Variable(x)
        return self.v * x
m = M()
m(2.)
m(3.)
m.v

# x.assign_sub()