In [1]:
import tensorflow as tf
import tensorflow.keras as keras
import tensorflow.keras.layers as layers

# tensorflow.keras

Implementation of the Keras API meant to be a high-level API for TensorFlow.

**DESCRIPTION**

TensorFlow 内置的 Keras API 实现库，帮助文档参见[tensorflow.org](https://www.tensorflow.org/guide/keras).

**PACKAGE CONTENTS**

    activations (package)
    applications (package)
    backend (package)
    callbacks (package)
    constraints (package)
    datasets (package)
    estimator (package)
    experimental (package)
    initializers (package)
    layers (package)
    losses (package)
    metrics (package)
    mixed_precision (package)
    models (package)
    optimizers (package)
    premade (package)
    preprocessing (package)
    regularizers (package)
    utils (package)
    wrappers (package)

**FUNCTIONS**

- Input

**CLASSES**

- Sequential

- Model

**FILE**：  \tensorflow\lib\site-packages\tensorflow\keras\\\_\_init__.py

#  

#  

# keras.Input()
```python
keras.Input(
    shape=None,
    batch_size=None,
    name=None,
    dtype=None,
    sparse=False,
    tensor=None,
    ragged=False,
    **kwargs,
)
```
`Input()`用于初始化一个 Keras 符号张量，可以起到一个占位符的效果；需要注意的是，即使在即时执行模式下，该占位符仍旧可以参与 TF 运算并即时输出结果，但输出的张量依然没有具体取值，而仅仅是对张量形状的匹配性进行运算；

**Args**
- shape: 可以是整数构成的元祖、整数构成的列表、`TensorShape`实例，其不包含 batch 维度；若某一维度是 None，则代表该维度的形状未知待定；`shape`和`tensor`均为 None 时会抛出`ValueError`异常；
- batch_size, dtype: pass;
- name: 该层的名称；
- sparse: 用于指明这个占位符是否为稀疏张量；`ragged`和`sparse`只能有一个为真，否则会抛出`ValueError`异常；
- tensor: 初始化`Input`层的张量；为其指明具体值时，该层便不再起占位符的作用；`shape`和`tensor`均为 None 时会抛出`ValueError`异常；
- ragged: 用于指明这个占位符是否为不规则张量；`ragged`和`sparse`只能有一个为真，否则会抛出`ValueError`异常；`ragged`为 True 时，`shape`中指明了 None 的维度表示那个不规则的维度；更多有关不规则张量的信息参见[相关教程](https://www.tensorflow.org/guide/ragged_tensors)；
- \*\*kwargs: 对弃用参数提供支持，例如`batch_shape`、`batch_input_shape`等，当同时指明`shape`和`batch_input_shape`、或`shape`和`batch_shape`时会抛出`ValueError`异常；

**File**:  \keras\engine\input_layer.py

**Type**:      function

### Example
简单的使用：
```python
inputs = Input(shape=(64,))
x = Dense(32, activation='relu')(inputs)
x = Dense(16, activation='relu')(x)
outputs = Dense(10, activation='relu')(x)
model = Model(inputs=inputs, outputs=outputs)
```
即时执行模式下，占位符参与 TF 运算的结果没有具体取值
```python
x0 = keras.Input(shape=(1, 32))
x1 = keras.Input(shape=(32, 4))
y = x0 @ x1
y.shape  # ==> TensorShape([None, 1, 4])
```

#  

#  

# keras.Sequential()
`keras.Sequential(layers=None, name=None, *args, **kwargs)`

**Docstring**:

`Sequential`将若干线性堆叠的层 group into `tf.keras.Model`，并为该模块提供训练和推断的特性

**Args**:

- layers: 添加到该模型的层所组成的列表
- name: 该模型的名称

**File**:  tensorflow\python\keras\engine\sequential.py

**Type**:           type

### Examples

In [None]:
>>> # Optionally, the first layer can receive an `input_shape` argument:
>>> model = keras.Sequential()
>>> model.add(layers.Dense(8, input_shape=(16,)))
>>> # Afterwards, we do automatic shape inference:
>>> model.add(layers.Dense(4))

>>> # This is identical to the following:
>>> model = keras.Sequential()
>>> model.add(layers.Dense(8, input_dim=16))

>>> # And to the following:
>>> model = keras.Sequential()
>>> model.add(layers.Dense(8, batch_input_shape=(None, 16)))



>>> # When using the delayed-build pattern (no input shape specified), you can
>>> # choose to manually build your model by calling
>>> # `build(batch_input_shape)`:
>>> model = keras.Sequential()
>>> model.add(layers.Dense(8))
>>> model.add(layers.Dense(4))
>>> model.build((None, 16))
>>> len(model.weights)
4


# Note that when using the delayed-build pattern (no input shape specified),
# the model gets built the first time you call `fit` (or other training and
# evaluation methods).
model = keras.Sequential()
model.add(layers.Dense(8))
model.add(layers.Dense(1))
model.compile(optimizer='sgd', loss='mse')
# This builds the model for the first time:
model.fit(x, y, batch_size=32, epochs=10)

## keras.Sequential().add()
`model.add(layer)`

在已有的网络层下面(由输入指向输出的方向为下)添加一个`layer`；当添加的`layer`无法获得其输入形状时，或有多个输出张量时，或已经与其他模块相连接时，会抛出`ValueError`异常

**Type**:      function

## keras.Sequential.pop()
`model.pop()`

删除模型中的最后一层

**Type**:      function

    layers
    <property object at 0x00000138AD8C4720>

    dynamic
    <property object at 0x00000138A8BF6310>

    add
    <function Sequential.add at 0x00000138BBCEF310>

    pop
    <function Sequential.pop at 0x00000138BBCEF430>

    build
    <function Sequential.build at 0x00000138BBCEF4C0>

    call
    <function Sequential.call at 0x00000138BBCEF550>

    compute_output_shape
    <function Sequential.compute_output_shape at 0x00000138BBCEF5E0>

    compute_mask
    <function Sequential.compute_mask at 0x00000138BBCEF670>

    predict_proba
    <function Sequential.predict_proba at 0x00000138BBCEF820>

    predict_classes
    <function Sequential.predict_classes at 0x00000138BBCEF940>

    get_config
    <function Sequential.get_config at 0x00000138BBCEF700>

    from_config
    <classmethod object at 0x00000138BBCE5F40>

    input_spec
    <property object at 0x00000138BBCE7D60>

    _trackable_saved_model_saver
    <property object at 0x00000138BBCE7E00>

    _keras_api_names
    ('keras.Sequential', 'keras.models.Sequential')

    _keras_api_names_v1
    ('keras.Sequential', 'keras.models.Sequential')


# 

# 

**properties**

    metrics

    metrics_names

    distribute_strategy

    run_eagerly

    _compile_was_called

    _trackable_saved_model_saver

**functions**

    get_weights

    load_weights

    compile

    \_get_optimizer

    \_reset_compile_cache

    train_step

    make_train_function

    fit
    <function Model.fit at 0x000002760FEBAA60>

    test_step
    <function Model.test_step at 0x000002760FEBAAF0>

    make_test_function
    <function Model.make_test_function at 0x000002760FEBAB80>

    evaluate
    <function Model.evaluate at 0x000002760FEBACA0>

    predict_step
    <function Model.predict_step at 0x000002760FEBAD30>

    make_predict_function
    <function Model.make_predict_function at 0x000002760FEBADC0>

    predict
    <function Model.predict at 0x000002760FEBAEE0>

    reset_metrics
    <function Model.reset_metrics at 0x000002760FEBAF70>

    train_on_batch
    <function Model.train_on_batch at 0x000002760FEBC040>

    test_on_batch
    <function Model.test_on_batch at 0x000002760FEBC0D0>

    predict_on_batch
    <function Model.predict_on_batch at 0x000002760FEBC160>

    fit_generator
    <function Model.fit_generator at 0x000002760FEBC310>

    evaluate_generator
    <function Model.evaluate_generator at 0x000002760FEBC430>

    predict_generator
    <function Model.predict_generator at 0x000002760FEBC550>

    _check_call_args
    <function Model._check_call_args at 0x000002760FEBC1F0>

    _validate_compile
    <function Model._validate_compile at 0x000002760FEBC5E0>

    _maybe_load_initial_epoch_from_ckpt
    <function Model._maybe_load_initial_epoch_from_ckpt at 0x000002760FEBC670>

    _assert_compile_was_called
    <function Model._assert_compile_was_called at 0x000002760FEBC700>

    _set_inputs
    <function Model._set_inputs at 0x000002760FEBC790>

    _list_functions_for_serialization
    <function Model._list_functions_for_serialization at 0x000002760FEBC8B0>

    _should_eval
    <function Model._should_eval at 0x000002760FEBC940>

    _get_compile_args
    <function Model._get_compile_args at 0x000002760FEBC9D0>

    _get_callback_model
    <function Model._get_callback_model at 0x000002760FEBCA60>

    _in_multi_worker_mode
    <function Model._in_multi_worker_mode at 0x000002760FEBCAF0>

    _get_distribution_strategy
    <function Model._get_distribution_strategy at 0x000002760FEBCB80>




# keras.Model()
`keras.Model(*args, **kwargs)`

**Docstring**:

`Model`将网络层进行包装，返回能够进行训练和推理操作的对象；创建模型之后，便可以使用`.compile()`方法配置损失和度量，使用`.fit()`方法训练模型，用`.predict()`方法进行预测；更多细节参见 [Keras 训练模型的相关指导](http://localhost:8888/notebooks/Help_Viewer_Python/TensorFlow/TF2/Guide/Keras/02.Train_a_Model.ipynb)

**两种创建模型方法**：

1. 使用 functional API；即从`Input`开始先后连接不同的网络层的实例调用，以指明模型向前传播的方式，最后利用输入和输出创建模型；更多关于 functional API 参见[相关指导](http://localhost:8888/notebooks/Help_Viewer_Python/TensorFlow/TF2/Guide/Keras/01.Create_a_Model.ipynb)；
```python
inputs = keras.Input(shape=(64,))
x = layers.Dense(16, activation="relu")(inputs)
outputs = layers.Dense(4, activation="softmax")(x)
model = tf.keras.Model(inputs=inputs, outputs=outputs)
```
2. 继承`Model`类，并在`__init__()`方法中定义网络的层，在`call`方法中定义网络向前传播的方式；此外，在`call`方法中还可以设置`training`参数，用以指明模型在训练和推断时执行的不同的操作；更多关于通过类继承创建模型的方法，请参见[相关指导](http://localhost:8888/notebooks/Help_Viewer_Python/TensorFlow/TF2/Guide/Keras/01.Create_a_Model.ipynb)；

```python
class Model(keras.Model):
    def __init__(self):
        super(MyModel, self).__init__()
        self.dense1 = layers.Dense(4, activation=tf.nn.relu)
        self.dense2 = layers.Dense(5, activation=tf.nn.softmax)
        self.dropout = layers.Dropout(0.5)

    def call(self, inputs, training=False):
        x = self.dense1(inputs)
        if training:
            x = self.dropout(x, training=training)
        return self.dense2(x)

```


**File**:  \keras\engine\training.py

**Type**:           type

**Subclasses**:     Sequential, Model, \_LinearModel, LinearModel, WideDeepModel

## keras.Model.compile()
```python
model.compile(
    optimizer='rmsprop',
    loss=None,
    metrics=None,
    loss_weights=None,
    sample_weight_mode=None,
    weighted_metrics=None,
    **kwargs,
)
```
为模型进行训练相关配置

**Args**

- optimizer: 接受表示优化器的字符串，或`keras.optimizers`模块中的优化器实例；

- loss: 接受代表目标函数名称的字符串，或自定义的目标函数，或`.keras.losses.Loss`实例；若模型含有多个输出，可以传递一个字典或列表，以对每个输出使用不同的损失；最终模型的损失值会是所有单个损失的总和；
    - 对于自定义目标函数，其应满足范式`loss = fn(y_true, y_pred)`，其中`y_true`除在函数是稀疏分类交叉熵损失时形状为`[batch_size, d0, .. dN-1]`，否则形状应为`[batch_size, d0, .. dN]`；`y_pred`形状也应为`[batch_size, d0, .. dN]`；
    - 对于`Loss`实例，若其参数`reduction`被指明为 None，则返回的张量形状为`[batch_size, d0, .. dN-1]`，即对每个样本或每个时间步的损失值；否则返回标量张量；

- metrics: 应为一个列表，其每个元素可以是代表表示度量的字符串，或自定义函数，或`keras.metrics.Metric`实例；对于多输出模型，可以通过传递一个字典为不同输出指定不同度量，例如`metrics={'output_a': 'accuracy', 'output_b': ['accuracy', 'mse']}`，或通过传递一个列表进行指定，例如`metrics=[['accuracy'], ['accuracy', 'mse']]`或`metrics=['accuracy', ['accuracy', 'mse']]`；
    - 对于自定义函数，其应满足范式`result = fn(y_true, y_pred)`
    - 对于字符串形式，例如`'accuracy'`或`'acc'`，会基于模型使用的损失函数及输出形状，将其视为`keras.metrics`模块中的`BinaryAccuracy`、`CategoricalAccuracy`、`SparseCategoricalAccuracy`中的一种；对于`'crossentropy'`、`'ce'`类似；

- loss_weights: 为模型不同输出的损失加权的列表或字典，其每个元素应为标量浮点型对象；模型最终的损失则为这些损失的加权和；对于列表，损失和权重顺序是一一对应的；对于字典，其键值应为输出的名称；

- sample_weight_mode: 如果需要对每个时间步采样进行的加权 (二维加权)，可以将其设置为`"temporal"`；None 默认对每个样本进行加权 (一维加权)；如果模型有多个输出，可以传递字典或由模式组成的列表，以对每个输出指定不同的`sample_weight_mode`；

- weighted_metrics: 由`fit()`方法所接收的`sample_weight`或`class_weight`参数所评估和加权的指标列表；

- \*\*kwargs: 其他附加参数，若需要即时执行，可传递`run_eagerly=True`.

**Type**:      function

In [None]:
keras.Model.compile()

## keras.Model.fit()
```python
model.fit(
    x=None, y=None,
    batch_size=None,
    epochs=1,
    verbose=1,
    callbacks=None,
    validation_split=0.0,
    validation_data=None,
    shuffle=True,
    class_weight=None,
    sample_weight=None,
    initial_epoch=0,
    steps_per_epoch=None,
    validation_steps=None,
    validation_batch_size=None,
    validation_freq=1,
    max_queue_size=10,
    workers=1,
    use_multiprocessing=False
)
```
对模型进行训练和验证，并返回一个`History`的对象，其`History.history`属性记录了各 epoch 下的训练和验证的损失值和度量值；
   
**Args**:
- x: 输入数据，其可以是:
    - Numpy 数组或类数组；对于多输入可以是数组组成的列表
    - TF 张量；对于多输入可以是张量组成的列表
    - 若模型指定了输入的名称，可以是以名称为键值的字典
    - `tf.data`的数据集，其应返回`(inputs, targets)`或`(inputs, targets, sample_weights)`
    - 一个生成器，或`keras.utils.Sequence`，其应返回`(inputs, targets)`或`(inputs, targets, sample_weights)`<br>
 
 一种常见的模式是将`tf.data.Dataset`、生成器或`tf.keras.utils.Sequence`传递给`x`，这种方式不仅可以生成输入数据，也会生成输出数据和样本权重；Keras 要求这些类迭代器对象的输出是明确的，迭代器返回的应是长度为 1、2 或 3 的元组，其中第二个和第三个可省略元素将分别对应`y`和`sample_weight`；所返回和任何类型数据均被视为输入数据；迭代器生成的字典的外部结构也应遵循上述关于元组的约定，例如`({"x0": x0， "x1": x1}， y)`；keras 无法从字典的单个键中提取输入输出和权重；需要注意的是，`x`不支持`namedtuple`数据类型，这是因为这种数据类型既是有序数据类型，也是一个映射型数据类型，进而给定一个`namedtuple("example_tuple", ["y", "x"])`形式的 namedtuple，对其解析时很难确定是否要颠倒数据排列的顺序；对于`namedtuple("other_tuple", ["x", "y", "z"])`形式的 namedtuple，很难断言应将其视为单个输入数据，还是应将其视为输入输出和权重的组合形式；


- y: 目标数据，其类型应与`x`一致，当`x`为`Dataset`、生成器或`keras.utils.Sequence`实例时不需要指定`y`


- batch_size: None 时为 32，若数据为`Dataset`、生成器或`keras.utils.Sequence`实例，则不需要指定`batch_size`，因为这些对象会自动生成 batch


- epochs: 默认为 1，训练时遍历`range(initial_epoch, epochs)`


- verbose: 可以是 {0, 1, 2}，默认 1；0 表示不显示任何信息；1 表示显示进度条；2 表示每个 epoch 显示分割线；需要注意的是，将进度条记录到日志文件中通常不会很有帮助，进而在不以交互方式运行时建议使用模式 2；


- callbacks: `keras.callbacks.Callback`实例组成的列表；训练时使用的 callback，详见`tf.keras.callbacks`


- validation_split: (0, 1) 间的浮点数，用于指明从训练集中分割出的验证集占比；分割操作是在乱序之前从提供的训练集最后若干样本中选择的；当`x`为`Dataset`、生成器或`keras.utils.Sequence`实例时不支持此参数


- validation_data: 即验证集；该参数会覆盖`validation_split`；该参数可以是`(x_val, y_val)`形式的 Numpy 数组或张量，或`(x_val, y_val, val_sample_weights)`形式的 Numpy 数组，或数据集形式；对于前两种情况，必须指明`batch_size`；对于最后一种情况，必须指明`validation_steps`；需要注意的是`validation_data`不支持字典、生成器、`keras.utils.Sequence`实例类型；


- shuffle: 可以是布尔值，用于指明是否在每个 epoch 之前对训练数据进行乱序；或为`'batch'`；`x`是生成器时则忽略此参数；`'batch'`是处理 HDF5 数据的一个特殊选项；当`steps_per_epoch`不为 None 时不起作用


- class_weight: 应为字典形式，其键值为类别的索引，取值为训练期间计算损失函数时不同类别的权重值


- sample_weight: 训练样本的加权值所组成的 Numpy 数组；对于非时序数据，默认将形状为`(samples,)`的数组中的权重值按索引对应至样本；对于时序数据，默认将形状为`(samples, sequence_length)`的数组中的权重值按索引对应至每个样本的每个时间步的输入；使用时序数据时，须确保`compile()`函数中指明了`sample_weight_mode="temporal"`；当`x`为`Dataset`、生成器或`keras.utils.Sequence`实例时不支持此参数；


- initial_epoch: 起始 epoch


- steps_per_epoch: 可以是整型或 None；None 时默认取总样本数与 batch 大小的商，当无法以这种方式确定时取 1；若`x`为`tf.data`数据集且`steps_per_epoch`为 None，则默认所有数据在一个 epoch 内使用；当使用无限重复的数据集时，必须指定此参数；此参数不支持输入为数组的情况


- validation_steps: 仅在为`validation_data`指定了`tf.data`的数据集时起作用；表示每每次验证执行的步数，即使用的 batch 数量；None 时会在一个 epoch 中使用所有的验证数据；若指明了`validation_steps`且一个 epoch 中仅使用到了验证集的部分数据，则每次进行验证时仍使用同样的一部分数据


- validation_batch_size: 整型或 None；默认与`batch_size`相等；当数据为`Dataset`、生成器或`keras.utils.Sequence`实例时不支持此参数；


- validation_freq: 可以是整型或`collections_abc.Container`实例，如列表、元祖等；只在提供了验证集时起作用；若为整型，则代表进行验证的频率；若为`Container`实例，则代表进行验证的 epoch 的序号，例如`validation_freq=[1, 2, 10]`代表在第 1、2、10 个 epoch 进行验证


- max_queue_size: 整型，仅适用于输入为生成器或`keras.utils.Sequence`的情况，用于指定输入的最大生成队列长度；默认为 10；


- workers: 整型，仅适用于输入为生成器或`keras.utils.Sequence`的情况；使用基于进程 (process-based) 的线程 (threading) 时要启动的最大进程数；默认为 1；被指定为 0 时会在主线程上执行生成器；


- use_multiprocessing: 布尔型，仅适用于输入为生成器或`keras.utils.Sequence`的情况；默认为 False；True 时使用基于进程的线程；由于其实现依赖于多处理，所以请勿将无法 pickle 的参数传递给生成器，因为无法 pickle 的参数很难传递给子进程

**Type**:      function

## keras.Model.evaluate()
```python
keras.Model.evaluate(
    x=None,
    y=None,
    batch_size=None,
    verbose=1,
    sample_weight=None,
    steps=None,
    callbacks=None,
    max_queue_size=10,
    workers=1,
    use_multiprocessing=False,
    return_dict=False,
)
```
在测试集上计算模型的损失和度量值

**Args**
- x: 输入数据，其可以是:
    - Numpy 数组或类数组；对于多输入可以是数组组成的列表
    - TF 张量；对于多输入可以是张量组成的列表
    - 若模型指定了输入的名称，可以是以名称为键值的字典
    - `tf.data.Dataset`实例；
    - 一个生成器，或`keras.utils.Sequence`；

- y: 目标数据，其类型应与`x`一致，当`x`为`Dataset`、生成器或`keras.utils.Sequence`实例时不需要指定`y`

- batch_size: None 时为 32，若数据为`Dataset`、生成器或`keras.utils.Sequence`实例，则不需要指定`batch_size`，因为这些对象会自动生成 batch

- verbose: 可以是 {0, 1, 2}，默认 1；0 表示不显示任何信息；1 表示显示进度条；

- sample_weight: 测试样本的加权值所组成的 Numpy 数组；对于非时序数据，默认将形状为`(samples,)`的数组中的权重值按索引对应至样本；对于时序数据，默认将形状为`(samples, sequence_length)`的数组中的权重值按索引对应至每个样本的每个时间步的输入；使用时序数据时，须确保`compile()`函数中指明了`sample_weight_mode="temporal"`；当`x`为`Dataset`、生成器或`keras.utils.Sequence`实例时不支持此参数；

- steps: 整型或 None，测试的总步数；默认 None 时忽略此参数，此时若`x`为`Dataset`，则在整个测试集上进行测试；此参数不支持数组的输入

- callbacks: `keras.callbacks.Callback`实例组成的列表；评估时使用的 callback，详见`tf.keras.callbacks`

- max_queue_size: 整型，仅适用于输入为生成器或`keras.utils.Sequence`的情况，用于指定输入的最大生成队列长度；默认为 10；

- workers: 整型，仅适用于输入为生成器或`keras.utils.Sequence`的情况；使用基于进程 (process-based) 的线程 (threading) 时要启动的最大进程数；默认为 1；被指定为 0 时会在主线程上执行生成器；

- use_multiprocessing: 布尔型，仅适用于输入为生成器或`keras.utils.Sequence`的情况；默认为 False；True 时使用基于进程的线程；由于其实现依赖于多处理，所以请勿将无法 pickle 的参数传递给生成器，因为无法 pickle 的参数很难传递给子进程

- return_dict: True 时将损失和度量以字典的形式返回，键为相应的名称；False 时则返回列表；默认 False


Returns: Scalar test loss (if the model has a single output and no metrics) or list of scalars (if the model has multiple outputs and/or metrics). The attribute `model.metrics_names` will give you the display labels for the scalar outputs.

**Type**:      function