##### Copyright 2020 The TensorFlow Authors.

In [None]:
#@title Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
# https://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.

# 权重聚类综合指南

<table class="tfo-notebook-buttons" align="left">
  <td>     <a target="_blank" href="https://tensorflow.google.cn/model_optimization/guide/clustering/clustering_comprehensive_guide"><img src="https://tensorflow.google.cn/images/tf_logo_32px.png">在 TensorFlow.org 上查看</a>
</td>
  <td><a target="_blank" href="https://colab.research.google.com/github/tensorflow/docs-l10n/blob/master/site/zh-cn/model_optimization/guide/clustering/clustering_comprehensive_guide.ipynb"><img src="https://tensorflow.google.cn/images/colab_logo_32px.png">在 Google Colab 中运行 </a></td>
  <td><a target="_blank" href="https://github.com/tensorflow/docs-l10n/blob/master/site/zh-cn/model_optimization/guide/clustering/clustering_comprehensive_guide.ipynb"><img src="https://tensorflow.google.cn/images/GitHub-Mark-32px.png">在 GitHub 上查看源代码</a></td>
  <td><a href="https://storage.googleapis.com/tensorflow_docs/docs-l10n/site/zh-cn/model_optimization/guide/clustering/clustering_comprehensive_guide.ipynb"><img src="https://tensorflow.google.cn/images/download_logo_32px.png"> 下载笔记本</a></td>
</table>

欢迎阅读 TensorFlow Model Optimization Toolkit 中*权重聚类*的综合指南。

本页面记录了各种用例，并展示了如何将 API 用于每种用例​​。了解需要哪些 API 后，可在 [API 文档](https://tensorflow.google.cn/model_optimization/api_docs/python/tfmot/clustering)中找到参数和底层详细信息：

- 如果要查看权重聚类的好处以及支持的功能，请查看[概述](https://tensorflow.google.cn/model_optimization/guide/clustering)。
- 有关单个端到端示例，请参阅[权重聚类示例](https://tensorflow.google.cn/model_optimization/guide/clustering/clustering_example)。

本指南涵盖了以下用例：

- 定义聚类模型。
- 为聚类模型设置检查点和进行反序列化。
- 提高聚类模型的准确率。
- 仅对于部署而言，您必须采取措施才能看到压缩的好处。


## 设置


In [None]:
! pip install -q tensorflow-model-optimization

import tensorflow as tf
import numpy as np
import tempfile
import os
import tensorflow_model_optimization as tfmot

input_dim = 20
output_dim = 20
x_train = np.random.randn(1, input_dim).astype(np.float32)
y_train = tf.keras.utils.to_categorical(np.random.randn(1), num_classes=output_dim)

def setup_model():
  model = tf.keras.Sequential([
      tf.keras.layers.Dense(input_dim, input_shape=[input_dim]),
      tf.keras.layers.Flatten()
  ])
  return model

def train_model(model):
  model.compile(
      loss=tf.keras.losses.categorical_crossentropy,
      optimizer='adam',
      metrics=['accuracy']
  )
  model.summary()
  model.fit(x_train, y_train)
  return model

def save_model_weights(model):
  _, pretrained_weights = tempfile.mkstemp('.h5')
  model.save_weights(pretrained_weights)
  return pretrained_weights

def setup_pretrained_weights():
  model= setup_model()
  model = train_model(model)
  pretrained_weights = save_model_weights(model)
  return pretrained_weights

def setup_pretrained_model():
  model = setup_model()
  pretrained_weights = setup_pretrained_weights()
  model.load_weights(pretrained_weights)
  return model

def save_model_file(model):
  _, keras_file = tempfile.mkstemp('.h5') 
  model.save(keras_file, include_optimizer=False)
  return keras_file

def get_gzipped_model_size(model):
  # It returns the size of the gzipped model in bytes.
  import os
  import zipfile

  keras_file = save_model_file(model)

  _, zipped_file = tempfile.mkstemp('.zip')
  with zipfile.ZipFile(zipped_file, 'w', compression=zipfile.ZIP_DEFLATED) as f:
    f.write(keras_file)
  return os.path.getsize(zipped_file)

setup_model()
pretrained_weights = setup_pretrained_weights()

## 定义聚类模型


### 聚类整个模型（序贯模型和函数式模型）

提高模型准确率的**提示**：

- 您必须将具有可接受准确率的预训练模型传递给此 API。使用聚类从头开始训练模型会导致准确率不佳。
- 在某些情况下，聚类某些层会对模型准确率造成不利影响。查看“聚类某些层”来了解如何跳过聚类对准确率影响最大的层。

要聚类所有层，请将 `tfmot.clustering.keras.cluster_weights` 应用于模型。


In [None]:
import tensorflow_model_optimization as tfmot

cluster_weights = tfmot.clustering.keras.cluster_weights
CentroidInitialization = tfmot.clustering.keras.CentroidInitialization

clustering_params = {
  'number_of_clusters': 3,
  'cluster_centroids_init': CentroidInitialization.KMEANS_PLUS_PLUS
}

model = setup_model()
model.load_weights(pretrained_weights)

clustered_model = cluster_weights(model, **clustering_params)

clustered_model.summary()

### 聚类某些层（序贯模型和函数式模型）


提高模型准确率的**提示**：

- 您必须将具有可接受准确率的预训练模型传递给此 API。使用聚类从头开始训练模型会导致准确率不佳。
- 与前面的层相反，使用更多冗余参数（例如 `tf.keras.layers.Dense` 和 `tf.keras.layers.Conv2D`）来聚类后面的层。
- 在微调期间，先冻结前面的层，然后再冻结聚类的层。将冻结层数视为超参数。根据经验，冻结大多数前面的层对于当前的聚类 API 较为理想。
- 避免聚类关键层（例如注意力机制）。

**更多提示**：`tfmot.clustering.keras.cluster_weights` API 文档提供了有关如何更改每层的聚类配置的详细信息。

In [None]:
# Create a base model
base_model = setup_model()
base_model.load_weights(pretrained_weights)

# Helper function uses `cluster_weights` to make only 
# the Dense layers train with clustering
def apply_clustering_to_dense(layer):
  if isinstance(layer, tf.keras.layers.Dense):
    return cluster_weights(layer, **clustering_params)
  return layer

# Use `tf.keras.models.clone_model` to apply `apply_clustering_to_dense` 
# to the layers of the model.
clustered_model = tf.keras.models.clone_model(
    base_model,
    clone_function=apply_clustering_to_dense,
)

clustered_model.summary()

### 按通道聚类卷积层

聚类模型可以传递给进一步的优化，例如[训练后量化](https://tensorflow.google.cn/lite/performance/post_training_quantization)。如果量化是按通道进行的，那么模型也应该按通道进行聚类。这可以提高聚类和量化模型的准确性。

**注：**只有 Conv2D 层按通道进行聚类

要按通道进行聚类，参数 `cluster_per_channel` 应设置为 `True`。可以为某些层或整个模型设置该参数。

**提示：**

- 如果某个模型要进一步量化，可以考虑使用[聚类保留 QAT 技术](https://tensorflow.google.cn/model_optimization/guide/combine/collaborative_optimization)。

- 按通道应用聚类之前，可以对模型进行剪枝。当参数 `preserve_sparsity` 设置为 `True` 时，按通道进行聚类期间会保留稀疏性。请注意，在这种情况下，应使用[稀疏性和聚类保留 QAT 技术](https://tensorflow.google.cn/model_optimization/guide/combine/collaborative_optimization)。

### 聚类自定义 Keras 层或指定要聚类的层的权重

`tfmot.clustering.keras.ClusterableLayer` 适用于两个用例：

1. 聚类原生不支持的任何层，包括自定义 Keras 层。
2. 指定要聚类所支持层的哪些权重。

例如，API 默认只聚类 `Dense` 层的内核。下面的示例显示了如何修改它以同时聚类偏差。注意，从 Keras 层派生时，需要重写函数 `get_clusterable_weights`，您可以在其中指定要聚类的可训练变量的名称和可训练变量本身。例如，如果您返回一个空列表 []，则没有权重是可聚类的。

**常犯错误**：聚类偏差通常会严重影响模型准确率。

In [None]:
class MyDenseLayer(tf.keras.layers.Dense, tfmot.clustering.keras.ClusterableLayer):

  def get_clusterable_weights(self):
   # Cluster kernel and bias. This is just an example, clustering
   # bias usually hurts model accuracy.
   return [('kernel', self.kernel), ('bias', self.bias)]

# Use `cluster_weights` to make the `MyDenseLayer` layer train with clustering as usual.
model_for_clustering = tf.keras.Sequential([
  tfmot.clustering.keras.cluster_weights(MyDenseLayer(20, input_shape=[input_dim]), **clustering_params),
  tf.keras.layers.Flatten()
])

model_for_clustering.summary()

您还可以使用 `tfmot.clustering.keras.ClusterableLayer` 来聚类 Keras 自定义层。为此，您可以像往常一样扩展 `tf.keras.Layer` 并实现 `__init__`、`call` 和 `build` 函数，但您还需要扩展 `clusterable_layer.ClusterableLayer` 类并实现：

1. `get_clusterable_weights`，可在其中指定要聚类的权重内核，如上面所示。
2. `get_clusterable_algorithm`，可在其中指定权重张量的聚类算法。这是因为您需要指定如何针对聚类确定自定义层权重的形状。返回的聚类算法类应当从 `clustering_algorithm.ClusteringAlgorithm` 类派生，并且函数 `get_pulling_indices` 应当被覆盖。可以在[此处](https://github.com/tensorflow/model-optimization/blob/18e87d262e536c9a742aef700880e71b47a7f768/tensorflow_model_optimization/python/core/clustering/keras/clustering_algorithm.py#L62)找到此函数的示例，该示例支持 1D、2D 和 3D 秩的权重。

可以在[此处](https://github.com/tensorflow/model-optimization/blob/master/tensorflow_model_optimization/python/core/clustering/keras/mnist_clusterable_layer_test.py)找到此用例的示例。

## 为聚类模型设置检查点和进行反序列化

**您的用例**：仅 HDF5 模型格式需要此代码（HDF5 权重或其他格式不需要）。

In [None]:
# Define the model.
base_model = setup_model()
base_model.load_weights(pretrained_weights)
clustered_model = cluster_weights(base_model, **clustering_params)

# Save or checkpoint the model.
_, keras_model_file = tempfile.mkstemp('.h5')
clustered_model.save(keras_model_file, include_optimizer=True)

# `cluster_scope` is needed for deserializing HDF5 models.
with tfmot.clustering.keras.cluster_scope():
  loaded_model = tf.keras.models.load_model(keras_model_file)

loaded_model.summary()

## 提高聚类模型的准确率

对于您的特定用例，您可以考虑以下提示：

- 形心初始化在最终优化的模型准确率中起到关键作用。通常，kmeans++ 线性初始化优于线性、密度和随机初始化。不使用 kmeans++ 时，线性初始化往往优于密度和随机初始化，因为它不会丢失较大的权重。但是，对于在具有双峰分布的权重上使用极少簇的情况，已经观察到密度初始化可以提供更出色的准确率。

- 微调聚类模型时，将学习率设置为低于训练中使用的学习率。

- 有关提高模型准确率的总体思路，请在“定义聚类模型”下查找您的用例对应的提示。

## 部署

### 导出大小经过压缩的模型

**常见误区**：`strip_clustering` 和应用标准压缩算法（例如通过 gzip）对于看到聚类压缩的好处必不可少。

In [None]:
model = setup_model()
clustered_model = cluster_weights(model, **clustering_params)

clustered_model.compile(
    loss=tf.keras.losses.categorical_crossentropy,
    optimizer='adam',
    metrics=['accuracy']
)

clustered_model.fit(
    x_train,
    y_train
)

final_model = tfmot.clustering.keras.strip_clustering(clustered_model)

print("final model")
final_model.summary()

print("\n")
print("Size of gzipped clustered model without stripping: %.2f bytes" 
      % (get_gzipped_model_size(clustered_model)))
print("Size of gzipped clustered model with stripping: %.2f bytes" 
      % (get_gzipped_model_size(final_model)))