# 多模式与多任务

In [1]:
import numpy as np

import autokeras as ak
import tensorflow as tf

在本教程中，我们将使用 AutoModel API 来展示如何处理多模态数据和多任务。

In [None]:
gpus = tf.config.list_physical_devices("GPU")

if gpus:
   
    gpu0 = gpus[1] #如果有多个GPU，仅使用第0个GPU
    tf.config.experimental.set_memory_growth(gpu0, True) #设置GPU显存用量按需使用
    # 或者也可以设置GPU显存为固定使用量(例如：4G)
    #tf.config.experimental.set_virtual_device_configuration(gpu0,
    #    [tf.config.experimental.VirtualDeviceConfiguration(memory_limit=4096)]) 
    tf.config.set_visible_devices([gpu0],"GPU") 

## 什么是多模态？

多模态数据意味着每个数据实例都有多种形式的信息。 例如，可以将照片另存为图像。 除了图像，它也可能有它被取的时间和地点作为其属性，可以表示为结构化数据。

## 什么是多任务？

多任务这里我们指的是我们要预测具有相同输入特征的多个目标。 例如，我们不仅要根据其内容对图像进行分类，还要将其质量回归为介于 0 和 1 之间的浮点数。

下图显示了多模态和多任务神经网络模型的示例。

![](https://tva1.sinaimg.cn/large/008i3skNly1gs9p2h6ou7j30la0fa75a.jpg)

它有两个输入图像和结构化数据。 每个图像都与结构化数据中的一组属性相关联。 从这些数据中，我们试图同时预测分类标签和回归值。

## 数据准备

为了说明我们的想法，我们生成一些随机图像和结构化数据作为多模态数据。

In [3]:
num_instances = 100
# Generate image data.
image_data = np.random.rand(num_instances, 32, 32, 3).astype(np.float32)
# Generate structured data.
structured_data = np.random.rand(num_instances, 20).astype(np.float32)

In [4]:
image_data.shape

(100, 32, 32, 3)

我们还为分类和回归生成了一些多任务目标。

In [5]:
# Generate regression targets.
regression_target = np.random.rand(num_instances, 1).astype(np.float32)
# Generate classification labels of five classes.
classification_target = np.random.randint(5, size=num_instances)

In [6]:
classification_target.shape

(100,)

## 构建和训练模型

然后我们用 AutoModel 初始化多模态多任务模型。 由于这只是一个演示，我们使用了少量的 max_trials 和 epochs。

In [7]:
# Initialize the multi with multiple inputs and outputs.
model = ak.AutoModel(
    inputs=[ak.ImageInput(), ak.StructuredDataInput()],
    outputs=[
        ak.RegressionHead(metrics=["mae"]),
        ak.ClassificationHead(loss="categorical_crossentropy", metrics=["accuracy"]),
    ],
    overwrite=True,
    max_trials=2,
)

In [None]:
# Fit the model with prepared data.
model.fit(
    [image_data, structured_data],
    [regression_target, classification_target],
    epochs=3,
)

Trial 2 Complete [00h 00m 14s]
val_loss: 4.782716274261475

Best val_loss So Far: 1.6710597276687622
Total elapsed time: 00h 00m 56s
INFO:tensorflow:Oracle triggered exit
Epoch 1/3
Epoch 2/3
Epoch 3/3
