In [None]:
import tensorflow as tf
from d2l import tensorflow as d2l


def net():
    return tf.keras.models.Sequential([
        # Aqui, usamos uma janela maior de 11 x 11 para capturar objetos.
        # Ao mesmo tempo, usamos um passo de 4 para reduzir significativamente
        # a altura e a largura da saída.
        # Aqui, o número de canais de saída é muito maior do que no LeNet
        tf.keras.layers.Conv2D(filters=96, kernel_size=11, strides=4,
                               activation='relu'),
        tf.keras.layers.MaxPool2D(pool_size=3, strides=2),
        # Torne a janela de convolução menor, defina o preenchimento
        # para 2 para altura e largura consistentes na entrada e
        # saída e aumente o número de canais de saída
        tf.keras.layers.Conv2D(filters=256, kernel_size=5, padding='same',
                               activation='relu'),
        tf.keras.layers.MaxPool2D(pool_size=3, strides=2),
        # Use três camadas convolucionais sucessivas e uma janela de convolução menor.
        # Exceto para a camada convolucional final, o número de canais de saída
        # é aumentado ainda mais. Camadas de pooling não são usadas para reduzir a
        # altura e largura de entrada após as duas primeiras camadas convolucionais
        tf.keras.layers.Conv2D(filters=384, kernel_size=3, padding='same',
                               activation='relu'),
        tf.keras.layers.Conv2D(filters=384, kernel_size=3, padding='same',
                               activation='relu'),
        tf.keras.layers.Conv2D(filters=256, kernel_size=3, padding='same',
                               activation='relu'),
        tf.keras.layers.MaxPool2D(pool_size=3, strides=2),
        tf.keras.layers.Flatten(),
        # Aqui, o número de saídas da camada totalmente conectada é várias vezes
        # maior do que no LeNet. Use a camada de eliminação para mitigar overfitting
        tf.keras.layers.Dense(4096, activation='relu'),
        tf.keras.layers.Dropout(0.5),
        tf.keras.layers.Dense(4096, activation='relu'),
        tf.keras.layers.Dropout(0.5),
        # Camada de saída. Como estamos usando o Fashion-MNIST, o número de
        # classes é 10, em vez de 1000 como no papel
        tf.keras.layers.Dense(10)
    ])


In [None]:
X = tf.random.uniform((1, 224, 224, 1))
for layer in net().layers:
    X = layer(X)
    print(layer.__class__.__name__, 'output shape:\t', X.shape)

In [None]:
batch_size = 128
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size, resize=224)

In [None]:
lr, num_epochs = 0.01, 10
d2l.train_ch6(net, train_iter, test_iter, num_epochs, lr, d2l.try_gpu())