# Tutorial de TensorFlow com Keras: Conceitos e APIs Principais

Este tutorial oferece uma visão geral concisa mas completa do TensorFlow com Keras, uma das combinações de bibliotecas mais populares para aprendizagem de máquina e redes neurais. Vamos explorar os componentes principais, APIs e exemplos práticos para tarefas comuns.

## Conteúdo
1. [Introdução ao TensorFlow e Keras](#1-introdução-ao-tensorflow-e-keras)
2. [Tensores: O Bloco Fundamental](#2-tensores-o-bloco-fundamental)
3. [API Keras: Visão Geral](#3-api-keras-visão-geral)
4. [Construindo Modelos](#4-construindo-modelos)
5. [Camadas e Ativações](#5-camadas-e-ativações)
6. [Otimizadores e Funções de Perda](#6-otimizadores-e-funções-de-perda)
7. [Carregamento e Processamento de Dados](#7-carregamento-e-processamento-de-dados)
8. [Treinamento e Avaliação de Modelos](#8-treinamento-e-avaliação-de-modelos)
9. [Callbacks e TensorBoard](#9-callbacks-e-tensorboard)
10. [Salvando e Carregando Modelos](#10-salvando-e-carregando-modelos)
11. [Redes Neurais Convolucionais (CNNs)](#11-redes-neurais-convolucionais-cnns)
12. [Redes Neurais Recorrentes (RNNs)](#12-redes-neurais-recorrentes-rnns)
13. [Processamento de Linguagem Natural](#13-processamento-de-linguagem-natural)
14. [Transferência de aprendizagem](#14-transferência-de-aprendizagem)
15. [TensorFlow para Produção](#15-tensorflow-para-produção)
16. [Recursos Adicionais](#16-recursos-adicionais)

## 1. Introdução ao TensorFlow e Keras

**TensorFlow** é uma biblioteca de código aberto desenvolvida pelo Google para computação numérica e aprendizagem de máquina. **Keras** é uma API de alto nível que roda sobre o TensorFlow, simplificando a construção de redes neurais.

Principais características:

- **TensorFlow**:
  - Computação de tensores com suporte a GPU e TPU
  - Grafos computacionais para otimização
  - Ecossistema rico para pesquisa e produção
  - TensorFlow 2.x com execução eager (imperativa) por padrão

- **Keras**:
  - API de alto nível, fácil de usar
  - Desenvolvimento rápido de protótipos
  - Suporte para diferentes tipos de redes neurais
  - Integrado ao TensorFlow desde a versão 2.0

In [None]:
# Instalação do TensorFlow (descomente se necessário)
# !pip install tensorflow

# Importações básicas
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers, models, optimizers, losses, metrics, datasets
import numpy as np

# Verificar versão e disponibilidade de GPU
print(f"TensorFlow versão: {tf.__version__}")
print(f"Keras versão: {keras.__version__}")
print(f"GPUs disponíveis: {tf.config.list_physical_devices('GPU')}")

# Configuração para usar GPU se disponível
gpus = tf.config.list_physical_devices('GPU')
if gpus:
    try:
        # Permitir crescimento de memória conforme necessário
        for gpu in gpus:
            tf.config.experimental.set_memory_growth(gpu, True)
        print("Usando GPU com alocação de memória dinâmica")
    except RuntimeError as e:
        print(f"Erro na configuração de GPU: {e}")

## 2. Tensores: O Bloco Fundamental

Assim como no PyTorch, os tensores são as estruturas de dados fundamentais no TensorFlow:

In [None]:
# Criando tensores
# 1. A partir de arrays NumPy ou listas Python
x = tf.constant([[1, 2, 3], [4, 5, 6]])
print(f"Tensor de lista: \n{x}\n")

# 2. Tensores preenchidos
zeros = tf.zeros((2, 3))  # Tensor 2x3 de zeros
ones = tf.ones((2, 3))    # Tensor 2x3 de uns
rand = tf.random.uniform((2, 3))  # Tensor 2x3 com valores aleatórios entre 0 e 1
print(f"Zeros: \n{zeros}\n")
print(f"Ones: \n{ones}\n")
print(f"Random: \n{rand}\n")

# 3. Tensores com valores específicos
range_tensor = tf.range(0, 10, 2)  # Valores de 0 a 10 com passo 2
linspace = tf.linspace(0.0, 10.0, 5)  # 5 valores igualmente espaçados entre 0 e 10
print(f"Range: {range_tensor}")
print(f"Linspace: {linspace}\n")

# Propriedades dos tensores
print(f"Forma (shape): {x.shape}")
print(f"Tipo de dados: {x.dtype}")
print(f"Dispositivo: {x.device}\n")

# Operações com tensores
a = tf.constant([1, 2, 3])
b = tf.constant([4, 5, 6])

# Operações aritméticas
print(f"a + b: {a + b}")
print(f"a * b: {a * b}")
print(f"Produto escalar: {tf.tensordot(a, b, axes=1)}\n")

# Redimensionamento
c = tf.constant([[1, 2, 3], [4, 5, 6]])
print(f"Original: \n{c}")
print(f"Reshape: \n{tf.reshape(c, (3, 2))}")

# Operações de álgebra linear
matrix1 = tf.constant([[1, 2], [3, 4]])
matrix2 = tf.constant([[5, 6], [7, 8]])
matrix_product = tf.matmul(matrix1, matrix2)
print(f"\nProduto matricial: \n{matrix_product}")

# Operações de redução
print(f"\nSoma de todos os elementos: {tf.reduce_sum(c)}")
print(f"Média por linha: {tf.reduce_mean(c, axis=1)}")
print(f"Máximo por coluna: {tf.reduce_max(c, axis=0)}")

## 3. API Keras: Visão Geral

Keras é a API de alto nível do TensorFlow para construir e treinar modelos de aprendizagem profundo. Existem três maneiras principais de usar Keras:

In [None]:
# 1. API Sequencial (para redes com fluxo linear)
sequential_model = keras.Sequential([
    layers.Dense(64, activation='relu', input_shape=(10,)),
    layers.Dense(32, activation='relu'),
    layers.Dense(1, activation='sigmoid')
])

print("Modelo Sequencial:")
sequential_model.summary()

# 2. API Funcional (para redes com topologias mais complexas)
inputs = keras.Input(shape=(10,))
x = layers.Dense(64, activation='relu')(inputs)
x = layers.Dense(32, activation='relu')(x)
outputs = layers.Dense(1, activation='sigmoid')(x)
functional_model = keras.Model(inputs=inputs, outputs=outputs)

print("\nModelo Funcional:")
functional_model.summary()

# 3. Subclasse de Model (para lógica personalizada)
class CustomModel(keras.Model):
    def __init__(self):
        super(CustomModel, self).__init__()
        self.dense1 = layers.Dense(64, activation='relu')
        self.dense2 = layers.Dense(32, activation='relu')
        self.dense3 = layers.Dense(1, activation='sigmoid')
        
    def call(self, inputs):
        x = self.dense1(inputs)
        x = self.dense2(x)
        return self.dense3(x)

subclass_model = CustomModel()
# Construir o modelo com uma chamada de exemplo
subclass_model.build((None, 10))

print("\nModelo por Subclasse:")
subclass_model.summary()

## 4. Construindo Modelos

Vamos explorar mais detalhadamente como construir modelos com Keras:

In [None]:
# Modelo Sequencial com mais detalhes
model = keras.Sequential()
model.add(layers.Dense(64, activation='relu', input_shape=(10,)))
model.add(layers.Dense(32, activation='relu'))
model.add(layers.Dense(16, activation='relu'))
model.add(layers.Dense(1, activation='sigmoid'))

# Compilando o modelo
model.compile(
    optimizer='adam',
    loss='binary_crossentropy',
    metrics=['accuracy']
)

print("Modelo Sequencial Detalhado:")
model.summary()

# Modelo Funcional com múltiplas entradas e saídas
# Primeira entrada e seu caminho
input_1 = keras.Input(shape=(10,), name='input_1')
x1 = layers.Dense(32, activation='relu')(input_1)

# Segunda entrada e seu caminho
input_2 = keras.Input(shape=(5,), name='input_2')
x2 = layers.Dense(16, activation='relu')(input_2)

# Concatenando as duas entradas
concat = layers.Concatenate()([x1, x2])
x = layers.Dense(32, activation='relu')(concat)

# Múltiplas saídas
output_1 = layers.Dense(1, activation='sigmoid', name='binary_output')(x)
output_2 = layers.Dense(5, activation='softmax', name='multi_output')(x)

# Criando o modelo com múltiplas entradas e saídas
multi_io_model = keras.Model(
    inputs=[input_1, input_2],
    outputs=[output_1, output_2]
)

# Compilando com múltiplas perdas e métricas
multi_io_model.compile(
    optimizer='adam',
    loss={
        'binary_output': 'binary_crossentropy',
        'multi_output': 'categorical_crossentropy'
    },
    metrics={
        'binary_output': 'accuracy',
        'multi_output': ['accuracy', 'categorical_accuracy']
    },
    loss_weights={
        'binary_output': 1.0,
        'multi_output': 0.5
    }
)

print("\nModelo com Múltiplas Entradas e Saídas:")
multi_io_model.summary()

## 5. Camadas e Ativações

O Keras oferece uma ampla variedade de camadas e funções de ativação:

In [None]:
# Principais tipos de camadas
print("Camadas Básicas:")
print("1. Dense (Totalmente Conectada)")
dense = layers.Dense(32, activation='relu', input_shape=(10,))
print(f"   {dense}")

print("\n2. Dropout (Regularização)")
dropout = layers.Dropout(0.5)
print(f"   {dropout}")

print("\n3. BatchNormalization")
batch_norm = layers.BatchNormalization()
print(f"   {batch_norm}")

print("\nCamadas Convolucionais:")
print("1. Conv2D (Convolução 2D)")
conv2d = layers.Conv2D(32, kernel_size=(3, 3), activation='relu', padding='same')
print(f"   {conv2d}")

print("\n2. MaxPooling2D")
max_pool = layers.MaxPooling2D(pool_size=(2, 2))
print(f"   {max_pool}")

print("\n3. Conv1D (para sequências)")
conv1d = layers.Conv1D(32, kernel_size=3, activation='relu')
print(f"   {conv1d}")

print("\nCamadas Recorrentes:")
print("1. SimpleRNN")
simple_rnn = layers.SimpleRNN(32, return_sequences=True)
print(f"   {simple_rnn}")

print("\n2. LSTM")
lstm = layers.LSTM(32)
print(f"   {lstm}")

print("\n3. GRU")
gru = layers.GRU(32)
print(f"   {gru}")

print("\nCamadas de Reshaping:")
print("1. Flatten")
flatten = layers.Flatten()
print(f"   {flatten}")

print("\n2. Reshape")
reshape = layers.Reshape((4, 8))
print(f"   {reshape}")

print("\nCamadas de Merge:")
print("1. Concatenate")
concat = layers.Concatenate()
print(f"   {concat}")

print("\n2. Add")
add = layers.Add()
print(f"   {add}")

print("\nFunções de Ativação:")
activations = [
    'relu', 'sigmoid', 'tanh', 'softmax', 'elu', 'selu', 'softplus', 'softsign',
    'leaky_relu', 'hard_sigmoid', 'exponential', 'linear'
]

for activation in activations:
    print(f"- {activation}")

# Exemplo de uso de diferentes ativações
activation_model = keras.Sequential([
    layers.Dense(32, activation='relu', input_shape=(10,)),
    layers.Dense(32, activation='tanh'),
    layers.Dense(10, activation='softmax')
])

# Também é possível usar a camada de Activation separadamente
separate_activation_model = keras.Sequential([
    layers.Dense(32, input_shape=(10,)),
    layers.Activation('relu'),
    layers.Dense(32),
    layers.Activation('tanh'),
    layers.Dense(10),
    layers.Activation('softmax')
])

## 6. Otimizadores e Funções de Perda

O Keras oferece vários otimizadores e funções de perda para treinar redes neurais:

In [None]:
# Otimizadores
print("Otimizadores Disponíveis:")

# 1. SGD (Stochastic Gradient Descent)
sgd = optimizers.SGD(learning_rate=0.01, momentum=0.9, nesterov=True)
print(f"1. SGD: {sgd}")

# 2. Adam (Adaptive Moment Estimation)
adam = optimizers.Adam(learning_rate=0.001, beta_1=0.9, beta_2=0.999)
print(f"2. Adam: {adam}")

# 3. RMSprop
rmsprop = optimizers.RMSprop(learning_rate=0.001, rho=0.9)
print(f"3. RMSprop: {rmsprop}")

# 4. Adagrad
adagrad = optimizers.Adagrad(learning_rate=0.01)
print(f"4. Adagrad: {adagrad}")

# 5. Adadelta
adadelta = optimizers.Adadelta(learning_rate=1.0, rho=0.95)
print(f"5. Adadelta: {adadelta}")

# 6. Adamax
adamax = optimizers.Adamax(learning_rate=0.002, beta_1=0.9, beta_2=0.999)
print(f"6. Adamax: {adamax}")

# 7. Nadam
nadam = optimizers.Nadam(learning_rate=0.002, beta_1=0.9, beta_2=0.999)
print(f"7. Nadam: {nadam}")

# Funções de Perda
print("\nFunções de Perda:")

# Para classificação
print("Para Classificação:")
print("1. binary_crossentropy - Para classificação binária")
print("2. categorical_crossentropy - Para classificação multiclasse com one-hot encoding")
print("3. sparse_categorical_crossentropy - Para classificação multiclasse com rótulos inteiros")
print("4. hinge - Para classificação com margem (SVM)")

# Para regressão
print("\nPara Regressão:")
print("1. mean_squared_error (MSE) - Erro Quadrático Médio")
print("2. mean_absolute_error (MAE) - Erro Absoluto Médio")
print("3. mean_absolute_percentage_error (MAPE) - Erro Percentual Absoluto Médio")
print("4. huber_loss - Menos sensível a outliers que MSE")

# Exemplo de uso de otimizador e função de perda
model = keras.Sequential([
    layers.Dense(32, activation='relu', input_shape=(10,)),
    layers.Dense(1, activation='sigmoid')
])

# Compilando com otimizador e função de perda
model.compile(
    optimizer=adam,  # Usando o otimizador Adam definido acima
    loss='binary_crossentropy',
    metrics=['accuracy']
)

# Também é possível usar funções de perda personalizadas
def custom_loss(y_true, y_pred):
    return tf.reduce_mean(tf.square(y_true - y_pred) * tf.exp(y_true))

# Compilando com função de perda personalizada
model.compile(
    optimizer='adam',
    loss=custom_loss,
    metrics=['accuracy']
)

## 7. Carregamento e Processamento de Dados

O TensorFlow oferece várias ferramentas para carregar e processar dados de forma eficiente:

In [None]:
# Usando tf.data.Dataset para criar pipelines de dados eficientes
# 1. Criando um dataset a partir de tensores
features = np.random.normal(size=(1000, 10)).astype(np.float32)
labels = np.random.randint(0, 2, size=(1000, 1)).astype(np.float32)

dataset = tf.data.Dataset.from_tensor_slices((features, labels))
print(f"Dataset: {dataset}")

# 2. Transformando o dataset
# Embaralhar, agrupar em batches e pré-buscar
batch_size = 32
dataset = dataset.shuffle(buffer_size=1000)
dataset = dataset.batch(batch_size)
dataset = dataset.prefetch(buffer_size=tf.data.AUTOTUNE)
print(f"Dataset transformado: {dataset}")

# 3. Iterando sobre o dataset
for features_batch, labels_batch in dataset.take(2):  # Pegando apenas 2 batches para exemplo
    print(f"Batch de features: {features_batch.shape}")
    print(f"Batch de labels: {labels_batch.shape}")

# 4. Aplicando transformações aos dados
def preprocess_data(features, label):
    # Normalização
    features = (features - tf.reduce_mean(features)) / tf.math.reduce_std(features)
    # Adicionando ruído para data augmentation
    features = features + tf.random.normal(shape=tf.shape(features), stddev=0.1)
    return features, label

transformed_dataset = dataset.map(preprocess_data)

# 5. Dividindo em conjuntos de treino e validação
train_size = int(0.8 * 1000)
train_dataset = tf.data.Dataset.from_tensor_slices((features[:train_size], labels[:train_size]))
val_dataset = tf.data.Dataset.from_tensor_slices((features[train_size:], labels[train_size:]))

# Preparando para treinamento
train_dataset = train_dataset.shuffle(buffer_size=train_size).batch(batch_size).prefetch(tf.data.AUTOTUNE)
val_dataset = val_dataset.batch(batch_size).prefetch(tf.data.AUTOTUNE)

print(f"\nDataset de treino: {train_dataset}")
print(f"Dataset de validação: {val_dataset}")

# 6. Usando datasets integrados do Keras
'''
(x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data()

# Pré-processamento
x_train = x_train.astype('float32') / 255.0
x_test = x_test.astype('float32') / 255.0

# Criando datasets
train_dataset = tf.data.Dataset.from_tensor_slices((x_train, y_train)).batch(batch_size)
test_dataset = tf.data.Dataset.from_tensor_slices((x_test, y_test)).batch(batch_size)
'''

## 8. Treinamento e Avaliação de Modelos

Vamos ver como treinar e avaliar um modelo com Keras:

In [None]:
# Criando um modelo simples para classificação binária
model = keras.Sequential([
    layers.Dense(64, activation='relu', input_shape=(10,)),
    layers.Dropout(0.2),
    layers.Dense(32, activation='relu'),
    layers.Dropout(0.2),
    layers.Dense(1, activation='sigmoid')
])

# Compilando o modelo
model.compile(
    optimizer='adam',
    loss='binary_crossentropy',
    metrics=['accuracy']
)

# Treinando o modelo com os datasets criados anteriormente
history = model.fit(
    train_dataset,
    epochs=10,
    validation_data=val_dataset,
    verbose=2  # 0: silencioso, 1: barra de progresso, 2: uma linha por época
)

# Avaliando o modelo
loss, accuracy = model.evaluate(val_dataset)
print(f"\nPerda de validação: {loss:.4f}")
print(f"Acurácia de validação: {accuracy:.4f}")

# Fazendo previsões
sample_data = np.random.normal(size=(5, 10)).astype(np.float32)
predictions = model.predict(sample_data)
print(f"\nPrevisões para 5 amostras: {predictions.flatten()}")

# Visualizando o histórico de treinamento
import matplotlib.pyplot as plt

# Gráfico de perda
plt.figure(figsize=(12, 4))
plt.subplot(1, 2, 1)
plt.plot(history.history['loss'], label='Treino')
plt.plot(history.history['val_loss'], label='Validação')
plt.title('Perda de Treinamento e Validação')
plt.xlabel('Época')
plt.ylabel('Perda')
plt.legend()

# Gráfico de acurácia
plt.subplot(1, 2, 2)
plt.plot(history.history['accuracy'], label='Treino')
plt.plot(history.history['val_accuracy'], label='Validação')
plt.title('Acurácia de Treinamento e Validação')
plt.xlabel('Época')
plt.ylabel('Acurácia')
plt.legend()

plt.tight_layout()
plt.show()

## 9. Callbacks e TensorBoard

Os callbacks do Keras permitem personalizar o processo de treinamento:

In [None]:
# Principais callbacks
print("Callbacks Disponíveis:")

# 1. ModelCheckpoint - Salva o modelo durante o treinamento
checkpoint_cb = keras.callbacks.ModelCheckpoint(
    'best_model.h5',
    save_best_only=True,
    monitor='val_loss',
    mode='min'
)
print("1. ModelCheckpoint - Salva o modelo durante o treinamento")

# 2. EarlyStopping - Para o treinamento quando não há melhoria
early_stopping_cb = keras.callbacks.EarlyStopping(
    monitor='val_loss',
    patience=5,
    restore_best_weights=True
)
print("2. EarlyStopping - Para o treinamento quando não há melhoria")

# 3. ReduceLROnPlateau - Reduz a taxa de aprendizagem quando a métrica estagna
reduce_lr_cb = keras.callbacks.ReduceLROnPlateau(
    monitor='val_loss',
    factor=0.1,
    patience=3,
    min_lr=1e-6
)
print("3. ReduceLROnPlateau - Reduz a taxa de aprendizagem quando a métrica estagna")

# 4. TensorBoard - Para visualização e monitoramento
tensorboard_cb = keras.callbacks.TensorBoard(
    log_dir='./logs',
    histogram_freq=1,
    write_graph=True
)
print("4. TensorBoard - Para visualização e monitoramento")

# 5. CSVLogger - Registra métricas em um arquivo CSV
csv_logger_cb = keras.callbacks.CSVLogger('training.log')
print("5. CSVLogger - Registra métricas em um arquivo CSV")

# 6. LambdaCallback - Para callbacks personalizados
lambda_cb = keras.callbacks.LambdaCallback(
    on_epoch_end=lambda epoch, logs: print(f"Época {epoch+1}: perda = {logs['loss']:.4f}")
)
print("6. LambdaCallback - Para callbacks personalizados")

# Criando um callback personalizado
class CustomCallback(keras.callbacks.Callback):
    def on_train_begin(self, logs=None):
        print("Iniciando treinamento!")
        
    def on_epoch_end(self, epoch, logs=None):
        print(f"Época {epoch+1}: acurácia = {logs['accuracy']:.4f}")
        
    def on_train_end(self, logs=None):
        print("Treinamento concluído!")

custom_cb = CustomCallback()
print("7. Callback Personalizado - Implementando a classe Callback")

# Usando callbacks no treinamento
model = keras.Sequential([
    layers.Dense(32, activation='relu', input_shape=(10,)),
    layers.Dense(1, activation='sigmoid')
])

model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

# Treinando com callbacks
history = model.fit(
    train_dataset,
    epochs=5,
    validation_data=val_dataset,
    callbacks=[
        checkpoint_cb,
        early_stopping_cb,
        reduce_lr_cb,
        custom_cb
    ],
    verbose=0  # Desativando a saída padrão para ver apenas os callbacks
)

# TensorBoard
print("\nUsando TensorBoard:")
print("1. Crie um callback TensorBoard e adicione-o à lista de callbacks")
print("2. Execute o treinamento")
print("3. Inicie o servidor TensorBoard: tensorboard --logdir=./logs")
print("4. Acesse http://localhost:6006 no navegador")

## 10. Salvando e Carregando Modelos

O Keras oferece várias maneiras de salvar e carregar modelos:

In [None]:
# Criando um modelo simples para demonstração
model = keras.Sequential([
    layers.Dense(32, activation='relu', input_shape=(10,)),
    layers.Dense(16, activation='relu'),
    layers.Dense(1, activation='sigmoid')
])

model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

# 1. Salvando o modelo completo (arquitetura + pesos + estado do otimizador)
model.save('modelo_completo.h5')  # Formato HDF5
model.save('modelo_completo')     # Formato SavedModel (diretório)

# 2. Salvando apenas os pesos
model.save_weights('pesos_modelo.h5')

# 3. Salvando apenas a arquitetura (como JSON ou YAML)
model_json = model.to_json()
with open('arquitetura_modelo.json', 'w') as json_file:
    json_file.write(model_json)

# Carregando modelos
# 1. Carregando modelo completo
loaded_model = keras.models.load_model('modelo_completo.h5')
print("Modelo carregado:")
loaded_model.summary()

# 2. Carregando arquitetura e pesos separadamente
# Primeiro, carregamos a arquitetura
with open('arquitetura_modelo.json', 'r') as json_file:
    loaded_model_json = json_file.read()
    
model_from_json = keras.models.model_from_json(loaded_model_json)

# Depois, carregamos os pesos
model_from_json.load_weights('pesos_modelo.h5')

# Compilando o modelo carregado
model_from_json.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

print("\nModelo carregado a partir de JSON e pesos:")
model_from_json.summary()

# 3. Usando TensorFlow SavedModel (recomendado para produção)
# Já salvamos acima com model.save('modelo_completo')
loaded_saved_model = keras.models.load_model('modelo_completo')

print("\nModelo carregado do formato SavedModel:")
loaded_saved_model.summary()

## 11. Redes Neurais Convolucionais (CNNs)

As CNNs são especialmente eficazes para processamento de imagens:

In [None]:
# Definindo uma CNN simples para classificação de imagens
cnn_model = keras.Sequential([
    # Camada de entrada
    layers.Input(shape=(28, 28, 1)),  # Para imagens MNIST 28x28 com 1 canal
    
    # Primeiro bloco convolucional
    layers.Conv2D(32, kernel_size=(3, 3), activation='relu', padding='same'),
    layers.BatchNormalization(),
    layers.MaxPooling2D(pool_size=(2, 2)),
    
    # Segundo bloco convolucional
    layers.Conv2D(64, kernel_size=(3, 3), activation='relu', padding='same'),
    layers.BatchNormalization(),
    layers.MaxPooling2D(pool_size=(2, 2)),
    
    # Terceiro bloco convolucional
    layers.Conv2D(128, kernel_size=(3, 3), activation='relu', padding='same'),
    layers.BatchNormalization(),
    layers.MaxPooling2D(pool_size=(2, 2)),
    
    # Achatamento e camadas densas
    layers.Flatten(),
    layers.Dense(128, activation='relu'),
    layers.Dropout(0.5),
    layers.Dense(10, activation='softmax')  # 10 classes para MNIST
])

# Compilando o modelo
cnn_model.compile(
    optimizer='adam',
    loss='sparse_categorical_crossentropy',
    metrics=['accuracy']
)

print("Modelo CNN:")
cnn_model.summary()

# Testando com dados aleatórios
dummy_images = np.random.random((10, 28, 28, 1)).astype(np.float32)
dummy_labels = np.random.randint(0, 10, size=(10,))

# Treinamento rápido para demonstração
cnn_model.fit(dummy_images, dummy_labels, epochs=1, verbose=0)

# Fazendo previsões
predictions = cnn_model.predict(dummy_images[:2])
print(f"\nPrevisões para 2 imagens: {np.argmax(predictions, axis=1)}")

# Arquiteturas CNN populares
print("\nArquiteturas CNN Populares Disponíveis no Keras:")
print("1. VGG16/VGG19")
print("2. ResNet50/ResNet101/ResNet152")
print("3. InceptionV3")
print("4. MobileNet/MobileNetV2")
print("5. DenseNet121/DenseNet169/DenseNet201")
print("6. EfficientNetB0-B7")

# Exemplo de uso de uma arquitetura pré-treinada
'''
from tensorflow.keras.applications import ResNet50
from tensorflow.keras.applications.resnet50 import preprocess_input

# Carregando o modelo pré-treinado
base_model = ResNet50(weights='imagenet', include_top=False, input_shape=(224, 224, 3))

# Congelando as camadas do modelo base
base_model.trainable = False

# Adicionando camadas personalizadas
model = keras.Sequential([
    base_model,
    layers.GlobalAveragePooling2D(),
    layers.Dense(1024, activation='relu'),
    layers.Dropout(0.5),
    layers.Dense(10, activation='softmax')  # Número de classes
])

# Compilando o modelo
model.compile(
    optimizer='adam',
    loss='categorical_crossentropy',
    metrics=['accuracy']
)
'''

## 12. Redes Neurais Recorrentes (RNNs)

As RNNs são projetadas para processar dados sequenciais:

In [None]:
# Definindo uma RNN simples
rnn_model = keras.Sequential([
    layers.Input(shape=(20, 10)),  # (timesteps, features)
    layers.SimpleRNN(32, return_sequences=True),
    layers.SimpleRNN(32),
    layers.Dense(1, activation='sigmoid')
])

print("Modelo RNN Simples:")
rnn_model.summary()

# Definindo uma LSTM
lstm_model = keras.Sequential([
    layers.Input(shape=(20, 10)),
    layers.LSTM(32, return_sequences=True),
    layers.Dropout(0.2),
    layers.LSTM(32),
    layers.Dropout(0.2),
    layers.Dense(1, activation='sigmoid')
])

print("\nModelo LSTM:")
lstm_model.summary()

# Definindo uma GRU
gru_model = keras.Sequential([
    layers.Input(shape=(20, 10)),
    layers.GRU(32, return_sequences=True),
    layers.Dropout(0.2),
    layers.GRU(32),
    layers.Dropout(0.2),
    layers.Dense(1, activation='sigmoid')
])

print("\nModelo GRU:")
gru_model.summary()

# Definindo uma RNN bidirecional
bidirectional_model = keras.Sequential([
    layers.Input(shape=(20, 10)),
    layers.Bidirectional(layers.LSTM(32, return_sequences=True)),
    layers.Bidirectional(layers.LSTM(32)),
    layers.Dense(1, activation='sigmoid')
])

print("\nModelo Bidirecional:")
bidirectional_model.summary()

# Testando com dados aleatórios
dummy_sequences = np.random.random((10, 20, 10)).astype(np.float32)  # (batch_size, timesteps, features)
dummy_labels = np.random.randint(0, 2, size=(10, 1)).astype(np.float32)

# Compilando e treinando o modelo LSTM
lstm_model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
lstm_model.fit(dummy_sequences, dummy_labels, epochs=1, verbose=0)

# Fazendo previsões
predictions = lstm_model.predict(dummy_sequences[:2])
print(f"\nPrevisões para 2 sequências: {predictions.flatten()}")

print("\nComparação entre RNN, LSTM e GRU:")
print("1. RNN: Simples, mas sofre com o problema de gradientes que desaparecem/explodem")
print("2. LSTM: Resolve o problema dos gradientes com células de memória e gates")
print("3. GRU: Versão simplificada da LSTM, geralmente mais rápida e com desempenho similar")

print("\nAplicações Comuns de RNNs:")
print("1. Processamento de Linguagem Natural (NLP)")
print("2. Reconhecimento de Fala")
print("3. Previsão de Séries Temporais")
print("4. Tradução Automática")
print("5. Geração de Texto")

## 13. Processamento de Linguagem Natural

O TensorFlow e Keras são amplamente utilizados para tarefas de NLP:

In [None]:
# Exemplo de modelo para classificação de texto
max_features = 10000  # Tamanho do vocabulário
embedding_dim = 128   # Dimensão do embedding
sequence_length = 100 # Comprimento máximo da sequência

# Modelo de classificação de texto
nlp_model = keras.Sequential([
    layers.Input(shape=(sequence_length,)),
    
    # Camada de embedding
    layers.Embedding(max_features, embedding_dim),
    
    # Camadas recorrentes
    layers.Bidirectional(layers.LSTM(64, return_sequences=True)),
    layers.Bidirectional(layers.LSTM(64)),
    
    # Camadas densas
    layers.Dense(64, activation='relu'),
    layers.Dropout(0.5),
    layers.Dense(1, activation='sigmoid')  # Para classificação binária
])

# Compilando o modelo
nlp_model.compile(
    optimizer='adam',
    loss='binary_crossentropy',
    metrics=['accuracy']
)

print("Modelo NLP:")
nlp_model.summary()

# Pré-processamento de texto
print("\nPré-processamento de Texto com Keras:")

# 1. Tokenização
from tensorflow.keras.preprocessing.text import Tokenizer

texts = [
    'Eu amo aprender sobre inteligência artificial',
    'O processamento de linguagem natural é fascinante',
    'As redes neurais são poderosas para NLP'
]

tokenizer = Tokenizer(num_words=100)
tokenizer.fit_on_texts(texts)

print("Vocabulário:")
print(dict(list(tokenizer.word_index.items())[:10]))  # Mostrando as 10 primeiras palavras

# 2. Convertendo textos para sequências
sequences = tokenizer.texts_to_sequences(texts)
print("\nSequências:")
for i, seq in enumerate(sequences):
    print(f"Texto {i+1}: {seq}")

# 3. Padding de sequências
from tensorflow.keras.preprocessing.sequence import pad_sequences

padded_sequences = pad_sequences(sequences, maxlen=10, padding='post', truncating='post')
print("\nSequências com Padding:")
for i, seq in enumerate(padded_sequences):
    print(f"Texto {i+1}: {seq}")

# Modelo de embedding pré-treinado
print("\nUsando Embeddings Pré-treinados:")
print("1. GloVe, Word2Vec, FastText são embeddings populares")
print("2. Podem ser carregados e usados em modelos Keras")

# Exemplo de como carregar embeddings pré-treinados (comentado para não baixar)
'''
import numpy as np

# Carregando embeddings GloVe
embeddings_index = {}
with open('glove.6B.100d.txt', encoding='utf-8') as f:
    for line in f:
        values = line.split()
        word = values[0]
        coefs = np.asarray(values[1:], dtype='float32')
        embeddings_index[word] = coefs

# Criando matriz de embedding
embedding_dim = 100
embedding_matrix = np.zeros((max_features, embedding_dim))
for word, i in tokenizer.word_index.items():
    if i < max_features:
        embedding_vector = embeddings_index.get(word)
        if embedding_vector is not None:
            embedding_matrix[i] = embedding_vector

# Usando a matriz de embedding no modelo
model = keras.Sequential([
    layers.Embedding(max_features, embedding_dim, weights=[embedding_matrix], trainable=False),
    layers.LSTM(64),
    layers.Dense(1, activation='sigmoid')
])
'''

# Transformers e TensorFlow Hub
print("\nTransformers e TensorFlow Hub:")
print("1. TensorFlow Hub oferece modelos pré-treinados prontos para uso")
print("2. BERT, GPT, T5 e outros transformers estão disponíveis")
print("3. Podem ser usados para transfer learning em tarefas de NLP")

# Exemplo de uso do BERT (comentado para não baixar)
'''
import tensorflow_hub as hub
import tensorflow_text as text

# Carregando o modelo BERT
bert_preprocess = hub.KerasLayer("https://tfhub.dev/tensorflow/bert_en_uncased_preprocess/3")
bert_encoder = hub.KerasLayer("https://tfhub.dev/tensorflow/bert_en_uncased_L-12_H-768_A-12/4")

# Criando o modelo
text_input = layers.Input(shape=(), dtype=tf.string)
preprocessed_text = bert_preprocess(text_input)
outputs = bert_encoder(preprocessed_text)

# Usando a saída [CLS] para classificação
pooled_output = outputs["pooled_output"]
sequence_output = outputs["sequence_output"]

# Adicionando camadas para classificação
x = layers.Dense(64, activation='relu')(pooled_output)
x = layers.Dropout(0.2)(x)
x = layers.Dense(1, activation='sigmoid')(x)

# Criando o modelo final
bert_model = keras.Model(inputs=text_input, outputs=x)
'''

## 14. Transferência de aprendizagem

O TensorFlow facilita o uso de modelos pré-treinados para transferência de aprendizagem:

In [None]:
# Exemplo de transferência de aprendizagem com modelos pré-treinados
'''
from tensorflow.keras.applications import MobileNetV2
from tensorflow.keras.applications.mobilenet_v2 import preprocess_input

# Carregando o modelo base pré-treinado
base_model = MobileNetV2(weights='imagenet', include_top=False, input_shape=(224, 224, 3))

# Congelando o modelo base
base_model.trainable = False

# Criando um novo modelo com o modelo base
model = keras.Sequential([
    base_model,
    layers.GlobalAveragePooling2D(),
    layers.Dense(1024, activation='relu'),
    layers.Dropout(0.5),
    layers.Dense(10, activation='softmax')  # Número de classes
])

# Compilando o modelo
model.compile(
    optimizer='adam',
    loss='categorical_crossentropy',
    metrics=['accuracy']
)
'''

print("Transferência de aprendizagem em TensorFlow/Keras:")
print("1. Carregar um modelo pré-treinado (geralmente sem a camada de classificação)")
print("2. Congelar as camadas do modelo base (opcional)")
print("3. Adicionar novas camadas para a tarefa específica")
print("4. Treinar o modelo com taxa de aprendizagem reduzida")

print("\nFine-tuning (Ajuste Fino):")
print("1. Treinar inicialmente com o modelo base congelado")
print("2. Descongelar algumas camadas superiores do modelo base")
print("3. Treinar novamente com taxa de aprendizagem muito baixa")

# Exemplo de código para fine-tuning
'''
# Primeira fase: treinar com o modelo base congelado
base_model.trainable = False
model.fit(train_dataset, epochs=10)

# Segunda fase: descongelar algumas camadas e treinar com taxa de aprendizagem baixa
base_model.trainable = True

# Congelar as primeiras camadas e treinar apenas as últimas
for layer in base_model.layers[:-4]:
    layer.trainable = False
    
# Recompilar com taxa de aprendizagem mais baixa
model.compile(
    optimizer=keras.optimizers.Adam(1e-5),  # Taxa de aprendizagem muito baixa
    loss='categorical_crossentropy',
    metrics=['accuracy']
)

# Continuar o treinamento
model.fit(train_dataset, epochs=5)
'''

print("\nModelos Pré-treinados Disponíveis:")
print("1. Para Visão Computacional: VGG, ResNet, Inception, MobileNet, EfficientNet")
print("2. Para NLP: BERT, GPT, T5, Universal Sentence Encoder")
print("3. Para Áudio: AudioSet, Speech Commands")

print("\nTensorFlow Hub:")
print("1. Repositório de modelos pré-treinados prontos para uso")
print("2. Fácil integração com Keras")
print("3. Suporte para diferentes domínios e tarefas")

## 15. TensorFlow para Produção

O TensorFlow oferece ferramentas para otimizar e implementar modelos em produção:

In [None]:
print("TensorFlow para Produção:")

print("\n1. TensorFlow SavedModel:")
print("   - Formato padrão para salvar modelos TensorFlow")
print("   - Contém o grafo computacional completo")
print("   - Pode ser carregado em diferentes ambientes")

# Exemplo de salvamento no formato SavedModel
'''
model.save('saved_model_dir')
'''

print("\n2. TensorFlow Lite:")
print("   - Versão otimizada do TensorFlow para dispositivos móveis e embarcados")
print("   - Suporta quantização para reduzir o tamanho do modelo")
print("   - Otimizado para latência e tamanho")

# Exemplo de conversão para TensorFlow Lite
'''
converter = tf.lite.TFLiteConverter.from_saved_model('saved_model_dir')
tflite_model = converter.convert()

# Salvando o modelo
with open('model.tflite', 'wb') as f:
    f.write(tflite_model)
'''

print("\n3. TensorFlow.js:")
print("   - Executa modelos TensorFlow no navegador ou Node.js")
print("   - Permite inferência no lado do cliente")
print("   - Suporta treinamento no navegador")

# Exemplo de conversão para TensorFlow.js
'''
!tensorflowjs_converter --input_format=keras saved_model_dir tfjs_model
'''

print("\n4. TensorFlow Serving:")
print("   - Sistema de serviço para modelos em produção")
print("   - Suporta versionamento e atualização de modelos")
print("   - Alta performance e escalabilidade")

print("\n5. Otimização de Modelos:")
print("   - Quantização: Redução de precisão (float32 para int8)")
print("   - Pruning: Remoção de conexões desnecessárias")
print("   - Compressão: Redução do tamanho do modelo")

# Exemplo de quantização
'''
converter = tf.lite.TFLiteConverter.from_saved_model('saved_model_dir')
converter.optimizations = [tf.lite.Optimize.DEFAULT]
quantized_tflite_model = converter.convert()
'''

print("\n6. TensorFlow Extended (TFX):")
print("   - Plataforma para ML em produção em grande escala")
print("   - Componentes para todo o pipeline de ML")
print("   - Validação de dados, treinamento, avaliação, implantação")

print("\n7. Monitoramento e Logging:")
print("   - TensorBoard para visualização de métricas")
print("   - TensorFlow Profiler para análise de desempenho")
print("   - Integração com sistemas de monitoramento")

## 16. Recursos Adicionais

Para aprofundar seus conhecimentos em TensorFlow e Keras:

1. **Documentação Oficial**:
   - TensorFlow: [tensorflow.org/api_docs](https://www.tensorflow.org/api_docs)
   - Keras: [keras.io/api](https://keras.io/api/)

2. **Tutoriais Oficiais**:
   - [tensorflow.org/tutorials](https://www.tensorflow.org/tutorials)
   - [keras.io/guides](https://keras.io/guides/)

3. **Cursos Online**:
   - [TensorFlow Developer Certificate](https://www.tensorflow.org/certificate)
   - [Deep Learning Specialization (Coursera)](https://www.coursera.org/specializations/deep-learning)
   - [TensorFlow in Practice Specialization (Coursera)](https://www.coursera.org/specializations/tensorflow-in-practice)

4. **Livros**:
   - "Deep Learning with Python" por François Chollet (criador do Keras)
   - "Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow" por Aurélien Géron

5. **Comunidade e Fóruns**:
   - [Stack Overflow - TensorFlow](https://stackoverflow.com/questions/tagged/tensorflow)
   - [TensorFlow Forum](https://discuss.tensorflow.org/)
   - [GitHub - TensorFlow](https://github.com/tensorflow/tensorflow)
   - [GitHub - Keras](https://github.com/keras-team/keras)

6. **Ecossistema TensorFlow**:
   - TensorFlow Hub: Repositório de modelos pré-treinados
   - TensorFlow Datasets: Conjuntos de dados prontos para uso
   - TensorFlow Graphics: Para computação gráfica
   - TensorFlow Probability: Para modelagem probabilística
   - TensorFlow Federated: Para aprendizagem federado
   - TensorFlow Quantum: Para computação quântica

## Conclusão

Este tutorial cobriu os conceitos e APIs principais do TensorFlow com Keras, desde os fundamentos até tópicos avançados. O TensorFlow é uma biblioteca poderosa e flexível para aprendizagem de máquina, com o Keras fornecendo uma API de alto nível intuitiva. Com o conhecimento adquirido neste tutorial, você está pronto para explorar mais a fundo e aplicar o TensorFlow e Keras em seus próprios projetos.