<a href="https://colab.research.google.com/github/SampMark/Deep-Learning/blob/main/Building_Neural_Networks_with_the_Keras_Functional_API.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Construindo Redes Neurais com a API Funcional do Keras**

## **Introdução**
A API funcional do Keras oferece uma abordagem mais robusta e flexível para a construção de modelos de redes neurais, superando as limitações da API sequencial.

Enquanto a **API sequencial** é ideal para modelos simples e lineares, a **API funcional** expande as possibilidades ao permitir a construção de arquiteturas complexas, como redes com múltiplas entradas e saídas, camadas compartilhadas e conexões não lineares. Este projeto explora as vantagens da API funcional e apresenta um guia prático para sua implementação.

## **Por que usar a API Funcional?**

A **API funcional** do Keras é especialmente útil em cenários que exigem flexibilidade na definição de fluxos de dados. permite a criação de modelos complexos com múltiplas entradas e saídas, camadas compartilhadas e até mesmo fluxos de dados não lineares.

A flexibilidade é crucial para abordar problemas complexos e explorar arquiteturas de redes neurais inovadoras, permitindo a cientístas de dados explorarem e se adaptem melhor às necessidades específicas de problemas complexos.

A utilização da **API funcional** permite a criação de:

1. **Modelos com múltiplas entradas e saídas**: fundamental em tarefas como processamento multimodal, em que diferentes tipos de dados são integrados (ex.: texto e imagens).

2. **Camadas compartilhadas**: ideal para arquiteturas como redes neurais siamêsas, utilizadas em tarefas de verificação, como identificação de duplicação de imagens ou comparação de textos.

3. **Arquiteturas complexas**: redes com fluxos de dados não lineares, conexões residuais (como em ResNets) ou até mesmo blocos iterativos de processamento.

## **Importando e Instalando as Bibliotecas**

---



In [1]:
!pip install tensorflow



In [2]:
import tensorflow as tf
# Keras está incluído no TensorFlow como tensorflow.keras
from tensorflow.keras.models import Model
from tensorflow.keras.layers import Input, Dense

# **Implementando a API Funcional**

## **Passo 1: Definir a Camada de Entrada**

---

A camada de entrada define a forma dos dados, que serão alimentados na rede neural. Utiliza-se a função `keras.Input()` para criar a camada de entrada, especificando a forma dos dados, que define o formato dos dados esperados pelo modelo. Por exemplo, suponha que no conjunto de dados utilizado, cada entrada é um vetor de comprimento 20.

* `Input(shape=(20,))` cria uma camada de entrada que espera vetores de entrada de comprimento 20.

* `print(input_layer)` mostra as informações da camada, ajudando a entender o tipo de informação disponível sobre as camadas.

In [3]:
# Definir a entrada
input_layer = Input(shape=(20,))

# Exibir informações
print(input_layer)

<KerasTensor shape=(None, 20), dtype=float32, sparse=False, name=keras_tensor>


## **Passo 2: Adicionar Camadas Ocultas**

---
As camadas ocultas são responsáveis por processar as informações da camada de entrada e extrair _features_ relevantes. Utiliza-se a função `keras.layers.Dense()` para adicionar camadas densas (_fully connected_) ao modelo, são adicionadas conectando explicitamente cada camada à anterior.

Cada camada oculta recebe a saída da camada anterior como sua entrada. **As camadas ocultas ajudam o modelo a aprender padrões complexos nos dados**.

**Explicação**:

* `Dense(64, activation='relu')` cria uma camada densa (totalmente conectada) com 64 unidades e função de ativação `ReLU`.

### **Escolha da Função de Ativação**

* `ReLU`: escolha padrão para camadas ocultas.
* `Leaky ReLU`: alternativa ao ReLU, útil para evitar "neurônios mortos".
* `Tanh`: preferível ao `sigmoid` em camadas ocultas, especialmente se os dados contêm valores positivos e negativos.
* `Sigmoid`: ideal para camadas de saída em problemas de classificação binária.
* `Softmax`:usada para normalizar saídas em problemas de classificação multiclasses.
* `ELU`: recomendado para redes muito profundas devido à melhor propagação de gradientes.



In [4]:
# Adicionar camadas ocultas
hidden_layer1 = Dense(64, activation='relu')(input_layer)
hidden_layer2 = Dense(64, activation='relu')(hidden_layer1)

### **Comparativo das Funções de Ativação**

A tabela a seguir resume as principais características das funções de ativação:

| **Função de Ativação** | **Fórmula**                 | **Intervalo de Saída** | **Vantagens**                                                                 | **Desvantagens**                                  | **Uso Principal**                        |
|-------------------------|----------------------------|-------------------------|-------------------------------------------------------------------------------|--------------------------------------------------|------------------------------------------|
| ReLU                   | $ f(x) = \max(0, x) $   | $[0, +\infty)$       | Simples, resolve *vanishing gradient*, eficiente computacionalmente          | Pode causar neurônios mortos (*dead neurons*)    | Camadas ocultas                          |
| Tanh                   | $ f(x) = \tanh(x) $     | $(-1, 1)$            | Centrado em zero, melhor que sigmoid para camadas ocultas                    | Sofre *vanishing gradient*                       | Camadas ocultas                          |
| Sigmoid                | $ f(x) = \frac{1}{1+e^{-x}} $ | $(0, 1)$            | Bom para probabilidades (saídas de classificação binária)                    | Saturação para 0 ou 1, *vanishing gradient*      | Camadas de saída (classificação binária) |
| Softmax                | $ f(x_i) = \frac{e^{x_i}}{\sum e^{x_j}} $ | $(0, 1), \text{soma} = 1$ | Normaliza saídas como probabilidades                                       | Não utilizada em camadas ocultas                | Camadas de saída (classificação multiclasses) |
| Leaky ReLU             | $ f(x) = \begin{cases} x, & x > 0 \\ \alpha x, & \text{senão} \end{cases} $ | $(-\infty, +\infty)$ | Resolve neurônios mortos, eficiente para redes profundas                   | Necessário ajuste do $alpha$                 | Camadas ocultas                          |
| ELU                    | $ f(x) = \begin{cases} x, & x > 0 \\ \alpha(e^x - 1), & \text{senão} \end{cases} $ | $(-1, +\infty)$ | Resolve neurônios mortos, melhora propagação de gradientes                  | Custo computacional levemente maior             | Camadas ocultas                          |


## **Passo 3: Definir a Camada de Saída**

---

A camada de saída especifica o tipo de tarefa que o modelo realizará, como classificação binária ou regressão, entre outros. Ou seja, a camada de saída produz a predição final do modelo. Logo, a escolha da função de ativação na camada de saída depende da tarefa em questão.

Por exemplo, supondo um problema de classificação binária, a função de ativação sigmoide é preferível devido à sua capacidade de produzir probabilidades.

A função sigmoide comprime a saída da rede neural em um intervalo entre 0 e 1, o que pode ser interpretado como a probabilidade da entrada pertencer à classe positiva. Essa característica facilita a tomada de decisão e a definição de limiares para a classificação. Além disso, a sigmoide é uma função monotônica e diferenciável, o que auxilia no processo de treinamento da rede neural.

**Explicação**:

* `Dense(1, activation='sigmoid')` cria uma camada densa com 1 unidade e uma função de ativação `sigmoide`, adequada para classificação binária.

In [5]:
# Definir a camada de saída
output_layer = Dense(1, activation='sigmoid')(hidden_layer2)

## **Passo 4: Criar o Modelo**

Neste passo será criado o modelo, conectando-se a camada de entrada à camada de saída para formar o modelo completo.

**Explicação**:

* `Model(inputs=input_layer, outputs=output_layer)` cria um modelo Keras que conecta a camada de entrada à camada de saída por meio das camadas ocultas.

* `model.summary()` fornece um resumo do modelo, mostrando as camadas, suas formas e o número de parâmetros, possibilitando a interpretação da sua arquitetura.

In [6]:
# Criar o modelo
model = Model(inputs=input_layer, outputs=output_layer)

# Exibir sumário
model.summary()

## **Passo 5: Compilar o Modelo**

Antes de treinar o modelo, é necessário compilá-lo, sendo necessário especificar o otimizador, a função de perda e as métricas de avaliação.

**Explicação**:

* `optimizer='adam'` especifica o otimizador `Adam`, uma escolha popular para treinar redes neurais.

* `loss='binary_crossentropy'` especifica a função de perda para problemas de classificação binária.

* `metrics=['accuracy']` instrui o Keras a avaliar o modelo usando precisão durante o treinamento.

In [7]:
# Compilar o modelo
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

## **Passo 6: Treinar o Modelo**

Depois de compilado, o modelo pode ser treinado usando dados de treinamento. Para este exemplo, vamos supor que `X_train` são seus dados de entrada de treinamento e `y_train` é o rótulo correspondente.

**Explicação**:

* `X_train` e `y_train` são marcadores de posição para os dados de treinamento.

* `model.fit` treina o modelo para um número especificado de épocas e tamanho de lote.

Os parâmetros `epochs` e `batch_size` controlam o número de iterações de treinamento e o número de exemplos processados por cada iteração, respectivamente.

In [8]:
# Importar a biblioteca NumPy para manipulação de arrays
import numpy as np

# Gerar dados de treinamento aleatórios
X_train = np.random.rand(1000, 20)  # 1000 exemplos com 20 features
y_train = np.random.randint(2, size=(1000, 1))  # 1000 rótulos binários

# Ajustar o modelo com os dados de treinamento
model.fit(X_train, y_train, epochs=10, batch_size=32)

Epoch 1/10
[1m32/32[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 2ms/step - accuracy: 0.4864 - loss: 0.7026
Epoch 2/10
[1m32/32[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 1ms/step - accuracy: 0.5257 - loss: 0.6922 
Epoch 3/10
[1m32/32[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.5292 - loss: 0.6893
Epoch 4/10
[1m32/32[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.5213 - loss: 0.6867
Epoch 5/10
[1m32/32[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.5739 - loss: 0.6836
Epoch 6/10
[1m32/32[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.5471 - loss: 0.6833
Epoch 7/10
[1m32/32[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.5756 - loss: 0.6788
Epoch 8/10
[1m32/32[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.5924 - loss: 0.6773
Epoch 9/10
[1m32/32[0m [32m━━━━━━━━━━━━━━━━━━━━[0m

<keras.src.callbacks.history.History at 0x789c1a521e50>

## **Passo 7: Avaliar o Modelo**

Após o treinamento, é necessário avaliá-lo com base nos dados de teste, para ver o quão bem ele se sai.

Explicação:

* `model.evaluate` calcula `loss` e `accuracy`, respectivamente a perda e a precisão do modelo em dados de teste.
  * A perda indica o quão bem o modelo se ajusta aos dados, enquanto a acurácia mede a proporção de exemplos classificados corretamente.

* `X_test` e `y_test` são marcadores de posição para os dados de teste, neste exemplo:
  * `X_test` contém 200 exemplos com 20 features aleatórias cada.
  * `y_test` contém 200 rótulos binários (0 ou 1) correspondentes.

In [9]:
# Gerar dados de teste aleatórios
X_test = np.random.rand(200, 20)  # 200 exemplos com 20 features cada
y_test = np.random.randint(2, size=(200, 1))  # 200 rótulos binários

# Avaliar o modelo com os dados de teste
loss, accuracy = model.evaluate(X_test, y_test)

# Imprimir os resultados da avaliação
print(f'Perda nos dados de teste (loss): {loss}')  # Imprime o valor da perda nos dados de teste
print(f'Teste de Acurácia: {accuracy}')  # Imprime a acurácia nos dados de teste

[1m7/7[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.5463 - loss: 0.6895  
Perda nos dados de teste (loss): 0.6905525326728821
Teste de Acurácia: 0.5649999976158142


In [10]:
from sklearn.metrics import classification_report, confusion_matrix, roc_auc_score

# Previsões no conjunto de teste
y_pred = model.predict(X_test)
y_pred_classes = (y_pred > 0.5).astype("int32")

# Relatório de classificação
print(classification_report(y_test, y_pred_classes))

# Matriz de confusão
cm = confusion_matrix(y_test, y_pred_classes)
print("Matriz de Confusão:")
print(cm)

# AUC
auc = roc_auc_score(y_test, y_pred)
print(f"AUC: {auc}")

[1m7/7[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 12ms/step
              precision    recall  f1-score   support

           0       0.59      0.46      0.52       102
           1       0.55      0.67      0.60        98

    accuracy                           0.56       200
   macro avg       0.57      0.57      0.56       200
weighted avg       0.57      0.56      0.56       200

Matriz de Confusão:
[[47 55]
 [32 66]]
AUC: 0.5378151260504201


# **Referências**

  GÉRON, Aurélien. **Hands-on Machine Learning with Scikit-Learn, Keras, and TensorFlow**: Unsupervised Learning Techniques. O'Reilly Media, Incorporated, 2023.


  CHOLLET, Francois; CHOLLET, François. **Deep learning with Python**. simon and schuster, 2021.


  TENSORFLOW. **TensorFlow Python API Documentation**. Disponível em: https://www.tensorflow.org/api_docs/python/tf. Acesso em: 19 jan. 2025.