# Projeto TensorFlow Keras

Contruindo uma MLP do zero

# Parte 1: Conceitos básicos para construir uma MLP

Acesse o conteúdo didático [nesse link](https://github.com/alura-cursos/Live-coding-alura-keras/blob/main/Primeiros%20passos%20-%20TF%20Keras%20-%20Apresenta%C3%A7%C3%A3o%20em%20slides.pdf)

**Alguns conceitos importantes para lembrar antes de iniciar o código**

* **Redes Neurais**: uma rede neural é composta por diversos neurônios interligados entre si, daí o nome "rede neural".

* **Neurônio Artificial / Perceptron**: os neurônios são a unidade básica de uma rede neural e possuem a seguinte estrutura:
   - **Entradas**: dados que alimentam o neurônio.
   - **Peso**: importância atribuída a cada entrada em relação ao resultado final; pesos maiores indicam entradas mais relevantes para a saída.
   - **Função de Ativação**: determina se o neurônio deve "disparar" e influencia diretamente o resultado final (saída).

* **MLP (Multi-Layer Perceptron)**: uma rede neural com múltiplas camadas de neurônios, incluindo camadas ocultas, para processar dados complexos.

* **Estrutura do MLP**:
   - **Camada de Entrada**: onde os dados iniciais, com seus respectivos pesos, são enviados para a camada seguinte.
   - **Camada Oculta**: composta por vários perceptrons e chamada assim porque não visualizamos diretamente o que ocorre nela. Sua função é extrair e combinar características complexas dos dados.
   - **Camada de Saída**: formada por neurônios que realizam a decisão final da rede.

* **Aprendizado Feedforward**: fluxo de dados que percorre da camada de entrada até a camada de saída sem retorno para camadas anteriores.

* **Perda**: uma métrica que mede o quão ruim está o modelo em comparação ao resultado esperado; quanto mais próxima de zero, melhor o desempenho.

* **Backpropagation**: método que ajusta os pesos das conexões para reduzir a perda, usando um algoritmo de otimização para melhorar a precisão da rede.

* **Épocas**: número de vezes que o modelo vê e processa o conjunto de dados completo durante o treinamento, permitindo ajustes progressivos nos pesos.

Links diretos para a documentação de cada uma das bibliotecas utilizadas no projeto:

* [pandas](https://pandas.pydata.org/)
* [scikit-learn](https://scikit-learn.org/stable/)
* [tensorflow](https://www.tensorflow.org/)
* [matplotlib](https://matplotlib.org/)
* [seaborn](https://seaborn.pydata.org/)

![](https://github.com/Mirlaa/Live-coding-alura-keras/blob/main/imagens/imagem3.png?raw=true)

# Parte 2: Processando os dados

Você pode manter os dados salvos em seu notebook com o código abaixo:
```Python
url = 'https://raw.githubusercontent.com/alura-cursos/Live-coding-alura-keras/refs/heads/main/novas_notas.csv'
url_novos = 'https://raw.githubusercontent.com/alura-cursos/Live-coding-alura-keras/refs/heads/main/novas_notas.csv'
```

In [None]:
url = 'https://raw.githubusercontent.com/alura-cursos/Live-coding-alura-keras/refs/heads/main/autenticacao_notas.csv'

Esse conjunto de dados representa informações extraídas de imagens de **notas fiscais**, com o objetivo de distinguir entre notas **AUTÊNTICAS** e **FALSAS**. As colunas contêm características numéricas extraídas das imagens essas características permitem analisar as texturas e variações das imagens.

Esssas características foram extraídas usando a [Transformada Wavelet](https://semanaacademica.org.br/system/files/artigos/transformada_wavelets.pdf). Essa técnica permite analisar as texturas e variações das imagens.

* **Colunas**:

1. **Variância**: representa a variabilidade dos valores da imagem após a transformação Wavelet.
2. **Assimetria**: mede a assimetria dos valores na imagem transformada.
3. **Curtose**: mede o grau de "pico" ou "achatamento" da distribuição dos valores da imagem.
4. **Entropia**: mede o grau de desordem ou complexidade da imagem.
5. **Classe**: é a *variável alvo* e indica se a nota é autêntica ou falsa. É representada como um valor inteiro, onde geralmente `0` representa uma nota falsa e `1` uma nota autêntica.


A separação do conjunto de dados em treino e teste permite que se avalie o desempenho do modelo para dados novos. Fazemos ela com a função [`train_test_split`](https://scikit-learn.org/dev/modules/generated/sklearn.model_selection.train_test_split.html).

Além disso, a técnica também permite verificar a capacidade de generalização do modelo e evita o problema de **overfitting**, onde o modelo se adapta aos dados de treino e tem baixa performance com dados não vistos, como se estivesse "*decorado*" o conjunto de treino.

Aplicar o [`StandardScaler`](https://scikit-learn.org/dev/modules/generated/sklearn.preprocessing.StandardScaler.html) após a separação dos dados evita o vazamento de dados, pois usa apenas as estatísticas dos dados de treino para escalonar tanto treino quanto teste. Isso mantém o conjunto de teste independente e permite uma avaliação mais precisa da capacidade de generalização do modelo.

Não conseguimos encontrar uma solução para predição de notas ficais autênticas com um simples Percepton, devemos usar uma MLP.

![](https://github.com/Mirlaa/Live-coding-alura-keras/blob/main/imagens/imagem2.png?raw=true)

# Parte 3: Construindo a MLP

[**TensorFlow (tf)**](https://www.tensorflow.org/?hl=pt-br) é uma biblioteca de código aberto para machine learning que facilita a construção, o treinamento e a implantação de redes neurais, com foco em deep learning.


- [**`tf.keras.Sequential`**](https://www.tensorflow.org/api_docs/python/tf/keras/Sequential): cria um modelo de rede neural linear, onde as camadas são adicionadas sequencialmente.
- [**`tf.keras.layers.Input`**](https://www.tensorflow.org/api_docs/python/tf/keras/Input): define a entrada da rede, especificando a forma dos dados que serão processados pelo modelo.
- [**`tf.keras.layers.Dense`**](https://www.tensorflow.org/api_docs/python/tf/keras/layers/Dense): adiciona uma camada densa totalmente conectada, onde cada neurônio é conectado a todos os neurônios da camada anterior.

- [**`compile`**](https://www.tensorflow.org/api_docs/python/tf/keras/Model#compile): configura o modelo para treinamento, especificando a função de perda, o otimizador e as métricas a serem usadas para avaliar o desempenho durante o aprendizado.


- [**`fit`**](https://www.tensorflow.org/api_docs/python/tf/keras/Model#fit): treina o modelo nos dados fornecidos, ajustando os pesos das camadas para minimizar a perda, de acordo com o número de épocas e o tamanho do lote definidos.

Durante o treinamento, o Keras pode medir a perda e as métricas de um conjunto não observado pelo modelo em cada época, ajudando a verificar se o modelo está generalizando bem e quando deve parar de treinar. O conjunto de validação atua esse conjunto não observado de dados, auxiliando na avaliação do modelo.

Valores de acurácia e perda para treino e validação são bem similares o que pode indicar uma MLP que não apresenta overfitting, ou seja, que não domente decorou os dados de treino e conseguiu generalizar sua saída.

![](https://github.com/Mirlaa/Live-coding-alura-keras/blob/main/imagens/imagem1.png?raw=true)

# Parte 4: Avaliando a MLP

É possível avaliar o desempenho da nossa MLP verificando como ela se sai ao gerar predições para o conjunto de teste.

- [**`evaluate`**](https://www.tensorflow.org/api_docs/python/tf/keras/Model#evaluate): calcula a perda e as métricas do modelo em um conjunto de dados específico (normalmente, o conjunto de teste) para verificar o desempenho final após o treinamento.

Também podemos observar a evolução do aprendizado da MLP conforme se passam as épocas

- **`history.history`**: retorna um dicionário com os valores das métricas e da perda ao longo das épocas de treinamento (e validação, se usada), permitindo visualizar o progresso e identificar possíveis overfitting ou underfitting.

É possível coletar novos dados e verificar a saída do modelo para esses novos dados

In [None]:
url_novos='https://raw.githubusercontent.com/alura-cursos/Live-coding-alura-keras/refs/heads/main/novas_notas.csv'

* [**`predict`**](https://www.tensorflow.org/api_docs/python/tf/keras/Model#predict): gera previsões para novos dados usando o modelo treinado. Ele processa as entradas e retorna a saída do modelo, que pode ser probabilidades, classes ou valores contínuos, dependendo da tarefa (classificação ou regressão) e da configuração da camada de saída.

# Conteúdos extras


* **Formação [Deep Learning com Tensorflow Keras](https://cursos.alura.com.br/formacao-deep-learning-tensorflow-keras)**

  Explore os fundamentos do Deep Learning, bem como técnicas e bibliotecas avançadas, para resolver problemas complexos de aprendizado de máquina e inteligência artificial.
  - **Curso: [Keras: primeiros passos em redes neurais](https://cursos.alura.com.br/course/keras-primeiros-passos-redes-neurais)**
    
    Entenda o que é, como funciona e como aprende uma rede neural simples e multicamada, desenvolvendo um modelo MLP com a API Keras.
  - **Curso: [TensorFlow Keras: classificando imagens com redes convolucionais](https://cursos.alura.com.br/course/tensorflow-keras-classificando-imagens-redes-convolucionais)**
    
    Domine a classificação de imagens com TensorFlow Keras! Aprenda a construir redes convolucionais em um curso prático sobre folhas de videiras.
  - **Curso: [TensorFlow Keras: classificando e sugerindo palavras](https://cursos.alura.com.br/course/tensorflow-keras-classificando-sugerindo-palavras)**
    
    Aprenda a usar TensorFlow Keras para completar textos com redes LSTM. Este curso ensina técnicas avançadas de processamento de linguagem natural e como aplicar redes neurais para prever a próxima palavra em uma sequência de texto.
  - **Curso: [TensorFlow Keras: Decodificando Áudio com IA](https://cursos.alura.com.br/course/tensorflow-keras-decodificando-audio-ia)**
    
    Aprenda a criar, treinar e implementar modelos de reconhecimento de áudio com TensorFlow neste curso prático. Explore técnicas avançadas, utilize modelos pré-treinados como Yamnet e domine a transferência de aprendizado.
  - **Curso: [TensorFlow/Keras: gerando imagens com Deep Learning](https://cursos.alura.com.br/course/tensorflow-keras-gerando-imagens-deep-learning)**
    
    Aprenda a gerar imagens com Deep Learning! Curso prático de GANs, difusores e Stable Diffusion com TensorFlow/Keras.
* **Curso [TensorFlow: implementando um perceptron de múltiplas camadas (MLP)](https://cursos.alura.com.br/course/tensorflow-implementando-perceptron-multiplas-camadas)**
  Explore os princípios fundamentais das redes neurais com TensorFlow: perceptrons, gradiente descendente, camadas ocultas e funções de ativação.

> O projeto que você construiu é **seu**! Então fique a vontade para compartilhar o seu projeto no GitHub, botar no seu portfólio, divulgar no LinkedIn e nos marcar na postagem.
>
> Bons estudos!

--Mirla Costa