#### **Deep & Reinforcement Learning**

#### **Observa√ß√µes**

##### Classificando diferentes tipos de semente de ab√≥bora üéÉüå±

As sementes de ab√≥bora s√£o frequentemente consumidas como confeitos em todo o mundo devido √† sua quantidade adequada de prote√≠nas, gorduras, carboidratos e teores minerais. A base de dados **"SementesAbobora.xlsx"** possui um estudo foi realizado nos dois tipos de sementes de ab√≥bora mais importantes e de qualidade, **‚Äú√úrg√ºp Sivrisi‚Äù** e **‚Äú√áer√ßevelik‚Äù**, geralmente cultivadas nas regi√µes de √úrg√ºp e Karaca√∂ren na Turquia.

Muitas esp√©cies de sementes t√™m semelhan√ßas visuais, o que torna a classifica√ß√£o manual dif√≠cil e sujeita a erros. Redes neurais podem ser treinadas para identificar padr√µes que n√£o s√£o facilmente percept√≠veis pelo olho humano, aumentando a precis√£o da classifica√ß√£o.

Imagine que foi proposto para voc√™ o desafio de criar uma **intelig√™ncia para identificar os tipos de sementes para ajudar a equipe de engenheiros e engenheiras Agr√≠colas**. Para trabalhar com a precis√£o dos resultados x complexidade das caracter√≠sticas de sementes, voc√™ optou em utilizar as **redes neurais multilayer perceptron**. Vamos para a aplica√ß√£o?

**Features**

- Per√≠metro
- Maior_Eixo_Comprimento
- Comprimento_Eixo_Menor
- √Årea_Convexa
- Equiv_Di√¢metro
- Excentricidade
- Solidez
- Extens√£o
- Redondeza
- Proporcao
- Compacidade

**Target**
Classes:
 ((A)√áer√ßevelik, (B)√úrg√ºp Sivrisi)

#### **Conte√∫do - Bases e Notebook da aula**

Github:  
https://github.com/FIAP/Pos_Tech_DTAT/tree/DeepLearning


#### **Importa√ß√£o de bibliotecas**

In [107]:
#Importar biblioteca completa
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import numpy as np
import tensorflow as tf

#Importar algo especifico de uma biblioteca
from sklearn.utils import shuffle
from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

# keras libraries
from tensorflow import keras
from keras import models
from keras import layers
from keras import metrics
from keras.optimizers import Adam
from keras.metrics import Precision
from tqdm.keras import TqdmCallback

ModuleNotFoundError: No module named 'tensorflow'

#### **Fun√ß√µes (def)**

#### **Aula 1 - Perceptron de m√∫ltiplas camadas**

In [None]:
#Importar base de dados

link = 'https://github.com/RicardViana/fiap-Deep-Learning-and-unstructured-data/raw/refs/heads/main/SementesAbobora.xlsx'
df = pd.read_excel(link)

In [None]:
#Ver os primeiros dados

df.head()

In [None]:
#Ver os ultimos dados

df.tail()

In [None]:
#Ver a qtd de linhas e colunas da data frame
df.shape

In [None]:
#Como a base de dados possui os dados de classes de forma ordenada, isso pode ser um problema para o aprendizado de m√°quina e dessa forma √© preciso embaralhar os dados com o comando shuffle.

'''

Se o que voc√™ quer prever √© uma categoria (nome, grupo, "sim/n√£o"), voc√™ est√° lidando com Classes.

Se o que voc√™ quer prever √© um n√∫mero cont√≠nuo (pre√ßo de uma casa, temperatura, valor do d√≥lar), voc√™ est√° lidando com Regress√£o.

'''

df = shuffle(df)

In [None]:
#Verificar os dados embaralhados
df.head()

In [None]:
#Ver o equilibrio da base de dados
df['Class'].value_counts()

In [None]:
#Potando histogramas para analisar a simetria dos dados
df.hist(bins=100, figsize=(12, 12))
plt.show()

In [None]:
#Verificar a correla√ß√£o dos dados
correlation_matrix = df.select_dtypes(include='number').corr().round(2)

fig, ax = plt.subplots(figsize=(15,10))
sns.heatmap(data=correlation_matrix, annot=True, linewidths=.5, ax=ax)
plt.show()

In [None]:
#Ver a info dos dados
df.info()

In [None]:
# Utilizando LabelEncoder para transformar/converter r√≥tulos de texto em n√∫meros referente a variavel target
le = LabelEncoder()

# Sobrescrever a coluna Class
df.Class = le.fit_transform(df['Class'])

In [None]:
# Verificar apenas os dados distitos
set(df['Class'])

In [None]:
# Separar os dados 
X = df[['Area','Per√≠metro', 'Comprimento_Eixo_Menor','Excentricidade','Solidez','Extens√£o','Redondeza', 'Proporcao', 'Compacidade']]
y = df['Class']

In [None]:
# Separar os dados em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.20)

In [None]:
# Pr√©-processamento dos dados

'''

Apesar de deep learning n√£o requerer distribui√ß√µes normais, √© comum aplicar t√©cnicas de pr√©-processamento de dados para normalizar ou padronizar as caracter√≠sticas. 
Isso pode ajudar a acelerar a converg√™ncia do treinamento da rede neural.
A converg√™ncia est√° relacionada com o erro, ou seja, o quanto a sua rede aprende a corrigir os erros durante o processamento.

'''

# Ajustar os dados (Fit)
scaler = StandardScaler()
scaler.fit(X_train)
scaler.fit(X_test)

In [None]:
# Transformar os dados
X_train = scaler.transform(X_train)
X_test = scaler.transform(X_test)

In [None]:
# Ver os dados de treino
X_train

In [None]:
# Ver a quantidade de linhas e colunas da base de treino
X_train.shape

In [None]:
# Ver o tipo do dado
type(X_train)

In [None]:
# Ver a quantidade de linhas e colunas da base de teste
X_test.shape

In [None]:
# Ver o tipo do dado
type(X_test)

In [None]:
#Moldando nossas vari√°veis resposta

'''

A nossas classes est√£o em um formato de estrutura de dados unidimensional (assim como uma coluna) e precisamos moldar para o formato de array -n dimensional(matriz).
O comando reshape √© utilizado para reformatar a estrutura de um array multidimensional, como um tensor, que √© a estrutura de dados fundamental usada em deep learning e processamento de dados em redes neurais.

'''

# Ver o tipo do dado
type(y_train)

In [None]:
# reshape() molda uma matriz sem alterar os dados da matriz

'''

O que o .reshape((-1, 1)) faz?

Imagine que os dados originais sejam uma lista simples: [0, 1, 0, 1] e para o Python, isso √© um vetor de uma √∫nica dimens√£o (1D). 
No entanto, bibliotecas como o TensorFlow ou Scikit-Learn geralmente exigem que os dados de entrada tenham duas dimens√µes: uma para as linhas (amostras) e outra para as colunas (caracter√≠sticas).

* O n√∫mero 1: Diz ao NumPy que queremos que o resultado final tenha exatamente 1 coluna.
* O n√∫mero -1: Esse √© um "coringa". Ele diz ao NumPy: "Calcule automaticamente quantas linhas s√£o necess√°rias para que todos os dados caibam nessa 1 coluna".

O passo a passo da linha inteira

O comando abaixo√© uma "super instru√ß√£o" que faz tr√™s coisas:

1. np.asarray(y_train): Garante que o dado seja um array do NumPy (caso ele venha de uma lista ou de uma coluna do Pandas).
2. .astype('float32'): Converte os n√∫meros para o formato de ponto flutuante de 32 bits. Computacionalmente, as GPUs e CPUs processam c√°lculos de Redes Neurais muito mais r√°pido em float32 do que em n√∫meros inteiros ou float64.
3. .reshape((-1, 1)): Transforma o vetor de "deitado" (1D) para "em p√©" (2D), como uma coluna de uma tabela.

Por que isso √© necess√°rio?

A maioria dos modelos de Deep Learning (como os do Keras/TensorFlow) espera que o seu `y` (o que voc√™ quer prever) tenha o formato (n√∫mero_de_amostras, n√∫mero_de_sa√≠das).

Mesmo que voc√™ s√≥ tenha uma sa√≠da (0 ou 1), o modelo espera que essa sa√≠da esteja dentro de uma estrutura de "coluna", e n√£o apenas uma lista solta.

'''

y_train = np.asarray(y_train).astype('float32').reshape((-1,1))
y_test = np.asarray(y_test).astype('float32').reshape((-1,1))

In [None]:
# Ver o tipo do dado ap√≥s o reshape
type(y_train)

In [None]:
# Ver a qtd de linhas e colunas
y_train.shape

In [None]:
# Construindo a arquitetura da rede neural multicamadas 

'''

Agora utilizando as bibliotecas tensorflow e keras, vamos construir a arquitetura da nossa primeira rede neural

'''

#### **Aula 2 - Redes convolucionais**

#### **Aula 3 - Transfer√™ncia de aprendizagem**

#### **Aula 4 - Redes recorrentes**

#### **Aula 5 - Redes n√£o supervisionadas**

#### **Aula 6 - Gans**