# Aula 02 - Introdução ao PyTorch – Um Exemplo Prático

## Objetivo da Aula

Apresentar de forma simples e didática os conceitos utilizados na implementação de um modelo de **aprendizado de máquina** para prever se o feedback de um cliente foi "Bom" ou não.

Nosso objetivo é criar um modelo que diga:  
➡️ Dado o perfil do cliente, ele dará um feedback **bom** ou **não**?

## 1. O Que É Machine Learning (Aprendizado de Máquina)?

**Machine Learning** é uma área da Inteligência Artificial que permite que computadores aprendam com dados. Em vez de programar regras explícitas, damos ao computador exemplos e ele descobre padrões sozinho.

No nosso caso, queremos **prever** se o **feedback** de um cliente foi bom com base em algumas informações como idade, renda e nota do produto.

## 2. Entendendo o Dataset

O arquivo `exemplo_dataset2.csv` contém dados sobre clientes. Cada linha representa um cliente, e as colunas podem incluir:

- `idade`: Quantos anos o cliente tem.
- `renda`: Quanto dinheiro o cliente ganha por mês.
- `nota`: Nota dada pelo cliente ao produto.
- `feedback`: Comentário do cliente ("Bom", "Ruim", etc.)

## 3. Tratamento dos Dados

### 3.1 Valores Ausentes

Às vezes, alguns dados estão faltando (`NaN`). Para resolver isso:

- Preenchemos valores ausentes nas colunas numéricas (`idade`, `renda`, `nota`) com estatísticas (mediana ou média).
- Na coluna `feedback`, colocamos `"Desconhecido"` quando falta informação.

### 3.2 Transformação do Alvo (Target)

Como o nosso objetivo é  prever se o feedback foi "Bom", então criamos uma nova coluna chamada `feedback_Bom` que será preenchida da seguinte forma:

- Se for "Bom", colocamos **1**
- Se for outro valor, colocamos **0**

Isso é chamado de **transformação binária**, ou seja, transformamos texto em números (0 e 1), que o computador entende melhor.

## 4. Dividindo os Dados: Treino e Teste

Para treinar e testar o modelo, dividimos os dados em duas partes:

- **Treino (70%)**: usado para ensinar o modelo.
- **Teste (30%)**: usado para verificar se o modelo está aprendendo bem.

Essa divisão evita que o modelo "chute" respostas certas apenas porque viu os mesmos dados antes.

## 5. O Que É Deep Learning?

**Deep Learning** é uma técnica avançada de **Machine Learning** que usa **redes neurais artificiais**. Elas são inspiradas no cérebro humano e conseguem aprender relações complexas entre os dados.

No exemplo prático, usamos uma rede neural simples com:
- Uma **camada oculta** com 8 neurônios
- Função de ativação **ReLU**
- Uma saída final (**logit**) para prever se o feedback será bom ou não

## 6. Como Funciona uma Rede Neural?

Uma rede neural processa os dados passo a passo:

1. **Camada de entrada**: Recebe os dados (idade, renda, nota)
2. **Camada oculta**: Faz cálculos internos com os dados
3. **Ativação (ReLU)**: Decide quais informações seguir adiante
4. **Camada de saída**: Gera um número (**logit**) que indica se o feedback provavelmente será bom ou não

Depois, aplicamos a função **sigmoid** para transformar esse número em uma probabilidade (entre 0 e 1).  
Se for maior que 0.5 → prevemos que o feedback será **bom**


## 7. Treinamento do Modelo

### Etapas do Treinamento:
1. **Forward Pass**: O modelo faz uma previsão com os dados de entrada.
2. **Cálculo do Erro**: Medimos o quanto ele errou usando a **função de perda** (loss).
   - Neste caso, usamos `BCEWithLogitsLoss` (Boa para classificação binária)
3. **Backward Pass**: Corrigimos os pesos da rede para diminuir o erro.
   - Usamos o otimizador **Adam**, que ajusta automaticamente esses pesos

Repetimos esse processo várias vezes (**épocas**) até que o modelo aprenda bem.

## 8. Avaliação do Modelo

Depois de treinar, testamos o modelo com os dados que ele **nunca viu antes** (conjunto de teste).

Calculamos a **acurácia**, ou seja, quantas previsões foram corretas em relação ao total.

Exemplo:
- Se acertou 28 em 30 previsões → Acurácia = 93.33%

## 9. Resumo das Etapas do Projeto

| Etapa | Descrição |
|-------|-----------|
| 1. Carregar dados | Ler o dataset CSV |
| 2. Limpar dados | Preencher valores faltantes |
| 3. Preparar alvo | Criar coluna binária `feedback_Bom` |
| 4. Separar treino/teste | Dividir dados para validação |
| 5. Criar rede neural | Definir arquitetura simples |
| 6. Treinar modelo | Usar dados de treino para aprendizado |
| 7. Testar modelo | Verificar desempenho nos dados de teste |

## 10. Ferramentas Utilizadas

- **Pandas**: Manipulação de dados (ler CSV, limpar, criar novas colunas)
- **NumPy**: Suporte matemático para operações com vetores
- **Scikit-learn**: Divisão dos dados em treino e teste
- **PyTorch**: Criação e treinamento da rede neural

## 11. Glossário Simples

| Termo | Significado |
|-------|-------------|
| Feature | Informações de entrada (idade, renda, nota) |
| Target | Resultado que queremos prever (feedback Bom ou Não) |
| Tensor | Estrutura de dados usada no PyTorch (similar a listas ou arrays) |
| Logit | Valor bruto da saída da rede antes da ativação final |
| Epoch | Uma passagem completa pelos dados de treino |
| Loss | Medida de erro do modelo |
| Accuracy | Percentual de previsões corretas |

## 12. Conclusão

Este projeto mostra como podemos usar técnicas de Deep Learning para fazer previsões com dados reais. Mesmo sendo um exemplo simples, ele cobre todas as etapas importantes de um projeto de Machine Learning:

1. Limpeza e preparação dos dados  
2. Escolha do modelo  
3. Treinamento e ajuste  
4. Avaliação do desempenho  
