<a href="https://colab.research.google.com/github/ferdinandrafols/IA_LLMs/blob/main/gsi073_aula0_regressao_logistica.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# GSI073 - Tópicos Especiais de Inteligência Artificial

## Definição dos dados

In [None]:
import torch
import sklearn

# 1. Carregar dados
iris = sklearn.datasets.load_iris()
X = iris.data        # 4 features: sépalas e pétalas
y = (iris.target == 1).astype(float)  # 1 se Versicolor, 0 caso contrário

# 2. Preparar dados para pytorch
X = torch.tensor(X, dtype=torch.float32)
y = torch.tensor(y, dtype=torch.float32).view(-1, 1)

# 👇 Adicionando prints para visualizar
print("Shape de X:", X.shape)
print("Primeiras 5 linhas de X:\n", X[:5])

print("Shape de y:", y.shape)
print("Primeiras 5 linhas de y:\n", y[:5])


Excelente pergunta 👌 — **sim**, o resultado que você obteve está **correto e bom** ✅

Vamos justificar por partes 👇

---

## 🧠 **1. Estrutura dos dados**

📊 **`X` com shape `(150, 4)`** → **perfeito**.

* O dataset Iris tem exatamente **150 amostras**
* e **4 características** (sépalas e pétalas).
  ✅ Isso significa que você converteu os dados corretamente para tensor PyTorch.

📌 Se tivesse dado errado, você veria:

* `X` com shape diferente de `(150, 4)`
* erro de tipo de dado
* ou até erros no `torch.tensor(...)`.

---

## 🌿 **2. Estrutura dos rótulos `y`**

📊 **`y` com shape `(150, 1)`** → **perfeito para classificação binária**.

* Você converteu corretamente `iris.target` (0, 1, 2) em **binário (0 e 1)**.
* Isso é exatamente o formato que funções de perda como

  * `nn.BCEWithLogitsLoss()` ou
  * `nn.BCELoss()`
    esperam.

✅ Isso significa que o modelo poderá aprender a **distinguir “Versicolor” (1)** de outras espécies (0).

---

## 🧮 **3. Valores das primeiras linhas de `y`**

```
[[0.],
 [0.],
 [0.],
 [0.],
 [0.]]
```

👉 Isso **também está correto**:

* No dataset original, as **primeiras 50 flores** são da classe `0` (Setosa).
* A classe `1` (Versicolor) só começa a aparecer da amostra 50 em diante.
* Por isso os primeiros rótulos são todos `0.`.

✅ Isso indica que a **transformação lógica `iris.target == 1` funcionou como esperado**.

---

## 🪄 **4. Tipos de dados**

Você usou:

```python
dtype=torch.float32
```

✅ Isso é **o tipo padrão ideal para treinar redes neurais** —
nem inteiro (`int`) nem double (`float64`), que é mais pesado.

---

## 📝 Conclusão Final

| Item Verificado      | Resultado            | Situação  |
| -------------------- | -------------------- | --------- |
| Shape de X           | `(150, 4)`           | ✅ Correto |
| Shape de y           | `(150, 1)`           | ✅ Correto |
| Conversão para float | `float32`            | ✅ Correto |
| Rótulos binários     | 0 ou 1               | ✅ Correto |
| Primeiros rótulos 0  | coerente com dataset | ✅ Correto |

✅ **Sim, o resultado foi bom.**
Você tem agora **os dados prontos para treinar um modelo de classificação binária no PyTorch** — por exemplo, uma rede simples com uma ou duas camadas lineares.

---

👉 Próximos passos comuns seriam:

* dividir em treino e teste,
* definir um modelo (`nn.Sequential` ou `nn.Module`),
* escolher função de perda (`BCEWithLogitsLoss`),
* usar `SGD` ou `Adam` como otimizador,
* e treinar.

Se quiser, posso montar um **modelo PyTorch completo (forward + treino)** com esses dados para você ver na prática. Deseja isso? 🧠⚡📉


## Definição do modelo e treinamento

In [None]:
# 3. Definir modelo: regressão logística
modelo = torch.nn.Linear(4, 1)  # 4 features → 1 saída (probabilidade de ser Versicolor)

# 4. Definir função de perda e algoritmo de otimização
funcao_perda = torch.nn.BCEWithLogitsLoss()  # combinação de sigmoid + BCE
optimizer = torch.optim.SGD(modelo.parameters(), lr=0.1)

## Execução do treinamento

In [None]:
# 5. Treino
for epoch in range(1000):
    optimizer.zero_grad() # reseta gradiente senão acumula
    outputs = modelo(X)
    loss = funcao_perda(outputs, y)
    loss.backward()
    optimizer.step()

    if (epoch + 1) % 10 == 0:
        print(f"Época [{epoch+1}/100], Loss: {loss.item():.4f}")