<a href="https://colab.research.google.com/github/PedroTonus/praticasGSI073/blob/main/GSI073_aula0_regressao_logistica.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# GSI073 - Tópicos Especiais de Inteligência Artificial

## Definição dos dados

In [None]:
import torch
import sklearn
from sklearn.model_selection import train_test_split

# 1. Carregar dados
iris = sklearn.datasets.load_iris()
X = iris.data        # 4 features: sépalas e pétalas
y = (iris.target == 1).astype(float)  # 1 se Versicolor, 0 caso contrário

# 2. Preparar dados para pytorch e dividir em treino e teste
X = torch.tensor(X, dtype=torch.float32)
y = torch.tensor(y, dtype=torch.float32).view(-1, 1)

# Dividir os dados em treino e teste (75 para treino, restante para teste)
X_treino, X_teste, y_treino, y_teste = train_test_split(X, y, train_size=75, random_state=42)

# Exibir o tamanho dos conjuntos
print(f"Tamanho do conjunto de treino: {X_treino.shape[0]}")
print(f"Tamanho do conjunto de teste: {X_teste.shape[0]}")

## Definição do modelo e treinamento

In [None]:
# 3. Definir modelo: regressão logística
modelo = torch.nn.Linear(4, 1)  # 4 features → 1 saída (probabilidade de ser Versicolor)

# 4. Definir função de perda e algoritmo de otimização
funcao_perda = torch.nn.BCEWithLogitsLoss()  # combinação de sigmoid + BCE
optimizer = torch.optim.SGD(modelo.parameters(), lr=0.1)

## Execução do treinamento

In [None]:
# 5. Treino
for epoch in range(1000):
    optimizer.zero_grad() # reseta gradiente senão acumula
    outputs = modelo(X_treino)
    loss = funcao_perda(outputs, y_treino)
    loss.backward()
    optimizer.step()

    if (epoch + 1) % 10 == 0:
        print(f"Época [{epoch+1}/100], Loss: {loss.item():.4f}")

In [None]:
# 6. Teste (avaliação)
# Remova o loop for, pois o teste é feito após o treino completo
with torch.no_grad(): # Desativa o cálculo de gradientes durante o teste
    outputs_teste = modelo(X_teste)
    previsoes = (outputs_teste > 0).float() # Transforma logits em previsões binárias

    # Calcular a acurácia
    acuracia = (previsoes == y_teste).float().mean()
    print(f"Acurácia no conjunto de teste: {acuracia.item():.4f}")