<a href="https://colab.research.google.com/github/fbdsfoa/AtvExtra/blob/master/Untitled8.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [9]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder, StandardScaler

# Baixar o dataset diretamente
url = "https://archive.ics.uci.edu/ml/machine-learning-databases/adult/adult.data"
column_names = [
    "age", "workclass", "fnlwgt", "education", "education-num",
    "marital-status", "occupation", "relationship", "race", "sex",
    "capital-gain", "capital-loss", "hours-per-week", "native-country", "income"
]
data = pd.read_csv(url, header=None, names=column_names, na_values=" ?", skipinitialspace=True)

# Remover valores faltantes
data.dropna(inplace=True)

# Separar variáveis independentes (X) e dependente (y)
X = data.iloc[:, :-1]
y = data.iloc[:, -1]

# Converter a variável alvo para 0 e 1
y = LabelEncoder().fit_transform(y)

# Transformar variáveis categóricas em numéricas (one-hot encoding)
X = pd.get_dummies(X)

# Normalizar variáveis contínuas
scaler = StandardScaler()
X = scaler.fit_transform(X)

# Dividir em conjuntos de treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


In [10]:
import torch
from torch.utils.data import DataLoader, TensorDataset

# Converter para tensores
X_train_tensor = torch.tensor(X_train, dtype=torch.float32)
y_train_tensor = torch.tensor(y_train, dtype=torch.float32)
X_test_tensor = torch.tensor(X_test, dtype=torch.float32)
y_test_tensor = torch.tensor(y_test, dtype=torch.float32)

# Criar DataLoaders para facilitar o treinamento
train_dataset = TensorDataset(X_train_tensor, y_train_tensor)
test_dataset = TensorDataset(X_test_tensor, y_test_tensor)

train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=32, shuffle=False)


In [11]:
import torch.nn as nn
import torch.nn.functional as F

class FullyConnectedNet(nn.Module):
    def __init__(self, input_size):
        super(FullyConnectedNet, self).__init__()
        self.fc1 = nn.Linear(input_size, 128)
        self.fc2 = nn.Linear(128, 64)
        self.fc3 = nn.Linear(64, 1)  # Saída para classificação binária

    def forward(self, x):
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = torch.sigmoid(self.fc3(x))  # Sigmoid para probabilidade entre 0 e 1
        return x

input_size = X_train.shape[1]
model = FullyConnectedNet(input_size)


In [12]:
criterion = nn.BCELoss()  # Função de perda para classificação binária
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)

epochs = 20
for epoch in range(epochs):
    model.train()
    total_loss = 0

    for X_batch, y_batch in train_loader:
        # Resetar os gradientes
        optimizer.zero_grad()

        # Forward pass
        y_pred = model(X_batch).squeeze()
        loss = criterion(y_pred, y_batch)

        # Backward pass e atualização de pesos
        loss.backward()
        optimizer.step()

        total_loss += loss.item()

    print(f"Epoch {epoch+1}/{epochs}, Loss: {total_loss/len(train_loader):.4f}")


Epoch 1/20, Loss: 0.3471
Epoch 2/20, Loss: 0.3136
Epoch 3/20, Loss: 0.3048
Epoch 4/20, Loss: 0.3004
Epoch 5/20, Loss: 0.2958
Epoch 6/20, Loss: 0.2904
Epoch 7/20, Loss: 0.2871
Epoch 8/20, Loss: 0.2833
Epoch 9/20, Loss: 0.2783
Epoch 10/20, Loss: 0.2739
Epoch 11/20, Loss: 0.2711
Epoch 12/20, Loss: 0.2660
Epoch 13/20, Loss: 0.2616
Epoch 14/20, Loss: 0.2586
Epoch 15/20, Loss: 0.2535
Epoch 16/20, Loss: 0.2501
Epoch 17/20, Loss: 0.2458
Epoch 18/20, Loss: 0.2410
Epoch 19/20, Loss: 0.2379
Epoch 20/20, Loss: 0.2342


In [13]:
from sklearn.metrics import accuracy_score

model.eval()
y_pred = []

with torch.no_grad():
    for X_batch, _ in test_loader:
        preds = model(X_batch).squeeze()
        y_pred.extend((preds > 0.5).int().numpy())

accuracy = accuracy_score(y_test, y_pred)
print(f"Acurácia no conjunto de teste: {accuracy:.4f}")


Acurácia no conjunto de teste: 0.8475


In [17]:
# Salvar o modelo treinado
torch.save(model.state_dict(), "fully_connected_model.pth")
print("Modelo salvo em 'fully_connected_model.pth'")

# Recriar a estrutura do modelo
loaded_model = FullyConnectedNet(input_size)
loaded_model.load_state_dict(torch.load("fully_connected_model.pth"))
loaded_model.eval()  # Colocar o modelo em modo de avaliação
print("Modelo carregado com sucesso!")


Modelo salvo em 'fully_connected_model.pth'
Modelo carregado com sucesso!


  loaded_model.load_state_dict(torch.load("fully_connected_model.pth"))


In [25]:
import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.utils.data import DataLoader, TensorDataset
import numpy as np
import pandas as pd
from sklearn.metrics import accuracy_score
from sklearn.preprocessing import StandardScaler

# Suponha que você tenha um DataFrame X que foi usado para treinar o modelo
# Exemplo de dado de treinamento (defina com seus dados reais)
# X = pd.DataFrame(...) # Dados de treinamento

# Exemplo de dado novo (substitua pelos seus dados reais)
new_data = np.array([[39, 'State-gov', 77516, 'Bachelors', 13, 'Never-married',
                      'Adm-clerical', 'Not-in-family', 'White', 'Male', 2174,
                      0, 40, 'United-States']])

# Nomes das colunas
column_names = ['age', 'workclass', 'fnlwgt', 'education', 'education-num',
                  'marital-status', 'occupation', 'relationship', 'race', 'sex',
                  'capital-gain', 'capital-loss', 'hours-per-week', 'native-country', 'income']

# Converter new_data para DataFrame usando column_names (sem a coluna 'income')
new_data = pd.DataFrame(new_data, columns=column_names[:-1])

# Aplicar one-hot encoding com pd.get_dummies
new_data = pd.get_dummies(new_data)

# Garantir que new_data tenha as mesmas colunas de X (dados de treinamento)
# Reindexar new_data para combinar com as colunas de X_train
new_data = new_data.reindex(columns=X.columns, fill_value=0)  # Colunas de X.train

# Carregar o scaler (supondo que o scaler foi treinado com os dados de treinamento)
# Exemplo: scaler = StandardScaler().fit(X)
scaler = StandardScaler()  # Isso deve ser o scaler que você usou para treinar o modelo
new_data = scaler.fit_transform(new_data)  # Transformar os novos dados com o scaler

# Converter para tensor
new_data_tensor = torch.tensor(new_data, dtype=torch.float32)

# Carregar o modelo treinado (supondo que o modelo foi salvo em 'loaded_model')
# Exemplo: loaded_model = torch.load('path_to_model.pth')
# Supondo que você tenha um modelo carregado com 'loaded_model'

with torch.no_grad():
    prediction = loaded_model(new_data_tensor).squeeze().item()
    print(f"Probabilidade de renda >50K: {prediction:.4f}")
    print("Classe prevista:", ">=50K" if prediction > 0.5 else "<50K")

# Avaliar a acurácia no conjunto de teste
y_pred = []

# Supondo que você tenha um DataLoader com os dados de teste, como test_loader
# Exemplo: test_loader = DataLoader(test_data, batch_size=64)

with torch.no_grad():
    for X_batch, _ in test_loader:
        preds = loaded_model(X_batch).squeeze()
        y_pred.extend((preds > 0.5).int().numpy())

# Calcular a acurácia
accuracy = accuracy_score(y_test, y_pred)  # y_test é o conjunto de rótulos verdadeiros de teste
print(f"Acurácia no conjunto de teste (modelo carregado): {accuracy:.4f}")


Probabilidade de renda >50K: 0.6386
Classe prevista: >=50K
Acurácia no conjunto de teste (modelo carregado): 0.8475
