In [None]:
import os
import pandas as pd
from kaggle.api.kaggle_api_extended import KaggleApi
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import classification_report

# ========== 1. Baixar os dados do Kaggle ==========

# Caminho para a chave da API do Kaggle (kaggle.json)
os.environ['KAGGLE_CONFIG_DIR'] = os.path.expanduser('C:/Users/Gabriel Albuquerque/.kaggle')

# Inicializar e autenticar
api = KaggleApi()
api.authenticate()

# Nome do dataset e caminho de destino
dataset = 'ankushpanday1/alzheimers-prediction-dataset-global'
download_path = 'datasets/'

# Baixar e descompactar os arquivos
api.dataset_download_files(dataset, path=download_path, unzip=True)

# ========== 2. Carregar os dados ==========
# Verificar os arquivos disponíveis
print("Arquivos disponíveis:", os.listdir(download_path))



In [None]:
# Substitua abaixo pelo nome do CSV real que foi baixado
csv_name = 'AlzheimerDataset.csv'
csv_path = os.path.join(download_path, csv_name)

df = pd.read_csv(csv_path)

# Visualizar os dados
print("Amostra dos dados:")
print(df.head())
print("\nInformações:")
print(df.info())

# ========== 3. Pré-processamento e MLP ==========

# Substitua "Diagnosis" pela coluna que representa o rótulo (target)
target_column = 'Class'  # ou 'Diagnosis', dependendo do nome real
X = df.drop(columns=[target_column])
y = df[target_column]

# Normalização
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Separar treino e teste
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)

# Criar e treinar o modelo
mlp = MLPClassifier(hidden_layer_sizes=(100, 50), max_iter=500, random_state=42)
mlp.fit(X_train, y_train)

# Avaliar o modelo
y_pred = mlp.predict(X_test)
print("\nRelatório de Classificação:")
print(classification_report(y_test, y_pred))
