In [None]:
import os
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Definir o caminho da pasta onde estão os arquivos
data_path = "data/"

# Listar os arquivos CSV na pasta
csv_files = [f for f in os.listdir(data_path) if f.endswith('.csv')]

# Loop para carregar e analisar cada arquivo
for file in csv_files:
    file_path = os.path.join(data_path, file)
    print(f"\n🔍 Analisando o arquivo: {file}\n")
    
    # Carregar o dataset
    df = pd.read_csv(file_path)

    # Exibir as 5 primeiras linhas
    print("📌 Primeiras 5 linhas do dataset:")
    display(df.head())

    # Informações gerais sobre o dataset
    print("\n📊 Informações gerais do dataset:")
    print(df.info())

    # Estatísticas descritivas das colunas numéricas
    print("\n📈 Estatísticas descritivas:")
    display(df.describe())

    # Verificar valores ausentes
    print("\n❗ Valores ausentes por coluna:")
    print(df.isnull().sum())

    # Exibir a distribuição das variáveis numéricas
    df.hist(figsize=(12, 8), bins=30, edgecolor="black")
    plt.suptitle(f'Distribuição das variáveis numéricas - {file}')
    plt.show()

    # Exibir o mapa de calor da correlação
    plt.figure(figsize=(10, 6))
    sns.heatmap(df.corr(), annot=True, cmap="coolwarm", fmt=".2f")
    plt.title(f'Matriz de Correlação - {file}')
    plt.show()

    print("\n" + "-"*50 + "\n")
