In [3]:
import pandas as pd
import numpy as np
from scipy.stats import skew, kurtosis
import warnings
import os

# Configuração
pd.options.display.float_format = '{:.4f}'.format
warnings.filterwarnings("ignore")

# Caminho do arquivo
file_path = "2-resultados_sorteios.csv"

# Verificação e leitura do arquivo
try:
    df = pd.read_csv(file_path, sep="\t", engine="python")
    df.columns = [f"col_{i}" for i in range(1, df.shape[1] + 1)]
    df_numeric = df.apply(pd.to_numeric, errors='coerce')

    # Seleção das colunas dos sorteios
    sorteio_data = df_numeric.iloc[:, 2:]  # da 3ª coluna em diante
    valores = sorteio_data.values.flatten()
    valores = valores[~np.isnan(valores)]

    # Estatísticas Descritivas Gerais
    estatisticas = {
        "Válidos": len(valores),
        "Ausentes": sorteio_data.size - len(valores),
        "Mínimo": np.min(valores),
        "Máximo": np.max(valores),
        "Mediana": np.median(valores),
        "Média": np.mean(valores),
        "Desvio padrão": np.std(valores, ddof=1),
        "Coeficiente de variação (%)": (np.std(valores, ddof=1) / np.mean(valores)) * 100,
        "Erro padrão da média": np.std(valores, ddof=1) / np.sqrt(len(valores)),
        "Variância": np.var(valores, ddof=1),
        "Assimetria": skew(valores),
        "Erro padrão da assimetria": np.sqrt(6 / len(valores)),
        "Curtose": kurtosis(valores),
        "Erro padrão da curtose": np.sqrt(24 / len(valores)),
    }

    # Resultado final
    df_results = pd.DataFrame.from_dict(estatisticas, orient="index", columns=["Valor"])
    print(df_results)

except FileNotFoundError:
    print(f"Erro: o arquivo '{file_path}' não foi encontrado.")

except pd.errors.EmptyDataError:
    print(f"Erro: o arquivo '{file_path}' está vazio ou mal formatado.")

except Exception as e:
    print(f"Ocorreu um erro ao processar os dados: {e}")


                                 Valor
Válidos                     29920.0000
Ausentes                        0.0000
Mínimo                          1.0000
Máximo                         55.0000
Mediana                        28.0000
Média                          28.0000
Desvio padrão                  15.8748
Coeficiente de variação (%)    56.6956
Erro padrão da média            0.0918
Variância                     252.0084
Assimetria                      0.0000
Erro padrão da assimetria       0.0142
Curtose                        -1.2008
Erro padrão da curtose          0.0283
