# Estatísticas Descritivas

In [8]:
import pandas as pd
import numpy as np
import joblib

In [9]:
df_categorias = joblib.load('../../util/data/df_categorias.z')
df_vendas = joblib.load('../../util/data/df_vendas.z')
df_vendedores = joblib.load('../../util/data/df_vendedores.z')
df_unidades = joblib.load('../../util/data/df_unidades.z')
df_clientes = joblib.load('../../util/data/df_clientes.z')
df_produtos = joblib.load('../../util/data/df_produtos.z')

In [10]:
dataframes = {
    "categorias": df_categorias,
    "vendas": df_vendas,
    "vendedores": df_vendedores,
    "unidades": df_unidades,
    "clientes": df_clientes,
    "produtos": df_produtos
}

In [11]:
def interpretar_variavel(coluna, serie):
    interpretacoes = []
    desvio = serie.std()
    media = serie.mean()
    skew = serie.skew()

    if desvio > media * 0.5:
        interpretacoes.append("Alta variabilidade.")
    if abs(skew) > 1:
        interpretacoes.append("Distribuição assimétrica.")
    elif 0.5 < abs(skew) <= 1:
        interpretacoes.append("Distribuição moderadamente assimétrica.")
    else:
        interpretacoes.append("Distribuição aproximadamente simétrica.")

    return " ".join(interpretacoes)

In [12]:
for nome_df, df in dataframes.items():
    with open(f"estatisticas_{nome_df}.txt", "w", encoding="utf-8") as f:
        f.write(f"Relatório estatístico - {nome_df.upper()}\n\n")
        
        colunas_numericas = df.select_dtypes(include=np.number).columns
        
        for coluna in colunas_numericas:
            serie = df[coluna].dropna()
            if len(serie) == 0:
                continue

            media = serie.mean()
            mediana = serie.median()
            moda = serie.mode().values
            desvio_padrao = serie.std()
            variancia = serie.var()
            amplitude = serie.max() - serie.min()
            interpretacao = interpretar_variavel(coluna, serie)

            f.write(f"Variável: {coluna}\n")
            f.write(f"  Média: {media:.2f}\n")
            f.write(f"  Mediana: {mediana:.2f}\n")
            f.write(f"  Moda: {moda}\n")
            f.write(f"  Desvio Padrão: {desvio_padrao:.2f}\n")
            f.write(f"  Variância: {variancia:.2f}\n")
            f.write(f"  Amplitude: {amplitude:.2f}\n")
            f.write(f"  Interpretação: {interpretacao}\n\n")
