In [28]:
import pandas as pd

# Código de Cores ANSI
azul = "\033[38;5;33m"  #
verde = "\033[38;5;82m"  #
laranja = "\033[38;5;208m"  
reset = '\033[0m'

def calcular_estatisticas(df, coluna):
    """
    Calcula estatísticas descritivas de uma coluna numérica de um DataFrame.

    Parameters:
    df (pd.DataFrame): O DataFrame contendo os dados.
    coluna (str): O nome da coluna para calcular as estatísticas.

    Returns:
    dict: Um dicionário contendo várias estatísticas, ou uma mensagem de erro se a coluna não for numérica.
    """
    if coluna not in df.columns:
        return {"erro": "A coluna especificada não existe no DataFrame."}

    if not pd.api.types.is_numeric_dtype(df[coluna]):
        return {"erro": "A coluna especificada não é numérica."}
    
    # Calculando a Média
    media = df[coluna].mean()
    print(f'média: {azul}{media}{reset}')
    
    # Calculando a Mediana
    mediana = df[coluna].median()
    print(f'mediana: {azul}{mediana}{reset}')
    
    # Calculando a Moda
    frequencia = df[coluna].value_counts()
    max_frequencia = frequencia.max()
    modas = frequencia[frequencia == max_frequencia].index.tolist()
    
    if max_frequencia == 1:
        print("Não há moda.")
    elif len(modas) == len(frequencia):
        print("Não há moda, todos os elementos aparecem com a mesma frequência.")
    else:
        print(f'moda: {azul}{modas}{reset}')

    quartis = df[coluna].quantile([0.25, 0.5, 0.75]).tolist()  # Q1, Q2 (mediana), Q3
    maximo  = df[coluna].max()
    minimo  = df[coluna].min()
    amplitude = maximo - minimo
    variancia = df[coluna].var()
    desvio = df[coluna].std()
    erro_padrao = desvio / (len(df[coluna]) ** 0.5)  # Erro padrão da média
    coef_variacao = (desvio / media) * 100 if media != 0 else None  # Coeficiente de variação
    assimetria = df[coluna].skew()  # Assimetria
    curtose = df[coluna].kurtosis()  # Curtose

    # Imprimindo os resultados
    print("quartis (Q1, Q2, Q3):", quartis)
    print("amplitude:", amplitude)
    print("variância:", variancia)
    print("desvio padrão:", desvio)
    print("erro padrão:", erro_padrao)
    print("coeficiente de variação (%):", coef_variacao)
    print("assimetria:", assimetria)
    print("curtose:", curtose)

    return {
        "media": media,
        "mediana": mediana,
        "modas": modas,
        "quartis": quartis,
        "amplitude": amplitude,
        "variancia": variancia,
        "desvio_padrao": desvio,
        "erro_padrao": erro_padrao,
        "coef_variacao": coef_variacao,
        "assimetria": assimetria,
        "curtose": curtose
    }

# Exemplo de uso
# df = pd.DataFrame({'coluna_exemplo': [1, 2, 3, 4, 5]})
# resultado = calcular_estatisticas(df, 'coluna_exemplo')
# print(resultado)


In [29]:
# Exemplo de criação de um DataFrame
dados = {
    'idade': [25, 30, 35, 40, 45],
    'salario': [50000, 60000, 70000, 80000, 90000],
    'nome': ['Alice', 'Bob', 'Charlie', 'David', 'Eve']
}

df = pd.DataFrame(dados)

# Chamando a função para a coluna 'idade'
resultados = calcular_estatisticas(df, 'idade')
print(resultados)

# Chamando a função para a coluna 'nome' (que não é numérica)
resultados_invalido = calcular_estatisticas(df, 'nome')
print(resultados_invalido)

média: [38;5;33m35.0[0m
mediana: [38;5;33m35.0[0m
Não há moda.
quartis (Q1, Q2, Q3): [30.0, 35.0, 40.0]
amplitude: 20
variância: 62.5
desvio padrão: 7.905694150420948
erro padrão: 3.5355339059327373
coeficiente de variação (%): 22.587697572631278
assimetria: 0.0
curtose: -1.2000000000000002
{'media': 35.0, 'mediana': 35.0, 'modas': [25, 30, 35, 40, 45], 'quartis': [30.0, 35.0, 40.0], 'amplitude': 20, 'variancia': 62.5, 'desvio_padrao': 7.905694150420948, 'erro_padrao': 3.5355339059327373, 'coef_variacao': 22.587697572631278, 'assimetria': 0.0, 'curtose': -1.2000000000000002}
{'erro': 'A coluna especificada não é numérica.'}
