In [11]:
import pandas as pd
import glob
import os

#  processar todos os CSV e transformá-los em DataFrames do Pandas usando um loop.
for arquivo in glob.glob('/content/*.csv'):
    nome_variavel = 'df_' + os.path.splitext(os.path.basename(arquivo))[0]
    globals()[nome_variavel] = pd.read_csv(arquivo)


# Lista com todos os dataframes criados para passar como argumentos para a função
datasets_exemplo = [
    df_vendas,
    df_clientes,
    df_estoque,
    df_logs,
    df_avaliacoes
]

# Lista com os nomes para cada dataframe para passar como argumentos para a função
titulos_exemplo = [
    "Vendas",
    "Clientes",
    "Estoque",
    "Logs de Acesso",
    "Avaliações"
]

In [None]:
def analisar_dataframes(lista_dfs: list, nomes_dfs: list) -> pd.DataFrame:
    """
    Realiza uma análise exploratória completa em uma lista de DataFrames.
    """
    def formatar_memoria(bytes_):
        """Formata bytes em KB ou MB para melhor leitura."""
        if bytes_ < 1024**2:
            return f"{bytes_/1024:.2f} KB"
        return f"{bytes_/(1024**2):.2f} MB"

    resumo = []
    for nome, df in zip(nomes_dfs, lista_dfs):
        nulos_detalhe = {col: n for col, n in df.isnull().sum().items() if n > 0}
        total_celulas = df.size

        info = {
            "Dataset": nome,
            "Linhas": df.shape[0],
            "Colunas": df.shape[1],
            "Linhas Duplicadas": df.duplicated().sum(),
            "Uso de Memória": formatar_memoria(df.memory_usage(deep=True).sum()),
            "Total de Nulos": df.isnull().sum().sum(),
            "% de Nulos": (df.isnull().sum().sum() / total_celulas) * 100 if total_celulas > 0 else 0,
            "Colunas com Nulos": len(nulos_detalhe),
            "Detalhe dos Nulos": nulos_detalhe if nulos_detalhe else "Nenhum",
            "Tipos de Dados": df.dtypes.value_counts().to_dict()
        }
        resumo.append(info)

    df_resumo = pd.DataFrame(resumo)

    # Formatação final
    df_resumo['% de Nulos'] = df_resumo['% de Nulos'].map('{:.2f}%'.format)

    return df_resumo


# Chamando a função analisar_dataframes
info_completa_df = analisar_dataframes(datasets_exemplo, titulos_exemplo)
display(info_completa_df)

Unnamed: 0,Dataset,Linhas,Colunas,Linhas Duplicadas,Uso de Memória,Total de Nulos,% de Nulos,Colunas com Nulos,Detalhe dos Nulos,Tipos de Dados
0,Vendas,6,5,1,1.00 KB,2,6.67%,2,"{'Quantidade': 1, 'Preço_Unitario': 1}","{object: 2, float64: 2, int64: 1}"
1,Clientes,5,4,0,1.04 KB,1,5.00%,1,{'Idade': 1},"{object: 3, int64: 1}"
2,Estoque,4,3,0,0.65 KB,0,0.00%,0,Nenhum,"{object: 2, int64: 1}"
3,Logs de Acesso,10,6,0,1.60 KB,4,6.67%,2,"{'IP_Address': 3, 'Response_Time_ms': 1}","{object: 2, int64: 2, datetime64[ns]: 1, float..."
4,Avaliações,10,2,2,1.17 KB,6,30.00%,1,{'Comentario': 6},{object: 2}


In [None]:
# Lista dos DataFrames
dataframes_para_salvar = {
    "vendas": df_vendas,
    "clientes": df_clientes,
    "estoque": df_estoque,
    "logs_de_acesso": df_logs,
    "avaliacoes": df_avaliacoes
}

# Loop para salvar cada DataFrame em um arquivo CSV
print("Iniciando a geração dos arquivos CSV...")

for nome_arquivo, dataframe in dataframes_para_salvar.items():

    filename = f"{nome_arquivo}.csv"

    dataframe.to_csv(filename, index=False, encoding='utf-8-sig')

    print(f"-> Arquivo '{filename}' gerado com sucesso!")

print("\nProcesso concluído!")

Iniciando a geração dos arquivos CSV...
-> Arquivo 'vendas.csv' gerado com sucesso!
-> Arquivo 'clientes.csv' gerado com sucesso!
-> Arquivo 'estoque.csv' gerado com sucesso!
-> Arquivo 'logs_de_acesso.csv' gerado com sucesso!
-> Arquivo 'avaliacoes.csv' gerado com sucesso!

Processo concluído!
