In [1]:
import pandas as pd

In [4]:
def gerar_relatorio_qualidade(arquivo_csv):
    # Ler o arquivo CSV
    df = pd.read_csv(arquivo_csv)
    
    # excluir colunas NAME (não possui valor errado) e ORBITING BODY (mesmo valor para todas as linhas)
    df = df.drop(columns=['name','orbiting_body'])
    
    # Inicializar o relatório
    relatorio = {
        "coluna": [],
        "itens_faltantes": [],
        "itens_incorretos": [],
        "maximo": [],
        "minimo": [],
        "media": []
    }
    
    # Iterar pelas colunas do DataFrame
    for coluna in df.columns:
        relatorio["coluna"].append(coluna)
        
        # Contar itens faltantes
        itens_faltantes = df[coluna].isna().sum()
        relatorio["itens_faltantes"].append(itens_faltantes)
        
        # Identificar itens incorretos
        itens_incorretos = 0
        if df[coluna].dtype == 'object':
            itens_incorretos = df[coluna].apply(lambda x: not pd.api.types.is_numeric_dtype(type(x))).sum()
        relatorio["itens_incorretos"].append(itens_incorretos)
        
        # Calcular estatísticas básicas se for uma coluna numérica
        if pd.api.types.is_numeric_dtype(df[coluna]):
            maximo = df[coluna].max()
            minimo = df[coluna].min()
            media = df[coluna].mean()
        else:
            maximo = minimo = media = None
        
        relatorio["maximo"].append(maximo)
        relatorio["minimo"].append(minimo)
        relatorio["media"].append(media)
    
    # Converter o relatório para um DataFrame
    df_relatorio = pd.DataFrame(relatorio)
    
    return df_relatorio

In [5]:
# Exemplo de uso
arquivo_csv = 'nearest-earth-objects(1910-2024).csv'
relatorio_qualidade = gerar_relatorio_qualidade(arquivo_csv)
print(relatorio_qualidade)

                   coluna  itens_faltantes  itens_incorretos           maximo  \
0                  neo_id                0                 0         54462807   
1      absolute_magnitude               28                 0            33.58   
2  estimated_diameter_min               28                 0        37.545248   
3  estimated_diameter_max               28                 0        83.953727   
4       relative_velocity                0                 0    291781.106613   
5           miss_distance                0                 0  74798651.452197   
6            is_hazardous                0                 0             True   

        minimo         media  
0      2000433  1.759939e+07  
1         9.25  2.293252e+01  
2     0.000511  1.578120e-01  
3     0.001143  3.528785e-01  
4   203.346433  5.106066e+04  
5  6745.532516  4.153535e+07  
6        False  1.276231e-01  
