In [20]:
#Importações
import pandas as pd
import great_expectations as gx

In [21]:
#Criação do contexto

context = gx.get_context()

# Leitura do arquivo csv
df = pd.read_csv("data/usuarios.csv")

In [25]:
df_gx = gx.from_pandas(df)

# Validação para verificar que os campos existem
df_gx.expect_column_to_exist(column="Nome")
df_gx.expect_column_to_exist(column="Matrícula")
df_gx.expect_column_to_exist(column="E-mail")
df_gx.expect_column_to_exist(column="Telefone")

# Validação para verificar se os campos estão nos tipos corretos
df_gx.expect_column_values_to_be_of_type(column="Nome", type_="str")
df_gx.expect_column_values_to_be_of_type(column="Matrícula", type_="str")
df_gx.expect_column_values_to_be_of_type(column="E-mail", type_="str")
df_gx.expect_column_values_to_be_of_type(column="Telefone", type_="str")

# Validação para verificar se os campos obrigatórios não estão nulos
df_gx.expect_column_values_to_not_be_null(column="Nome")
df_gx.expect_column_values_to_not_be_null(column="Matrícula")
df_gx.expect_column_values_to_not_be_null(column="E-mail")

# Validação para verificar se Matrícula e E-mail não são repetidos
df_gx.expect_column_values_to_be_unique(column="Matrícula")
df_gx.expect_column_values_to_be_unique(column="E-mail")


# Validar os dados
results = df_gx.validate()

def gerar_resumo(results):
    total_expectations = len(results["results"])
    successful_expectations = sum(result["success"] for result in results["results"])
    unsuccessful_expectations = total_expectations - successful_expectations

    print("Summary:")
    for result in results["results"]:
        expectation_type = result["expectation_config"]["expectation_type"]
        column = result["expectation_config"]["kwargs"].get("column", "Tabela")
        success = result["success"]
        print(f"- Expectation: {expectation_type} na coluna '{column}' - {'Passed' if success else 'Failed'}")
    
    print("\nFinal Summary:")
    print(f"Test cases in the test suite: {total_expectations}")
    print(f"Expectations with 'Passed' status: {successful_expectations}")
    print(f"Expectations with 'Failed' status: {unsuccessful_expectations}")

# Gerar e exibir o relatório amigável
gerar_resumo(results)

Summary:
- Expectation: expect_column_to_exist na coluna 'Nome' - Passed
- Expectation: expect_column_values_to_be_of_type na coluna 'Nome' - Passed
- Expectation: expect_column_values_to_not_be_null na coluna 'Nome' - Passed
- Expectation: expect_column_to_exist na coluna 'Matrícula' - Passed
- Expectation: expect_column_values_to_be_of_type na coluna 'Matrícula' - Passed
- Expectation: expect_column_values_to_not_be_null na coluna 'Matrícula' - Passed
- Expectation: expect_column_values_to_be_unique na coluna 'Matrícula' - Passed
- Expectation: expect_column_to_exist na coluna 'E-mail' - Passed
- Expectation: expect_column_values_to_be_of_type na coluna 'E-mail' - Passed
- Expectation: expect_column_values_to_not_be_null na coluna 'E-mail' - Passed
- Expectation: expect_column_values_to_be_unique na coluna 'E-mail' - Passed
- Expectation: expect_column_to_exist na coluna 'Telefone' - Passed
- Expectation: expect_column_values_to_be_of_type na coluna 'Telefone' - Passed

Final Summary