## Instanciando um Contexto de Dados

Obteremos um objeto DataContext com o seguinte código:

In [1]:
import great_expectations as gx

context = gx.get_context()

## Verificando o conteúdo do contexto de dados
Podemos garantir que o Data Context foi instanciado corretamente imprimindo seu conteúdo.

In [2]:
context

{
  "anonymous_usage_statistics": {
    "enabled": true,
    "explicit_id": true,
    "usage_statistics_url": "https://stats.greatexpectations.io/great_expectations/v1/usage_statistics",
    "data_context_id": "a214ff4d-5608-440d-bf08-eea48d27c380",
    "explicit_url": false
  },
  "checkpoint_store_name": "checkpoint_store",
  "config_version": 3,
  "data_docs_sites": {
    "local_site": {
      "class_name": "SiteBuilder",
      "show_how_to_buttons": true,
      "store_backend": {
        "class_name": "TupleFilesystemStoreBackend",
        "base_directory": "C:\\Users\\PCMATR~1\\AppData\\Local\\Temp\\tmpclhuah5t"
      },
      "site_index_builder": {
        "class_name": "DefaultSiteIndexBuilder"
      }
    }
  },
  "datasources": {},
  "evaluation_parameter_store_name": "evaluation_parameter_store",
  "expectations_store_name": "expectations_store",
  "include_rendered_content": {
    "globally": false,
    "expectation_validation_result": false,
    "expectation_suite": false


## 2. Conectando aos dados
Nos conectaremos aos dados .csv armazenados em nosso repositório:

In [4]:
validator = context.sources.pandas_default.read_csv('data/us_tax_data_2016.csv')

## 3. Criando Expectativas

Quando lemos nossos dados .csv, recebemos uma instância do __Validator__ de volta. 

Um __Validador__ é um objeto capaz de armazenar Expectativas sobre os dados aos quais está associado, bem como realizar introspecções sobre esses dados.

A seguir definiremos algumas Expectations.

Com a Expectation definida abaixo, estamos afirmando que esperamos que a coluna ``agi_stub`` seja sempre preenchida. 

Ou seja: nenhum dos valores da coluna deve ser nulo.

In [5]:
validator.expect_column_values_to_not_be_null('agi_stub')

Calculating Metrics:   0%|          | 0/6 [00:00<?, ?it/s]

{
  "meta": {},
  "result": {
    "element_count": 179796,
    "unexpected_count": 0,
    "unexpected_percent": 0.0,
    "partial_unexpected_list": []
  },
  "success": true,
  "exception_info": {
    "raised_exception": false,
    "exception_traceback": null,
    "exception_message": null
  }
}

## 4. Validando os dados

### 4.1 Executando as Expectativas definidas
Agora que definimos nossas expectativas, é hora do GX fazer uma introspecção de nossos dados e ver se eles correspondem ao que dissemos a GX para esperar. Para isso, definimos um Checkpoint (que nos permitirá repetir a Validação no futuro).

In [6]:
checkpoint = gx.checkpoint.SimpleCheckpoint(name='meu_checkpoint', date_context=context, validator=validator)

TypeError: SimpleCheckpoint.__init__() missing 1 required positional argument: 'data_context'

Uma vez criado o Checkpoint, vamos executá-lo e receber de volta os resultados da nossa Validação.

In [None]:
check_result = checkpoint.run()
check_result

### 4.2 Visualizando os resultados
O Great Expectations fornece uma maneira amigável e legível por humanos de visualizar os resultados de Validations: Data Docs. 

Nosso Checkpoint terá compilado automaticamente novos Data Docs para incluir os resultados da validação que executamos, para que possamos visualizá-los imediatamente:

In [None]:
val_result_identifier = checkpoint.list_validation_result_identifiers()[0]

### 4.3 Salvando o contexto de dados para uso futuro
Como não inicializamos anteriormente um Contexto de dados do sistema de arquivos ou especificamos um caminho para criar um, o Contexto de dados que recebemos de gx.get_context() era um Contexto de dados efêmero temporário na memória. 

Para salvar este Contexto de Dados para uso futuro, vamos convertê-lo em um Contexto de Dados do Sistema de Arquivos:

In [None]:
context.convert_to_file_context()

Você pode fornecer o caminho para uma pasta específica ao converter seu contexto de dados efêmeros em um contexto de dados do sistema de arquivos.
Se você fizer isso, seu contexto de dados do sistema de arquivos será inicializado nesse local. 
Caso contrário, seu novo contexto de dados do sistema de arquivos será inicializado na pasta em que seu script é executado.