# ðŸ”¥ Desafio - **AvaliaÃ§Ã£o de conformidade - Monitoramento hÃ­drico**

## Enunciado:

- As tabelas **`parameter_sample`** e **`parameter_result`** armazenam dados de amostras e resultados, respectivamente, de monitoramento de qualidade hÃ­drica.
- As tabelas **`zlegislation_record`** e **`zstandard_reference`** armazenam padrÃµes legais e os limites estipulados para cada parÃ¢metro, respectivamente.
- A tabela **`zparameters`** armazena os parÃ¢metros de monitoramento hÃ­drico de qualidade, juntamente com suas propriedades.
- As amostras sÃ£o derivadas dos pontos de monitoramento (tabela `station`) e os resultados sÃ£o derivados das amostras. 

O esquema a seguir ilustra os relacionamentos entre as tabelas (alguns campos foram omitidos para melhorar a visualizaÃ§Ã£o).

![station_samples_results](../../img/desafios/aula04/sql_diagram.png)

> Note que nÃ£o foi estabelecido um relacionamento direto entre o conjunto de tabelas com dados do monitoramento (`station`, `parameter_sample` e `parameter_result`) e as tabelas com legislaÃ§Ãµes e limites (`zlegislation_record` e `zstandard_reference`). A modelagem destes dados no projeto foi realizada de maneira simplificada, nÃ£o considerando totalmente a normalizaÃ§Ã£o de alguns campos comuns, como o da matriz.

Como citado no desafio anterior, uma anÃ¡lise comum e de muita importÃ¢ncia inerente aos dados de qualidade hÃ­drica, Ã© a **avaliaÃ§Ã£o de conformidade legal**, atravÃ©s da comparaÃ§Ã£o das mediÃ§Ãµes a valores de referÃªncia.

## Objetivo
O desafio Ã© escrever uma consulta SQL para alimentar um *dashboard* de anÃ¡lise de conformidade hÃ­drica, em que um dos indicadores Ã© a quantidade de resultados em desacordo com os limites legais de uma determinada legislaÃ§Ã£o.
Deve ser possÃ­vel **selecionar uma ou mais legislaÃ§Ãµes** (assim como pontos e/ou parÃ¢metros) pela interface da ferramenta analÃ­tica e o indicador deve retornar o total de desvios para as legislaÃ§Ãµes selecionadas.

HÃ¡ diferentes formas de resolver este problema, sendo um deles a criaÃ§Ã£o de um modelo *star-schema* (fato-dimensÃ£o), a partir das tabelas envolvidas. Vamos adotar esta abordagem.

Os seguintes campos devem estar presentes no modelo de dados:
- Codigo HGA: Nome HGA do ponto de monitoramento (station.Name)
- Tipo Ponto: Tipo do ponto de monitoramento (station.stn_type)
- Local: LocalizaÃ§Ã£o do ponto de monitoramento (station.zlocation)
- Matriz: Matriz do ponto de monitoramento (station.zmatrix)
- Enquadramento: Classe de enquadramento do ponto de monitoramento (station.zlegal_framework)
- ID Amostra: Identificador da amostra de qualidade (parameter_sample.sample_id ou parameter_result.sample_id)
- Data Amostra: Data de amostragem (parameter_sample.sample_date)
- Parametro: Nome do parametro quÃ­mico analisado (parameter_result.chemical_name ou zparameters.chemical_name)
- Grupo Parametro: Agrupamento dos parÃ¢metros quÃ­micos de acordo com sua natureza (zparameters.zparameter_group)
- Resultado: Valor numÃ©rico obtido na anÃ¡lise do parÃ¢metro (parameter_result.result_value)
- Unidade: Unidade referente ao parÃ¢metro analisado (parameter_result.result_unit)
- LegislaÃ§Ã£o: Nome da legislaÃ§Ã£o a qual os resultados estÃ£o sendo comparados (zlegislation_record.zreference_legislation ou zstandard_reference.zreference_legislation)
- Limite Min: Valor minimo estabelecido pela legislaÃ§Ã£o, para o parÃ¢metro em questÃ£o (zstandard_reference.zminimum_limit)
- Limite Max: Valor maximo estabelecido pela legislaÃ§Ã£o, para o parÃ¢metro em questÃ£o (zstandard_reference.zmaximum_limit)
- **Validacao: [Conforme/NÃ£o Conforme/Sem ComparaÃ§Ã£o] CÃ¡lculo indicando se o resultado estÃ¡ de acordo ou nÃ£o com os respectivos limites (??)**

Obs.: Os resultados de um ponto devem ser comparados aos limites **de todas as legislaÃ§Ãµes pertinentes**, considerando os campos **matriz** e **enquadramento**. Ex.: Os pontos de **Ã¡gua superficiais** de enquadramento **classe 2** devem ser comparados Ã s legislaÃ§Ãµes `CONAMA 357/2005_Doce II` e `COPAM 01/2008_Doce II`.

****

### Entendendo o problema

Neste caso, precisamos combinar tabelas utilizando algumas regras lÃ³gicas que **nÃ£o estÃ£o presentes na estrutura do prÃ³prio banco de dados**. Por exemplo, nÃ£o hÃ¡ um relacionamento fÃ­sico entre o campo `station.zmatrix` e o campo `zlegislation_record.zmatrix` ... porÃ©m, esta relaÃ§Ã£o Ã© fundamental para antender ao objetivo.

Ao utilizar ferramentas como o *Query Designer*, esta lÃ³gica nÃ£o Ã© considerada automaticamente.

![Query Designer](../../img/desafios/aula04/query_designer.png)

> Esta consulta nÃ£o retornarÃ¡ os registros corretos..

In [None]:
-- -- Tabelas envolvidas
-- SELECT COUNT(ID) FROM station
SELECT COUNT(Station) FROM parameter_sample
SELECT COUNT(Station) FROM parameter_result
SELECT COUNT(zreference_legislation) FROM zlegislation_record
SELECT COUNT(zreference_legislation) FROM zstandard_reference

-- -- station + amostras
-- SELECT COUNT(s.ID) FROM station s INNER JOIN parameter_sample a ON s.ID = a.Station

-- -- amostras + resultados
-- SELECT COUNT(a.sample_id)
-- FROM parameter_sample a 
--     INNER JOIN parameter_result r 
--         ON a.Station = r.Station
--         AND a.sample_id = r.sample_id


In [None]:
-- ðŸ’¡ Dica 1: Ã‰ esperado que a tabela final possua mais linhas que as tabelas envolvidas, uma vez que um resultado pode ter correspondÃªncia a limites de mÃºltiplas legislaÃ§Ãµes
-- ðŸ’¡ Dica 2: Nem todos os parÃ¢metros possuem limites definidos nas legislaÃ§Ãµes.. Como garantir que eles nÃ£o sejam excluÃ­dos da tabela final ?

    SELECT  s.Name                         AS [Codigo HGA]
           ,s.zlocation                   AS [Local]
           ,s.zmatrix                     AS [Matriz]
           ,s.stn_type                    AS [Tipo Ponto]
           ,s.zlegal_framework            AS [Classe Enquadramento]
           ,a.sample_id                   AS [ID Amostra]
           ,a.sample_date                 AS [Data Amostra]
           ,r.chemical_name               AS [Parametro]
           ,r.result_value                AS [Resultado Numerico]
           ,r.result_unit                 AS [Unidade]
           ,p.zparameter_group            AS [Grupo Parametro]
           ,lr.zreference_legislation     AS [Legislacao]
           ,lim.zminimum_limit            AS [Limite Min]
           ,lim.zmaximum_limit            AS [Limite Max]
           ,CASE
               WHEN lim.zmaximum_limit IS NULL AND lim.zminimum_limit IS NULL THEN 'Sem ComparaÃ§Ã£o'
               WHEN
                   (lim.zmaximum_limit IS NOT NULL AND r.result_value > lim.zmaximum_limit) OR
                   (lim.zminimum_limit IS NOT NULL AND r.result_value < lim.zminimum_limit)
               THEN 'NÃ£o Conforme'
               ELSE 'Conforme'
           END                            AS [ValidaÃ§Ã£o]
      /* Primeiro as maiores tabelas */
      FROM parameter_result r
      /* RIGHT JOIN para retornar amostras sem correspondÃªncia
         Podem existir amostras sem resultados analisados */
RIGHT JOIN parameter_sample a
        ON a.sample_id = r.sample_id
    --     ON a.Station = r.Station
    --    AND a.sample_id = r.sample_id
INNER JOIN station s
        ON s.ID = a.Station
INNER JOIN zparameters p
        ON r.chemical_name = p.zchemical_name
        /* LEFT JOIN para preservar todos os resultados,
           inclusive dos parÃ¢metros sem limite correspondente */
 LEFT JOIN zlegislation_record lr
        ON lr.zmatrix = s.zmatrix
       AND lr.zlegal_framework = s.zlegal_framework
 LEFT JOIN zstandard_reference lim
        ON lr.zreference_legislation = lim.zreference_legislation
       AND lim.zchemical_name = p.zchemical_name

# ðŸ¤¯ Desafio desafiador

A consulta proposta anteriormente envolve a mesclagem (JOIN) de vÃ¡rias tabelas - `parameter_sample`, `parameter_result`, `station`, `zparameters`, `zlegislation_record` e `zstandard_reference` - o que pode tornÃ¡-la computacionalmente cara.

Analise o plano de execuÃ§Ã£o da consulta e avalie como ela pode ser otimizada. Lembre-se que o objetivo principal (*dashboard*) deve ser atendido.