# Manipulação de dados com SQL 🦑

![SQL](../img/aula02/sql_2.png)

## Revisão Aula 01

![Grupos SQL](../img/aula01/grupos_sql.png)

Os tipos da linguagem SQL são:

- **DQL - Data Query Language** - Linguagem de Consulta de dados.
    - São os comandos de consulta. Exemplos: `SELECT`, `FROM`
- **DML - Data Manipulation Language** - Linguagem de Manipulação de Dados.
    - São os comandos que interagem com os dados dentro das tabelas. Exemplos: `INSERT`, `DELETE`, e `UPDATE`.

### Ordem de execução dos comandos SQL

O SQL Server não faz o processamento dos dados na ordem de escrita, internamente o SQL Server segue a seguinte ordem:

![Execution Order](../img/aula01/execution_order.png)

## Funções de agregação 🍹

Para obter agregações, a partir de dados agregados, como a contagem de todos os registros pertencentes a uma categoria, precisamos utilizar a instrução `GROUP BY` combinada com uma das funções de agregação, `SUM()`, `COUNT()`, `AVG()`, `MAX()`, `MIN()` _etc_.

Funções SQL Server: [Aggregate Functions (Transact-SQL) - SQL Server | Microsoft Learn](https:\learn.microsoft.com\en-us\sql\t-sql\functions\aggregate-functions-transact-sql?view=sql-server-ver16)

In [1]:
USE [SQL_TREINAMENTO]
GO

In [6]:
-- Contagem de pontos cadastrados por matriz
SELECT
    zmatrix        AS [Matriz]
    ,COUNT(ID)     AS [Qtde Pontos]
FROM station
-- GROUP BY [Matriz]       -- Syntax error
GROUP BY [zmatrix]
ORDER BY COUNT(ID) DESC
-- ORDER BY [Qtde Pontos]

Matriz,Qtde Pontos
Agua Subterranea,366
Agua Superficial,217
Efluente,44
Efluente Sanitario,12
Climatologia,10
Ruido,8
Qualidade do Ar,8
Rejeito,2


In [7]:
-- Estatísticas do NA subterrâneo por ponto
SELECT
    Station
    ,COUNT(Station)         AS [Medições]
    ,MIN(zwl_elevation)     AS [NA Min]
    ,AVG(zwl_elevation)     AS [NA Médio]
    ,MAX(zwl_elevation)     AS [NA Max]
FROM gw_level
GROUP BY Station

Station,Medições,NA Min,NA Médio,NA Max
88,18,125789.0,1.2638033333333332e+16,127058.0
89,23,123712.0,1.2476486956521736e+16,125788.0
91,22,123828.0,1243857.0,125059.0
93,17,124346.0,1.2538035294117644e+16,1266.0
95,8,123565.0,124021625.0,124343.0
96,23,124601.0,1253218695652174.0,125972.0
97,108,120931.0,1.2444057407407408e+16,127256.0
98,36,119423.0,1.2372561111111108e+16,126135.0
99,20,117479.0,12421635.0,125864.0
100,37,123494.0,1246097027027027.0,127371.0


In [9]:
-- Estatísticas do NA subterrâneo por ponto e ano
SELECT
    Station
    ,YEAR(date_)                      AS [Ano]
    ,COUNT(Station)                   AS [Medições]
    ,ROUND(MIN(zwl_elevation), 2)     AS [NA Mínimo]
    ,ROUND(AVG(zwl_elevation), 2)     AS [NA Médio]
    ,ROUND(MAX(zwl_elevation), 2)     AS [NA Máximo]
FROM gw_level
WHERE
    Station IN (88, 89, 93, 203, 208)
GROUP BY Station, YEAR(date_)
ORDER BY Station, YEAR(date_)

Station,Ano,Medições,NA Mínimo,NA Médio,NA Máximo
88,2016,13,126138,126548,127058
88,2017,5,125789,125943,126102
89,2016,14,124534,1252,125788
89,2017,9,123712,124087,124459
93,2016,11,125297,125645,1266
93,2017,6,124346,124895,125228
203,2016,2,126934,126934,126934
203,2017,10,126383,126703,126969
203,2018,11,125635,126247,126646
203,2019,10,124672,125236,125596


Para aplicar filtros aos grupos agregados, não é possível utilizar o operador `WHERE`. Para isto, devemos usar a instrução `HAVING`.

> Ex.: Retornar as mesmas estatísticas anteriores, apenas para grupos com mais de 10 observações...

In [11]:
SELECT
    Station
    ,YEAR(date_)                      AS [Ano]
    ,COUNT(Station)                   AS [Medições]
    ,ROUND(MIN(zwl_elevation), 2)     AS [NA Mínimo]
    ,ROUND(AVG(zwl_elevation), 2)     AS [NA Médio]
    ,ROUND(MAX(zwl_elevation), 2)     AS [NA Máximo]
FROM gw_level
WHERE
    Station IN (88, 89, 93, 203, 208)
    -- AND COUNT(Station) > 10
GROUP BY Station, YEAR(date_)
HAVING COUNT(Station) > 10
ORDER BY Station, [Ano]

Station,Ano,Medições,NA Mínimo,NA Médio,NA Máximo
88,2016,13,126138,126548,127058
89,2016,14,124534,1252,125788
93,2016,11,125297,125645,1266
203,2018,11,125635,126247,126646
203,2021,12,123719,124242,1259
203,2022,11,123538,123796,12407
208,2017,45,122386,12263,123263
208,2018,30,117132,120588,122579
208,2019,12,116398,117032,120108


## Mesclar múltiplas tabelas - JOINs 🤺

Para unir várias tabelas e trazer colunas adicionais, faremos uso do operador `JOIN`, na instrução `FROM`.

A sintaxe básica é: `FROM <tabela_A> [LEFT/RIGHT/INNER/FULL] JOIN <tabela_B> ON <tabela_A.coluna_A> = <tabela_B.coluna_B>`

> **DICA:** Quando se executa um `LEFT/RIGHT JOIN` e são retornados mais registros do que haviam inicialmente na tabela *left* ou *right*, possivelmente há registros duplicados (**de acordo com o critério utilizado no JOIN**).

![SQL Join Image](../img/aula02/join_types0.jpg "SQL Join image")

![SQL Join Image](../img/aula02/join_types.png "SQL Join image")

In [None]:
-- Mesmo agrupamento anterior, apenas para os pontos da "Mina B"

SELECT TOP 100 *
FROM gw_level

[...]

In [12]:
SELECT TOP 5 * FROM station
SELECT TOP 5 * FROM gw_level

ID,Name,zoriginal_name,zmine,X,zdescription,zlocation,Y,Elevation,TOC,Depth,stn_type,status,zreport_authorities,zmonitoring_type,zmatrix,zregistration_date,zhydrographic_basin,zlegal_framework,zupdate_date,zhydrographic_subbasin,zphoto,zwater_body,zcomment,zdata_source,zrecord_resp,geo_point,zcomplex,zinstall_date,zresp_area,ztype_environment,zdistance,zqaqc_flag
1,WST-01,WST-01,Mina D,,,Mina D,,,,,Ponto Abastecimento,Desativado,0,Qualidade Hidrica,Agua Superficial,2023-05-23,Bacia A,Doce Classe II,2023-05-25,,,-,,Treinamento,WST,,Complexo A,,Hidrogeologia,,,
2,WST-02,WST-02,Mina D,,Hidrometro,Mina D,,,,,Ponto Abastecimento,Ativo,0,Qualidade Hidrica,Agua Superficial,2023-05-23,Bacia A,Doce Classe II,2023-05-25,,,-,,Treinamento,WST,,Complexo A,,Hidrogeologia,,,
3,WST-03,WST-03,Mina D,-50478033.0,Apanhador Bocaina,Mina A,-27547915.0,,,,Apanhador,Desativado,0,Qualidade Hidrica,Agua Superficial,2023-05-23,Bacia A,Doce Classe II,2023-05-25,,,-,,Treinamento,WST,0xE6100000010C1C998286047134C0C5C30251E0E445C0,Complexo A,,Hidrogeologia,,,
4,WST-04,WST-04,Mina D,-51013122.0,Hidrometro Apanhador,Barragem B,-27403114.0,961.0,,,Apanhador,Ativo,0,Qualidade Hidrica,Agua Superficial,2023-05-23,Bacia A,Doce Classe II,2023-05-25,,,-,,Treinamento,WST,0xE6100000010C1D74030ED37F34C03E1072FD8EE245C0,Complexo A,,Hidrogeologia,,,
5,WST-05,WST-05,Mina D,-49993625.0,Hidrometro Apanhador,Mina D,-26903298.0,1057.0,,,Apanhador,Ativo,0,Qualidade Hidrica,Agua Superficial,2023-05-23,Bacia A,Doce Classe II,2023-05-25,,,-,,Treinamento,WST,0xE6100000010C2C86D8DD0D7234C0584B8C48F0E145C0,Complexo A,,Hidrogeologia,,,


Station,screen_id,date_,depth_,zwl_elevation,dry_indicator,zstatus,zdata_type,zinstrument_type,comment,zmeasurement_resp,zdata_source,zrecord_resp,zpressure,zfrequency,zqaqc_flag
88,1,2016-01-22 00:00:00.000,3042,127058,Nao,Normal,Medido Manual,Medidor de Nivel,,WST,Treinamento SQL,WST,,Mensal,
88,1,2016-02-17 00:00:00.000,311,12699,Nao,Normal,Medido Manual,Medidor de Nivel,,WST,Treinamento SQL,WST,,Mensal,
88,1,2016-02-26 00:00:00.000,3159,126941,Nao,Normal,Medido Manual,Medidor de Nivel,,WST,Treinamento SQL,WST,,Mensal,
88,1,2016-04-27 00:00:00.000,3219,126881,Nao,Normal,Medido Manual,Medidor de Nivel,,WST,Treinamento SQL,WST,,Mensal,
88,1,2016-05-31 00:00:00.000,3434,126666,Nao,Normal,Medido Manual,Medidor de Nivel,,WST,Treinamento SQL,WST,,Mensal,


In [13]:
SELECT 
    vt.Name AS [TableName]
    ,vf.Name AS [FieldName]
    ,vf.[Description]
FROM ViewField vf
    JOIN ViewTable vt
        ON vf.ViewTable_Id = vt.Id
WHERE
    (vt.Name = 'station' AND vf.Name = 'ID')
    OR (vt.Name = 'gw_level' AND vf.Name = 'Station')

TableName,FieldName,Description
station,ID,ID do ponto de monitoramento cadastrado.
gw_level,Station,ID do ponto de monitoramento cadastrado.


In [18]:
-- Referenciar tabelas e colunas correspondentes

SELECT TOP 100
    -- *
    -- [zdata_source]
    s.[Name]              [Codigo HGA]
    ,s.[zlocation]
    ,s.[stn_type]
    ,gw.[date_]
    ,gw.[zwl_elevation]
    ,gw.[depth_]
FROM gw_level gw
    INNER JOIN station s   -- INNER
        ON gw.Station = s.ID

Codigo HGA,zlocation,stn_type,date_,zwl_elevation,depth_
WST-88,Mina F,Dreno,2016-01-22 00:00:00.000,127058.0,3042
WST-88,Mina F,Dreno,2016-02-17 00:00:00.000,12699.0,311
WST-88,Mina F,Dreno,2016-02-26 00:00:00.000,126941.0,3159
WST-88,Mina F,Dreno,2016-04-27 00:00:00.000,126881.0,3219
WST-88,Mina F,Dreno,2016-05-31 00:00:00.000,126666.0,3434
WST-88,Mina F,Dreno,2016-06-24 00:00:00.000,12659.0,351
WST-88,Mina F,Dreno,2016-07-27 00:00:00.000,126489.0,3611
WST-88,Mina F,Dreno,2016-08-25 00:00:00.000,126388.0,3712
WST-88,Mina F,Dreno,2016-09-30 00:00:00.000,126336.0,3764
WST-88,Mina F,Dreno,2016-10-28 00:00:00.000,126266.0,3834


In [17]:
SELECT
    s.[Name]                                AS [Codigo HGA]
    ,YEAR(gw.date_)                         AS [Ano]
    ,COUNT(gw.Station)                      AS [Medições]
    ,ROUND(MIN(gw.zwl_elevation), 2)        AS [NA Mínimo]
    ,ROUND(AVG(gw.zwl_elevation), 2)        AS [NA Médio]
    ,ROUND(MAX(gw.zwl_elevation), 2)        AS [NA Máximo]
FROM gw_level gw
    INNER JOIN station s
        ON gw.Station = s.ID
WHERE s.zlocation = 'Mina B'
GROUP BY s.[Name], YEAR(gw.date_)

Codigo HGA,Ano,Medições,NA Mínimo,NA Médio,NA Máximo
WST-251,2022,8,116704,116749,116773
WST-252,2022,8,116469,116522,116568
WST-253,2022,8,116842,11695,117135
WST-254,2022,8,117792,117827,117927
WST-251,2023,1,116708,116708,116708
WST-252,2023,1,116467,116467,116467
WST-253,2023,2,116862,116866,11687


> **DICA:** Quando não se conhece bem a modelagem e a relação entre as tabelas, pode-se utilizar alguma ferramenta de _Query Builder_ (SSMS, Excel, Power BI, **HGA** _etc_).

## `INNER JOIN` _vs_ `LEFT JOIN`

In [19]:
-- INNER JOIN
SELECT COUNT(s.ID) AS [Qtde]
FROM gw_level gw 
    INNER JOIN station s
        ON gw.Station = s.ID

Qtde
14546


In [20]:
-- LEFT JOIN: gw_level + station
SELECT COUNT(s.ID) AS [Qtde]
FROM gw_level gw 
    LEFT JOIN station s
        ON gw.Station = s.ID

Qtde
14546


In [22]:
-- LEFT JOIN: station + gw_level
SELECT s.*
FROM station s
    LEFT JOIN gw_level gw
        ON s.ID = gw.Station
WHERE gw.Station IS NULL

ID,Name,zoriginal_name,zmine,X,zdescription,zlocation,Y,Elevation,TOC,Depth,stn_type,status,zreport_authorities,zmonitoring_type,zmatrix,zregistration_date,zhydrographic_basin,zlegal_framework,zupdate_date,zhydrographic_subbasin,zphoto,zwater_body,zcomment,zdata_source,zrecord_resp,geo_point,zcomplex,zinstall_date,zresp_area,ztype_environment,zdistance,zqaqc_flag
1,WST-01,WST-01,Mina D,,,Mina D,,,,,Ponto Abastecimento,Desativado,0,Qualidade Hidrica,Agua Superficial,2023-05-23,Bacia A,Doce Classe II,2023-05-25,,,-,,Treinamento,WST,,Complexo A,,Hidrogeologia,,,
2,WST-02,WST-02,Mina D,,Hidrometro,Mina D,,,,,Ponto Abastecimento,Ativo,0,Qualidade Hidrica,Agua Superficial,2023-05-23,Bacia A,Doce Classe II,2023-05-25,,,-,,Treinamento,WST,,Complexo A,,Hidrogeologia,,,
3,WST-03,WST-03,Mina D,-50478033.0,Apanhador Bocaina,Mina A,-27547915.0,,,,Apanhador,Desativado,0,Qualidade Hidrica,Agua Superficial,2023-05-23,Bacia A,Doce Classe II,2023-05-25,,,-,,Treinamento,WST,0xE6100000010C1C998286047134C0C5C30251E0E445C0,Complexo A,,Hidrogeologia,,,
4,WST-04,WST-04,Mina D,-51013122.0,Hidrometro Apanhador,Barragem B,-27403114.0,961.0,,,Apanhador,Ativo,0,Qualidade Hidrica,Agua Superficial,2023-05-23,Bacia A,Doce Classe II,2023-05-25,,,-,,Treinamento,WST,0xE6100000010C1D74030ED37F34C03E1072FD8EE245C0,Complexo A,,Hidrogeologia,,,
5,WST-05,WST-05,Mina D,-49993625.0,Hidrometro Apanhador,Mina D,-26903298.0,1057.0,,,Apanhador,Ativo,0,Qualidade Hidrica,Agua Superficial,2023-05-23,Bacia A,Doce Classe II,2023-05-25,,,-,,Treinamento,WST,0xE6100000010C2C86D8DD0D7234C0584B8C48F0E145C0,Complexo A,,Hidrogeologia,,,
6,WST-06,WST-06,Mina D,-53486805.0,Hidrometro Ptmb-01,Mina D,-26299373.0,,,,Apanhador,Ativo,0,Qualidade Hidrica,Agua Superficial,2023-05-23,Bacia A,Doce Classe II,2023-05-25,,,-,,Treinamento,WST,0xE6100000010C7CDD127C307034C06AE9FA9331E445C0,Complexo A,,Hidrogeologia,,,
7,WST-07,WST-07,Mina D,,Hidrometro,Mina D,,,,,Apanhador,Ativo,0,Qualidade Hidrica,Agua Superficial,2023-05-23,Bacia A,Doce Classe II,2023-05-25,,,-,,Treinamento,WST,,Complexo A,,Hidrogeologia,,,
8,WST-08,WST-08,Mina D,-52054975.0,,PDR,-26277128.0,,,,Apanhador,Desativado,0,Qualidade Hidrica,Agua Superficial,2023-05-23,Bacia A,Doce Classe II,2023-05-25,,,-,,Treinamento,WST,0xE6100000010C420DAAD43D6E34C0B166F4A3B1E845C0,Complexo A,,Hidrogeologia,,,
9,WST-09,WST-09,Mina G,,Hidrometro Apanhador,Mina G,,,,,Apanhador,Nao Implantado,0,Qualidade Hidrica,Agua Superficial,2023-05-23,Bacia A,Doce Classe II,2023-05-25,,,-,,Treinamento,WST,,Complexo B,,Hidrogeologia,,,
10,WST-10,WST-10,Mina F,-52887966.0,Hidrometro Apanhador,Mina F,-26203018.0,1273.0,,,Apanhador,Ativo,0,Qualidade Hidrica,Agua Superficial,2023-05-23,Bacia A,Doce Classe II,2023-05-25,,,-,,Treinamento,WST,0xE6100000010C2C5D9CF4DA4934C0CE50FEF3E2F745C0,Complexo B,,Hidrogeologia,,,


In [25]:
SELECT TOP 100
    s.Name          AS [Codigo HGA]
    ,l.from_        AS [De (m)]
    ,l.to_          AS [Ate (m)]
    ,l.soil_type    AS [Litologia]
FROM station s
    LEFT JOIN lithology l
        ON s.ID = l.Station
WHERE s.zmatrix = 'Agua Subterranea'

Codigo HGA,De (m),Ate (m),Litologia
WST-88,,,
WST-89,,,
WST-90,,,
WST-91,,,
WST-92,,,
WST-93,,,
WST-94,,,
WST-95,,,
WST-96,,,
WST-97,,,


In [26]:
SELECT
    s.Name          AS [Codigo HGA]
    ,s.stn_type     AS [Tipo Ponto]
    ,s.zcomplex     AS [Complexo]
FROM station s
    LEFT JOIN lithology l
        ON s.ID = l.Station
WHERE s.stn_type LIKE 'Poco%'
    AND l.soil_type IS NULL

Codigo HGA,Tipo Ponto,Complexo
WST-322,Poco Abastecimento,Complexo B
WST-330,Poco Abastecimento,Complexo B
WST-413,Poco Abastecimento,Complexo B
WST-414,Poco Tubular,Complexo A
WST-415,Poco Tubular,Complexo A
WST-429,Poco Tubular,Complexo B
WST-590,Poco Tubular,Complexo B


## "Concatenando" tabelas

Para anexar tabelas contendo os mesmos campos, podemos utilizar o operador `UNION` entre vários `SELECT <coluna_1>...<column_name_n> FROM <tabela>`.

> **DICA:** `UNION` reúne apenas linhas distintas entre as tabelas (remove duplicidades), enquanto `UNION ALL` reúne todas as linhas entre as tabelas, incluindo as duplicadas.

In [30]:
-- Retornar todos os pontos das minas A e D
SELECT 
    [Name]
    ,zmatrix            AS [Matriz]
    ,stn_type           AS [Tipo Ponto]
    ,zlocation          AS [Local]
FROM station
WHERE [zlocation] = 'Mina A'

-- UNION
UNION ALL

SELECT 
    [Name]
    ,zmatrix            AS [Matriz]
    ,stn_type           AS [Tipo Ponto]
    ,zlocation          AS [Local]
    -- ,zcomplex           AS [Complexo]
FROM station
WHERE [zlocation] = 'Mina D'

Name,Matriz,Tipo Ponto,Local
WST-03,Agua Superficial,Apanhador,Mina A
WST-226,Agua Subterranea,Furo de Longo Prazo,Mina A
WST-227,Agua Subterranea,Furo de Longo Prazo,Mina A
WST-228,Agua Subterranea,Furo de Longo Prazo,Mina A
WST-229,Agua Subterranea,Furo de Longo Prazo,Mina A
WST-230,Agua Subterranea,Furo de Longo Prazo,Mina A
WST-231,Agua Subterranea,Furo de Longo Prazo,Mina A
WST-232,Agua Subterranea,Furo de Longo Prazo,Mina A
WST-233,Agua Subterranea,Furo de Longo Prazo,Mina A
WST-234,Agua Subterranea,Furo de Longo Prazo,Mina A


In [31]:
-- Retornar todos os pontos das minas A e D
SELECT 
    [Name]
    ,zmatrix            AS [Matriz]
    ,stn_type           AS [Tipo Ponto]
    ,zlocation          AS [Local]
FROM station
WHERE [zlocation] IN ('Mina A', 'Mina D')

Name,Matriz,Tipo Ponto,Local
WST-01,Agua Superficial,Ponto Abastecimento,Mina D
WST-02,Agua Superficial,Ponto Abastecimento,Mina D
WST-03,Agua Superficial,Apanhador,Mina A
WST-05,Agua Superficial,Apanhador,Mina D
WST-06,Agua Superficial,Apanhador,Mina D
WST-07,Agua Superficial,Apanhador,Mina D
WST-14,Agua Superficial,Agua Superficial,Mina D
WST-15,Agua Superficial,Agua Superficial,Mina D
WST-16,Agua Superficial,Agua Superficial,Mina D
WST-17,Agua Superficial,Agua Superficial,Mina D


# Subqueries 🤹‍♀️

Semelhante às **tabelas temporárias**, ***subqueries*** são uma maneira alternativa de armazenar resultados temporários de suas consultas para executar novas consultas na sequência.

Para criar uma **_subquery_**, basta criar uma segunda estrutura `SELECT ... FROM ...`, dentro da cláusula `...FROM (...) ...` ou `... WHERE (...) ...` da primeira consulta.

> **DICA:** **Subconsultas** às vezes são mais difíceis de ler e entender do que **tabelas temporárias**. O uso de tabelas **temporárias** permite separar sua lógica para criar a tabela em um formato ordenado intuitivamente.

## Exercício: Obter resultados de NA do ponto 'WST-88' acima da média

In [36]:
-- Primeiro passo: Obter a média do ponto
SELECT AVG(gw.zwl_elevation)        AS [NA Médio]
FROM gw_level gw
    INNER JOIN station s
        ON gw.Station = s.ID
WHERE s.[Name] = 'WST-88'

-- Segundo passo: Selecionar novamente o conjunto de resultados,
-- utilizando as médias calculadas
SELECT TOP 100
    s.[Name]            AS [Codigo HGA]
    ,s.[stn_type]       AS [Tipo Ponto]
    ,gw.date_           AS [Data]
    ,gw.zwl_elevation   AS [Cota NA]
FROM gw_level gw
    INNER JOIN station s
        ON gw.Station = s.ID
WHERE gw.zwl_elevation < (
    -- Retorna a média
    SELECT AVG(gw.zwl_elevation)        AS [NA Médio]
    FROM gw_level gw
        INNER JOIN station s
            ON gw.Station = s.ID
    WHERE s.[Name] = 'WST-88'
) AND s.[Name] = 'WST-88'

NA Médio
12638033333333333


Codigo HGA,Tipo Ponto,Data,Cota NA
WST-88,Dreno,2016-09-30 00:00:00.000,126336
WST-88,Dreno,2016-10-28 00:00:00.000,126266
WST-88,Dreno,2016-11-25 00:00:00.000,1262
WST-88,Dreno,2016-11-28 00:00:00.000,126187
WST-88,Dreno,2016-12-29 00:00:00.000,126138
WST-88,Dreno,2017-01-25 00:00:00.000,126102
WST-88,Dreno,2017-02-22 00:00:00.000,12603
WST-88,Dreno,2017-03-30 00:00:00.000,125928
WST-88,Dreno,2017-04-24 00:00:00.000,125867
WST-88,Dreno,2017-05-22 00:00:00.000,125789


### 🧠 **Pré-Desafio**:

> ### Como seria possível obter os resultados de NA acima da média para os pontos 'WST-88' e 'WST-205' em uma única consulta ??

Obs.: Não vale usar `UNION`/`UNION ALL` 😒

******

## Tabelas temporárias

### Tipos de tabelas temporárias 🍺🍷🍹

**Tabelas temporárias** são úteis para consultas mais complicadas em que você precisa armazenar os resultados de uma transformação de tabela de forma intermediária para executar outra transformação na sequência.

Existem três tipos de tabelas temporárias no SQL que poderá criar:
1. Tabela temporária local
2. ***Common Table Expression* - CTE**
3. Tabela temporária global

#### i. Tabela temporária local
Quando você cria uma tabela temporária **local**, ela será armazenanda temporariamente em sua sessão SQL atual. Dessa forma, podemos executar o trecho do código que cria a **tabela temporária local**, e em seguida, consultar os resultados e realizar diferentes operações de transformação neles depois.

**Importante:** Quando criamos uma tabela **local**, seus resultados podem ser consultados apenas no mesmo painel onde o código para criá-la foi escrito.

Para criar uma tabela temporária **local**, utilizamos a instrução `INTO #<temp_table_name>` logo antes de escrever a parte `FROM <table_name>...`.

> **DICA:** Uma tabela temporária **local** não pode ser substituída, portanto, executar a consulta de criá-la novamente resultará em um erro. Portanto, a tabela precisa ser excluída antes de reexecutar a consulta. Uma maneira sucinta de evitar a criação de tabelas temporárias **locais** e, em seguida excluí-las, é incluir a seguinte linha no topo do seu código: `IF OBJECT_ID('tempdb..#<tabela>') IS NOT NULL DROP TABLE #<tabela>`

In [37]:
-- Tabela temporária local

IF OBJECT_ID('tempdb..#na_medio') IS NOT NULL DROP TABLE #na_medio
GO

SELECT AVG(gw.zwl_elevation)        AS [NA Médio]
INTO #na_medio
FROM gw_level gw
    INNER JOIN station s
        ON gw.Station = s.ID
WHERE s.[Name] = 'WST-88'

-- Segundo passo: Selecionar novamente o conjunto de resultados,
-- utilizando as médias calculadas
SELECT TOP 100
    s.[Name]            AS [Codigo HGA]
    ,s.[stn_type]       AS [Tipo Ponto]
    ,gw.date_           AS [Data]
    ,gw.zwl_elevation   AS [Cota NA]
FROM gw_level gw
    INNER JOIN station s
        ON gw.Station = s.ID
WHERE zwl_elevation > (SELECT * FROM #na_medio)

Codigo HGA,Tipo Ponto,Data,Cota NA
WST-88,Dreno,2016-01-22 00:00:00.000,127058
WST-88,Dreno,2016-02-17 00:00:00.000,12699
WST-88,Dreno,2016-02-26 00:00:00.000,126941
WST-88,Dreno,2016-04-27 00:00:00.000,126881
WST-88,Dreno,2016-05-31 00:00:00.000,126666
WST-88,Dreno,2016-06-24 00:00:00.000,12659
WST-88,Dreno,2016-07-27 00:00:00.000,126489
WST-88,Dreno,2016-08-25 00:00:00.000,126388
WST-93,Dreno,2016-02-17 00:00:00.000,1266
WST-97,Dreno,2016-01-22 00:00:00.000,127256


#### ii. Common Table Expression (CTE)
Ao criar uma **CTE**, ela é armazenada temporariamente na **consulta atual**. Isso significa que os resultados da consulta não podem ser obtidos em uma parte posterior do código. Como a **CTE** não existe fora da consulta atual, não há necessidade de excluí-la explicitamente quando for necessário criá-la novamente.

Para criar uma **CTE**, envolva sua instrução `SELECT...` entre parênteses do seguinte código, `WITH <cte_name> AS ()...`

> **DICA:** À primeira vista, **CTE**s podem parecer inferiores às **tabelas temporárias locais**, mas elas são de fato muito poderosas. Devido à natureza em que eles só existem dentro da própria execução da consulta, eles podem ser usados na definição de **Views**, para inserir em uma tabela criada e como parte da criação de outros objetos SQL. **Tabelas temporárias locais** tipicamente não podem.

In [38]:
WITH na_medio AS (
    SELECT AVG(gw.zwl_elevation)        AS [NA Médio]
    FROM gw_level gw
        INNER JOIN station s
            ON gw.Station = s.ID
    WHERE s.[Name] = 'WST-88'
)

SELECT TOP 100
    s.[Name]            AS [Codigo HGA]
    ,s.[stn_type]       AS [Tipo Ponto]
    ,gw.date_           AS [Data]
    ,gw.zwl_elevation   AS [Cota NA]
FROM gw_level gw
    INNER JOIN station s
        ON gw.Station = s.ID
WHERE zwl_elevation > (SELECT * FROM na_medio)
    AND s.[Name] = 'WST-88'

Codigo HGA,Tipo Ponto,Data,Cota NA
WST-88,Dreno,2016-01-22 00:00:00.000,127058
WST-88,Dreno,2016-02-17 00:00:00.000,12699
WST-88,Dreno,2016-02-26 00:00:00.000,126941
WST-88,Dreno,2016-04-27 00:00:00.000,126881
WST-88,Dreno,2016-05-31 00:00:00.000,126666
WST-88,Dreno,2016-06-24 00:00:00.000,12659
WST-88,Dreno,2016-07-27 00:00:00.000,126489
WST-88,Dreno,2016-08-25 00:00:00.000,126388


#### iii. Tabela temporária global
Quando uma tabela temporária **global** é criada, ela é armazenada *permanentemente* no banco de dados, `[tempdb]`, permitindo que outros usuários do mesmo servidor possam acessá-la Em contraste com as outras duas tabelas temporárias (**tabelas temporárias locais** e **CTEs**), você precisa excluir explicitamente as tabelas globais.

Criar uma tabela temporária **global** é como criar uma tabela temporária **local**, basta usar a instrução `INTO <##temp_table_name>` logo antes de escrever a parte `FROM <###table_name>...`. Observe a ênfase em dois símbolos hash, `##`, em vez de apenas um que é usado para **tabelas temporárias locais**.

> **AVISO:** O banco de dados `[tempdb]` armazena essas tabelas temporárias **global***, e como esse banco de dados é um pouco invisível, pois está oculto no *Object Explorer* no SSMS, muitas vezes pode-se esquecer de excluir a tabela depois para economizar espaço. Por isso a criação uma tabela temporária **global** é raramente aconselhável. 

## Desafio: Dominando subqueries e CTE's

Notebook completo: 📒 [Desafio Aula02](../desafios/aula02/Aula02_Challenge.ipynb)