<img src="https://raw.githubusercontent.com/andre-marcos-perez/ebac-course-utils/main/media/logo/newebac_logo_black_half.png" alt="ebac-logo">

---

# **Módulo** | SQL: Filtrando & Seleção Condicional
Caderno de **Exercícios**<br>
Professor [Mariane Neiva](https://www.linkedin.com/in/mariane-neiva/)

---

# **Tópicos**

<ol type="1">
  <li>Filtros and, or, in e between;</li>
  <li>Filtros like e wildcards;</li>
  <li>Seleção condicional;</li>
</ol>

---

# **Instruções**

Nessa **atividades**, você deve:

 1. Executar a consulta SQL fornecida;
 2. Exportar os resultados em um arquivo csv para sua máquina;
 3. Renomear o arquivo como **query\<numero-da-query\>.csv**;
 4. Enviar para a avaliação do tutor na plataforma da EBAC.

> **Atenção**: Substitua o **\<numero-da-query>** numero da consulta, exemplo: **query1.csv**.

**Importante**: Para consultar mais detalhes da AWS Athena [clique aqui](https://docs.aws.amazon.com/athena/latest/ug/what-is.html)

---

# Atividades

#1. Prática 1

> **Não há necessidade de entrega**.
Para esses exercícios, utilizaremos os mesmo dados do módulo 3.

Caso você não tenha as informações de **transacoes.csv**, elas estarão disponíveis no material de aula.

Siga os seguintes passos para criação da tabela (desconsidere caso você já tenha os dados no seu S3):

* Crie uma pasta bucket-transacoes no seu S3 e carregue o arquivo **transacoes.csv**
* Volta para o AWS Athena e execute o seguinte comando:

```sql
CREATE EXTERNAL TABLE transacoes(
id_cliente BIGINT,
id_transacao BIGINT,
valor FLOAT,
id_loja STRING)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
WITH SERDEPROPERTIES ('separatorChar' = ',', 'quoteChar' = '"', 'escapeChar' = '\\')
STORED AS TEXTFILE
LOCATION 's3://bucket-transacoes/'
```

Utilizaremos a tabela para os exercícios seguintes.

# **2. Selecionando dados**

Vamos testar os comandos and, or, in e between?! Execute as queries e salve o resultado para enviar os exercícios.   

##2.1 Query 1

```sql
SELECT *
FROM transacoes
WHERE valor > 30 AND id_loja = 'magalu';
```

> **Importante**: entregue os resultados da query com o nome *query1.csv*

##2.2 Query 2

```sql
SELECT *
FROM transacoes
WHERE valor > 30 OR id_loja = 'magalu';
```

> **Importante**: entregue os resultados da query com o nome *query2.csv*

##2.3 Query 3

```sql
SELECT *
FROM transacoes
WHERE id_loja IN ('magalu','subway') AND valor > 10;
```

> **Importante**: entregue os resultados da query com o nome *query3.csv*

##2.4 Query 4

```sql
SELECT *
FROM transacoes
WHERE valor BETWEEN 60.0 AND 1000.0;
```

> **Importante**: entregue os resultados da query com o nome *query4.csv*

# **3. Filtro like e wildcards**

Agora é hora de trabalhar com padrões! Execute as queries e salve o resultado para enviar os exercícios.   

##3.1 Query 5

```sql
SELECT *
FROM transacoes
WHERE id_loja LIKE 'mag%'
```

> **Importante**: entregue os resultados da query com o nome *query5.csv*

##3.2 Query 6

```sql
SELECT *
FROM transacoes
WHERE id_loja LIKE '%sh%'
```

> **Importante**: entregue os resultados da query com o nome *query6.csv*



# **4. Seleção condicional**

Chegou a hora de testar a combinação do CASE com o SELECT! Execute a  query e salve o resultado para enviar o  exercício.   

##4.1 Query 7

```sql
SELECT id_cliente, id_loja, valor,
CASE
    WHEN valor > 1000 THEN 'Compra com alto valor'
    WHEN valor < 1000 THEN 'Compra com baixo valor'
END
AS classeValor,
CASE
    WHEN id_loja IN ('giraffas','subway')  THEN 'alimentacao'
    WHEN id_loja IN ('magalu','extra') THEN 'variedade'
    WHEN id_loja IN ('postoshell','seveneleven') THEN '24horas'
    ELSE 'outros'
END
AS tipo_compra
FROM transacoes;
```

> **Importante**: entregue os resultados da query com o nome *query7.csv*



In [1]:
import pandas as pd

In [9]:
# condição "AND"
pd.read_csv('query_1.csv')

Unnamed: 0,id_cliente,id_transacao,valor,id_loja
0,1,768805383,50.74,magalu
1,1,76856563,2000.9,magalu


In [10]:
# condição "OR"
pd.read_csv('query_2.csv')

Unnamed: 0,id_cliente,id_transacao,valor,id_loja
0,1,768805383,50.74,magalu
1,2,768805399,30.9,giraffas
2,3,818770008,110.0,postoshell
3,1,76856563,2000.9,magalu
4,4,764545534,50.74,extra
5,3,8154567758,1100.0,shopee


In [4]:
# condição "IN"
pd.read_csv('query_3.csv')

Unnamed: 0,id_cliente,id_transacao,valor,id_loja
0,1,768805383,50.74,magalu
1,1,76856563,2000.9,magalu
2,1,767573759,15.7,subway


In [11]:
# condição "BETWEEN"
pd.read_csv('query_4.csv')

Unnamed: 0,id_cliente,id_transacao,valor,id_loja
0,3,818770008,110.0,postoshell


In [12]:
# padrão "mag%"
pd.read_csv('query_5.csv')

Unnamed: 0,id_cliente,id_transacao,valor,id_loja
0,1,768805383,50.74,magalu
1,1,76856563,2000.9,magalu


In [13]:
# padrão "%sh%"
pd.read_csv('query_6.csv')

Unnamed: 0,id_cliente,id_transacao,valor,id_loja
0,3,818770008,110.0,postoshell
1,3,8154567758,1100.0,shopee


In [14]:
# condição "CASE"
pd.read_csv('query_7.csv')

Unnamed: 0,id_cliente,id_loja,valor,classeValor,tipo_compra
0,1,magalu,50.74,Compra com baixo valor,variedade
1,2,giraffas,30.9,Compra com baixo valor,alimentacao
2,3,postoshell,110.0,Compra com baixo valor,24horas
3,1,magalu,2000.9,Compra com alto valor,variedade
4,1,subway,15.7,Compra com baixo valor,alimentacao
5,3,seveneleven,2.99,Compra com baixo valor,24horas
6,4,extra,50.74,Compra com baixo valor,variedade
7,5,subway,10.0,Compra com baixo valor,alimentacao
8,3,shopee,1100.0,Compra com alto valor,outros
