# Criando as views

--------

Novamente, é preciso se importar as dependências e reconectar com o banco, como foi feito nas partes 1 e 2 do trabalho:

In [None]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from sqlalchemy import create_engine

In [3]:
senha = input("Digite sua senha do usuário postgres: ")

# string de conexão com o banco de dados ecommerce
engine = create_engine(f'postgresql://postgres:{senha}@localhost:5432/ecommerce')

--------

Nessa seção do trabalho, o objetivo é apenas criar as views com os dados necessários para responder cada pergunta feita.

Cada query sozinha, claro, não responde as perguntas. Os insights coletados estão no arquivo ```04_analises```.

### 1. Qual a média de vendas por estilo?

```sql
	CREATE OR REPLACE VIEW media_vendas_por_estilo AS
	SELECT 
		COUNT(DISTINCT style) AS total_estilos,
		COUNT(1) AS total_vendas,
		(COUNT(1) / COUNT(DISTINCT STYLE)) AS media
	FROM vendas
```

### 2. Quais os 3 estilos mais comuns para cada produto?

```sql
    CREATE OR REPLACE VIEW top_3_estilos_por_produto AS
    SELECT product, ranking, style, total
    FROM (
        SELECT 
            p.product AS product, 
            ROW_NUMBER() OVER (PARTITION BY v.code ORDER BY COUNT(style) DESC) AS ranking, 
            v.style AS style, 
            COUNT(style) AS total
        FROM vendas v
        LEFT JOIN produtos p ON p.code = v.code
        GROUP BY p.product, v.code, v.style
    ) ranking_styles
    WHERE ranking <= 3 
```

### 3. Quais os estilos mais comuns no geral e sua quantidade?

```sql
    CREATE OR REPLACE VIEW top_estilos_geral AS
	SELECT  
		ROW_NUMBER() OVER (PARTITION BY v.style ORDER BY COUNT(style) DESC) AS ranking, 
		v.style AS style, 
		COUNT(style) AS total
    FROM vendas v
    GROUP BY v.STYLE
    ORDER BY total desc
```

### 4. Qual o intervalo temporal entre a primeira e a última venda?

```sql
    CREATE OR REPLACE VIEW intervalo_temporal_vendas AS
    SELECT MIN(ORDER_DATE), MAX(ORDER_DATE)  FROM vendas
```

### 5. Qual é a quantidade total de vendas país de entrega? 

```sql
    CREATE OR REPLACE VIEW total_vendida_por_pais AS
    SELECT v.ship_country, COUNT(v.code) AS total_vendas_por_pais FROM vendas v
    GROUP BY v.ship_country
    ORDER BY total_vendas_por_pais DESC
```

### 6. Qual produto é mais vendido em cada país?

```sql
    CREATE OR REPLACE VIEW produto_mais_vendido_por_pais AS
    SELECT ship_country, p.product, p.price, total_sales
    FROM (
        SELECT 
            ship_country, 
            code,
            ROW_NUMBER() OVER (PARTITION BY ship_country ORDER BY SUM(quantity) DESC) AS ranking,
            SUM(quantity) AS total_sales
        FROM vendas
        GROUP BY ship_country, code
    ) ranked_sales
    LEFT JOIN produtos p ON p.code = ranked_sales.code
    WHERE ranking = 1
    ORDER BY p.price DESC;
```

### 7. Qual a quantidade média de itens por pedido para cada produto?

```sql
    CREATE OR REPLACE VIEW media_items_por_pedido AS
    SELECT p.product, AVG(v.quantity) AS media_por_pedido FROM vendas v
    LEFT JOIN produtos p ON p.code = v.code
    GROUP BY p.product
    ORDER BY media_por_pedido desc
```

### 8. Existe uma sazonalidade nas vendas ao longo do ano? (Quais são os meses com mais vendas?)

```sql
    CREATE OR REPLACE VIEW sazonalidade_vendas AS
    SELECT TO_CHAR(DATE_TRUNC('month', order_date), 'Month') AS mes, SUM(quantity) AS total_vendas
    FROM vendas
    GROUP BY mes
    ORDER BY total_vendas desc;
```

### 9. Quais são os produtos mais lucrativos em termos de receita?

```sql
    CREATE OR REPLACE VIEW produtos_mais_lucrativos AS
    SELECT p.product, sum(quantity) * p.price AS total_arrecadado
    FROM vendas v
    LEFT JOIN produtos p ON p.code = p.code
    GROUP BY p.product, p.price
    ORDER BY total_arrecadado desc;
```

### 10. Quais são os 5 produtos mais vendidos

```sql
    CREATE OR REPLACE VIEW produtos_mais_vendidos AS 
    SELECT p.product, sum(quantity) AS total_vendido
    FROM vendas v
    LEFT JOIN produtos p ON p.code = p.code
    GROUP BY p.product
    ORDER BY total_vendido desc;
```

### 11. **(ChatGPT)** Como a quantidade de pedidos varia em relação ao dia da semana? 

```sql
	CREATE OR REPLACE VIEW total_pedidos_por_dia_da_semana AS
	SELECT dia_semana, sum(total_vendas) from (
		SELECT 
			EXTRACT(DOW FROM order_date) as num_dia_semana,
			TO_CHAR(order_date, 'Day') AS dia_semana, 
			sum(Quantity) AS total_vendas
		FROM vendas
		GROUP BY dia_semana, order_date
		ORDER BY num_dia_semana
	)
	GROUP BY num_dia_semana, dia_semana
	ORDER BY num_dia_semana
```

### 12. **(ChatGPT)** Qual é a quantidade média de produtos por país de entrega? 

```sql
    CREATE OR REPLACE VIEW media_vendida_por_pais AS
    SELECT v.ship_country, AVG(v.quantity) AS media_vendida_por_pais FROM vendas v
    GROUP BY v.ship_country
    ORDER BY media_vendida_por_pais DESC
```

### 13. **(ChatGPT)** Existe uma correlação entre a quantidade de produtos e o serviço de envio escolhido? 

```sql
    CREATE OR REPLACE VIEW relacao_qtd_produtos_e_servico_envio AS
    SELECT v.ship_service_level, AVG(v.quantity) AS media_vendida_por_servico FROM vendas v
    GROUP BY v.ship_service_level
    ORDER BY media_vendida_por_servico DESC
```

### 14. **(ChatGPT)** Existe uma diferença significativa na quantidade de produtos vendidos entre diferentes países de entrega? 

```sql
    CREATE OR REPLACE VIEW diferenca_produtos_por_pais AS
    SELECT v.ship_country, SUM(v.quantity) AS total_produtos_por_pais FROM vendas v
    GROUP BY v.ship_country
    ORDER BY total_produtos_por_pais DESC 
```

### 15. **(ChatGPT)** Quais são os estilos de produto mais populares?

```sql
    CREATE OR REPLACE VIEW estilos_mais_populares AS
    SELECT v.style, COUNT(v.style) AS total_ocorrencias FROM vendas v
    GROUP BY v.style
    ORDER BY total_ocorrencias DESC 
```

--------