#Parte 2: SQL

Com base nas tabelas geradas no exercício anterior, escreva consultas SQL para:

●    Listar o nome do produto, categoria e a soma total de vendas (Quantidade * Preço) para cada produto. Ordene o resultado pelo valor total de vendas em ordem decrescente.

●    Identificar os produtos que venderam menos no mês de junho de 2024.

Salve suas consultas e a explicação da lógica em um arquivo chamado consultas_sql.sql.

In [None]:
import pandas as pd #para manipulação de dados
import sqlite3 # para trabalhar com o banco de dados SQLite
from google.colab import files # para importar o arquivo da máquina local

uploaded = files.upload() #carregando o arquivo CSV

df = pd.read_csv('data_clean.csv') #lendo o CSV

conn = sqlite3.connect(':memory:') #para conectar ao banco de dados em memória
cursor = conn.cursor()


Saving data_clean.csv to data_clean (1).csv


In [None]:
cursor.execute('''
    CREATE TABLE vendas (
      ID INTEREGER PRIMARY KEY,
      Data TEXT,
      Produto TEXT,
      Categoria TEXT,
      Quantidade INTEREGER,
      Preço REAL,
      Total_Vendas REAL,
      Ano_Mes TEXT
    );

''')

df['Data'] = pd.to_datetime(df['Data']) #confirmando o datetime

for row in df.itertuples():
    data_str = row.Data.strftime('%Y-%m-%d')
    ano_mes = row.Data.strftime('%Y-%m')
    cursor.execute('''
        INSERT INTO vendas (ID, Data, Produto, Categoria, Quantidade, Preço, Total_Vendas, Ano_Mes)
        VALUES (?, ?, ?, ?, ?, ?, ?, ?)
    ''', (row.ID, data_str, row.Produto, row.Categoria, row.Quantidade, row.Preço, row.Quantidade * row.Preço, ano_mes))

conn.commit()

query = "SELECT * FROM vendas LIMIT 5;"
display(pd.read_sql(query, conn))

Unnamed: 0,ID,Data,Produto,Categoria,Quantidade,Preço,Total_Vendas,Ano_Mes
0,1,2023-07-26,executive,point,7,48.26,337.82,2023-07
1,2,2023-01-15,green,easy,15,28.71,430.65,2023-01
2,3,2023-12-12,give,line,11,61.09,671.99,2023-12
3,4,2023-02-11,big,argue,8,12.82,102.56,2023-02
4,5,2023-06-28,past,yard,7,85.81,600.67,2023-06


In [None]:
consulta_1 = '''
SELECT Produto,
       Categoria,
       SUM(Quantidade * Preço) AS Total_Vendas
FROM vendas
GROUP BY Produto, Categoria
ORDER BY Total_Vendas DESC;
'''
display(pd.read_sql(consulta_1, conn))

Unnamed: 0,Produto,Categoria,Total_Vendas
0,much,next,1680.66
1,wear,about,1656.65
2,apply,phone,1557.0
3,ten,there,1349.28
4,analysis,something,1292.9
5,amount,message,1162.44
6,when,partner,1158.12
7,investment,should,1098.71
8,theory,these,1078.374082
9,pretty,cold,1027.4


In [None]:
consulta_2 = '''
SELECT Produto,
       SUM(Quantidade * Preço) AS Total_Vendas_Junho
FROM vendas
WHERE Data BETWEEN '2023-06-01' AND '2023-06-30'
GROUP BY Produto
ORDER BY Total_Vendas_Junho ASC;
'''

display(pd.read_sql(consulta_2, conn))

Unnamed: 0,Produto,Total_Vendas_Junho
0,compare,56.35
1,pass,58.57
2,cut,348.4
3,past,600.67


In [None]:
consulta_sql = """

-- Explicação: As duas consultas abaixo fazem parte do exercício solicitado.
-- A primeira lista os produtos com maior total de vendas;
-- E a segunda identifica os produtos que venderam menos no mês de junho de 2023.

-- Explicando a primeira consulta: O objetivo -> Listar nome do produto, a categoria e a soma total das vendas.
-- O total de vendas é calculado multiplicando a quantidade vendida pelo preço do produto.
-- O resultado é agrupado por produto e categoria, e ordenado pela soma das vendas de forma decrescente.

SELECT Produto,
       Categoria,
       SUM(Quantidade * Preço) AS Total_Vendas
FROM vendas
GROUP BY Produto, Categoria
ORDER BY Total_Vendas DESC;



-- Explicando a segunda consulta: O objetivo -> Identificar os produtos que venderam menos no mês de junho de 2023.
-- Realizei a total das vendas, sendo resultado da quantidade multiplicada pelo preço, para o período de 01/06/2023 a 30/06/2023.
-- O resultado então é ordenado do menor para o maior na coluna com o total de vendas junho.


SELECT Produto,
       SUM(Quantidade * Preço) AS Total_Vendas_Junho
FROM vendas
WHERE Data BETWEEN '2023-06-01' AND '2023-06-30'
GROUP BY Produto
ORDER BY Total_Vendas_Junho ASC;
"""

with open("/content/consultas_sql.sql", "w") as file:
    file.write(consulta_sql)

files.download('/content/consultas_sql.sql')

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>