# Consulta em Banco de Dados com SQL e Python 


In [1]:
# Versão linguagem Python utilizada

from platform import python_version
python_version()

'3.9.13'

In [17]:
# Importando biblioteca SQLite

import sqlite3

sqlite3.sqlite_version


'3.39.3'

In [18]:
# Importando biblioteca Pandas 

import pandas as pd
pd.__version__

'2.1.4'

In [3]:
# Conectando ao banco de dados

bd = sqlite3.connect('cap12_dsa.db')

In [5]:
# Abrindo um cursor para percorrer os dados no banco de dados

cursor = bd.cursor()

# Query SQL para extrair os nomes das colunas no banco de dados

sql_query = """SELECT name FROM sqlite_master WHERE type = 'table';"""
cursor.execute(sql_query)

<sqlite3.Cursor at 0x20a3a8e65e0>

In [6]:
# Visualizando o resultado

print(cursor.fetchall())

[('tb_vendas_dsa',)]


In [15]:
# Verificando todas as linhas da tabela

query1 = 'SELECT * FROM tb_vendas_dsa'
cursor.execute(query1)

# List comprehension para visualizar os nomes das colunas

nomes_colunas = [description[0] for description in cursor.description]

print(nomes_colunas)


#tabela

['ID_Pedido', 'ID_Cliente', 'Nome_Produto', 'Valor_Unitario', 'Unidades_Vendidas', 'Custo']


In [16]:
# Dados da query1
tabela = cursor.fetchall()

# Carregando os dados como dataframe do Pandas

df = pd.DataFrame(tabela, columns = ['ID_Pedido', 
                                    'ID_Cliente', 
                                    'Nome_Produto',
                                    'Valor_Unitario',
                                    'Unidades_Vendidas',
                                    'Custo'])

df

Unnamed: 0,ID_Pedido,ID_Cliente,Nome_Produto,Valor_Unitario,Unidades_Vendidas,Custo
0,1,63,Produto_38,154.03,7,92.42
1,2,49,Produto_8,171.52,5,102.91
2,3,83,Produto_39,28.97,13,17.38
3,4,37,Produto_2,104.55,4,62.73
4,5,19,Produto_1,77.21,19,46.33
...,...,...,...,...,...,...
495,496,27,Produto_12,155.02,1,93.01
496,497,32,Produto_23,71.04,6,42.62
497,498,80,Produto_1,67.83,13,40.70
498,499,13,Produto_50,187.89,16,112.73


In [39]:
# Calculando a média de unidades vendidas

query2 = 'SELECT AVG(Unidades_Vendidas) FROM tb_vendas_dsa'
cursor.execute(query2)

# Retornando resultado da query2

media = cursor.fetchall()

print('A média de unidades vendidas é de:', media)

A média de unidades vendidas é de: [(10.506,)]


In [40]:
# Calculando a média de unidades vendidas por produto
query3 = 'SELECT Nome_Produto, AVG(Unidades_Vendidas) FROM tb_vendas_dsa GROUP BY Nome_Produto'
cursor.execute(query3)

# Retornando resultado da query3

media2 = cursor.fetchall()

# Carregando os dados como dataframe do Pandas

media2_produtos = pd.DataFrame(media2, columns = ['Nome_Produto',
                                                'Média de Unidades Vendidas'])

media2_produtos

Unnamed: 0,Nome_Produto,Média de Unidades Vendidas
0,Produto_1,12.0
1,Produto_10,9.5
2,Produto_11,14.181818
3,Produto_12,8.846154
4,Produto_13,6.0
5,Produto_14,9.166667
6,Produto_15,9.75
7,Produto_16,8.25
8,Produto_17,11.714286
9,Produto_18,13.083333


In [47]:
# Calculando a média de unidades vendidas por produto,
# quando o valor unitário for maior que 199
query4 = """SELECT Nome_Produto, 
                AVG(Unidades_Vendidas) 
            FROM 
                tb_vendas_dsa 
            WHERE 
                Valor_Unitario > 199 
            GROUP BY 
                Nome_Produto"""
cursor.execute(query3)

# Retornando resultado da query4

media3 = cursor.fetchall()

# Carregando os dados como dataframe do Pandas

media3_produtos = pd.DataFrame(media3, columns = ['Nome_Produto',
                                                'Média de Un. Vend. acima de 199'])

media3_produtos

Unnamed: 0,Nome_Produto,Média de Un. Vend. acima de 199
0,Produto_1,12.0
1,Produto_10,9.5
2,Produto_11,14.181818
3,Produto_12,8.846154
4,Produto_13,6.0
5,Produto_14,9.166667
6,Produto_15,9.75
7,Produto_16,8.25
8,Produto_17,11.714286
9,Produto_18,13.083333


In [34]:
# Verificando os Top 10 produtos mais vendidos

query5 = """SELECT Nome_Produto, 
                COUNT(Unidades_Vendidas) 
            FROM 
                tb_vendas_dsa  
            GROUP BY 
                Nome_Produto
            ORDER BY 
                COUNT(Unidades_Vendidas) DESC
            LIMIT 10"""
cursor.execute(query5)

# Retornando resultado da query4

top10 = cursor.fetchall()

# Carregando os dados como dataframe do Pandas

top10_produtos = pd.DataFrame(top10, columns = ['Nome_Produto',
                                                'Unidades_Vendidas'])

top10_produtos

Unnamed: 0,Nome_Produto,Unidades_Vendidas
0,Produto_7,16
1,Produto_30,16
2,Produto_22,16
3,Produto_16,16
4,Produto_1,15
5,Produto_8,14
6,Produto_4,13
7,Produto_32,13
8,Produto_29,13
9,Produto_25,13


In [38]:
# Verificando os 10 produtos de maior lucro 

query6 = """SELECT DISTINCT(Nome_Produto), 
                Valor_Unitario, 
                Custo,
                Valor_Unitario - Custo AS Lucro
            FROM 
                tb_vendas_dsa  
            GROUP BY 
                Nome_Produto
            ORDER BY 
                Lucro DESC
            LIMIT 10"""
cursor.execute(query6)

# Retornando resultado da query4

maior_custo = cursor.fetchall()

# Carregando os dados como dataframe do Pandas

produtos_custo = pd.DataFrame(maior_custo, columns = ['Nome_Produto',
                                                      'Valor_Unitario',
                                                      'Custo',
                                                      'Lucro'])

produtos_custo

Unnamed: 0,Nome_Produto,Valor_Unitario,Custo,Lucro
0,Produto_12,197.18,118.31,78.87
1,Produto_20,194.8,116.88,77.92
2,Produto_50,191.3,114.78,76.52
3,Produto_10,191.3,114.78,76.52
4,Produto_21,191.28,114.77,76.51
5,Produto_46,190.45,114.27,76.18
6,Produto_8,171.52,102.91,68.61
7,Produto_34,167.69,100.61,67.08
8,Produto_3,164.55,98.73,65.82
9,Produto_36,161.97,97.18,64.79


In [None]:
# Fechando o cursor e encerrando a conexão

cursor.close()
con.close()