## Configurando o MySQL com Python

Neste momento, vamos configurar a integração entre o MySQL e Python. Isso nos permitirá executar consultas, inserções e outras operações no banco de dados MySQL usando o Python como nossa linguagem de programação principal.

In [26]:
import os
from dotenv import load_dotenv
import mysql.connector

# Carrega as variáveis do arquivo .env no ambiente de trabalho
load_dotenv()

# A função os.getenv é usada para obter o valor das variáveis de ambiente
host = os.getenv("DB_HOST")
user = os.getenv("DB_USERNAME")
password = os.getenv("DB_PASSWORD")

cnx = mysql.connector.connect(
    host=host,
    user=user,
    password=password
)

print(cnx)

<mysql.connector.connection_cext.CMySQLConnection object at 0x7a3709a2fc10>


In [28]:
cursor = cnx.cursor()

## Criando uma base de dados

O método `execute()` é usado para compilar uma instrução SQL

In [12]:
cursor.execute("CREATE DATABASE IF NOT EXISTS dbprodutos;")

In [29]:
cursor.execute("SHOW DATABASES;")

for db in cursor:
    print(db) 

('dbprodutos',)
('information_schema',)
('mysql',)
('performance_schema',)
('sys',)


## Criando uma tabela

Antes de criar nossa tabela, vamos revisar as colunas necessárias que precisaremos incluir nela. Essa etapa é importante para garantir que nossa tabela seja projetada corretamente, atendendo aos requisitos de armazenamento e organização dos dados.

In [6]:
import pandas as pd

df_livros = pd.read_csv("../data/tabela_livros.csv")

df_livros.head()

Unnamed: 0,_id,Produto,Categoria do Produto,Preço,Frete,Data da Compra,Vendedor,Local da compra,Avaliação da compra,Tipo de pagamento,Quantidade de parcelas,Latitude,Longitude
0,67da0e428db414948c460b12,Dashboards com Power BI,livros,57.63,9.31056,2022-02-01,Bianca Santos,SP,3,cartao_credito,1,-22.19,-48.79
1,67da0e428db414948c460b73,Dashboards com Power BI,livros,46.58,0.0,2020-06-01,Rafael Costa,PR,1,cartao_credito,4,-24.89,-51.55
2,67da0e428db414948c460b3c,Ciência de dados com python,livros,50.51,10.245086,2022-03-01,Thiago Silva,MG,1,cartao_credito,6,-18.1,-44.38
3,67da0e428db414948c460b40,Modelagem preditiva,livros,71.64,1.399054,2023-03-01,Mariana Ferreira,SP,4,cartao_credito,2,-22.19,-48.79
4,67da0e428db414948c460ba5,Modelagem preditiva,livros,105.99,3.228088,2022-07-01,Thiago Silva,SP,1,cartao_credito,4,-22.19,-48.79


In [22]:
df_livros.columns

Index(['_id', 'Produto', 'Categoria do Produto', 'Preço', 'Frete',
       'Data da Compra', 'Vendedor', 'Local da compra', 'Avaliação da compra',
       'Tipo de pagamento', 'Quantidade de parcelas', 'Latitude', 'Longitude'],
      dtype='object')

In [None]:
df_livros.shape

(1484, 13)

**Selecionando a base de dados para verificar a tabela criada**

In [24]:
cursor.execute(""" 
    CREATE TABLE IF NOT EXISTS dbprodutos.tb_livros(
        id VARCHAR(100),
        Produto VARCHAR(100),
        Categoria_Produto VARCHAR(100),
        Preco FLOAT(10,2),
        Frete FLOAT(10,2),
        Data_Compra DATE,
        Vendedor VARCHAR(100),
        Local_Compra VARCHAR(100),
        Avaliacao_Compra INT,
        Tipo_Pagamento VARCHAR(100),
        Qntd_Parcelas INT,
        Latitude FLOAT(10,2),
        Longitude FLOAT(10,2),

        PRIMARY KEY (id)                  
    );
""")

## Inserindo os dados do csv na tabela

Para inserir os dados na tabela do MySQL, é necessário percorrer cada linha do DataFrame e transformá-las em tuplas. Essa abordagem permite que mapeemos os dados do DataFrame para as colunas correspondentes da tabela do MySQL de forma eficiente e precisa.

In [6]:
cursor.execute("USE dbprodutos;")

In [7]:
cursor.execute("SHOW TABLES;")

for tb in cursor:
    print(tb)

('tb_livros',)
('tb_livros_2021',)


In [8]:
for i, row in df_livros.iterrows():
    print(tuple(row))

('67da0e428db414948c460b12', 'Dashboards com Power BI', 'livros', 57.63, 9.3105595123, '2022-02-01', 'Bianca Santos', 'SP', 3, 'cartao_credito', 1, -22.19, -48.79)
('67da0e428db414948c460b73', 'Dashboards com Power BI', 'livros', 46.58, 0.0, '2020-06-01', 'Rafael Costa', 'PR', 1, 'cartao_credito', 4, -24.89, -51.55)
('67da0e428db414948c460b3c', 'Ciência de dados com python', 'livros', 50.51, 10.2450858314, '2022-03-01', 'Thiago Silva', 'MG', 1, 'cartao_credito', 6, -18.1, -44.38)
('67da0e428db414948c460b40', 'Modelagem preditiva', 'livros', 71.64, 1.3990535443, '2023-03-01', 'Mariana Ferreira', 'SP', 4, 'cartao_credito', 2, -22.19, -48.79)
('67da0e428db414948c460ba5', 'Modelagem preditiva', 'livros', 105.99, 3.2280877057, '2022-07-01', 'Thiago Silva', 'SP', 1, 'cartao_credito', 4, -22.19, -48.79)
('67da0e428db414948c460bba', 'Modelagem preditiva', 'livros', 101.54, 14.5010858917, '2021-08-01', 'Rafael Costa', 'DF', 3, 'cartao_credito', 4, -15.83, -47.86)
('67da0e428db414948c460c19', 'C

In [9]:
lista_dados =  [tuple(row) for i, row in df_livros.iterrows()]
lista_dados

[('67da0e428db414948c460b12',
  'Dashboards com Power BI',
  'livros',
  57.63,
  9.3105595123,
  '2022-02-01',
  'Bianca Santos',
  'SP',
  3,
  'cartao_credito',
  1,
  -22.19,
  -48.79),
 ('67da0e428db414948c460b73',
  'Dashboards com Power BI',
  'livros',
  46.58,
  0.0,
  '2020-06-01',
  'Rafael Costa',
  'PR',
  1,
  'cartao_credito',
  4,
  -24.89,
  -51.55),
 ('67da0e428db414948c460b3c',
  'Ciência de dados com python',
  'livros',
  50.51,
  10.2450858314,
  '2022-03-01',
  'Thiago Silva',
  'MG',
  1,
  'cartao_credito',
  6,
  -18.1,
  -44.38),
 ('67da0e428db414948c460b40',
  'Modelagem preditiva',
  'livros',
  71.64,
  1.3990535443,
  '2023-03-01',
  'Mariana Ferreira',
  'SP',
  4,
  'cartao_credito',
  2,
  -22.19,
  -48.79),
 ('67da0e428db414948c460ba5',
  'Modelagem preditiva',
  'livros',
  105.99,
  3.2280877057,
  '2022-07-01',
  'Thiago Silva',
  'SP',
  1,
  'cartao_credito',
  4,
  -22.19,
  -48.79),
 ('67da0e428db414948c460bba',
  'Modelagem preditiva',
  'livr

In [46]:
sql = "INSERT INTO dbprodutos.tb_livros VALUES (%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s);"

cursor.executemany(sql, lista_dados)
cnx.commit()

## Visualizando os dados inseridos

In [47]:
print(cursor.rowcount, "dados foram inseridos.")

1484 dados foram inseridos.


In [10]:
sql = "SELECT * FROM dbprodutos.tb_livros where Local_Compra = 'SP' and Tipo_Pagamento <> 'Boleto' AND  Tipo_Pagamento <> 'cartao_credito' AND  Tipo_Pagamento <> 'cupom'"

cursor.execute(sql)

for tb in cursor:
    print(tb)

('67da0e428db414948c46137d', 'Iniciando em programação', 'livros', 71.45, 1.39, datetime.date(2023, 3, 8), 'Isabella Pereira', 'SP', 5, 'cartao_debito', 1, -22.19, -48.79)
('67da0e428db414948c461970', 'Modelagem preditiva', 'livros', 87.82, 2.26, datetime.date(2020, 3, 13), 'Lucas Oliveira', 'SP', 4, 'cartao_debito', 1, -22.19, -48.79)
('67da0e428db414948c46277c', 'Modelagem preditiva', 'livros', 98.74, 2.84, datetime.date(2020, 8, 24), 'Felipe Santos', 'SP', 5, 'cartao_debito', 1, -22.19, -48.79)
('67da0e428db414948c462b44', 'Ciência de dados com python', 'livros', 82.73, 1.99, datetime.date(2021, 8, 27), 'Bianca Santos', 'SP', 5, 'cartao_debito', 1, -22.19, -48.79)
('6855f7c9f04c452e34470cff', 'Iniciando em programação', 'livros', 71.45, 1.39, datetime.date(2023, 3, 8), 'Isabella Pereira', 'SP', 5, 'cartao_debito', 1, -22.19, -48.79)
('6855f7c9f04c452e344712f2', 'Modelagem preditiva', 'livros', 87.82, 2.26, datetime.date(2020, 3, 13), 'Lucas Oliveira', 'SP', 4, 'cartao_debito', 1, -2

In [11]:
df_livros_2021 = pd.read_csv("../data/tabela_2021_em_diante.csv")

df_livros_2021.head()

Unnamed: 0,_id,Produto,Categoria do Produto,Preço,Frete,Data da Compra,Vendedor,Local da compra,Avaliação da compra,Tipo de pagamento,Quantidade de parcelas,Latitude,Longitude
0,67da0e428db414948c460afa,Jogo de copos,utilidades domesticas,37.44,2.881983,2022-01-01,Thiago Silva,RJ,4,cartao_credito,4,-22.25,-42.66
1,67da0e428db414948c460b09,Cama king,moveis,660.46,35.450634,2021-02-01,Juliana Costa,RJ,5,cartao_credito,3,-22.25,-42.66
2,67da0e428db414948c460b12,Dashboards com Power BI,livros,57.63,9.31056,2022-02-01,Bianca Santos,SP,3,cartao_credito,1,-22.19,-48.79
3,67da0e428db414948c460b53,Boneca bebê,brinquedos,51.2,3.25735,2021-04-01,Rafael Costa,SP,5,cartao_credito,1,-22.19,-48.79
4,67da0e428db414948c460b56,Guarda roupas,moveis,666.47,33.071962,2022-04-01,Rafael Costa,MA,5,boleto,1,-5.42,-45.44


In [57]:
df_livros_2021.columns

Index(['_id', 'Produto', 'Categoria do Produto', 'Preço', 'Frete',
       'Data da Compra', 'Vendedor', 'Local da compra', 'Avaliação da compra',
       'Tipo de pagamento', 'Quantidade de parcelas', 'Latitude', 'Longitude'],
      dtype='object')

In [58]:
df_livros_2021.shape

(13148, 13)

In [59]:
cursor.execute(""" 
    CREATE TABLE IF NOT EXISTS dbprodutos.tb_livros_2021(
        id VARCHAR(100),
        Produto VARCHAR(100),
        Categoria_Produto VARCHAR(100),
        Preco FLOAT(10,2),
        Frete FLOAT(10,2),
        Data_Compra DATE,
        Vendedor VARCHAR(100),
        Local_Compra VARCHAR(100),
        Avaliacao_Compra INT,
        Tipo_Pagamento VARCHAR(100),
        Qntd_Parcelas INT,
        Latitude FLOAT(10,2),
        Longitude FLOAT(10,2),

        PRIMARY KEY (id)                  
    );
""")

In [12]:
cursor.execute("USE dbprodutos;")
cursor.execute("SHOW TABLES;")

for tb in cursor:
    print(tb)

('tb_livros',)
('tb_livros_2021',)


In [67]:
lista_dados_2021 =  [tuple(row) for i, row in df_livros_2021.iterrows()]

In [62]:
sql = "INSERT INTO dbprodutos.tb_livros_2021 VALUES (%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s);"

cursor.executemany(sql, lista_dados_2021)
cnx.commit()

In [74]:
print(cursor.rowcount, "dados foram inseridos.")

1 dados foram inseridos.


In [13]:
# sql = "SELECT * FROM dbprodutos.tb_livros_2021;"
sql = "SELECT COUNT(*) FROM dbprodutos.tb_livros_2021;"

cursor.execute(sql)

for tb in cursor:
    print(tb)

(13148,)
