## Configurando o MySQL com Python

Neste momento, vamos configurar a integração entre o MySQL e Python. Isso nos permitirá executar consultas, inserções e outras operações no banco de dados MySQL usando o Python como nossa linguagem de programação principal.

In [69]:
import os
from dotenv import load_dotenv
import mysql.connector

load_dotenv()

host = os.getenv("DB_HOST")
user = os.getenv("DB_USERNAME")
password= os.getenv("DB_PASSWORD")

cnx = mysql.connector.connect(
    host = host,
    user = user,
    password= password
)


<mysql.connector.connection_cext.CMySQLConnection object at 0x7ef8ae8e3a90>


Criaremos um cursor, que é um objeto utilizado para executar instruções SQL no contexto do Python. Essse cursor nos permitirá enviar consultas e comandos SQL para o banco de dados MySQL por meio da conexão estabelecida e obter os resultados de volta para serem processados em nosso código Python

In [60]:
cursor = cnx.cursor()

## Criando uma base de dados

O método `execute()` é usado para compilar uma instrução SQL

In [10]:
cursor.execute('CREATE DATABASE IF NOT EXISTS db_produtos;')

In [13]:
cursor.execute('SHOW DATABASES;')

for dbs in cursor:
    print(dbs)

('db_produtos',)
('information_schema',)
('mysql',)
('performance_schema',)
('sys',)


## Criando uma tabela

Antes de criar nossa tabela, vamos revisar as colunas necessárias que precisaremos incluir nela. Essa etapa é importante para garantir que nossa tabela seja projetada corretamente, atendendo aos requisitos de armazenamento e organização dos dados.

In [None]:
import pandas as pd

df_livros = pd.read_csv('../data/tabela_livros.csv')
df_livros.head()

Unnamed: 0,_id,Produto,Categoria do Produto,Preço,Frete,Data da Compra,Vendedor,Local da compra,Avaliação da compra,Tipo de pagamento,Quantidade de parcelas,Latitude,Longitude
0,68d5c99fe9d1b9afa7631953,Modelagem preditiva,livros,92.45,5.609697,2020-01-01,Thiago Silva,BA,1,cartao_credito,3,-13.29,-41.71
1,68d5c99fe9d1b9afa7631954,Iniciando em programação,livros,43.84,0.0,2020-01-01,Mariana Ferreira,SP,5,cartao_credito,1,-22.19,-48.79
2,68d5c99fe9d1b9afa7631966,Iniciando em programação,livros,63.25,3.894137,2022-01-01,Juliana Costa,RJ,5,cartao_credito,4,-22.25,-42.66
3,68d5c99fe9d1b9afa7631974,Ciência de dados com python,livros,86.13,5.273176,2021-02-01,Camila Ribeiro,RJ,4,cartao_credito,3,-22.25,-42.66
4,68d5c99fe9d1b9afa7631976,Ciência de dados com python,livros,72.75,1.458158,2021-02-01,Beatriz Moraes,PR,4,cartao_credito,2,-24.89,-51.55


In [16]:
df_livros.columns

Index(['_id', 'Produto', 'Categoria do Produto', 'Preço', 'Frete',
       'Data da Compra', 'Vendedor', 'Local da compra', 'Avaliação da compra',
       'Tipo de pagamento', 'Quantidade de parcelas', 'Latitude', 'Longitude'],
      dtype='object')

In [17]:
df_livros.shape

(742, 13)

In [19]:
cursor.execute("""
    CREATE TABLE IF NOT EXISTS db_produtos.tb_livros(
               id VARCHAR(100),
               Produto VARCHAR(100),
               Categoria_Produto VARCHAR(100),
               Preco FLOAT(10,2),
               Frete FLOAT(10,2),
               Data_Compra DATE,
               Vendedor VARCHAR(100),
               Local_Compra VARCHAR(100),
               Avaliacao_Compra INT,
               Tipo_Pagamento VARCHAR(100),
               Qntd_Parcelas INT,
               Latitude FLOAT(10,2),
               Longitude FLOAT(10,2),
               
                PRIMARY KEY (id)
    );
""")

**Selecionando a base de dados para verificar a tabela criada**

In [20]:
cursor.execute('USE db_produtos;')
cursor.execute('SHOW TABLES;')

for i in cursor:
    print(i)

('tb_livros',)


## Inserindo os dados do csv na tabela

In [25]:
for i, row in df_livros.iterrows():
    print(tuple(row))

('68d5c99fe9d1b9afa7631953', 'Modelagem preditiva', 'livros', 92.45, 5.6096965236, '2020-01-01', 'Thiago Silva', 'BA', 1, 'cartao_credito', 3, -13.29, -41.71)
('68d5c99fe9d1b9afa7631954', 'Iniciando em programação', 'livros', 43.84, 0.0, '2020-01-01', 'Mariana Ferreira', 'SP', 5, 'cartao_credito', 1, -22.19, -48.79)
('68d5c99fe9d1b9afa7631966', 'Iniciando em programação', 'livros', 63.25, 3.894137208, '2022-01-01', 'Juliana Costa', 'RJ', 5, 'cartao_credito', 4, -22.25, -42.66)
('68d5c99fe9d1b9afa7631974', 'Ciência de dados com python', 'livros', 86.13, 5.2731755368, '2021-02-01', 'Camila Ribeiro', 'RJ', 4, 'cartao_credito', 3, -22.25, -42.66)
('68d5c99fe9d1b9afa7631976', 'Ciência de dados com python', 'livros', 72.75, 1.458157705, '2021-02-01', 'Beatriz Moraes', 'PR', 4, 'cartao_credito', 2, -24.89, -51.55)
('68d5c99fe9d1b9afa7631979', 'Iniciando em programação', 'livros', 61.73, 0.0, '2021-02-01', 'Beatriz Moraes', 'SP', 4, 'cartao_credito', 1, -22.19, -48.79)
('68d5c99fe9d1b9afa76319

In [26]:
lista_dados = [tuple(row) for i,row in df_livros.iterrows()]
lista_dados

[('68d5c99fe9d1b9afa7631953',
  'Modelagem preditiva',
  'livros',
  92.45,
  5.6096965236,
  '2020-01-01',
  'Thiago Silva',
  'BA',
  1,
  'cartao_credito',
  3,
  -13.29,
  -41.71),
 ('68d5c99fe9d1b9afa7631954',
  'Iniciando em programação',
  'livros',
  43.84,
  0.0,
  '2020-01-01',
  'Mariana Ferreira',
  'SP',
  5,
  'cartao_credito',
  1,
  -22.19,
  -48.79),
 ('68d5c99fe9d1b9afa7631966',
  'Iniciando em programação',
  'livros',
  63.25,
  3.894137208,
  '2022-01-01',
  'Juliana Costa',
  'RJ',
  5,
  'cartao_credito',
  4,
  -22.25,
  -42.66),
 ('68d5c99fe9d1b9afa7631974',
  'Ciência de dados com python',
  'livros',
  86.13,
  5.2731755368,
  '2021-02-01',
  'Camila Ribeiro',
  'RJ',
  4,
  'cartao_credito',
  3,
  -22.25,
  -42.66),
 ('68d5c99fe9d1b9afa7631976',
  'Ciência de dados com python',
  'livros',
  72.75,
  1.458157705,
  '2021-02-01',
  'Beatriz Moraes',
  'PR',
  4,
  'cartao_credito',
  2,
  -24.89,
  -51.55),
 ('68d5c99fe9d1b9afa7631979',
  'Iniciando em progr

In [27]:
sql = 'INSERT INTO db_produtos.tb_livros VALUES (%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s);'

cursor.executemany(sql, lista_dados)
cnx.commit()

In [28]:
print(cursor.rowcount, 'dados inseridos')

742 dados inseridos


## Criando tabela 2021

In [None]:
df_2021 = pd.read_csv('../data/tabela_2021_mais.csv')
df_2021.head()

In [48]:
df_2021.columns

Index(['_id', 'Produto', 'Categoria do Produto', 'Preço', 'Frete',
       'Data da Compra', 'Vendedor', 'Local da compra', 'Avaliação da compra',
       'Tipo de pagamento', 'Quantidade de parcelas', 'Latitude', 'Longitude'],
      dtype='object')

In [49]:
df_2021.shape

(6574, 13)

In [50]:
cursor.execute("""
    CREATE TABLE IF NOT EXISTS db_produtos.tb_produtos(
               id VARCHAR(100),
               Produto VARCHAR(100),
               Categoria_Produto VARCHAR(100),
               Preco FLOAT(10,2),
               Frete FLOAT(10,2),
               Data_Compra DATE,
               Vendedor VARCHAR(100),
               Local_Compra VARCHAR(100),
               Avaliacao_Compra INT,
               Tipo_Pagamento VARCHAR(100),
               Qntd_Parcelas INT,
               Latitude FLOAT(10,2),
               Longitude FLOAT(10,2),
               
                PRIMARY KEY (id)
    );
""")

In [61]:
cursor.execute('USE db_produtos;')
cursor.execute('SHOW TABLES;')

for i in cursor:
    print(i)

('tb_livros',)
('tb_produtos',)


## Inserindo dados 2021

In [52]:
for i, row in df_2021.iterrows():
    print(tuple(row))

('68d5c99fe9d1b9afa763195c', 'Xadrez de madeira', 'brinquedos', 25.23, 0.0, '2021-01-01', 'Thiago Silva', 'BA', 5, 'cartao_credito', 2, -13.29, -41.71)
('68d5c99fe9d1b9afa763195d', 'Impressora', 'eletronicos', 322.04, 14.7321002401, '2021-01-01', 'João Souza', 'SP', 3, 'cartao_credito', 1, -22.19, -48.79)
('68d5c99fe9d1b9afa763195e', 'Mesa de centro', 'moveis', 282.22, 12.6118050347, '2021-01-01', 'João Souza', 'SP', 3, 'boleto', 1, -22.19, -48.79)
('68d5c99fe9d1b9afa763195f', 'Tablet ABXY', 'eletronicos', 1100.42, 68.4513476183, '2021-01-01', 'Beatriz Moraes', 'SP', 1, 'cupom', 1, -22.19, -48.79)
('68d5c99fe9d1b9afa7631960', 'Fogão', 'eletrodomesticos', 791.81, 42.4446263246, '2021-01-01', 'Juliana Costa', 'SP', 4, 'boleto', 1, -22.19, -48.79)
('68d5c99fe9d1b9afa7631961', 'Violão', 'instrumentos musicais', 316.84, 17.1595536296, '2022-01-01', 'Pedro Gomes', 'SP', 5, 'cartao_credito', 2, -22.19, -48.79)
('68d5c99fe9d1b9afa7631962', 'Geladeira', 'eletrodomesticos', 2322.94, 121.27400572

In [53]:
lista_dados_2021 = [tuple(row) for i,row in df_2021.iterrows()]
lista_dados_2021

[('68d5c99fe9d1b9afa763195c',
  'Xadrez de madeira',
  'brinquedos',
  25.23,
  0.0,
  '2021-01-01',
  'Thiago Silva',
  'BA',
  5,
  'cartao_credito',
  2,
  -13.29,
  -41.71),
 ('68d5c99fe9d1b9afa763195d',
  'Impressora',
  'eletronicos',
  322.04,
  14.7321002401,
  '2021-01-01',
  'João Souza',
  'SP',
  3,
  'cartao_credito',
  1,
  -22.19,
  -48.79),
 ('68d5c99fe9d1b9afa763195e',
  'Mesa de centro',
  'moveis',
  282.22,
  12.6118050347,
  '2021-01-01',
  'João Souza',
  'SP',
  3,
  'boleto',
  1,
  -22.19,
  -48.79),
 ('68d5c99fe9d1b9afa763195f',
  'Tablet ABXY',
  'eletronicos',
  1100.42,
  68.4513476183,
  '2021-01-01',
  'Beatriz Moraes',
  'SP',
  1,
  'cupom',
  1,
  -22.19,
  -48.79),
 ('68d5c99fe9d1b9afa7631960',
  'Fogão',
  'eletrodomesticos',
  791.81,
  42.4446263246,
  '2021-01-01',
  'Juliana Costa',
  'SP',
  4,
  'boleto',
  1,
  -22.19,
  -48.79),
 ('68d5c99fe9d1b9afa7631961',
  'Violão',
  'instrumentos musicais',
  316.84,
  17.1595536296,
  '2022-01-01',
  '

In [54]:
sql = 'INSERT INTO db_produtos.tb_produtos VALUES (%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s);'

cursor.executemany(sql, lista_dados_2021)
cnx.commit()

In [55]:
print(cursor.rowcount, 'dados inseridos')

6574 dados inseridos


## Visualizando os dados inseridos

In [62]:
cursor.execute('SELECT * FROM db_produtos.tb_livros')

for i in cursor:
    print(i)

('68d5c99fe9d1b9afa7631953', 'Modelagem preditiva', 'livros', 92.45, 5.61, datetime.date(2020, 1, 1), 'Thiago Silva', 'BA', 1, 'cartao_credito', 3, -13.29, -41.71)
('68d5c99fe9d1b9afa7631954', 'Iniciando em programação', 'livros', 43.84, 0.0, datetime.date(2020, 1, 1), 'Mariana Ferreira', 'SP', 5, 'cartao_credito', 1, -22.19, -48.79)
('68d5c99fe9d1b9afa7631966', 'Iniciando em programação', 'livros', 63.25, 3.89, datetime.date(2022, 1, 1), 'Juliana Costa', 'RJ', 5, 'cartao_credito', 4, -22.25, -42.66)
('68d5c99fe9d1b9afa7631974', 'Ciência de dados com python', 'livros', 86.13, 5.27, datetime.date(2021, 2, 1), 'Camila Ribeiro', 'RJ', 4, 'cartao_credito', 3, -22.25, -42.66)
('68d5c99fe9d1b9afa7631976', 'Ciência de dados com python', 'livros', 72.75, 1.46, datetime.date(2021, 2, 1), 'Beatriz Moraes', 'PR', 4, 'cartao_credito', 2, -24.89, -51.55)
('68d5c99fe9d1b9afa7631979', 'Iniciando em programação', 'livros', 61.73, 0.0, datetime.date(2021, 2, 1), 'Beatriz Moraes', 'SP', 4, 'cartao_credi

In [63]:
cursor.close()

True

In [64]:
cnx.close()