## Configurando o MySQL com Python

Neste momento, vamos configurar a integração entre o MySQL e Python. Isso nos permitirá executar consultas, inserções e outras operações no banco de dados MySQL usando o Python como nossa linguagem de programação principal.

In [23]:
import mysql.connector
from personal_info import *

cnx = mysql.connector.connect(
    host=MYSQL_HOST,
    user=MYSQL_USER,
    password=MYSQL_PASSWORD
)

print(cnx)


<mysql.connector.connection_cext.CMySQLConnection object at 0x7f4db39ddea0>


Criaremos um cursor, que é um objeto utilizado para executar instruções SQL no contexto do Python. Essse cursor nos permitirá enviar consultas e comandos SQL para o banco de dados MySQL por meio da conexão estabelecida e obter os resultados de volta para serem processados em nosso código Python

In [24]:
cursor = cnx.cursor()

## Criando uma base de dados

O método `execute()` é usado para compilar uma instrução SQL

In [25]:
cursor.execute("CREATE DATABASE IF NOT EXISTS alura_dbprodutos;")

In [None]:
cursor.execute("SHOW DATABASES;")

for db in cursor:
    print(db)

('alura_dbprodutos',)
('information_schema',)
('mysql',)
('performance_schema',)
('sys',)


## Criando uma tabela

Antes de criar nossa tabela, vamos revisar as colunas necessárias que precisaremos incluir nela. Essa etapa é importante para garantir que nossa tabela seja projetada corretamente, atendendo aos requisitos de armazenamento e organização dos dados.

In [28]:
import pandas as pd

df_livros = pd.read_csv("../data/tabela_livros.csv")
df_livros.head()

Unnamed: 0,_id,Produto,Categoria do Produto,Preço,Frete,Data da Compra,Vendedor,Local da compra,Avaliação da compra,Tipo de pagamento,Quantidade de parcelas,Latitude,Longitude
0,672e9863f138b7914b828d09,Iniciando em programação,livros,43.84,0.0,2020-01-01,Mariana Ferreira,SP,5,cartao_credito,1,-22.19,-48.79
1,672e9863f138b7914b828d1b,Iniciando em programação,livros,63.25,3.894137,2022-01-01,Juliana Costa,RJ,5,cartao_credito,4,-22.25,-42.66
2,672e9863f138b7914b828d29,Ciência de dados com python,livros,86.13,5.273176,2021-02-01,Camila Ribeiro,RJ,4,cartao_credito,3,-22.25,-42.66
3,672e9863f138b7914b828d2b,Ciência de dados com python,livros,72.75,1.458158,2021-02-01,Beatriz Moraes,PR,4,cartao_credito,2,-24.89,-51.55
4,672e9863f138b7914b828d2e,Iniciando em programação,livros,61.73,0.0,2021-02-01,Beatriz Moraes,SP,4,cartao_credito,1,-22.19,-48.79


In [49]:
df_produtos = pd.read_csv("../data/tabela_2021_em_diante.csv")
df_produtos.head()

Unnamed: 0,_id,Produto,Categoria do Produto,Preço,Frete,Data da Compra,Vendedor,Local da compra,Avaliação da compra,Tipo de pagamento,Quantidade de parcelas,Latitude,Longitude
0,672e9863f138b7914b828d11,Xadrez de madeira,brinquedos,25.23,0.0,2021-01-01,Thiago Silva,BA,5,cartao_credito,2,-13.29,-41.71
1,672e9863f138b7914b828d12,Impressora,eletronicos,322.04,14.7321,2021-01-01,João Souza,SP,3,cartao_credito,1,-22.19,-48.79
2,672e9863f138b7914b828d13,Mesa de centro,moveis,282.22,12.611805,2021-01-01,João Souza,SP,3,boleto,1,-22.19,-48.79
3,672e9863f138b7914b828d14,Tablet ABXY,eletronicos,1100.42,68.451348,2021-01-01,Beatriz Moraes,SP,1,cupom,1,-22.19,-48.79
4,672e9863f138b7914b828d15,Fogão,eletrodomesticos,791.81,42.444626,2021-01-01,Juliana Costa,SP,4,boleto,1,-22.19,-48.79


In [30]:
df_livros.columns

Index(['_id', 'Produto', 'Categoria do Produto', 'Preço', 'Frete',
       'Data da Compra', 'Vendedor', 'Local da compra', 'Avaliação da compra',
       'Tipo de pagamento', 'Quantidade de parcelas', 'Latitude', 'Longitude'],
      dtype='object')

In [50]:
df_produtos.columns

Index(['_id', 'Produto', 'Categoria do Produto', 'Preço', 'Frete',
       'Data da Compra', 'Vendedor', 'Local da compra', 'Avaliação da compra',
       'Tipo de pagamento', 'Quantidade de parcelas', 'Latitude', 'Longitude'],
      dtype='object')

In [51]:
df_livros.shape

(741, 13)

In [52]:
df_produtos.shape

(6574, 13)

In [53]:
cursor.execute("""
    CREATE TABLE IF NOT EXISTS alura_dbprodutos.table_livros(
        id VARCHAR(100),
        Produto VARCHAR(100),
        Categoria_Produto VARCHAR(100),
        Preco FLOAT(10,2),
        Frete FLOAT(10,2),
        Data_Compra DATE,
        Vendedor VARCHAR(100),
        Local_Compra VARCHAR(100),
        Avaliacao_Compra INT,
        Tipo_Pagamento VARCHAR(100),
        Qntd_Parcelas INT,
        Latitude FLOAT(10,2),
        Longitude FLOAT(10,2),
        
        PRIMARY KEY (id)
    );
""")

In [54]:
cursor.execute("""
    CREATE TABLE IF NOT EXISTS alura_dbprodutos.table_produtos_2021_em_diante (
        id VARCHAR(100),
        Produto VARCHAR(100),
        Categoria_Produto VARCHAR(100),
        Preco FLOAT(10,2),
        Frete FLOAT(10,2),
        Data_Compra DATE,
        Vendedor VARCHAR(100),
        Local_Compra VARCHAR(100),
        Avaliacao_Compra INT,
        Tipo_Pagamento VARCHAR(100),
        Qntd_Parcelas INT,
        Latitude FLOAT(10,2),
        Longitude FLOAT(10,2),
        
        PRIMARY KEY (id)
    );
""")

**Selecionando a base de dados para verificar a tabela criada**

In [55]:
cursor.execute("USE alura_dbprodutos;")
cursor.execute("SHOW TABLES;")

for table in cursor:
    print(table)

('table_livros',)
('table_produtos_2021_em_diante',)


## Inserindo os dados do csv na tabela

Para inserir os dados na tabela do MySQL, é necessário percorrer cada linha do DataFrame e transformá-las em tuplas. Essa abordagem permite que mapeemos os dados do DataFrame para as colunas correspondentes da tabela do MySQL de forma eficiente e precisa.

In [43]:
for i, row in df_livros.iterrows():
    print(tuple(row))

('672e9863f138b7914b828d09', 'Iniciando em programação', 'livros', 43.84, 0.0, '2020-01-01', 'Mariana Ferreira', 'SP', 5, 'cartao_credito', 1, -22.19, -48.79)
('672e9863f138b7914b828d1b', 'Iniciando em programação', 'livros', 63.25, 3.894137208, '2022-01-01', 'Juliana Costa', 'RJ', 5, 'cartao_credito', 4, -22.25, -42.66)
('672e9863f138b7914b828d29', 'Ciência de dados com python', 'livros', 86.13, 5.2731755368, '2021-02-01', 'Camila Ribeiro', 'RJ', 4, 'cartao_credito', 3, -22.25, -42.66)
('672e9863f138b7914b828d2b', 'Ciência de dados com python', 'livros', 72.75, 1.458157705, '2021-02-01', 'Beatriz Moraes', 'PR', 4, 'cartao_credito', 2, -24.89, -51.55)
('672e9863f138b7914b828d2e', 'Iniciando em programação', 'livros', 61.73, 0.0, '2021-02-01', 'Beatriz Moraes', 'SP', 4, 'cartao_credito', 1, -22.19, -48.79)
('672e9863f138b7914b828d31', 'Dashboards com Power BI', 'livros', 57.63, 9.3105595123, '2022-02-01', 'Bianca Santos', 'SP', 3, 'cartao_credito', 1, -22.19, -48.79)
('672e9863f138b7914

In [46]:
# List comprehension
lista_dados = [tuple(row) for i, row in df_livros.iterrows()]
lista_dados[1]

('672e9863f138b7914b828d1b',
 'Iniciando em programação',
 'livros',
 63.25,
 3.894137208,
 '2022-01-01',
 'Juliana Costa',
 'RJ',
 5,
 'cartao_credito',
 4,
 -22.25,
 -42.66)

In [56]:
# List comprehension
lista_dados_produtos = [tuple(row) for i, row in df_produtos.iterrows()]
lista_dados_produtos[1]

('672e9863f138b7914b828d12',
 'Impressora',
 'eletronicos',
 322.04,
 14.7321002401,
 '2021-01-01',
 'João Souza',
 'SP',
 3,
 'cartao_credito',
 1,
 -22.19,
 -48.79)

In [None]:
sql = "INSERT INTO alura_dbprodutos.table_livros VALUES (%s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s);"

cursor.executemany(sql, lista_dados)
cnx.commit()
print(cursor.rowcount, "dados inseridos")

In [None]:
sql = "INSERT INTO alura_dbprodutos.table_produtos_2021_em_diante VALUES (%s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s);"

cursor.executemany(sql, lista_dados_produtos)
cnx.commit()
print(cursor.rowcount, "dados inseridos")

## Visualizando os dados inseridos

In [62]:
cursor.execute("SELECT * FROM alura_dbprodutos.table_livros LIMIT 5;")

for row in cursor:
    print(row)

('672e9863f138b7914b828d09', 'Iniciando em programação', 'livros', 43.84, 0.0, datetime.date(2020, 1, 1), 'Mariana Ferreira', 'SP', 5, 'cartao_credito', 1, -22.19, -48.79)
('672e9863f138b7914b828d1b', 'Iniciando em programação', 'livros', 63.25, 3.89, datetime.date(2022, 1, 1), 'Juliana Costa', 'RJ', 5, 'cartao_credito', 4, -22.25, -42.66)
('672e9863f138b7914b828d29', 'Ciência de dados com python', 'livros', 86.13, 5.27, datetime.date(2021, 2, 1), 'Camila Ribeiro', 'RJ', 4, 'cartao_credito', 3, -22.25, -42.66)
('672e9863f138b7914b828d2b', 'Ciência de dados com python', 'livros', 72.75, 1.46, datetime.date(2021, 2, 1), 'Beatriz Moraes', 'PR', 4, 'cartao_credito', 2, -24.89, -51.55)
('672e9863f138b7914b828d2e', 'Iniciando em programação', 'livros', 61.73, 0.0, datetime.date(2021, 2, 1), 'Beatriz Moraes', 'SP', 4, 'cartao_credito', 1, -22.19, -48.79)


In [64]:
cursor.close()

False

In [65]:

cnx.close()