## Configurando o MySQL com Python

Neste momento, vamos configurar a integração entre o MySQL e Python. Isso nos permitirá executar consultas, inserções e outras operações no banco de dados MySQL usando o Python como nossa linguagem de programação principal.

In [2]:

def connect_mysql(host_name, user_name, pw):
    cnx = mysql.connector.connect(
        host = host_name,
        user = user_name,
        password = pw
    )
    
    return cnx

In [7]:
a = connect_mysql('localhost','orlando_bussolo', 'asdfg...')

<mysql.connector.connection_cext.CMySQLConnection object at 0x7f2b7da7ca60>


Criaremos um cursor, que é um objeto utilizado para executar instruções SQL no contexto do Python. Essse cursor nos permitirá enviar consultas e comandos SQL para o banco de dados MySQL por meio da conexão estabelecida e obter os resultados de volta para serem processados em nosso código Python

In [12]:
def create_cursor(cnx):
    cursor = cnx.cursor()
    return cursor
    print(cursor)

In [15]:
b = create_cursor(a)

## Criando uma base de dados

O método `execute()` é usado para compilar uma instrução SQL

('db_games',)
('information_schema',)
('mysql',)
('performance_schema',)
('sys',)


In [29]:
cursor.execute("USE db_games")
cursor.execute("SHOW TABLES")
for a in cursor:
    print(a)    

('premiere_league',)


In [14]:
def create_database(cursor, db_name):
    cursor.execute(f"CREATE DATABASE IF NOT EXISTS,{db_name}")
    print(f"\nBase de dados {db_name} criada")

## Criando uma tabela

Antes de criar nossa tabela, vamos revisar as colunas necessárias que precisaremos incluir nela. Essa etapa é importante para garantir que nossa tabela seja projetada corretamente, atendendo aos requisitos de armazenamento e organização dos dados.

In [None]:
 df = pd.read_csv("/home/orlando_linux/pipeline-python-mongo-mysql/data_teste/tabela.csv")

**Selecionando a base de dados para verificar a tabela criada**

## Inserindo os dados do csv na tabela

Para inserir os dados na tabela do MySQL, é necessário percorrer cada linha do DataFrame e transformá-las em tuplas. Essa abordagem permite que mapeemos os dados do DataFrame para as colunas correspondentes da tabela do MySQL de forma eficiente e precisa.

In [1]:
import mysql.connector
import pandas as pd

cnx = mysql.connector.connect(
        host = 'localhost',
        user = 'orlando_bussolo',
        password = 'asdfg...'
    )

cursor = cnx.cursor()
cursor.execute("CREATE DATABASE IF NOT EXISTS db_games")

cursor.execute("SHOW DATABASES")
for x in cursor:
    print(x)


('db_games',)
('information_schema',)
('mysql',)
('performance_schema',)
('sys',)


In [2]:
cursor.execute("""
        CREATE TABLE IF NOT EXISTS db_games.premiere_league(
        
        match_id INT,
        league_id INT,
        match_date DATE,
        match_time TIME,
        match_hometeam_id INT,
        match_hometeam_name VARCHAR(255),
        match_hometeam_score INT,
        match_awayteam_name VARCHAR(255),
        match_awayteam_id INT,
        match_awayteam_score INT,
        match_round INT,
        match_stadium VARCHAR(255),
        match_referee VARCHAR(255),
        league_year VARCHAR(50),
                
        PRIMARY KEY (match_id)
    )""")

In [3]:
cursor.execute("USE db_games")
cursor.execute("SHOW TABLES")
for x in cursor:
    print(x)

('premiere_league',)


In [4]:
 df = pd.read_csv("/home/orlando_linux/pipeline-python-mongo-mysql/data_teste/tabela.csv")
df.head(1)

Unnamed: 0,match_id,league_id,match_date,match_time,match_hometeam_id,match_hometeam_name,match_hometeam_score,match_awayteam_name,match_awayteam_id,match_awayteam_score,match_round,match_stadium,match_referee,league_year
0,206506,152,2024-01-30,21:15,3088,Aston Villa,1.0,Newcastle United,3100,3.0,22,Villa Park (Birmingham),J. Brooks,2023/2024


In [5]:
for i, row in df.iterrows():
    tuple(row)

In [12]:
import numpy as np
lista = [tuple(row) for i, row in df.iterrows() ]
lista = [tuple(None if pd.isna(item) else item for item in tupla) for tupla in lista]


print(lista)

[(206506, 152, '2024-01-30', '21:15', 3088, 'Aston Villa', 1.0, 'Newcastle United', 3100, 3.0, 22, 'Villa Park (Birmingham)', 'J. Brooks', '2023/2024'), (206507, 152, '2024-01-30', '20:45', 3085, 'Fulham', 0.0, 'Everton', 3073, 0.0, 22, 'Craven Cottage (London)', 'T. Bramall', '2023/2024'), (206508, 152, '2024-01-30', '20:45', 3091, 'Luton Town', 4.0, 'Brighton & Hove Albion', 3079, 0.0, 22, 'Kenilworth Road (Luton, Bedfordshire)', 'R. Jones', '2023/2024'), (206509, 152, '2024-01-30', '20:30', 3089, 'Nottingham Forest', 1.0, 'Arsenal', 141, 2.0, 22, 'The City Ground (Nottingham, Nottinghamshire)', 'S. Hooper', '2023/2024'), (206513, 152, '2024-01-30', '21:00', 3429, 'Crystal Palace', 3.0, 'Sheffield United', 3074, 2.0, 22, 'Selhurst Park (London)', 'T. Harrington', '2023/2024'), (206510, 152, '2024-01-31', '20:30', 164, 'Tottenham Hotspur', 3.0, 'Brentford', 3086, 2.0, 22, 'Tottenham Hotspur Stadium (London)', 'D. Coote', '2023/2024'), (206514, 152, '2024-01-31', '21:15', 84, 'Liverpoo

In [13]:

sql = "INSERT INTO db_games.premiere_league VALUES (%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s);"

cursor.executemany(sql, lista)
#print(f"\n {cursor.rowcount} dados foram inseridos na tabela premiere_league.")
cnx.commit()

## Visualizando os dados inseridos