# Coleta de Dados no MySQL utilizando Python

Para mais detalhes sobre o pacote mysql.connector, consulte:

https://www.w3schools.com/python/python_mysql_getstarted.asp

In [1]:
# Importando da biblioteca de conexão com os bancos MySQL
import mysql.connector

Para instalação do pacote, execute o comando abaixo no prompt do Anaconda:

- conda install -c anaconda mysql-connector-python

Conectar ao MySQL Server sem selecionar um banco de dados

In [2]:
mydb = mysql.connector.connect(
    host='localhost',
    user='root',
    password='root'
)

print(mydb)

mycursor = mydb.cursor()

# Visualizando os bancos disponíveis
mycursor.execute("SHOW DATABASES")

for db in mycursor:
    print(db)

# Para criar um banco de dados use o comando abaixo
#mycursor.execute("CREATE DATABASE mydatabae")

<mysql.connector.connection_cext.CMySQLConnection object at 0x0000021C107CA948>
('bootcamp',)
('information_schema',)
('mysql',)
('performance_schema',)
('sakila',)
('sys',)
('world',)


Conectar ao MySQL Server selecionando um banco de dados

In [3]:
mydb = mysql.connector.connect(
    host='localhost',
    user='root',
    password='root',
    database='bootcamp'
)

print(mydb)

mycursor = mydb.cursor()

<mysql.connector.connection_cext.CMySQLConnection object at 0x0000021C107CADC8>


In [4]:
# Visualizando os bancos disponíveis
mycursor.execute("SHOW DATABASES")

for db in mycursor:
    print(db)

('bootcamp',)
('information_schema',)
('mysql',)
('performance_schema',)
('sakila',)
('sys',)
('world',)


In [5]:
# Criando uma tabela de caracteristicageralimovel
query = """
    CREATE TABLE caracteristicageralimovel
    (
        idCaracteristicasImovel INT NOT NULL AUTO_INCREMENT,
        idcaracteristicasGerais INT NOT NULL,
        idImovel INT NOT NULL,
        temCaracteristica TINYINT DEFAULT NULL,
        PRIMARY KEY (idCaracteristicasImovel),
        KEY fk_caracteristicasGerais_has_Imovel_Imovel1_idx (idImovel),
        KEY fk_caracteristicasGerais_has_Imovel_caracteristicasGerais1_idx (idcaracteristicasGerais),
        CONSTRAINT fk_caracteristicasGerais_has_Imovel_caracteristicasGerais1 FOREIGN KEY (idcaracteristicasGerais) REFERENCES caracteristicasgerais (idcaracteristicasGerais),
        CONSTRAINT fk_caracteristicasGerais_has_Imovel_Imovel1 FOREIGN KEY (idImovel) REFERENCES imovel (idImovel)
    )
"""
query

mycursor.execute(query)

In [6]:
# Visualizando as tabelas disponíveis
mycursor.execute("SHOW TABLES")

for db in mycursor:
    print(db)

('caracteristicageralimovel',)
('caracteristicasgerais',)
('cidade',)
('estado',)
('imovel',)
('tipounidade',)


In [7]:
# Inserindo um registro na tabela caracteristicasgerais
query = "INSERT INTO caracteristicasgerais (idcaracteristicasGerais, dsccaracteristicasGerais) VALUES (%s, %s)"
values = (1, "Portaria 24 horas")
mycursor.execute(query, values)

mydb.commit()

print(mycursor.rowcount, "registro(s) inserido(s)")

1 registro(s) inserido(s)


In [8]:
# Inserindo múltiplos valores na tabela caracteristicasgerais
values = [(2, "Elevador"), (3, "Piscina")]

mycursor.executemany(query, values)

mydb.commit()

print(mycursor.rowcount, "registro(s) inserido(s)")

2 registro(s) inserido(s)


In [9]:
# Consultando os dados da tabela caracteristicasgerais
query = "SELECT * FROM caracteristicasgerais"

mycursor.execute(query)

myresult = mycursor.fetchall()

for mydata in myresult:
    print(mydata)

(1, 'Portaria 24 horas')
(2, 'Elevador')
(3, 'Piscina')


In [10]:
# Consultando apenas um dado da tabela caracteristicasgerais
query = "SELECT idcaracteristicasGerais, dsccaracteristicasGerais FROM caracteristicasgerais;"

mycursor.execute(query)

myresult = mycursor.fetchone()

print(myresult)

(1, 'Portaria 24 horas')


In [11]:
mydb = mysql.connector.connect(
    host='localhost',
    user='root',
    password='root',
    database='bootcamp'
)

print(mydb)

mycursor = mydb.cursor()

<mysql.connector.connection_cext.CMySQLConnection object at 0x0000021C107E2248>


In [12]:
import os, csv

# Leitura do arquivo sem utilizar biblioteca Pandas

# filename = 'c:\\Users\\USUARIO\\Downloads\\IGTI\\Bootcamp Online - Cientista de Dados\\3_Modulo2_Coleta_e_Obtencao_de_Dados\\Parte1\\AulasPraticas\\dados\\cidades.csv'
filename = 'cidades.csv'
path = os.path.join(os.getcwd(), "dados") #diretório_atual/dados
file_path = os.path.join(path, filename)

query = "INSERT INTO cidade (CodigoCompletoIBGE, CodigoCidadeIBGE, NomeCidade, CodEstadoIBGE) VALUES (%s, %s, %s, %s);"

# Gravando o conteúdo do arquivo na tabela cidade linha a linha
with open(file_path, 'r') as incsvfile:
    mycursor = mydb.cursor()
    reader = csv.reader(incsvfile, delimiter=',')
    next(reader, None) #pula o cabeçalho
    for line in reader:
        print(line)
        #print(line[1])
        mycursor.execute(query, line)

mydb.commit()

incsvfile.close()


['5000252', '00252', 'Alcinópolis', '50']
['5000609', '00609', 'Amambai', '50']
['5000708', '00708', 'Anastácio', '50']
['5000807', '00807', 'Anaurilândia', '50']
['5000856', '00856', 'Angélica', '50']
['5000906', '00906', 'Antônio João', '50']
['5001003', '01003', 'Aparecida do Taboado', '50']
['5001102', '01102', 'Aquidauana', '50']
['5001243', '01243', 'Aral Moreira', '50']
['5001508', '01508', 'Bandeirantes', '50']
['5001904', '01904', 'Bataguassu', '50']
['5002001', '02001', 'Batayporã', '50']
['5002100', '02100', 'Bela Vista', '50']
['5002159', '02159', 'Bodoquena', '50']
['5002209', '02209', 'Bonito', '50']
['5002308', '02308', 'Brasilândia', '50']
['5002407', '02407', 'Caarapó', '50']
['5002605', '02605', 'Camapuã', '50']
['5002704', '02704', 'Campo Grande', '50']
['5002803', '02803', 'Caracol', '50']
['5002902', '02902', 'Cassilândia', '50']
['5002951', '02951', 'Chapadão do Sul', '50']
['5003108', '03108', 'Corguinho', '50']
['5003157', '03157', 'Coronel Sapucaia', '50']
['5

In [13]:
# Visualizando a quantidade de registros na tabela cidade
mycursor.execute("SELECT COUNT(*) FROM cidade")

myresult = mycursor.fetchone()

print(myresult)

(5570,)


In [14]:
# Fechando a conexão ao final
mydb.close()