### Inserindo dados no banco de dados 

 O objetivo é pegar todos os dados que estão em diversos arquivos csv, que são preferências de vários usuários, e colocar em um banco de dados realacional. Para isso foi usado o banco de dados MySQL.

In [1]:
import pandas as pd
import os
import MySQLdb
import sqlalchemy

In [2]:
# diretório arquivos
diretorio = "C:\dataScience\env\dados"

In [3]:
# lista com todos os arquivos do diretório
lista_path = os.listdir(diretorio)

In [4]:
lista_path[:5]

['2020-01-01.csv',
 '2020-01-02.csv',
 '2020-01-03.csv',
 '2020-01-04.csv',
 '2020-01-05.csv']

In [5]:
lista_df = []

for arquivo in lista_path:
    local_arquivo = os.path.join(diretorio, arquivo)
    df = pd.read_csv(local_arquivo, sep = '|', encoding = 'latin-1')
    lista_df.append(df)
    
# Atribui os dados coletados em um dataframe    
df = pd.concat(lista_df)

In [6]:
df[:5]

Unnamed: 0,cod_pessoa,data_coleta,genero,data_nascimento,animal_estimacao,clima,bebida_favorita,hobbies
0,10141743,2020-01-01,Masculino,1981-04-25,peixe,frio,Cerveja,Praticar esporte
1,10141860,2020-01-01,Feminino,1966-01-19,peixe,quente,Café,Assistir TV
2,10142548,2020-01-01,Masculino,1973-08-02,tartaruga,frio,Café,Ler livros
3,10142591,2020-01-01,Masculino,1997-03-05,gato,moderado,Cerveja,Aprender algo novo
4,10142654,2020-01-01,Feminino,1969-08-05,tartaruga,moderado,Café,Assistir TV


In [7]:
df.shape

(2127, 8)

### Estrutura das tabelas no banco de dados

 ##### Modelo entidade relacionamento

![Alt](imagem.png)

### CONEXÃO COM O BANCO DE DADOS MySQL E ARMAZENANDO OS DADOS

In [2]:
user = 'root'
password = '1234'
host = 'localhost'
database = 'coleta_dados' #schema

string_conexao = f'mysql://{user}:{password}@{host}/{database}'
string_conexao #testar a string de conexão com o banco de dados. 

'mysql://root:1234@localhost/coleta_dados'

In [21]:
engine = sqlalchemy.create_engine(string_conexao)
conn = engine.connect()

In [22]:
df_pessoas = df[["cod_pessoa", "genero", "data_nascimento"]].drop_duplicates()
df_pessoas

Unnamed: 0,cod_pessoa,genero,data_nascimento
0,10141743,Masculino,1981-04-25
1,10141860,Feminino,1966-01-19
2,10142548,Masculino,1973-08-02
3,10142591,Masculino,1997-03-05
4,10142654,Feminino,1969-08-05
...,...,...,...
1,10142475,Masculino,1955-05-30
2,10142522,Masculino,1954-12-22
3,10142881,Masculino,1952-07-30
4,10143184,Masculino,1984-06-05


In [23]:
animais = list(df.animal_estimacao.unique())
animais

['peixe', 'tartaruga', 'gato', 'cachorro']

In [24]:
climas = list(df.clima.unique())
climas

['frio', 'quente', 'moderado']

In [25]:
bebidas = list(df.bebida_favorita.unique())
bebidas

['Cerveja', 'Café', 'refrigerante', 'Água', 'Vinho', 'Chá']

In [26]:
hobbies = list(df.hobbies.unique())
hobbies

['Praticar esporte',
 'Assistir TV',
 'Ler livros',
 'Aprender algo novo',
 'Escrever',
 'Pintar quadros',
 'Dormir',
 'Escutar música']

In [27]:
for pessoa in df_pessoas[:3].itertuples():
    print(pessoa)

Pandas(Index=0, cod_pessoa=10141743, genero='Masculino', data_nascimento='1981-04-25')
Pandas(Index=1, cod_pessoa=10141860, genero='Feminino', data_nascimento='1966-01-19')
Pandas(Index=2, cod_pessoa=10142548, genero='Masculino', data_nascimento='1973-08-02')


In [28]:
for pessoa in df_pessoas.itertuples():
    cod_pessoa = pessoa.cod_pessoa    
    genero = pessoa.genero
    data_nascimento = str(pessoa.data_nascimento)
    try:
        query = f"""insert into pessoa (cod_pessoa, genero, data_nascimento ) 
                     values ('{cod_pessoa}',  '{genero}', '{data_nascimento}')"""      
        conn.execute(query)      
        print(f"Registro inserido com sucesso! Cod_pessoa =: {cod_pessoa}")
    except Exception as e:        
        print(f"Não foi possível inserir o regristro {cod_pessoa}. O erro foi encontrado foi: {e}")  

Registro inserido com sucesso! Cod_pessoa =: 10141743
Registro inserido com sucesso! Cod_pessoa =: 10141860
Registro inserido com sucesso! Cod_pessoa =: 10142548
Registro inserido com sucesso! Cod_pessoa =: 10142591
Registro inserido com sucesso! Cod_pessoa =: 10142654
Registro inserido com sucesso! Cod_pessoa =: 10141523
Registro inserido com sucesso! Cod_pessoa =: 10141996
Registro inserido com sucesso! Cod_pessoa =: 10142089
Registro inserido com sucesso! Cod_pessoa =: 10142145
Registro inserido com sucesso! Cod_pessoa =: 10142520
Registro inserido com sucesso! Cod_pessoa =: 10143160
Registro inserido com sucesso! Cod_pessoa =: 10141712
Registro inserido com sucesso! Cod_pessoa =: 10141987
Registro inserido com sucesso! Cod_pessoa =: 10142093
Registro inserido com sucesso! Cod_pessoa =: 10142325
Registro inserido com sucesso! Cod_pessoa =: 10142552
Registro inserido com sucesso! Cod_pessoa =: 10142598
Registro inserido com sucesso! Cod_pessoa =: 10143013
Registro inserido com sucess

Registro inserido com sucesso! Cod_pessoa =: 10143475
Registro inserido com sucesso! Cod_pessoa =: 10143613
Registro inserido com sucesso! Cod_pessoa =: 10141792
Registro inserido com sucesso! Cod_pessoa =: 10142112
Registro inserido com sucesso! Cod_pessoa =: 10142388
Registro inserido com sucesso! Cod_pessoa =: 10142876
Registro inserido com sucesso! Cod_pessoa =: 10142990
Registro inserido com sucesso! Cod_pessoa =: 10143163
Registro inserido com sucesso! Cod_pessoa =: 10141673
Registro inserido com sucesso! Cod_pessoa =: 10142268
Registro inserido com sucesso! Cod_pessoa =: 10142756
Registro inserido com sucesso! Cod_pessoa =: 10142867
Registro inserido com sucesso! Cod_pessoa =: 10143045
Registro inserido com sucesso! Cod_pessoa =: 10143424
Registro inserido com sucesso! Cod_pessoa =: 10142023
Registro inserido com sucesso! Cod_pessoa =: 10142061
Registro inserido com sucesso! Cod_pessoa =: 10142545
Registro inserido com sucesso! Cod_pessoa =: 10143092
Registro inserido com sucess

Registro inserido com sucesso! Cod_pessoa =: 10143252
Registro inserido com sucesso! Cod_pessoa =: 10143356
Registro inserido com sucesso! Cod_pessoa =: 10143400
Registro inserido com sucesso! Cod_pessoa =: 10143512
Registro inserido com sucesso! Cod_pessoa =: 10141681
Registro inserido com sucesso! Cod_pessoa =: 10142581
Registro inserido com sucesso! Cod_pessoa =: 10142736
Registro inserido com sucesso! Cod_pessoa =: 10142839
Registro inserido com sucesso! Cod_pessoa =: 10143027
Registro inserido com sucesso! Cod_pessoa =: 10143048
Registro inserido com sucesso! Cod_pessoa =: 10141526
Registro inserido com sucesso! Cod_pessoa =: 10141605
Registro inserido com sucesso! Cod_pessoa =: 10141609
Registro inserido com sucesso! Cod_pessoa =: 10142249
Registro inserido com sucesso! Cod_pessoa =: 10142282
Registro inserido com sucesso! Cod_pessoa =: 10142602
Registro inserido com sucesso! Cod_pessoa =: 10143026
Registro inserido com sucesso! Cod_pessoa =: 10143292
Registro inserido com sucess

Registro inserido com sucesso! Cod_pessoa =: 10141959
Registro inserido com sucesso! Cod_pessoa =: 10141967
Registro inserido com sucesso! Cod_pessoa =: 10142136
Registro inserido com sucesso! Cod_pessoa =: 10142504
Registro inserido com sucesso! Cod_pessoa =: 10141643
Registro inserido com sucesso! Cod_pessoa =: 10141865
Registro inserido com sucesso! Cod_pessoa =: 10141989
Registro inserido com sucesso! Cod_pessoa =: 10142013
Registro inserido com sucesso! Cod_pessoa =: 10142222
Registro inserido com sucesso! Cod_pessoa =: 10142318
Registro inserido com sucesso! Cod_pessoa =: 10142347
Registro inserido com sucesso! Cod_pessoa =: 10142550
Registro inserido com sucesso! Cod_pessoa =: 10142864
Registro inserido com sucesso! Cod_pessoa =: 10142982
Registro inserido com sucesso! Cod_pessoa =: 10141856
Registro inserido com sucesso! Cod_pessoa =: 10141895
Registro inserido com sucesso! Cod_pessoa =: 10143041
Registro inserido com sucesso! Cod_pessoa =: 10143359
Registro inserido com sucess

Registro inserido com sucesso! Cod_pessoa =: 10142196
Registro inserido com sucesso! Cod_pessoa =: 10142328
Registro inserido com sucesso! Cod_pessoa =: 10142647
Registro inserido com sucesso! Cod_pessoa =: 10142686
Registro inserido com sucesso! Cod_pessoa =: 10143139
Registro inserido com sucesso! Cod_pessoa =: 10141512
Registro inserido com sucesso! Cod_pessoa =: 10141589
Registro inserido com sucesso! Cod_pessoa =: 10141637
Registro inserido com sucesso! Cod_pessoa =: 10142677
Registro inserido com sucesso! Cod_pessoa =: 10141612
Registro inserido com sucesso! Cod_pessoa =: 10141844
Registro inserido com sucesso! Cod_pessoa =: 10142214
Registro inserido com sucesso! Cod_pessoa =: 10142439
Registro inserido com sucesso! Cod_pessoa =: 10142479
Registro inserido com sucesso! Cod_pessoa =: 10142608
Registro inserido com sucesso! Cod_pessoa =: 10143006
Registro inserido com sucesso! Cod_pessoa =: 10143125
Registro inserido com sucesso! Cod_pessoa =: 10143186
Registro inserido com sucess

Registro inserido com sucesso! Cod_pessoa =: 10142415
Registro inserido com sucesso! Cod_pessoa =: 10142659
Registro inserido com sucesso! Cod_pessoa =: 10143224
Registro inserido com sucesso! Cod_pessoa =: 10143375
Registro inserido com sucesso! Cod_pessoa =: 10142108
Registro inserido com sucesso! Cod_pessoa =: 10142332
Registro inserido com sucesso! Cod_pessoa =: 10142696
Registro inserido com sucesso! Cod_pessoa =: 10142810
Registro inserido com sucesso! Cod_pessoa =: 10143011
Registro inserido com sucesso! Cod_pessoa =: 10143203
Registro inserido com sucesso! Cod_pessoa =: 10142115
Registro inserido com sucesso! Cod_pessoa =: 10142749
Registro inserido com sucesso! Cod_pessoa =: 10142972
Registro inserido com sucesso! Cod_pessoa =: 10143610
Registro inserido com sucesso! Cod_pessoa =: 10142296
Registro inserido com sucesso! Cod_pessoa =: 10142709
Registro inserido com sucesso! Cod_pessoa =: 10143578
Registro inserido com sucesso! Cod_pessoa =: 10142188
Registro inserido com sucess

Registro inserido com sucesso! Cod_pessoa =: 10141983
Registro inserido com sucesso! Cod_pessoa =: 10142070
Registro inserido com sucesso! Cod_pessoa =: 10142538
Registro inserido com sucesso! Cod_pessoa =: 10142793
Registro inserido com sucesso! Cod_pessoa =: 10143035
Registro inserido com sucesso! Cod_pessoa =: 10143236
Registro inserido com sucesso! Cod_pessoa =: 10143352
Registro inserido com sucesso! Cod_pessoa =: 10143355
Registro inserido com sucesso! Cod_pessoa =: 10141608
Registro inserido com sucesso! Cod_pessoa =: 10141815
Registro inserido com sucesso! Cod_pessoa =: 10141962
Registro inserido com sucesso! Cod_pessoa =: 10142137
Registro inserido com sucesso! Cod_pessoa =: 10142275
Registro inserido com sucesso! Cod_pessoa =: 10142315
Registro inserido com sucesso! Cod_pessoa =: 10142818
Registro inserido com sucesso! Cod_pessoa =: 10142993
Registro inserido com sucesso! Cod_pessoa =: 10143454
Registro inserido com sucesso! Cod_pessoa =: 10142398
Registro inserido com sucess

Registro inserido com sucesso! Cod_pessoa =: 10141527
Registro inserido com sucesso! Cod_pessoa =: 10142256
Registro inserido com sucesso! Cod_pessoa =: 10142817
Registro inserido com sucesso! Cod_pessoa =: 10143268
Registro inserido com sucesso! Cod_pessoa =: 10141943
Registro inserido com sucesso! Cod_pessoa =: 10142584
Registro inserido com sucesso! Cod_pessoa =: 10142721
Registro inserido com sucesso! Cod_pessoa =: 10142873
Registro inserido com sucesso! Cod_pessoa =: 10142962
Registro inserido com sucesso! Cod_pessoa =: 10143032
Registro inserido com sucesso! Cod_pessoa =: 10143327
Registro inserido com sucesso! Cod_pessoa =: 10143422
Registro inserido com sucesso! Cod_pessoa =: 10142303
Registro inserido com sucesso! Cod_pessoa =: 10142453
Registro inserido com sucesso! Cod_pessoa =: 10142825
Registro inserido com sucesso! Cod_pessoa =: 10143018
Registro inserido com sucesso! Cod_pessoa =: 10143198
Registro inserido com sucesso! Cod_pessoa =: 10143418
Registro inserido com sucess

Registro inserido com sucesso! Cod_pessoa =: 10143490
Registro inserido com sucesso! Cod_pessoa =: 10142421
Registro inserido com sucesso! Cod_pessoa =: 10142871
Registro inserido com sucesso! Cod_pessoa =: 10143002
Registro inserido com sucesso! Cod_pessoa =: 10143095
Registro inserido com sucesso! Cod_pessoa =: 10143237
Registro inserido com sucesso! Cod_pessoa =: 10142209
Registro inserido com sucesso! Cod_pessoa =: 10142569
Registro inserido com sucesso! Cod_pessoa =: 10142702
Registro inserido com sucesso! Cod_pessoa =: 10143267
Registro inserido com sucesso! Cod_pessoa =: 10143302
Registro inserido com sucesso! Cod_pessoa =: 10141533
Registro inserido com sucesso! Cod_pessoa =: 10141687
Registro inserido com sucesso! Cod_pessoa =: 10142657
Registro inserido com sucesso! Cod_pessoa =: 10141541
Registro inserido com sucesso! Cod_pessoa =: 10141754
Registro inserido com sucesso! Cod_pessoa =: 10142250
Registro inserido com sucesso! Cod_pessoa =: 10142672
Registro inserido com sucess

Registro inserido com sucesso! Cod_pessoa =: 10142262
Registro inserido com sucesso! Cod_pessoa =: 10142304
Registro inserido com sucesso! Cod_pessoa =: 10142473
Registro inserido com sucesso! Cod_pessoa =: 10142531
Registro inserido com sucesso! Cod_pessoa =: 10142573
Registro inserido com sucesso! Cod_pessoa =: 10143077
Registro inserido com sucesso! Cod_pessoa =: 10143381
Registro inserido com sucesso! Cod_pessoa =: 10143594
Registro inserido com sucesso! Cod_pessoa =: 10141802
Registro inserido com sucesso! Cod_pessoa =: 10141995
Registro inserido com sucesso! Cod_pessoa =: 10142434
Registro inserido com sucesso! Cod_pessoa =: 10142651
Registro inserido com sucesso! Cod_pessoa =: 10142725
Registro inserido com sucesso! Cod_pessoa =: 10142754
Registro inserido com sucesso! Cod_pessoa =: 10143368
Registro inserido com sucesso! Cod_pessoa =: 10141911
Registro inserido com sucesso! Cod_pessoa =: 10142082
Registro inserido com sucesso! Cod_pessoa =: 10142425
Registro inserido com sucess

Registro inserido com sucesso! Cod_pessoa =: 10143592
Registro inserido com sucesso! Cod_pessoa =: 10141696
Registro inserido com sucesso! Cod_pessoa =: 10142281
Registro inserido com sucesso! Cod_pessoa =: 10142963
Registro inserido com sucesso! Cod_pessoa =: 10141882
Registro inserido com sucesso! Cod_pessoa =: 10142150
Registro inserido com sucesso! Cod_pessoa =: 10142812
Registro inserido com sucesso! Cod_pessoa =: 10142845
Registro inserido com sucesso! Cod_pessoa =: 10142912
Registro inserido com sucesso! Cod_pessoa =: 10142992
Registro inserido com sucesso! Cod_pessoa =: 10143007
Registro inserido com sucesso! Cod_pessoa =: 10143206
Registro inserido com sucesso! Cod_pessoa =: 10143272
Registro inserido com sucesso! Cod_pessoa =: 10143361
Registro inserido com sucesso! Cod_pessoa =: 10141597
Registro inserido com sucesso! Cod_pessoa =: 10141977
Registro inserido com sucesso! Cod_pessoa =: 10142499
Registro inserido com sucesso! Cod_pessoa =: 10142723
Registro inserido com sucess

Registro inserido com sucesso! Cod_pessoa =: 10142838
Registro inserido com sucesso! Cod_pessoa =: 10143101
Registro inserido com sucesso! Cod_pessoa =: 10143344
Registro inserido com sucesso! Cod_pessoa =: 10141682
Registro inserido com sucesso! Cod_pessoa =: 10142234
Registro inserido com sucesso! Cod_pessoa =: 10142355
Registro inserido com sucesso! Cod_pessoa =: 10142510
Registro inserido com sucesso! Cod_pessoa =: 10143068
Registro inserido com sucesso! Cod_pessoa =: 10143170
Registro inserido com sucesso! Cod_pessoa =: 10143517
Registro inserido com sucesso! Cod_pessoa =: 10141623
Registro inserido com sucesso! Cod_pessoa =: 10141974
Registro inserido com sucesso! Cod_pessoa =: 10142213
Registro inserido com sucesso! Cod_pessoa =: 10142457
Registro inserido com sucesso! Cod_pessoa =: 10142490
Registro inserido com sucesso! Cod_pessoa =: 10143083
Registro inserido com sucesso! Cod_pessoa =: 10143254
Registro inserido com sucesso! Cod_pessoa =: 10143479
Registro inserido com sucess

Registro inserido com sucesso! Cod_pessoa =: 10142410
Registro inserido com sucesso! Cod_pessoa =: 10142468
Registro inserido com sucesso! Cod_pessoa =: 10142858
Registro inserido com sucesso! Cod_pessoa =: 10142995
Registro inserido com sucesso! Cod_pessoa =: 10143260
Registro inserido com sucesso! Cod_pessoa =: 10143399
Registro inserido com sucesso! Cod_pessoa =: 10142087
Registro inserido com sucesso! Cod_pessoa =: 10142095
Registro inserido com sucesso! Cod_pessoa =: 10142901
Registro inserido com sucesso! Cod_pessoa =: 10143211
Registro inserido com sucesso! Cod_pessoa =: 10142653
Registro inserido com sucesso! Cod_pessoa =: 10143126
Registro inserido com sucesso! Cod_pessoa =: 10141700
Registro inserido com sucesso! Cod_pessoa =: 10141757
Registro inserido com sucesso! Cod_pessoa =: 10141972
Registro inserido com sucesso! Cod_pessoa =: 10142060
Registro inserido com sucesso! Cod_pessoa =: 10142623
Registro inserido com sucesso! Cod_pessoa =: 10142831
Registro inserido com sucess

Registro inserido com sucesso! Cod_pessoa =: 10143171
Registro inserido com sucesso! Cod_pessoa =: 10142154
Registro inserido com sucesso! Cod_pessoa =: 10142313
Registro inserido com sucesso! Cod_pessoa =: 10142856
Registro inserido com sucesso! Cod_pessoa =: 10142418
Registro inserido com sucesso! Cod_pessoa =: 10142435
Registro inserido com sucesso! Cod_pessoa =: 10143420
Registro inserido com sucesso! Cod_pessoa =: 10141665
Registro inserido com sucesso! Cod_pessoa =: 10142158
Registro inserido com sucesso! Cod_pessoa =: 10142223
Registro inserido com sucesso! Cod_pessoa =: 10142492
Registro inserido com sucesso! Cod_pessoa =: 10142708
Registro inserido com sucesso! Cod_pessoa =: 10142762
Registro inserido com sucesso! Cod_pessoa =: 10143047
Registro inserido com sucesso! Cod_pessoa =: 10143188
Registro inserido com sucesso! Cod_pessoa =: 10143370
Registro inserido com sucesso! Cod_pessoa =: 10141553
Registro inserido com sucesso! Cod_pessoa =: 10142215
Registro inserido com sucess

In [29]:
for animal in animais:
    try:
        query = f"""insert into animal_estimacao (animal) 
                     values ('{animal}')"""
        conn.execute(query)
        print(f"Registro inserido com sucesso: {animal}")
    except Exception as e:
        print(f"Não foi possível inserir o regristro {animal}. O erro foi encontrado foi: {e}") 

Registro inserido com sucesso: peixe
Registro inserido com sucesso: tartaruga
Registro inserido com sucesso: gato
Registro inserido com sucesso: cachorro


In [30]:
for bebida in bebidas:
    try:
        query = f"""insert into bebida (bebida) 
                     values ('{bebida}')"""
        conn.execute(query)
        print(f"Registro inserido com sucesso: {bebida}")
    except Exception as e:
        print(f"Não foi possível inserir o regristro {bebida}. O erro foi encontrado foi: {e}")    

Registro inserido com sucesso: Cerveja
Registro inserido com sucesso: Café
Registro inserido com sucesso: refrigerante
Registro inserido com sucesso: Água
Registro inserido com sucesso: Vinho
Registro inserido com sucesso: Chá


In [31]:
for hobbie in hobbies:
    try:
        query = f"""insert into hobbie (hobbie) 
                     values ('{hobbie}')"""
        conn.execute(query)
        print(f"Registro inserido com sucesso: {hobbie}")
    except Exception as e:
        print(f"Não foi possível inserir o regristro {hobbie}. O erro foi encontrado foi: {e}")  

Registro inserido com sucesso: Praticar esporte
Registro inserido com sucesso: Assistir TV
Registro inserido com sucesso: Ler livros
Registro inserido com sucesso: Aprender algo novo
Registro inserido com sucesso: Escrever
Registro inserido com sucesso: Pintar quadros
Registro inserido com sucesso: Dormir
Registro inserido com sucesso: Escutar música


In [32]:
for clima in climas:
    try:
        query = f"""insert into clima (clima) 
                     values ('{clima}')"""
        conn.execute(query)
        print(f"Registro inserido com sucesso: {clima}")
    except Exception as e:
        print(f"Não foi possível inserir o regristro {clima}. O erro foi encontrado foi: {e}") 

Registro inserido com sucesso: frio
Registro inserido com sucesso: quente
Registro inserido com sucesso: moderado


In [None]:
df.to_sql('stg_pesquisa', con=conn, schema='coleta_dados')

In [None]:
query = """
        insert into pesquisa (data_pesquisa, cod_pessoa, cod_animal_estimacao, 
                              cod_bebida, cod_hobbie, cod_clima)
(
        select stg.data_coleta as data_pesquisa,
               stg.cod_pessoa,
               aes.cod_animal_estimacao,
               beb.cod_bebida,
               hob.cod_hobbie,
               cli.cod_clima                         
          from stg_pesquisa as stg
          join animal_estimacao aes
            on stg.animal_estimacao = aes.animal
          join bebida as beb
            on beb.bebida = bebida_favorita
          join hobbie as hob 
            on hob.hobbie = stg.hobbies
          join clima as cli
            on cli.clima = stg.clima
 );           
            
            """
conn.execute(query)

Agora que os dados foram inseridos no banco de dados, será feito as consultas no MySQL.