# Coleta de dados estruturados - 2º desafio IGTI
O arquivo contém uma pesquisa fictícia na qual um grupo de pessoas informou suas preferências pessoais
sobre os assuntos: Clima, Bebida, Hobbie e Animal de estimação. Os dados da pesquisa estão disponíveis
através de datas de coleta. Dessa forma, cada dia coletado terá informações baseadas naquela amostra.

Os dados estruturados são provenientes de estruturas definidas, inflexível, pensadas antes mesmo da própria criação dos dados.

In [1]:
# Importar as bibliotecas necessárias.
import pandas as pd # importando a biblioteca pandas
import os # bibliotecas para funções do sistema operacional

## Importando dados do arquivo¶
O primeiro passo é encontrar o local aonde o arquivo a ser trabalho vai estar armazenado. Após isso, vamos abrir-lo e em seguida vamos adiciona-lo dentro de um dataframe do pandas.

In [2]:
DIRETORIO = "C:\\Users\\ribei\\OneDrive\\PDM\\Bootcamp Cientista de Dados\\Apostilas\\Modulo 2\\base-trabalho_prático\\dataset"

In [5]:
## Identifica os arquivos que estão no diretório
lista_df = [] # cria uma lista
lista_path = os.listdir(DIRETORIO) # retorna uma lista dos nomes dos arquivos no diretório

In [6]:
## Lista 5 arquivos da lista, pra gente conferir se os arquivos foram localizados
lista_path[:5]

['2020-01-01.csv',
 '2020-01-02.csv',
 '2020-01-03.csv',
 '2020-01-04.csv',
 '2020-01-05.csv']

### Cria uma lista com os arquivos, em seguida, abre cada arquivo incluindo no Dataframe

In [9]:
# Atribui os dados coletados em um dataframe
lista_df = []
for arquivo in lista_path:
    local_arquivo = os.path.join(DIRETORIO, arquivo)
    df = pd.read_csv(local_arquivo, sep= '|', encoding='ISO-8859-1') #o separador aqui é um bipe
    lista_df.append(df)
df_pesquisa = pd.concat(lista_df)

In [10]:
df_pesquisa[:10] #lê as primeiras dez colunas do data.frame

Unnamed: 0,cod_pessoa,data_coleta,genero,data_nascimento,animal_estimacao,clima,bebida_favorita,hobbies
0,10141743,2020-01-01,Masculino,1981-04-25,peixe,frio,Cerveja,Praticar esporte
1,10141860,2020-01-01,Feminino,1966-01-19,peixe,quente,Café,Assistir TV
2,10142548,2020-01-01,Masculino,1973-08-02,tartaruga,frio,Café,Ler livros
3,10142591,2020-01-01,Masculino,1997-03-05,gato,moderado,Cerveja,Aprender algo novo
4,10142654,2020-01-01,Feminino,1969-08-05,tartaruga,moderado,Café,Assistir TV
0,10141523,2020-01-02,Feminino,1998-09-24,gato,quente,Cerveja,Aprender algo novo
1,10141996,2020-01-02,Feminino,1973-03-13,tartaruga,quente,refrigerante,Escrever
2,10142089,2020-01-02,Feminino,1970-03-23,gato,moderado,Água,Pintar quadros
3,10142145,2020-01-02,Masculino,1998-08-01,peixe,frio,refrigerante,Escrever
4,10142520,2020-01-02,Masculino,1994-05-09,peixe,moderado,Café,Praticar esporte


In [11]:
# Gerar o arquivo com o dataframe que possui os dados de todos os arquivos juntos
df_pesquisa.to_csv(DIRETORIO + 'pesquisa_por_data.csv', sep = '|', encoding='ISO-8859-1',
index=False)

## Armazenando os dados no banco de dados

O próximo passo é criar a conexão com o banco de dados. No entanto, antes de executar o script que gera a string de conexão precisamos criar o schema no banco de dados lá no SQL - é o diagrama.

In [13]:
import MySQLdb # Interface para conectar a um servidor de banco de dados MySQL. Ele implementa a API do Banco de Dados Python v2.0 e é construído em cima da API MySQL C.
import sqlalchemy # Facilita a comunicação com bancos de dados. Pode ser usada como uma ferramenta ORM (Object Relational Mapper, mapper relacional) que traduz classes Python em tabelas em bancos de dados relacionais e converte automaticamente chamadas de função para instruções SQL.

# Colocar os dados da conta do MySQL

In [44]:
user = 'matheus'
password = 'Economia756124!!!!!!'
host = 'localhost'
database = 'coletaIGTI' #schema

string_conexao = f'mysql://{user}:{password}@{host}/{database}'
string_conexao #testar a string de conexão com o banco de dados. 

'mysql://matheus:Economia756124!!!!!!@localhost/coletaIGTI'

A string é composta pelo o usuário de acesso ao banco, a senha, o caminho do banco de dados e o schema que vai ser utilizado

In [45]:
# Connecta-se à base de dados
engine = sqlalchemy.create_engine(string_conexao)
conn = engine.connect()

### Construção dos bancos de dados separados

In [46]:
df_pessoas = df_pesquisa[['cod_pessoa', 'genero', 'data_nascimento']].drop_duplicates()

In [47]:
df_hobbies = df_pesquisa[['hobbies']].drop_duplicates()

In [48]:
df_animal = df_pesquisa[['animal_estimacao']].drop_duplicates()

In [49]:
df_clima = df_pesquisa[['clima']].drop_duplicates()

In [50]:
df_bebida = df_pesquisa[['bebida_favorita']].drop_duplicates()

### Visualizar as bases de dados

In [51]:
df_pessoas[:3]

Unnamed: 0,cod_pessoa,genero,data_nascimento
0,10141743,Masculino,1981-04-25
1,10141860,Feminino,1966-01-19
2,10142548,Masculino,1973-08-02


In [52]:
df_hobbies[:3]

Unnamed: 0,hobbies
0,Praticar esporte
1,Assistir TV
2,Ler livros


In [53]:
df_animal[:3]

Unnamed: 0,animal_estimacao
0,peixe
2,tartaruga
3,gato


In [54]:
df_clima[:3]

Unnamed: 0,clima
0,frio
1,quente
3,moderado


In [55]:
df_bebida[:3]

Unnamed: 0,bebida_favorita
0,Cerveja
1,Café
1,refrigerante


## Para inserir os dados no diagrama/squema do SQL

In [65]:
for pessoa in df_pessoas.itertuples():
    cod_pessoa = pessoa.cod_pessoa
    genero = pessoa.genero
    data_nascimento = str(pessoa.data_nascimento)[:10] # para retirar o
    try:
        querey = f"""insert into pessoa (cod_pessoa, genero, data_nascimento )
        values ('{cod_pessoa}', '{genero}', '{data_nascimento}')"""
        conn.execute(querey)
        print(f"Registro inserido com sucesso: {cod_pessoa}")
    except Exception as e:
        print(f"Não foi possível inserir o regristro {cod_pessoa}. O erro foi encontrado foi: {e}")

Registro inserido com sucesso: 10141743
Registro inserido com sucesso: 10141860
Registro inserido com sucesso: 10142548
Registro inserido com sucesso: 10142591
Registro inserido com sucesso: 10142654
Registro inserido com sucesso: 10141523
Registro inserido com sucesso: 10141996
Registro inserido com sucesso: 10142089
Registro inserido com sucesso: 10142145
Registro inserido com sucesso: 10142520
Registro inserido com sucesso: 10143160
Registro inserido com sucesso: 10141712
Registro inserido com sucesso: 10141987
Registro inserido com sucesso: 10142093
Registro inserido com sucesso: 10142325
Registro inserido com sucesso: 10142552
Registro inserido com sucesso: 10142598
Registro inserido com sucesso: 10143013
Registro inserido com sucesso: 10141570
Registro inserido com sucesso: 10141851
Registro inserido com sucesso: 10141938
Registro inserido com sucesso: 10142733
Registro inserido com sucesso: 10142851
Registro inserido com sucesso: 10142941
Registro inserido com sucesso: 10143484


Registro inserido com sucesso: 10141644
Registro inserido com sucesso: 10141705
Registro inserido com sucesso: 10141966
Registro inserido com sucesso: 10142260
Registro inserido com sucesso: 10142336
Registro inserido com sucesso: 10142610
Registro inserido com sucesso: 10143294
Registro inserido com sucesso: 10141528
Registro inserido com sucesso: 10141668
Registro inserido com sucesso: 10141780
Registro inserido com sucesso: 10142620
Registro inserido com sucesso: 10143298
Registro inserido com sucesso: 10143365
Registro inserido com sucesso: 10141564
Registro inserido com sucesso: 10142270
Registro inserido com sucesso: 10143508
Registro inserido com sucesso: 10143556
Registro inserido com sucesso: 10142186
Registro inserido com sucesso: 10142497
Registro inserido com sucesso: 10142587
Registro inserido com sucesso: 10142652
Registro inserido com sucesso: 10142655
Registro inserido com sucesso: 10143056
Registro inserido com sucesso: 10141577
Registro inserido com sucesso: 10141906


Registro inserido com sucesso: 10141574
Registro inserido com sucesso: 10142670
Registro inserido com sucesso: 10143024
Registro inserido com sucesso: 10143478
Registro inserido com sucesso: 10143538
Registro inserido com sucesso: 10141869
Registro inserido com sucesso: 10141959
Registro inserido com sucesso: 10141967
Registro inserido com sucesso: 10142136
Registro inserido com sucesso: 10142504
Registro inserido com sucesso: 10141643
Registro inserido com sucesso: 10141865
Registro inserido com sucesso: 10141989
Registro inserido com sucesso: 10142013
Registro inserido com sucesso: 10142222
Registro inserido com sucesso: 10142318
Registro inserido com sucesso: 10142347
Registro inserido com sucesso: 10142550
Registro inserido com sucesso: 10142864
Registro inserido com sucesso: 10142982
Registro inserido com sucesso: 10141856
Registro inserido com sucesso: 10141895
Registro inserido com sucesso: 10143041
Registro inserido com sucesso: 10143359
Registro inserido com sucesso: 10143432


Registro inserido com sucesso: 10142595
Registro inserido com sucesso: 10142769
Registro inserido com sucesso: 10143414
Registro inserido com sucesso: 10141701
Registro inserido com sucesso: 10142104
Registro inserido com sucesso: 10142259
Registro inserido com sucesso: 10142279
Registro inserido com sucesso: 10143123
Registro inserido com sucesso: 10141739
Registro inserido com sucesso: 10142419
Registro inserido com sucesso: 10142660
Registro inserido com sucesso: 10142967
Registro inserido com sucesso: 10143305
Registro inserido com sucesso: 10143542
Registro inserido com sucesso: 10143587
Registro inserido com sucesso: 10141878
Registro inserido com sucesso: 10141958
Registro inserido com sucesso: 10142427
Registro inserido com sucesso: 10141770
Registro inserido com sucesso: 10142092
Registro inserido com sucesso: 10142600
Registro inserido com sucesso: 10142159
Registro inserido com sucesso: 10142889
Registro inserido com sucesso: 10143473
Registro inserido com sucesso: 10143616


Registro inserido com sucesso: 10142753
Registro inserido com sucesso: 10143334
Registro inserido com sucesso: 10141531
Registro inserido com sucesso: 10141746
Registro inserido com sucesso: 10142316
Registro inserido com sucesso: 10142349
Registro inserido com sucesso: 10142806
Registro inserido com sucesso: 10142875
Registro inserido com sucesso: 10143362
Registro inserido com sucesso: 10141983
Registro inserido com sucesso: 10142070
Registro inserido com sucesso: 10142538
Registro inserido com sucesso: 10142793
Registro inserido com sucesso: 10143035
Registro inserido com sucesso: 10143236
Registro inserido com sucesso: 10143352
Registro inserido com sucesso: 10143355
Registro inserido com sucesso: 10141608
Registro inserido com sucesso: 10141815
Registro inserido com sucesso: 10141962
Registro inserido com sucesso: 10142137
Registro inserido com sucesso: 10142275
Registro inserido com sucesso: 10142315
Registro inserido com sucesso: 10142818
Registro inserido com sucesso: 10142993


Registro inserido com sucesso: 10141907
Registro inserido com sucesso: 10142008
Registro inserido com sucesso: 10142177
Registro inserido com sucesso: 10142295
Registro inserido com sucesso: 10142341
Registro inserido com sucesso: 10142443
Registro inserido com sucesso: 10142734
Registro inserido com sucesso: 10142902
Registro inserido com sucesso: 10143245
Registro inserido com sucesso: 10141561
Registro inserido com sucesso: 10141655
Registro inserido com sucesso: 10142103
Registro inserido com sucesso: 10142298
Registro inserido com sucesso: 10142707
Registro inserido com sucesso: 10142798
Registro inserido com sucesso: 10142966
Registro inserido com sucesso: 10143144
Registro inserido com sucesso: 10141505
Registro inserido com sucesso: 10141640
Registro inserido com sucesso: 10142580
Registro inserido com sucesso: 10142603
Registro inserido com sucesso: 10142915
Registro inserido com sucesso: 10141517
Registro inserido com sucesso: 10141559
Registro inserido com sucesso: 10141648


Registro inserido com sucesso: 10143034
Registro inserido com sucesso: 10143141
Registro inserido com sucesso: 10143409
Registro inserido com sucesso: 10141662
Registro inserido com sucesso: 10141834
Registro inserido com sucesso: 10141965
Registro inserido com sucesso: 10142377
Registro inserido com sucesso: 10142458
Registro inserido com sucesso: 10142991
Registro inserido com sucesso: 10143251
Registro inserido com sucesso: 10141547
Registro inserido com sucesso: 10141931
Registro inserido com sucesso: 10143264
Registro inserido com sucesso: 10141544
Registro inserido com sucesso: 10141694
Registro inserido com sucesso: 10142162
Registro inserido com sucesso: 10142855
Registro inserido com sucesso: 10141748
Registro inserido com sucesso: 10141951
Registro inserido com sucesso: 10142327
Registro inserido com sucesso: 10142900
Registro inserido com sucesso: 10143043
Registro inserido com sucesso: 10143275
Registro inserido com sucesso: 10143411
Registro inserido com sucesso: 10143499


Registro inserido com sucesso: 10142642
Registro inserido com sucesso: 10143503
Registro inserido com sucesso: 10143551
Registro inserido com sucesso: 10142644
Registro inserido com sucesso: 10142843
Registro inserido com sucesso: 10141847
Registro inserido com sucesso: 10142224
Registro inserido com sucesso: 10142824
Registro inserido com sucesso: 10143183
Registro inserido com sucesso: 10143571
Registro inserido com sucesso: 10142027
Registro inserido com sucesso: 10142190
Registro inserido com sucesso: 10142350
Registro inserido com sucesso: 10142755
Registro inserido com sucesso: 10143105
Registro inserido com sucesso: 10143116
Registro inserido com sucesso: 10143584
Registro inserido com sucesso: 10141506
Registro inserido com sucesso: 10142387
Registro inserido com sucesso: 10142390
Registro inserido com sucesso: 10142487
Registro inserido com sucesso: 10143235
Registro inserido com sucesso: 10143303
Registro inserido com sucesso: 10143417
Registro inserido com sucesso: 10143604


Registro inserido com sucesso: 10142859
Registro inserido com sucesso: 10143308
Registro inserido com sucesso: 10143480
Registro inserido com sucesso: 10143520
Registro inserido com sucesso: 10143606
Registro inserido com sucesso: 10141562
Registro inserido com sucesso: 10141879
Registro inserido com sucesso: 10141915
Registro inserido com sucesso: 10141992
Registro inserido com sucesso: 10142240
Registro inserido com sucesso: 10142821
Registro inserido com sucesso: 10142840
Registro inserido com sucesso: 10142965
Registro inserido com sucesso: 10143527
Registro inserido com sucesso: 10143568
Registro inserido com sucesso: 10143599
Registro inserido com sucesso: 10141708
Registro inserido com sucesso: 10141804
Registro inserido com sucesso: 10141978
Registro inserido com sucesso: 10142122
Registro inserido com sucesso: 10142590
Registro inserido com sucesso: 10142643
Registro inserido com sucesso: 10143066
Registro inserido com sucesso: 10142402
Registro inserido com sucesso: 10142440


In [66]:
for hobbie in df_hobbies.itertuples():
    desc_hobbie = hobbie.hobbies
    try:
        querey = f"""insert into hobbie (hobbie )
        values ('{desc_hobbie}')"""
        conn.execute(querey)
        print(f"Registro inserido com sucesso: {desc_hobbie}")
    except Exception as e:
        print(f"Não foi possível inserir o regristro {desc_hobbie}. O erro foi encontrado foi: {e}")

Registro inserido com sucesso: Praticar esporte
Registro inserido com sucesso: Assistir TV
Registro inserido com sucesso: Ler livros
Registro inserido com sucesso: Aprender algo novo
Registro inserido com sucesso: Escrever
Registro inserido com sucesso: Pintar quadros
Registro inserido com sucesso: Dormir
Registro inserido com sucesso: Escutar música


In [67]:
for animal in df_animal.itertuples():
    desc_animal = animal.animal_estimacao
    try:
        querey = f"""insert into animal_estimacao (animal )
        values ('{desc_animal}')"""
        conn.execute(querey)
        print(f"Registro inserido com sucesso: {desc_animal}")
    except Exception as e:
        print(f"Não foi possível inserir o regristro {desc_animal}. O erro foi encontrado foi: {e}")

Registro inserido com sucesso: peixe
Registro inserido com sucesso: tartaruga
Registro inserido com sucesso: gato
Registro inserido com sucesso: cachorro


In [68]:
for clima in df_clima.itertuples():
    desc_clima = clima.clima
    try:
        querey = f"""insert into clima (clima )
        values ('{desc_clima}')"""
        conn.execute(querey)
        print(f"Registro inserido com sucesso: {desc_clima}")
    except Exception as e:
        print(f"Não foi possível inserir o regristro {desc_clima}. O erro foi encontrado foi: {e}")

Registro inserido com sucesso: frio
Registro inserido com sucesso: quente
Registro inserido com sucesso: moderado


In [69]:
for bebida in df_bebida.itertuples():
    desc_bebida = bebida.bebida_favorita
    try:
        querey = f"""insert into bebida (bebida )
        values ('{desc_bebida}')"""
        conn.execute(querey)
        print(f"Registro inserido com sucesso: {desc_bebida}")
    except Exception as e:
        print(f"Não foi possível inserir o regristro {desc_bebida}. O erro foi encontrado foi: {e}")

Registro inserido com sucesso: Cerveja
Registro inserido com sucesso: Café
Registro inserido com sucesso: refrigerante
Registro inserido com sucesso: Água
Registro inserido com sucesso: Vinho
Registro inserido com sucesso: Chá


### Ler um sql da tabela do banco e adiciona-lo em um dataframe.

In [70]:
df_hobbie = pd.read_sql('hobbie', con=conn)
df_animal = pd.read_sql('animal_estimacao', con=conn)
df_clima = pd.read_sql('clima', con=conn)
df_bebida = pd.read_sql('bebida', con=conn)

In [71]:
df_hobbie

Unnamed: 0,cod_hobbie,hobbie
0,1,Praticar esporte
1,2,Assistir TV
2,3,Ler livros
3,4,Aprender algo novo
4,5,Escrever
5,6,Pintar quadros
6,7,Dormir
7,8,Escutar música


In [84]:
# Setar as coluna nome x como index.
dicionario_hobbie = df_hobbie.set_index(df_hobbie.hobbie)['cod_hobbie'].to_dict()
dicionario_animal = df_animal.set_index(df_animal.animal)['cod_animal_estimacao'].to_dict()
dicionario_clima = df_clima.set_index(df_clima.clima)['cod_clima'].to_dict()
dicionario_bebida = df_bebida.set_index(df_bebida.bebida)['cod_bebida'].to_dict()

### Buscar os nomes dos fabricantes e associamos a seu respectivo código

In [85]:
df_pesquisa.hobbies = df_pesquisa.hobbies.map(dicionario_hobbie)

In [86]:
df_pesquisa.animal_estimacao = df_pesquisa.animal_estimacao.map(dicionario_animal)

In [87]:
df_pesquisa.clima = df_pesquisa.clima.map(dicionario_clima)

In [88]:
df_pesquisa.bebida_favorita = df_pesquisa.bebida_favorita.map(dicionario_bebida)

In [106]:
for pesquisa in df_pesquisa.itertuples():
    data_pesquisa = pesquisa.data_coleta
    cod_pessoa = pesquisa.cod_pessoa
    cod_animal = pesquisa.animal_estimacao
    cod_bebida = pesquisa.bebida_favorita
    cod_hobbie = pesquisa.hobbies
    cod_clima = pesquisa.clima
    try:
        querey = f"""insert into pesquisas (data_pesquisa, cod_pessoa, cod_animal, cod_bebida, cod_hobbie, cod_clima)
        values ('{data_pesquisa}',{cod_pessoa}','{cod_animal}','{cod_bebida}','{cod_hobbie}', '{cod_clima}')"""
        conn.execute(querey)
        print(f"Registro inserido com sucesso: {cod_pessoa}")
    except Exception as e:
        print(f"Não foi possível inserir o regristro {cod_pessoa}. O erro foi encontrado foi: {e}")

Não foi possível inserir o regristro 10141743. O erro foi encontrado foi: (MySQLdb._exceptions.ProgrammingError) (1064, "You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near '','nan','nan','nan', 'nan')' at line 2")
[SQL: insert into pesquisas (data_pesquisa, cod_pessoa, cod_animal, cod_bebida, cod_hobbie, cod_clima)
        values ('2020-01-01',10141743','nan','nan','nan', 'nan')]
(Background on this error at: http://sqlalche.me/e/14/f405)
Não foi possível inserir o regristro 10141860. O erro foi encontrado foi: (MySQLdb._exceptions.ProgrammingError) (1064, "You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near '','nan','nan','nan', 'nan')' at line 2")
[SQL: insert into pesquisas (data_pesquisa, cod_pessoa, cod_animal, cod_bebida, cod_hobbie, cod_clima)
        values ('2020-01-01',10141860','nan','nan','nan', 'nan')]
(Backgro

Não foi possível inserir o regristro 10142625. O erro foi encontrado foi: (MySQLdb._exceptions.ProgrammingError) (1064, "You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near '','nan','nan','nan', 'nan')' at line 2")
[SQL: insert into pesquisas (data_pesquisa, cod_pessoa, cod_animal, cod_bebida, cod_hobbie, cod_clima)
        values ('2020-02-21',10142625','nan','nan','nan', 'nan')]
(Background on this error at: http://sqlalche.me/e/14/f405)
Não foi possível inserir o regristro 10142961. O erro foi encontrado foi: (MySQLdb._exceptions.ProgrammingError) (1064, "You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near '','nan','nan','nan', 'nan')' at line 2")
[SQL: insert into pesquisas (data_pesquisa, cod_pessoa, cod_animal, cod_bebida, cod_hobbie, cod_clima)
        values ('2020-02-21',10142961','nan','nan','nan', 'nan')]
(Backgro

Não foi possível inserir o regristro 10142279. O erro foi encontrado foi: (MySQLdb._exceptions.ProgrammingError) (1064, "You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near '','nan','nan','nan', 'nan')' at line 2")
[SQL: insert into pesquisas (data_pesquisa, cod_pessoa, cod_animal, cod_bebida, cod_hobbie, cod_clima)
        values ('2020-04-29',10142279','nan','nan','nan', 'nan')]
(Background on this error at: http://sqlalche.me/e/14/f405)
Não foi possível inserir o regristro 10143123. O erro foi encontrado foi: (MySQLdb._exceptions.ProgrammingError) (1064, "You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near '','nan','nan','nan', 'nan')' at line 2")
[SQL: insert into pesquisas (data_pesquisa, cod_pessoa, cod_animal, cod_bebida, cod_hobbie, cod_clima)
        values ('2020-04-29',10143123','nan','nan','nan', 'nan')]
(Backgro

Não foi possível inserir o regristro 10141729. O erro foi encontrado foi: (MySQLdb._exceptions.ProgrammingError) (1064, "You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near '','nan','nan','nan', 'nan')' at line 2")
[SQL: insert into pesquisas (data_pesquisa, cod_pessoa, cod_animal, cod_bebida, cod_hobbie, cod_clima)
        values ('2020-07-14',10141729','nan','nan','nan', 'nan')]
(Background on this error at: http://sqlalche.me/e/14/f405)
Não foi possível inserir o regristro 10142567. O erro foi encontrado foi: (MySQLdb._exceptions.ProgrammingError) (1064, "You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near '','nan','nan','nan', 'nan')' at line 2")
[SQL: insert into pesquisas (data_pesquisa, cod_pessoa, cod_animal, cod_bebida, cod_hobbie, cod_clima)
        values ('2020-07-14',10142567','nan','nan','nan', 'nan')]
(Backgro

Não foi possível inserir o regristro 10143405. O erro foi encontrado foi: (MySQLdb._exceptions.ProgrammingError) (1064, "You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near '','nan','nan','nan', 'nan')' at line 2")
[SQL: insert into pesquisas (data_pesquisa, cod_pessoa, cod_animal, cod_bebida, cod_hobbie, cod_clima)
        values ('2020-09-21',10143405','nan','nan','nan', 'nan')]
(Background on this error at: http://sqlalche.me/e/14/f405)
Não foi possível inserir o regristro 10143452. O erro foi encontrado foi: (MySQLdb._exceptions.ProgrammingError) (1064, "You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near '','nan','nan','nan', 'nan')' at line 2")
[SQL: insert into pesquisas (data_pesquisa, cod_pessoa, cod_animal, cod_bebida, cod_hobbie, cod_clima)
        values ('2020-09-21',10143452','nan','nan','nan', 'nan')]
(Backgro

Não foi possível inserir o regristro 10142402. O erro foi encontrado foi: (MySQLdb._exceptions.ProgrammingError) (1064, "You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near '','nan','nan','nan', 'nan')' at line 2")
[SQL: insert into pesquisas (data_pesquisa, cod_pessoa, cod_animal, cod_bebida, cod_hobbie, cod_clima)
        values ('2020-11-26',10142402','nan','nan','nan', 'nan')]
(Background on this error at: http://sqlalche.me/e/14/f405)
Não foi possível inserir o regristro 10142440. O erro foi encontrado foi: (MySQLdb._exceptions.ProgrammingError) (1064, "You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near '','nan','nan','nan', 'nan')' at line 2")
[SQL: insert into pesquisas (data_pesquisa, cod_pessoa, cod_animal, cod_bebida, cod_hobbie, cod_clima)
        values ('2020-11-26',10142440','nan','nan','nan', 'nan')]
(Backgro

In [97]:
df_pesquisa

Unnamed: 0,cod_pessoa,data_coleta,genero,data_nascimento,animal_estimacao,clima,bebida_favorita,hobbies
0,10141743,2020-01-01,Masculino,1981-04-25,,,,
1,10141860,2020-01-01,Feminino,1966-01-19,,,,
2,10142548,2020-01-01,Masculino,1973-08-02,,,,
3,10142591,2020-01-01,Masculino,1997-03-05,,,,
4,10142654,2020-01-01,Feminino,1969-08-05,,,,
...,...,...,...,...,...,...,...,...
1,10142475,2020-12-31,Masculino,1955-05-30,,,,
2,10142522,2020-12-31,Masculino,1954-12-22,,,,
3,10142881,2020-12-31,Masculino,1952-07-30,,,,
4,10143184,2020-12-31,Masculino,1984-06-05,,,,
