# <font color=red>Coleta de Dados no MySQL utilizando o R</font>

Existem três **pacotes** que podem ser **utilizados para conectar o R aos SGBDs MySQL e MariaDB**, são os pacotes <b> *DBI*, *RMariaDB* e o *RMySQL*</b>.

Os pacotes RMariaDB e RMySQL utilizam o mesmo driver de banco de dados, a biblioteca cliente MariaDB Connector/C para comunicação cliente/servidor. O RMariaDB substituirá o RMySQL, portanto, em um futuro próximo, você não receberá mais correções de bugs ou segurança do RMySQL. Desta forma, vamos trabalhar com o pacote mais atual que é o RMariaDB.

O pacote RMariaDB exige que sua versão de R seja ≥ 2.8.0. Para verificar qual a versão da linguagem R é a sua, execute o comando:
*sessionInfo()*

<b>Para mais detalhes sobre a biblioteca RMariaDB consulte:</b>
* https://cran.r-project.org/web/packages/RMariaDB/index.html
* https://cran.r-project.org/web/packages/RMariaDB/RMariaDB.pdf

<b>Para mais detalhes sobre a biblioteca RMySQL consulte:</b>
* https://cran.r-project.org/web/packages/RMySQL/index.html
* https://cran.r-project.org/web/packages/RMySQL/RMySQL.pdf

<b>Para mais detalhes sobre a biblioteca DBI consulte:</b>
* https://cran.r-project.org/web/packages/DBI/index.html
* https://cran.r-project.org/web/packages/DBI/DBI.pdf

### <font color=blue>Instalar o pacote RMariaDB</font>

In [None]:
# Instalar o pacote RMariaD se for a primeira vez que for utlizar.

install.packages("RMariaDB")

Caso opte por utilizar o pacote DBI ou RMySQL, estes também devem ser instalados.

### <font color=blue>Importar o pacote RMariaDB</fonte>

In [2]:
#importação do pacote deve ser SEMPRE realizada

#Importa pacote RMariaDB se ele ainda não foi carregado
if(!"RMariaDB" %in% (.packages())){require(RMariaDB)}

Loading required package: RMariaDB
"package 'RMariaDB' was built under R version 3.6.3"

<b>Outras formas de importação do pacote RMariaDB:</b>
* require(RMariaDB)
* library(RMariaDB)

<b><font color=red>Observação 1:</b></font> A mensagem ilustrada abaixo não indica um erro, é um alerta indicando a versão do R no qual o pacote RMariaDB foi construindo.
<img src="R1.png" style="width: 40%"/>

<b><font color=red>Observação 2:</b></font> A mensagem abaixo indica um erro, alertando que não existe o pacote RMariaDB instalado. Para corrigir, instale o pacote.
<img src="R2.png" style="width: 70%"/>


In [None]:
#Conecta ao SGBD MySQL --> Banco de dados bootcamp
con <- dbConnect(MariaDB(), user = "root", password = "igti",
                 dbname = "bootcamp", host = "localhost",serverTimezone='UTC')

<b><font color=red>Observação:</b></font> Caso ocorra o erro abaixo:<br>

<b>Error:</b> Failed to connect: <i>Plugin caching_sha2_password could not be loaded:</i> The specified module could not be found.

Acesse seu SGBD MySQL Server utilizando o MySQL Workbench e execute o comando abaixo no seu esquema de BD

    ALTER USER 'root'@'localhost' IDENTIFIED WITH mysql_native_password BY 'igti';

Agora execute o comando de conexão novamente.

In [None]:
#Para listar quais tabela existem no esquema .bootcamp. execute:

#Lê a lista de tabelas no BD
tables <- dbListTables(con) 
tables

In [None]:
#Para consultar quais os dados de uma tabela execute:
# dbReadTable(nome-da-conexao,"nome-da-tabela")

#Consulta os dados da tabela *estado*
tabledata <- dbReadTable(con,"estado")
tabledata

<b><font color=red>Observação:</b></font> Veja que o resultado do comando acima demonstra que a tabela 'estado' não possue dados.

In [None]:
#Consulta os dados da tabela *tipounidade*
tabledata <- dbReadTable(con,"tipounidade")
tabledata

<b><font color=red>Observação:</b></font> Veja que o resultado do comando acima demonstra que a tabela 'tipounidade' possue alguns dados.

In [None]:
#Para executar um comando SQL execute:
#dbSendQuery(nome-da-conexao,"comando")

# Vamos inserir uma nova linha na tabela tipounidade
# Cria o comando e salva na variável query
query <-  "INSERT INTO tipounidade(idTipoUnidade,dscTipoUnidade) VALUES(7,'Loft');"

results <- dbSendQuery(con,query)
print(results)

# Limpa resultados
dbClearResult(results)

<b><font color=red>Observação 1:</b></font> Caso ocorra o erro: *Error: Duplicate entry '6' for key 'tipounidade.PRIMARY' [1062]*

Isso significa que você violou a chave primária, ou seja, tentou inserir uma chave que já existe. Confira o valor da chave que esta inserindo, altere, e execute novamente.

<b><font color=red>Observação 2:</b></font> Caso ocorra o erro: *Error: Column count doesn't match value count at row 1 [1136]*

Isso significa que você esta inserindo dados não compatíveis com a definição da tabela.


In [None]:
#Consulta os dados da tabela *tipounidade*
tabledata <- dbReadTable(con,"tipounidade")
tabledata

In [None]:
id <- 8
desc <- 'Chácara'

query <-  paste("INSERT INTO tipounidade(idTipoUnidade,dscTipoUnidade) VALUES(",id,",'",desc,"');",sep='')

results <- dbSendQuery(con,query)
print(results)

# Limpa resultados
dbClearResult(results)

In [None]:
#Consulta os dados da tabela *tipounidade*
tabledata <- dbReadTable(con,"tipounidade")
tabledata

Agora vamos realizar a carga na tabela "estados" a partir dos dados coletados no arquivo estados.xlsx.
Para abrir ler o arquivo será necessário o pacote *"XLSX"*.

### <font color=blue>Instalar o pacote xlsx</fonte>

In [None]:
# Instalar o pacote xlsx se for a primeira vez que for utlizar.
install.packages('xlsx')

### <font color=blue>Importar o pacote xlsx</fonte>

In [None]:
#Importa pacote xlsx se ele ainda não foi carregado
if(!"xlsx" %in% (.packages())){require(xlsx)}

Outras formas de importação do pacote xlsx:

* require(xlsx)
* library(xlsx)

In [None]:
#Antes de excutar esta célula, garanta que o caminho do arquivo estados.xlsx esteja correto.

filename <- "C:/Bootcamp/Datasets/XLS/estados.xlsx"
print(filename)

insertdata <- read.xlsx(filename, sheetIndex=1, header=TRUE,encoding="UTF-8")
print("Lista de estados existentes no arquivo:")
insertdata

<b><font color=red>Observação:</b></font> As colunas da tabela estado são: *CodEstadoIBGE,NomeEstado,SiglaEstado,Regiao*


In [None]:
# Escrever ou gravar os dados na tabela estado

dbWriteTable(con,'estado',insertdata,append = TRUE)

In [None]:
#Consulta os dados da tabela *estado*
results <- dbReadTable(con,"estado")
results

<b><font color=red>Observação:</b></font> O retorno do comando *dbReadTable* são os dados existentes na tabela estado.

In [None]:
#Consulta os dados da tabela *estado*
query <- "SELECT * FROM estado;"

results <- dbSendQuery(con,query)
results

<b><font color=red>Observação:</b></font> O retorno do comando *dbSendQuery* indica que se o comando SQL passado para a variável *query* foi executado com sucesso ou não.

In [None]:
# Limpa os dados da variável results
dbClearResult(results)

results <- dbGetQuery(con,query)
results

<b><font color=red>Observação:</b></font> O retorno do comando *dbGetQuery* é o resultados da query executada, neste caso, são os dados existentes na tabela estado.

In [None]:
#Realizar o commit dos dados use o comando abaixo. 

#dbCommit(con)


<b><font color=red>Observação:</b></font> O padrão da biblioteca para comando isolados, ou seja, fora de uma transação é ser auto commit.

In [None]:
# Verifique se o caminho do arquivo existe.

#Salvar o resultado da query no arquivo CSV
write.csv(results,"C:/Bootcamp/Datasets/CSV/estadosDB.csv",row.names=FALSE,quote=FALSE)


In [None]:
# Desconectar do banco de dados
dbDisconnect(con)

##### Fim!