# Importação de dados em múltiplas planilhas do Excel


Este pequeno tutorial ilustra como importar dados armazenados em múltiplas planilhas do Excel. Um exemplar que ilustra bem o tipo de situação referida são os dados relativos ao *Resumo das Principais Incidências Criminais do Estado do Rio de Janeiro*, publicadas mensalmente no Diário Oficial do ERJ e disponibilizados em formato eletrônico pelo Instituto de Segurança Pública - ISP, na página [`http://www.isp.rj.gov.br/dadosoficiais.asp`](http://www.isp.rj.gov.br/dadosoficiais.asp).

A figura a seguir ilustra a disposição dos dados na planilha:

![](../../dados/importa_dados_isp/fig1.png)

Os dados são disponibilizados em planilhas do Excel e o *script* a seguir ilustra como importar estes dados.

Vamos assumir que o arquivo de dados já tenha sido baixado pelo usuário e convertido para uma planilha `.xlsx`. Será utilizado o pacote `openxlsx` para fazer a importação dos dados. Caso não tenha instalado este pacote, será necessário fazê-lo.

O arquivo utilizado neste tutorial encontra-se disponível no GitHub.

In [2]:
# install.packages('openxlsx')
library(openxlsx)

"package 'openxlsx' was built under R version 3.3.2"

Carregado o pacote, vamos definir o arquivo a ser importado:

In [3]:
setwd('C:\\Users\\Marcos\\Documents\\GitHub\\Usando-R-em-Auditoria\\dados\\importa_dados_isp')
arquivo <- 'DO201601.xlsx'

Os nomes das planilhas existentes no arquivo podem ser obtidos da seguinte forma:

In [4]:
planilhas <- getSheetNames(arquivo)
planilhas

Como nosso interesse é importar os dados das [Aisps](http://www.isp.rj.gov.br/Conteudo.asp?ident=38), temos que excluir o que não é Aisp. Isso pode ser feito da seguinte forma:

In [5]:
planilhas <- planilhas[grepl('Aisp', planilhas)]
planilhas

A importação dos dados propriamente ditos pode ser feita da seguinte forma:

In [6]:
dados_isp <- mapply(read.xlsx,
                     xlsxFile=arquivo, # 'xlsxFile' é um argumento de 'read.xlsx'
                     sheet=planilhas,  # 'sheet' também é um argumento de 'read.xlsx'
                     MoreArgs = list(rows = 5:59, cols = 1:17), # Define as linhas e colunas a serem importadas
                     SIMPLIFY = FALSE)

names(dados_isp) <- paste(arquivo, planilhas, sep='-')
head(dados_isp[[1]])

X1,9a..DP,10a..DP,X4,X5,X6,X7,X8,X9,X10,X11,X12
VÍTIMAS DE CRIMES VIOLENTOS,,,,,,,,,,,
Homicídio Doloso,2.0,0.0,,,,,,,,,
Lesão Corporal Seguida de Morte,0.0,0.0,,,,,,,,,
Latrocínio (Roubo seguido de morte),0.0,0.0,,,,,,,,,
Tentativa de Homicídio,2.0,0.0,,,,,,,,,
Lesão Corporal Dolosa,51.0,29.0,,,,,,,,,


Agora dispomos de uma lista com os dados relativos a cada planilha contendo informações sobre uma determinada Aisp.

Precisamos agora realizar alguns ajustes nos dados. O primeiro é retirar os pontos nos nomes das delegacias e incluir um nome para a coluna relativa aos delitos. Isso pode ser feito da seguinte forma:

In [7]:
dados_isp <- lapply(dados_isp, function(x){names(x) <- gsub('\\.', '', names(x));
                                           names(x)[1] <- 'Delitos';
                                           x})
head(dados_isp[[1]])

Delitos,9aDP,10aDP,X4,X5,X6,X7,X8,X9,X10,X11,X12
VÍTIMAS DE CRIMES VIOLENTOS,,,,,,,,,,,
Homicídio Doloso,2.0,0.0,,,,,,,,,
Lesão Corporal Seguida de Morte,0.0,0.0,,,,,,,,,
Latrocínio (Roubo seguido de morte),0.0,0.0,,,,,,,,,
Tentativa de Homicídio,2.0,0.0,,,,,,,,,
Lesão Corporal Dolosa,51.0,29.0,,,,,,,,,


Um outro ajuste é filtrar os dados de forma a manter apenas os delitos. Isto pode ser feito da seguinte forma:

In [8]:
dados_isp <- lapply(dados_isp, function(x) subset(x, grepl('^ +', x[[1]])))
head(dados_isp[[1]])

Unnamed: 0,Delitos,9aDP,10aDP,X4,X5,X6,X7,X8,X9,X10,X11,X12
2,Homicídio Doloso,2,0,,,,,,,,,
3,Lesão Corporal Seguida de Morte,0,0,,,,,,,,,
4,Latrocínio (Roubo seguido de morte),0,0,,,,,,,,,
5,Tentativa de Homicídio,2,0,,,,,,,,,
6,Lesão Corporal Dolosa,51,29,,,,,,,,,
7,Estupro,3,3,,,,,,,,,


Agora vamos excluir as colunas que tenham apenas `NA`.

In [9]:
dados_isp <- lapply(dados_isp, function(x) x[,!grepl('^X', names(x), ignore.case = TRUE)])
head(dados_isp[[1]]) # Dados da primeira planilha...

Unnamed: 0,Delitos,9aDP,10aDP
2,Homicídio Doloso,2,0
3,Lesão Corporal Seguida de Morte,0,0
4,Latrocínio (Roubo seguido de morte),0,0
5,Tentativa de Homicídio,2,0
6,Lesão Corporal Dolosa,51,29
7,Estupro,3,3


Agora estamos em condições em reunir todos os dados em um único `data frame`. Isso pode ser feito da seguinte forma:

In [10]:
merge2 <- function(x, y) merge(x, y, by='Delitos', all=TRUE, sort = FALSE)
dados_isp <- Reduce(merge2, dados_isp)
head(dados_isp)

Delitos,9aDP,10aDP,23aDP,24aDP,25aDP,26aDP,44aDP,6aDP,17aDP,...,107aDP,108aDP,109aDP,Var.137,.1,54aDP,35aDP,27aDP,31aDP,39aDP
Homicídio Doloso,2,0,1,1,2,1,2,0,1,...,0,0,0,,,14,9,1,1,9
Lesão Corporal Seguida de Morte,0,0,0,0,0,0,0,0,0,...,0,0,0,,,0,0,0,0,0
Latrocínio (Roubo seguido de morte),0,0,0,0,0,0,0,0,0,...,0,0,0,,,0,0,2,0,1
Tentativa de Homicídio,2,0,1,2,12,4,5,11,7,...,0,0,0,,,8,5,2,4,0
Lesão Corporal Dolosa,51,29,24,42,55,45,20,37,41,...,21,60,8,,,145,194,62,54,33
Estupro,3,3,2,2,1,3,0,7,4,...,1,3,1,,,8,19,4,4,4


Por alguma razão, ainda permanecem algumas variáveis que não deveriam constar da base de dados. Podemos removê-las da seguinte forma:

In [12]:
dados_isp <- dados_isp[, grepl('Delitos|^\\d+aDP', names(dados_isp), ignore.case = TRUE)]
dados_isp

Delitos,9aDP,10aDP,23aDP,24aDP,25aDP,26aDP,44aDP,6aDP,17aDP,...,99aDP,100aDP,107aDP,108aDP,109aDP,54aDP,35aDP,27aDP,31aDP,39aDP
Homicídio Doloso,2,0,1,1,2,1,2,0,1,...,1,0,0,0,0,14,9,1,1,9
Lesão Corporal Seguida de Morte,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0
Latrocínio (Roubo seguido de morte),0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,2,0,1
Tentativa de Homicídio,2,0,1,2,12,4,5,11,7,...,9,1,0,0,0,8,5,2,4,0
Lesão Corporal Dolosa,51,29,24,42,55,45,20,37,41,...,8,19,21,60,8,145,194,62,54,33
Estupro,3,3,2,2,1,3,0,7,4,...,1,0,1,3,1,8,19,4,4,4
Homicídio Culposo,2,1,0,0,2,1,0,3,0,...,0,0,0,1,0,0,2,3,2,0
Lesão Corporal Culposa,24,23,8,20,16,17,26,40,46,...,1,3,4,12,9,33,119,35,20,14
Encontro de Cadáver,0,1,0,0,0,0,0,0,0,...,1,0,1,0,0,0,1,0,0,0
Encontro de Ossada,0,0,0,0,0,0,0,0,0,...,0,0,0,0,0,0,0,0,0,0


Agora o data frame `dados_isp` possui os dados dos delitos constantes do arquivo **`DO201601.xlsx`**.

**Marcos F Silva**