## Feminicídio

> O objetivo deste estudo é avaliar a mortalidade feminina no estado do Rio Grande do Norte.
> Desta forma será primeiramente avaliado os dados de mortalidade apenas para o sexo feminino, olhando no contexto geral. Em um segundo momento será selecionada apenas as causas em que envolvem agressão física ou por arma de fogo, que indiretamente apontam violência contra a mulher, uma das formas de tipificar feminicídio. Por fim, será avaliado todos os dados de mortalidade: geral, por agressão física e por arma de fogo; a fim de obtermos assim a evolução anual dos dados.
> Para este estudo, iniciaremos apenas com os dados de 1996 até 2015, posteriormente adicionaremos os dados de 2016 e 2017 (prévio).

> Não estipularemos indicadores neste momento, pois se trata do estudo inicial do caso. Contudo é desejado no final identificarmos a principal faixa etária, qual região do estado é mais violento com mulheres, qual município, qual a zona de moradia mais preponderante, etc.

In [1]:
library(stringr)

In [2]:
library(dplyr)


Attaching package: ‘dplyr’

The following objects are masked from ‘package:stats’:

    filter, lag

The following objects are masked from ‘package:base’:

    intersect, setdiff, setequal, union



In [3]:
todos <- read.csv2("mortalidade_96-15.csv", header=T, sep=";")

In [4]:
mulheres <- subset(todos, SEXO == 2)
mulheres <- droplevels(mulheres)

In [5]:
str(mulheres)

'data.frame':	129299 obs. of  18 variables:
 $ DTOBITO   : int  30061996 11071996 28081996 13061996 14091996 28031996 15031996 29031996 19031996 9031996 ...
 $ IDADE     : int  459 439 446 414 487 488 445 477 478 484 ...
 $ SEXO      : int  2 2 2 2 2 2 2 2 2 2 ...
 $ RACACOR   : int  NA NA NA NA NA NA NA NA NA NA ...
 $ ESTCIV    : int  1 2 1 1 1 3 1 3 2 3 ...
 $ ESC       : Factor w/ 9 levels "0","1","2","3",..: NA NA NA NA 7 NA 7 NA NA NA ...
 $ CODMUNRES : int  2408003 2401453 2408102 2403301 2408003 2404309 2408102 2401107 2408003 2408003 ...
 $ LOCOCOR   : int  1 3 1 1 1 1 1 3 1 3 ...
 $ CODMUNOCOR: int  2304400 2401453 2304400 2409407 2304400 2408003 2408102 2401107 2408003 2408003 ...
 $ GRAVIDEZ  : int  NA NA NA NA NA NA NA NA NA NA ...
 $ CAUSABAS  : Factor w/ 2730 levels "A009","A039",..: 362 2211 22 1121 1036 2212 1004 699 708 2211 ...
 $ LINHAA    : Factor w/ 2017 levels "*","**J960","**R092",..: NA NA NA NA NA NA NA NA NA NA ...
 $ LINHAB    : Factor w/ 3011 levels "*519",

In [6]:
# write.csv2(mulheres, "mulheres_rn_96-15.csv", row.names=FALSE)

In [7]:
mulheres$CODCID_CAUSABAS <- as.character(str_sub(mulheres$CAUSABAS, 1, 1))
mulheres$CODCID_LINHAA <- str_sub(mulheres$LINHAA, 1, 1)
mulheres$CODCID_LINHAB <- str_sub(mulheres$LINHAB, 1, 1)
mulheres$CODCID_LINHAC <- str_sub(mulheres$LINHAC, 1, 1)
mulheres$CODCID_LINHAD <- str_sub(mulheres$LINHAD, 1, 1)
mulheres$CODCID_LINHAII <- str_sub(mulheres$LINHAII, 1, 1)

In [8]:
mulheres <- droplevels(mulheres)

In [9]:
str(mulheres)

'data.frame':	129299 obs. of  24 variables:
 $ DTOBITO        : int  30061996 11071996 28081996 13061996 14091996 28031996 15031996 29031996 19031996 9031996 ...
 $ IDADE          : int  459 439 446 414 487 488 445 477 478 484 ...
 $ SEXO           : int  2 2 2 2 2 2 2 2 2 2 ...
 $ RACACOR        : int  NA NA NA NA NA NA NA NA NA NA ...
 $ ESTCIV         : int  1 2 1 1 1 3 1 3 2 3 ...
 $ ESC            : Factor w/ 9 levels "0","1","2","3",..: NA NA NA NA 7 NA 7 NA NA NA ...
 $ CODMUNRES      : int  2408003 2401453 2408102 2403301 2408003 2404309 2408102 2401107 2408003 2408003 ...
 $ LOCOCOR        : int  1 3 1 1 1 1 1 3 1 3 ...
 $ CODMUNOCOR     : int  2304400 2401453 2304400 2409407 2304400 2408003 2408102 2401107 2408003 2408003 ...
 $ GRAVIDEZ       : int  NA NA NA NA NA NA NA NA NA NA ...
 $ CAUSABAS       : Factor w/ 2730 levels "A009","A039",..: 362 2211 22 1121 1036 2212 1004 699 708 2211 ...
 $ LINHAA         : Factor w/ 2017 levels "*","**J960","**R092",..: NA NA NA NA NA NA 

In [10]:
# feminicidios <- subset(mulheres, select = c(CODCID_CAUSABAS,CODCID_LINHAA,CODCID_LINHAB,
#                                         CODCID_LINHAC,CODCID_LINHAD,CODCID_LINHAII) %in% c("S","T"))

In [14]:
feminicidios <- subset(mulheres, CODCID_CAUSABAS %in% c('S', 'T'))

In [12]:
feminicidios <- filter(mulheres, startsWith(as.character(CAUSABAS), "S") | startsWith(as.character(CAUSABAS), "T"))

In [16]:
head(feminicidios)

“number of rows of result is not a multiple of vector length (arg 2)”

DTOBITO,IDADE,SEXO,RACACOR,ESTCIV,ESC,CODMUNRES,LOCOCOR,CODMUNOCOR,GRAVIDEZ,⋯,LINHAD,LINHAII,CIRCOBITO,ACIDTRAB,CODCID_CAUSABAS,CODCID_LINHAA,CODCID_LINHAB,CODCID_LINHAC,CODCID_LINHAD,CODCID_LINHAII
