# Análise de Crimes contra a Mulher no Estado do Pará (2019-2023)

Neste notebook, vamos realizar uma análise detalhada da base de dados sobre crimes contra a mulher no estado do Pará, ocorridos entre os anos de 2019 e 2023. O objetivo principal é explorar e extrair informações úteis para compreender o panorama desses crimes e identificar padrões relevantes.

Esta etapa visa criar visualizações gráficas dos dados tratados para compreender sua natureza e encontrar insights úteis. Essas visualizações facilitam a identificação de padrões, tendências e relações entre variáveis. Ao examinar os dados por meio de gráficos, podemos detectar distribuições, outliers e entender melhor seu comportamento geral. Isso é fundamental para tomadas de decisão informadas e o desenvolvimento de estratégias eficazes.



### 1. Importações necesssárias

In [1]:
# Manipulação e Análise de Dados
import pandas as pd
import numpy as np

# Operações de Sistema
import os

# Visualização de Dados
import matplotlib.pyplot as plt

# Visualizações Interativas com Plotly
import plotly
import plotly.express as px
import plotly.offline as py
import plotly.graph_objects as go


In [2]:
plotly.offline.init_notebook_mode(connected=True)

#### 1.1. Importação da base de dados

In [114]:
crimes_selecionados_para_df = pd.read_csv('/home/heloisasilva/Downloads/bases siac/crimes_selecionados_pará.csv')

In [4]:
crimes_selecionados_para_df.head()

Unnamed: 0,unidade_origem,unidade_responsavel,dia_semana,mes_fato,municipios,ano_fato,data_fato,consolidado,especificacao_crime,causa_presumivel,...,grau_de_relacionamento,relato,aut_sexo,distrito,regionais,nro_bop_aditado,nro_bop,turno,periodo,tipo_violencia
0,MARAMBAIA - 5ª SECCIONAL - 1ª RISP - 9ª AISP,ATALAIA - DELEGACIA DE POLICIA - 2ª RISP - 17ª...,SEG,NOVEMBRO,ANANINDEUA,2019,2019-11-25,LESAO CORPORAL,VIOLENCIA DOMESTICA,ÓDIO OU VINGANÇA,...,FILHO(A),<p>A relatora vem a esta Seccional comunicar q...,M,ANANINDEUA,METROPOLITANA,Nao informado,00006/2019.113110-8,TARDE,2 SEMESTRE DE 2019,Violência física
1,MARITUBA - SECCIONAL - 2º RISP- 22ª AISP,MARITUBA - SECCIONAL - 2º RISP- 22ª AISP,QUI,JUNHO,MARITUBA,2019,2019-06-13,LESAO CORPORAL,VIOLENCIA DOMESTICA,OUTRAS,...,NAO INFORMADO,<p>A nacional acima qualificado compareceu nes...,F,MARITUBA,METROPOLITANA,Nao informado,00029/2019.103607-1,NOITE,1 SEMESTRE DE 2019,Violência física
2,MARITUBA - SECCIONAL - 2º RISP- 22ª AISP,MARITUBA - SECCIONAL - 2º RISP- 22ª AISP,TER,MARCO,MARITUBA,2019,2019-03-05,LESAO CORPORAL,VIOLENCIA DOMESTICA,ÓDIO OU VINGANÇA,...,NAO INFORMADO,<p>O policial militar acima identificado apres...,Nao informado,MARITUBA,METROPOLITANA,Nao informado,00029/2019.101409-1,NOITE,1 SEMESTRE DE 2019,Violência física
3,ITUPIRANGA - DELEGACIA DE POLICIA - 10ª RISP,ITUPIRANGA - DELEGACIA DE POLICIA - 10ª RISP,QUA,FEVEREIRO,ITUPIRANGA,2019,2019-02-27,AMEACA,Nao informado,ÓDIO OU VINGANÇA,...,NAO INFORMADO,<p>A relatora comunica que foi desmoralizada p...,Nao informado,ITUPIRANGA,CARAJAS,Nao informado,00157/2019.100273-5,MANHA,1 SEMESTRE DE 2019,Violência psicológica
4,BENFICA-UIPP MURINIM 94-2º RISP-23ª AISP,BENFICA-UIPP MURINIM 94-2º RISP-23ª AISP,QUI,JUNHO,BENEVIDES,2019,2019-06-20,AMEACA,Nao informado,ÓDIO OU VINGANÇA,...,NAO INFORMADO,A RELATORA ACIMA QUALIFICADA INFORMA QUE NO DI...,Nao informado,BENEVIDES,METROPOLITANA,/.-,94/2019.000595-4,NOITE,1 SEMESTRE DE 2019,Violência psicológica


In [42]:
crimes_selecionados_para_df.columns

Index(['unidade_origem', 'unidade_responsavel', 'dia_semana', 'mes_fato',
       'municipios', 'ano_fato', 'data_fato', 'consolidado',
       'especificacao_crime', 'causa_presumivel', 'meio_empregado_sisp',
       'bairros', 'local_ocorrencia', 'vit_fx_etaria', 'vit_sexo',
       'vit_cor_pele', 'vit_grau_inst', 'grau_de_relacionamento', 'relato',
       'aut_sexo', 'distrito', 'regionais', 'nro_bop_aditado', 'nro_bop',
       'turno', 'periodo', 'tipo_violencia'],
      dtype='object')

In [43]:
crimes_selecionados_para_df.shape

(217173, 27)

### 2. Renomeação de termos das colunas para padronização

- Crimes consolidados

In [8]:
crimes_selecionados_para_df.consolidado.value_counts()

consolidado
AMEACA                                              108996
LESAO CORPORAL                                       67112
ESTUPRO DE VULNERAVEL                                14986
VIOLENCIA PSICOLOGICA                                 5818
DESCUMPRIMENTO DE MEDIDAS PROTETIVAS DE URGENCIA      5476
IMPORTUNACAO SEXUAL                                   4386
ESTUPRO                                               3882
TENTATIVA DE FEMINICIDIO                               979
DESCUMPRIMENTO DE MEDIDAS PROTETIVAS                   951
ASSEDIO SEXUAL                                         873
HOMICIDIO                                              802
DIVULGACAO DE CENA DE ESTUPRO                          778
VIOLENCIA MORAL                                        665
TENTATIVA DE HOMICIDIO                                 664
FEMINICIDIO                                            276
VIOLENCIA PATRIMONIAL                                  230
VIOLENCIA FISICA                            

In [115]:
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['consolidado'].isin(['AMEACA']), 'consolidado'] = 'Ameaça'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['consolidado'].isin(['LESAO CORPORAL']), 'consolidado'] = 'Lesão corporal'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['consolidado'].isin(['ESTUPRO DE VULNERAVEL']), 'consolidado'] = 'Estupro de vulnerável'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['consolidado'].isin(['VIOLENCIA PSICOLOGICA']), 'consolidado'] = 'Violência psicológica'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['consolidado'].isin(['DESCUMPRIMENTO DE MEDIDAS PROTETIVAS DE URGENCIA']), 'consolidado'] = 'Descumprimento de medidas protetivas de urgência'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['consolidado'].isin(['IMPORTUNACAO SEXUAL']), 'consolidado'] = 'Importunação sexual'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['consolidado'].isin(['ESTUPRO']), 'consolidado'] = 'Estupro'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['consolidado'].isin(['TENTATIVA DE FEMINICIDIO']), 'consolidado'] = 'Tentativa de feminicídio'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['consolidado'].isin(['DESCUMPRIMENTO DE MEDIDAS PROTETIVAS']), 'consolidado'] = 'Descumprimento de medidas protetivas'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['consolidado'].isin(['ASSEDIO SEXUAL']), 'consolidado'] = 'Assédio sexual'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['consolidado'].isin(['HOMICIDIO']), 'consolidado'] = 'Homicídio'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['consolidado'].isin(['DIVULGACAO DE CENA DE ESTUPRO']), 'consolidado'] = 'Divulgação de cena de estupro'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['consolidado'].isin(['VIOLENCIA MORAL']), 'consolidado'] = 'Violência moral'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['consolidado'].isin(['TENTATIVA DE HOMICIDIO']), 'consolidado'] = 'Tentativa de homicídio'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['consolidado'].isin(['FEMINICIDIO']), 'consolidado'] = 'Feminicídio'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['consolidado'].isin(['VIOLENCIA PATRIMONIAL']), 'consolidado'] = 'Violência patrimonial'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['consolidado'].isin(['VIOLENCIA FISICA']), 'consolidado'] = 'Violência fisíca'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['consolidado'].isin(['EXPLORACAO SEXUAL INFANTIL']), 'consolidado'] = 'Exploração sexual infantil'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['consolidado'].isin(['VIOLENCIA DOMESTICA']), 'consolidado'] = 'Violência doméstica'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['consolidado'].isin(['ABORTO']), 'consolidado'] = 'Aborto'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['consolidado'].isin(['ASSEDIO']), 'consolidado'] = 'Assédio'


In [12]:
crimes_selecionados_para_df.consolidado.value_counts()

consolidado
Ameaça                                              108996
Lesão corporal                                       67112
Estupro de vulnerável                                14986
Violência psicológica                                 5818
Descumprimento de medidas protetivas de urgência      5476
Importunação sexual                                   4386
Estupro                                               3882
Tentativa de feminicídio                               979
Descumprimento de medidas protetivas                   951
Assédio sexual                                         873
Homicídio                                              802
Divulgação de cena de estupro                          778
Violência moral                                        665
Tentativa de homicídio                                 664
Feminicídio                                            276
Violência patrimonial                                  230
Violência fisíca                            

- Especificação dos crimes

In [17]:
crimes_selecionados_para_df.especificacao_crime.value_counts().head(10)

especificacao_crime
Nao informado               131503
VIOLENCIA DOMESTICA          71329
MENOR                         5543
PREJUDICADO                   2655
CRIMES VIRTUAIS               1346
TENTATIVA DE FEMINICIDIO       656
OUTROS                         651
SIMPLES                        492
MENOR/ERA DO FATO              338
FEMINICIDIO                    305
Name: count, dtype: int64

In [116]:
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['especificacao_crime'].isin(['VIOLENCIA DOMESTICA']), 'especificacao_crime'] = 'Violência doméstica'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['especificacao_crime'].isin(['MENOR', 'MENOR/ERA DO FATO']), 'especificacao_crime'] = 'Menor'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['especificacao_crime'].isin(['CRIMES VIRTUAIS']), 'especificacao_crime'] = 'Crimes virtuais'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['especificacao_crime'].isin(['PREJUDICADO']), 'especificacao_crime'] = 'Prejudicado'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['especificacao_crime'].isin(['TENTATIVA DE FEMINICIDIO']), 'especificacao_crime'] = 'Tentativa de feminicídio'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['especificacao_crime'].isin(['FEMINICIDIO']), 'especificacao_crime'] = 'Feminicídio'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['especificacao_crime'].isin(['OUTROS']), 'especificacao_crime'] = 'Outros'


In [19]:
crimes_selecionados_para_df.especificacao_crime.value_counts().head(10)

especificacao_crime
Nao informado               131503
Violência doméstica          71329
Menor                         5881
Prejudicado                   2655
Crimes virtuais               1346
Tentativa de feminicídio       656
Outros                         651
SIMPLES                        492
Feminicídio                    305
PESSOA COM DEFICIENCIA         170
Name: count, dtype: int64

- Turno

In [20]:
crimes_selecionados_para_df.turno.value_counts()

turno
NOITE        70623
MANHA        62174
TARDE        61058
MADRUGADA    23318
Name: count, dtype: int64

In [117]:
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['turno'].isin(['MANHA']), 'turno'] = 'Manhã'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['turno'].isin(['TARDE']), 'turno'] = 'Tarde'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['turno'].isin(['NOITE']), 'turno'] = 'Noite'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['turno'].isin(['MADRUGADA']), 'turno'] = 'Madrugada'


In [22]:
crimes_selecionados_para_df.turno.value_counts()

turno
Noite        70623
Manhã        62174
Tarde        61058
Madrugada    23318
Name: count, dtype: int64

- Locais

In [23]:
crimes_selecionados_para_df.local_ocorrencia.value_counts().head(10)

local_ocorrencia
RESIDENCIA PARTICULAR          123816
VIA PUBLICA                     43193
OUTROS LOCAIS                   16292
INTERNET                         7453
ESTABELECIMENTO COMERCIAL        4963
CAFE, BAR, RESTAURANTE, ETC      3610
CONDOMINIO                       3406
ESTABELECIMENTO DE ENSINO        2102
EDIFICIO PUBLICO                 1837
ZONA URBANA                      1577
Name: count, dtype: int64

In [118]:
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['local_ocorrencia'].isin(['RESIDENCIA PARTICULAR']), 'local_ocorrencia'] = 'Residência particular'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['local_ocorrencia'].isin(['VIA PUBLICA']), 'local_ocorrencia'] = 'Via pública'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['local_ocorrencia'].isin(['OUTROS LOCAIS']), 'local_ocorrencia'] = 'Outros locais'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['local_ocorrencia'].isin(['INTERNET']), 'local_ocorrencia'] = 'Internet'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['local_ocorrencia'].isin(['ESTABELECIMENTO COMERCIAL', 'CAFE, BAR, RESTAURANTE, ETC']), 'local_ocorrencia'] = 'Estabeleciemnto comercial'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['local_ocorrencia'].isin(['CONDOMINIO']), 'local_ocorrencia'] = 'Condomínio residencial'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['local_ocorrencia'].isin(['ESTABELECIMENTO DE ENSINO']), 'local_ocorrencia'] = 'Estabelecimento de ensino'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['local_ocorrencia'].isin(['EDIFICIO PUBLICO']), 'local_ocorrencia'] = 'Edifício público'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['local_ocorrencia'].isin(['ZONA URBANA']), 'local_ocorrencia'] = 'Zona urbana'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['local_ocorrencia'].isin(['AREA RURAL']), 'local_ocorrencia'] = 'Área rural'


In [27]:
crimes_selecionados_para_df.local_ocorrencia.value_counts().head(10)

local_ocorrencia
Residência particular        123816
Via pública                   43193
Outros locais                 16292
Estabeleciemnto comercial      8573
Internet                       7453
Condomínio residencial         3406
Estabelecimento de ensino      2102
Edifício público               1837
Zona urbana                    1577
Área rural                     1551
Name: count, dtype: int64

- Faixa etaria das vitimas

In [28]:
crimes_selecionados_para_df.vit_fx_etaria.value_counts()

vit_fx_etaria
ADULTO IV (35 A 64 ANOS)      82227
ADULTO I (18 A 24 ANOS)       38424
ADULTO II (25 A 29 ANOS)      32023
ADULTO III (30 A 34 ANOS)     31058
ADOLESCENTE (12 A 17 ANOS)    14791
CRIANCA (0 A 11 ANOS)          7856
PREJUDICADO                    5566
IDOSO (65 ANOS OU MAIS)        4368
NAO INFORMADO                   860
Name: count, dtype: int64

In [119]:
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['vit_fx_etaria'].isin(['ADULTO IV (35 A 64 ANOS)']), 'vit_fx_etaria'] = '35 a 64 anos'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['vit_fx_etaria'].isin(['ADULTO I (18 A 24 ANOS)']), 'vit_fx_etaria'] = '18 a 24 anos'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['vit_fx_etaria'].isin(['ADULTO III (30 A 34 ANOS)']), 'vit_fx_etaria'] = '30 a 34 anos'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['vit_fx_etaria'].isin(['ADULTO II (25 A 29 ANOS)']), 'vit_fx_etaria'] = '25 a 29 anos'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['vit_fx_etaria'].isin(['ADOLESCENTE (12 A 17 ANOS)']), 'vit_fx_etaria'] = '12 a 17 anos'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['vit_fx_etaria'].isin(['IDOSO (65 ANOS OU MAIS)']), 'vit_fx_etaria'] = '65 anos ou mais'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['vit_fx_etaria'].isin(['CRIANCA (0 A 11 ANOS)']), 'vit_fx_etaria'] = '0 a 11 anos'


In [30]:
crimes_selecionados_para_df.vit_fx_etaria.value_counts()

vit_fx_etaria
35 a 64 anos       82227
18 a 24 anos       38424
25 a 29 anos       32023
30 a 34 anos       31058
12 a 17 anos       14791
0 a 11 anos         7856
PREJUDICADO         5566
65 anos ou mais     4368
NAO INFORMADO        860
Name: count, dtype: int64

- Grau de instrução

In [31]:
crimes_selecionados_para_df.vit_grau_inst.value_counts()

vit_grau_inst
ENSINO MEDIO COMPLETO                    56835
ENSINO FUNDAMENTAL INCOMPLETO            49824
NAO INFORMADO                            30865
ENSINO MEDIO INCOMPLETO                  19478
ENSINO SUPERIOR COMPLETO                 18521
ENSINO FUNDAMENTAL COMPLETO              17166
PREJUDICADO                              11620
ENSINO SUPERIOR INCOMPLETO                9653
NAO ALFABETIZADO                          3190
POS-GRADUACAO/ESPECIALIZACAO                14
1º GRAU COMPLETO (ENSINO FUNDAMENTAL)        3
PJ, EP E OUTROS                              2
MESTRADO                                     1
ENSINO ENSINO FUNDAMENTAL                    1
Name: count, dtype: int64

In [120]:
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['vit_grau_inst'].isin(['ENSINO MEDIO COMPLETO']), 'vit_grau_inst'] = 'Médio completo'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['vit_grau_inst'].isin(['ENSINO FUNDAMENTAL INCOMPLETO']), 'vit_grau_inst'] = 'Fundamental incompleto'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['vit_grau_inst'].isin(['ENSINO SUPERIOR COMPLETO']), 'vit_grau_inst'] = 'Superior completo'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['vit_grau_inst'].isin(['ENSINO MEDIO INCOMPLETO']), 'vit_grau_inst'] = 'Médio incompleto'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['vit_grau_inst'].isin(['ENSINO FUNDAMENTAL COMPLETO','1º GRAU COMPLETO (ENSINO FUNDAMENTAL)','ENSINO ENSINO FUNDAMENTAL']), 'vit_grau_inst'] = 'Fundamental completo'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['vit_grau_inst'].isin(['ENSINO SUPERIOR INCOMPLETO']), 'vit_grau_inst'] = 'Superior incompleto'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['vit_grau_inst'].isin(['NAO ALFABETIZADO']), 'vit_grau_inst'] = 'Não alfabetizado'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['vit_grau_inst'].isin(['POS-GRADUACAO/ESPECIALIZACAO','MESTRADO']), 'vit_grau_inst'] = 'Pós-graduação/Especialização'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['vit_grau_inst'].isin(['NAO INFORMADO']), 'vit_grau_inst'] = 'Não informado'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['vit_grau_inst'].isin(['PREJUDICADO']), 'vit_grau_inst'] = 'Prejudicado'



In [37]:
crimes_selecionados_para_df.vit_grau_inst.value_counts()

vit_grau_inst
Médio completo                  56835
Fundamental incompleto          49824
Não informado                   30865
Médio incompleto                19478
Superior completo               18521
Fundamental completo            17170
Prejudicado                     11620
Superior incompleto              9653
Não alfabetizado                 3190
Pós-graduação/Especialização       15
PJ, EP E OUTROS                     2
Name: count, dtype: int64

- Grau de relacionamento

In [52]:
crimes_selecionados_para_df.grau_de_relacionamento.unique()

array(['FILHO(A)', 'NAO INFORMADO', 'EX-COMPANHEIRO(A)', 'COMPANHEIRO(A)',
       'NAMORADO(A)', 'PAI', 'PRIMO(A)', 'PADRASTO', 'TIO(A)', 'IRMAO(A)',
       'VIZINHO(A)', 'AMIGO(A)', 'AVO(A)', 'CONHECIDO(A)', 'NETO(A)',
       'CUNHADO(A)', 'SOGRO(A)', 'EX-PADRASTO', 'SOBRINHO(A)', 'GENRO',
       'MAE', 'EX-NAMORADO(A)', 'PADRINHO', 'ENTEADO(A)', 'MADRASTA',
       'EX-NORA', 'ESPOSO(A)', 'EX-SOGRO(A)', 'NORA',
       'PARENTESCO POR AFINIDADE', 'PREJUDICADO', 'EX-MADRASTA',
       'EX-GENRO', 'C', 'MARIDO', 'MADRINHA', 'PAI DO PADRASTO', 'CHEFE',
       'PROFESSOR(A)', 'CUNH0', 'EX-AMANTE', 'EX COMPANHEIRO(A)',
       'PREJUDCIADO', 'ERICK SANTOS SOUSA', 'EX-CHEFE', 'AFILHADO(A)',
       'EX-ENTEADO(A)', 'S', 'PERJUDICADO', 'PARDA',
       '00531/2023.100070-6', 'PREJUDICAOD', 'DESCONHECIDO(A)', 'EX',
       '66666', 'UNIAO ESTAVEL', '1º GRAU COMPLETO (ENSINO FUNDAMENTAL)',
       'EX-NAMORADO', 'IRMAO(A0'], dtype=object)

In [121]:
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['grau_de_relacionamento'].isin(['COMPANHEIRO(A)']), 'grau_de_relacionamento'] = 'Companheiro(a)'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['grau_de_relacionamento'].isin(['EX-COMPANHEIRO(A)']), 'grau_de_relacionamento'] = 'Ex-companheiro(a)'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['grau_de_relacionamento'].isin(['IRMAO(A)','IRMAO(A0']), 'grau_de_relacionamento'] = 'Irmão(ã)'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['grau_de_relacionamento'].isin(['VIZINHO(A)']), 'grau_de_relacionamento'] = 'Vizinho(a)'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['grau_de_relacionamento'].isin(['PADRASTO']), 'grau_de_relacionamento'] = 'Padrasto'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['grau_de_relacionamento'].isin(['TIO(A)']), 'grau_de_relacionamento'] = 'Tio(a)'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['grau_de_relacionamento'].isin(['PAI']), 'grau_de_relacionamento'] = 'Pai'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['grau_de_relacionamento'].isin(['NAMORADO(A)']), 'grau_de_relacionamento'] = 'Namorado(a)'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['grau_de_relacionamento'].isin(['EX-NAMORADO(A)']), 'grau_de_relacionamento'] = 'Ex-namorado(a)'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['grau_de_relacionamento'].isin(['PREJUDICADO']), 'grau_de_relacionamento'] = 'Prejudicado'

In [57]:
crimes_selecionados_para_df.grau_de_relacionamento.value_counts().head(10)

grau_de_relacionamento
NAO INFORMADO        153320
Companheiro(a)        21278
Ex-companheiro(a)     17210
Prejudicado            2952
Padrasto               2881
Irmão(ã)               2720
Pai                    1937
Tio(a)                 1844
Vizinho(a)             1700
Namorado(a)            1630
Name: count, dtype: int64

- Cor da pele da vitima

In [58]:
crimes_selecionados_para_df.vit_cor_pele.value_counts()

vit_cor_pele
PREJUDICADO    208179
PARDA            7828
PRETA             666
BRANCA            482
INDIGENA           13
AMARELA             5
Name: count, dtype: int64

In [122]:
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['vit_cor_pele'].isin(['PARDA']), 'vit_cor_pele'] = 'Parda'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['vit_cor_pele'].isin(['BRANCA']), 'vit_cor_pele'] = 'Branca'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['vit_cor_pele'].isin(['PRETA']), 'vit_cor_pele'] = 'Preta'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['vit_cor_pele'].isin(['INDIGENA']), 'vit_cor_pele'] = 'Indígena'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['vit_cor_pele'].isin(['AMARELA']), 'vit_cor_pele'] = 'Amarela'


- Causas

In [61]:
crimes_selecionados_para_df.causa_presumivel.value_counts().head(10)

causa_presumivel
OUTRAS                                   106239
ÓDIO OU VINGANÇA                          59672
CIÚME                                     16366
ALCOOLISMO / EMBRIAGUEZ                   10866
DEVASSIDÃO                                 9444
IMPERÍCIA / IMPRUDÊNCIA / NEGLIGÊNCIA      7033
AMBIÇÃO                                    5073
ENTORPECENTES                              1188
ALIENACAO                                   771
ACIDENTAL                                   473
Name: count, dtype: int64

In [123]:
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['causa_presumivel'].isin(['OUTRAS']), 'causa_presumivel'] = 'Outras causas'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['causa_presumivel'].isin(['ÓDIO OU VINGANÇA']), 'causa_presumivel'] = 'Ódio/Vingança'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['causa_presumivel'].isin(['IMPERÍCIA / IMPRUDÊNCIA / NEGLIGÊNCIA']), 'causa_presumivel'] = 'Crime culposo'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['causa_presumivel'].isin(['CIÚME']), 'causa_presumivel'] = 'Ciúme'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['causa_presumivel'].isin(['DEVASSIDÃO']), 'causa_presumivel'] = 'Devassidão'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['causa_presumivel'].isin(['ALCOOLISMO / EMBRIAGUEZ']), 'causa_presumivel'] = 'Alcoolismo/Embriaguez'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['causa_presumivel'].isin(['AMBIÇÃO']), 'causa_presumivel'] = 'Ambição'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['causa_presumivel'].isin(['ENTORPECENTES']), 'causa_presumivel'] = 'Entorpecentes'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['causa_presumivel'].isin(['ALIENACAO']), 'causa_presumivel'] = 'Alienação'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['causa_presumivel'].isin(['ACIDENTAL']), 'causa_presumivel'] = 'Acidental'


- Meio emppregado

In [66]:
crimes_selecionados_para_df.meio_empregado_sisp.value_counts().head(10)

meio_empregado_sisp
OUTROS MEIOS                   115913
SEM INSTRUMENTO                 82390
ARMA CORTANTE OU PERFURANTE      7767
ARMA CONTUNDENTE                 4959
ARMA DE FOGO                     2646
ARMA PERFURO CORTANTE            2240
AUTOMOVEL DE PASSEIO              296
MOTOCICLETA                       273
ONIBUS                            260
FOGO                              190
Name: count, dtype: int64

In [124]:
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['meio_empregado_sisp'].isin(['OUTROS MEIOS']), 'meio_empregado_sisp'] = 'Outros meios'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['meio_empregado_sisp'].isin(['SEM INSTRUMENTO']), 'meio_empregado_sisp'] = 'Sem instrumento'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['meio_empregado_sisp'].isin(['ARMA CORTANTE OU PERFURANTE']), 'meio_empregado_sisp'] = 'Arma cortante/perfurante'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['meio_empregado_sisp'].isin(['ARMA CONTUNDENTE']), 'meio_empregado_sisp'] = 'Arma contundente'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['meio_empregado_sisp'].isin(['ARMA PERFURO CORTANTE']), 'meio_empregado_sisp'] = 'Arma perfuro cortante'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['meio_empregado_sisp'].isin(['ARMA DE FOGO']), 'meio_empregado_sisp'] = 'Arma de fogo'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['meio_empregado_sisp'].isin(['AUTOMOVEL DE PASSEIO']), 'meio_empregado_sisp'] = 'Automóvel de passeio'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['meio_empregado_sisp'].isin(['ONIBUS']), 'meio_empregado_sisp'] = 'Ônibus'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['meio_empregado_sisp'].isin(['MOTOCICLETA']), 'meio_empregado_sisp'] = 'Motocicleta'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['meio_empregado_sisp'].isin(['AUTOMOVEL COMERCIAL']), 'meio_empregado_sisp'] = 'Automóvel comercial'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['meio_empregado_sisp'].isin(['FOGO']), 'meio_empregado_sisp'] = 'Fogo'


- Bairros, municipios, distritos e regiões

In [72]:
crimes_selecionados_para_df.bairros.value_counts().head(15)

bairros
BAIRRO CENTRAL           19052
CENTRO                   18278
CIDADE NOVA               4038
GUAMA                     3320
PEDREIRA                  3051
CENTRO DE PARAUAPEBAS     2798
JURUNAS                   2528
MARAMBAIA                 2521
TAPANA                    2469
MARCO                     2366
ZONA RURAL                2274
NOVA MARABA               2017
ABAETETUBA                1993
ICUI-GUAJARA              1799
SACRAMENTA                1708
Name: count, dtype: int64

In [125]:
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['bairros'].isin(['GUAMA']), 'bairros'] = 'Guamá'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['bairros'].isin(['PEDREIRA']), 'bairros'] = 'Pedreira'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['bairros'].isin(['JURUNAS']), 'bairros'] = 'Jurunas'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['bairros'].isin(['TAPANA']), 'bairros'] = 'Tapanã'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['bairros'].isin(['MARAMBAIA']), 'bairros'] = 'Marambaia'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['bairros'].isin(['MARCO']), 'bairros'] = 'Marco'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['bairros'].isin(['SACRAMENTA']), 'bairros'] = 'Sacramenta'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['bairros'].isin(['CONDOR']), 'bairros'] = 'Condor'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['bairros'].isin(['TERRA FIRME']), 'bairros'] = 'Terra firme'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['bairros'].isin(['PARQUE VERDE']), 'bairros'] = 'Parque Verde'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['bairros'].isin(['TELEGRAFO']), 'bairros'] = 'Telégrafo'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['bairros'].isin(['COQUEIRO']), 'bairros'] = 'Coqueiro'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['bairros'].isin(['UMARIZAL']), 'bairros'] = 'Umarizal'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['bairros'].isin(['TENONE']), 'bairros'] = 'Tenoné'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['bairros'].isin(['MANGUEIRAO']), 'bairros'] = 'Mangueirão'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['bairros'].isin(['BAIRRO CENTRAL']), 'bairros'] = 'Bairro central'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['bairros'].isin(['CENTRO','CENTRO DE PARAUAPEBAS']), 'bairros'] = 'Bairro central'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['bairros'].isin(['CIDADE NOVA']), 'bairros'] = 'Cidade Nova'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['bairros'].isin(['ABAETETUBA']), 'bairros'] = 'Abaetetuba'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['bairros'].isin(['ICUI-GUAJARA','Icui_Guajara']), 'bairros'] = 'Icui Guajara'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['bairros'].isin(['ZONA RURAL']), 'bairros'] = 'Zona rural'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['bairros'].isin(['NOVA MARABA']), 'bairros'] = 'Nova maraba'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['bairros'].isin(['COQUEIRO ANANINDEUA']), 'bairros'] = 'Coqueiro'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['bairros'].isin(['CENTRO DE ANANINDEUA']), 'bairros'] = 'Centro de Ananindeua'

In [102]:
crimes_selecionados_para_df.bairros.value_counts().head(15)

bairros
Bairro central          40128
Cidade Nova              4038
Guamá                    3320
Coqueiro                 3162
Pedreira                 3051
Jurunas                  2528
Marambaia                2521
Tapanã                   2469
Marco                    2366
Zona rural               2274
Nova maraba              2017
Abaetetuba               1993
Icui Guajara             1799
Sacramenta               1708
Centro de Ananindeua     1627
Name: count, dtype: int64

In [103]:
crimes_selecionados_para_df.distrito.value_counts().head(15)

distrito
BELEM          38258
ANANINDEUA     16801
SANTAREM       10095
ICOARACI        8556
MARABA          6790
PARAUAPEBAS     5997
CASTANHAL       4956
ABAETETUBA      4153
ALTAMIRA        3822
BARCARENA       3626
ITAITUBA        3538
MARITUBA        3150
TUCURUI         2918
ORIXIMINA       2850
CAMETA          2772
Name: count, dtype: int64

In [126]:
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['distrito'].isin(['BELEM']), 'distrito'] = 'Belém'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['distrito'].isin(['ANANINDEUA']), 'distrito'] = 'Ananindeua'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['distrito'].isin(['SANTAREM']), 'distrito'] = 'Santarém'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['distrito'].isin(['ICOARACI']), 'distrito'] = 'Icoaraci'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['distrito'].isin(['MARABA']), 'distrito'] = 'Marabá'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['distrito'].isin(['PARAUAPEBAS']), 'distrito'] = 'Parauapebas'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['distrito'].isin(['CASTANHAL']), 'distrito'] = 'Castanhal'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['distrito'].isin(['ABAETETUBA']), 'distrito'] = 'Abaetetuba'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['distrito'].isin(['ALTAMIRA']), 'distrito'] = 'Altamira'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['distrito'].isin(['BARCARENA']), 'distrito'] = 'Barcarena'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['distrito'].isin(['ITAITUBA']), 'distrito'] = 'Itaituba'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['distrito'].isin(['MARITUBA']), 'distrito'] = 'Marituba'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['distrito'].isin(['TUCURUI']), 'distrito'] = 'Tucuruí'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['distrito'].isin(['ORIXIMINA']), 'distrito'] = 'Oriximiná'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['distrito'].isin(['CAMETA']), 'distrito'] = 'Cametá'

In [106]:
crimes_selecionados_para_df.municipios.value_counts().head(15)

municipios
BELEM          49978
ANANINDEUA     16802
SANTAREM       10251
MARABA          6806
PARAUAPEBAS     5999
CASTANHAL       4966
ABAETETUBA      4166
ALTAMIRA        3829
BARCARENA       3792
ITAITUBA        3583
MARITUBA        3249
TUCURUI         2926
ORIXIMINA       2889
CAMETA          2831
REDENCAO        2760
Name: count, dtype: int64

In [127]:
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['municipios'].isin(['BELEM']), 'municipios'] = 'Belém'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['municipios'].isin(['ANANINDEUA']), 'municipios'] = 'Ananindeua'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['municipios'].isin(['SANTAREM']), 'municipios'] = 'Santarém'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['municipios'].isin(['ICOARACI']), 'municipios'] = 'Icoaraci'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['municipios'].isin(['MARABA']), 'municipios'] = 'Marabá'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['municipios'].isin(['PARAUAPEBAS']), 'municipios'] = 'Parauapebas'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['municipios'].isin(['CASTANHAL']), 'municipios'] = 'Castanhal'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['municipios'].isin(['ABAETETUBA']), 'municipios'] = 'Abaetetuba'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['municipios'].isin(['ALTAMIRA']), 'municipios'] = 'Altamira'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['municipios'].isin(['BARCARENA']), 'municipios'] = 'Barcarena'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['municipios'].isin(['ITAITUBA']), 'municipios'] = 'Itaituba'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['municipios'].isin(['MARITUBA']), 'municipios'] = 'Marituba'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['municipios'].isin(['TUCURUI']), 'municipios'] = 'Tucuruí'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['municipios'].isin(['ORIXIMINA']), 'municipios'] = 'Oriximiná'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['municipios'].isin(['CAMETA']), 'municipios'] = 'Cametá'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['municipios'].isin(['REDENCAO']), 'municipios'] = 'Redenção'


In [111]:
crimes_selecionados_para_df.regionais.value_counts().head(15)

regionais
CAPITAL             49978
BAIXO AMAZONAS      23063
METROPOLITANA       22832
CARAJAS             20088
GUAMA               18687
TOCANTINS           17342
CAETE               12400
XINGU                8764
LAGO DE TUCURUI      8409
MARAJO OCIDENTAL     7361
TAPAJOS              6756
ARAGUAIA             6508
MARAJO ORIENTAL      6070
CAPIM                4700
ALTO XINGU           4202
Name: count, dtype: int64

In [128]:
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['regionais'].isin(['CAPITAL']), 'regionais'] = 'Capital'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['regionais'].isin(['BAIXO AMAZONAS']), 'regionais'] = 'Baixo Amazonas'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['regionais'].isin(['METROPOLITANA']), 'regionais'] = 'Região Metropolitana'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['regionais'].isin(['CARAJAS']), 'regionais'] = 'Carajás'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['regionais'].isin(['GUAMA']), 'regionais'] = 'Guamá'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['regionais'].isin(['TOCANTINS']), 'regionais'] = 'Tocantins'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['regionais'].isin(['CAETE']), 'regionais'] = 'Caeté'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['regionais'].isin(['XINGU']), 'regionais'] = 'Xingu'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['regionais'].isin(['LAGO DE TUCURUI']), 'regionais'] = 'Lago de Tucuruí'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['regionais'].isin(['MARAJO OCIDENTAL']), 'regionais'] = 'Marajó Ocidental'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['regionais'].isin(['TAPAJOS']), 'regionais'] = 'Tapajós'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['regionais'].isin(['ARAGUAIA']), 'regionais'] = 'Araguaia'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['regionais'].isin(['MARAJO ORIENTAL']), 'regionais'] = 'Marajó Oriental'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['regionais'].isin(['CAPIM']), 'regionais'] = 'Capim'
crimes_selecionados_para_df.loc[crimes_selecionados_para_df['regionais'].isin(['ALTO XINGU']), 'regionais'] = 'Alto Xingu'

In [129]:
crimes_selecionados_para_df.regionais.value_counts().head(15)

regionais
Capital                 49978
Baixo Amazonas          23063
Região Metropolitana    22832
Carajás                 20088
Guamá                   18687
Tocantins               17342
Caeté                   12400
Xingu                    8764
Lago de Tucuruí          8409
Marajó Ocidental         7361
Tapajós                  6756
Araguaia                 6508
Marajó Oriental          6070
Capim                    4700
Alto Xingu               4202
Name: count, dtype: int64

### 3. Visualizções

* **Tipos de violência mais frequentes**

Para uma melhor visualização, alguns crimes da coluna "consolidado" serão agrupados de acordo com  tipo de violência contra a mulher

A Lei Maria da Penha (Lei nº 11.340/2006) classifica e especifica os tipos de violência domestica contra a mulher, e o Art. 7º enumera algumas das formas de violências que as mulheres podem sofrer. São elas, dentre outras, as violências física, psicológica, sexual, patrimonial ou sexual.

Portanto os crimes serão agrupados da seguinte forma:
1. **Violência Física:**
    - Lesão corporal
    - Homicídio
    - Tentativa de homicídio
    - Tentativa de feminicídio
    - Violência física
    - Feminicídio
2. **Violência Sexual:**
    - Estupro de vulnerável
    - Importunação sexual
    - Assédio sexual
    - Violência sexual
    - Estupro
    - Violação sexual
3. **Violência Psicológica/Emocional:**
    - Violência psicológica
    - Assédio
    - Ameaça
4. **Violência patrimonial:**
    - Violência patrimonial
5. Violência moral:
    - Violência moral
6. **Outros:**
    - Descumprimento de medidas protetivas
    - Descumprimento de medidas protetivas de urgência
    - Violência doméstica

In [130]:
if not os.path.exists("imagens_svg_estado"):
    os.mkdir("imagens_svg_estado")

In [144]:
custom_palette= ['#BA1F4C','#9373AE','#41A7C4','#D68E4A','#889684',
                 '#96C84E','#352DA7','#691D73', '#D4BE8E','#386E0D', 
                 '#BF4F7F', '#AC3516','#3A6CC6','#295A96','#DBB1C3']

In [136]:
tipos_crimes = crimes_selecionados_para_df.copy()

mapeamento_crimes = {
    'Lesão corporal': 'Violência física',
    'Homicídio': 'Violência física',
    'Feminicídio': 'Violência física',
    'Tentativa de homicídio': 'Violência física',
    'Tentativa de feminicídio': 'Violência física',
    'Violência física': 'Violência física',

    'Estupro': 'Violência sexual',
    'Estupro de vulnerável': 'Violência sexual',
    'Importunação sexual': 'Violência sexual',
    'Assédio sexual': 'Violência sexual',
    'Violação sexual': 'Violência sexual',
    'Violência sexual': 'Violência sexual',
    'Exploração sexual infantil': 'Violência sexual',
    'Divulgação de cena de estupro': 'Violência sexual',


    'Ameaça': 'Violência psicológica',
    'Violência psicológica': 'Violência psicológica',
    'Assédio': 'Violência psicológica',

    'Violência patrimonial': 'Violência patrimonial',

    'Violência moral': 'Violência moral',

    'Descumprimento de medidas protetivas': 'Outros',
    'Descumprimento de medidas protetivas de urgência': 'Outros',
    'Violência doméstica': 'Outros'
}

tipos_crimes['Tipos'] = tipos_crimes['consolidado'].map(mapeamento_crimes)

frequencia_crimes = tipos_crimes['Tipos'].value_counts()

In [149]:
frequencia_crimes = tipos_crimes['Tipos'].value_counts(normalize=True) * 100

In [150]:
frequencia_crimes

Tipos
Violência psicológica    52.915693
Violência física         32.183924
Violência sexual         11.515294
Outros                    2.972611
Violência moral           0.306478
Violência patrimonial     0.106000
Name: proportion, dtype: float64

In [148]:
fig = go.Figure(data=[go.Pie(labels=frequencia_crimes.index, values=frequencia_crimes.values,marker=dict(colors=custom_palette))])

fig.update_layout(#title= 'Tipos de crime mais frequentes contra a mulher',
                  scene=dict(aspectmode="cube"),
                  width=650,  
                  height=400,margin=dict(l=10, r=10, t=10, b=10),
        plot_bgcolor='#FFF5EE',paper_bgcolor='white', legend=dict(bgcolor='#FFF5EE', x=1.11, y=0.93), font=dict(size=15))

fig.update_traces(marker=dict(line=dict(color='white', width=2)),
                  textfont=dict(size=15))

py.iplot(fig)

fig.write_image("Crimes no estado/imagens_svg_estado/tipos_violencia.svg")

ValueError: 
Image export using the "kaleido" engine requires the kaleido package,
which can be installed using pip:
    $ pip install -U kaleido
