# Uma análise sobre crimes violentos letais intencionais (CVLI)

De acorco com a **Secretaria de Defesa Social (SDS)** do estado de Pernambuco CVLI é um indicador constituído pelos crimes de homicídio doloso, latrocínio e lesão corporal seguida de morte. Tal indicador é importante para dimensionar os casos de letalidade intencional. Estes dados são coletados diariamente no IML, Polícia Científica, Coordenação de Plantão da Polícia Civil, Serviço de inteligência da PMPE e CIODS, sendo analisados e consolidados pela Gerência de Análise Criminal e Estatística (GACE) até o 15º do mês subsequente.

A base de dados disponiblizada na [SDS](https://www.sds.pe.gov.br/estatisticas/51-avulsas/51-indicadores-criminais-em-pernambuco-3), apresenta informações detalhadas sobre os CVLI's, contendo uma granulação ao nível de Município, Região Geográfica, Sexo, natureza Jurídica, Data, Ano, Idade e Total de Vítimas. Sendo assim, com essa análise buscamos compreender a evoução histórica e entender algumas correlações deste tipo de crime.

## Perguntas para a Análise

  1. Qual a evolução histórica de CVLI em Pernambuco?
  2. Qual a incidência de CVLI por sexo?
  3. Qual a incidência de CVLI por Idade?
  4. Existe um aumento na ocorrência de Feminicídio? 
  5. Existe um aumento na ocorrência de CVLI contra a mulher?
  6. Com base no CVLI, qual a Cidade mais violenta do Estado?   

In [1]:
# Bibliotecas
import pandas as pd
from datetime import datetime

import plotly.express as px

In [2]:
# Dataset imports

today = datetime.today()
months = {
    "1": "JAN",
    "2": "FEB",
    "3": "MAR",
    "4": "ABR",
    "5": "MAI",
    "6": "JUN",
    "7": "JUL",
    "8": "AGO",
    "9": "SET",
    "10": "OUT",
    "11": "NOV",
    "12": "DEZ"
}

try:
    if today.day < 15:
        month = months.get(str(today.month - 2))    
    else:
        month = months.get(str(today.month - 1))
    cvli = pd.read_excel(f"https://www.sds.pe.gov.br/images/indicadores/CVP/MICRODADOS_DE_CVLI_JAN_2004_A_{month}_2022.xlsx", sheet_name="Plan1", engine='openpyxl')
    cvli.rename(columns={'NATUREZA JURIDICA': 'NATUREZA_JURIDICA', 'TOTAL DE VITIMAS': 'TOTAL_DE_VITIMAS'}, inplace=True)
    print(f"##### Trabalhando com dados atualizados em {month} de {today.year} #####")
except:
    print("Exception!")
    cvli = pd.read_excel("dataset/MICRODADOS_DE_CVLI_JAN_2004_A_ABR_2022.xlsx", sheet_name="Plan1", engine='openpyxl')
    
      

##### Trabalhando com dados atualizados em MAI de 2022 #####


## Entendendo os dados

In [3]:
cvli.head()

Unnamed: 0,MUNICIPIO,REGIAO_GEOGRAFICA,SEXO,NATUREZA_JURIDICA,DATA,ANO,IDADE,TOTAL_DE_VITIMAS
0,BUENOS AIRES,ZONA DA MATA,MASCULINO,HOMICIDIO,2004-01-01,2004,,1
1,CAMARAGIBE,REGIÃO METROPOLITANA,FEMININO,HOMICIDIO,2004-01-01,2004,,1
2,CARUARU,AGRESTE,MASCULINO,HOMICIDIO,2004-01-01,2004,,2
3,CORRENTES,AGRESTE,MASCULINO,HOMICIDIO,2004-01-01,2004,,1
4,ESCADA,ZONA DA MATA,MASCULINO,HOMICIDIO,2004-01-01,2004,,1


In [4]:
cvli.describe()

Unnamed: 0,ANO,IDADE,TOTAL_DE_VITIMAS
count,71375.0,67256.0,71375.0
mean,2012.678375,29.979719,1.029002
std,5.310668,12.052247,0.250702
min,2004.0,1.0,1.0
25%,2008.0,21.0,1.0
50%,2013.0,27.0,1.0
75%,2017.0,36.0,1.0
max,2022.0,99.0,9.0


In [5]:
cvli.dtypes

MUNICIPIO                    object
REGIAO_GEOGRAFICA            object
SEXO                         object
NATUREZA_JURIDICA            object
DATA                 datetime64[ns]
ANO                           int64
IDADE                       float64
TOTAL_DE_VITIMAS              int64
dtype: object

In [29]:
cvli["MES"] = cvli["DATA"].apply(lambda x: x.month)

## Visualização dos dados

In [37]:
cvli_ano = cvli.groupby(["ANO", "SEXO"]).sum().reset_index()
cvli_mes = cvli.groupby(["ANO", "MES", "SEXO"]).sum().reset_index()

In [33]:
fig = px.line(cvli_ano, x = "ANO", y = "TOTAL_DE_VITIMAS", color="SEXO")
fig.show()

In [38]:
fig = px.line(cvli_mes, x = "MES", y = "TOTAL_DE_VITIMAS", color="ANO")
fig.show()