### Análise exploratória sobre o número de assassinatos nos estados brasileiros

* O conjunto de dados de segurança pública utilizado nesta análise exploratória foi retirado do site do Ministério da Justiça.   

* Utilizamos a segunda aba do arquivo onde contém informações sobre a quantidade de mortes em cada estado do Brasil entre o período de 2015 a 2022. As mortes estão divididas em 3 categorias de crimes.   

* O objetivo dessa análise é levantar algumas perguntas sobre a quantidade de assassinatos no Brasil e extrair informações úteis a partir delas. 

* Obs.: O dataset não possui dados sobre as vitimas do estado de São Paulo no ano de 2015 e, aparentemente, também faltam mais dados sobre as vitimas do ano de 2016. Além disso, alguns dos estados podem não ter dados sobre alguns meses.

* Fonte do conjunto de dados: https://dados.mj.gov.br/dataset/sistema-nacional-de-estatisticas-de-seguranca-publica

### Importando as bibliotecas

In [1]:
import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
from matplotlib import gridspec
import seaborn as sns

### Importando o dataset

In [2]:
data = pd.read_excel('indicadoressegurancapublicauf.xlsx', sheet_name=1)
data.rename(columns={'Sexo da Vítima': 'sexo', 'Tipo Crime': 'tipo_crime',
                    'Ano': 'ano', 'Mês':'mes', 'UF':'uf', 'Vítimas': 'vitimas'}, inplace = True)

### Visualizando o dataset

In [3]:
data.head()

In [4]:
data.tail()

In [5]:
data.describe()

In [6]:
data.info()

### Quais são os tipos de crimes descritos no dataset?

In [7]:
print(data['tipo_crime'].unique())

### Qual o total de vítimas de cada categoria?

In [8]:
vitimas_num = data[['tipo_crime', 'vitimas']].groupby('tipo_crime').sum().reset_index()
vitimas_num

### Qual o total de vítimas de cada categoria a cada ano?

In [9]:
vitimas_num_ano = data[['tipo_crime', 'vitimas', 'ano']].groupby(['ano', 'tipo_crime']).sum()
vitimas_num_ano

### Qual foi o ano que tiveram menos homicídios dolosos e o ano que tiveram mais?

In [10]:
# 2022 foi o ano com o menor número de homicídios dolosos (28.856) e 2017 foi o ano com o 
# maior número (55.950)

### Qual o estado com a maior quantidade de vítimas e o estado com a menor?

In [11]:
data_vit_uf = data[['uf', 'vitimas']].groupby('uf').sum().sort_values('vitimas', ascending=True).reset_index()
data_vit_uf

In [12]:
# Roraima teve a menor quantidade de vítimas (1.575), já a Bahia teve a maior quantidade (45.402)

### ---- Agora vamos visualizar de forma gráfica ----

### O número de vítimas aumentou ou diminuiu ao longo do tempo?

In [13]:
# Vamos visualizar com dois tipos de gráficos diferentes

vitimas_ano_line = data[['ano', 'vitimas']].groupby('ano').sum() 
vitimas_ano_bar = data[['ano', 'vitimas']].groupby('ano').sum().reset_index()

fig = plt.figure(figsize=(12, 6))
specs = gridspec.GridSpec(ncols=2, nrows=1, figure=fig)

ax1 = fig.add_subplot(specs[:, 0])
ax2 = fig.add_subplot(specs[:, 1])

# Primeiro gráfico
ax1 = sns.lineplot(x='ano', y='vitimas', data=vitimas_ano_line, ax=ax1)

# Segundo gráfico
ax2 = sns.barplot(x='ano', y='vitimas', data=vitimas_ano_bar, ax=ax2)


### Quem morreu mais ao longo dos anos, homens ou mulheres?

In [14]:
vitimas_genero = data[['sexo', 'vitimas']].groupby('sexo').sum().reset_index()
vitimas_genero

### Agora com porcentagem

In [15]:
total_vitimas = vitimas_genero['vitimas'].sum()
vitimas_genero['Porcentagem'] = vitimas_genero['vitimas'].apply(lambda x: round(x/total_vitimas * 100, 2))
vitimas_genero

In [16]:
fig = plt.figure(figsize=(12, 6))
ax = sns.barplot(x='sexo', y='vitimas', data=vitimas_genero);
ax.bar_label(ax.containers[0])

In [17]:
# Homens estão entre o maior número de vítimas

### Quantidade de vítimas por estados

In [18]:
new_data_vit_uf = data[['uf', 'vitimas']].groupby('uf').sum().reset_index()
fig = plt.figure(figsize=(15, 9))
sns.barplot(x='uf', y='vitimas', data=new_data_vit_uf);
plt.xticks(rotation=60);

### Avaliando o número de vítimas de cada estado ao longo dos anos

In [21]:
data_uf_ano = data[['uf', 'vitimas', 'ano']].groupby(['uf', 'ano']).sum()

ax = data_uf_ano.unstack(level=0).plot(kind='bar', legend=None, subplots=True, rot=45,
                                       figsize=(15, 25), layout=(7, 4))
# Ajuste o espaço entre os subgráficos
plt.subplots_adjust(wspace=0.5, hspace=0.7)

# Defina os limites do eixo y para todos os subgráficos
y_max = data_uf_ano.max().max()
for ax_row in ax:
    for ax_col in ax_row:
        ax_col.set_ylim(0, y_max)
        
# Ajuste a disposição dos subgráficos        
plt.tight_layout();

### Avaliando o número de vítimas por mês no Rio de Janeiro

In [20]:
data_vit_rj = data.loc[data['uf'] == 'Rio de Janeiro', ['ano', 'mes', 'vitimas']].groupby(['ano', 'mes'],
sort=False).sum()

ax = data_vit_rj.unstack(level=0).plot(kind='bar', legend = None, subplots=True, rot=60, figsize=(12, 12), layout=(3, 3))

# Defina os limites do eixo y para todos os subgráficos
y_max = data_vit_rj.max().max()
for ax_row in ax:
    for ax_col in ax_row:
        ax_col.set_ylim(0, y_max)

plt.tight_layout()

### Conclusões

* 2017 foi o ano em que ocorreram a maior quantidade de homicídios dolosos no Brasil e 2022 foi o ano com o menor número.

* Roraima foi o Estado com a menor quantidade de vítimas durante esse período, já a Bahia foi o estado com a maior quantidade.

* Houve uma redução considerável no número de vítimas do começo do período até o final.

* Homens correspondem a cerca de 88% das vítimas, enquanto mulheres correspondem a cerca de 8%.

* A maioria dos estados mostrou uma redução na quantidade de vítimas ao longo do período.

* No estado do Rio de Janeiro, ao longo dos anos, pode-se observar que a quantidade de vítimas era menor na metade do ano, entre os períodos de maio a agosto.

* Importante lembrar que apenas esse conjunto de dados não basta para definir quais são os estados mais e menos violentos. Para isso, normalmente utiliza-se a taxa de homicídios por 100 mil habitantes. Ex.: Pega-se o número de vítimas em um estado naquele ano, divide pelo total da população do estado no mesmo ano e em seguida multiplica por 100 mil.