<a href="https://colab.research.google.com/github/kaiquefreire05/analise-ocorrencias-criminais/blob/main/an%C3%A1lise_ocorr%C3%AAncias_criminais.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Analisando ocorrências criminais por UF (Unidade de federação)

A violência e a criminalidade são problemas complexos que afetam a sociedade brasileira há décadas. Esses problemas têm consequências graves para a vida das pessoas, incluindo perdas humanas, danos materiais e prejuízos econômicos.

Para compreender melhor esses problemas e desenvolver políticas públicas mais eficazes para combatê-los, é importante realizar análises de dados.

Neste projeto, vamos analisar um dataset de ocorrências criminais por unidade federativa no Brasil.

A análise dos dados nos permitirá:

* Identificar tendências e padrões de criminalidade no Brasil;

* Comparar a situação de diferentes unidades federativas em relação à criminalidade;

* Propor hipóteses sobre os fatores que podem contribuir para a criminalidade; Avaliar a eficácia de políticas públicas de segurança pública.

# Coleta dos dados

O dataset foi disponibilizado pelo Ministério da Justiça e Segurança Pública e contém informações sobre o número de ocorrências, natureza do fato registrado, perfil da vítima, perfil do autor, meios empregados, dentre outras.

# Objetivos

Os objetivos deste projeto são:

* Identificar as principais tendências e padrões de criminalidade no Brasil;

* Comparar a situação de diferentes unidades federativas em relação à criminalidade;

* Identificar fatores que podem contribuir para a criminalidade.

# Primeiros passos

## Importando bibliotecas que serão usadas

In [None]:
# Bibliotecas necessárias
import pandas as pd
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

## Fazendo a leitura da base de dados

In [None]:
# Fazendo leitura da base de dados
df = pd.read_excel('/content/drive/MyDrive/datasets/indicadoressegurancapublicauf.xlsx')

## Primeiras interações com a base de dados

In [None]:
# Verificando as 5 primeiras linhas
df.head()

Unnamed: 0,UF,Tipo Crime,Ano,Mês,Ocorrências
0,Acre,Estupro,2022,janeiro,31
1,Acre,Furto de veículo,2022,janeiro,50
2,Acre,Homicídio doloso,2022,janeiro,10
3,Acre,Lesão corporal seguida de morte,2022,janeiro,1
4,Acre,Roubo a instituição financeira,2022,janeiro,0


In [None]:
# Verificando as 5 últimas linhas
df.tail()

Unnamed: 0,UF,Tipo Crime,Ano,Mês,Ocorrências
23015,Tocantins,Roubo a instituição financeira,2015,dezembro,6
23016,Tocantins,Roubo de carga,2015,dezembro,1
23017,Tocantins,Roubo de veículo,2015,dezembro,55
23018,Tocantins,Roubo seguido de morte (latrocínio),2015,dezembro,2
23019,Tocantins,Tentativa de homicídio,2015,dezembro,42


In [None]:
# Visualizando o tamanho da base de dados
df.shape

(23020, 5)

# Visualização e descrição das colunas

In [None]:
# Verificando nome das colunas
df.columns

Index(['UF', 'Tipo Crime', 'Ano', 'Mês', 'Ocorrências'], dtype='object')

In [None]:
# Verificando o tipo de variável que a coluna armazena
df.dtypes

UF             object
Tipo Crime     object
Ano             int64
Mês            object
Ocorrências     int64
dtype: object

### Descrição:

**DF**

* `Tipo de dado:` objeto
* `Descrição`: Referente as 27 Unidades Federativas, sendo os 26 Estados acrescidos do Distrito Federal(DF), que é o local onde fica a capital do país.

**Tipo Crime**

* `Tipo de dado:` objeto
* `Descrição:` Representa o tipo de crime registrado na ocorrência. Os valores possíveis são os códigos dos crimes definidos pelo Código Penal Brasileiro.

**Ano**

* `Tipo de dado:` inteiro
* `Descrição:` Representa o ano da ocorrência criminal.

**Mês**

* `Tipo de dado:` objeto
* `Descrição:` Representa o mês da ocorrência criminal. Os valores possíveis são os nomes dos 12 meses do ano.

**Ocorrências**

* `Tipo de dado:` inteiro
* `Descrição:` Representa o número de ocorrências criminais registradas no mês e na unidade federativa especificados.

# Começando a análise dos dados

## Verificando o intervalo de tempo da base de dados

In [None]:
# Verificando a quantidade de anos que serão analisados
df['Ano'].unique()

array([2022, 2021, 2020, 2019, 2018, 2017, 2016, 2015])

## Conferindo as unidades federativas

In [None]:
df['UF'].unique

<bound method Series.unique of 0             Acre
1             Acre
2             Acre
3             Acre
4             Acre
           ...    
23015    Tocantins
23016    Tocantins
23017    Tocantins
23018    Tocantins
23019    Tocantins
Name: UF, Length: 23020, dtype: object>

## Verificando se existe valores ausentes

In [None]:
df.isnull().sum()

UF             0
Tipo Crime     0
Ano            0
Mês            0
Ocorrências    0
dtype: int64

# Começando a visualizar os dados

## Qual foi o ano com o maior e menor números de ocorrências?