# Análise Exploratória dos Dados de Homicídios


Neste notebook, realizaremos uma análise exploratória dos dados de homicídios nos municípios brasileiros. 
Os passos incluem:

1. Carregar os dados tratados.
2. Analisar estatísticas descritivas.
3. Visualizar distribuições e tendências.
        

In [None]:

# Importando bibliotecas necessárias
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Configurando estilo de gráficos
sns.set(style="whitegrid")

# Carregando os dados tratados
file_path = '../data/processed/homicidios_cleaned.csv'
df = pd.read_csv(file_path)

# Exibindo as primeiras linhas do dataset
df.head()
        

## Estatísticas Descritivas

In [None]:

# Estatísticas descritivas das colunas numéricas
df.describe()
        

## Distribuição da Taxa de Homicídios

In [None]:

# Histograma da taxa de homicídios por 100 mil habitantes
plt.figure(figsize=(10, 6))
sns.histplot(df['taxa_homicidios_100k'], kde=True, bins=15, color='blue')
plt.title("Distribuição da Taxa de Homicídios Estimados por 100 mil Habitantes")
plt.xlabel("Taxa de Homicídios")
plt.ylabel("Frequência")
plt.show()
        

## Correlação entre População e Taxa de Homicídios

In [None]:

# Gráfico de dispersão entre população e taxa de homicídios
plt.figure(figsize=(10, 6))
sns.scatterplot(x='populacao', y='taxa_homicidios_100k', data=df, color='green')
plt.title("População vs. Taxa de Homicídios Estimados")
plt.xlabel("População")
plt.ylabel("Taxa de Homicídios")
plt.show()
        

## Conclusões


Nesta análise exploratória, identificamos as distribuições e relações importantes dos dados:

- A maior parte das taxas de homicídios está concentrada em um intervalo específico.
- Há uma correlação muito fraca entre população e taxa de homicídios.

Nos próximos passos, analisaremos os quartis e realizaremos uma regressão linear para explorar mais insights.
        