### Estudo com Análise de Crimes de Ódio (2017-2025)

Objetivo da Análise
O objetivo é explorar o conjunto de dados sobre crimes de ódio para entender padrões, tendências e as principais características desses incidentes.

Perguntas a Serem Respondidas
    Antes de começar, vamos definir algumas perguntas que guiarão nossa análise:

Tendência Temporal: 
    Como o número de crimes de ódio evoluiu ao longo dos anos presentes no dataset?

Distribuição Geográfica: 
    Quais estados apresentam os maiores números de registros de crimes de ódio?

Motivações Principais:
    Quais são as motivações de preconceito (viés) mais comuns por trás desses crimes?

Tipos de Ofensa:
    Quais são os tipos de ofensa (crime) mais frequentemente reportados?

Relação Agência x Crimes:
    Existe alguma diferença significativa no número de crimes reportados por tipo de agência (ex: polícia da cidade, xerife do condado)?

#### Configuração do Ambiente e Carregamento dos Dados

In [None]:
# Importando as bibliotecas necessárias
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Configurando o estilo dos gráficos para melhor visualização
sns.set_style("whitegrid")
plt.rcParams['figure.figsize'] = (12, 6)

# Carregando o dataset
# Certifique-se de que o arquivo 'Hate_Crimes_2017-2025.csv' está na mesma pasta do seu notebook
# ou forneça o caminho completo para o arquivo.
try:
    df = pd.read_csv('Hate_Crimes_2017-2025.csv')
    print("Arquivo carregado com sucesso!")
except FileNotFoundError:
    print("Erro: Arquivo não encontrado. Verifique o nome e o caminho do arquivo.")

#### Análise Exploratória de Dados (EDA)

In [None]:
# 1. Visualizar as primeiras linhas do DataFrame
print("Amostra dos dados:")
display(df.head())

In [None]:
# 2. Obter informações sobre as colunas, tipos de dados e valores nulos
print("\nInformações do DataFrame:")
df.info()

In [None]:
# 3. Gerar estatísticas descritivas para as colunas numéricas
print("\nEstatísticas Descritivas:")
display(df.describe())

In [None]:
# 4. Verificar a contagem de valores nulos em cada coluna
print("\nContagem de valores nulos por coluna:")
print(df.isnull().sum())

In [None]:
# 5. Listar os nomes das colunas para facilitar a referência
print("\nNomes das colunas:")
print(df.columns)

#### Análises Gráficas para Responder às Perguntas

Pergunta 1: Como o número de crimes de ódio evoluiu ao longo dos anos?

In [None]:
# 1. Converter a coluna de data para o formato datetime
df['Date of Incident'] = pd.to_datetime(df['Date of Incident'])

# 2. Extrair o ano para uma nova coluna 'Year'
df['Year'] = df['Date of Incident'].dt.year

# 3. Agrupar os dados pela nova coluna 'Year'
crimes_por_ano = df.groupby('Year').size().reset_index(name='Total_Incidentes')

# Criando o gráfico de linhas
plt.figure(figsize=(12, 6))
sns.lineplot(data=crimes_por_ano, x='Year', y='Total_Incidentes', marker='o')

plt.title('Evolução do Número de Crimes de Ódio por Ano', fontsize=16)
plt.xlabel('Ano')
plt.ylabel('Número Total de Incidentes')
plt.xticks(crimes_por_ano['Year'])
plt.grid(True)
plt.show()

Pergunta 2: Quais estados apresentam os maiores números de registros?

In [None]:
# Contando os incidentes por Distrito do Conselho
crimes_por_distrito = df['Council District'].value_counts().nlargest(15).reset_index()
crimes_por_distrito.columns = ['Distrito', 'Total_Incidentes']

# Criando o gráfico de barras
plt.figure(figsize=(15, 8))
sns.barplot(data=crimes_por_distrito, x='Total_Incidentes', y='Distrito', palette='viridis', orient='h')

plt.title('Top 15 Distritos por Número de Crimes de Ódio Reportados', fontsize=16)
plt.xlabel('Número Total de Incidentes')
plt.ylabel('Distrito do Conselho')
plt.show()

Pergunta 3: Quais são as motivações de preconceito (viés) mais comuns?

In [None]:
# Contando os incidentes por tipo de motivação (usando a coluna 'Bias')
motivacao = df['Bias'].value_counts().nlargest(10).reset_index()
motivacao.columns = ['Motivacao', 'Total_Incidentes']

# Criando o gráfico de barras
plt.figure(figsize=(12, 8))
sns.barplot(data=motivacao, x='Total_Incidentes', y='Motivacao', palette='mako')

plt.title('Top 10 Motivações (Viés) para Crimes de Ódio', fontsize=16)
plt.xlabel('Número Total de Incidentes')
plt.ylabel('Tipo de Motivação')
plt.show()

Pergunta 4: Quais são os tipos de ofensa mais frequentemente reportados?

In [None]:
# Contando os incidentes por tipo de ofensa (usando a coluna 'Offense(s)')
tipo_ofensa = df['Offense(s)'].value_counts().nlargest(10).reset_index()
tipo_ofensa.columns = ['Tipo_de_Ofensa', 'Total_Incidentes']

# Criando o gráfico de barras
plt.figure(figsize=(12, 8))
sns.barplot(data=tipo_ofensa, x='Total_Incidentes', y='Tipo_de_Ofensa', palette='rocket')

plt.title('Top 10 Tipos de Ofensa em Crimes de Ódio', fontsize=16)
plt.xlabel('Número Total de Incidentes')
plt.ylabel('Ofensa')
plt.show()

Pergunta 5: Existe diferença no número de crimes reportados por tipo de agência?

In [None]:
# Agrupando por Setor Policial (usando 'APD Sector')
crimes_por_setor = df['APD Sector'].value_counts().reset_index()
crimes_por_setor.columns = ['Setor_Policial', 'Total_Incidentes']

# Criando o gráfico de barras
plt.figure(figsize=(14, 7))
sns.barplot(data=crimes_por_setor, x='Setor_Policial', y='Total_Incidentes', palette='cubehelix')

plt.title('Número de Crimes de Ódio Reportados por Setor Policial', fontsize=16)
plt.xlabel('Setor Policial (APD Sector)')
plt.ylabel('Número Total de Incidentes')
plt.xticks(rotation=45, ha='right')
plt.tight_layout()
plt.show()