In [None]:
# Importações Necessárias
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns
import folium


In [None]:
# Carregamento dos Dados
db = pd.read_csv("BaseDados/alterado.csv")

In [None]:
# Histograma de Idades dos Agressores
plt.figure(figsize=(5, 3))
dd = db['AGE']  # Extração da coluna de idades
plt.hist(dd, bins=10, range=(0, 100), color='#D3D3D3', edgecolor='black')
plt.title("Levantamento De Agressores Por Faixa Etária", fontsize=15, fontweight='bold')
plt.xlabel('Idade', fontsize=12)
plt.ylabel('Quantidade', fontsize=12)
plt.gca().spines['top'].set_visible(False)
plt.gca().spines['right'].set_visible(False)
plt.grid(color='gray', linestyle='--', linewidth=0.5, axis='y', alpha=0.7)
plt.show()

In [None]:
# Boxplot da Distribuição de Idades
db['AGE'] = pd.to_numeric(db['AGE'], errors='coerce')  # Conversão da coluna 'AGE' para numérico
plt.figure(figsize=(10, 6))
plt.boxplot(db['AGE'].dropna(), patch_artist=True, boxprops=dict(facecolor='#D3D3D3'), medianprops=dict(color="black"))
plt.title("Distribuição de Idades dos Agressores", fontsize=15, fontweight='bold')
plt.xticks([1], ['Idade'])
plt.ylabel('Idade', fontsize=12)
plt.gca().spines['top'].set_visible(False)
plt.gca().spines['right'].set_visible(False)
plt.grid(color='gray', linestyle='--', linewidth=0.5, axis='y', alpha=0.7)
plt.show()

In [None]:
# Gráfico de Barras de Agressores por Sexo
db['GENDER'].value_counts().plot.bar(figsize=(5, 4), color=['#D3D3D3', '#A9A9A9'], edgecolor='black')
plt.title("Levantamento de Agressores Por Sexo", fontsize=15, fontweight='bold', color="black")
plt.ylabel('Quantidade', fontsize=12)
plt.xticks(rotation=0, fontsize=11)
plt.yticks(fontsize=11)
plt.gca().spines['top'].set_visible(False)
plt.gca().spines['right'].set_visible(False)
plt.grid(color='gray', linestyle='--', linewidth=0.5, axis='y', alpha=0.7)
plt.show()

In [None]:
# Gráfico de Barras de Vítimas Menores
tt = db['VICTIM MINOR'].value_counts()
tt.plot.bar(figsize=(10, 6))
plt.title("Levantamento Se As Vítimas Dos Agressores Eram Menores Ou Não", fontsize=15, color="blue")
plt.ylabel('Quantidade')
plt.xticks(rotation=0)
plt.show()

In [None]:
# Gráfico de Barras da Existência de Praças
dados_coluna = db['Existencia de Pracas']
dados_coluna.value_counts().plot.bar(figsize=(10, 6))
plt.title("Existência de Praças Próximas", fontsize=15, color="blue")
plt.ylabel('Quantidade')
plt.xlabel('Existência')
plt.xticks(rotation=0)
plt.show()


In [None]:
# Visualização de Linha entre Dois Pontos no Mapa
latitude_inicial = db['LAT'].mean()
longitude_inicial = db['LONG'].mean()
mapa = folium.Map(location=[latitude_inicial, longitude_inicial], zoom_start=12)
coordenadas = [[db['LAT'].iloc[0], db['LONG'].iloc[0]], [db['LAT'].iloc[100], db['LONG'].iloc[100]]]
linha = folium.PolyLine(locations=coordenadas, color='red').add_to(mapa)
folium.Popup('Linha entre os pontos').add_to(linha)
mapa

In [None]:
# Carregamento da Base de Dados
df = pd.read_csv('ParaClasificacao.csv')

In [None]:
# Visualização da Comparação entre Dados Iniciais e Finais
plt.figure(figsize=(10, 6))
estagios = ['Inicial', 'Final']
linhas = [3120, 1924]
colunas = [8, 17]
fig, ax1 = plt.subplots()
ax2 = ax1.twinx()
ax1.bar(estagios, linhas, color='#D3D3D3', width=0.4, label='Linhas', align='center')
ax2.bar(estagios, colunas, color='#A9A9A9', width=0.4, label='Colunas', align='edge')
ax1.set_title('Comparação entre Dados Iniciais e Finais', fontsize=15, fontweight='bold')
ax1.set_xlabel('Estágio dos Dados')
ax1.set_ylabel('Quantidade de Linhas', color='#D3D3D3')
ax2.set_ylabel('Quantidade de Colunas', color='#A9A9A9')
ax1.tick_params(axis='y', colors='#D3D3D3')
ax2.tick_params(axis='y', colors='#A9A9A9')
ax1.legend(loc='upper left')
ax2.legend(loc='upper right')
ax1.spines['top'].set_visible(False)
ax2.spines['top'].set_visible(False)
plt.show()

In [None]:
# Visualização da Distribuição de Variáveis Numéricas

variaveis = ['AGE', 'HEIGHT', 'WEIGHT']
titulos = ['Distribuição da idade', 'Distribuição da altura', 'Distribuição do peso']
eixos_x = ['Idade', 'Altura', 'Peso']
for var, titulo, eixo_x in zip(variaveis, titulos, eixos_x):
    plt.hist(df[var], bins=20)
    plt.title(titulo)
    plt.xlabel(eixo_x)
    plt.ylabel('Frequência')
    plt.show()

In [None]:
# Visualização da Distribuição dos Valores em Colunas Categóricas
df['RACE'].value_counts().plot(kind='bar')
plt.title('Distribuição dos Valores na Coluna RACE')
plt.xlabel('RACE')
plt.ylabel('Frequência')
plt.show()

In [None]:
plt.scatter(df['LONG'], df['LAT'])
plt.title('Relação entre a Latitude e Longitude do Crime')
plt.xlabel('Longitude')
plt.ylabel('Latitude')
plt.show()


In [None]:
# Visualizações com Seaborn

sns.displot(df, x="AGE", kde=True)
sns.displot(df, x="HEIGHT", kde=True)
sns.displot(df, x="WEIGHT", kde=True)
sns.displot(df, x="LAT", kde=True)
sns.displot(df, x="LONG", kde=True)
sns.countplot(x="Existencia de Pracas", data=df)

sns.pairplot(df[['HEIGHT', 'WEIGHT', 'AGE', 'LAT', 'LONG']])
plt.show()

In [None]:
# Matriz de Correlação

corr = df.corr()
mask = np.triu(np.ones_like(corr, dtype=bool))
plt.figure(figsize=(12, 8))
sns.heatmap(corr, cmap='coolwarm', annot=True, fmt='.2f', vmin=-1, vmax=1, mask=mask)
plt.title('Matriz de Correlação', fontsize=16)
plt.xticks(fontsize=12)
plt.yticks(fontsize=12)
plt.show()