# Análise de Furtos ao Patrimônio no Distrito Federal


<p align="center">
  <img src="../img/imagedf.jpg" alt="Região do Distrito Federal">
</p>



#### Contextualização do Problema

###### <h5> <p style="text-align: justify; margin-top: 10px; font-size: 14px;">O Distrito Federal, coração político do Brasil, não está imune aos desafios que envolvem a segurança patrimonial. Ao longo dos anos, a segurança pública tem sido uma preocupação constante, e a localização e compreensão do número de furtos ao patrimônio em cada região é crucial para desenvolver estratégias eficazes de prevenção e intervenção. </P><h5>



<p align="center">
  <img src="../img/mapadf.jpg" alt="Região do Distrito Federal" width="600">
</p>


#### Metodologia/Data: 

<h5> <p style="text-align: justify; margin-top: 10px; font-size: 14px;">Os dados foram coletado do site da Secretaria de Estado de Segurança Pública - SSP/DF e do Instituto Brasileiro de Geografia e Estatística - IBGE.</p><h5>


#### Geometria do Distrito Federal
<h5> <p style="text-align: justify; margin-top: 10px; font-size: 14px;">Explorando e Trabalhando a geometria do Distrito Federal</p><h5>

In [8]:
# ler os dados com o geopandas
import geopandas as gpd
data = gpd.read_file('..\\data\\DF_Municipios_2022.shp')


AttributeError: partially initialized module 'pandas' has no attribute '_pandas_parser_CAPI' (most likely due to a circular import)

In [None]:
type(data)

In [None]:
data.head()

In [None]:
data.plot()

In [None]:
import matplotlib.pyplot as plt

data.plot(figsize=(16,14), facecolor='white', edgecolor='black')
plt.show()

In [None]:
#filtrar somente o Distrito Federal
gdf_df = data[data['NM_MUN'] == 'Brasília']
gdf_df

In [None]:
# mostrar a região filtrada
import matplotlib.pyplot as plt

gdf_df = data[data['NM_MUN'] == 'Brasília']
gdf_df.plot(figsize=(8, 8), facecolor="white", edgecolor="black")
plt.show()

In [None]:
# salvar o geodataframe com formato geojson
filename = "..\\data\\DF_Municipios_2022.geojson"
gdf_df.to_file(filename, driver="GeoJSON")

In [None]:
gdf_df = gpd.read_file(filename, driver="GeoJSON")
gdf_df

In [None]:
# Importar os objetos geométricos da biblioteca shapely 
from shapely.geometry import Point, LineString, Polygon

In [None]:
# Criar uma geometria do tipo ponto
ponto = Point(5, 10)

In [None]:
ponto

In [None]:
print (ponto)

In [None]:
type(ponto)

In [None]:
# Utilizando a função coords
list (ponto.coords)

In [None]:
# Lendo x e y separadamente
x = ponto.x
y = ponto.y
print(x , y)

In [None]:
ponto_1 = Point(2,3)
ponto_2 = Point(5,7)
distancia = ponto_1.distance(ponto_2)
print("Distância entre os pontos:", distancia)

In [None]:
# Criar um linha a partir de objetos pontos
ponto_1 = Point(2,3)
ponto_2 = Point(5,7)
ponto_3 = Point(2,10)
linha = LineString([ponto_1, ponto_2, ponto_3])

In [None]:
linha

In [None]:
print(linha)

In [None]:
type(linha)

In [None]:
# Utilizando a função coords
list(linha.coords)

In [None]:
#lendo x e y separadamente
coordenadas_x = list(linha.xy[0])
coordenadas_y = list(linha.xy[1])

print('coordenadas_x:', coordenadas_x)
print('coordenadas_y:', coordenadas_y)


In [None]:
#pegar o comprimento da linha
linha.length

In [None]:
# Obter o ponto central (centróide)
print(linha.centroid)

In [None]:
# Criar um polygon passando as coordenadas
poly = Polygon([(2,3),(5,7),(2,10)])

In [None]:
poly

In [None]:
print(poly)

In [None]:
type(poly)

In [None]:
#  Obter as coordenadas do poligono
list(poly.exterior.coords)

In [None]:
# Calcular a área
poly_area = poly.area
print ('Área=', poly_area)

In [None]:
# Pegar o centroide do polígono
poly_centroid = poly.centroid
print('Centróide:', poly_centroid)

In [None]:
# Obter as coordenadas do bounding box
poly.bounds

In [None]:
# Pegar as coordenadas da linha exterior
poly_exterior = poly.exterior
print('Exterior:', poly_exterior)

In [None]:
# Obter o tamanho da linha exterior
poly_exterior_length = poly.exterior.length
print('Comprimento exterior:', poly_exterior_length)

In [None]:
import pandas as pd

#### Conhecendo a base de dados

In [None]:
# Ler os dados com pandas
filename = r'..\\data\\furtos contra patrimônio.xlsx'
df_furtos = pd.read_excel(filename)

In [None]:
# Mostrar os dados com a função head

df_furtos.head()


##### Alguns tratamentos necessários

In [None]:
# Tratando os dados, retirando informações desnecessárias, espaços em branco...
df_furtos = df_furtos.fillna('')
df_furtos = df_furtos.rename(columns={'Unnamed: 0':'','Unnamed: 11':'','Unnamed: 12':''})


In [None]:
df_furtos.head(40)

In [None]:
# Mostrar todas as colunas para ver se temos informações de latitude e longitude
df_furtos.columns

In [None]:
#Apenas os dados de latitude e longitude
df_furtos[['Latitude', 'Longitude']].dropna()

In [None]:
# Criando GeoDataFrame
# Importar a classe point da biblioteca Shapely
from shapely.geometry import Point

In [None]:
# Criar a nossa coluna geometry
df_furtos['geometry'] = None


for index, row in df_furtos.iterrows():
    if pd.notna(row.Longitude) and pd.notna(row.Latitude) and row.Longitude != '' and row.Latitude != '':
        df_furtos.loc[index, 'geometry'] = Point(float(row.Longitude), float(row.Latitude))


In [None]:
df_furtos.head(10)

In [None]:
# Conferindo o tipo de dataframe
type(df_furtos)

In [None]:
# Importar a biblioteca geopandas
import geopandas as gpd 

In [None]:
# Criar o GeoDataFrame
gdf_furtos = gpd.GeoDataFrame(df_furtos, geometry='geometry')

In [None]:
# Conferindo o tipe do dataframe após a trasformação
type(gdf_furtos)

In [None]:
gdf_furtos.head(5)

In [None]:
# Mostrar os dados usando a função plot
gdf_furtos.plot()

In [None]:
# Carregar os dados do Distrito Federal
filename = '..\\data\\DF_Municipios_2022.geojson'
gdf_capital_DF = gpd.read_file(filename, driver='GEOJSON')

In [None]:
# Mostrar os dados carregados com a função plot
gdf_capital_DF.plot()

In [None]:
# Importar a biblioteca matplotlib
import matplotlib.pyplot as plt

#### Os pontos no mapa

In [None]:
# Pegar o polygon do DF
polygon_DF = gdf_capital_DF.iloc[0].geometry

In [None]:
# Mostrar o polygon no juyter
polygon_DF

In [None]:
# Fazer a operação de interseção entre as geometrias
gdf_furtos.intersects(polygon_DF)

In [None]:
# Interseção entre as geometrias das regiões administrativas
gdf_furtos_capital_DF = gdf_furtos[gdf_furtos.intersects(polygon_DF)]

In [None]:
# Mostrar os dados com matplotlib
fig, ax = plt.subplots(figsize=(10,10))

gdf_furtos_capital_DF.plot(ax=ax)
gdf_capital_DF.plot(ax=ax, facecolor='None', edgecolor='black')

In [None]:
#Salvando os dados de furtos no Distrito Federal
filename = '../data/furtos contra patrimônio.geojson'
gdf_furtos_capital_DF.to_file(filename, driver='GeoJSON')

#### Criando um mapa simples

In [None]:
# Criando um mapa simples usando folium
import folium
fmap = folium.Map()
fmap

#### Reunindo os nossos dados no mapa

In [None]:
# Carregando os dados de furtos
gdf_furtos = gpd.read_file('..\\data\\furtos contra patrimônio.geojson', driver="GeoJSON")
# Carregando os dados de geometria
gdf_geometria_DF = gpd.read_file("..\\data\\DF_Municipios_2022.geojson", driver="GeoJSON")

In [None]:
gdf_furtos.head()

In [None]:
gdf_furtos_slice = gdf_furtos.iloc[:100] # Quero todos os dados até o valor[]

fmap = folium.Map()  #mapa

feat_geojson = folium.features.GeoJson(gdf_furtos_slice)

fmap.add_child(feat_geojson) 
fmap

In [None]:
# Melhorando a inicialização do mapa, quando o mapa aparecer já aparecerá com localização determinada(zoom)
import folium

# Convertendo os valores de Latitude e Longitude para números
gdf_furtos_slice['Latitude'] = pd.to_numeric(gdf_furtos_slice['Latitude'], errors='coerce')
gdf_furtos_slice['Longitude'] = pd.to_numeric(gdf_furtos_slice['Longitude'], errors='coerce')

# Calculando a média das coordenadas
media_latitude = gdf_furtos_slice['Latitude'].mean()
media_longitude = gdf_furtos_slice['Longitude'].mean()

# Inicializando o mapa
fmap = folium.Map(location=[media_latitude, media_longitude])

# Criando um objeto GeoJson para adicionar ao mapa
feat_geojson = folium.features.GeoJson(gdf_furtos_slice.to_json())

# Adicionando o objeto GeoJson ao mapa
fmap.add_child(feat_geojson)


# Adicionando os limites, a fronteira do DF
limites = folium.features.GeoJson(gdf_geometria_DF, style_function=lambda feature: 
                                  {'color':'black', 'weight':2,'fillOpacity':0.0})
fmap.add_child(limites)

# Adicionar um círculo transparente no centro do mapa
folium.CircleMarker(
    location=[media_latitude, media_longitude],
    radius=10,
    color='none',
    fill=True,
    fill_opacity=0
).add_to(fmap)


# Exibindo o mapa
fmap


In [None]:
# Importar plugin FastMarkerCluster (Para uma grande quantidade de dados, melhora a visualização fazendo agrupamentos dinâmicos)
from folium.plugins import FastMarkerCluster

#### Mapa de frequência de casos

In [None]:
fmap = folium.Map(location=[media_latitude, media_longitude])  #mapa

mc = FastMarkerCluster(gdf_furtos[['Latitude', 'Longitude']])

fmap.add_child(mc) 

# Adicionando os limites, a fronteira do DF
limites = folium.features.GeoJson(gdf_geometria_DF, style_function=lambda feature: 
                                  {'color':'black', 'weight':2,'fillOpacity':0.0})
fmap.add_child(limites)

# Adicionar um círculo transparente no centro do mapa
folium.CircleMarker(
    location=[media_latitude, media_longitude],
    radius=10,
    color='none',
    fill=True,
    fill_opacity=0
).add_to(fmap)


fmap

In [None]:
# Salvando o mapa em um arquivo html
fmap.save('..\\html\\furtos_contra_patrimonio.html')

#### Criando HeatMap (Mapa de calor)

In [None]:
import folium
from folium.plugins import HeatMap
import geopandas as gpd


fmap = folium.Map(location=[media_latitude, media_longitude], tiles='cartodbpositron')

heat_map = HeatMap(gdf_furtos[['Latitude','Longitude']])

fmap.add_child(heat_map)




# Adicionando os limites, a fronteira do DF
limites = folium.features.GeoJson(gdf_geometria_DF, style_function=lambda feature: 
                                  {'color':'black', 'weight':2,'fillOpacity':0.0})
fmap.add_child(limites)

# Adicionar um círculo transparente no centro do mapa
folium.CircleMarker(
    location=[media_latitude, media_longitude],
    radius=10,
    color='none',
    fill=True,
    fill_opacity=0
).add_to(fmap)
fmap

In [None]:
# Salvando o mapa de calor em um arquivo html
fmap.save('..\\html\\heatmap_furtos_contra_patrimonio.html')

In [None]:
#Adicionando informações estatísticas
# Carregar as regiões administrativas
gdf_geometrias_gsp = gpd.read_file('..\\data\\DF_Municipios_2022.geojson', driver='GeoJSON')

# carregar os dados de furtos no Distrito Federal
gdf_furtos_gsp = gpd.read_file('..\\data\\furtos contra patrimônio.geojson', driver='GeoJSON')


In [None]:
gdf_furtos_gsp.head(5)

In [None]:
import folium
import pandas as pd

# Convertendo 'Latitude' e 'Longitude' para float
gdf_furtos_gsp['Latitude'] = gdf_furtos_gsp['Latitude'].astype(float)
gdf_furtos_gsp['Longitude'] = gdf_furtos_gsp['Longitude'].astype(float)

# Calcular a média
media_latitude = gdf_furtos_gsp['Latitude'].mean()
media_longitude = gdf_furtos_gsp['Longitude'].mean()

# Criar o mapa
fmap = folium.Map(location=[media_latitude, media_longitude], tiles='cartodbpositron', zoom_start=10)

# Iterar sobre os municípios
for index, municipio in gdf_furtos_gsp.iterrows():
    municipio_geojson = folium.features.GeoJson(municipio['geometry'], 
                                                style_function=lambda feature: {'color': 'blue', 'weight': 2, 'fillOpacity': 0.1})
    
    # Construir o texto do popup
    popup_text = f'''
                 Município: {municipio['CID_MUN']} <br>
                 População:{str(int(municipio['População']))} <br>
                 Furtos registrados(2018-2022): {str(int(municipio['qtd_furtos']))}
                 '''

    # Adicionar o popup ao GeoJson
    popup = folium.Popup(popup_text, max_width=300)
    popup.add_to(municipio_geojson)
    municipio_geojson.add_to(fmap)

# Adicionando os limites, a fronteira do DF
limites = folium.features.GeoJson(gdf_geometria_DF, style_function=lambda feature: 
                                  {'color':'black', 'weight':2,'fillOpacity':0.0})
fmap.add_child(limites)

# Adicionar um círculo transparente no centro do mapa
folium.CircleMarker(
    location=[media_latitude, media_longitude],
    radius=10,
    color='none',
    fill=True,
    fill_opacity=0
).add_to(fmap)

# Salvar o mapa em um arquivo HTML
fmap.save('..\\html\\qtd_furtos_DF.html')


#### Análise Exploratória dos Dados

Média de Furtos por Ano
###### <h5> <p style="text-align: justify; margin-top: 10px; font-size: 14px;">Para ter uma visão geral da tendência ao longo do período.</p><h5>

In [None]:
gdf_furtos_gsp.head(5)

###### <h5> <p style="text-align: justify; margin-top: 10px; font-size: 14px;"> Média de Furtos a Patrimônios entre os anos de 2018 até 2022 no Distrito Federal <p></h5>

In [None]:
import pandas as pd

# Remover espaços extras nos nomes das colunas
gdf_furtos_gsp.columns = gdf_furtos_gsp.columns.str.strip()

# Selecionar as colunas desejadas
ocorrencias = ['Ocorrências 2018', 'Ocorrências 2019', 'Ocorrências 2020', 'Ocorrências 2021', 'Ocorrências 2022']

# Tentar converter as colunas para numérico
for col in ocorrencias:
    gdf_furtos_gsp[col] = pd.to_numeric(gdf_furtos_gsp[col], errors='coerce')

# Adicionando uma nova coluna ao DataFrame com a média
gdf_furtos_gsp['Média'] = gdf_furtos_gsp[ocorrencias].mean(axis=1)

# Criando um DataFrame apenas com as colunas desejadas
df_media_furtos = gdf_furtos_gsp[['CID_MUN', 'Média']]

print(df_media_furtos)


In [None]:
import matplotlib.pyplot as plt
import pandas as pd

# DataFrame da média de furtos
df_media_furtos = {
    'CID_MUN': [
       'BRASILIA', 'GAMA', 'TAGUATINGA', 'BRAZLANDIA',
        'SOBRADINHO', 'PLANALTINA', 'PARANOA', 'NUCLEO BANDEIRANTE',
        'CEILANDIA', 'GUARA', 'CRUZEIRO', 'SAMAMBAIA',
        'SANTA MARIA', 'SAO SEBASTIAO', 'RECANTO DAS EMAS',
        'LAGO SUL', 'RIACHO FUNDO', 'LAGO NORTE',
        'CANDANGOLANDIA', 'AGUAS CLARAS', 'RIACHO FUNDO 2',
        'SUDOESTE', 'VARJAO DO TORTO', 'PARK WAY',
        'ESTRUTURAL', 'SOBRADINHO 2', 'JARDIM BOTANICO',
        'ITAPOA', 'SIA', 'VICENTE PIRES', 'FERCAL',
        'SOL NASCENTE/POR DO SOL', 'ARNIQUEIRA'
    ],
    'Média': [
        682.2, 268.2, 627.8, 45.8, 97.8, 157.6, 72.0, 51.0, 668.4, 159.0,
        34.0, 337.0, 164.0, 102.6, 150.6, 24.6, 50.8, 18.0, 11.0, 114.4,
        40.8, 39.4, 10.0, 5.8, 50.0, 35.8, 7.4, 75.2, 111.8, 96.4, 8.6,
        73.6, 45.6
    ]
}

df_media_furtos = pd.DataFrame(df_media_furtos)

# Ajustando o espaçamento e o tamanho da fonte
plt.figure(figsize=(12, 8))
bars = plt.bar(df_media_furtos['CID_MUN'], df_media_furtos['Média'], color='blue', width=0.7)  # Ajuste o valor de width conforme necessário
plt.xlabel('Cidades')
plt.ylabel('Média de Ocorrências')
plt.title('Média de Ocorrências por Cidade')
plt.xticks(rotation=45, ha='right')  # Rotaciona os rótulos do eixo x para melhor legibilidade

# Adicionar valores acima das barras com fonte menor 
for bar in bars:
    yval = bar.get_height()
    plt.text(bar.get_x() + bar.get_width()/2, yval + 5, round(yval, 1), ha='center', va='bottom', fontsize=9)

plt.tight_layout()  # Ajusta o layout para evitar corte de rótulos
plt.show()


Ranking de Cidades (Maiores e Menores taxas em relação a população)
###### <h5> <p style="text-align: justify; margin-top: 10px; font-size: 14px;"> Identificando as cidades com as maiores e menores taxas de furtos em relação à população. Isso pode ajudar a focalizar esforços de segurança onde são mais necessários. <p></h5>


In [None]:
import matplotlib.pyplot as plt
import pandas as pd

# DataFrame
df_media_furtos = {
    'CID_MUN': [
        'BRASILIA', 'GAMA', 'TAGUATINGA', 'BRAZLANDIA',
        'SOBRADINHO', 'PLANALTINA', 'PARANOA', 'NUCLEO BANDEIRANTE',
        'CEILANDIA', 'GUARA', 'CRUZEIRO', 'SAMAMBAIA',
        'SANTA MARIA', 'SAO SEBASTIAO', 'RECANTO DAS EMAS',
        'LAGO SUL', 'RIACHO FUNDO', 'LAGO NORTE',
        'CANDANGOLANDIA', 'AGUAS CLARAS', 'RIACHO FUNDO 2',
        'SUDOESTE', 'VARJAO DO TORTO', 'PARK WAY',
        'ESTRUTURAL', 'SOBRADINHO 2', 'JARDIM BOTANICO',
        'ITAPOA', 'SIA', 'VICENTE PIRES', 'FERCAL',
        'SOL NASCENTE/POR DO SOL', 'ARNIQUEIRA'
    ],
    'Média': [
        682.2, 268.2, 627.8, 45.8, 97.8, 157.6, 72.0, 51.0, 668.4, 159.0,
        34.0, 337.0, 164.0, 102.6, 150.6, 24.6, 50.8, 18.0, 11.0, 114.4,
        40.8, 39.4, 10.0, 5.8, 50.0, 35.8, 7.4, 75.2, 111.8, 96.4, 8.6,
        73.6, 45.6
    ]
}

df_media_furtos = pd.DataFrame(df_media_furtos)

# Ordenar o DataFrame pela coluna 'Média'
df_media_furtos = df_media_furtos.sort_values(by='Média')

# Pegar os 5 maiores e 5 menores
top5 = df_media_furtos.tail(5)
bottom5 = df_media_furtos.head(5)

# Ajustando o espaçamento e o tamanho da fonte para os 5 maiores
plt.figure(figsize=(4, 4))
bars = plt.bar(top5['CID_MUN'], top5['Média'], color='green', width=0.5)  # Ajuste o valor de width conforme necessário
plt.xlabel('Cidades')
plt.ylabel('Média de Ocorrências')
plt.title('5 Cidades com Maior Média de Ocorrências')
plt.xticks(rotation=45, ha='right')

# Adicionar valores acima das barras com fonte menor (exemplo: fontsize=8)
for bar in bars:
    yval = bar.get_height()
    plt.text(bar.get_x() + bar.get_width()/2, yval + 2, round(yval, 1), ha='center', va='bottom', fontsize=8)

plt.tight_layout()
plt.show()

# Ajustando o espaçamento e o tamanho da fonte para os 5 menores
plt.figure(figsize=(4, 4))
bars = plt.bar(bottom5['CID_MUN'], bottom5['Média'], color='red', width=0.5)  # Ajuste o valor de width conforme necessário
plt.xlabel('Cidades')
plt.ylabel('Média de Ocorrências')
plt.title('5 Cidades com Menor Média de Ocorrências')
plt.xticks(rotation=45, ha='right')

# Adicionar valores acima das barras com fonte menor (exemplo: fontsize=8)
for bar in bars:
    yval = bar.get_height()
    plt.text(bar.get_x() + bar.get_width()/2, yval + 0, round(yval, 1), ha='center', va='bottom', fontsize=8)

plt.tight_layout()
plt.show()


Taxa de Furtos em Relação à População
<h5> <p style="text-align: justify; margin-top: 10px; font-size: 14px;"> Para entender a incidência relativa em relação à população. Isso ajuda a normalizar os dados em função do tamanho da população. <p><h5>

In [None]:
gdf_furtos_gsp.head(5)

Variação Anual
<h5> <p style="text-align: justify; margin-top: 10px; font-size: 14px;"> Analisando a variação percentual anual nos casos de furtos para identificar anos com aumentos ou reduções significativas em relação ao ano anterior.<p></h5>

In [None]:
import pandas as pd
import matplotlib.pyplot as plt

# Base de dados
dados = {
    'CID_MUN': ["BRASILIA", "GAMA", "TAGUATINGA", "BRAZLANDIA", "SOBRADINHO", "PLANALTINA", "PARANOA", "NUCLEO BANDEIRANTE",
                "CEILANDIA", "GUARA", "CRUZEIRO", "SAMAMBAIA", "SANTA MARIA", "SAO SEBASTIAO", "RECANTO DAS EMAS", "LAGO SUL",
                "RIACHO FUNDO", "LAGO NORTE", "CANDANGOLANDIA", "AGUAS CLARAS", "RIACHO FUNDO 2", "SUDOESTE", "VARJAO DO TORTO",
                "PARK WAY", "ESTRUTURAL", "SOBRADINHO 2", "JARDIM BOTANICO", "ITAPOA", "SIA", "VICENTE PIRES", "FERCAL",
                "SOL NASCENTE/POR DO SOL", "ARNIQUEIRA"],
    'Ocorrências 2018': [1086, 308, 793, 45, 154, 253, 95, 44, 687, 152, 43, 360, 200, 151, 152, 15, 34, 22, 9, 11, 226, 51, 13, 11, 47, 38, 7, 94, 119, 74, 10, 50, 45],
    'Ocorrências 2019': [715, 355, 760, 47, 120, 183, 87, 55, 784, 189, 38, 355, 202, 115, 182, 25, 42, 20, 15, 152, 49, 47, 16, 3, 63, 34, 7, 85, 153, 102, 11, 82, 50],
    'Ocorrências 2020': [543, 230, 596, 44, 61, 137, 77, 72, 635, 186, 34, 311, 168, 60, 181, 33, 84, 15, 13, 134, 40, 40, 9, 6, 48, 40, 3, 80, 140, 127, 10, 79, 52],
    'Ocorrências 2021': [504, 297, 478, 48, 67, 118, 38, 40, 569, 157, 35, 355, 129, 72, 122, 17, 51, 16, 11, 112, 37, 35, 3, 6, 41, 32, 8, 44, 95, 90, 6, 77, 32],
    'Ocorrências 2022': [563, 151, 512, 45, 87, 97, 63, 44, 667, 111, 20, 304, 121, 115, 116, 33, 43, 17, 7, 62, 52, 24, 9, 3, 51, 35, 12, 73, 52, 89, 6, 80, 49]
}

# Criando um DataFrame
df = pd.DataFrame(dados)

# Calculando as variações percentuais
df['2018-2019 %'] = ((df['Ocorrências 2019'] - df['Ocorrências 2018']) / df['Ocorrências 2018']) * 100
df['2019-2020 %'] = ((df['Ocorrências 2020'] - df['Ocorrências 2019']) / df['Ocorrências 2019']) * 100
df['2020-2021 %'] = ((df['Ocorrências 2021'] - df['Ocorrências 2020']) / df['Ocorrências 2020']) * 100
df['2021-2022 %'] = ((df['Ocorrências 2022'] - df['Ocorrências 2021']) / df['Ocorrências 2021']) * 100

# Formatando as colunas de porcentagem para duas casas decimais
df['2018-2019 %'] = df['2018-2019 %'].map('{:.2f}%'.format)
df['2019-2020 %'] = df['2019-2020 %'].map('{:.2f}%'.format)
df['2020-2021 %'] = df['2020-2021 %'].map('{:.2f}%'.format)
df['2021-2022 %'] = df['2021-2022 %'].map('{:.2f}%'.format)

# Criando uma tabela com as porcentagens
tabela_porcentagens = df[['CID_MUN', '2018-2019 %', '2019-2020 %', '2020-2021 %', '2021-2022 %']]

# Mostrando a tabela
print(tabela_porcentagens)


Análise temporal
<h5> <p style="text-align: justify; margin-top: 10px; font-size: 14px;"> Gráficos temporais para visualizar como os casos de furtos variam ao longo do tempo(aumentos e quedas). <p></h5>

In [None]:
import pandas as pd

# Nossa base de dados
dados = {
    'CID_MUN': ["BRASILIA", "GAMA", "TAGUATINGA", "BRAZLANDIA", "SOBRADINHO", "PLANALTINA", "PARANOA", "NUCLEO BANDEIRANTE",
                "CEILANDIA", "GUARA", "CRUZEIRO", "SAMAMBAIA", "SANTA MARIA", "SAO SEBASTIAO", "RECANTO DAS EMAS", "LAGO SUL",
                "RIACHO FUNDO", "LAGO NORTE", "CANDANGOLANDIA", "AGUAS CLARAS", "RIACHO FUNDO 2", "SUDOESTE", "VARJAO DO TORTO",
                "PARK WAY", "ESTRUTURAL", "SOBRADINHO 2", "JARDIM BOTANICO", "ITAPOA", "SIA", "VICENTE PIRES", "FERCAL",
                "SOL NASCENTE/POR DO SOL", "ARNIQUEIRA"],
    'Ocorrências 2018': [1086, 308, 793, 45, 154, 253, 95, 44, 687, 152, 43, 360, 200, 151, 152, 15, 34, 22, 9, 11, 226, 51, 13, 11, 47, 38, 7, 94, 119, 74, 10, 50, 45],
    'Ocorrências 2019': [715, 355, 760, 47, 120, 183, 87, 55, 784, 189, 38, 355, 202, 115, 182, 25, 42, 20, 15, 152, 49, 47, 16, 3, 63, 34, 7, 85, 153, 102, 11, 82, 50],
    'Ocorrências 2020': [543, 230, 596, 44, 61, 137, 77, 72, 635, 186, 34, 311, 168, 60, 181, 33, 84, 15, 13, 134, 40, 40, 9, 6, 48, 40, 3, 80, 140, 127, 10, 79, 52],
    'Ocorrências 2021': [504, 297, 478, 48, 67, 118, 38, 40, 569, 157, 35, 355, 129, 72, 122, 17, 51, 16, 11, 112, 37, 35, 3, 6, 41, 32, 8, 44, 95, 90, 6, 77, 32],
    'Ocorrências 2022': [563, 151, 512, 45, 87, 97, 63, 44, 667, 111, 20, 304, 121, 115, 116, 33, 43, 17, 7, 62, 52, 24, 9, 3, 51, 35, 12, 73, 52, 89, 6, 80, 49]
}

# Criando um DataFrame
df = pd.DataFrame(dados)

# Calculando as variações
df['2018-2019'] = df['Ocorrências 2019'] - df['Ocorrências 2018']
df['2019-2020'] = df['Ocorrências 2020'] - df['Ocorrências 2019']
df['2020-2021'] = df['Ocorrências 2021'] - df['Ocorrências 2020']
df['2021-2022'] = df['Ocorrências 2022'] - df['Ocorrências 2021']

# Exibindo o DataFrame
print(df[['CID_MUN', '2018-2019', '2019-2020', '2020-2021', '2021-2022']])


Estística Descritiva
<h5> <p style="text-align: justify; margin-top: 10px; font-size: 14px;"> Obtendo média, desvio padrão, mínimo, quartis</p><h5>

In [None]:
import pandas as pd

# Criando o DataFrame a partir dos dados fornecidos
dados = {
    'CID_MUN': ["BRASILIA", "GAMA", "TAGUATINGA", "BRAZLANDIA", "SOBRADINHO", "PLANALTINA", "PARANOA", "NUCLEO BANDEIRANTE",
                "CEILANDIA", "GUARA", "CRUZEIRO", "SAMAMBAIA", "SANTA MARIA", "SAO SEBASTIAO", "RECANTO DAS EMAS", "LAGO SUL",
                "RIACHO FUNDO", "LAGO NORTE", "CANDANGOLANDIA", "AGUAS CLARAS", "RIACHO FUNDO 2", "SUDOESTE", "VARJAO DO TORTO",
                "PARK WAY", "ESTRUTURAL", "SOBRADINHO 2", "JARDIM BOTANICO", "ITAPOA", "SIA", "VICENTE PIRES", "FERCAL",
                "SOL NASCENTE/POR DO SOL", "ARNIQUEIRA"],
    'Ocorrências 2018': [1086, 308, 793, 45, 154, 253, 95, 44, 687, 152, 43, 360, 200, 151, 152, 15, 34, 22, 9, 11, 226, 51, 13, 11, 47, 38, 7, 94, 119, 74, 10, 50, 45],
    'Ocorrências 2019': [715, 355, 760, 47, 120, 183, 87, 55, 784, 189, 38, 355, 202, 115, 182, 25, 42, 20, 15, 152, 49, 47, 16, 3, 63, 34, 7, 85, 153, 102, 11, 82, 50],
    'Ocorrências 2020': [543, 230, 596, 44, 61, 137, 77, 72, 635, 186, 34, 311, 168, 60, 181, 33, 84, 15, 13, 134, 40, 40, 9, 6, 48, 40, 3, 80, 140, 127, 10, 79, 52],
    'Ocorrências 2021': [504, 297, 478, 48, 67, 118, 38, 40, 569, 157, 35, 355, 129, 72, 122, 17, 51, 16, 11, 112, 37, 35, 3, 6, 41, 32, 8, 44, 95, 90, 6, 77, 32],
    'Ocorrências 2022': [563, 151, 512, 45, 87, 97, 63, 44, 667, 111, 20, 304, 121, 115, 116, 33, 43, 17, 7, 62, 52, 24, 9, 3, 51, 35, 12, 73, 52, 89, 6, 80, 49]
}

df = pd.DataFrame(dados)

# Calculando as estatísticas descritivas
estatisticas_descritivas = df.describe()

# Exibindo as estatísticas descritivas
print(estatisticas_descritivas)


In [None]:
import matplotlib.pyplot as plt
import pandas as pd

# DataFrame
dados = {
    'CID_MUN': ["BRASILIA", "GAMA", "TAGUATINGA", "BRAZLANDIA", "SOBRADINHO", "PLANALTINA", "PARANOA", "NUCLEO BANDEIRANTE",
                "CEILANDIA", "GUARA", "CRUZEIRO", "SAMAMBAIA", "SANTA MARIA", "SAO SEBASTIAO", "RECANTO DAS EMAS", "LAGO SUL",
                "RIACHO FUNDO", "LAGO NORTE", "CANDANGOLANDIA", "AGUAS CLARAS", "RIACHO FUNDO 2", "SUDOESTE", "VARJAO DO TORTO",
                "PARK WAY", "ESTRUTURAL", "SOBRADINHO 2", "JARDIM BOTANICO", "ITAPOA", "SIA", "VICENTE PIRES", "FERCAL",
                "SOL NASCENTE/POR DO SOL", "ARNIQUEIRA"],
    'Ocorrências 2018': [1086, 308, 793, 45, 154, 253, 95, 44, 687, 152, 43, 360, 200, 151, 152, 15, 34, 22, 9, 11, 226, 51, 13, 11, 47, 38, 7, 94, 119, 74, 10, 50, 45],
    'Ocorrências 2019': [715, 355, 760, 47, 120, 183, 87, 55, 784, 189, 38, 355, 202, 115, 182, 25, 42, 20, 15, 152, 49, 47, 16, 3, 63, 34, 7, 85, 153, 102, 11, 82, 50],
    'Ocorrências 2020': [543, 230, 596, 44, 61, 137, 77, 72, 635, 186, 34, 311, 168, 60, 181, 33, 84, 15, 13, 134, 40, 40, 9, 6, 48, 40, 3, 80, 140, 127, 10, 79, 52],
    'Ocorrências 2021': [504, 297, 478, 48, 67, 118, 38, 40, 569, 157, 35, 355, 129, 72, 122, 17, 51, 16, 11, 112, 37, 35, 3, 6, 41, 32, 8, 44, 95, 90, 6, 77, 32],
    'Ocorrências 2022': [563, 151, 512, 45, 87, 97, 63, 44, 667, 111, 20, 304, 121, 115, 116, 33, 43, 17, 7, 62, 52, 24, 9, 3, 51, 35, 12, 73, 52, 89, 6, 80, 49]
}

df = pd.DataFrame(dados)

# Calculando as estatísticas descritivas
estatisticas_descritivas = df.describe()

# Criando o gráfico
fig, axs = plt.subplots(nrows=1, ncols=5, figsize=(20, 5), sharey=True)

# Iterando sobre os anos e criando os gráficos
for i, col in enumerate(estatisticas_descritivas.columns):
    bars = axs[i].bar(estatisticas_descritivas.index, estatisticas_descritivas[col], yerr=estatisticas_descritivas.loc['std', col], capsize=5)
    axs[i].set_title(f'Estatísticas Descritivas - {col}')
    axs[i].set_ylabel('Ocorrências')
    axs[i].set_xticks(estatisticas_descritivas.index)  # Adicionando esta linha
    axs[i].set_xticklabels(estatisticas_descritivas.index, rotation=45, ha='right')

    # Adicionando rótulos sobre as barras com um ajuste para cima
    for bar in bars:
        height = bar.get_height()
        axs[i].text(bar.get_x() + bar.get_width() / 2, height + 10, f'{height:.0f}', ha='center', va='bottom')

plt.tight_layout()
plt.show()


Variação

In [None]:
import pandas as pd
import matplotlib.pyplot as plt

# Carregar dados
df = pd.DataFrame(dados)

# Criar gráfico de linha para cada cidade
cidades = df['CID_MUN'].unique()
num_cidades = len(cidades)
num_graficos_por_linha = 4
num_linhas = (num_cidades + num_graficos_por_linha - 1) // num_graficos_por_linha

for i, cidade in enumerate(cidades):
    if i % num_graficos_por_linha == 0:
        fig, axs = plt.subplots(1, num_graficos_por_linha, figsize=(15, 5))
    ax = axs[i % num_graficos_por_linha]
    valores_ocorrencias = df[df['CID_MUN'] == cidade][['Ocorrências 2018', 'Ocorrências 2019', 'Ocorrências 2020', 'Ocorrências 2021', 'Ocorrências 2022']].values.flatten()
    valores_ocorrencias = pd.to_numeric(valores_ocorrencias, errors='coerce')
    ax.plot([2018, 2019, 2020, 2021, 2022], valores_ocorrencias)
    ax.set_title(cidade)
    ax.set_xlabel('Ano')
    ax.set_ylabel('Número de Ocorrências')
    ax.tick_params(axis='x', rotation=45)
    ax.set_xticks([2018, 2019, 2020, 2021, 2022])
    ax.set_xticklabels(['2018', '2019', '2020', '2021', '2022'])

plt.show()


