In [26]:
import pandas as pd
import numpy as np
from tqdm.notebook import tqdm

import seaborn as sns
import matplotlib.pyplot as plt
import plotly.express as px
from shapely.geometry import LineString

import geopandas as gpd
import geopy

tqdm.pandas()
sns.set(style="whitegrid")
import warnings 
warnings.filterwarnings("ignore")

In [27]:
incidents = pd.read_csv('DATA.csv')

In [28]:
incidents.head(1)

Unnamed: 0,Folder name,Folder color,Latitude,Longitude,Title,Description,Color,Phone number,Timestamp,Pin icon code
0,,71b300,41.336001,-8.560611,1 de Agosto de 1984,Assalto ao Banco Espírito Santo na Trofa. Foi ...,71b300,,2024-02-08T17:16:00Z,-1


In [29]:
incidents.tail(1)

Unnamed: 0,Folder name,Folder color,Latitude,Longitude,Title,Description,Color,Phone number,Timestamp,Pin icon code
122,,71b300,37.089224,-8.298158,Setembro de 1986,Bombas Detonadas em Empreendimentos Turísitico...,3f51b5,,2024-02-08T17:57:28Z,-1


In [30]:
incidents['ID'] = range(1, len(incidents) + 1)
incidents.set_index('ID', inplace = True)

In [31]:
incidents

Unnamed: 0_level_0,Folder name,Folder color,Latitude,Longitude,Title,Description,Color,Phone number,Timestamp,Pin icon code
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
1,,71b300,41.336001,-8.560611,1 de Agosto de 1984,Assalto ao Banco Espírito Santo na Trofa. Foi ...,71b300,,2024-02-08T17:16:00Z,-1
2,,71b300,38.010202,-7.870127,1 de Fevereiro de 1985,"Bombas Detonadas, 8 dispositivos no Bairro Ale...",3f51b5,,2024-02-08T17:37:17Z,-1
3,,71b300,38.748041,-9.188370,1 de Junho de 1984,"Agressão, disparos contra administrador de uma...",ff5722,,2024-02-08T17:10:19Z,-1
4,,71b300,39.973942,-8.627772,1 de Maio de 1984,"Vandalismo, colocação de Pregos na Estrada Nac...",ffeb3b,,2024-02-08T17:06:30Z,-1
5,,71b300,38.815583,-9.223445,2 de Novembro de 1983,Assalto à dependência do Crédito Predial Portu...,71b300,,2024-02-08T14:42:44Z,-1
...,...,...,...,...,...,...,...,...,...,...
119,,71b300,38.768374,-9.294940,Janeiro de 1982,Bombas Detonadas no Posto da Guarda Nacional R...,3f51b5,,2024-02-08T13:58:46Z,-1
120,,71b300,39.694550,-8.130265,Julho de 1980,Constante Vandalismo contra veiculos da Políci...,ffeb3b,,2024-02-08T12:23:55Z,-1
121,,71b300,38.697433,-9.423230,Maio de 1981,Explosivos Detonados no Royal British Club em ...,3f51b5,,2024-02-08T13:28:17Z,-1
122,,71b300,39.744673,-8.811827,Novembro de 1983,Bombas Detonadas no Posto da Guarda Nacional R...,3f51b5,,2024-02-08T14:41:30Z,-1


In [32]:
columns_to_drop = ['Folder name', 'Phone number', 'Pin icon code', 'Timestamp']
incidents.drop(columns=columns_to_drop, inplace = True)

In [33]:
incidents.head(1)

Unnamed: 0_level_0,Folder color,Latitude,Longitude,Title,Description,Color
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
1,71b300,41.336001,-8.560611,1 de Agosto de 1984,Assalto ao Banco Espírito Santo na Trofa. Foi ...,71b300


In [34]:
incidents.isnull().sum()

Folder color    0
Latitude        0
Longitude       0
Title           0
Description     0
Color           0
dtype: int64

In [35]:
incidents['Color'].unique()

array(['71b300', '3f51b5', 'ff5722', 'ffeb3b', 'f44336', 'ff9800',
       '9e9e9e', '795548', '9c27b0', '607d8b'], dtype=object)

In [36]:
incidents['Folder color'].unique()

array(['71b300'], dtype=object)

In [37]:
incidents.drop('Folder color', inplace= True, axis = 1)

In [38]:
incidents.head(3)

Unnamed: 0_level_0,Latitude,Longitude,Title,Description,Color
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
1,41.336001,-8.560611,1 de Agosto de 1984,Assalto ao Banco Espírito Santo na Trofa. Foi ...,71b300
2,38.010202,-7.870127,1 de Fevereiro de 1985,"Bombas Detonadas, 8 dispositivos no Bairro Ale...",3f51b5
3,38.748041,-9.18837,1 de Junho de 1984,"Agressão, disparos contra administrador de uma...",ff5722


In [39]:
incidents['Color'].replace('ff9800', 'ff5722', inplace=True)

In [40]:
incident_type = {'71b300' : 'Assalto', 
                '3f51b5': 'Bomba Detonadas',
                'ff5722' : 'Agressão',
                'ffeb3b' : 'Vandalismo',
                'f44336' : 'Assassinato',
                '9e9e9e' : 'Assalto com Vítimas Mortais', 
                '795548' : 'Tentativa de Assalto (falhada)', 
                '9c27b0' : 'Bombas Não Detonadas',
                '607d8b' : 'Fugas da Prisão'
                 }

incidents['Categoria'] = incidents['Color'].map(incident_type)

In [41]:
incidents

Unnamed: 0_level_0,Latitude,Longitude,Title,Description,Color,Categoria
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
1,41.336001,-8.560611,1 de Agosto de 1984,Assalto ao Banco Espírito Santo na Trofa. Foi ...,71b300,Assalto
2,38.010202,-7.870127,1 de Fevereiro de 1985,"Bombas Detonadas, 8 dispositivos no Bairro Ale...",3f51b5,Bomba Detonadas
3,38.748041,-9.188370,1 de Junho de 1984,"Agressão, disparos contra administrador de uma...",ff5722,Agressão
4,39.973942,-8.627772,1 de Maio de 1984,"Vandalismo, colocação de Pregos na Estrada Nac...",ffeb3b,Vandalismo
5,38.815583,-9.223445,2 de Novembro de 1983,Assalto à dependência do Crédito Predial Portu...,71b300,Assalto
...,...,...,...,...,...,...
119,38.768374,-9.294940,Janeiro de 1982,Bombas Detonadas no Posto da Guarda Nacional R...,3f51b5,Bomba Detonadas
120,39.694550,-8.130265,Julho de 1980,Constante Vandalismo contra veiculos da Políci...,ffeb3b,Vandalismo
121,38.697433,-9.423230,Maio de 1981,Explosivos Detonados no Royal British Club em ...,3f51b5,Bomba Detonadas
122,39.744673,-8.811827,Novembro de 1983,Bombas Detonadas no Posto da Guarda Nacional R...,3f51b5,Bomba Detonadas


In [42]:
incidents.info(memory_usage='deep')

<class 'pandas.core.frame.DataFrame'>
Index: 123 entries, 1 to 123
Data columns (total 6 columns):
 #   Column       Non-Null Count  Dtype  
---  ------       --------------  -----  
 0   Latitude     123 non-null    float64
 1   Longitude    123 non-null    float64
 2   Title        123 non-null    object 
 3   Description  123 non-null    object 
 4   Color        123 non-null    object 
 5   Categoria    123 non-null    object 
dtypes: float64(2), object(4)
memory usage: 48.3 KB


In [43]:
incidents = incidents.astype({'Color': 'category',  
                          'Categoria': 'category'})


In [44]:
incidents.info(memory_usage='deep')

<class 'pandas.core.frame.DataFrame'>
Index: 123 entries, 1 to 123
Data columns (total 6 columns):
 #   Column       Non-Null Count  Dtype   
---  ------       --------------  -----   
 0   Latitude     123 non-null    float64 
 1   Longitude    123 non-null    float64 
 2   Title        123 non-null    object  
 3   Description  123 non-null    object  
 4   Color        123 non-null    category
 5   Categoria    123 non-null    category
dtypes: category(2), float64(2), object(2)
memory usage: 34.0 KB


In [45]:
incidents

Unnamed: 0_level_0,Latitude,Longitude,Title,Description,Color,Categoria
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
1,41.336001,-8.560611,1 de Agosto de 1984,Assalto ao Banco Espírito Santo na Trofa. Foi ...,71b300,Assalto
2,38.010202,-7.870127,1 de Fevereiro de 1985,"Bombas Detonadas, 8 dispositivos no Bairro Ale...",3f51b5,Bomba Detonadas
3,38.748041,-9.188370,1 de Junho de 1984,"Agressão, disparos contra administrador de uma...",ff5722,Agressão
4,39.973942,-8.627772,1 de Maio de 1984,"Vandalismo, colocação de Pregos na Estrada Nac...",ffeb3b,Vandalismo
5,38.815583,-9.223445,2 de Novembro de 1983,Assalto à dependência do Crédito Predial Portu...,71b300,Assalto
...,...,...,...,...,...,...
119,38.768374,-9.294940,Janeiro de 1982,Bombas Detonadas no Posto da Guarda Nacional R...,3f51b5,Bomba Detonadas
120,39.694550,-8.130265,Julho de 1980,Constante Vandalismo contra veiculos da Políci...,ffeb3b,Vandalismo
121,38.697433,-9.423230,Maio de 1981,Explosivos Detonados no Royal British Club em ...,3f51b5,Bomba Detonadas
122,39.744673,-8.811827,Novembro de 1983,Bombas Detonadas no Posto da Guarda Nacional R...,3f51b5,Bomba Detonadas


In [46]:
incidents['Data'] = incidents['Title']
incidents = incidents.drop(columns=['Title'])

In [47]:
import re
from datetime import datetime

# Mapeamento dos meses em português para números
month_mapping = {
    'Janeiro': 1,
    'Fevereiro': 2,
    'Março': 3,
    'Abril': 4,
    'Maio': 5,
    'Junho': 6,
    'Julho': 7,
    'Agosto': 8,
    'Setembro': 9,
    'Outubro': 10,
    'Novembro': 11,
    'Dezembro': 12
}

# Função para converter o título no formato "DD de MMMM de YYYY" para "YYYY-MM-DD"
def convert_title_to_date(title):
    # Extrair dia, mês e ano do título. Se o dia não for encontrado, usar 1 como padrão.
    match = re.search(r'(\d+)? de (\w+) de (\d+)', title)
    if match:
        day, month_text, year = match.groups()
        day = day or "1"  # Usar o dia 1 se nenhum dia for especificado
        month = month_mapping.get(month_text, 0)  # Retorna 0 se o mês não for encontrado
        if month != 0:  # Verifica se o mês foi encontrado com sucesso
            date_str = f"{year}-{month:02d}-{day.zfill(2)}"
            return pd.to_datetime(date_str, format="%Y-%m-%d").date()
    return None

# Verificar as primeiras linhas do DataFrame para confirmar as alterações
incidents.head()


Unnamed: 0_level_0,Latitude,Longitude,Description,Color,Categoria,Data
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
1,41.336001,-8.560611,Assalto ao Banco Espírito Santo na Trofa. Foi ...,71b300,Assalto,1 de Agosto de 1984
2,38.010202,-7.870127,"Bombas Detonadas, 8 dispositivos no Bairro Ale...",3f51b5,Bomba Detonadas,1 de Fevereiro de 1985
3,38.748041,-9.18837,"Agressão, disparos contra administrador de uma...",ff5722,Agressão,1 de Junho de 1984
4,39.973942,-8.627772,"Vandalismo, colocação de Pregos na Estrada Nac...",ffeb3b,Vandalismo,1 de Maio de 1984
5,38.815583,-9.223445,Assalto à dependência do Crédito Predial Portu...,71b300,Assalto,2 de Novembro de 1983


In [51]:
incidents['Data'].apply(convert_title_to_date)

ID
1      1984-08-01
2      1985-02-01
3      1984-06-01
4      1984-05-01
5      1983-11-02
          ...    
119          None
120          None
121          None
122          None
123          None
Name: Data, Length: 123, dtype: object

In [49]:
incidents.info()

<class 'pandas.core.frame.DataFrame'>
Index: 123 entries, 1 to 123
Data columns (total 6 columns):
 #   Column       Non-Null Count  Dtype   
---  ------       --------------  -----   
 0   Latitude     123 non-null    float64 
 1   Longitude    123 non-null    float64 
 2   Description  123 non-null    object  
 3   Color        123 non-null    category
 4   Categoria    123 non-null    category
 5   Data         123 non-null    object  
dtypes: category(2), float64(2), object(2)
memory usage: 5.8+ KB


In [50]:
incidents.tail(10)

Unnamed: 0_level_0,Latitude,Longitude,Description,Color,Categoria,Data
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
114,38.528305,-8.89627,Assalto Falhado à Renault Portugal.,795548,Tentativa de Assalto (falhada),31 de Março de 1983
115,38.643909,-8.218274,Bombas Detonadas numa viatura em Montemor-o-No...,3f51b5,Bomba Detonadas,Agosto de 1982
116,38.269015,-8.730164,Fuga da Prisão de Pinheiro Cruz.,607d8b,Fugas da Prisão,Dezembro de 1982
117,41.008058,-8.642975,Assalto a um Banco não especificado em Espinho...,71b300,Assalto,Fevereiro de 1983
118,38.769544,-9.305461,Bombas Detonadas na residência de um empresári...,3f51b5,Bomba Detonadas,Janeiro de 1982
119,38.768374,-9.29494,Bombas Detonadas no Posto da Guarda Nacional R...,3f51b5,Bomba Detonadas,Janeiro de 1982
120,39.69455,-8.130265,Constante Vandalismo contra veiculos da Políci...,ffeb3b,Vandalismo,Julho de 1980
121,38.697433,-9.42323,Explosivos Detonados no Royal British Club em ...,3f51b5,Bomba Detonadas,Maio de 1981
122,39.744673,-8.811827,Bombas Detonadas no Posto da Guarda Nacional R...,3f51b5,Bomba Detonadas,Novembro de 1983
123,37.089224,-8.298158,Bombas Detonadas em Empreendimentos Turísitico...,3f51b5,Bomba Detonadas,Setembro de 1986
