# GEORREFERENCIAMENTO OVP-DH
## Jupyter Notebook compartilhado

In [1]:
import numpy as np
import pandas as pd
import json
import ipywidgets
import folium
from folium import plugins
from folium.plugins import MarkerCluster
import psycopg2
from sqlalchemy import create_engine
from getpass import getpass

### Abrindo dataset

In [2]:
#abrindo o arquivo csv e eliminando a coluna sem dados
data = pd.read_csv('../data/georef.csv').drop(columns=['Unnamed: 0'])
#lendo as cinco primeiras linhas
data.head()

Unnamed: 0,id_ocorrencia,conduta,natureza_lesao,tipo_crime,uf,municipio,endereco,logradouro_sede,geolocalizacao,latitude,longitude
0,2,Operação policial - Repressão a manifestação,Crimes de abuso de autoridade (Lei 4.898/1965),Impedir ou cercear o direito de reunião,RIO DE JANEIRO,Rio de Janeiro,Câmara Municipal,Câmara Municipal,0101000020E6100000E013EB54F91546C0DC847B65DE8A...,-22.542456,-44.171672
1,2,Operação policial - Repressão a manifestação,Crimes de abuso de autoridade (Lei 4.898/1965),Ameaçar a integridade física do indivíduo,RIO DE JANEIRO,Rio de Janeiro,Câmara Municipal,Câmara Municipal,0101000020E6100000E013EB54F91546C0DC847B65DE8A...,-22.542456,-44.171672
2,4,Operação policial - Repressão a manifestação,Crimes de lesão corporal (CP),Lesão corporal grave,DISTRITO FEDERAL,Brasília,Esplanada dos Ministérios,Esplanada dos Ministérios,0101000020E6100000EC53E98255EF47C0B71F95078E98...,-15.797959,-47.869797
3,4,Operação policial - Repressão a manifestação,Crimes de abuso de autoridade (Lei 4.898/1965),Impedir ou cercear o direito de reunião,DISTRITO FEDERAL,Brasília,Esplanada dos Ministérios,Esplanada dos Ministérios,0101000020E6100000EC53E98255EF47C0B71F95078E98...,-15.797959,-47.869797
4,4,Operação policial - Repressão a manifestação,Crimes de abuso de autoridade (Lei 4.898/1965),Ameaçar a integridade física do indivíduo,DISTRITO FEDERAL,Brasília,Esplanada dos Ministérios,Esplanada dos Ministérios,0101000020E6100000EC53E98255EF47C0B71F95078E98...,-15.797959,-47.869797


In [3]:
#obtendo informacoes sobre o dataset
data.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 355 entries, 0 to 354
Data columns (total 11 columns):
id_ocorrencia      355 non-null int64
conduta            355 non-null object
natureza_lesao     355 non-null object
tipo_crime         355 non-null object
uf                 355 non-null object
municipio          355 non-null object
endereco           215 non-null object
logradouro_sede    227 non-null object
geolocalizacao     355 non-null object
latitude           355 non-null float64
longitude          355 non-null float64
dtypes: float64(2), int64(1), object(8)
memory usage: 30.6+ KB


## Construindo o mapa 

1. Selecionar marcadores a partir de condição

IAN: por favor, implemente: 
 - Ao clicar no ícone abrir uma tabelinha com algumas informações do dataframe, não só o que eu determino na variável 'popup' (infos que quero: conduta / natureza_lesao / logradouro_sede)

### Definindo 'natureza_lesao' como objetivo de pesquisa

In [4]:
data['natureza_lesao'].unique()

array(['Crimes de abuso de autoridade (Lei 4.898/1965)',
       'Crimes de lesão corporal (CP)', 'Crimes contra a honra (CP)',
       'Crimes contra a liberdade pessoal (CP)',
       'Crimes contra a liberdade sexual (CP)',
       'Crimes contra a vida (CP)',
       'Crimes contra a administração da justiça (CP)',
       'Crimes de tortura (Lei 9.455/1997)',
       'Crimes contra a administração em geral (CP)',
       'Crimes contra a paz pública (CP)',
       'Crimes de periclitação da vida e da saúde (CP)',
       'Crimes de dano (CP)', 'Crimes de perigo comum (CP)',
       'Abuso de autoridade do ECA (Lei 8.069/1990)',
       'Crime de extorsão (CP)', 'Crimes contra a fé pública (CP)',
       'Convenção contra o crime de genocídio'], dtype=object)

In [5]:
# Pegando a média da latitudes e longitudes das ocorrências
latmean = data['latitude'].mean()
lonmean = data['longitude'].mean()

# Criando o mapa
mapa_choropleth = folium.Map(location=[latmean,lonmean], 
                         zoom_start=8, 
                         tiles='OpenStreetMap', 
                         control_scale=True)

# Minimapa
minimap = plugins.MiniMap(toggle_display=True)
mapa_choropleth.add_child(minimap)

# Plugins - fullscreen
plugins.Fullscreen(position='topleft').add_to(mapa_choropleth);

### Plotando sub-grupos em camadas

In [6]:
#denominacoes no arquivo json
municipios_geo = r'../data/geojs_estado_sp.json'

#abrir o arquivo na classe dicionario
with open(municipios_geo, encoding='latin-1') as municipios:
    municipios_dict = json.load(municipios)
    
#iterando sobre o dicionario para obter os nomes dos municipios
nomes_json = []
for index in range(len(municipios_dict['features'])):
    nomes_json.append(municipios_dict['features'][index]['properties']['name'])

In [7]:
#transformacao do dataset em tabela para intensidade das camadas
municipios_incidentes = data[data['uf'] == 'SÃO PAULO']['municipio'].value_counts()

In [8]:
#apenas Santa Barbara D'Oeste esta com o nome diferente
#transposicao dos nomes no json para a tabela gerada
municipios_incidentes.rename({"Santa Bárbara D'Oeste":"Santa Bárbara d'Oeste"}, inplace=True)

In [9]:
#selecao dos municios paulistas para aplicar a intensidade encontrada
incidencia_df = pd.DataFrame(municipios_incidentes.reset_index())
incidencia_df.rename({'index':'municipio',
                      'municipio':'incidencia'},
                     axis=1, 
                     inplace = True)

In [10]:
# json completo tem 10 mil coordenadas e mais de 600 municipios
# ha 71 municipios afetados
# selecionar elementos do json que estao na lista de municipios afetados
params_afetados = [x for x in municipios_dict['features'] if x['properties']['name'] in incidencia_df.municipio.to_list()]

# incluir parametros em dicionario a ser formatado
params_dict = { "type": "FeatureCollection", "features": params_afetados}

# criar json, em utf-8 (originalmente latin-1), com base na lista reduzida
geo_data = json.dumps(params_dict)

In [11]:
#criando o mapa do choropleth
folium.Choropleth(
    geo_data=geo_data,
    data=incidencia_df,
    name='Choropleth',
    columns=['municipio', 'incidencia'],
    key_on='feature.properties.name',
    fill_color='OrRd', 
    fill_opacity=0.7, 
    line_opacity=0.2,
    legend_name='incidentes por municipio',
    smooth_factor=0).add_to(mapa_choropleth);

In [12]:
def grupo_mapa(natureza_lesao):
    group = plugins.FeatureGroupSubGroup(all_subgroups, natureza_lesao)
    mapa_choropleth.add_child(group)
    
    for i in data[data['natureza_lesao'] == natureza_lesao].itertuples():
            folium.Marker(location=[i.latitude, i.longitude], 
                          popup=natureza_lesao, 
                          icon=folium.Icon(color=dic_nl[natureza_lesao], 
                                           icon='bolt', 
                                           prefix='fa')).add_to(group)

for i in dic_nl.keys():
    grupo_mapa(i)

NameError: name 'dic_nl' is not defined

### Adicionando menu

In [13]:
folium.LayerControl(collapsed=False).add_to(mapa_choropleth);

### Visualizando o mapa

In [14]:
mapa_choropleth

### Salvando o mapa

In [18]:
mapa_choropleth.save('../examples/mapa_choropleth.html')