<a href="https://colab.research.google.com/github/amadords/Projetos-Publicos/blob/master/Plotando_dados_em_Mapas_com_Folium.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Plotando dados em Mapas com Folium**
---

[![LinkedIn](https://img.shields.io/badge/LinkedIn-DanielSousaAmador-cyan.svg)](https://www.linkedin.com/in/daniel-sousa-amador)
[![GitHub](https://img.shields.io/badge/GitHub-amadords-darkblue.svg)](https://github.com/amadords)
[![Medium](https://img.shields.io/badge/Medium-DanielSousaAmador-white.svg)](https://daniel-s-amador.medium.com/)

![img](https://intro-to-code.readthedocs.io/en/latest/_images/folium.png)

A documentação da biblioteca se encontra em seu [GitHub](https://python-visualization.github.io/folium/modules.html).


Trabalhar com dados é algo incrível! Se temos dados, temos como fazer algo com eles.

Às vezes em uma base de dados, encontramos Latitudes e Longitudes respectivas a cada dado e, é comum não utilizarmos esse tipo de dado por achar que não há utilidade. Mas será que não tem mesmo?


Com a biblioteca **folium**, podemos criar mapas com esses dados e plotar, por exemplo, mapas de calor ou marcar regiões específicas.

Vamos aos exemplos.

Trabalho original - [Minerando Dados](https://www.youtube.com/watch?v=EElW-W0GmrA&t=877s)


### Importando a biblioteca necessária

In [None]:
import folium

![mossoró](https://s2.glbimg.com/0iLYqrKYV_z8X3_NYVGKxhG2UkA=/s.glbimg.com/og/rg/f/original/2013/11/14/mossoro_panoramica_-_giovanni_sergio_-_606x455.jpg)

Minha cidade natal é **Mossoró-RN** e suas coordenadas são:

- Latitude: -5.18804
- Longitude: -37.3441

Então vamos iniciar plotando essas coordenadas.

In [None]:
# latitude, longitude
mapa = folium.Map(location=[-5.18804,-37.3441])

In [None]:
mapa

Veja como foi fácil, quase tão fácil quanto ler um arquivo no pandas.

# Estilos

## Stamen Toner

Cria uma mapa em preto e branco. Facilita muito a visualização, inclusive de rotas.

In [None]:
folium.Map(
    location=[-5.18804,-37.3441],
    tiles='Stamen Toner'
)

## Stamen Terrain
Cria um mapa com nitidez nos relevos presentes.

In [None]:
folium.Map(
    location=[-5.18804,-37.3441],
    tiles='Stamen Terrain',
)

# Zoom

A função é intuitiva. 

Basicamente será útil quando se quer focar em uma parte específica do ponto plotado.

In [None]:
folium.Map(
    location=[-5.18804,-37.3441],
    tiles='Stamen Terrain',
    zoom_start=15
)

# Adicionando Marcadores

Como é comum no **Google Maps**, alguns locais como hospitais, igrejas, praças, recebem um marcação para facilitar a localização.

No nosso exemplo vou plotar o Hospital Regional Tarcisio Maia em Mossoró-RN.

In [None]:
# criando o mapa

mapa = folium.Map(
    location=[-5.18804,-37.3441],
    tiles='Stamen Terrain',
    zoom_start=15
)

In [None]:
# adicionando os marcadores

folium.Marker(
    [-5.188979, -37.364880],
    popup='<i>Hospital Tarcisio Maia</i>', 
    tooltip='Clique aqui!'
    ).add_to(mapa);

In [None]:
mapa

**Mudando a cor do marcador para verde**

In [None]:
folium.Marker(
    [-5.188979, -37.364880],
    popup='<i>Hospital Tarcisio Maia</i>', 
    tooltip='Clique aqui!',
    icon=folium.Icon(color='green')
    ).add_to(mapa);

In [None]:
mapa

**Criando um marcador circular**

In [None]:
folium.CircleMarker(
    location=[-5.188979, -37.364880],
    radius=50,
    color='#3186cc',
    fill=True,
    fill_color='#3186cc'
).add_to(mapa);

In [None]:
mapa

### Exibindo as coordenadas de Latitude e Longitude

Para vários marcadores é útil que esteja presente.

In [None]:
mapa.add_child(folium.LatLngPopup())

# Plugins

Os plugins nos uxiliarão em nossa tarefas de criar mapas de calor.

A documentação pode ser vista no link abaixo.

[plugins](https://python-visualization.github.io/folium/plugins.html)

**Importando as bibliotecas necessárias**

In [None]:
import pandas as pd
from folium import plugins

**Lendo a base de dados**

In [None]:
df = pd.read_csv('olist_geolocation_dataset.csv')

**Visualização das primeiras linhas**

In [None]:
df.head()

Unnamed: 0,geolocation_zip_code_prefix,geolocation_lat,geolocation_lng,geolocation_city,geolocation_state
0,1037,-23.545621,-46.639292,sao paulo,SP
1,1046,-23.546081,-46.64482,sao paulo,SP
2,1046,-23.546129,-46.642951,sao paulo,SP
3,1041,-23.544392,-46.639499,sao paulo,SP
4,1035,-23.541578,-46.641607,sao paulo,SP


**A base de dados tem 1.000.163 (um milhão e cento e sessenta e três entradas)**

In [None]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 35000 entries, 0 to 34999
Data columns (total 5 columns):
 #   Column                       Non-Null Count  Dtype  
---  ------                       --------------  -----  
 0   geolocation_zip_code_prefix  35000 non-null  int64  
 1   geolocation_lat              35000 non-null  float64
 2   geolocation_lng              35000 non-null  float64
 3   geolocation_city             35000 non-null  object 
 4   geolocation_state            35000 non-null  object 
dtypes: float64(2), int64(1), object(2)
memory usage: 1.3+ MB


Como temos mais de um milhão de entradas, então vamos pegar somente as dezoito mil finais para plotar nossso mapa.

In [None]:
coordenadas=[]
for lat,lng in zip(df.geolocation_lat.values[:18000],df.geolocation_lng.values[:18000]):
  coordenadas.append([lat,lng])

In [None]:
mapa = folium.Map(location=[ -23.5489, -46.6388 ],zoom_start=5,tiles='Stamen Toner')

In [None]:
mapa.add_child(plugins.HeatMap(coordenadas))        
mapa

### Visualizando os dados mais distribuidos no mapa

**Veja que temos os 26 estados e o Distrito Federal**

In [None]:
df.geolocation_state.unique()

array(['SP', 'RN', 'S'], dtype=object)

In [None]:
len(df.geolocation_state.unique())

3

**Reduzindo a base de dados**

Como temos mais de um milhão de dados, vamos visualizar quanto temos em cada estado para posteriormente fazer a redução.

In [None]:
df.geolocation_state.value_counts()

SP    34998
RN        1
S         1
Name: geolocation_state, dtype: int64

Para reduzir é simples, basta passar a função *sample* da bibliotecas pandas e passar o percentual que se quer.

Vamos utilizar 0.03, o que corresponde a 3% da base de dados original.

In [None]:
df_reduzido = df.sample(frac = 0.03)

In [None]:
df_reduzido.geolocation_state.value_counts()

SP    1050
Name: geolocation_state, dtype: int64

**Criando lista com apensa latitudes e longitudes**

In [None]:
coordenadas=[]
for lat,lng in zip(df_reduzido.geolocation_lat.values,df_reduzido.geolocation_lng.values):
  coordenadas.append([lat,lng])

**Exibindo 5 primeiros itens da lista**

In [None]:
coordenadas[:5]

[[-23.57643949930751, -46.62508260115993],
 [-23.48530875797796, -46.65443518373822],
 [-23.56767815208615, -46.646803781839765],
 [-23.544184893415704, -46.63966516818631],
 [-23.48514561532687, -46.60697659172488]]

**Criando o mapa**

In [None]:
mapa = folium.Map(location=[-15.788497,-47.879873],zoom_start=5,tiles='Stamen Toner')

**Passando as coordenadas para criar o mapa de calor (HeatMap)**

In [None]:
mapa.add_child(plugins.HeatMap(coordenadas))        
mapa

### Persistindo o mapa em disco

In [None]:
mapa.save('mapa-consumidor.html')

# Obrigado!


[![LinkedIn](https://img.shields.io/badge/LinkedIn-DanielSousaAmador-cyan.svg)](https://www.linkedin.com/in/daniel-sousa-amador)
[![GitHub](https://img.shields.io/badge/GitHub-amadords-darkblue.svg)](https://github.com/amadords)
[![Medium](https://img.shields.io/badge/Medium-DanielSousaAmador-white.svg)](https://daniel-s-amador.medium.com/)



<center><img width="90%" src="https://raw.githubusercontent.com/danielamador12/Portfolio/master/github.png"></center>