<a href="https://colab.research.google.com/github/amadords/Projetos-Publicos/blob/master/Plotando_dados_em_Mapas_com_Folium.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Plotando dados em Mapas com Folium
---


[![LinkedIn](https://img.shields.io/badge/LinkedIn-DanielSousaAmador-purple.svg)](https://www.linkedin.com/in/daniel-sousa-amador)
[![GitHub](https://img.shields.io/badge/GitHub-amadords-darkblue.svg)](https://github.com/amadords)
[![Medium](https://img.shields.io/badge/Medium-DanielSousaAmador-darkorange.svg)](https://medium.com/@daniel.s.amador)

![img](https://intro-to-code.readthedocs.io/en/latest/_images/folium.png)

A documentação da biblioteca se encontra em seu [GitHub](https://python-visualization.github.io/folium/modules.html).


Trabalhar com dados é algo incrível! Se temos dados, temos como fazer algo com eles.

Às vezes em uma base de dados, encontramos Latitudes e Longitudes respectivas a cada dado e, é comum não utilizarmos esse tipo de dado por achar que não há utilidade. Mas será que não tem mesmo?


Com a biblioteca **folium**, podemos criar mapas com esses dados e plotar, por exemplo, mapas de calor ou marcar regiões específicas.

Vamos aos exemplos.

Trabalho original - [Minerando Dados](https://www.youtube.com/watch?v=EElW-W0GmrA&t=877s)


### Importando a biblioteca necessária

In [1]:
import folium

![mossoró](https://s2.glbimg.com/0iLYqrKYV_z8X3_NYVGKxhG2UkA=/s.glbimg.com/og/rg/f/original/2013/11/14/mossoro_panoramica_-_giovanni_sergio_-_606x455.jpg)

Minha cidade natal é **Mossoró-RN** e suas coordenadas são:

- Latitude: -5.18804
- Longitude: -37.3441

Então vamos inicias plotando essas coordenadas.

In [2]:
# latitude, longitude
mapa = folium.Map(location=[-5.18804,-37.3441])

In [3]:
mapa

Veja como foi fácil, quase tão fácil quanto ler um arquivo no pandas.

# Estilos

## Stamen Toner

Cria uma mapa em preto e branco. Facilita muito a visualização, inclusive de rotas.

In [4]:
folium.Map(
    location=[-5.18804,-37.3441],
    tiles='Stamen Toner'
)

## Stamen Terrain
Cria um mapa com nitidez nos relevos presentes.

In [5]:
folium.Map(
    location=[-5.18804,-37.3441],
    tiles='Stamen Terrain',
)

# Zoom

A função é intuitiva. 

Basicamente será útil quando se quer focar em uma parte específica do ponto plotado.

In [6]:
folium.Map(
    location=[-5.18804,-37.3441],
    tiles='Stamen Terrain',
    zoom_start=15
)

# Adicionando Marcadores

Como é comum no **Google Maps**, alguns locais como hospitais, igrejas, praças, recebem um marcação para facilitar a localização.

No nosso exemplo vou plotar o Hospital Regional Tarcisio Maia em Mossoró-RN.

In [7]:
# criando o mapa

mapa = folium.Map(
    location=[-5.18804,-37.3441],
    tiles='Stamen Terrain',
    zoom_start=15
)

In [8]:
# adicionando os marcadores

folium.Marker(
    [-5.188979, -37.364880],
    popup='<i>Hospital Tarcisio Maia</i>', 
    tooltip='Clique aqui!'
    ).add_to(mapa);

In [9]:
mapa

**Mudando a cor do marcador para verde**

In [10]:
folium.Marker(
    [-5.188979, -37.364880],
    popup='<i>Hospital Tarcisio Maia</i>', 
    tooltip='Clique aqui!',
    icon=folium.Icon(color='green')
    ).add_to(mapa);

In [11]:
mapa

**Criando um marcador circular**

In [12]:
folium.CircleMarker(
    location=[-5.188979, -37.364880],
    radius=50,
    color='#3186cc',
    fill=True,
    fill_color='#3186cc'
).add_to(mapa);

In [13]:
mapa

### Exibindo as coordenadas de Latitude e Longitude

Para vários marcadores é útil que esteja presente.

In [14]:
mapa.add_child(folium.LatLngPopup())

# Plugins

Os plugins nos uxiliarão em nossa tarefas de criar mapas de calor.

A documentação pode ser vista no link abaixo.

[plugins](https://python-visualization.github.io/folium/plugins.html)

**Importando as bibliotecas necessárias**

In [15]:
import pandas as pd
from folium import plugins

**Lendo a base de dados**

In [16]:
df = pd.read_csv('olist_geolocation_dataset.csv')

**Visualização das primeiras linhas**

In [17]:
df.head()

Unnamed: 0,geolocation_zip_code_prefix,geolocation_lat,geolocation_lng,geolocation_city,geolocation_state
0,1037,-23.545621,-46.639292,sao paulo,SP
1,1046,-23.546081,-46.64482,sao paulo,SP
2,1046,-23.546129,-46.642951,sao paulo,SP
3,1041,-23.544392,-46.639499,sao paulo,SP
4,1035,-23.541578,-46.641607,sao paulo,SP


**A base de dados tem 1.000.163 (um milhão e cento e sessenta e três entradas)**

In [18]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1000163 entries, 0 to 1000162
Data columns (total 5 columns):
 #   Column                       Non-Null Count    Dtype  
---  ------                       --------------    -----  
 0   geolocation_zip_code_prefix  1000163 non-null  int64  
 1   geolocation_lat              1000163 non-null  float64
 2   geolocation_lng              1000163 non-null  float64
 3   geolocation_city             1000163 non-null  object 
 4   geolocation_state            1000163 non-null  object 
dtypes: float64(2), int64(1), object(2)
memory usage: 38.2+ MB


Como temos mais de um milhão de entradas, então vamos pegar somente as dezoito mil finais para plotar nossso mapa.

In [19]:
coordenadas=[]
for lat,lng in zip(df.geolocation_lat.values[:18000],df.geolocation_lng.values[:18000]):
  coordenadas.append([lat,lng])

In [20]:
mapa = folium.Map(location=[ -23.5489, -46.6388 ],zoom_start=5,tiles='Stamen Toner')

In [21]:
mapa.add_child(plugins.HeatMap(coordenadas))        
mapa

### Visualizando os dados mais distribuidos no mapa

**Veja que temos os 26 estados e o Distrito Federal**

In [22]:
df.geolocation_state.unique()

array(['SP', 'RN', 'AC', 'RJ', 'ES', 'MG', 'BA', 'SE', 'PE', 'AL', 'PB',
       'CE', 'PI', 'MA', 'PA', 'AP', 'AM', 'RR', 'DF', 'GO', 'RO', 'TO',
       'MT', 'MS', 'RS', 'PR', 'SC'], dtype=object)

In [23]:
len(df.geolocation_state.unique())

27

**Reduzindo a base de dados**

Como temos mais de um milhão de dados, vamos visualizar quanto temos em cada estado para posteriormente fazer a redução.

In [24]:
df.geolocation_state.value_counts()

SP    404268
MG    126336
RJ    121169
RS     61851
PR     57859
SC     38328
BA     36045
GO     20139
ES     16748
PE     16432
DF     12986
MT     12031
CE     11674
PA     10853
MS     10431
MA      7853
PB      5538
RN      5041
PI      4549
AL      4183
TO      3576
SE      3563
RO      3478
AM      2432
AC      1301
AP       853
RR       646
Name: geolocation_state, dtype: int64

Para reduzir é simples, basta passar a função *sample* da bibliotecas pandas e passar o percentual que se quer.

Vamos utilizar 0.03, o que corresponde a 3% da base de dados original.

In [25]:
df_reduzido = df.sample(frac = 0.03)

In [26]:
df_reduzido.geolocation_state.value_counts()

SP    12015
MG     3784
RJ     3674
RS     1857
PR     1782
SC     1167
BA     1092
GO      603
ES      513
PE      465
DF      421
MT      384
CE      326
PA      322
MS      293
MA      234
PB      177
RN      155
PI      136
AL      134
SE      109
TO      104
RO       98
AM       79
AC       42
AP       28
RR       11
Name: geolocation_state, dtype: int64

**Criando lista com apensa latitudes e longitudes**

In [27]:
coordenadas=[]
for lat,lng in zip(df_reduzido.geolocation_lat.values,df_reduzido.geolocation_lng.values):
  coordenadas.append([lat,lng])

**Exibindo 5 primeiros itens da lista**

In [28]:
coordenadas[:5]

[[-23.55685108881068, -46.66894297446478],
 [-20.24238185932879, -56.378984765754474],
 [-20.470203020543565, -54.61276210118859],
 [-25.047512127006215, -51.53710655378235],
 [-29.179782371815694, -51.19858990062022]]

**Criando o mapa**

In [29]:
mapa = folium.Map(location=[-15.788497,-47.879873],zoom_start=5,tiles='Stamen Toner')

**Passando as coordenadas para criar o mapa de calor (HeatMap)**

In [30]:
mapa.add_child(plugins.HeatMap(coordenadas))        
mapa

### Persistindo o mapa em disco

In [31]:
mapa.save('mapa-consumidor.html')

# Obrigado!

Obrigado por ter disponibilizado um pouco do seu tempo e atenção aqui. Espero que, de alguma forma, tenha sido útil para seu crescimento. Se houver qualquer dúvida ou sugestão, não hesite em entrar em contato no [LinkedIn](https://www.linkedin.com/in/daniel-sousa-amador) e verificar meus outros projetos no [GitHub](https://github.com/amadords).

[![LinkedIn](https://img.shields.io/badge/LinkedIn-DanielSousaAmador-purple.svg)](https://www.linkedin.com/in/daniel-sousa-amador)
[![GitHub](https://img.shields.io/badge/GitHub-amadords-darkblue.svg)](https://github.com/amadords)
[![Medium](https://img.shields.io/badge/Medium-DanielSousaAmador-darkorange.svg)](https://medium.com/@daniel.s.amador)



<center><img width="90%" src="https://raw.githubusercontent.com/danielamador12/Portfolio/master/github.png"></center>