# Folium: Criando mapas interativos com dados reais de forma¬†simples
<center><img src='images/Header 16-6.jpg'></center>

> Folium √© uma poderosa biblioteca Python que combina as a capacidades do ecossistema com a versatilidade da biblioteca Leaflet.js. Com o Folium podemos facilmente buscar, tratar e manipular nossos dados em python e, em seguida, visualiza-los de maneira interativa em um mapa Leaflet.

[https://python-visualization.github.io/folium/latest/index.html](https://python-visualization.github.io/folium/latest/index.html)

Neste artigo vamos trabalhar exibindo dados com algumas ferramentas do Folium: 

- Cria√ß√£o do mapa interativo centralizado em uma coordenada geogr√°fica
- MarkerCluster: posiciona um marcador na coordenada passada; agrupa marcadores pr√≥ximos de acordo com o zoom
- HeatMap: cria um ponto de calor na coordenada passada; Possibilita identificar onde possui a maior intensidade de pontos pela cor
- HeatMapWithTime: Cria uma linha temporal em mapas de calor

### Instala√ß√£o

A biblioteca Folium pode ser facilmente instalada usando o comando:

`$ pip install folium`

Se voc√™ est√° usando o Conda, o equivalente √©

`$ conda install folium -c conda-forge`

### Depend√™ncias

O Folium tem as seguintes depend√™ncias: branca, Jinja2, Numpy e Requests, que ser√£o instaladas automaticamente com o comando de instala√ß√£o.


## Criando um mapa

Esse √© o exemplo mais simples para a cria√ß√£o de um mapa:

In [1]:
import folium

m = folium.Map(location=(-22.9140008, -43.563634))

Pronto, est√° criado! Mas como podemos ver?

Se estivermos em um Jupyter Notebook, podemos visualizar facilmente chamando a instancia:

In [2]:
m

Ou podemos salvar como HTML:

In [3]:
m.save("html/index.html")

Podemos tamb√©m mudar o tipo de mapa que √© exibido facilmente adicionando o argumento `tiles` e o tipo de mapa. Por padr√£o √© carregado o tileset `OpenStreetMap` porem vamos ver como fica utilizando o `cartodb positron`

In [4]:
m = folium.Map(location=(-22.9140008, -43.563634), tiles="cartodb positron")
m

Agora que entendemos um pouco sobre a cria√ß√£o do mapa com o Folium, vamos trabalhar com algumas ferramentas que ele disponibiliza para a visualiza√ß√£o dos nossos dados!

Mas antes de iniciar, vamos carregar todas as libs:

In [5]:
import folium, googlemaps, time
from folium.plugins import HeatMap, MarkerCluster, HeatMapWithTime
import pandas as pd

# carregando a chave api
import dotenv, os
%load_ext dotenv
chave_api = os.getenv("API_KEY")

import warnings
warnings.simplefilter(action='ignore', category=pd.errors.SettingWithCopyWarning)

## MarkerCluster

Para utilizar essa primeira ferramenta, pensei em trabalhar com dados reais, como por exemplo: Quais s√£o os Mc Donald‚Äôs mais pr√≥ximos que est√£o abertos nesse momento?

Podemos conseguir esses dados de maneira f√°cil utilizando a biblioteca `googlemaps`.

Instanciando o `googlemaps` com a chave API:

In [6]:
client = googlemaps.Client(chave_api)

>Caso n√£o tenha uma chave de api do google clouds, crie uma por aqui [https://cloud.google.com/?hl=pt-BR](https://cloud.google.com/?hl=pt-BR), ap√≥s criar uma, ative as API‚Äôs: Places e Geocoding.

N√£o tem uma chave mas quer acompanhar o tutorial? Todas as respostas recebidas pela API est√£o dispon√≠veis no reposit√≥rio. Carregue-as da seguinte maneira:

In [7]:
import json
with open("responses/01-geocode-response.json", "r") as file:
    response = json.load(file)

# substitua a requisi√ß√£o √† api pelas linhas acima
# lembre de alterar o nome do arquivo

Utilizando o m√©todo geocode e passando uma string referente a um endere√ßo, nos √© retornado um dicion√°rio repleto de informa√ß√µes. Vamos trabalhar nesse momento somente com as coordenadas.

In [8]:
endereco = "rio de janeiro, rj, brasil"
coords_endereco = client.geocode(endereco)[0]["geometry"]["location"]

coords_endereco
# {'lat': -22.9068467, 'lng': -43.1728965}

{'lat': -22.9068467, 'lng': -43.1728965}

A partir dessa coordenada, vamos fazer uma busca pelos estabelecimentos pr√≥ximos definindo uma query que, no nosso caso vai ser "Mc Donald‚Äôs"

In [9]:
lista_coordenadas = []
keyword = "Mc Donalds"
response = client.places(query=keyword, location=coords_endereco, open_now=True)

for result in response["results"]:
        latitude = result["geometry"]["location"]["lat"]
        longitude = result["geometry"]["location"]["lng"]
        lista_coordenadas.append([latitude, longitude])

lista_coordenadas[0]
# [-22.9137805, -43.1666602]


[-22.911237, -43.1759081]

### Criando o mapa e adicionando os marcadores

Com os dados em m√£os, podemos inserir em um mapa da seguinte forma:

In [10]:
mapa = folium.Map(location= lista_coordenadas[0], zoom_start= 13)
marker = MarkerCluster().add_to(mapa)

MarkerCluster(locations=lista_coordenadas).add_to(mapa)
mapa.save('mcdonalds_nearby_marker.html')
mapa

Dessa vez definimos um zoom inicial para o nosso mapa com o `zoom_start=13`

O argumento `locations` recebe uma lista de coordenadas e para cada uma delas insere um marcador no respectivo local do mapa.

Podemos tamb√©m estilizar o marcador, com os argumentos:

In [11]:
folium.Marker(
    location=[-22.9068467, -43.1728965],
    tooltip="Rio de Janeiro",
    popup="Informa√ß√µes",
    icon=folium.Icon(icon="user", color="red"),
).add_to(mapa)
mapa
# Veja mais op√ß√µes em: https://github.com/lennardv2/Leaflet.awesome-markers e 
# https://fontawesome.com/search?s=solid&f=classic&o=r

Podemos ent√£o concluir que √© bem simples apresentar esses dados em um mapa, permitindo uma explora√ß√£o interativa para an√°lises e insights geogr√°ficos. Mas vamos explorar mais algumas ferramentas. Dessa vez vamos tentar com um mapa de calor.

## HeatMap

Um gr√°fico de calor em um mapa, pode nos ajudar a obter informa√ß√µes valiosas. O mapa de calor facilita a identifica√ß√£o de repeti√ß√µes e padr√µes em coordenadas geoespaciais.

Para exemplificar com dados reais um mapa de calor, vamos buscar as coordenadas de todos os *Mc Donald‚Äôs* de uma cidade. Vamos fazer uma busca parecida com a anterior, por√©m com um raio maior. Tamb√©m vamos coletar um pouco mais de dados da resposta, para limpar e refinar os resultados. E para isso, nada melhor que usar o amigo do analista de dados, sim, estou falando do `Pandas`. üêº

Vamos come√ßar fazendo uma nova requisi√ß√£o, utilizando agora o `places_nearby()` para definir um raio maior de busca.

In [12]:
lista_dfs = []
keyword = "Mc Donalds"
response = client.places_nearby(location=coords_endereco, keyword=keyword, radius=50000)

while True:
    time.sleep(0.1)

    for store in response["results"]:
        df = pd.DataFrame(
            {
                "nome": store["name"],
                "endereco": store["vicinity"],
                "latitude": store["geometry"]["location"]["lat"],
                "longitude": store["geometry"]["location"]["lng"],
            },
            index=[0],
        )
        lista_dfs.append(df)

    if "next_page_token" in response:
        next_page_token = response["next_page_token"]
        time.sleep(2.3)
        response = client.places_nearby(
            location=coords_endereco,
            keyword=keyword,
            radius=50000,
            page_token=next_page_token,
        )

    else:
        break

df_resultados = pd.concat(lista_dfs, ignore_index=True)
df_resultados.sample(5)

Unnamed: 0,nome,endereco,latitude,longitude
50,McDonald's,"Av. Jorn. Roberto Marinho, 231 - box 301/302 -...",-22.826635,-43.015602
18,McDonald's,"Pra√ßa Floriano, 19 - Centro, Rio de Janeiro",-22.911237,-43.175908
1,McDonald's,"R. Dr. Fel√≠ciano Sodr√©, 260 - Centro, S√£o Gon√ßalo",-22.823476,-43.046556
54,McDonald's,"Av. das Am√©ricas, 14801 - Recreio dos Bandeira...",-23.012553,-43.457515
2,McDonald's,"R. Mariz e Barros, 525 - Maracan√£, Rio de Janeiro",-22.914593,-43.219269


- Como s√£o muitos resultados, a API divide-os em p√°ginas e envia na resposta um token para a pr√≥xima.
- Ap√≥s a primeira requisi√ß√£o √© iniciado um loop infinito, que √© interrompido quando n√£o tem mais p√°ginas. Dentro do loop √© iniciado um for loop que itera por cada resultado da p√°gina, criando um dataframe para cada um.
- Caso a p√°gina tenha um token para a pr√≥xima p√°gina, √© feito uma nova requisi√ß√£o incluindo esse token como argumento.
- Por fim, fazemos uma concatena√ß√£o de DataFrames com `pd.concat()`

> Importante: Evite utilizar o m√©todo concat() dentro de loops, isso pode resultar em uma grande perca de efici√™ncia. Para casos como esse, guarde os DataFrames em uma lista tempor√°ria e, ao final do loop, utilize o pd.concat() para unir todos os DataFrames da lista.


### Tratando os dados

Ap√≥s criar o DataFrame com todos os resultados, podemos trata-los para remover poss√≠veis resultados indesejados ou duplicados.

E com os dados limpos, podemos salvar apenas o que nos interessa: as coordenadas.

In [13]:
lojas_mc_filtrado = df_resultados[
    (df_resultados["nome"].str.lower().str.contains("mcdonald"))
    | df_resultados["nome"].str.lower().str.contains("mc donald")
]
lojas_mc_filtrado = lojas_mc_filtrado.drop_duplicates(subset="endereco")

lista_coordenadas = lojas_mc_filtrado[['latitude', 'longitude']].values

print('Quantidade de resultados:', len(lista_coordenadas))
# Quantidade de resultados: 60
print('Exemplo de resultado:', lista_coordenadas[0])
# Exemplo de resultado: [-22.9056077 -43.1761831]

Quantidade de resultados: 60
Exemplo de resultado: [-22.9056077 -43.1761831]


### Plotando os dados no mapa

Agora vamos utilizar o plugin HeatMap para criar os pontos de calor e em seguida adicionar no mapa com a fun√ß√£o `add_to()`

In [14]:
map_calor = folium.Map(location=list(coords_endereco.values()), zoom_start=11, tiles="Cartodb dark_matter",)
HeatMap(lista_coordenadas, radius= 30).add_to(map_calor)
map_calor.save('mcdonalds_heatmap.html')
map_calor

Com dados parecidos aos anteriores por√©m em maior escala podemos identificar facilmente pontos de maior cobertura dos restaurantes.

## HeatmapWithTime

O mapa de calor com tempo possibilita visualizar de uma forma din√¢mica como os pontos do mapa evoluem ao longo do tempo. Esse recurso √© amplamente utilizado em diversas √°reas, como na analise de tr√°fego de ve√≠culos ao longo do dia ou mapeamento de jogadores em esportes ao longo das partidas, entre muitos outros exemplos.

Para exemplificar essa ferramenta vamos trabalhar usando a data de abertura das lojas da empresa renner (disponibilizadas publicamente em seu site: https://lojasrenner.mzweb.com.br/) e analisar o avan√ßo da cobertura da empresa pelo pa√≠s ao longo do tempo.

### Carregando e tratando dados

Partindo do zero: vamos puxar todos os dados da planilha com a fun√ß√£o `pd.read_excel()`. 

- Com o argumento `sheet_name` devemos passar o nome referente a aba que contem a lista de lojas.
- Em `skiprows` vamos passar quantas linhas devemos pular de cabe√ßalho
- E finalmente em `usecols`, selecionaremos as colunas que vamos come√ßar a trabalhar

In [15]:
df = pd.read_excel(
    "Planilhas e Fundamentos .xlsm", 
    sheet_name= 'Lista de Lojas | Stores List', 
    skiprows= 5,
    usecols = ['Opening date', 'Country', 'UF', 'State', 'City'])

df_renner = df.copy()
df_renner

Unnamed: 0,Opening date,Country,UF,State,City
0,2023-10-17 00:00:00,Brazil,MG,Minas Gerais,Ituiutaba
1,2023-10-11 00:00:00,Brazil,SC,Santa Catarina,Videira
2,2023-09-20 00:00:00,Brazil,ES,Esp√≠rito Santo,Vit√≥ria
3,2023-09-15 00:00:00,Brazil,PB,Para√≠ba,Jo√£o Pessoa
4,2023-09-09 00:00:00,Brazil,GO,Goi√°s,Goi√¢nia
...,...,...,...,...,...
764,41,4,57,,
765,118,46,205,,
766,10,0,10,,
767,4,0,4,,


>Pessoalmente gosto de criar copias de requisi√ß√µes ou de dataframes carregados de arquivos para n√£o precisar executar a opera√ß√£o novamente caso fa√ßa algo errado durante a analise.

In [16]:
# removendo dados faltantes
df_renner.dropna(inplace= True)

# tratando a data de abertura
df_renner['Opening date'] = pd.to_datetime(df_renner['Opening date']) 

# filtrando o pais
df_renner = df_renner[df_renner['Country'] == 'Brazil']

# criando uma coluna com endereco
df_renner['Address'] = df_renner.apply(lambda row: f"{row['City']} - {row['State']} - {row['Country']}", axis= 1)

df_renner.head(5)

Unnamed: 0,Opening date,Country,UF,State,City,Address
0,2023-10-17,Brazil,MG,Minas Gerais,Ituiutaba,Ituiutaba - Minas Gerais - Brazil
1,2023-10-11,Brazil,SC,Santa Catarina,Videira,Videira - Santa Catarina - Brazil
2,2023-09-20,Brazil,ES,Esp√≠rito Santo,Vit√≥ria,Vit√≥ria - Esp√≠rito Santo - Brazil
3,2023-09-15,Brazil,PB,Para√≠ba,Jo√£o Pessoa,Jo√£o Pessoa - Para√≠ba - Brazil
4,2023-09-09,Brazil,GO,Goi√°s,Goi√¢nia,Goi√¢nia - Goi√°s - Brazil


Com os dados do endere√ßo agora podemos fazer uma requisi√ß√£o ao geocode para obter as coordenadas do local e salvar em uma nova coluna.

In [17]:
def get_coords(address): return client.geocode(address)[0]['geometry']['location']
df_renner['Coords'] = df_renner['Address'].apply(lambda coords: tuple(get_coords(coords).values()))

df_renner_copia = df_renner.copy()
df_renner.head(4)

Unnamed: 0,Opening date,Country,UF,State,City,Address,Coords
0,2023-10-17,Brazil,MG,Minas Gerais,Ituiutaba,Ituiutaba - Minas Gerais - Brazil,"(-18.9745738, -49.4600885)"
1,2023-10-11,Brazil,SC,Santa Catarina,Videira,Videira - Santa Catarina - Brazil,"(-27.0052075, -51.15439500000001)"
2,2023-09-20,Brazil,ES,Esp√≠rito Santo,Vit√≥ria,Vit√≥ria - Esp√≠rito Santo - Brazil,"(-20.3196644, -40.3384748)"
3,2023-09-15,Brazil,PB,Para√≠ba,Jo√£o Pessoa,Jo√£o Pessoa - Para√≠ba - Brazil,"(-7.118835199999999, -34.8814339)"


A partir desse df, deixaremos somente o que vamos precisar para criar os marcadores no mapa: as coordenadas e o ano de abertura da loja.

In [18]:
# criando uma coluna com o ano
df_renner['Opening Year'] = df_renner['Opening date'].dt.year

# removendo dados desnecess√°rios
df_renner = df_renner.drop(['Country', 'UF', 'State', 'City', 'Opening date', 'Address'], axis=1)

# Ordenando pelo ano
df_renner = df_renner.sort_values(by='Opening Year')

df_renner.head(5)

Unnamed: 0,Coords,Opening Year
728,"(-31.7699685, -52.3312971)",1967
727,"(-30.0368176, -51.2089887)",1970
726,"(-29.9077898, -51.1847036)",1976
725,"(-30.0368176, -51.2089887)",1977
724,"(-29.68949839999999, -53.7923441)",1980


Estamos quase l√°, para criarmos o mapa de calor com linha do tempo precisamos criar uma `data` e um `index`. O `index` √© uma lista com marcadores, para o nosso caso usaremos uma lista com todos os anos passados da abertura da primeira loja at√© o ano atual. Para a `data`, precisamos criar uma lista do mesmo tamanho do index, com coordenadas ou listas de coordenadas. 

Vamos fazer alguns loops percorrendo o `index` e identificar qual loja est√° aberta e qual est√° fechada. Tamb√©m podemos atribuir uma intensidade, de 0 √† 1 junto com a coordenada. Criaremos uma defini√ß√£o de quanto mais tempo a loja est√° aberta, maior ser√° a for√ßa.

In [19]:
# criando o index de anos
primeiro_ano = df_renner["Opening Year"].min()
ultimo_ano = df_renner["Opening Year"].max()
year_index = list(range(primeiro_ano, ultimo_ano))
year_index.append(ultimo_ano)

coords_time_line = []
for year in year_index:
    lojas_coordenadas_por_ano = []
    for index, row in df_renner.iterrows():
        # calcula o tempo que a loja est√° aberta
        year_diff = year - row["Opening Year"]

        # caso seja menor que zero, n√£o √© adicionada ao mapa
        if year_diff < 0:
            pass
        else:
            # adicionando uma lista com as cordenadas e a intensidade
            coord = [row["Coords"][0], row["Coords"][1]]

            # para ilustrar, podemos criar uma defini√ß√£o de for√ßa de acordo com
            # a idade da loja
            if year_diff == 0:
                coord.append(0.5)
            elif year_diff == 1:
                coord.append(0.7)
            elif year_diff > 1:
                coord.append(1)

            lojas_coordenadas_por_ano.append(coord)

    coords_time_line.append(lojas_coordenadas_por_ano)

Por fim, estamos com duas vari√°veis: year_index e coords_time_line, as duas com o mesmo tamanho. Agora basta criar o mapa:

In [20]:
mapa_renner = folium.Map(location=[-17, -50], zoom_start=4)
HeatMap = HeatMapWithTime(
    data=coords_time_line,
    index=year_index,
    auto_play=True,
    max_opacity=0.3,
    name="Datas",
    blur=1,
    min_speed=1,
).add_to(mapa_renner)
mapa_renner.save('renner_heatmap-time.html')
mapa_renner

Com o HeatMapWithTime, tamb√©m configuramos mais algumas coisas, como opacidade m√°xima, blur e velocidade m√≠nima. 

## Conclus√£o

O folium ainda oferece outras funcionalidades al√©m das abordadas nesse artigo. Mas com uma exemplifica√ß√£o breve de algumas de suas ferramentas podemos perceber o potencial da biblioteca para an√°lise e gera√ß√£o de insights a partir de dados geoespaciais. 

Aliado a outras ferramentas para obten√ß√£o e manipula√ß√£o de dados, o Folium se torna pe√ßa chave em um conjunto para a an√°lise e visualiza√ß√£o de dados. Sua leveza e baixa dificuldade para gerar mapas interativos possibilitam uma an√°lise explorat√≥ria e explanat√≥ria eficaz.

Refer√™ncias

https://python-visualization.github.io/folium/latest/

https://lojasrenner.mzweb.com.br/


Reposit√≥rio do projeto:

https://github.com/Moscarde/FoliumTools

Se voc√™ leu at√© esse ponto, muito obrigado. Esta √© minha primeira publica√ß√£o, Fique √† vontade para me seguir em outras redes sociais e, se poss√≠vel me conte o que achou do conte√∫do. =)

https://www.linkedin.com/in/moscarde/

https://github.com/Moscarde/