<img alt="Colaboratory logo" width="15%" src="https://raw.githubusercontent.com/carlosfab/escola-data-science/master/img/novo_logo_bg_claro.png">

#### **Data Science na Prática 3.0**
*by [sigmoidal.ai](https://sigmoidal.ai)*

---

# Mapas

Em muitos casos, é interessante que possamos utilizar mapas para representar nossos dados. A depender do escopo e objetivo do nosso projeto, eles serão primordiais. Portanto, conhecer algumas alternativas para plotar esse tipo de dado é muito importante!

<center><img src="https://i.imgur.com/M3toZK8.png"width="450px"></center>

Uma das possibilidades é a biblioteca [PyDeck](https://deckgl.readthedocs.io/en/latest/). Essa biblioteca é extremamente poderosa, e nos possibilita plotar gráficos muito impressionantes. Essa biblioteca é focada em mapas e faz um excelente trabalho no que se propões a fazer.

<center><img src="https://miro.medium.com/max/3504/1*ms3kXnMX0IJjSYocKxbwHw.png"width="450px"></center>

A outra possibilidade é o [Folium](http://python-visualization.github.io/folium/). Essa também é uma possibilidade interessante, que nos possibilita plotar mapas extremamente interessantes, e entregar um trabalho muito bacana no que diz respeito a mapas.

Mas vamos ver na prática como plotar esses mapas.


In [None]:
# importando as bibliotecas necessárias
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import folium

Para esse projeto, utilizaremos um conjunto de dados do portal [Inside Airbnb](http://insideairbnb.com) com dados da cidade de Nova Iorque.

Dentro desse portal, você também pode encontrar conjuntos de dados de outras cidades, para plotar diferentes mapas.


In [None]:
# importando os dados
df = pd.read_csv("http://data.insideairbnb.com/united-states/ny/new-york-city/2021-06-02/visualisations/listings.csv")

Esse conjunto é muito grande, e para os propósitos dessa aula, isso seria um problema. Para que o mapa fique mais focado, nossa visualização melhor e mais informativa, irei utilizar apenas uma fração do conjunto de dados.

Isso também irá melhorar a performance do nosso mapa interativo.

In [None]:
# verificando o tamanho do dataset
print('Dataset original: ', df.shape)

# criando um dataset menor
df_map = df.sample(frac=0.01, random_state=0)

# verificando o tamanho do dataset
print('Dataset para o plot: ', df_map.shape)

Dataset original:  (36230, 16)
Dataset para o plot:  (362, 16)


Para plotar o nosso mapa, vamos precisar extrair os valores de algumas colunas e transformar em variáveis, para passarmos como parâmetro para o nosso mapa.

Essas variáveis são `latitude`, `longitude` e os labels que queremos mostrar quando passarmos o mouse por. cima dos pontos, que nesse caso serão a descrição dos anúncios, salvos na coluna `name`.

Com essas variáveis estaremos prontos para criar nosso mapa!

In [None]:
# criando as variáveis necessárias
latitude = df_map.latitude.values
longitude = df_map.longitude.values
listings = df_map.name.values

Para criar o mapa, primeiro precisamos saber a localidade de onde o nosso mapa irá começar. Para isso, utilizaremos o [Google Maps](https://www.google.com/maps).

Na barra de pesquisa, busque pela cidade que está analisando, no nosso caso, Nova Iorque. Ao visualizar o mapa, iremos buscar as informações de latitude, longigute e o zoom inicial no endereço do browser.

Clique na barra de endereço, e encontre esses 3 parâmetros, que estarão juntos, em sequência.

Pronto, você já tem o seu mapa base!

In [None]:
# criando o mapa
nyc = folium.Map(location=[40.7267795,-73.8828923],
                 zoom_start=10)
nyc

Com nosso mapa interativo plotado, nós podemos também adicionar nossos markers, que são os anúncios.

Eles serão plotados como marcadores em suas respectivas localidades, com suas descrições sendo exibidas ao passarmos o mouse por cima deles.

Para isso, vamos criar uma função, que percorre nossos pontos e os adiciona ao mapa.

In [None]:
# adicionando os marcadores
for lat, lon, listing in zip(latitude, longitude, listings):
    folium.Marker(location=[float(lat), float(lon)], popup=listing).add_to(nyc)
# plotando o mapa
nyc.save('nyc_map.html')
nyc

Além disso, podemos também facilmente salvar nosso mapa finalizado como um artigo html, para ser aproveitado de outras formas.

Também é possível salvar como json.

In [None]:
# salvando
nyc.save('nyc_map.html')

In [None]:
pip install pydeck -q

In [None]:
#mapanyc

# criando a camada
layer = pdk.Layer(
    'HexagonLayer',  # `type` positional argument is here
    df_map,
    get_position=['longitude', 'latitude'],
    auto_highlight=True,
    elevation_scale=50,
    pickable=True,
    elevation_range=[0, 3000],
    extruded=True,
    coverage=1)

# definindo a visão
view_state = pdk.ViewState(
    longitude=-73.8828923,
    latitude=40.7267795,
    zoom=6,
    min_zoom=5,
    max_zoom=15,
    pitch=40.5,
    bearing=-27.36)

# combinando os dois em um deck, e visualizando
r = pdk.Deck(layers=[layer], initial_view_state=view_state)

# salvando como html
r.to_html('hexagon-example.html')

<IPython.core.display.Javascript object>

In [None]:
# código de exemplo do PyDeck
import pydeck as pdk

UK_ACCIDENTS_DATA = 'https://raw.githubusercontent.com/visgl/deck.gl-data/master/examples/3d-heatmap/heatmap-data.csv'

layer = pdk.Layer(
    'HexagonLayer',  # `type` positional argument is here
    UK_ACCIDENTS_DATA,
    get_position=['lng', 'lat'],
    auto_highlight=True,
    elevation_scale=50,
    pickable=True,
    elevation_range=[0, 3000],
    extruded=True,
    coverage=1)

# Set the viewport location
view_state = pdk.ViewState(
    longitude=-1.415,
    latitude=52.2323,
    zoom=6,
    min_zoom=5,
    max_zoom=15,
    pitch=40.5,
    bearing=-27.36)

# Combined all of it and render a viewport
r = pdk.Deck(layers=[layer], initial_view_state=view_state)
r.to_html('hexagon-example.html')

<IPython.core.display.Javascript object>