![Insper](https://github.com/danielscarvalho/Insper-DS-Dicas/blob/master/Insper-Logo.png?raw=true)

# Insper Pós-Graduação
## Programa Avançada em Data Science e Decisão [»](https://www.insper.edu.br/pos-graduacao/programas-avancados/data-science-e-decisao/)

# Aula 9 - Análise Espacial - Visualização

### GeoPandas

O GeoPandas estende a bibliotecas Pandas de ciência de dados adicionando suporte para dados geoespaciais. 

A estrutura de dados central do GeoPandas é geopandas.GeoDataFrame, uma subclasse de pandas.DataFrame capaz de armazenar colunas geométricas e realizar operações espaciais. As geometrias são tratadas por geopandas.GeoSeries, uma subclasse de pandas.Series. Portanto, seu GeoDataFrame é uma combinação de Series com seus dados (numéricos, booleanos, texto etc.) e GeoSeries com geometrias (pontos, polígonos etc.). Você pode ter quantas colunas com geometrias desejar, não há limite típico para software GIS de desktop. [>>](https://geopandas.org/getting_started/introduction.html)

![GeoPandas](https://geopandas.org/_images/dataframe.svg)

### Instalação dos pacotes necessários

Note que vamos instalar diversas LIBs de uma vez só...

Instalar na linha de comando, ou com o conda...

```bash
pip3 install geopandas pygeos fiona contextily
```

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import geopandas
import fiona
import contextily as cx

Buscando GEO localização (latitude e longitude) nominatim do OpenStreetMap como **JSON** (dict): https://www.openstreetmap.org

In [None]:
import requests

In [None]:
insper = requests.get("https://nominatim.openstreetmap.org/search?format=json&q=Insper").json()

In [None]:
insper

In [None]:
import pandas as pd

In [None]:
pd.DataFrame([[address["lat"], address["lon"], address["display_name"]] for address in insper], \
            columns =['lat','lon','address'])

Importando dados no formato **geojson**

In [None]:
insper_gdf = geopandas.read_file("https://nominatim.openstreetmap.org/search?format=geojson&q=Insper")

In [None]:
type(insper_gdf)

In [None]:
insper_gdf

In [None]:
mc_gdf = geopandas.read_file("https://nominatim.openstreetmap.org/search?format=geojson&q=mcdonalds+sao+paulo")

In [None]:
mc_gdf

In [None]:
type(mc_gdf)

Obtendo mapas do **Contextily**

In [None]:
nightlights = cx.providers.NASAGIBS.ViirsEarthAtNight2012

brasil_cx = cx.Place("Brasil", source=nightlights)
brasil_cx.plot()
plt.show()

In [None]:
%time
sp_cx = cx.Place("Sao Paulo, Brazil")
sp_cx.plot()
plt.show()

In [None]:
%time
ax = insper_gdf.plot(color="red", figsize=(9, 9))
cx.add_basemap(ax, crs=insper_gdf.crs.to_string(), zoom=18) #zoom 1 to 18

The Coordinate Reference System (CRS)

- https://en.wikipedia.org/wiki/Spatial_reference_system

In [None]:
mc_gdf.crs.to_string()

In [None]:
mc_gdf.crs

In [None]:
mc_gdf

In [None]:
%time
ax = mc_gdf.plot(color="red", figsize=(9, 9))
cx.add_basemap(ax, zoom=10, crs=mc_gdf.crs.to_string()) #zoom 1 to 18

In [None]:
%time
rj_cx = cx.Place("Rio de Janeiro, Brazil")
rj_cx.plot()
plt.show()

In [None]:
%time
rj_cx = cx.Place("Goiania, Brazil")
rj_cx.plot()
plt.show()

In [None]:
from geopandas.tools import geocode

insper2_gdf = geocode("Insper", provider='nominatim', user_agent='autogis_2021', timeout=10)

In [None]:
type(insper2_gdf)

In [None]:
insper2_gdf

In [None]:
ax = insper2_gdf.plot(color="red", figsize=(9, 9))
cx.add_basemap(ax, crs=insper2_gdf.crs.to_string())

Portal de Dados Abertos da Cidade de São Paulo<br>
http://dados.prefeitura.sp.gov.br/dataset?res_format=ZIP

Trabalhando com arquivo SHP (Shapefile)

 > No Linux, Unix e Mac usamos o comando "ls" ou "ls -l" para listar os arquivos<br>
 > No Windows usar "dir" ou "dir /w"

In [None]:
#Linux, Mac, Unix
!ls -l Bases/*.zip

In [None]:
#Windows
!dir /w Bases/*.zip

In [None]:
!ls -l Bases/SP_*

In [None]:
!ls Bases/SP_Mun97_region/*.shp

In [None]:
sp_gdf=geopandas.read_file("Bases/SP_Mun97_region/SP_Mun97_region.shp")

In [None]:
sp_gdf.crs

In [None]:
sp_gdf

In [None]:
sp_gdf.plot(legend=True, figsize=(15,8))

plt.title("Municípios do estado de São Paulo")
plt.show()

In [None]:
sp_gdf.plot(color='white', edgecolor='black', figsize=(15,8))

plt.title("Municípios do estado de São Paulo: bordas")
plt.show()

In [None]:
print(sp_gdf.SEM_ACENTO[0])
sp_gdf.geometry[0]

In [None]:
sp_gdf[sp_gdf["SEM_ACENTO"]=="SAO PAULO"].plot(legend=True, figsize=(15,8))

plt.title("Cidade de São Paulo: Shape")
plt.show()

In [None]:
sp_gdf.centroid

In [None]:
sp_gdf['centroid'] = sp_gdf.centroid

In [None]:
spcentroid_gdf = sp_gdf.set_geometry('centroid')

#plt.title("Centroid dos municípios do estado de SP")
spcentroid_gdf.plot( figsize=(15,8));

In [None]:
ax = spcentroid_gdf["geometry"].plot( figsize=(15,8))
spcentroid_gdf["centroid"].plot(ax=ax, color="black")

In [None]:
ax = spcentroid_gdf[spcentroid_gdf["SEM_ACENTO"]=="SAO PAULO"]["geometry"].plot(figsize=(15,8))
spcentroid_gdf[spcentroid_gdf["SEM_ACENTO"]=="SAO PAULO"]["centroid"] \
.plot(ax=ax, color="black")

### Para saber mais:

- [Centroid](https://en.wikipedia.org/wiki/Centroid)
- [Geographic center of the United States](https://en.wikipedia.org/wiki/Geographic_center_of_the_United_States)

Mapa do Brasil com dados de um arquivo **dpkg**

Este download arquivo pode demorar...

In [None]:
!wget ftp://geoftp.ibge.gov.br/cartas_e_mapas/bases_cartograficas_continuas/bcim/versao2016/geopackage/bcim_2016_21_11_2018.gpkg

Listar as camadas no **gpkg**

In [None]:
fiona.listlayers('bcim_2016_21_11_2018.gpkg')

In [None]:
brasil_gdf = geopandas.read_file("bcim_2016_21_11_2018.gpkg",layer="lim_unidade_federacao_a")

In [None]:
brasil_gdf

In [None]:
brasil_gdf.crs

In [None]:
brasil_gdf["nome"]

In [None]:
brasil_gdf.plot(legend=True, figsize=(15,8))
plt.title("Estados do Brasil")
plt.show()


In [None]:
brasil_gdf.plot(color='green', edgecolor='yellow', figsize=(15,8))
plt.show()

In [None]:
ax = brasil_gdf.plot(color='white', edgecolor='red', figsize=(20,10), alpha=0.3)
cx.add_basemap(ax, crs=brasil_gdf.crs.to_string())

In [None]:
brcapitais_gdf = geopandas.read_file('bcim_2016_21_11_2018.gpkg', layer='loc_capital_p')

In [None]:
type(brcapitais_gdf)

In [None]:
ax = brcapitais_gdf.plot(color='red', alpha=0.5, edgecolor='black', figsize=(20,10))
cx.add_basemap(ax, crs=brcapitais_gdf.crs.to_string())

In [None]:
municipios_gdf = geopandas.read_file('bcim_2016_21_11_2018.gpkg', layer='lim_municipio_a')

In [None]:
sp_gdf = municipios_gdf.query('nome == "São Paulo"')

In [None]:
ax = sp_gdf.plot(color='red', alpha=0.3, edgecolor='black', figsize=(20, 10))
cx.add_basemap(ax, crs=sp_gdf.crs.to_string())

Obtendo e combinando dados de fonte diferente...<br>
Precisamos de uma chave comum...

In [None]:
!wget http://www.servicos.blog.br/wp-content/uploads/2013/10/populacao-e-pib-por-estados.xlsx

In [None]:
!ls -l *.xlsx

In [None]:
!dir \w *.xlsx

In [None]:
dados_br_df = pd.read_excel("populacao-e-pib-por-estados.xlsx")

In [None]:
dados_br_df.head()

In [None]:
dados_br_df.rename({"Sigla":"sigla","PIB":"pib","População":"população","Estado":"estado"}, axis=1, inplace=True)

In [None]:
dados_br_df.head()

In [None]:
br_gdf = brasil_gdf.merge(dados_br_df, on = 'sigla')

In [None]:
br_gdf.head()

In [None]:
type(br_gdf)

In [None]:
br_gdf.plot(column = 'pib',
               cmap = "seismic",
               figsize = (16,10),
               legend = True,
               edgecolor = 'black')

plt.title("Brasil: PIB por estado")
plt.show()

In [None]:
br_gdf.plot(column = 'população',
               cmap = "RdYlGn",
               figsize = (16,10),
               legend = True,
               edgecolor = 'black')

plt.title("Brasil: População por estado")
plt.show()

Datasets padrão no GeoPandas

In [None]:
geopandas.datasets.available

In [None]:
world_gdf = geopandas.read_file(geopandas.datasets.get_path('naturalearth_lowres'))

world_gdf.plot( figsize=(15,8))

plt.show()

In [None]:
type(world_gdf)

In [None]:
world_gdf.head()

In [None]:
world_gdf.plot(column = 'gdp_md_est',
               cmap = "Spectral",
               figsize = (16,10),
               legend = True,
               edgecolor = 'black')

plt.title("World: GDP")
plt.show()

In [None]:
world_gdf.plot(column = 'pop_est',
               cmap = "PiYG",
               figsize = (16,10),
               legend = True,
               edgecolor = 'black')

plt.title("World: Populatin (est)")
plt.show()

In [None]:
sa_gdf = world_gdf[world_gdf.continent == 'South America']

sa_gdf.plot(
    color='white', edgecolor='black',  figsize=(15,8))

plt.show()

In [None]:
type(sa_gdf)

In [None]:
sa_gdf

In [None]:
#Fonte: Documentação do geopandas
sa_capitals_df = pd.DataFrame(
    {'City': ['Buenos Aires', 'Brasilia', 'Santiago', 'Bogota', 'Caracas'],
     'Country': ['Argentina', 'Brazil', 'Chile', 'Colombia', 'Venezuela'],
     'Latitude': [-34.58, -15.78, -33.45, 4.60, 10.48],
     'Longitude': [-58.66, -47.91, -70.66, -74.08, -66.86]})

In [None]:
sa_capitals_df

In [None]:
sa_apitals_gdf = geopandas.GeoDataFrame(
    sa_capitals_df, geometry=geopandas.points_from_xy(sa_capitals_df.Longitude, sa_capitals_df.Latitude))

In [None]:
sa_apitals_gdf

In [None]:
ax = sa_gdf.plot(
    color='white', edgecolor='black', figsize=(15,8))

sa_apitals_gdf.plot(ax=ax, color='red')

plt.show()

In [None]:
sa_gdf.plot(column = 'gdp_md_est',
               cmap = "Spectral",
               figsize = (16,10),
               legend = True,
               edgecolor = 'black')

plt.title("South America: GDP")
plt.show()

In [None]:
sa_gdf.plot(column = 'pop_est',
               cmap = "Wistia",
               figsize = (16,10),
               legend = True,
               edgecolor = 'black')

plt.title("South America: Population (est)")
plt.show()

Formatos de dados GEO:

- shp: [Shapefile](https://en.wikipedia.org/wiki/Shapefile#:~:text=The%20shapefile%20format%20is%20a,information%20system%20(GIS)%20software.&text=The%20shapefile%20format%20can%20spatially,wells%2C%20rivers%2C%20and%20lakes.) (zip com 3 arquivos: .shp, .shx, e .dbf)
- geojson: https://geojson.org/
- gpkg: [GeoPackage](https://en.wikipedia.org/wiki/GeoPackage)

Podemos obter estes tipos de dados GEO como arquivo ou dinamicamente como chamada de WEB API, normalmente são arquivos grandes.

Sites de governos tem dados acurados (GEO), salvar os dados porque os sites mudam muito!!

### GeoViews: (HoloViz)

- http://geoviews.org/gallery/index.html
- http://geoviews.org

### Dicas de Ciências dos Dados:

- https://github.com/danielscarvalho/Insper-DS-Dicas/blob/master/Dica-008-what3words.ipynb
- https://github.com/danielscarvalho/Insper-DS-Dicas

### Referências:

- https://geopandas.org/
- https://nominatim.org/
- https://github.com/tbrugz/geodata-br
- https://matplotlib.org/stable/tutorials/colors/colormaps.html
- https://contextily.readthedocs.io/en/latest/intro_guide.html