<a href="https://colab.research.google.com/github/Joaogalescky/Ciencia-de-Dados---2024/blob/main/Explica%C3%A7%C3%A3o_Geopandas_intro.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Geopandas

[Geopandas](https://geopandas.org) é uma biblioteca para manipulação de informações geográficas, possibilitando a apresentação de mapas e análises de dados utilizando informações geométricas.

Aqui utilizaremos como fonte de dados a biblioteca [geobr](https://github.com/ipeaGIT/geobr), desenvolvida pelo Instituto de Pesquisa Econômica Aplicada (IPEA).

## Bibliotecas necessárias
- Geopandas
- GeoBR: Mapas do Brasil

Por padrão, as bibliotecas GeoPandas e geobr não vêm instaladas. Desta forma, é necessário instalá-las.

**Atividade**
- Instale as bibliotecas GeoPandas e geobr.
```bash
%%bash
#Instalação das bibliotecas
pip3 install geopandas
pip3 install geobr
```

In [None]:
%%bash
#Instalação das bibliotecas
pip3 install geopandas
pip3 install geobr

## Importação de bibliotecas

```python
import geopandas as gpd
import geobr

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
```

In [None]:
import geopandas as gpd
import geobr

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

## Carregando bases geobr

As bases do geobr podem ser obtidas a partir de funções da biblioteca. O retorno da função é um **GeoDataFrame**. Algumas das funções são:
-  `.read_country()` : País, Brasil
-  `.read_state()` : estados do Brasil
-  `.read_municipality()` : Municípios
-  `.read_meso_region()` : Mesorregiões
-  `.read_micro_region()` : Microrregiões

**Exemplo**.
- Carrega o mapa do Brasil
```python
gdf_br = geobr.read_country()
```

- Carrega os estados do Brasil
```python
gdf_estados = geobr.read_state()
```

Ao executar cada função, o GeoDataFrame será carregado a partir dos servidores da biblioteca GeoPandas, na internet.

In [None]:
%%time
#Carrega bases estados e municipios (Pode demorar um pouco)
print('Carregando país...')
gdf_br = geobr.read_country()  #País
print('Carregando estados...')
gdf_estados = geobr.read_state() #Estados
print('Carregando municípios...')
gdf_municipios = geobr.read_municipality() #Municípios
print('Carregando mesorregiões...')
gdf_meso = geobr.read_meso_region() #Mesoregiões
print('Carregando microrregiões...')
gdf_micro = geobr.read_micro_region() #Microregiões
print('Download das bases finalizado.')

Carregando país...
Carregando estados...
Carregando municípios...
Carregando mesorregiões...
Carregando microrregiões...
Download das bases finalizado.
CPU times: user 177 ms, sys: 1.07 ms, total: 178 ms
Wall time: 174 ms


## GeoDataFrame

Um `GeoDataFrame` se assemelha a um DataFrame Pandas, porém possui a coluna `geometry`, que armazena informações sobre a geometria correspondente aos valores contidos naquela linha.

**Exemplo**
- GeoDataFrame do brasil

```python
gdf_br
```

Neste caso existe apenas uma informação na base.

**Exemplo**
-  GeoDataFrame com os Estados do Brasil
```python
gdf_estados.head()
```

No caso dos estados temos informações a mais, como o código do estado, a abreviação do estado, nome do estado, o código da região e o nome região.

## O método `.plot()`

O método `.plot()` dos GeoDataFrames apresenta as figuras geométricas presentes.

**Exemplo**
- Mapa do Brasil

```python
gdf_br.plot()
```

**Exemplo**
- Estados do Brasil
```python
gdf_estados.plot()
```

### Parâmetros

Alguns parâmetros para manipulação dos mapas no método `.plot()` são:
- `figsize`: indica o tamanho do mapa a ser gerado, tendo como entrada uma tupla.
    - **Exemplo**
        - `gdf_estados.plot(figsize=(10,20))`.
    - Na apresentação, o tamanho será adaptado ao mapa, mantendo as proporções originais.
- `color`: indica a cor de fundo do gráfico
    - **Exemplo**
        - `gdf_estados.plot(color='r')`
- `edgecolor`: indica a cor da borda do mapa.
    - **Exemplo**
        - `gdf_estados.plot(edgecolor='r')`
- `column`: utiliza uma coluna do geodataframe para ser utilizado como cor. As linhas que possuírem o mesmo valor terão a mesma cor no gráfico.
    - **Exemplo**
        - `gdf_estados.plot(column='name_region')`
- `alpha`: nível de transparência, com valores no intervalo $[0.0,1.0]$, de maior a menor transparência.
    - **Exemplo**
        - `gdf_estados.plot(color='y', alpha=0.8)`
        - `gdf_estados.plot(color='y', alpha=0.3)`
    - Este parâmetro é bastante útil na sobreposição de informações em mapas.
- `legend`: inclui legenda no gráfico.
    - **Exemplo**
        - `gdf_estados.plot(column='name_region', legend=True)`
    
**Exemplo**  

```python
gdf_estados.plot(figsize=(10,10), edgecolor='k', column='name_region', legend=True, alpha = 0.6)
```

**Observação**  
- Os parâmetros `color` e `column` não podem ser utilizados simultaneamente.

## Manipulação de GeoDataFrames

Assim como nos DataFrames, é possível criar novas colunas e filtrar linhas no GeoDataFrames, além das outras operações possíveis de serem aplicadas aos DataFrames Pandas.

**Exemplo**
- Mapa dos estados presentes na região Sul.
```python
idx = gdf_estados['name_region']=='Sul' #Filtra apenas estados da região Sul
gdf_estados[idx].plot() #Mostra os estados no filtro aplicado
```

**Atividade**  
- Apresente o mapa contendo todos os estados da região Nordeste.
- Apresenta o mapa do estado que possui o código 42.

**Atividade**  
- Quais são os estados que fazem parte da região Norte? Liste-os, utilizando filtros no GeoDataFrame.

### Métodos úteis
Alguns métodos já conhecidos na biblioteca Pandas são extremamente úteis durante a manipulação de GeoDataFrames.

- `.isin()` : Retorna `True` caso o valor esteja presente em uma sequência ou conjunto. Útil para filtrar por valores específicos.

**Exemplo**
- Apresente o mapa dos estados MS, GO, RS e CE.
```python
estados = {'MS', 'GO', 'RS', 'CE'} #conjunto ou lista com os valores
gdf_estados[gdf_estados['abbrev_state'].isin(estados)].plot() #filtra apenas por estados  que estão na lista
```

**Atividade**
- Apresente um mapa com os estados do Amazonas, Ceará, São Paulo, Espírito Santo e Distrito Federal

## Sobreposição de mapas

Uma possibilidade é aplicar diversos mapas na mesma figura, chamando diversas vezes o método `.plot()` passando o retorno do mapa anterior gerado. O primeiro mapa gerado corresponde ao fundo, e os demais correspondem a camadas superiores, que serão sobrepostas às anteriores.

**Exemplo**.
- Mapa do Paraná sobreposto ao mapa do Brasil. Repare que o mapa do Brasil é gerado primeiro.
```python
mapa = gdf_br.plot() #Mapa do Brasil
gdf_pr = gdf_estados[gdf_estados['name_state']=='Paraná'] #Gera um GeoDataFrame apenas com o PR
gdf_pr.plot(ax = mapa, color='y') #Mapa do PR, indicando em qual mapa plotar
```

**Atividade**

Mostre

**Atividade**
- Qual é o nome da cidade com código `3542602.0` ?
- Mostre o mapa da cidade de código `1200203.0` .

## Outras bases GeoBR

A biblioteca **geobr** também permite a leitura de outras bases de dados. Informações sobre as bases disponíveis podem ser vistas na página do repositório da biblioteca [geobr](https://github.com/ipeaGIT/geobr#available-datasets).

**Exemplo**
- Mapa do Brasil com as áreas de terras indígenas, diferenciando-as por etnia.

```python
#Mapa do Brasil. Fundo de cor branca e borda de cor preta.
mapa = geobr.read_country().plot(figsize=(10,10), color='w', edgecolor='k')
#Mapa das terras indígenas. Cores separadas por etnia, utilizando o mapa do Brasil.
geobr.read_indigenous_land().plot(ax=mapa, column='etnia_nome')
```

**Exemplo**  
- Escolas do Brasil
```python
gdf_escolas = geobr.read_schools()
```

**Atividade**
- Plote um mapa com as escolas de Cascavel-PR.
- Calcule e mostre quantas escolas de Cascavel são públicas e privadas
- Calcule e mostre quantas escolas públicas de Cascavel pertencem a cada esfera administrativa (Municipal, Estadual, Federal)

**Atividade**
- Explique o código abaixo, preenchendo nos comentários a finalidade de cada linha. Após explicar, execute-o e discuta sobre o resultado.

```python
# _________
cidade = 'Cascavel'         # _________
estado = 'PR'               # _________
coluna = 'government_level' # _________

# _________
gdf_cidade = geobr.read_municipality() # _________
gdf_cidade = gdf_cidade[gdf_cidade['abbrev_state'] == estado] # _________
gdf_cidade = gdf_cidade[gdf_cidade['name_muni'] == cidade]    # _________

# _________
gdf_cidade_escolas = geobr.read_schools() # _________
gdf_cidade_escolas = gdf_cidade_escolas[gdf_cidade_escolas['name_muni']==cidade]    # _________
gdf_cidade_escolas = gdf_cidade_escolas[gdf_cidade_escolas['abbrev_state']==estado] # _________

# _________
mapa = gdf_cidade.plot(figsize=(20,20), color='w', edgecolor='k')      # _________
gdf_cidade_escolas.plot(ax=mapa, column=coluna,legend=True, alpha=0.7) # _________
```

**Atividade**
- Plote no mapa de Cascavel a localização das escolas públicas e privadas, diferenciando-as por cor.

**Atividade**  
- Apresente no mapa do Paraná as áreas de terras indígenas, diferenciando-as por etnia. Utilize legenda.
- Carregue outro geodaframe da biblioteca geobr. Apresente um mapa com informações da base lida e realize uma análise sobre os dados lidos.

## Referências
[GeoPandas](https://geopandas.org)  
[geobr](https://github.com/ipeaGIT/geobr)  
Pereira, R.H.M.; Gonçalves, C.N.; et. all (2019) geobr: Loads Shapefiles of Official Spatial Data Sets of Brazil. GitHub repository - https://github.com/ipeaGIT/geobr.  

