# Tratamento de dados utilizando GeoPandas    

## 1. Bibliotecas que serão utilizadas

In [1]:
import geopandas as gpd
import matplotlib.pyplot as plt

## 2. Dados espaciais

Dados adiquiridos diretamente no site do IBGE, através do link https://www.ibge.gov.br/geociencias/organizacao-do-territorio/malhas-territoriais/15774-malhas.html?=&t=downloads

## 3. Lendo arquivos
Vamos para uma análise em python que consiste em carregar os dados. Para arquivos espaciais existem vários padrões de arquivos diferentes, como por exemplo: `Shapefile`, `GeoJSON`, `KML` e `GPKG`

In [None]:
#ler os dados com GeoPandas
data = gpd.read_file('data/SP_Municipios_2022.shp')

In [None]:
type(data)

Podemos ver que o tipo da variável é um `GeoDataFrame`. O objeto `GeoDataFrame` herda as funcionalidades do `pandas.DataFrame`.

In [None]:
data.head(5)

## 4. Visualizando os dados
Quando usamos dados espaciais, uma boa ideia é explorar os dados utilizando um mapa. Criar um mapa simples de um `GeoDataFrame` é simples: Podemos utilizar a função `.plot()`, que cria um mapa baseado nas geometrias dos dados. Na verdade, o GeoPandas utiliza o `matplotlib` para criar os mapas.

In [None]:
data.plot()

Melhorando um pouco a visualização utilizando parâmetros do matplotlib

In [None]:
data.plot(figsize=(16, 14), facecolor='white', edgecolor='black')
plt.show()

## 5. Salvando os dados
Uma vantagem do `GeoDataFrame` é a herança das funções do `Pandas`, utilizando as informações dos dados, podemos filtrar uma determinada região

In [None]:
# Filtrando somente a capital 'São Paulo'
gdf_sp = data[data['NM_MUN'] == 'São Paulo']
gdf_sp

In [None]:
# Vendo a região filtrada
gdf_sp.plot(figsize=(8, 8), facecolor='white', edgecolor='black')
plt.show()

Para salvar os dados espaciais utilizando o `GeoPandas` também é bem simples.

Para salvar apenas a região filtrada acima em um novo arquivo, podemos utilizar a função `to_file()` para salcar os arquivos, o GeoPandas utiliza o formato padrão `Shapefile` (.shp), mas também podemos salvar em outros formatos utilizando o parâmetro "driver". Nesse caso, vamos salvar no formato `GeoJSON`.

In [None]:
# Salvando o GeoDataFrame como GeoJSON
filename = 'data/capital_são_paulo.json'
gdf_sp.to_file(filename, driver='GeoJSON')

In [None]:
# Lendo o GeoJSON criado
gdf_sp = gpd.read_file(filename, driver='GeoJSON')
gdf_sp