# <center><span style="color:#336699">Introdução à Programação com Dados Geoespaciais em Ambientes de Computação Interativa</span></center>
<hr style="border:2px solid #0077b9;">

<br/>

<div style="text-align: center;font-size: 150%;">
    Aula 02: Manipulação de Dados Vetoriais em Python</br>
    <span style="font-size: 0.75em;">Parte III - Manipulação de Dados Vetoriais em Python</span>
</div>

<br/>

<div style="text-align: center;font-size: 90%;">
    Gilberto Ribeiro de Queiroz<sup><a href="https://orcid.org/0000-0001-7534-0219"><i class="fab fa-lg fa-orcid" style="color: #a6ce39"></i></a></sup>, Karine Reis Ferreira<sup><a href="https://orcid.org/0000-0003-2656-5504"><i class="fab fa-lg fa-orcid" style="color: #a6ce39"></i></a></sup>, Marcos Adami<sup><a href="https://orcid.org/0000-0003-4247-4477"><i class="fab fa-lg fa-orcid" style="color: #a6ce39"></i></a></sup>, Thales Sehn Körting<sup><a href="https://orcid.org/0000-0002-0876-0501"><i class="fab fa-lg fa-orcid" style="color: #a6ce39"></i></a></sup>
    <br/><br/>
    Divisão de Observação da Terra e Geoinformática, Instituto Nacional de Pesquisas Espaciais (INPE)
    <br/>
    Avenida dos Astronautas, 1758, Jardim da Granja, São José dos Campos, SP 12227-010, Brazil
    <br/><br/>
    Última Atualização: 30 de Janeiro de 2025
</div>

<br/>

<div style="text-align: justify;  margin-left: 25%; margin-right: 25%;">
    <b>Resumo.</b> Este Jupyter Notebook apresenta uma visão geral de como realizar a leitura de dados vetoriais com a biblioteca *GeoPandas* e como realizar algumas análises simples com dados de focos de queimada.
</div>

<br/>

<div style="text-align: justify;  margin-left: 25%; margin-right: 25%;">
    <b>Atenção:</b> Este material é baseado nas notas de aula disponível em <a href="https://prog-geo.github.io">https://prog-geo.github.io</a>.
</div>

<img src="../img/logo/geopandas.png" align="right" width="192" />

# <span style="color:#336699">Introdução</span>
<hr style="border:1px solid #0077b9;">

O **[GeoPandas](https://geopandas.org/)** é uma biblioteca que adiciona ao *Pandas* suporte a objetos geográficos, com facilidades para:
- Tratar **colunas com elementos geométricos**.
  
- Realização de **operações espaciais**.


- Criação de mapas para visualização.


O GeoPandas se apóia em outro projetos de software livre como a biblioteca *Shapely*, as bibliotecas *[Fiona](http://fiona.readthedocs.io/en/latest/manual.html)* e *[Pyogrio](https://pyogrio.readthedocs.io/en/stable/)* para leitura e escrita de dados e a *Matplotlib* para visualização.


As duas estruturas fornecidas por esta biblioteca são:

- **GeoSeries:** um vetor contendo uma representação geométrica em conformidade com os tipos da *OGC Simple Feature*: `Point`, `LineString`, `Polygon`, `MultiPoint`, `MultiLineString` e `MultiPolygon`. Essa estrutura possui as mesmas operações da classe `Series` do *Pandas* além de operações espaciais como cálculo de área, perímetro, distâncias, relacionamentos espaciais, operações de conjunto (união, intersecção, diferença), *buffer*, entre outras, todas suportadas pela *Shapely*.

    | | municipio |
    | :--- | :--- |
    | 0 | POINT (-47.607 -5.673) |
    | 1 | POINT (-47.606 -5.581) |
    | 2 | POINT (-47.734 -5.562) |
    | 3 | POINT (-47.605 -5.58) |
    | 4 | POINT (-47.606 -5.677) |

- **GeoDataFrame:** `DataFrame` com uma coluna geométrica.

    | | municipio | estado | regiao | pais | satelite | bioma | timestamp | satelite_r | geometry |
    | :--- | :--- | :--- | :--- | :--- | :--- | :--- | :--- | :--- | :--- |
    | 0 | Sítio Novo Do Tocantins | Tocantins | N | Brazil | NPP_375 | Cerrado | 2016/02/12 17:05:45 | f | POINT (-47.607 -5.673) |
    | 1 | Sítio Novo Do Tocantins | Tocantins | N | Brazil | NPP_375 | Cerrado | 2016/07/17 04:00:00 | f | POINT (-47.606 -5.581) |
    | 2 | Sítio Novo Do Tocantins | Tocantins | N | Brazil | AQUA_M-T | Cerrado | 2016/01/15 16:40:14 | t | POINT (-47.734 -5.562) |
    | 3 | Sítio Novo Do Tocantins | Tocantins | N | Brazil | NPP_375 | Cerrado | 2016/01/15 16:40:14 | t | POINT (-47.605 -5.58) |
    | 4 | Sítio Novo Do Tocantins | Tocantins | N | Brazil | NPP_375 | Cerrado | 2016/02/12 17:05:45 | f | POINT (-47.606 -5.677) |

----

Os seguintes conjuntos de dados geográficos serão utilizados para explorar as funcionalidades do *GeoPandas*:

- O conjunto de arquivos ESRI Shapefile `focos-queimada.shp`, extraído da aplicação BDQueimadas, que contém 56.892 registros de focos de incêndio na vegetação entre o período de 01 de setembro e 31 de outubro de 2025.
  
- O conjunto de arquivos ESRI Shapefile `BRUFE250GC_SIR.shp` contendo a malha das Unidades da Federação do ano de 2018.


<img src="../img/dado-vetorial/uf-focos.png"/>


# <span style="color:#336699">Importação da biblioteca GeoPandas</span>
<hr style="border:1px solid #0077b9;">

Por convenção importamos as funcionalidades do *GeoPandas* da seguinte forma:

In [None]:
import geopandas as gpd

Para verificar a versão do *GeoPandas* em uso:

In [None]:
gpd.__version__

# <span style="color:#336699">Leitura de Arquivos ESRI Shapefile</span>
<hr style="border:1px solid #0077b9;">

Para abrir um arquivo `ESRI Shapefile` e associar os dados a um `GeoDataFrame` basta utilizar a função **`read_file`**, como mostrado a seguir:


In [None]:
uf = gpd.read_file("https://geoftp.ibge.gov.br/organizacao_do_territorio/malhas_territoriais/malhas_municipais/municipio_2018/Brasil/BR/br_unidades_da_federacao.zip")
uf

Repare na estrutura criada:

In [None]:
uf.dtypes

# <span style="color:#336699">Propriedades GeoDataFrame</span>
<hr style="border:1px solid #0077b9;">

In [None]:
uf.crs

In [None]:
uf.geom_type

In [None]:
uf.geometry

In [None]:
uf.loc[10]

In [None]:
uf.loc[10].geometry

In [None]:
type(uf.loc[10].geometry)

In [None]:
uf.total_bounds

In [None]:
uf.bounds

In [None]:
uf.area 

In [None]:
# Transformando para o CRS Policônica SIRGAS 2000 (https://epsg.io/5880)
uf.to_crs("EPSG:5880").area 

In [None]:
uf["area"] = uf.to_crs("EPSG:5880").area
uf

# <span style="color:#336699">Visualizando os Dados</span>
<hr style="border:1px solid #0077b9;">

Podemos visualizar as unidades da federação em um mapa utilizando a operação `plot` do `GeoDataFrame`:

In [None]:
uf.plot();

In [None]:
uf.plot(figsize=(8, 8), column="NM_REGIAO", cmap='Pastel1', edgecolor="black", legend=True);

**Sugestão:** [Choosing Colormaps in Matplotlib](https://matplotlib.org/stable/users/explain/colors/colormaps.html)

In [None]:
uf.plot(figsize=(8, 8), column="area", cmap="OrRd", scheme="quantiles", legend=True);

In [None]:
uf.plot(figsize=(8, 8),
        column="area",
        cmap="OrRd",
        scheme="quantiles",
        legend=True,
        legend_kwds={
            "loc": "lower left"
       }
);

In [None]:
uf.boundary.plot();

# <span style="color:#336699">Operações Espaciais</span>
<hr style="border:1px solid #0077b9;">

Todas as geometrias são válidas?

In [None]:
uf.is_valid

----

Qual UF possui geometria inválida?

In [None]:
uf[~uf.is_valid]

----

Gerar o mapa de regiões a partir do mapa de UFs:

In [None]:
regioes = uf.dissolve(by="NM_REGIAO")
regioes

In [None]:
regioes.plot(figsize=(8, 8), cmap='Pastel1', edgecolor='black');

In [None]:
regioes2 = uf.dissolve(
    by="NM_REGIAO",
    aggfunc={
        "NM_ESTADO": "count",
        "area": "sum"
    }
)
regioes2

----

Calcular centróides:

In [None]:
centroides = uf.centroid
centroides

In [None]:
centroides.plot(marker='o', color='red', markersize=20, figsize=(8, 8))

----

Selecionar as UFs com regiões abaixo da latitude -20:

In [None]:
selecao = uf.cx[:, :-20]
selecao

In [None]:
ax = selecao.plot(figsize=(8, 8), cmap='Pastel1', edgecolor='black')

ax.axhline(y=-20, color="red", linewidth=3)

# <span style="color:#336699">Explorando o Conjunto de Dados de Focos</span>
<hr style="border:1px solid #0077b9;">

In [None]:
focos = gpd.read_file("../dados/shp/focos-queimada/focos-queimada.shp")

focos

In [None]:
focos.dtypes

In [None]:
focos.plot(marker='x', color='red', markersize=5, figsize=(8, 8));

**Q1.** Visualizar os focos de queimada do Estado de Minas Gerais.

In [None]:
focos_mg = focos[focos["Estado"] == "MINAS GERAIS"]
focos_mg

Em seguida, podemos utilizar a operação `plot` para desenhar as geometrias desse novo `GeoDataFrame`:

In [None]:
focos_mg.plot(marker='x', color='red', markersize=5, figsize=(20, 10));

----


**Q2.**  Visualizar os focos de queimada do Estado de Minas Gerais do mês de outubro.


Podemos alterar a coluna `DataHora` do tipo `string` para `datetime` para facilitar a manipulação dos dados desta coluna:

In [None]:
import pandas as pd

In [None]:
focos_mg["DataHora"] = pd.to_datetime(focos_mg["DataHora"])
focos_mg.dtypes

In [None]:
focos_mg_outubro = focos_mg[focos_mg["DataHora"].dt.month == 10] #ou focos_mg[focos_mg["DataHora"] >= "2025-10-01"]
focos_mg_outubro

In [None]:
focos_mg_outubro.plot(marker='x', color='red', markersize=5, figsize=(20, 10));

----

**Q3.**  Adicionar o limite do Estado de Minas Gerais ao mapa criado em *Q2*.

In [None]:
uf.plot(figsize=(8, 8));

In [None]:
mg = uf[uf["NM_ESTADO"] == "MINAS GERAIS"]
mg

In [None]:
ax = mg.plot(color='white', edgecolor='k', figsize=(20, 10))

focos_mg_outubro.plot(ax=ax, marker='x', color='red', markersize=5)

----

**Q4.**  Qual a distribuição dos focos por bioma?

In [None]:
focos_bioma = focos.groupby("Bioma")["Bioma"].count()
focos_bioma

In [None]:
focos_bioma.index.name = "Biomas"
focos_bioma.name = "#Focos x Bioma"
focos_bioma

In [None]:
ax = focos_bioma.plot(kind='pie',
                      autopct='%1.1f%%',
                      figsize=(8,8), fontsize='14'
);

ax.set_title('Focos por Bioma - 2025', fontsize=20);

----


**Q5.** Qual a frequência mensal de queimadas por bioma?

In [None]:
focos["DataHora"] = pd.to_datetime(focos["DataHora"])
focos["Mes"] = focos["DataHora"].dt.month
focos.dtypes

In [None]:
pvt = pd.pivot_table(focos, values='geometry', index=["Bioma"],
                         columns=["Mes"], aggfunc="count",
                         fill_value=0, margins=True,
                         margins_name="Total")

#pvt.columns=['out', 'nov', 'total']

pvt

----

Q6. Junção Espacial (*Spatial Join*):

In [None]:
uf_4326 = uf.to_crs(4326)

In [None]:
focos_x_uf = focos.sjoin(uf_4326, how="inner", predicate="within")
focos_x_uf

# <span style="color:#336699">Referências Bibliográficas</span>
<hr style="border:1px solid #0077b9;">

- [Documentação da biblioteca GeoPandas](https://geopandas.org/). Disponível online.