# Formatos de Dados Espaciais

Assim como temos diferentes formatos de arquivo para fotos (JPG, PNG) ou documentos (DOC, PDF), também temos vários formatos para dados espaciais. É como ter diferentes tipos de gavetas na mapoteca, cada uma ideal para um tipo de mapa!

## Objetivos
- Conhecer os principais formatos de dados espaciais (nossas "gavetas digitais")
- Aprender a ler e salvar em diferentes formatos (como arquivar e recuperar mapas)
- Entender quando usar cada formato (escolher a gaveta certa)
- Converter entre formatos (como fazer cópias em diferentes papéis)

## 1. Configuração do Ambiente

Vamos preparar nossas ferramentas para trabalhar com diferentes formatos:

In [None]:
# Nossa caixa de ferramentas para diferentes formatos:
import geopandas as gpd    # Para dados vetoriais (como desenhos técnicos)
import pandas as pd        # Para tabelas (como planilhas de atributos)
import rasterio           # Para dados matriciais (como fotos aéreas)
import json               # Para trabalhar com GeoJSON (como um bloco de notas digital)
from shapely.geometry import shape  # Para manipular formas geométricas
import matplotlib.pyplot as plt    # Para visualizar nossos dados

plt.rcParams['figure.figsize'] = (12, 8)

## 2. Formatos Vetoriais

### 2.1 Shapefile (.shp)
É como o formato PDF dos dados espaciais:
- Todo mundo consegue abrir
- Vem com vários arquivos juntos (.shp, .dbf, .shx, .prj)
- É como uma pasta com diferentes partes do mesmo mapa

In [None]:
# Lendo um shapefile
# Como abrir uma pasta de documentos relacionados
estados_shp = gpd.read_file('../data/raw/BR_UF_2022.shp')
print("Estrutura do nosso shapefile (como um índice):")
print(estados_shp.info())

# Salvando um shapefile
# Como fazer uma cópia organizada dos documentos
estados_shp.to_file('../data/processed/estados_exemplo.shp')

### 2.2 GeoJSON (.geojson)
É como um arquivo de texto que qualquer um pode ler:
- Fácil de abrir até no bloco de notas
- Muito usado na web (como HTML para mapas)
- Ótimo para compartilhar dados simples

In [None]:
# Convertendo para GeoJSON
# Como passar um documento formal para uma linguagem mais simples
estados_shp.to_file('../data/processed/estados.geojson', driver='GeoJSON')

# Lendo GeoJSON
# Como abrir nossa versão simplificada
estados_geojson = gpd.read_file('../data/processed/estados.geojson')

# Vamos ver como é a estrutura do GeoJSON
# É como olhar o conteúdo do arquivo de texto
print("\nPrimeira feature em GeoJSON (como uma ficha de cadastro):")
print(json.dumps(json.loads(estados_geojson.iloc[0:1].to_json()), indent=2))

### 2.3 GeoPackage (.gpkg)
É como um arquivo ZIP moderno:
- Pode guardar vários mapas juntos
- Mais eficiente que shapefile
- Como uma pasta compactada bem organizada

In [None]:
# Salvando em GeoPackage
# Como criar um arquivo compactado organizado
estados_shp.to_file('../data/processed/brasil.gpkg', driver='GPKG', layer='estados')

# Lendo do GeoPackage
# Como abrir um arquivo da nossa pasta compactada
estados_gpkg = gpd.read_file('../data/processed/brasil.gpkg', layer='estados')

# Vendo o que tem dentro do GeoPackage
# Como listar o conteúdo da pasta
import fiona
print("\nCamadas no GeoPackage (como arquivos numa pasta):")
print(fiona.listlayers('../data/processed/brasil.gpkg'))

## 3. Formatos Matriciais

### 3.1 GeoTIFF (.tif)
É como uma foto com coordenadas:
- O formato padrão para imagens georreferenciadas
- Pode ter várias bandas (como RGB numa foto)
- Guarda informação de localização junto

In [None]:
# Exemplo de leitura de GeoTIFF
# Como abrir uma foto aérea com coordenadas
try:
    with rasterio.open('../data/raw/exemplo_dem.tif') as src:
        print("Informações da nossa imagem:")
        print(f"Tamanho: {src.width}x{src.height} pixels")
        print(f"Sistema de Coordenadas: {src.crs}")
        print(f"Número de bandas (como camadas): {src.count}")
except:
    print("Arquivo de exemplo não encontrado (como procurar uma foto que não está na pasta)")

### 3.2 Outros Formatos Matriciais

- **ASCII Grid (.asc)**
  - Como uma planilha de números
  - Fácil de ler, mas ocupa muito espaço
  - Útil para dados simples

- **NetCDF (.nc)**
  - Como um banco de dados científico
  - Bom para dados meteorológicos
  - Pode guardar várias dimensões (tempo, profundidade)

- **JPEG2000 (.jp2)**
  - Como uma foto muito comprimida
  - Bom para imagens de satélite grandes
  - Economiza espaço mantendo qualidade

## 4. Comparação de Formatos

### Vetoriais:
| Formato    | Vantagens | Desvantagens |
|------------|-----------|---------------|
| Shapefile  | - Todo mundo usa<br>- Funciona em todo lugar | - Nomes curtos de campos<br>- Vários arquivos soltos |
| GeoJSON    | - Fácil de ler<br>- Ótimo para web | - Arquivos grandes<br>- Mais lento |
| GeoPackage | - Tudo num arquivo só<br>- Mais moderno | - Nem todo software abre<br>- Menos comum |

É como escolher entre:
- Shapefile = PDF (padrão universal)
- GeoJSON = TXT (simples e acessível)
- GeoPackage = ZIP (moderno e organizado)

### Matriciais:
| Formato    | Vantagens | Desvantagens |
|------------|-----------|---------------|
| GeoTIFF    | - Padrão universal<br>- Boa compressão | - Complexo para editar |
| ASCII Grid | - Simples de entender<br>- Fácil de editar | - Arquivos enormes |
| NetCDF     | - Muito flexível<br>- Bom para séries | - Mais complicado |

É como escolher entre:
- GeoTIFF = JPG (padrão para fotos)
- ASCII Grid = TXT (simples mas grande)
- NetCDF = ZIP com extras (complexo mas poderoso)

## 5. Exercícios Práticos

Vamos praticar como um arquivista de mapas digitais:

1. Conversão de Formatos:
   - Pegue o shapefile dos estados
   - Salve em GeoJSON e GeoPackage
   - Compare o tamanho dos arquivos
   - Como escolher entre qualidade e espaço

2. Manipulação de Atributos:
   - Adicione novos dados aos estados
   - Salve em diferentes formatos
   - Veja como cada formato lida com os dados
   - Como organizar informações extras

3. Análise de Performance:
   - Compare o tempo de abrir cada formato
   - Teste com dados grandes e pequenos
   - Descubra qual é melhor para cada uso
   - Como escolher a ferramenta certa