# Tarea 2

### Programa de Posgrado en Computación e Informática
### Ciencia de Datos Geoespaciales - PF-3311
### Edgar Chaves Villalobos – C5A022

#### Descripción

Debe desarrollar un cuaderno de notas (notebook) que describa un conjunto de datos geoespaciales mediante texto (puede añadir imágenes y otros recursos), así como gráficos y mapas generados mediante código en Python.
El conjunto de datos debe estar relacionado con algún tema de su interés (ej. su trabajo final de graduación, un proyecto de otro curso), de manera que luego pueda darle continuidad en las tareas siguientes y en el proyecto final.
En el cuaderno de notas debe incluir:

- Descripción general del conjunto de datos.
- Descripción de sus principales variables (columnas).
- Problemas que desea resolver o preguntas que espera contestar con los datos.
- Dos gráficos estadísticos elaborados con Matplotlib o con Plotly que le ayuden a describir el conjunto de datos.
- Dos mapas elaborados con Matplotlib o con el método explore() de GeoPandas que le ayuden a describir el conjunto de datos.
- Estructure el cuaderno de notas con Markdown y procese los datos con la biblioteca GeoPandas. Puede utilizar conjuntos de datos relacionados con los utilizados en clase, pero para responder preguntas diferentes.

#### Calificación
- Descripción general del conjunto de datos: 10%
- Descripción de sus principales variables (columnas): 15%
- Problemas que desea resolver o preguntas que espera contestar con los datos: 15%
- Gráficos estadísticos: 30% (15% cada una)
- Mapas: 30% (15% cada uno)

### Descripción general del conjunto de datos.

Los datos a utilizar son datos raster en formato TIF. Los datos se enfocan en dos recortes realizados de la zona de San Ramón de Alajuela, la cual va a ser la zona de estudio. El recorte es realizado de los Ortofotografías obtenidas del **Sistema Nacional de Información Territorial (SNIT)** las cuales estan en formato **CRTM05 (EPSG:5367)**.  La siguiente tabla resume los datos utlizados.


| Nombre del archivo     | Periodo   | Fuente     | Resolución espacial | Formato  |
|-------------------------|-----------|-------------|----------------------|-----------|
| `SanRamon_06-07.tif`   | 2006–2007 | SNIT / IGN  | 1 m/píxel            | GeoTIFF   |
| `SanRamon_15-18.tif`   | 2015–2018 | SNIT / IGN  | 1 m/píxel            | GeoTIFF   |


El área en cuestión del cantón de San Ramón se detalla en la siguiente tabla:

| Extremo                   | X (Este) | Y (Norte) |
|----------------------------|-----------|-----------|
| Esquina superior izquierda | 447,500   | 1,116,000 |
| Esquina inferior derecha   | 456,000   | 1,108,000 |




In [23]:
# Seccion para importar bibliotecas
import geopandas as gpd
import rasterio
import numpy as np
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from rasterio.plot import show

In [4]:
# Ruta del archivo GeoTIFF
ruta06 = "SanRamon_06-07.tif"

# Abrir el archivo
with rasterio.open(ruta06) as src:
    print("METADATOS GENERALES DEL RASTER")
    print("---------------------------------")
    print(f"Archivo: {ruta06}")
    print(f"Driver: {src.driver}")
    print(f"Dimensiones (ancho x alto): {src.width} x {src.height}")
    print(f"Número de bandas: {src.count}")
    print(f"Tipo de dato (dtype): {src.dtypes[0]}")
    print(f"CRS (sistema de coordenadas): {src.crs}")
    print(f"Resolución (X, Y): {src.res}")
    print(f"Extensión (bounds): {src.bounds}")
    print(f"Transformación afín:\n{src.transform}")

METADATOS GENERALES DEL RASTER
---------------------------------
Archivo: SanRamon_06-07.tif
Driver: GTiff
Dimensiones (ancho x alto): 4683 x 2602
Número de bandas: 4
Tipo de dato (dtype): uint8
CRS (sistema de coordenadas): EPSG:5367
Resolución (X, Y): (0.9999672218663218, 0.9999548808609255)
Extensión (bounds): BoundingBox(left=445218.4262, bottom=1114131.927, right=449901.2727, top=1116733.8096)
Transformación afín:
| 1.00, 0.00, 445218.43|
| 0.00,-1.00, 1116733.81|
| 0.00, 0.00, 1.00|


In [24]:
# Interpretación de color por banda
with rasterio.open(ruta06) as src:
    print("Interpretación de color por banda")
    interp = list(src.colorinterp)
    for i, ci in enumerate(interp, start=1):
        print(f"Banda {i}: {ci}")
    print()

Interpretación de color por banda
Banda 1: 3
Banda 2: 4
Banda 3: 5
Banda 4: 6



In [25]:
# Ruta del archivo GeoTIFF
ruta15 = "SanRamon_15-18.tif"

# Abrir el archivo
with rasterio.open(ruta15) as src:
    print("METADATOS GENERALES DEL RASTER")
    print("---------------------------------")
    print(f"Archivo: {ruta15}")
    print(f"Driver: {src.driver}")
    print(f"Dimensiones (ancho x alto): {src.width} x {src.height}")
    print(f"Número de bandas: {src.count}")
    print(f"Tipo de dato (dtype): {src.dtypes[0]}")
    print(f"CRS (sistema de coordenadas): {src.crs}")
    print(f"Resolución (X, Y): {src.res}")
    print(f"Extensión (bounds): {src.bounds}")
    print(f"Transformación afín:\n{src.transform}")

METADATOS GENERALES DEL RASTER
---------------------------------
Archivo: SanRamon_15-18.tif
Driver: GTiff
Dimensiones (ancho x alto): 4683 x 2602
Número de bandas: 4
Tipo de dato (dtype): uint8
CRS (sistema de coordenadas): EPSG:5367
Resolución (X, Y): (0.9999672218663218, 0.9999548808609255)
Extensión (bounds): BoundingBox(left=445218.4262, bottom=1114131.927, right=449901.2727, top=1116733.8096)
Transformación afín:
| 1.00, 0.00, 445218.43|
| 0.00,-1.00, 1116733.81|
| 0.00, 0.00, 1.00|


In [26]:
# Interpretación de color por banda
with rasterio.open(ruta15) as src:
    print("Interpretación de color por banda")
    interp = list(src.colorinterp)
    for i, ci in enumerate(interp, start=1):
        print(f"Banda {i}: {ci}")
    print()

Interpretación de color por banda
Banda 1: 3
Banda 2: 4
Banda 3: 5
Banda 4: 6



De los resultados anteriores, podemos usar la informacion de la docuemntacion de Raterio donde obtenemos el significado del ColorInterp ([Fuente](https://rasterio.readthedocs.io/en/latest/api/rasterio.enums.html)) en la siguiente tabla:

| Valor (`enum`) | Nombre (`ColorInterp.<...>`) | Significado                                |
|----------------|------------------------------|--------------------------------------------|
| 0              | `undefined`                  | Sin definir / desconocido                  |
| 1              | `gray`                       | Escala de grises                           |
| 2              | `palette`                    | Colores por paleta (no común en ortofotos) |
| 3              | `red`                        | Canal Rojo                                 |
| 4              | `green`                      | Canal Verde                                |
| 5              | `blue`                       | Canal Azul                                 |
| 6              | `alpha`                      | Canal Alfa (transparencia)                 |
| 7              | `hue`                        | Matiz (H en HSV)                           |
| 8              | `saturation`                 | Saturación (S en HSV)                      |
| 9              | `lightness`                  | Luminosidad (L en HSL)                     |
| 10             | `cyan`                       | Canal Cian                                 |
| 11             | `magenta`                    | Canal Magenta                              |
| 12             | `yellow`                     | Canal Amarillo                             |
| 13             | `black`                      | Canal Negro (K en CMYK)                    |
| 14             | `yCbCr_Y`                    | Canal Y (luminancia)                       |
| 15             | `yCbCr_Cb`                   | Canal azul-crominancia                     |
| 16             | `yCbCr_Cr`                   | Canal rojo-crominancia                     |



Por lo tanto, de manera resumen podemos decir que las bandas que tienen los archivos son:

| Banda | Valor enum | Interpretación |
|--------|-------------|----------------|
| 1      | 3           | **Red**        |
| 2      | 4           | **Green**      |
| 3      | 5           | **Blue**       |
| 4      | 6           | **Alpha**      |



### Descripción de sus principales variables (columnas).