# Descarta de datos
Actualmente se estan descargando los datos del satelite **Sentinel-2 y  Landsat 9**


**ESTABLECIMIENTO DE FECHAS DE INTERES**

In [67]:
from datetime import datetime

# Create a specific date and time
start_date = datetime(year=2024, month=10, day=1)  # Year, Month, Day, con un digito las que son de 1

# end date
end_date = datetime(year=2025, month=1, day=8)

**IMPORTACION DE LIBRERIAS**

In [68]:
import os
import json
import ee 
import geopandas as gpd
import matplotlib.pyplot as plt
import geemap
import pandas as pd

In [69]:
# Extración de fechas
start_year = start_date.year
start_month = start_date.month
start_day = start_date.day

end_year = end_date.year
end_month = end_date.month
end_day = end_date.day

## Autentificación para GCP 

In [70]:
# 1) Obtención de la dirección de trabajo 
direction = os.getcwd()

# Remove the last part of the path
direction = os.path.dirname(direction)

# Dirección de la llave 
service_account= direction + '/conf/local/gcp-for-data-science-397913-4fd843feede1.json'

# Autentificación 
credentials = ee.ServiceAccountCredentials(email=None,key_file=service_account)
ee.Initialize(credentials)

## 1) Importación del área de interés 
**NOTA:** Se obtiene el área de interés por medio de un archivo tipo Geojson, kml o shape. Para este ejemplo se utilizará un KML.

In [71]:
import geojson

# Nombre del archivo GeoJson a exportar
geojson_path = direction + "/data/01_raw/AOI.geojson"

# Cargar el archivo GeoJSON
with open(geojson_path, "r") as f:
    data = geojson.load(f)

**CREACION DE UN EARTH ENGINE GEOMETRY**

Es necesario utilizar el AOI y tranformalo.

- **[Creación de un geometria para Earth Engine](https://developers.google.com/earth-engine/apidocs/ee-geometry)**: La geometria de earth engine se puede crear a partir de un GeoJSON, esto serivara para hacer el corte en las imagenes satelitales de interés


In [72]:
# Step 4: Convert to Earth Engine Geometry
area_interest = ee.Geometry(geo_json=data)
type(area_interest)

ee.geometry.Geometry

## 2) Descarga de imagenes satelitales
En esta sección se abordarán los siguientes procesos 


- Descarga de datos satelitales para esa área junto con un filtro al área de intrés, fechas y nubosidad

### 2.2) Creación de un mapa base e integración de área de interés

**AÑADIMOS LA GEOMETRIA AL MAPA**

In [73]:
# 1) Creación del mapa base 
Map  = geemap.Map()

# Anadimos un base map distinto 
Map.add_basemap(basemap="Esri.WorldImagery")  # Imagene satelital de ESRI 

# 2) Add the geometry to the map
Map.addLayer(area_interest, {"color": "red"}, "Cleaned Geometry")

# Center the map on the geometry
Map.centerObject(area_interest, 11)

### 2.3) Descarga de imagenes satelitales

**IMPORTANTE:**
 Se hará la descarga de las imagenes en los años que se eligieron al inicio para los siguientes satelites:


- Sentinel 2:
  Bandas seleccionadas:
     - B2: Banda azul, central Wavelength = 490nm
     - B3: Banda verde, central Wavelength = 560nm
     - B4: Banda roja, central Wavelength = 665nm
     - B8: Banda Near Infrared, central Wavelength = 842nm, utilizada con algunas de las bandas RGB para el cálculo del NDVI
     - B11: Banda (SWIR 1), central Wavelength = 1610nm,  utilizada para el cálculo de NDWI

<br>

   - LandSat 9, bandas seleccionadas:
     - B10: Banda termica , utilizada para el cálculo de Land Surface Temperature


#### 2.3.1) Set up de filtros  

In [74]:
# 1) Importación del image collection de Copernicus
landsat9 = ee.ImageCollection(args='LANDSAT/LC09/C02/T1_L2')

# 2) Filtro por área de interés
landsat9 = landsat9.filterBounds(geometry=area_interest)

# 3) Filtro por fechas de interés
landsat9 = landsat9.filterDate(start=f"{start_year}-{start_month}-{start_day}",
                                 end=f"{end_year}-{end_month}-{end_day}")  # año, mes y día

# 5) Filtro por nubosidad
landsat9 = landsat9.filterMetadata('CLOUD_COVER', 'less_than', 20)  # Only images with < 20% cloud cover, DIFERENCIA EN CODIGO
# NOTE: This is still a image collection object

# 6) Seleccion Bandas necesarias
landsat9  = landsat9.select(["SR_B2", "SR_B3", "SR_B4", "ST_B10"]) # La ST_B10 es la infrarroja
type(landsat9) # Esto es un Image Collection

ee.imagecollection.ImageCollection

#### 2.3.2) Obtención del ID de cada imagen y sus fechas

In [75]:
# Get the list of image IDs from the filtered ImageCollection
landsat9_images_ids = landsat9.aggregate_array('system:index').getInfo()

# Cantidad de imagenes
number_landsat = len(landsat9_images_ids)
print("Cantidad de imagenes de landsat:", number_landsat)

Cantidad de imagenes de landsat: 12


**LANDSAT**

In [76]:
# Lista donde se almacenara el ID de las imagenes y su fecha
landsat_ids_and_dates = []

#  Creación de la lista ee
landsat_list = landsat9.toList(landsat9.size()) # Esto genera una ee list que contiene todo el listado de imagenes y metadados

# Inicio del ciclo
for i in range(0,number_landsat):
    # Aqui  se esta obteniedo cada imagen de la lista
    image = ee.Image(landsat_list.get(i)) # Aqui hace la vinculación a una imagen en particula, en este caso toma la lista de ee y va tomar la imagen i, otra opcion tal vez mas sencilla de visualizar es usando directamtne el ID del a imagen (str)

    # Se toma el ID de la imagen
    image_id = image.get('system:index').getInfo()

    # Se toma la fecha de imagen
    date = ee.Date(image.get('system:time_start')).format('YYYY-MM-dd').getInfo()

    # Extraccion de la hora a la que se tomo la imagen
    center_time = image.get('SCENE_CENTER_TIME').getInfo()


    # Se integra los resultados a la lista
    landsat_ids_and_dates.append({'ID': image_id, 'Date': date, "Time":center_time})

# Convertirlo a un pandas DF
landsat_ids_and_dates  = pd.DataFrame(data= landsat_ids_and_dates )
print("Cantidad de imagenes:", len(landsat_ids_and_dates ["Date"]))

# Tranformar la columna Date a tipo date
landsat_ids_and_dates ['Date'] = pd.to_datetime(arg=landsat_ids_and_dates ['Date'])
landsat_ids_and_dates ["Satelite"] = "LANDSAT/LC09/C02/T1_L2"

# Convert the 'Date' column to string format
landsat_ids_and_dates['Date'] = landsat_ids_and_dates['Date'].dt.strftime('%Y-%m-%d')

# Extract only the hour and minute from the 'Time' column
landsat_ids_and_dates['Time'] = landsat_ids_and_dates['Time'].str[:5]  # HH:MM format

# Combine 'Date' and 'Time' into the 'Date' column
landsat_ids_and_dates['Date'] = landsat_ids_and_dates['Date'] + ' ' + landsat_ids_and_dates['Time']

# Convert 'Date' column to string (if not already)
landsat_ids_and_dates['Date'] = landsat_ids_and_dates['Date'].astype(str)

# Drop the 'Time' column if no longer needed
landsat_ids_and_dates = landsat_ids_and_dates.drop(columns=['Time'])
landsat_ids_and_dates.head(n=5) # Visualizacion

Cantidad de imagenes: 12


Unnamed: 0,ID,Date,Satelite
0,LC09_032043_20241011,2024-10-11 17:35,LANDSAT/LC09/C02/T1_L2
1,LC09_032043_20241027,2024-10-27 17:35,LANDSAT/LC09/C02/T1_L2
2,LC09_032043_20241112,2024-11-12 17:35,LANDSAT/LC09/C02/T1_L2
3,LC09_032043_20241128,2024-11-28 17:35,LANDSAT/LC09/C02/T1_L2
4,LC09_032043_20241214,2024-12-14 17:35,LANDSAT/LC09/C02/T1_L2


### 2.3.3) Solicitud de descarga

**LANDSAT**

In [77]:
# 1) Creación de un diccionario vacio
landsat_images_dic  = {}

# Inicio de la solocitud de descarga

for i in landsat_ids_and_dates.index: # Iteracion sobre el indice del pandas DF
    # Extracción del ID de la imagen
    ID = landsat_ids_and_dates["ID"].loc[i]

    # Extracción de la fecha de la imagen
    image_date = landsat_ids_and_dates["Date"].loc[i]

    # Solicitud de descarga
    image = landsat9.filter(ee.Filter.eq(name='system:index',value= ID)).first()

    # Recorte de la imagen usando la función de clip de ee
    image = image.clip(area_interest)  # Recorta al área de interés

    # 7) Almacenar en el diccionario
    landsat_images_dic[f"Image_{image_date}"] = image
    print(image_date)

2024-10-11 17:35
2024-10-27 17:35
2024-11-12 17:35
2024-11-28 17:35
2024-12-14 17:35
2024-12-30 17:35
2024-10-02 17:41
2024-10-18 17:41
2024-11-19 17:41
2024-12-05 17:41
2024-12-21 17:41
2025-01-06 17:41


**PENDIENTE:**
- Hay que meter un filtro de nubosidad más estricto, que evaluemos la cantidad de nubes pero SOLO en la zona de interés.

In [78]:
## ES LO QUE ME PUSO EL CHAT PARA EL FILTRADO DE NUBES EN EL AREA DE INTERES 

#def cloud_percentage_in_aoi(image, aoi):
 #   """Calculate cloud percentage within the area of interest (AOI)."""
    # Mask clouds using QA60 band (1 = clouds, 0 = clear)
  #  cloud_mask = image.select('QA60').eq(1)
    
    # Calculate the total number of pixels in the AOI
   # total_pixels = ee.Number(image.clip(aoi).reduceRegion(
    #    reducer=ee.Reducer.count(),
     #   geometry=aoi,
      #  scale=10,
       # maxPixels=1e13
   # ).values().get(0))

    # Calculate cloud pixels in the AOI
   # cloud_pixels = ee.Number(cloud_mask.clip(aoi).reduceRegion(
    #    reducer=ee.Reducer.count(),
     #   geometry=aoi,
      #  scale=10,
       # maxPixels=1e13
   # ).values().get(0))
    
    # Calculate cloud percentage
   # cloud_percentage = cloud_pixels.divide(total_pixels).multiply(100)
   # return cloud_percentage

# Main script
#image_dic = {}  # Dictionary to store images

#for i in years:
 #   for z in months:
  #      if i <= current_year and z <= current_month:
            # 1) Import Sentinel-2 image collection
   #         sentinel2 = ee.ImageCollection("COPERNICUS/S2_SR") \
    #            .filterBounds(area_interest) \
     #           .filterDate(f"{i}-{z}-01", f"{i}-{z}-28") \
      #          .filter(ee.Filter.lt("CLOUDY_PIXEL_PERCENTAGE", 20))  # Rough initial filter
            
            # 2) Filter images based on AOI-specific cloud percentage
       #     def filter_by_aoi_cloud(image):
        #        cloud_percent = cloud_percentage_in_aoi(image, area_interest)
         #       return image.set('CLOUD_PERCENT_AOI', cloud_percent)
            
            # Apply AOI-specific cloud percentage calculation
          #  images_with_cloud_info = sentinel2.map(filter_by_aoi_cloud)

            # Filter images where AOI cloud coverage is less than 10%
  #          filtered_images = images_with_cloud_info.filter(ee.Filter.lt('CLOUD_PERCENT_AOI', 10))
            
            # Select the first image
   #         image = filtered_images.first()
            
            # Check if image exists and process
    #        if image.getInfo() is not None:
                # Select visible bands and band 8
     #           image = image.select(['B2', 'B3', 'B4', 'B8'])
      #          image = image.clip(area_interest)
                
                # Store the image
       #         image_dic[f"{i}-{z}"] = image
        #        print(f"Image for {i}-{z} meets cloud criteria in AOI.")
         #   else:
          #      print(f"No valid image found for {i}-{z}.")


## 3) Exportación 
La exportación la realizaremos a un bucket de GCP
 
API Reference: https://developers.google.com/earth-engine/apidocs/export-image-tocloudstorage#colab-python

**NOTA IMPORTANTE:** La exportación de las imagenes debe de cumplir ciertos requerimientos para que earth engine pueda aceder a ellos, los cuales son: 

It must be located in the US multi-region or US-CENTRAL1 region.

### 3.1) Exportación de imagenes Sentinel

In [79]:
# 1) Obtención de las llaves del diccionario
keys = list(landsat_images_dic.keys())
sentinel_images_names =[]

# Inicio del ciclo 
for i in keys: 
    
    # 1) Lectura de los datos 
    image = landsat_images_dic[i]
    
    task = ee.batch.Export.image.toCloudStorage(
    image=image,
    #description=f"Export", # Este es el nombre del archivo que se exportara , si vas a usar el filenameprexi no es necesario esto 
    bucket='earth_engine_selene',  # Cambia esto al nombre de tu bucket
    region = area_interest, # el parámetro region sirve para definir el área geográfica específica que se va a exportar.
    fileNamePrefix=f"Landsat/Row_Data/{i}", # Damos una dirección dentro del bucket y le damos nombre
    scale=10,  # Resolución en metros
    fileFormat='GeoTIFF')  # Formato de archivo
    
    task.start()  # Inicia la tarea de exportación
    print("Se exportó la imagen a Cloud Storage:", i)    
    
    # Image name
    name = f"{i}"
    sentinel_images_names.append(name)

Se exportó la imagen a Cloud Storage: Image_2024-10-11 17:35
Se exportó la imagen a Cloud Storage: Image_2024-10-27 17:35
Se exportó la imagen a Cloud Storage: Image_2024-11-12 17:35
Se exportó la imagen a Cloud Storage: Image_2024-11-28 17:35
Se exportó la imagen a Cloud Storage: Image_2024-12-14 17:35
Se exportó la imagen a Cloud Storage: Image_2024-12-30 17:35
Se exportó la imagen a Cloud Storage: Image_2024-10-02 17:41
Se exportó la imagen a Cloud Storage: Image_2024-10-18 17:41
Se exportó la imagen a Cloud Storage: Image_2024-11-19 17:41
Se exportó la imagen a Cloud Storage: Image_2024-12-05 17:41
Se exportó la imagen a Cloud Storage: Image_2024-12-21 17:41
Se exportó la imagen a Cloud Storage: Image_2025-01-06 17:41


### 3.2) Exportación de mapa html 
Este mapa contiene las capas agregadas, en este caso solo el área de interés 

In [80]:
# Visualizacion del mapa en un broswer 
html_file = direction + "/data/02_intermediate/Map.html" # String de la direccion de exportacion
Map.to_html(filename=html_file, title="My Map", width="100%", height="880px") # Exporacion a una html 
# NOTA : En estos momentos solo agrege el area de interes, no estan las imagenes TIF 

### 3.3) Exportación del nombre de las imagenes 
Esto lo utilizaremos pasa saber exactamente que es lo que se exporto al bucket

In [81]:
# 1) Creación del pandas DF 
names = pd.DataFrame(data=sentinel_images_names, columns=["Images names"])

# 2) Exportación a csv 
names.to_csv(path_or_buf=direction + "/data/02_intermediate/Landsat_images_names.csv", index=False)