This code creates variable metadata information to be added to a table

In [1]:
import os
import rasterio
import pandas as pd

# Ruta de la carpeta con los archivos TIF
ruta_carpeta = r"H:\.shortcut-targets-by-id\1M44eQfgiKNtbHWnOemX3695BodORG2B6\LW_SEM\WP4\EarthCul\Variables_layers\Variables Modelos\Aiguestortes\RGB diversity"

# Crear una lista para almacenar la información de los archivos
datos = []

# Iterar sobre los archivos en la carpeta
for archivo in os.listdir(ruta_carpeta):
    if archivo.endswith(".tif"):  # Filtrar solo archivos .tif
        ruta_archivo = os.path.join(ruta_carpeta, archivo)
        
        # Abrir el archivo TIF
        with rasterio.open(ruta_archivo) as src:
            # Leer datos del raster como matriz
            data = src.read(1)  # Leer la primera banda
            
            # Calcular valores mínimo, máximo y medio ignorando nodata
            nodata = src.nodata
            data_valid = data[data != nodata] if nodata is not None else data
            
            valor_min = data_valid.min()
            valor_max = data_valid.max()
            valor_medio = data_valid.mean()
            
            # Determinar tipo de variable (continua/categórica)
            tipo_variable = "continua" if len(set(data_valid)) > 10 else "categórica"
        
        # Agregar datos a la lista
        datos.append({
            "Archivo": archivo,
            "Valor Min": valor_min,
            "Valor Max": valor_max,
            "Valor Medio": valor_medio,
            "Tipo de Variable": tipo_variable
        })

# Convertir la lista a un DataFrame
df = pd.DataFrame(datos)

# Exportar el DataFrame a un archivo CSV
ruta_salida = os.path.join(ruta_carpeta, "resumen_variables_Aiguestortes_RGB_diversity.csv")
df.to_csv(ruta_salida, index=False, encoding='utf-8')

print(f"Archivo CSV creado exitosamente en: {ruta_salida}")


Archivo CSV creado exitosamente en: H:\.shortcut-targets-by-id\1M44eQfgiKNtbHWnOemX3695BodORG2B6\LW_SEM\WP4\EarthCul\Variables_layers\Variables Modelos\Aiguestortes\RGB diversity\resumen_variables_Aiguestortes_RGB_diversity.csv


For all the variables 

In [1]:
import os
import rasterio
import pandas as pd

# Ruta principal de la carpeta "Aiguestortes"
ruta_principal = r"H:\.shortcut-targets-by-id\1M44eQfgiKNtbHWnOemX3695BodORG2B6\LW_SEM\WP4\EarthCul\Variables_layers\Variables Modelos\Aiguestortes"

# Crear una lista para almacenar la información de los archivos
datos = []

# Recorrer todas las carpetas y subcarpetas de forma recursiva
for raiz, carpetas, archivos in os.walk(ruta_principal):
    for archivo in archivos:
        if archivo.endswith(".tif"):  # Filtrar solo archivos .tif
            ruta_archivo = os.path.join(raiz, archivo)
            
            # Abrir el archivo TIF
            with rasterio.open(ruta_archivo) as src:
                # Leer datos del raster como matriz
                data = src.read(1)  # Leer la primera banda
                
                # Calcular valores mínimo, máximo y medio ignorando nodata
                nodata = src.nodata
                data_valid = data[data != nodata] if nodata is not None else data
                
                valor_min = data_valid.min()
                valor_max = data_valid.max()
                valor_medio = data_valid.mean()
                
                # Determinar tipo de variable (continua/categórica)
                tipo_variable = "continua" if len(set(data_valid)) > 10 else "categórica"
            
            # Agregar datos a la lista
            datos.append({
                "Archivo": archivo,
                "Ruta Completa": ruta_archivo,
                "Valor Min": valor_min,
                "Valor Max": valor_max,
                "Valor Medio": valor_medio,
                "Tipo de Variable": tipo_variable
            })

# Convertir la lista a un DataFrame
df = pd.DataFrame(datos)

# Exportar el DataFrame a un archivo CSV
ruta_salida = os.path.join(ruta_principal, "resumen_variables_recursivo.csv")
df.to_csv(ruta_salida, index=False, encoding='utf-8')

print(f"Archivo CSV creado exitosamente en: {ruta_salida}")


Archivo CSV creado exitosamente en: H:\.shortcut-targets-by-id\1M44eQfgiKNtbHWnOemX3695BodORG2B6\LW_SEM\WP4\EarthCul\Variables_layers\Variables Modelos\Aiguestortes\resumen_variables_recursivo.csv


For all the parks 

In [None]:
import os
import rasterio
import pandas as pd

# Ruta principal donde se encuentran todas las carpetas de parques
ruta_principal = r"H:\.shortcut-targets-by-id\1M44eQfgiKNtbHWnOemX3695BodORG2B6\LW_SEM\WP4\EarthCul\Variables_layers\Variables Modelos"

# Crear una lista para almacenar la información de los archivos
datos = []

# Recorrer cada parque (carpeta principal)
for parque in os.listdir(ruta_principal):
    ruta_parque = os.path.join(ruta_principal, parque)
    
    # Verificar que sea una carpeta
    if os.path.isdir(ruta_parque):
        # Recorrer todas las subcarpetas y archivos de forma recursiva
        for raiz, carpetas, archivos in os.walk(ruta_parque):
            for archivo in archivos:
                if archivo.endswith(".tif"):  # Filtrar solo archivos .tif
                    ruta_archivo = os.path.join(raiz, archivo)
                    
                    # Abrir el archivo TIF
                    with rasterio.open(ruta_archivo) as src:
                        # Leer datos del raster como matriz
                        data = src.read(1)  # Leer la primera banda
                        
                        # Calcular valores mínimo, máximo y medio ignorando nodata
                        nodata = src.nodata
                        data_valid = data[data != nodata] if nodata is not None else data
                        
                        valor_min = data_valid.min()
                        valor_max = data_valid.max()
                        valor_medio = data_valid.mean()
                        
                        # Determinar tipo de variable (continua/categórica)
                        tipo_variable = "continua" if len(set(data_valid)) > 10 else "categórica"
                    
                    # Agregar datos a la lista
                    datos.append({
                        "Parque": parque,
                        "Archivo": archivo,
                        "Ruta Completa": ruta_archivo,
                        "Valor Min": valor_min,
                        "Valor Max": valor_max,
                        "Valor Medio": valor_medio,
                        "Tipo de Variable": tipo_variable
                    })

# Convertir la lista a un DataFrame
df = pd.DataFrame(datos)

# Exportar el DataFrame a un archivo CSV
ruta_salida = os.path.join(ruta_principal, "resumen_variables_parques.csv")
df.to_csv(ruta_salida, index=False, encoding='utf-8')

print(f"Archivo CSV creado exitosamente en: {ruta_salida}")


CSV por parque 

In [None]:
import os
import rasterio
import pandas as pd

# Ruta principal donde se encuentran todas las carpetas de los parques
ruta_principal = r"H:\.shortcut-targets-by-id\1M44eQfgiKNtbHWnOemX3695BodORG2B6\LW_SEM\WP4\EarthCul\Variables_layers\Variables Modelos"

# Recorrer cada parque (carpeta principal)
for parque in os.listdir(ruta_principal):
    ruta_parque = os.path.join(ruta_principal, parque)
    
    # Verificar que sea una carpeta
    if os.path.isdir(ruta_parque):
        datos = []  # Lista temporal para almacenar la información del parque actual
        
        # Recorrer todas las subcarpetas y archivos de forma recursiva
        for raiz, carpetas, archivos in os.walk(ruta_parque):
            for archivo in archivos:
                if archivo.endswith(".tif"):  # Filtrar solo archivos .tif
                    ruta_archivo = os.path.join(raiz, archivo)
                    
                    # Abrir el archivo TIF
                    with rasterio.open(ruta_archivo) as src:
                        # Leer datos del raster como matriz
                        data = src.read(1)  # Leer la primera banda
                        
                        # Calcular valores mínimo, máximo y medio ignorando nodata
                        nodata = src.nodata
                        data_valid = data[data != nodata] if nodata is not None else data
                        
                        valor_min = data_valid.min()
                        valor_max = data_valid.max()
                        valor_medio = data_valid.mean()
                        
                        # Determinar tipo de variable (continua/categórica)
                        tipo_variable = "continua" if len(set(data_valid)) > 10 else "categórica"
                    
                    # Agregar datos a la lista temporal
                    datos.append({
                        "Archivo": archivo,
                        "Ruta Completa": ruta_archivo,
                        "Valor Min": valor_min,
                        "Valor Max": valor_max,
                        "Valor Medio": valor_medio,
                        "Tipo de Variable": tipo_variable
                    })
        
        # Verificar si hay datos y exportar a CSV
        if datos:
            df = pd.DataFrame(datos)
            ruta_csv = os.path.join(ruta_parque, f"resumen_{parque}.csv")
            df.to_csv(ruta_csv, index=False, encoding='utf-8')
            print(f"CSV creado para {parque} en: {ruta_csv}")


Promediar los valores 

In [None]:
import os
import pandas as pd

# Ruta principal donde se encuentran las carpetas de parques
ruta_principal = r"H:\.shortcut-targets-by-id\1M44eQfgiKNtbHWnOemX3695BodORG2B6\LW_SEM\WP4\EarthCul\Variables_layers\Variables Modelos"

# Lista para almacenar los datos de todos los CSV
datos_combinados = []

# Recorrer cada parque (carpeta principal)
for parque in os.listdir(ruta_principal):
    ruta_parque = os.path.join(ruta_principal, parque)
    
    # Verificar que sea una carpeta
    if os.path.isdir(ruta_parque):
        # Buscar archivos CSV en la carpeta del parque
        for archivo in os.listdir(ruta_parque):
            if archivo.endswith(".csv") and archivo.startswith("resumen_"):
                ruta_csv = os.path.join(ruta_parque, archivo)
                
                # Leer el archivo CSV y agregar una columna con el nombre del parque
                df = pd.read_csv(ruta_csv)
                df['Parque'] = parque  # Añadir columna Parque
                datos_combinados.append(df)

# Combinar todos los datos en un único DataFrame
df_completo = pd.concat(datos_combinados, ignore_index=True)

# Agrupar por nombre del archivo y tipo de variable, y calcular el promedio
df_promedio = df_completo.groupby(['Archivo', 'Tipo de Variable'], as_index=False).agg({
    'Valor Min': 'mean',
    'Valor Max': 'mean',
    'Valor Medio': 'mean'
})

# Exportar el resultado a un archivo CSV consolidado
ruta_salida = os.path.join(ruta_principal, "promedio_variables_global.csv")
df_promedio.to_csv(ruta_salida, index=False, encoding='utf-8')

print(f"Archivo CSV consolidado creado en: {ruta_salida}")
