In [204]:
# 1. Instalación de las dependencias clave
print("Instalando geopandas, folium y toolz...")
!pip install geopandas folium toolz
print("¡Librerías instaladas!")

Instalando geopandas, folium y toolz...
¡Librerías instaladas!


In [205]:
# --- Carga de Datos (Corregida) ---

# Esta es la URL oficial del dataset 'naturalearth_lowres'
url = "https://naturalearth.s3.amazonaws.com/110m_cultural/ne_110m_admin_0_countries.zip"

# Usamos la URL directamente en read_file
# Geopandas lo descargará y leerá automáticamente
gdf = gpd.read_file(url)

print("\n--- Datos Cargados Exitosamente (desde URL) ---")
print(f"El tipo de dato es: {type(gdf)}")
print("Primeras 5 filas del GeoDataFrame:")
print(gdf.head())


--- Datos Cargados Exitosamente (desde URL) ---
El tipo de dato es: <class 'geopandas.geodataframe.GeoDataFrame'>
Primeras 5 filas del GeoDataFrame:
        featurecla  scalerank  LABELRANK                   SOVEREIGNT SOV_A3  \
0  Admin-0 country          1          6                         Fiji    FJI   
1  Admin-0 country          1          3  United Republic of Tanzania    TZA   
2  Admin-0 country          1          7               Western Sahara    SAH   
3  Admin-0 country          1          2                       Canada    CAN   
4  Admin-0 country          1          2     United States of America    US1   

   ADM0_DIF  LEVEL               TYPE TLC                        ADMIN  ...  \
0         0      2  Sovereign country   1                         Fiji  ...   
1         0      2  Sovereign country   1  United Republic of Tanzania  ...   
2         0      2      Indeterminate   1               Western Sahara  ...   
3         0      2  Sovereign country   1            

In [206]:
# --- 1. Definición de Funciones Puras ---

def filter_by_continent(continent_name: str):
    """
    Función Curried (como pide tu README):
    Retorna OTRA función que sabe cómo filtrar por continente.
    """
    def inner_filter(df: gpd.GeoDataFrame) -> gpd.GeoDataFrame:
        print(f"-> Filtrando por continente: {continent_name}")
        # --- CORRECCIÓN AQUÍ ---
        # El nuevo dataset usa 'CONTINENT' (mayúsculas)
        return df[df['CONTINENT'] == continent_name].copy()
    return inner_filter

def calculate_area_km2(df: gpd.GeoDataFrame) -> gpd.GeoDataFrame:
    """
    Función Pura: Calcula el área y la añade como nueva columna.
    Usa una proyección de área equivalente (EPSG:3395) para un cálculo preciso.
    """
    print("-> Calculando área en km2")
    # Hacemos una copia para asegurar inmutabilidad de la operación
    df_copy = df.copy()
    df_copy['area_km2'] = df_copy.geometry.to_crs('EPSG:3395').area / 1_000_000
    return df_copy

def get_top_5_areas(df: gpd.GeoDataFrame) -> gpd.GeoDataFrame:
    """
    Función Pura: Ordena y retorna el Top 5.
    """
    print("-> Obteniendo Top 5")
    return df.sort_values(by='area_km2', ascending=False).head(5)

# --- 2. Aplicación del Pipeline Funcional ---
#
# Usamos 'pipe' para pasar el GeoDataFrame (gdf) a través
# de nuestra secuencia de funciones.

print("\n\n--- INICIANDO PIPELINE FUNCIONAL ---")

pipeline_data = pipe(gdf,
    filter_by_continent('South America'), # 1. Filtra (usando currying)
    calculate_area_km2,                  # 2. Transforma (map)
    get_top_5_areas                      # 3. Analiza (reduce/filter)
)

print("--- PIPELINE COMPLETADO ---")
print("\nResultado (Top 5 países de Sudamérica por área):")

# --- CORRECCIÓN AQUÍ ---
# El nuevo dataset usa 'NAME' y 'CONTINENT' (mayúsculas)
print(pipeline_data[['NAME', 'CONTINENT', 'area_km2']])



--- INICIANDO PIPELINE FUNCIONAL ---
-> Filtrando por continente: South America
-> Calculando área en km2
-> Obteniendo Top 5
--- PIPELINE COMPLETADO ---

Resultado (Top 5 países de Sudamérica por área):
         NAME      CONTINENT      area_km2
29     Brazil  South America  9.002220e+06
9   Argentina  South America  4.309344e+06
10      Chile  South America  1.438280e+06
31       Peru  South America  1.351899e+06
30    Bolivia  South America  1.186031e+06


In [207]:
# --- 1. Definición de Funciones Puras ---

def filter_by_continent(continent_name: str):
    """
    Función Curried (como pide tu README):
    Retorna OTRA función que sabe cómo filtrar por continente.
    """
    def inner_filter(df: gpd.GeoDataFrame) -> gpd.GeoDataFrame:
        print(f"-> Filtrando por continente: {continent_name}")
        # --- CORRECCIÓN AQUÍ ---
        # El nuevo dataset usa 'CONTINENT' (mayúsculas)
        return df[df['CONTINENT'] == continent_name].copy()
    return inner_filter

def calculate_area_km2(df: gpd.GeoDataFrame) -> gpd.GeoDataFrame:
    """
    Función Pura: Calcula el área y la añade como nueva columna.
    Usa una proyección de área equivalente (EPSG:3395) para un cálculo preciso.
    """
    print("-> Calculando área en km2")
    # Hacemos una copia para asegurar inmutabilidad de la operación
    df_copy = df.copy()
    df_copy['area_km2'] = df_copy.geometry.to_crs('EPSG:3395').area / 1_000_000
    return df_copy

def get_top_5_areas(df: gpd.GeoDataFrame) -> gpd.GeoDataFrame:
    """
    Función Pura: Ordena y retorna el Top 5.
    """
    print("-> Obteniendo Top 5")
    # 'name' en el nuevo dataset es 'NAME'
    return df.sort_values(by='area_km2', ascending=False).head(5)

# --- 2. Aplicación del Pipeline Funcional ---
#
# Usamos 'pipe' para pasar el GeoDataFrame (gdf) a través
# de nuestra secuencia de funciones.

print("\n\n--- INICIANDO PIPELINE FUNCIONAL ---")

pipeline_data = pipe(gdf,
    filter_by_continent('South America'), # 1. Filtra (usando currying)
    calculate_area_km2,                  # 2. Transforma (map)
    get_top_5_areas                      # 3. Analiza (reduce/filter)
)

print("--- PIPELINE COMPLETADO ---")
print("\nResultado (Top 5 países de Sudamérica por área):")

# --- CORRECCIÓN AQUÍ ---
# El nuevo dataset usa 'NAME' y 'CONTINENT' (mayúsculas)
print(pipeline_data[['NAME', 'CONTINENT', 'area_km2']])



--- INICIANDO PIPELINE FUNCIONAL ---
-> Filtrando por continente: South America
-> Calculando área en km2
-> Obteniendo Top 5
--- PIPELINE COMPLETADO ---

Resultado (Top 5 países de Sudamérica por área):
         NAME      CONTINENT      area_km2
29     Brazil  South America  9.002220e+06
9   Argentina  South America  4.309344e+06
10      Chile  South America  1.438280e+06
31       Peru  South America  1.351899e+06
30    Bolivia  South America  1.186031e+06


In [208]:
# 1. Crear el directorio 'src'
!mkdir -p src

In [209]:
%%writefile src/analysis.py
# Contenido de src/analysis.py
import geopandas as gpd

def filter_by_continent(continent_name: str):
    """
    Función Curried: Retorna una función para filtrar por continente.
    """
    def inner_filter(df: gpd.GeoDataFrame) -> gpd.GeoDataFrame:
        print(f"-> (Analysis) Filtrando por continente: {continent_name}")
        # --- CORRECCIÓN ---
        # El nuevo dataset usa 'CONTINENT' (mayúsculas)
        return df[df['CONTINENT'] == continent_name].copy()
    return inner_filter

def get_top_n_areas(df: gpd.GeoDataFrame, n: int = 5) -> gpd.GeoDataFrame:
    """
    Función Pura: Ordena y retorna el Top N de áreas.
    """
    print(f"-> (Analysis) Obteniendo Top {n}")
    if 'area_km2' not in df.columns:
        raise ValueError("El DataFrame debe tener la columna 'area_km2'. Ejecute calculate_area_km2 primero.")

    return df.sort_values(by='area_km2', ascending=False).head(n)

print("Archivo 'src/analysis.py' CORREGIDO.")

Overwriting src/analysis.py


In [210]:
import geopandas as gpd
from toolz import pipe
import importlib  # <-- 1. Importamos la librería para recargar

# --- Importar nuestros módulos (primero el módulo completo) ---
import src.transforms
import src.analysis

# --- 2. Forzar la recarga de los módulos ---
# Esto le dice a Python que vuelva a leer los archivos .py
importlib.reload(src.transforms)
importlib.reload(src.analysis)

# --- 3. Importar las funciones específicas DESPUÉS de recargar ---
from src.transforms import calculate_area_km2
from src.analysis import filter_by_continent, get_top_n_areas

print("--- Módulos 'src.transforms' y 'src.analysis' RECARGADOS ---")

# 4. Cargar datos (Corregido)
url = "https://naturalearth.s3.amazonaws.com/110m_cultural/ne_110m_admin_0_countries.zip"
gdf = gpd.read_file(url)

print("\n\n--- INICIANDO PIPELINE ESTRUCTURADO ---")

# 5. Ejecutar el pipeline
pipeline_result = pipe(gdf,
    filter_by_continent('Africa'),  # Función de 'analysis.py'
    calculate_area_km2,             # Función de 'transforms.py'
    get_top_n_areas                 # Función de 'analysis.py'
)

print("--- PIPELINE ESTRUCTURADO COMPLETADO ---")
print("\nResultado (Top 5 países de África por área):")
# Usar 'NAME' y 'CONTINENT' (mayúsculas)
print(pipeline_result[['NAME', 'CONTINENT', 'area_km2']])

Archivo 'src/analysis.py' CORREGIDO.
--- Módulos 'src.transforms' y 'src.analysis' RECARGADOS ---


--- INICIANDO PIPELINE ESTRUCTURADO ---
-> (Analysis) Filtrando por continente: Africa
-> (Transform) Calculando área en km2
-> (Analysis) Obteniendo Top 5
--- PIPELINE ESTRUCTURADO COMPLETADO ---

Resultado (Top 5 países de África por área):
                NAME CONTINENT      area_km2
82           Algeria    Africa  3.000257e+06
11   Dem. Rep. Congo    Africa  2.342582e+06
164            Libya    Africa  2.063456e+06
14             Sudan    Africa  2.008403e+06
25      South Africa    Africa  1.591429e+06


In [211]:
%%writefile src/geospatial.py
# Contenido de src/geospatial.py
import geopandas as gpd

def load_geojson(filepath: str) -> gpd.GeoDataFrame:
    """
    Función Pura: Carga un archivo geoespacial (GeoJSON, Shapefile, etc.).
    """
    try:
        print(f"-> (Geo) Cargando datos desde {filepath}")
        gdf = gpd.read_file(filepath)
        return gdf
    except Exception as e:
        print(f"Error al cargar el archivo {filepath}: {e}")
        return gpd.GeoDataFrame() # Retorna un GDF vacío en caso de error

print("Archivo 'src/geospatial.py' creado.")

Overwriting src/geospatial.py


In [212]:
%%writefile src/geospatial.py
# Contenido de src/geospatial.py
import geopandas as gpd

def load_geojson(filepath: str) -> gpd.GeoDataFrame:
    """
    Función Pura: Carga un archivo geoespacial (GeoJSON, Shapefile, etc.).
    """
    try:
        print(f"-> (Geo) Cargando datos desde {filepath}")
        gdf = gpd.read_file(filepath)
        return gdf
    except Exception as e:
        print(f"Error al cargar el archivo {filepath}: {e}")
        return gpd.GeoDataFrame() # Retorna un GDF vacío en caso de error

print("Archivo 'src/geospatial.py' creado.")

Overwriting src/geospatial.py


In [213]:
%%writefile src/visualization.py
# Contenido de src/visualization.py
import folium
import geopandas as gpd

def visualize_map(gdf: gpd.GeoDataFrame, location: list = None, zoom_start: int = 3, output_filename: str = None):
    """
    Función Pura (en espíritu): Genera un mapa interactivo de Folium.
    """
    if gdf.empty:
        print("GeoDataFrame vacío, no se puede generar el mapa.")
        return

    # Si no se da una ubicación, centrar en el centroide de los datos
    if location is None:
        try:
            center = gdf.unary_union.centroid
            location = [center.y, center.x]
        except Exception as e:
            print(f"No se pudo calcular el centroide, usando [0,0]. Error: {e}")
            location = [0, 0] # Fallback

    print(f"-> (Viz) Generando mapa centrado en {location}")
    m = folium.Map(location=location, zoom_start=zoom_start)

    # --- CORRECCIÓN ---
    # Buscamos las columnas en MAYÚSCULAS que usa el nuevo dataset.
    cols = [col for col in ['NAME', 'CONTINENT', 'area_km2'] if col in gdf.columns]

    # Fallback para el geojson de 'data/' (para celdas futuras)
    if not cols:
        cols = [col for col in ['id', 'tipo_zona', 'area_km2'] if col in gdf.columns]

    print(f"-> (Viz) Usando columnas para tooltip: {cols}")

    folium.GeoJson(
        gdf,
        name='Datos Analizados',
        tooltip=folium.features.GeoJsonTooltip(fields=cols, aliases=cols),
        popup=folium.features.GeoJsonPopup(fields=cols, aliases=cols)
    ).add_to(m)

    folium.LayerControl().add_to(m)

    if output_filename:
        print(f"-> (Viz) Guardando mapa en {output_filename}")
        m.save(output_filename)
        return output_filename # Retornar la ruta
    else:
        print("-> (Viz) Mostrando mapa en el notebook...")
        return m # Retornar el objeto mapa para 'display()'

print("Archivo 'src/visualization.py' CREADO Y CORREGIDO.")

Overwriting src/visualization.py


In [214]:
import geopandas as gpd
from toolz import pipe

# --- Importar desde TODOS nuestros módulos del proyecto ---
from src.geospatial import load_geojson
from src.transforms import calculate_area_km2
from src.analysis import filter_by_continent, get_top_n_areas
from src.visualization import visualize_map

print("--- Todos los módulos del proyecto ('src/') importados ---")

# --- Pipeline Completo (Estilo README.md) ---
print("\n\n--- INICIANDO PIPELINE FINAL ---")

# 1. Definir la ruta del archivo (¡CORREGIDO!)
# Usamos la URL del dataset
data_path = "https://naturalearth.s3.amazonaws.com/110m_cultural/ne_110m_admin_0_countries.zip"

# 2. Ejecutar el pipeline completo
final_result = pipe(data_path,
    load_geojson,                     # 1. src.geospatial
    filter_by_continent('Africa'),    # 2. src.analysis
    calculate_area_km2,               # 3. src.transforms
    get_top_n_areas                   # 4. src.analysis
)

print("--- PIPELINE FINAL COMPLETADO ---")
print("\nResultado (Top 5 África):")
# --- CORRECCIÓN ---
# Usar 'NAME' y 'CONTINENT' (mayúsculas)
print(final_result[['NAME', 'CONTINENT', 'area_km2']])

# 3. Visualizar el resultado
mapa = visualize_map(final_result)
display(mapa)

--- Todos los módulos del proyecto ('src/') importados ---


--- INICIANDO PIPELINE FINAL ---
-> (Geo) Cargando datos desde https://naturalearth.s3.amazonaws.com/110m_cultural/ne_110m_admin_0_countries.zip
-> (Analysis) Filtrando por continente: Africa
-> (Transform) Calculando área en km2
-> (Analysis) Obteniendo Top 5
--- PIPELINE FINAL COMPLETADO ---

Resultado (Top 5 África):
                NAME CONTINENT      area_km2
82           Algeria    Africa  3.000257e+06
11   Dem. Rep. Congo    Africa  2.342582e+06
164            Libya    Africa  2.063456e+06
14             Sudan    Africa  2.008403e+06
25      South Africa    Africa  1.591429e+06
-> (Viz) Generando mapa centrado en [10.641081480458253, 18.504934756849735]
-> (Viz) Usando columnas para tooltip: ['NAME', 'CONTINENT', 'area_km2']
-> (Viz) Mostrando mapa en el notebook...


In [215]:
# 1. Crear el directorio 'tests'
!mkdir -p tests

In [216]:


# 2. Usar 'writefile' para crear el archivo de prueba
%%writefile tests/test_transforms.py
# Contenido de tests/test_transforms.py
import pytest
import geopandas as gpd
from shapely.geometry import Polygon
from src.transforms import calculate_area_km2

# Ocupamos crear un 'fixture' (datos de prueba)
@pytest.fixture
def sample_gdf() -> gpd.GeoDataFrame:
    """Crea un GeoDataFrame de prueba simple."""
    # Un polígono simple (un cuadrado)
    poly = Polygon([(0, 0), (0, 10), (10, 10), (10, 0)])
    # Creamos el GeoDataFrame en el CRS EPSG:4326 (lat/lon)
    gdf = gpd.GeoDataFrame(
        {'id': [1], 'geometry': [poly]},
        crs='EPSG:4326'
    )
    return gdf

# --- Inicio de las Pruebas ---
def test_calculate_area_km2_creates_column(sample_gdf):
    """Prueba que la función crea la columna 'area_km2'."""
    print("Ejecutando test: test_calculate_area_km2_creates_column")

    # 1. Aplicamos la función a transformar
    result_gdf = calculate_area_km2(sample_gdf)

    # 2. Verificamos (Assert)
    assert 'area_km2' in result_gdf.columns

def test_calculate_area_km2_calculates_correctly(sample_gdf):
    """
    Prueba que el área calculada es un valor positivo.
    Una prueba real verificaría el valor exacto, pero para
    este ejemplo, solo verificamos que sea positivo.
    """
    print("Ejecutando test: test_calculate_area_km2_calculates_correctly")

    # 1. Aplicamos la función
    result_gdf = calculate_area_km2(sample_gdf)

    # 2. Verificamos
    area_value = result_gdf['area_km2'].iloc[0]
    assert area_value is not None
    assert area_value > 0

print("Archivo 'tests/test_transforms.py' creado.")

Overwriting tests/test_transforms.py


In [217]:
# 1. Instalar pytest (y pytest-cov para cobertura, como pide el README)
print("Instalando pytest y pytest-cov...")
!pip install pytest pytest-cov

# 2. Ejecutar Pytest (¡CORREGIDO!)
# El comando '!' ejecuta pytest desde el shell.
print("\n--- EJECUTANDO PRUEBAS (pytest) ---")
# Agregamos PYTHONPATH=. para que Python encuentre la carpeta 'src'
!PYTHONPATH=. pytest tests/

# 3. Ejecutar Pruebas con Cobertura (¡CORREGIDO!)
print("\n--- EJECUTANDO PRUEBAS CON COBERTURA (pytest --cov) ---")
# Agregamos PYTHONPATH=. aquí también
!PYTHONPATH=. pytest --cov=src tests/

Instalando pytest y pytest-cov...

--- EJECUTANDO PRUEBAS (pytest) ---
platform linux -- Python 3.12.12, pytest-8.4.2, pluggy-1.6.0
rootdir: /content
plugins: cov-7.0.0, langsmith-0.4.42, typeguard-4.4.4, anyio-4.11.0
collected 2 items                                                              [0m

tests/test_transforms.py [32m.[0m[32m.[0m[32m                                              [100%][0m


--- EJECUTANDO PRUEBAS CON COBERTURA (pytest --cov) ---
platform linux -- Python 3.12.12, pytest-8.4.2, pluggy-1.6.0
rootdir: /content
plugins: cov-7.0.0, langsmith-0.4.42, typeguard-4.4.4, anyio-4.11.0
collected 2 items                                                              [0m

tests/test_transforms.py [32m.[0m[32m.[0m[32m                                              [100%][0m

_______________ coverage: platform linux, python 3.12.12-final-0 _______________

Name                   Stmts   Miss  Cover
------------------------------------------
src/analysis.py         

In [218]:
%%writefile requirements.txt
# Contenido de requirements.txt

# --- Core Geoespacial y Funcional ---
geopandas>=0.14.0
shapely>=2.0.0
folium>=0.15.0
toolz>=0.12.0

# --- Análisis y Datos ---
numpy>=1.24.0
pandas>=2.0.0
matplotlib>=3.7.0

# --- Pruebas (Testing) ---
pytest>=8.0.0
pytest-cov>=5.0.0

print("Archivo 'requirements.txt' creado exitosamente.")

Overwriting requirements.txt


In [219]:
# 1. Crear los directorios para los datos
!mkdir -p data/input

In [220]:


# 2. Crear el archivo 'mapa.geojson' con datos de prueba
%%writefile data/input/mapa.geojson
{
  "type": "FeatureCollection",
  "features": [
    {
      "type": "Feature",
      "properties": {
        "id": "zona_A",
        "tipo_zona": "Comercial",
        "valor_estimado": 4500000
      },
      "geometry": {
        "type": "Polygon",
        "coordinates": [
          [
            [-103.4, 19.2],
            [-103.3, 19.2],
            [-103.3, 19.3],
            [-103.4, 19.3],
            [-103.4, 19.2]
          ]
        ]
      }
    },
    {
      "type": "Feature",
      "properties": {
        "id": "zona_B",
        "tipo_zona": "Residencial",
        "valor_estimado": 2200000
      },
      "geometry": {
        "type": "Polygon",
        "coordinates": [
          [
            [-103.3, 19.1],
            [-103.2, 19.1],
            [-103.2, 19.2],
            [-103.3, 19.2],
            [-103.3, 19.1]
          ]
        ]
      }
    },
    {
      "type": "Feature",
      "properties": {
        "id": "zona_C",
        "tipo_zona": "Comercial",
        "valor_estimado": 7800000
      },
      "geometry": {
        "type": "Polygon",
        "coordinates": [
          [
            [-103.5, 19.25],
            [-103.4, 19.25],
            [-103.4, 19.35],
            [-103.5, 19.35],
            [-103.5, 19.25]
          ]
        ]
      }
    }
  ]
}

print("Directorio 'data/input/' y 'mapa.geojson' creados exitosamente.")

Overwriting data/input/mapa.geojson


In [221]:
%%writefile --append src/analysis.py

def filter_by_property(property_name: str, property_value: any):
    """
    Función Curried: Retorna una función para filtrar por una propiedad y valor.
    Ej: filter_by_property('tipo_zona', 'Comercial')
    """
    def inner_filter(df: gpd.GeoDataFrame) -> gpd.GeoDataFrame:
        print(f"-> (Analysis) Filtrando por {property_name} == {property_value}")
        try:
            # Aseguramos devolver una copia
            return df[df[property_name] == property_value].copy()
        except KeyError:
            print(f"  Error: La propiedad '{property_name}' no existe en el GeoDataFrame.")
            return gpd.GeoDataFrame() # Retorna GDF vacío
    return inner_filter

print("Función 'filter_by_property' agregada a 'src/analysis.py'.")

Appending to src/analysis.py


In [222]:
%%writefile --append src/analysis.py

def filter_by_property(property_name: str, property_value: any):
    """
    Función Curried: Retorna una función para filtrar por una propiedad y valor.
    Ej: filter_by_property('tipo_zona', 'Comercial')
    """
    def inner_filter(df: gpd.GeoDataFrame) -> gpd.GeoDataFrame:
        print(f"-> (Analysis) Filtrando por {property_name} == {property_value}")
        try:
            # Aseguramos devolver una copia
            return df[df[property_name] == property_value].copy()
        except KeyError:
            print(f"  Error: La propiedad '{property_name}' no existe en el GeoDataFrame.")
            return gpd.GeoDataFrame() # Retorna GDF vacío
    return inner_filter

print("Función 'filter_by_property' AGREGADA a 'src/analysis.py'.")

Appending to src/analysis.py


In [223]:
%%writefile src/analysis.py
# Contenido COMPLETO Y CORREGIDO de src/analysis.py
import geopandas as gpd

def filter_by_continent(continent_name: str):
    """
    Función Curried: Retorna una función para filtrar por continente.
    """
    def inner_filter(df: gpd.GeoDataFrame) -> gpd.GeoDataFrame:
        print(f"-> (Analysis) Filtrando por continente: {continent_name}")
        return df[df['CONTINENT'] == continent_name].copy()
    return inner_filter

# --- VERSIÓN CORREGIDA (CURRIED) ---
def get_top_n_areas(n: int = 5):
    """
    Función Curried: Retorna una función que ordena y retorna el Top N de áreas.
    """
    def inner_analysis(df: gpd.GeoDataFrame) -> gpd.GeoDataFrame:
        print(f"-> (Analysis) Obteniendo Top {n}")
        if 'area_km2' not in df.columns:
            raise ValueError("El DataFrame debe tener la columna 'area_km2'. Ejecute calculate_area_km2 primero.")

        return df.sort_values(by='area_km2', ascending=False).head(n)
    return inner_analysis # Retorna la función interna que espera el df

def filter_by_property(property_name: str, property_value: any):
    """
    Función Curried: Retorna una función para filtrar por una propiedad y valor.
    """
    def inner_filter(df: gpd.GeoDataFrame) -> gpd.GeoDataFrame:
        print(f"-> (Analysis) Filtrando por {property_name} == {property_value}")
        try:
            return df[df[property_name] == property_value].copy()
        except KeyError:
            print(f"  Error: La propiedad '{property_name}' no existe en el GeoDataFrame.")
            return gpd.GeoDataFrame()
    return inner_filter

print("Archivo 'src/analysis.py' SOBREESCRITO con la versión curried correcta.")

Overwriting src/analysis.py
