In [4]:
import geopandas as gpd
import geopandas as gpd

# Ruta del archivo GeoPackage
ruta_gpkg = '/Users/omartellez/proyecto_electoral_manzanillo/1_datos/02_procesados/dataset_produccion.gpkg'

try:
    # `gpd.list_layers` devuelve un DataFrame.
    nombres_de_capas_df = gpd.list_layers(ruta_gpkg)
    print("Información de las capas encontradas:")
    print(nombres_de_capas_df)
    print("\n")

    # Iterar a través de los valores en la columna 'name' del DataFrame
    for nombre_capa in nombres_de_capas_df['name']:
        print(f"--- Explorando la capa: '{nombre_capa}' ---")
        
        # Leer la capa específica en un GeoDataFrame
        gdf = gpd.read_file(ruta_gpkg, layer=nombre_capa)
        
        # Obtener y mostrar las columnas de la capa
        columnas = gdf.columns.tolist()
        print("Columnas:")
        for col in columnas:
            print(f"- {col}")
        
        # Opcional: Mostrar las primeras filas para tener una vista previa de los datos
        print("\nPrimeras 5 filas de la capa:")
        print(gdf.head())
        print("-" * 50 + "\n")

except Exception as e:
    print(f"Ocurrió un error: {e}")
    print("Por favor, verifica que la ruta del archivo sea correcta y que el archivo no esté corrupto.")
    

Información de las capas encontradas:
                 name geometry_type
0  dataset_produccion  MultiPolygon


--- Explorando la capa: 'dataset_produccion' ---
Columnas:
- seccion
- lista_nominal_promedio
- votos_totales_acumulados
- partido_dominante
- pct_voto_morena
- pct_voto_oposicion
- competitividad
- porc_genero_fem
- porc_ninos
- porc_futuros_votantes
- porc_jovenes
- porc_adultos_mayores
- porc_piso_tierra
- porc_con_auto
- porc_con_pc
- porc_con_celular
- porc_con_internet
- indice_digitalizacion
- GRAPROES
- porc_hogares_jefa_mujer
- porc_poblacion_migrante
- tasa_desocupacion
- porc_sin_servicios_salud
- indice_movilizacion
- geometry

Primeras 5 filas de la capa:
   seccion  lista_nominal_promedio  votos_totales_acumulados  \
0      254              478.458333                      8258   
1      255              312.541667                      5749   
2      202              506.177083                     32137   
3      200              554.500000                      9

In [7]:
import geopandas as gpd
import os

# --- 1. Definición de rutas y nombres ---

# Ruta del archivo original
ruta_gpkg_original = '/Users/omartellez/proyecto_electoral_manzanillo/1_datos/02_procesados/dataset_produccion.gpkg'
capa_original = 'dataset_produccion'

# Nombre y capa para el nuevo archivo
directorio = os.path.dirname(ruta_gpkg_original)
nombre_nuevo_archivo = 'manzanillo_secciones_censo.gpkg'
ruta_gpkg_nuevo = os.path.join(directorio, nombre_nuevo_archivo)
nombre_nueva_capa = 'manzanillo_secciones_censo'


# --- 2. Lista de columnas que quieres conservar ---

columnas_a_conservar = [
    'seccion',
    'porc_genero_fem',
    'porc_ninos',
    'porc_futuros_votantes',
    'porc_jovenes',
    'porc_adultos_mayores',
    'porc_piso_tierra',
    'porc_con_auto',
    'porc_con_pc',
    'porc_con_celular',
    'porc_con_internet',
    'indice_digitalizacion',
    'GRAPROES',
    'porc_hogares_jefa_mujer',
    'porc_poblacion_migrante',
    'tasa_desocupacion',
    'porc_sin_servicios_salud',
    'geometry'  # ¡Muy importante incluir la columna de geometría!
]

# --- 3. Proceso de lectura, selección y escritura ---

try:
    print(f"Leyendo la capa '{capa_original}' desde '{ruta_gpkg_original}'...")
    # Leer el archivo GeoPackage original
    gdf_original = gpd.read_file(ruta_gpkg_original, layer=capa_original)

    print("\nCreando el subconjunto con las columnas seleccionadas...")
    # Seleccionar solo las columnas deseadas
    # Se añade una validación para asegurar que todas las columnas existen
    columnas_existentes = [col for col in columnas_a_conservar if col in gdf_original.columns]
    gdf_nuevo = gdf_original[columnas_existentes]

    print(f"Columnas que se guardarán: {gdf_nuevo.columns.tolist()}")

    print(f"\nGuardando el nuevo archivo GeoPackage en '{ruta_gpkg_nuevo}'...")
    # Guardar el nuevo GeoDataFrame en un nuevo archivo GeoPackage
    gdf_nuevo.to_file(
        ruta_gpkg_nuevo,
        layer=nombre_nueva_capa,
        driver='GPKG'
    )

    print("\n¡Éxito! Se ha creado el nuevo archivo GeoPackage correctamente.")
    print(f"Ubicación: {ruta_gpkg_nuevo}")

except Exception as e:
    print(f"\nOcurrió un error durante el proceso: {e}")

Leyendo la capa 'dataset_produccion' desde '/Users/omartellez/proyecto_electoral_manzanillo/1_datos/02_procesados/dataset_produccion.gpkg'...

Creando el subconjunto con las columnas seleccionadas...
Columnas que se guardarán: ['seccion', 'porc_genero_fem', 'porc_ninos', 'porc_futuros_votantes', 'porc_jovenes', 'porc_adultos_mayores', 'porc_piso_tierra', 'porc_con_auto', 'porc_con_pc', 'porc_con_celular', 'porc_con_internet', 'indice_digitalizacion', 'GRAPROES', 'porc_hogares_jefa_mujer', 'porc_poblacion_migrante', 'tasa_desocupacion', 'porc_sin_servicios_salud', 'geometry']

Guardando el nuevo archivo GeoPackage en '/Users/omartellez/proyecto_electoral_manzanillo/1_datos/02_procesados/manzanillo_secciones_censo.gpkg'...

¡Éxito! Se ha creado el nuevo archivo GeoPackage correctamente.
Ubicación: /Users/omartellez/proyecto_electoral_manzanillo/1_datos/02_procesados/manzanillo_secciones_censo.gpkg
