In [5]:
import geopandas as gpd
import os

# --- CÓDIGO DE EXPLORACIÓN DEL SHAPEFILE ---

# 1. Define la ruta a tu archivo .shp
# Asumo que lo tienes en una carpeta como '05_censo' o similar
BASE_DIR = '/Users/omartellez/Manzanillo'
shapefile_folder = os.path.join(BASE_DIR, '05_censo') # ¡Ajusta esta ruta si es necesario!
shapefile_path = os.path.join(shapefile_folder, 'SECCION.shp')

# 2. Carga el Shapefile en un GeoDataFrame
try:
    gdf_censo = gpd.read_file(shapefile_path)
    print("¡Shapefile cargado exitosamente en un GeoDataFrame!\n")
    
    # 3. Muestra la información del GeoDataFrame
    print("--- Resumen de la estructura (.info()) ---")
    gdf_censo.info()
    
    # 4. Muestra las primeras filas de las columnas clave
    print("\n--- Primeras filas de columnas clave ---")
    # Seleccionamos la llave y algunas otras columnas para ver su formato
    # ¡Ajusta los nombres de las columnas censales si son diferentes!
    columnas_a_ver = [col for col in ['CVE_SECCION', 'POBTOT', 'GRAPROES', 'geometry'] if col in gdf_censo.columns]
    display(gdf_censo[columnas_a_ver].head())

except Exception as e:
    print(f"Ocurrió un error al cargar el Shapefile: {e}")

¡Shapefile cargado exitosamente en un GeoDataFrame!

--- Resumen de la estructura (.info()) ---
<class 'geopandas.geodataframe.GeoDataFrame'>
RangeIndex: 5535 entries, 0 to 5534
Data columns (total 7 columns):
 #   Column     Non-Null Count  Dtype   
---  ------     --------------  -----   
 0   ID         5535 non-null   int64   
 1   ENTIDAD    5535 non-null   int64   
 2   MUNICIPIO  5535 non-null   int64   
 3   SECCION    5535 non-null   int64   
 4   TIPO       5535 non-null   int64   
 5   CONTROL    5535 non-null   int64   
 6   geometry   5535 non-null   geometry
dtypes: geometry(1), int64(6)
memory usage: 302.8 KB

--- Primeras filas de columnas clave ---


Unnamed: 0,geometry
0,"POLYGON ((500302.763 2120249.665, 500360.086 2..."
1,"POLYGON ((500145.726 2120355.994, 500177.511 2..."
2,"POLYGON ((497706.152 2120593.746, 497746.478 2..."
3,"POLYGON ((484472.67 2120677.125, 484553.235 21..."
4,"POLYGON ((498286.657 2121249.594, 498303.07 21..."


In [6]:
import pandas as pd
import os

# --- CÓDIGO DE EXPLORACIÓN DEL ARCHIVO DEL CENSO ---

# 1. Define la ruta a tu archivo .csv
# Asumo que lo has guardado en la carpeta '05_censo' que creamos
BASE_DIR = '/Users/omartellez/Manzanillo'
censo_folder = os.path.join(BASE_DIR, '05_censo') 
censo_file_path = os.path.join(censo_folder, 'INE_SECCION_2020.csv')

# 2. Carga el CSV en un DataFrame
try:
    df_censo = pd.read_csv(censo_file_path)
    print("¡Archivo del censo cargado exitosamente!\n")
    
    # 3. Muestra la información del DataFrame
    print("--- Resumen de la estructura (.info()) ---")
    df_censo.info()
    
    # 4. Muestra las primeras filas para ver los datos
    print("\n--- Primeras 5 filas del archivo (.head()) ---")
    display(df_censo.head())

except FileNotFoundError:
    print(f"ERROR: No se encontró el archivo en la ruta especificada: {censo_file_path}")
    print("Por favor, asegúrate de que el archivo esté en la carpeta correcta.")
except Exception as e:
    print(f"Ocurrió un error al cargar el archivo: {e}")

¡Archivo del censo cargado exitosamente!

--- Resumen de la estructura (.info()) ---
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 68806 entries, 0 to 68805
Columns: 226 entries, ID to VPH_SINTIC
dtypes: float64(7), int64(219)
memory usage: 118.6 MB

--- Primeras 5 filas del archivo (.head()) ---


Unnamed: 0,ID,ENTIDAD,DISTRITO,MUNICIPIO,SECCION,TIPO,POBTOT,POBFEM,POBMAS,P_0A2,...,VPH_TELEF,VPH_CEL,VPH_INTER,VPH_STVP,VPH_SPMVPI,VPH_CVJ,VPH_SINRTV,VPH_SINLTC,VPH_SINCIN,VPH_SINTIC
0,118,1,3,1,1,2,2564,1360,1204,36,...,698,740,738,659,615,288,2,1,12,1
1,122,1,3,1,2,2,889,462,427,27,...,173,253,195,164,145,54,4,20,72,2
2,128,1,3,1,3,2,2003,1057,946,56,...,426,621,559,360,335,184,10,4,74,1
3,137,1,3,1,4,2,1636,880,756,40,...,311,507,456,330,329,147,10,11,61,1
4,138,1,3,1,5,2,808,445,363,14,...,188,256,233,168,119,70,4,0,30,0


In [7]:
# (Asumiendo que df_censo ya está cargado en tu notebook)

# Esto nos mostrará los nombres de las primeras 30 columnas
print("Primeras 30 columnas en el archivo del censo:")
print(df_censo.columns.tolist()[:30])

# Y esto nos mostrará las primeras filas de esas columnas
print("\nPrimeras 5 filas de esas columnas:")
display(df_censo.iloc[:, :15].head())

Primeras 30 columnas en el archivo del censo:
['ID', 'ENTIDAD', 'DISTRITO', 'MUNICIPIO', 'SECCION', 'TIPO', 'POBTOT', 'POBFEM', 'POBMAS', 'P_0A2', 'P_0A2_F', 'P_0A2_M', 'P_0A17', 'P_3YMAS', 'P_3YMAS_F', 'P_3YMAS_M', 'P_5YMAS', 'P_5YMAS_F', 'P_5YMAS_M', 'P_12YMAS', 'P_12YMAS_F', 'P_12YMAS_M', 'P_15YMAS', 'P_15YMAS_F', 'P_15YMAS_M', 'P_18YMAS', 'P_18YMAS_F', 'P_18YMAS_M', 'P_3A5', 'P_3A5_F']

Primeras 5 filas de esas columnas:


Unnamed: 0,ID,ENTIDAD,DISTRITO,MUNICIPIO,SECCION,TIPO,POBTOT,POBFEM,POBMAS,P_0A2,P_0A2_F,P_0A2_M,P_0A17,P_3YMAS,P_3YMAS_F
0,118,1,3,1,1,2,2564,1360,1204,36,16,20,444,2526,1343
1,122,1,3,1,2,2,889,462,427,27,15,12,195,862,447
2,128,1,3,1,3,2,2003,1057,946,56,27,29,408,1947,1030
3,137,1,3,1,4,2,1636,880,756,40,20,20,311,1596,860
4,138,1,3,1,5,2,808,445,363,14,6,8,155,794,439


In [8]:
import pandas as pd
import os

# --- 1. CONFIGURACIÓN ---
BASE_DIR = '/Users/omartellez/Manzanillo'
censo_folder = os.path.join(BASE_DIR, '05_censo')
input_file_censo = 'INE_SECCION_2020.csv'
output_file_censo = 'censo_manzanillo_completo_2020.csv' # Nuevo nombre para reflejar que están todas las variables

# Las claves de INEGI para Colima (6) y Manzanillo (8)
ENTIDAD_ID = 6
MUNICIPIO_ID = 8

# Los nombres de las columnas que usaremos para filtrar
COL_ENTIDAD = 'ENTIDAD'
COL_MUNICIPIO = 'MUNICIPIO'
COL_SECCION = 'SECCION'

# --- 2. CARGA, FILTRADO Y LIMPIEZA ---
input_path = os.path.join(censo_folder, input_file_censo)
df_censo_raw = pd.read_csv(input_path)

# Filtramos para quedarnos solo con Manzanillo, Colima
print(f"Filtrando {len(df_censo_raw)} filas para Manzanillo...")
df_manzanillo_censo = df_censo_raw[
    (df_censo_raw[COL_ENTIDAD] == ENTIDAD_ID) & 
    (df_censo_raw[COL_MUNICIPIO] == MUNICIPIO_ID)
].copy()
print(f"Se encontraron {len(df_manzanillo_censo)} secciones para Manzanillo.")

# Limpieza de la llave 'seccion' para asegurar la unión
# Renombramos la columna
df_manzanillo_censo = df_manzanillo_censo.rename(columns={COL_SECCION: 'seccion'})
# Nos aseguramos que sea de tipo entero
df_manzanillo_censo['seccion'] = df_manzanillo_censo['seccion'].astype(int)

# --- 3. GUARDADO ---
os.makedirs(censo_folder, exist_ok=True)
output_path = os.path.join(censo_folder, output_file_censo)
df_manzanillo_censo.to_csv(output_path, index=False)

print(f"\n¡Archivo del censo completo para Manzanillo guardado!")
print(f"Guardado en: {output_path}")
print("\n--- Resumen de los datos del censo para Manzanillo ---")
df_manzanillo_censo.info()
print("\n--- Primeras filas de la base de censo de Manzanillo ---")
display(df_manzanillo_censo.head())

Filtrando 68806 filas para Manzanillo...
Se encontraron 70 secciones para Manzanillo.

¡Archivo del censo completo para Manzanillo guardado!
Guardado en: /Users/omartellez/Manzanillo/05_censo/censo_manzanillo_completo_2020.csv

--- Resumen de los datos del censo para Manzanillo ---
<class 'pandas.core.frame.DataFrame'>
Index: 70 entries, 5552 to 5621
Columns: 226 entries, ID to VPH_SINTIC
dtypes: float64(7), int64(219)
memory usage: 124.1 KB

--- Primeras filas de la base de censo de Manzanillo ---


Unnamed: 0,ID,ENTIDAD,DISTRITO,MUNICIPIO,seccion,TIPO,POBTOT,POBFEM,POBMAS,P_0A2,...,VPH_TELEF,VPH_CEL,VPH_INTER,VPH_STVP,VPH_SPMVPI,VPH_CVJ,VPH_SINRTV,VPH_SINLTC,VPH_SINCIN,VPH_SINTIC
5552,134,6,2,8,200,3,621,312,309,21,...,83,177,112,88,48,16,2,5,65,0
5553,38,6,2,8,201,2,7,5,2,0,...,4,3,3,4,1,0,0,0,1,0
5554,27,6,2,8,202,2,2322,1179,1143,87,...,303,669,368,332,49,40,24,45,327,7
5555,35,6,2,8,203,2,589,284,305,19,...,73,170,106,106,12,12,13,19,82,4
5556,33,6,2,8,204,2,1829,902,927,61,...,191,545,299,327,44,19,37,45,269,8


In [9]:
import pandas as pd
import geopandas as gpd
import os

# --- 1. CONFIGURACIÓN DE RUTAS ---
BASE_DIR = '/Users/omartellez/Manzanillo'

path_geometrias = os.path.join(BASE_DIR, '05_censo', 'SECCION.shp')
path_electoral = os.path.join(BASE_DIR, '05_analisis_agregado', 'analisis_agregado_por_seccion.csv')
# CAMBIO: Usamos el nuevo archivo del censo completo
path_censo = os.path.join(BASE_DIR, '05_censo', 'censo_manzanillo_completo_2020.csv')

output_folder = os.path.join(BASE_DIR, '06_geopackage')
output_file = 'Manzanillo_Analisis_Electoral_Censal_Completo.gpkg'

# --- 2. CARGA DE LAS TRES FUENTES DE DATOS ---
print("Cargando las tres fuentes de datos...")
gdf_secciones = gpd.read_file(path_geometrias)
df_electoral = pd.read_csv(path_electoral)
df_censo = pd.read_csv(path_censo)
print("¡Datos cargados exitosamente!")

# --- 3. PREPARACIÓN FINAL Y UNIÓN (MERGE) ---
# Asegurarnos que las llaves de unión sean del mismo tipo (int)
gdf_secciones['SECCION'] = gdf_secciones['SECCION'].astype(int)
df_electoral['seccion'] = df_electoral['seccion'].astype(int)
df_censo['seccion'] = df_censo['seccion'].astype(int)

# Primera unión: Geometrías con datos electorales agregados
print("Uniendo geometrías con datos electorales...")
gdf_merged = gdf_secciones.merge(df_electoral, left_on='SECCION', right_on='seccion', how='left')

# Segunda unión: El resultado anterior con TODOS los datos del censo
print("Uniendo el resultado con los datos del censo...")
gdf_final = gdf_merged.merge(df_censo, on='seccion', how='left')

# Eliminar columnas redundantes si las hay
if 'SECCION' in gdf_final.columns:
    gdf_final = gdf_final.drop(columns=['SECCION'])

# --- 4. GUARDADO DEL GEOPACKAGE ---
os.makedirs(output_folder, exist_ok=True)
output_path = os.path.join(output_folder, output_file)

gdf_final.to_file(output_path, driver='GPKG')

print("\n\n¡PROYECTO FINALIZADO!")
print(f"GeoPackage con censo completo creado exitosamente en: {output_path}")
print("\n--- Resumen del GeoDataFrame Final ---")
gdf_final.info()
print("\n--- Primeras filas del GeoPackage ---")
display(gdf_final.head())

Cargando las tres fuentes de datos...


FileNotFoundError: [Errno 2] No such file or directory: '/Users/omartellez/Manzanillo/05_analisis_agregado/analisis_agregado_por_seccion.csv'