# Format data - Casillas

In [1]:
import numpy as np
import pandas as pd

## Parámetros

In [48]:
dict_entidad = {1: "Aguascalientes", 
                2: "Baja California",
                3: "Baja California Sur",
                4: "Campeche",
                5: "Coahuila de Zaragoza",
                6: "Colima",
                7: "Chiapas",
                8: "Chihuahua",
                9: "Ciudad de México",
                10: "Durango",
                11: "Guanajuato",
                12: "Guerrero",
                13: "Hidalgo",
                14: "Jalisco",
                15: "Estado de México",
                16: "Michoacán de Ocampo",
                17: "Morelos",
                18: "Nayarit",
                19: "Nuevo León",
                20: "Oaxaca",
                21: "Puebla",
                22: "Querétaro",
                23: "Quintana Roo",
                24: "San Luis Potosí",
                25: "Sinaloa",
                26: "Sonora",
                27: "Tabasco",
                28: "Tamaulipas",
                29: "Tlaxcala",
                30: "Veracruz de Ignacio de la Llave",
                31: "Yucatán",
                32: "Zacatecas",}

#### Funciones

In [34]:
def gets_secciones_atendidas(casillas_df):
    """
    Gets a list of the sections that are being attended

    Parameters
    ----------
    casillas_df : dataframe
        Dataframe with the casillas data

    Returns
    -------
    list
        List of sections that are being attended per casilla
    """
    unique_domicilios = list(casillas_df['domicilio'].unique())
    vector_secciones = []

    for unique_domicilio in unique_domicilios:
        df_casilla = casillas_df[casillas_df['domicilio'] == unique_domicilio].copy()
        secciones_atendidas = list(df_casilla['seccion'].unique())
        str_secciones_atendidas = str(secciones_atendidas).replace('[', '').replace(']', '')
        # Agregar n veces el vector de secciones
        for n in list(df_casilla['seccion']):
            vector_secciones.append(str_secciones_atendidas)

    return vector_secciones

In [46]:
def get_entidad_name(entidad, dict_entidad):
    """
    Gets the name of the entidad

    Parameters
    ----------
    entidad : str
        Entidad code
    dict_entidad : dict
        Dictionary with the entidad code and name

    Returns
    -------
    str
        Name of the entidad
    """
    int_entidad = int(entidad)
    entidad_name = dict_entidad[int_entidad]
    
    return entidad_name

In [61]:
def clean_coordinates(df):
    """
    Cleans the coordinates

    Parameters
    ----------
    raw_coords : str
        Raw coordinates
    
    Returns
    -------
    list
    """
    unwanted_chars = ['[', ']']
    raw_coords = df['geom']

    for unwanted_char in unwanted_chars:
        raw_coords = raw_coords.replace(unwanted_char, '')
    
    clean_coords = raw_coords.split(',')
    clean_coords = [float(coord) for coord in clean_coords]
    
    return clean_coords 

In [79]:
def get_names_aliases(casillas_especiales):
    """
    Gets name and aliases of casillas especiales

    Parameters
    ----------
    casillas_especiales : dataframe
        Dataframe with the casillas especiales data

    Returns
    -------
    final_names: list
    final_aliases: list
    """
    entidades = list(casillas_especiales['entidad'].unique())
    final_names = []
    final_aliases = []

    for entidad in entidades:
        casillas_entidad = casillas_especiales[casillas_especiales['entidad'] == entidad]
        total_casillas = len(casillas_entidad)
        names = [f"S{num}" for num in range(1, total_casillas + 1)]
        aliases = [f"Especial {num}" for num in range(1, total_casillas + 1)]

        final_names.extend(names)
        final_aliases.extend(aliases)

    return final_names, final_aliases

### Pipeline

In [42]:
casillas_df_1 = pd.read_csv("casillas_edos-1-31.csv", encoding='utf-8-sig')
casillas_df_2 = pd.read_csv("casillas_edos-32.csv", encoding='utf-8-sig')
casillas_df = pd.concat([casillas_df_1, casillas_df_2], ignore_index=True)
casillas_df

Unnamed: 0,casilla,inicial,final,domicilio,ubicacion,entidad,distitoSede,distritoLocal,latitud,longitud,seccion
0,B,ABOYTES DOÑAS,LLAMAS DELGADO,"CALLE HUIZACHE, NÚMERO 108, FRACCIONAMIENTO EL...",DOMICILIO PARTICULAR,1,3,6,-102.321935,21.929537,1
1,C1,LLAMAS ESPERON,ZUÑIGA GONZALEZ,"CALLE HUIZACHE, NÚMERO 108, FRACCIONAMIENTO EL...",DOMICILIO PARTICULAR,1,3,6,-102.321935,21.929537,1
2,B,ABREGO GUTIERREZ,LLAMAS VAZQUEZ,"AVENIDA GUADALUPE GONZÁLEZ, SIN NÚMERO, COLONI...",AULA MAGNA DEL DESARROLLO INTEGRAL DE LA FAMIL...,1,3,6,-102.311723,21.909189,2
3,C1,LOERA CHAVEZ,ZURITA ALVARADO,"AVENIDA GUADALUPE GONZÁLEZ, SIN NÚMERO, COLONI...",AULA MAGNA DEL DESARROLLO INTEGRAL DE LA FAMIL...,1,3,6,-102.311723,21.909189,2
4,B,ABREGO GUTIERREZ,LLAMAS VAZQUEZ,"AVENIDA GUADALUPE GONZÁLEZ, SIN NÚMERO, COLONI...",AULA MAGNA DEL DESARROLLO INTEGRAL DE LA FAMIL...,1,3,6,-102.311723,21.909189,4
...,...,...,...,...,...,...,...,...,...,...,...
156941,C1,LOPEZ DE LA ROSA,ZUÑIGA TORRES,"CALLE SAN JUAN NÚMERO 15, FRACCIONAMIENTO SAN ...",DOMICILIO PARTICULAR,32,4,4,-102.495328,22.754158,1902
156942,B,ABRAHAM GARCIA,LOPEZ CORTES,"CALLE SAN JUAN NÚMERO 15, FRACCIONAMIENTO SAN ...",DOMICILIO PARTICULAR,32,4,4,-102.495328,22.754158,1905
156943,C1,LOPEZ DE LA ROSA,ZUÑIGA TORRES,"CALLE SAN JUAN NÚMERO 15, FRACCIONAMIENTO SAN ...",DOMICILIO PARTICULAR,32,4,4,-102.495328,22.754158,1905
156944,B,ABRAHAM GARCIA,LOPEZ CORTES,"CALLE SAN JUAN NÚMERO 15, FRACCIONAMIENTO SAN ...",DOMICILIO PARTICULAR,32,4,4,-102.495328,22.754158,1908


In [43]:
vector_secciones = gets_secciones_atendidas(casillas_df)
casillas_df['seccionesAtendidas'] = vector_secciones

In [51]:
casillas_df['nombreEntidad'] = casillas_df['entidad'].apply(lambda x: get_entidad_name(x, dict_entidad))
casillas_df.rename(columns={'latitud': 'longitud', 'longitud': 'latitud'}, inplace=True)
casillas_df

Unnamed: 0,casilla,inicial,final,domicilio,ubicacion,entidad,distitoSede,distritoLocal,longitud,latitud,seccion,seccionesAtendidas,nombreEntidad
0,B,ABOYTES DOÑAS,LLAMAS DELGADO,"CALLE HUIZACHE, NÚMERO 108, FRACCIONAMIENTO EL...",DOMICILIO PARTICULAR,1,3,6,-102.321935,21.929537,1,1,Aguascalientes
1,C1,LLAMAS ESPERON,ZUÑIGA GONZALEZ,"CALLE HUIZACHE, NÚMERO 108, FRACCIONAMIENTO EL...",DOMICILIO PARTICULAR,1,3,6,-102.321935,21.929537,1,1,Aguascalientes
2,B,ABREGO GUTIERREZ,LLAMAS VAZQUEZ,"AVENIDA GUADALUPE GONZÁLEZ, SIN NÚMERO, COLONI...",AULA MAGNA DEL DESARROLLO INTEGRAL DE LA FAMIL...,1,3,6,-102.311723,21.909189,2,"2, 4, 5, 6",Aguascalientes
3,C1,LOERA CHAVEZ,ZURITA ALVARADO,"AVENIDA GUADALUPE GONZÁLEZ, SIN NÚMERO, COLONI...",AULA MAGNA DEL DESARROLLO INTEGRAL DE LA FAMIL...,1,3,6,-102.311723,21.909189,2,"2, 4, 5, 6",Aguascalientes
4,B,ABREGO GUTIERREZ,LLAMAS VAZQUEZ,"AVENIDA GUADALUPE GONZÁLEZ, SIN NÚMERO, COLONI...",AULA MAGNA DEL DESARROLLO INTEGRAL DE LA FAMIL...,1,3,6,-102.311723,21.909189,4,"2, 4, 5, 6",Aguascalientes
...,...,...,...,...,...,...,...,...,...,...,...,...,...
156941,C1,LOPEZ DE LA ROSA,ZUÑIGA TORRES,"CALLE SAN JUAN NÚMERO 15, FRACCIONAMIENTO SAN ...",DOMICILIO PARTICULAR,32,4,4,-102.495328,22.754158,1902,"1900, 1902, 1905, 1908",Zacatecas
156942,B,ABRAHAM GARCIA,LOPEZ CORTES,"CALLE SAN JUAN NÚMERO 15, FRACCIONAMIENTO SAN ...",DOMICILIO PARTICULAR,32,4,4,-102.495328,22.754158,1905,"1900, 1902, 1905, 1908",Zacatecas
156943,C1,LOPEZ DE LA ROSA,ZUÑIGA TORRES,"CALLE SAN JUAN NÚMERO 15, FRACCIONAMIENTO SAN ...",DOMICILIO PARTICULAR,32,4,4,-102.495328,22.754158,1905,"1900, 1902, 1905, 1908",Zacatecas
156944,B,ABRAHAM GARCIA,LOPEZ CORTES,"CALLE SAN JUAN NÚMERO 15, FRACCIONAMIENTO SAN ...",DOMICILIO PARTICULAR,32,4,4,-102.495328,22.754158,1908,"1900, 1902, 1905, 1908",Zacatecas


In [92]:
casillas_df.to_csv("casillas_edos_final.csv", index=False, encoding='utf-8-sig')

#### Clean Casillas Especiales

In [90]:
casillas_especiales = pd.read_csv("casillas_especiales.csv", encoding='utf-8-sig')
casillas_especiales[['longitud', 'latitud']] = casillas_especiales.apply(clean_coordinates, axis=1, result_type='expand')
casillas_especiales.drop(columns=['index', 'id', 'croquis', 'geom', 'dce', 'id_domicilio', 'type', 'active'], inplace=True)
casillas_especiales

Unnamed: 0,domicilio,ubicacion,referencia,name,alias,entidad,longitud,latitud
0,"AVENIDA AGUASCALIENTES ORIENTE, SIN NÚMERO, CO...",ESTACIÓN DE BOMBEROS,ENTRE PUENTE DE ALVARADO Y AVENIDA TECNOLÓGICO,S1,Especial 1,1,-102.256193,21.875533
1,"AVENIDA DE LA CONVENCIÓN DE 1914 SUR, NÚMERO 4...",CENTRAL DE ÓMNIBUS EN AGUASCALIENTES,ENTRE CALLE QUINTA AVENIDA Y CALLE REPÚBLICA D...,S1,Especial 1,1,-102.298926,21.865877
2,"AVENIDA JUAREZ, NÚMERO 412, COLONIA CENTRO,203...",JARDIN DE NIÑOS MARÍA LUISA VILLA DE GARCÍA ROJAS,RETORNO CARRETERA AGSZAC Y JOSE MARIA MORELOS,S1,Especial 1,1,-102.272575,22.083959
3,"CARRETERA TRANSPENINSULAR, NÚMERO 6500, EX EJI...",CENTRO DE GOBIERNO,A UN COSTADO DE PALACIO MUNICIPAL,S1,Especial 1,2,-116.594666,31.808960
4,"CALZADA ADOLFO LÓPEZ MATEOS, SIN NÚMERO, CONJU...",TEATRO DEL ESTADO,ESQUINA CON CALLE MILTON CASTELLANOS,S1,Especial 1,2,-115.474754,32.654680
...,...,...,...,...,...,...,...,...
295,"CALLE 15, SIN NÚMERO, PISTÉ, CÓDIGO POSTAL 977...",COLEGIO DE BACHILLERES DEL ESTADO DE YUCATÁN P...,CERCA DEL HOTEL PIRÁMIDE INN RESORT,S1,Especial 1,31,-88.581873,20.693078
296,"CALLE DURANGO, NÚMERO 402, COLONIA CENTRO, CÓD...",INTERIOR DE LA CENTRAL DE AUTOBUSES,ENTRE CALLE ÉBANO Y PASEO DEL MINERAL,S1,Especial 1,32,-102.859379,23.173519
297,"CALZADA REVOLUCIÓN MEXICANA SIN NÚMERO, COLONI...",CENTRO DE CAPACITACIÓN PARA EL TRABAJO INDUSTR...,"ENTRONQUE A SAUCEDA DE LA BORDA COLONIA LA FE,...",S1,Especial 1,32,-102.509096,22.756358
298,"CALLE PUEBLA ESQUINA CALLE CENTRAL, SIN NÚMERO...",ESCUELA PRIMARIA FRANCISCO GOITIA,ENTRE CALLE DEL ROSARIO Y CALLE CENTRAL,S1,Especial 1,32,-102.985023,22.654237


In [91]:
final_names, final_aliases = get_names_aliases(casillas_especiales)
casillas_especiales['name'] = final_names
casillas_especiales['alias'] = final_aliases
casillas_especiales['nombreEntidad'] = casillas_especiales['entidad'].apply(lambda x: get_entidad_name(x, dict_entidad))
casillas_especiales

Unnamed: 0,domicilio,ubicacion,referencia,name,alias,entidad,longitud,latitud,nombreEntidad
0,"AVENIDA AGUASCALIENTES ORIENTE, SIN NÚMERO, CO...",ESTACIÓN DE BOMBEROS,ENTRE PUENTE DE ALVARADO Y AVENIDA TECNOLÓGICO,S1,Especial 1,1,-102.256193,21.875533,Aguascalientes
1,"AVENIDA DE LA CONVENCIÓN DE 1914 SUR, NÚMERO 4...",CENTRAL DE ÓMNIBUS EN AGUASCALIENTES,ENTRE CALLE QUINTA AVENIDA Y CALLE REPÚBLICA D...,S2,Especial 2,1,-102.298926,21.865877,Aguascalientes
2,"AVENIDA JUAREZ, NÚMERO 412, COLONIA CENTRO,203...",JARDIN DE NIÑOS MARÍA LUISA VILLA DE GARCÍA ROJAS,RETORNO CARRETERA AGSZAC Y JOSE MARIA MORELOS,S3,Especial 3,1,-102.272575,22.083959,Aguascalientes
3,"CARRETERA TRANSPENINSULAR, NÚMERO 6500, EX EJI...",CENTRO DE GOBIERNO,A UN COSTADO DE PALACIO MUNICIPAL,S1,Especial 1,2,-116.594666,31.808960,Baja California
4,"CALZADA ADOLFO LÓPEZ MATEOS, SIN NÚMERO, CONJU...",TEATRO DEL ESTADO,ESQUINA CON CALLE MILTON CASTELLANOS,S2,Especial 2,2,-115.474754,32.654680,Baja California
...,...,...,...,...,...,...,...,...,...
295,"CALLE 15, SIN NÚMERO, PISTÉ, CÓDIGO POSTAL 977...",COLEGIO DE BACHILLERES DEL ESTADO DE YUCATÁN P...,CERCA DEL HOTEL PIRÁMIDE INN RESORT,S5,Especial 5,31,-88.581873,20.693078,Yucatán
296,"CALLE DURANGO, NÚMERO 402, COLONIA CENTRO, CÓD...",INTERIOR DE LA CENTRAL DE AUTOBUSES,ENTRE CALLE ÉBANO Y PASEO DEL MINERAL,S1,Especial 1,32,-102.859379,23.173519,Zacatecas
297,"CALZADA REVOLUCIÓN MEXICANA SIN NÚMERO, COLONI...",CENTRO DE CAPACITACIÓN PARA EL TRABAJO INDUSTR...,"ENTRONQUE A SAUCEDA DE LA BORDA COLONIA LA FE,...",S2,Especial 2,32,-102.509096,22.756358,Zacatecas
298,"CALLE PUEBLA ESQUINA CALLE CENTRAL, SIN NÚMERO...",ESCUELA PRIMARIA FRANCISCO GOITIA,ENTRE CALLE DEL ROSARIO Y CALLE CENTRAL,S3,Especial 3,32,-102.985023,22.654237,Zacatecas


In [93]:
casillas_especiales.to_csv("casillas_especiales_final.csv", index=False, encoding='utf-8-sig')