# Format data - Casillas

In [1]:
import numpy as np
import pandas as pd

## Parámetros

In [None]:
dict_entidad = {
    "Aguascalientes": "01",
    "Baja California": "02",
    "Baja California Sur": "03",
    "Campeche": "04",
    "Coahuila de Zaragoza": "05",
    "Colima": "06",
    "Chiapas": "07",
    "Chihuahua": "08",
    "Ciudad de México": "09",
    "Durango": "10",
    "Guanajuato": "11",
    "Guerrero": "12",
    "Hidalgo": "13",
    "Jalisco": "14",
    "México": "15",
    "Michoacán de Ocampo": "16",
    "Morelos": "17",
    "Nayarit": "18",
    "Nuevo León": "19",
    "Oaxaca": "20",
    "Puebla": "21",
    "Queretaro": "22",
    "Quintana Roo": "23",
    "San Luis Potosí": "24",
    "Sinaloa": "25",
    "Sonora": "26",
    "Tabasco": "27",
    "Tamaulipas": "28",
    "Tlaxcala": "29",
    "Veracruz de Ignacio de la Llave": "30",
    "Yucatán": "31",
    "Zacatecas": "32",
}


In [None]:
dict_entidad = {1: "Aguascalientes", 
                2: "Baja California",
                3: "Baja California Sur",
                4: "Campeche",
                5: "Coahuila de Zaragoza",
                6: "Colima",
                7: "Chiapas",
                8: "Chihuahua",
                9: "Ciudad de México",
                10: "Durango",
                11: "Guanajuato",
                12: "Guerrero",
                13: "Hidalgo",
                14: "Jalisco",
                15: "Estado de México",
                16: "Michoacán de Ocampo",
                17: "Morelos",
                18: "Nayarit",
                19: "Nuevo León",
                20: "Oaxaca",
                21: "Puebla",
                22: "Querétaro",
                23: "Quintana Roo",
                24: "San Luis Potosí",
                25: "Sinaloa",
                26: "Sonora",
                27: "Tabasco",
                28: "Tamaulipas",
                29: "Tlaxcala",
                30: "Veracruz de Ignacio de la Llave",
                31: "Yucatán",
                32: "Zacatecas",}

#### Funciones

In [34]:
def gets_secciones_atendidas(casillas_df):
    """
    Gets a list of the sections that are being attended

    Parameters
    ----------
    casillas_df : dataframe
        Dataframe with the casillas data

    Returns
    -------
    list
        List of sections that are being attended per casilla
    """
    unique_domicilios = list(casillas_df['domicilio'].unique())
    vector_secciones = []

    for unique_domicilio in unique_domicilios:
        df_casilla = casillas_df[casillas_df['domicilio'] == unique_domicilio].copy()
        secciones_atendidas = list(df_casilla['seccion'].unique())
        str_secciones_atendidas = str(secciones_atendidas).replace('[', '').replace(']', '')
        # Agregar n veces el vector de secciones
        for n in list(df_casilla['seccion']):
            vector_secciones.append(str_secciones_atendidas)

    return vector_secciones

In [None]:
def get_entidad_name(entidad, dict_entidad):
    """
    Gets the name of the entidad

    Parameters
    ----------
    entidad : str
        Entidad code
    dict_entidad : dict
        Dictionary with the entidad code and name

    Returns
    -------
    str
        Name of the entidad
    """
    int_entidad = int(entidad)
    entidad_name = dict_entidad[int_entidad]
    
    return entidad_name

### Pipeline

In [42]:
casillas_df_1 = pd.read_csv("casillas_edos-1-31.csv", encoding='utf-8-sig')
casillas_df_2 = pd.read_csv("casillas_edos-32.csv", encoding='utf-8-sig')
casillas_df = pd.concat([casillas_df_1, casillas_df_2], ignore_index=True)
casillas_df

Unnamed: 0,casilla,inicial,final,domicilio,ubicacion,entidad,distitoSede,distritoLocal,latitud,longitud,seccion
0,B,ABOYTES DOÑAS,LLAMAS DELGADO,"CALLE HUIZACHE, NÚMERO 108, FRACCIONAMIENTO EL...",DOMICILIO PARTICULAR,1,3,6,-102.321935,21.929537,1
1,C1,LLAMAS ESPERON,ZUÑIGA GONZALEZ,"CALLE HUIZACHE, NÚMERO 108, FRACCIONAMIENTO EL...",DOMICILIO PARTICULAR,1,3,6,-102.321935,21.929537,1
2,B,ABREGO GUTIERREZ,LLAMAS VAZQUEZ,"AVENIDA GUADALUPE GONZÁLEZ, SIN NÚMERO, COLONI...",AULA MAGNA DEL DESARROLLO INTEGRAL DE LA FAMIL...,1,3,6,-102.311723,21.909189,2
3,C1,LOERA CHAVEZ,ZURITA ALVARADO,"AVENIDA GUADALUPE GONZÁLEZ, SIN NÚMERO, COLONI...",AULA MAGNA DEL DESARROLLO INTEGRAL DE LA FAMIL...,1,3,6,-102.311723,21.909189,2
4,B,ABREGO GUTIERREZ,LLAMAS VAZQUEZ,"AVENIDA GUADALUPE GONZÁLEZ, SIN NÚMERO, COLONI...",AULA MAGNA DEL DESARROLLO INTEGRAL DE LA FAMIL...,1,3,6,-102.311723,21.909189,4
...,...,...,...,...,...,...,...,...,...,...,...
156941,C1,LOPEZ DE LA ROSA,ZUÑIGA TORRES,"CALLE SAN JUAN NÚMERO 15, FRACCIONAMIENTO SAN ...",DOMICILIO PARTICULAR,32,4,4,-102.495328,22.754158,1902
156942,B,ABRAHAM GARCIA,LOPEZ CORTES,"CALLE SAN JUAN NÚMERO 15, FRACCIONAMIENTO SAN ...",DOMICILIO PARTICULAR,32,4,4,-102.495328,22.754158,1905
156943,C1,LOPEZ DE LA ROSA,ZUÑIGA TORRES,"CALLE SAN JUAN NÚMERO 15, FRACCIONAMIENTO SAN ...",DOMICILIO PARTICULAR,32,4,4,-102.495328,22.754158,1905
156944,B,ABRAHAM GARCIA,LOPEZ CORTES,"CALLE SAN JUAN NÚMERO 15, FRACCIONAMIENTO SAN ...",DOMICILIO PARTICULAR,32,4,4,-102.495328,22.754158,1908


In [43]:
vector_secciones = gets_secciones_atendidas(casillas_df)
casillas_df['seccionesAtendidas'] = vector_secciones

In [44]:
casillas_df

Unnamed: 0,casilla,inicial,final,domicilio,ubicacion,entidad,distitoSede,distritoLocal,latitud,longitud,seccion,seccionesAtendidas
0,B,ABOYTES DOÑAS,LLAMAS DELGADO,"CALLE HUIZACHE, NÚMERO 108, FRACCIONAMIENTO EL...",DOMICILIO PARTICULAR,1,3,6,-102.321935,21.929537,1,1
1,C1,LLAMAS ESPERON,ZUÑIGA GONZALEZ,"CALLE HUIZACHE, NÚMERO 108, FRACCIONAMIENTO EL...",DOMICILIO PARTICULAR,1,3,6,-102.321935,21.929537,1,1
2,B,ABREGO GUTIERREZ,LLAMAS VAZQUEZ,"AVENIDA GUADALUPE GONZÁLEZ, SIN NÚMERO, COLONI...",AULA MAGNA DEL DESARROLLO INTEGRAL DE LA FAMIL...,1,3,6,-102.311723,21.909189,2,"2, 4, 5, 6"
3,C1,LOERA CHAVEZ,ZURITA ALVARADO,"AVENIDA GUADALUPE GONZÁLEZ, SIN NÚMERO, COLONI...",AULA MAGNA DEL DESARROLLO INTEGRAL DE LA FAMIL...,1,3,6,-102.311723,21.909189,2,"2, 4, 5, 6"
4,B,ABREGO GUTIERREZ,LLAMAS VAZQUEZ,"AVENIDA GUADALUPE GONZÁLEZ, SIN NÚMERO, COLONI...",AULA MAGNA DEL DESARROLLO INTEGRAL DE LA FAMIL...,1,3,6,-102.311723,21.909189,4,"2, 4, 5, 6"
...,...,...,...,...,...,...,...,...,...,...,...,...
156941,C1,LOPEZ DE LA ROSA,ZUÑIGA TORRES,"CALLE SAN JUAN NÚMERO 15, FRACCIONAMIENTO SAN ...",DOMICILIO PARTICULAR,32,4,4,-102.495328,22.754158,1902,"1900, 1902, 1905, 1908"
156942,B,ABRAHAM GARCIA,LOPEZ CORTES,"CALLE SAN JUAN NÚMERO 15, FRACCIONAMIENTO SAN ...",DOMICILIO PARTICULAR,32,4,4,-102.495328,22.754158,1905,"1900, 1902, 1905, 1908"
156943,C1,LOPEZ DE LA ROSA,ZUÑIGA TORRES,"CALLE SAN JUAN NÚMERO 15, FRACCIONAMIENTO SAN ...",DOMICILIO PARTICULAR,32,4,4,-102.495328,22.754158,1905,"1900, 1902, 1905, 1908"
156944,B,ABRAHAM GARCIA,LOPEZ CORTES,"CALLE SAN JUAN NÚMERO 15, FRACCIONAMIENTO SAN ...",DOMICILIO PARTICULAR,32,4,4,-102.495328,22.754158,1908,"1900, 1902, 1905, 1908"
