# Format data - Casillas

In [1]:
import numpy as np
import pandas as pd

## Parámetros

In [48]:
dict_entidad = {1: "Aguascalientes", 
                2: "Baja California",
                3: "Baja California Sur",
                4: "Campeche",
                5: "Coahuila de Zaragoza",
                6: "Colima",
                7: "Chiapas",
                8: "Chihuahua",
                9: "Ciudad de México",
                10: "Durango",
                11: "Guanajuato",
                12: "Guerrero",
                13: "Hidalgo",
                14: "Jalisco",
                15: "Estado de México",
                16: "Michoacán de Ocampo",
                17: "Morelos",
                18: "Nayarit",
                19: "Nuevo León",
                20: "Oaxaca",
                21: "Puebla",
                22: "Querétaro",
                23: "Quintana Roo",
                24: "San Luis Potosí",
                25: "Sinaloa",
                26: "Sonora",
                27: "Tabasco",
                28: "Tamaulipas",
                29: "Tlaxcala",
                30: "Veracruz de Ignacio de la Llave",
                31: "Yucatán",
                32: "Zacatecas",}

#### Funciones

In [34]:
def gets_secciones_atendidas(casillas_df):
    """
    Gets a list of the sections that are being attended

    Parameters
    ----------
    casillas_df : dataframe
        Dataframe with the casillas data

    Returns
    -------
    list
        List of sections that are being attended per casilla
    """
    unique_domicilios = list(casillas_df['domicilio'].unique())
    vector_secciones = []

    for unique_domicilio in unique_domicilios:
        df_casilla = casillas_df[casillas_df['domicilio'] == unique_domicilio].copy()
        secciones_atendidas = list(df_casilla['seccion'].unique())
        str_secciones_atendidas = str(secciones_atendidas).replace('[', '').replace(']', '')
        # Agregar n veces el vector de secciones
        for n in list(df_casilla['seccion']):
            vector_secciones.append(str_secciones_atendidas)

    return vector_secciones

In [46]:
def get_entidad_name(entidad, dict_entidad):
    """
    Gets the name of the entidad

    Parameters
    ----------
    entidad : str
        Entidad code
    dict_entidad : dict
        Dictionary with the entidad code and name

    Returns
    -------
    str
        Name of the entidad
    """
    int_entidad = int(entidad)
    entidad_name = dict_entidad[int_entidad]
    
    return entidad_name

In [58]:
def clean_coordinates(df):
    """
    Cleans the coordinates

    Parameters
    ----------
    raw_coords : str
        Raw coordinates
    
    Returns
    -------
    list
    """
    unwanted_chars = ['[', ']']
    raw_coords = df['geom']

    for unwanted_char in unwanted_chars:
        raw_coords = raw_coords.replace(unwanted_char, '')
    
    clean_coords = raw_coords.split(',')
    clean_coords = [float(coord) for coord in clean_coords]
    
    return clean_coords 

### Pipeline

In [42]:
casillas_df_1 = pd.read_csv("casillas_edos-1-31.csv", encoding='utf-8-sig')
casillas_df_2 = pd.read_csv("casillas_edos-32.csv", encoding='utf-8-sig')
casillas_df = pd.concat([casillas_df_1, casillas_df_2], ignore_index=True)
casillas_df

Unnamed: 0,casilla,inicial,final,domicilio,ubicacion,entidad,distitoSede,distritoLocal,latitud,longitud,seccion
0,B,ABOYTES DOÑAS,LLAMAS DELGADO,"CALLE HUIZACHE, NÚMERO 108, FRACCIONAMIENTO EL...",DOMICILIO PARTICULAR,1,3,6,-102.321935,21.929537,1
1,C1,LLAMAS ESPERON,ZUÑIGA GONZALEZ,"CALLE HUIZACHE, NÚMERO 108, FRACCIONAMIENTO EL...",DOMICILIO PARTICULAR,1,3,6,-102.321935,21.929537,1
2,B,ABREGO GUTIERREZ,LLAMAS VAZQUEZ,"AVENIDA GUADALUPE GONZÁLEZ, SIN NÚMERO, COLONI...",AULA MAGNA DEL DESARROLLO INTEGRAL DE LA FAMIL...,1,3,6,-102.311723,21.909189,2
3,C1,LOERA CHAVEZ,ZURITA ALVARADO,"AVENIDA GUADALUPE GONZÁLEZ, SIN NÚMERO, COLONI...",AULA MAGNA DEL DESARROLLO INTEGRAL DE LA FAMIL...,1,3,6,-102.311723,21.909189,2
4,B,ABREGO GUTIERREZ,LLAMAS VAZQUEZ,"AVENIDA GUADALUPE GONZÁLEZ, SIN NÚMERO, COLONI...",AULA MAGNA DEL DESARROLLO INTEGRAL DE LA FAMIL...,1,3,6,-102.311723,21.909189,4
...,...,...,...,...,...,...,...,...,...,...,...
156941,C1,LOPEZ DE LA ROSA,ZUÑIGA TORRES,"CALLE SAN JUAN NÚMERO 15, FRACCIONAMIENTO SAN ...",DOMICILIO PARTICULAR,32,4,4,-102.495328,22.754158,1902
156942,B,ABRAHAM GARCIA,LOPEZ CORTES,"CALLE SAN JUAN NÚMERO 15, FRACCIONAMIENTO SAN ...",DOMICILIO PARTICULAR,32,4,4,-102.495328,22.754158,1905
156943,C1,LOPEZ DE LA ROSA,ZUÑIGA TORRES,"CALLE SAN JUAN NÚMERO 15, FRACCIONAMIENTO SAN ...",DOMICILIO PARTICULAR,32,4,4,-102.495328,22.754158,1905
156944,B,ABRAHAM GARCIA,LOPEZ CORTES,"CALLE SAN JUAN NÚMERO 15, FRACCIONAMIENTO SAN ...",DOMICILIO PARTICULAR,32,4,4,-102.495328,22.754158,1908


In [43]:
vector_secciones = gets_secciones_atendidas(casillas_df)
casillas_df['seccionesAtendidas'] = vector_secciones

In [51]:
casillas_df['nombreEntidad'] = casillas_df['entidad'].apply(lambda x: get_entidad_name(x, dict_entidad))
casillas_df.rename(columns={'latitud': 'longitud', 'longitud': 'latitud'}, inplace=True)
casillas_df

Unnamed: 0,casilla,inicial,final,domicilio,ubicacion,entidad,distitoSede,distritoLocal,longitud,latitud,seccion,seccionesAtendidas,nombreEntidad
0,B,ABOYTES DOÑAS,LLAMAS DELGADO,"CALLE HUIZACHE, NÚMERO 108, FRACCIONAMIENTO EL...",DOMICILIO PARTICULAR,1,3,6,-102.321935,21.929537,1,1,Aguascalientes
1,C1,LLAMAS ESPERON,ZUÑIGA GONZALEZ,"CALLE HUIZACHE, NÚMERO 108, FRACCIONAMIENTO EL...",DOMICILIO PARTICULAR,1,3,6,-102.321935,21.929537,1,1,Aguascalientes
2,B,ABREGO GUTIERREZ,LLAMAS VAZQUEZ,"AVENIDA GUADALUPE GONZÁLEZ, SIN NÚMERO, COLONI...",AULA MAGNA DEL DESARROLLO INTEGRAL DE LA FAMIL...,1,3,6,-102.311723,21.909189,2,"2, 4, 5, 6",Aguascalientes
3,C1,LOERA CHAVEZ,ZURITA ALVARADO,"AVENIDA GUADALUPE GONZÁLEZ, SIN NÚMERO, COLONI...",AULA MAGNA DEL DESARROLLO INTEGRAL DE LA FAMIL...,1,3,6,-102.311723,21.909189,2,"2, 4, 5, 6",Aguascalientes
4,B,ABREGO GUTIERREZ,LLAMAS VAZQUEZ,"AVENIDA GUADALUPE GONZÁLEZ, SIN NÚMERO, COLONI...",AULA MAGNA DEL DESARROLLO INTEGRAL DE LA FAMIL...,1,3,6,-102.311723,21.909189,4,"2, 4, 5, 6",Aguascalientes
...,...,...,...,...,...,...,...,...,...,...,...,...,...
156941,C1,LOPEZ DE LA ROSA,ZUÑIGA TORRES,"CALLE SAN JUAN NÚMERO 15, FRACCIONAMIENTO SAN ...",DOMICILIO PARTICULAR,32,4,4,-102.495328,22.754158,1902,"1900, 1902, 1905, 1908",Zacatecas
156942,B,ABRAHAM GARCIA,LOPEZ CORTES,"CALLE SAN JUAN NÚMERO 15, FRACCIONAMIENTO SAN ...",DOMICILIO PARTICULAR,32,4,4,-102.495328,22.754158,1905,"1900, 1902, 1905, 1908",Zacatecas
156943,C1,LOPEZ DE LA ROSA,ZUÑIGA TORRES,"CALLE SAN JUAN NÚMERO 15, FRACCIONAMIENTO SAN ...",DOMICILIO PARTICULAR,32,4,4,-102.495328,22.754158,1905,"1900, 1902, 1905, 1908",Zacatecas
156944,B,ABRAHAM GARCIA,LOPEZ CORTES,"CALLE SAN JUAN NÚMERO 15, FRACCIONAMIENTO SAN ...",DOMICILIO PARTICULAR,32,4,4,-102.495328,22.754158,1908,"1900, 1902, 1905, 1908",Zacatecas


#### Clean Casillas Especiales

In [53]:
casillas_especiales = pd.read_csv("casillas_especiales.csv", encoding='utf-8-sig')

In [59]:
casillas_especiales

Unnamed: 0,index,id,active,type,domicilio,ubicacion,referencia,id_domicilio,croquis,geom,dce,name,alias,entidad
0,coordinates,30101260100,True,3,"AVENIDA AGUASCALIENTES ORIENTE, SIN NÚMERO, CO...",ESTACIÓN DE BOMBEROS,ENTRE PUENTE DE ALVARADO Y AVENIDA TECNOLÓGICO,79234.0,True,"[-102.256193237, 21.875532845]","[-102.256193319, 21.875532845]",S1,Especial 1,1
1,coordinates,30102180100,True,3,"AVENIDA DE LA CONVENCIÓN DE 1914 SUR, NÚMERO 4...",CENTRAL DE ÓMNIBUS EN AGUASCALIENTES,ENTRE CALLE QUINTA AVENIDA Y CALLE REPÚBLICA D...,77108.0,True,"[-102.298926129, 21.865877385]","[-102.298952933, 21.865887342]",S1,Especial 1,1
2,coordinates,30104700100,True,3,"AVENIDA JUAREZ, NÚMERO 412, COLONIA CENTRO,203...",JARDIN DE NIÑOS MARÍA LUISA VILLA DE GARCÍA ROJAS,RETORNO CARRETERA AGSZAC Y JOSE MARIA MORELOS,79045.0,True,"[-102.272574758, 22.083958521]","[-102.272511724, 22.083954793]",S1,Especial 1,1
3,coordinates,30202090100,True,3,"CARRETERA TRANSPENINSULAR, NÚMERO 6500, EX EJI...",CENTRO DE GOBIERNO,A UN COSTADO DE PALACIO MUNICIPAL,73492.0,True,"[-116.59466588, 31.808960466]","[-116.594665888, 31.808978701]",S1,Especial 1,2
4,coordinates,30202460100,True,3,"CALZADA ADOLFO LÓPEZ MATEOS, SIN NÚMERO, CONJU...",TEATRO DEL ESTADO,ESQUINA CON CALLE MILTON CASTELLANOS,974.0,True,"[-115.474754, 32.65468]","[-115.476432432, 32.65508607]",S1,Especial 1,2
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
295,coordinates,33109040100,True,3,"CALLE 15, SIN NÚMERO, PISTÉ, CÓDIGO POSTAL 977...",COLEGIO DE BACHILLERES DEL ESTADO DE YUCATÁN P...,CERCA DEL HOTEL PIRÁMIDE INN RESORT,82405.0,True,"[-88.581873241, 20.693077743]","[-88.581873173, 20.693075288]",S1,Especial 1,31
296,coordinates,33201890100,True,3,"CALLE DURANGO, NÚMERO 402, COLONIA CENTRO, CÓD...",INTERIOR DE LA CENTRAL DE AUTOBUSES,ENTRE CALLE ÉBANO Y PASEO DEL MINERAL,70278.0,True,"[-102.859379, 23.173519]","[-102.859376372, 23.17351679]",S1,Especial 1,32
297,coordinates,33204700100,True,3,"CALZADA REVOLUCIÓN MEXICANA SIN NÚMERO, COLONI...",CENTRO DE CAPACITACIÓN PARA EL TRABAJO INDUSTR...,"ENTRONQUE A SAUCEDA DE LA BORDA COLONIA LA FE,...",72942.0,True,"[-102.509095832, 22.756358478]","[-102.509090425, 22.756360951]",S1,Especial 1,32
298,coordinates,33206140100,True,3,"CALLE PUEBLA ESQUINA CALLE CENTRAL, SIN NÚMERO...",ESCUELA PRIMARIA FRANCISCO GOITIA,ENTRE CALLE DEL ROSARIO Y CALLE CENTRAL,,False,"[-102.985023134, 22.65423736]","[-102.985109346, 22.654728965]",S1,Especial 1,32


In [60]:
casillas_especiales[['longitud', 'latitud']] = casillas_especiales['geom'].apply(lambda x: clean_coordinates(x))
casillas_especiales

ValueError: Must have equal len keys and value when setting with an iterable