# Librerías

In [1]:
import arcpy
import json
import random
import numpy as np, numpy.random
from numpy.random import multinomial
import pandas as pd
from random import uniform

from arcgis.features import GeoAccessor, GeoSeriesAccessor

# Funciones

In [2]:
def leer_config(config_path):
    """Lee el archivo config y lo almacena cómo diccionario.

    Args:
        config_path (str): Ruta archivo config.json

    Returns:
        configa_data (dict): Diccionario que contiene los parámetros de entrada.

    """

    with open(config_path) as json_file:
        config_data = json.load(json_file)

    return config_data


def crear_dict_gse():
    """
    Genera diccionario de los distintos GSE's para las zonas:
    
    Returns:
        dict_gse (dict): Diccionario de los GSE a incluir dentro del Feature Class.
        
    """
    
    # Se inicializa el diccionario
    dict_gse = {"p_bajo": 0,
                "p_medio": 0,
                "p_alto": 0}
    
    return dict_gse

def crear_np_gse(n_rows):
    """
    Genera un numpy array de 3 dimensiones, donde la suma total de cada fila es igual a 100.
    Cada columna representa un GSE.
    
    Args:
        n_rows (int): N° de filas del Feature Class al que se le añadirán las columnas
        
    Returns:
        np_gse (np.array): Numpy array de 3 dimensiones que representa la distribución de GSE's de cada zona.
    """
    
    np_gse = np.vstack([(np.random.dirichlet(np.ones(3),size=1)*100)[0] for i in range(n_rows)])
    
    return np_gse


def crear_lista_random(suma_total, n_rows):
    """
    Crea una lista de tamaño n_rows donde la suma corresponde a suma_total. 
    Los valores se distribuyen según una distribución binomial.
    
    Args:
        suma_total (int): Suma total de la lista generada.
        n_rows (int): Número de elementos de lista a generar.
        
    Returns:
        lista_random (list): Lista de tamaño n_rows y suma equivalente a suma_total
    """
    
    lista_random = multinomial(suma_total, [1/n_rows] * n_rows)
    
    return lista_random


def crear_dict_superficies(dict_uso_suelo, n_rows):
    """Genera diccionario que contiene la cantidad de superficie repartida a cada zona.

    Args:
        dict_uso_suelo (dict): Diccionario que contiene la cantidad de superficie a repartir para cada uso.
        n_rows (int): Número de filas de la capa de zonas.

    Returns:
        dict_superficies (dict): Diccionario que contiene la lista de superficie asiganda a cada zona para cada uso.


    """
    dict_superficies = {
        "residencial": crear_lista_random(dict_uso_suelo["residencial"], n_rows),
        "comercio": crear_lista_random(dict_uso_suelo["comercio"], n_rows),
        "educacion": crear_lista_random(dict_uso_suelo["educacion"], n_rows),
        "salud": crear_lista_random(dict_uso_suelo["salud"], n_rows),
        "oficinas": crear_lista_random(dict_uso_suelo["oficinas"], n_rows),
        "parque": crear_lista_random(dict_uso_suelo["parque"], n_rows)
    }

    return dict_superficies

def crear_gse_proposito(n_rows):
    """
    Genera un numpy array de 5 dimensiones, donde la suma total de cada fila es igual a 1.
    Cada columna representa un el porcentaje en que se dsitribuye un gse por proposito p.
    
    Se utiliza para la generación de viajes
    
    Args:
        n_rows (int): N° de filas del Feature Class al que se le añadirán las columnas
        
    Returns:
        lista_gse_proposito (np.array): Numpy array de 3x5 dimensiones que representa la distribución de propositos por GSE en cada zona.
        lista_gse (list): Lista de gse.
    """
    
    lista_gse = ["bajo","medio","alto"]
    lista_gse_proposito = []

    for i in lista_gse:
        np_gse_proposito = np.vstack([(np.random.dirichlet(np.ones(5),size=1))[0] for i in range(n_rows)])
        lista_gse_proposito.append(np_gse_proposito)

    return lista_gse_proposito

def crear_lista_atraccion(dict_betas_proposito, dict_superficies, proposito):
    """
    Crea una lista de atracción para una determinado proposito.

    Args:
        dict_betas_proposito (dict): Diccionario que contiene los betas para cada proposito.
        dict_superficies (dict): Diccionario que contiene la cantidad de superficie para cada zona para cada superficie.
        proposito (str): Propósito para el cual quiere generarse la lista de atracción.

    Returns:
        lista_atraccion (list): Lista que contiene el nivel de atraccion para cada zona para el proposito dado.
    """

    lista_atraccion = dict_betas_proposito[proposito][0] + dict_betas_proposito[proposito][1] * dict_superficies['comercio'] + dict_betas_proposito[proposito][2] * dict_superficies['educacion'] + dict_betas_proposito[proposito][3] * dict_superficies['salud'] + dict_betas_proposito[proposito][4] * dict_superficies['oficinas'] + dict_betas_proposito[proposito][5] * dict_superficies['parque']

    return lista_atraccion


def crear_df_zonas(dict_superficies, gse_bajo, gse_medio, gse_alto):
    """
    Genera data frame de estado inicial de zonas: usos y poblacion.
    
    Returns:
        df_viajes (df): Data frame de que contiene informacion de zonas, usos y poblacion por gse
    """
    # Se inicializa el df
    df_zonas = pd.DataFrame({"residencia": dict_superficies["residencial"], # usos de suelo
                "comercio": dict_superficies["comercio"],
                "educacion": dict_superficies["educacion"],
                "salud": dict_superficies["salud"],
                "oficinas": dict_superficies["oficinas"],
                "parque": dict_superficies["parque"],
                "p_bajo": gse_bajo, # poblacion
                "p_medio": gse_medio,
                "p_alto": gse_alto})
    
    # modificar index para comenzar desde 1
    df_zonas.index += 1
    df_zonas['id'] = df_zonas.index
    
    return df_zonas


def crear_df_viajes():
    """
    Genera data frame de los viajes generados.
    
    Returns:
        df_viajes (df): Data frame de los viajes por GSE y proposito p a incluir dentro del Feature Class.
        
    """
    
    # Se inicializa el df
    df_viajes = pd.DataFrame({"v_b_c": v_b_comercio, # viajes gse bajo
                "v_b_e": v_b_educacion,
                "v_b_s": v_b_salud,
                "v_b_o": v_b_oficinas,
                "v_b_p": v_b_parque,
                "v_m_c": v_m_comercio, # viajes gse medio
                "v_m_e": v_m_educacion,
                "v_m_s": v_m_salud,
                "v_m_o": v_m_oficinas,
                "v_m_p": v_m_parque,
                "v_a_c": v_a_comercio, # viajes gse alto
                "v_a_e": v_a_educacion,
                "v_a_s": v_a_salud,
                "v_a_o": v_a_oficinas,
                "v_a_p": v_a_parque})
    
    # modificar index para comenzar desde 1
    df_viajes.index += 1 
    df_viajes['id'] = df_viajes.index
    
    return df_viajes

def crear_df_atracciones():
    """
    Genera un dta frame de las atracciones generadas.
    
    Returns:
        df_atracciones (df): Data frame de las atraciones por GSE y propósito p a incluir dentro del Feature Class.
        
    """
    
    # Se inicializa el df
    
    df_atracciones = pd.DataFrame({"a_c": a_comercio, # atraccion comercio
                "a_e": a_educacion, # atraccion educacion
                "a_s": a_salud, # atraccion salud
                "a_o": a_oficinas, # atraccion oficinas
                "a_p": a_parque})
    
    '''respaldo
    df_atracciones = pd.DataFrame({"a_b_c": a_b_comercio, # atracción gse bajo
                "a_b_e": a_b_educacion,
                "a_b_s": a_b_salud,
                "a_b_o": a_b_oficinas,
                "a_b_p": a_b_parque,
                "a_m_c": a_m_comercio, # atracción gse medio
                "a_m_e": a_m_educacion,
                "a_m_s": a_m_salud,
                "a_m_o": a_m_oficinas,
                "a_m_p": a_m_parque,
                "a_a_c": a_a_comercio, # atracción gse alto
                "a_a_e": a_a_educacion,
                "a_a_s": a_a_salud,
                "a_a_o": a_a_oficinas,
                "a_a_p": a_a_parque})
    '''
    
    # modificar index para comenzar desde 1
    df_atracciones.index += 1
    df_atracciones['id'] = df_atracciones.index
    
    return df_atracciones

def merge_od_matrix(od_matrix):
    """
    Genera un merge entre matrix origen destino y los data frames de usos de suelo, poblacion viajes y atracciones.
    
    Returns:
        od_matrix (df): Data frame de matriz origen destino con informacion de usos, poblacion por gse, viajes y atracciones.
    """
    # realizar merge entre od_matrix y zonas
    od_matrix = od_matrix.merge(df_zonas, left_on='OriginID', right_on='id')
    # botar id para no generar redundancia
    od_matrix = od_matrix.drop(['id'], axis=1)
    # realizar merge entre od_matrix y viajes
    od_matrix = od_matrix.merge(df_viajes, left_on='OriginID', right_on='id')
    # botar id para no generar redundancia
    od_matrix = od_matrix.drop(['id'], axis=1)
    # realizar merge entre od_matrix y atracciones
    od_matrix = od_matrix.merge(df_atracciones, left_on='OriginID', right_on='id')
    # botar id para no generar redundancia
    od_matrix = od_matrix.drop(['id'], axis=1)

    return od_matrix

def crear_factor(od_matrix):
    """
    Genera campos para factores de balance A por zona, gse y proposito.
    
    Inputs:
        od_matrix (df): Data frame de matriz origen destino con informacion de usos, poblacion por gse, viaje
    
    Returns:
        list_factor_balance_a (list): lista de campos con nombres de factores A por gse y proposito
        od_matrix (df): Data frame de matriz origen destino con informacion de usos, poblacion por gse, viajes y atracciones.
    """
    # crear factores de balance A por gse y proposito p
    list_factor_balance_a =["f_a_b_c", # factores para gse bajo y comercio
                      "f_a_b_e", # factor para gse bajo y educacion
                      "f_a_b_s", # factor para gse bajo y salud
                      "f_a_b_o", # factor para gse bajo y oficinas
                      "f_a_b_p", # factor para gse bajo y parque
                      "f_a_m_c", # factor para gse medio y comercio
                      "f_a_m_e", # factor para gse medio y educacion
                      "f_a_m_s", # factor para gse medio y salud
                      "f_a_m_o", # factor para gse medio y oficinas
                      "f_a_m_p", # factor para gse medio y parque
                      "f_a_a_c", # factor para gse alto y comercio
                      "f_a_a_e", # factor para gse alto y educacion
                      "f_a_a_s", # factor para gse alto y salud
                      "f_a_a_o", # factor para gse alto y oficinas
                      "f_a_a_p"] 

    for factor_name in list_factor_balance_a:
        od_matrix[factor_name] = round(random.uniform(0, .01), 7)
        
    """
    Genera campos para factores de balance B por zona, gse y proposito.
    
    Inputs:
        od_matrix (df): Data frame de matriz origen destino con informacion de usos, poblacion por gse, viaje
    
    Returns:
        list_factor_balance_b (list): lista de campos con nombres de factores B por gse y proposito
        od_matrix (df): Data frame de matriz origen destino con informacion de usos, poblacion por gse, viajes y atracciones.
    """

    # crear factores de balance B por gse y proposito p
    list_factor_balance_b =["f_b_b_c", # factores para gse bajo y comercio
                      "f_b_b_e", # factor para gse bajo y educacion
                      "f_b_b_s", # factor para gse bajo y salud
                      "f_b_b_o", # factor para gse bajo y oficinas
                      "f_b_b_p", # factor para gse bajo y parque
                      "f_b_m_c", # factor para gse medio y comercio
                      "f_b_m_e", # factor para gse medio y educacion
                      "f_b_m_s", # factor para gse medio y salud
                      "f_b_m_o", # factor para gse medio y oficinas
                      "f_b_m_p", # factor para gse medio y parque
                      "f_b_a_c", # factor para gse alto y comercio
                      "f_b_a_e", # factor para gse alto y educacion
                      "f_b_a_s", # factor para gse alto y salud
                      "f_b_a_o", # factor para gse alto y oficinas
                      "f_b_a_p"] 

    for factor_name in list_factor_balance_b:
        od_matrix[factor_name] = round(random.uniform(0.9,1.0), 7)
        
    return list_factor_balance_a, list_factor_balance_b, od_matrix

def calcular_friccion(od_matrix, dict_friccion):
    """
    Calcular la friccion para todos los gse por proposito de viaje.
    
    Inputs:
        od_matrix (df): Data frame de matriz origen destino con informacion de usos, poblacion por gse, viaje.
    
    Returns:
        od_matrix (df): Data frame de matriz origen destino con informacion de usos, poblacion por gse, viaje con valores de friccion calculado.
    """

    # calcular fricciones
    list_fricciones =["fr_b_c", # friccion para gse bajo y comercio
                      "fr_b_e", # friccion para gse bajo y educacion
                      "fr_b_s", # friccion para gse bajo y salud
                      "fr_b_o", # friccion para gse bajo y oficinas
                      "fr_b_p", # friccion para gse bajo y parque
                      "fr_m_c", # friccion para gse medio y comercio
                      "fr_m_e", # friccion para gse medio y educacion
                      "fr_m_s", # friccion para gse medio y salud
                      "fr_m_o", # friccion para gse medio y oficinas
                      "fr_m_p", # friccion para gse medio y parque
                      "fr_a_c", # friccion para gse alto y comercio
                      "fr_a_e", # friccion para gse alto y educacion
                      "fr_a_s", # friccion para gse alto y salud
                      "fr_a_o", # friccion para gse alto y oficinas
                      "fr_a_p"] 

    for index, friccion_name in enumerate(list_fricciones):
        beta = list(dict_friccion.values())[index][0]
        utilidad_compuesta = list(dict_friccion.values())[index][1]
        od_matrix[friccion_name] = np.exp(od_matrix['Total_Length']/1000)*beta*utilidad_compuesta
        
    return list_fricciones, od_matrix


def crear_distribucion(od_matrix, list_fricciones, list_factor_balance_b, list_factor_balance_a, df_viajes, df_atracciones):
    """
    Calcular distribucion de viajes para todos los gse por proposito de viaje.
    
    Inputs:
        od_matrix (df): Data frame de matriz origen destino con informacion de usos, poblacion por gse, viaje.
        list_fricciones (list): Lista de fricciones cacluladas.
        list_factor_bance_b (list): Lista de factores de balance b por gse y proposito de viaje.
        list_factor_bance_a (list): Lista de factores de balance a por gse y proposito de viaje.
        df_viajes (df): Data frame de viajes generados por gse y proposito.
        df_atracciones (df): Data frame de atracciones generados por superficie disponible por uso de suelo.
        
    Returns:
        list_distribucion (list): Lista con nombres de campos asociados a distribucion de viajes en df od_matrix.
        od_matrix (df): Data frame de matriz origen destino con informacion de usos, poblacion por gse, viaje con valores de distribucion calculado.
    """
    
    # Distribucion
    list_distribucion =["t_b_c", # distribucion para gse bajo y comercio
                      "t_b_e", # distribucion para gse bajo y educacion
                      "t_b_s", # distribucion para gse bajo y salud
                      "t_b_o", # distribucion para gse bajo y oficinas
                      "t_b_p", # distribucion para gse bajo y parque
                      "t_m_c", # distribucion para gse medio y comercio
                      "t_m_e", # distribucion para gse medio y educacion
                      "t_m_s", # distribucion para gse medio y salud
                      "t_m_o", # distribucion para gse medio y oficinas
                      "t_m_p", # distribucion para gse medio y parque
                      "t_a_c", # distribucion para gse alto y comercio
                      "t_a_e", # distribucion para gse alto y educacion
                      "t_a_s", # distribucion para gse alto y salud
                      "t_a_o", # distribucion para gse alto y oficinas
                      "t_a_p"] 

    # viajes*atraccion*A+B*friccion

    for index, distribucion_name in enumerate(list_distribucion):

        friccion = list_fricciones[index]
        balance_b = list_factor_balance_b[index]
        balance_a = list_factor_balance_a[index]
        viajes = list(df_viajes)[index]
        atraccion = list(np.repeat(list(df_atracciones)[:-1],3))[index]
  
        od_matrix[distribucion_name] = od_matrix[viajes]*od_matrix[atraccion]*od_matrix[balance_a]*od_matrix[balance_b]*od_matrix[friccion]

    return list_distribucion, od_matrix


def crear_particion_modal(od_matrix):

    # lista de particion por gse y proposito
    list_particion =["pm_b_c", # friccion para gse bajo y comercio
                      "pm_b_e", # friccion para gse bajo y educacion
                      "pm_b_s", # friccion para gse bajo y salud
                      "pm_b_o", # friccion para gse bajo y oficinas
                      "pm_b_p", # friccion para gse bajo y parque
                      "pm_m_c", # friccion para gse medio y comercio
                      "pm_m_e", # friccion para gse medio y educacion
                      "pm_m_s", # friccion para gse medio y salud
                      "pm_m_o", # friccion para gse medio y oficinas
                      "pm_m_p", # friccion para gse medio y parque
                      "pm_a_c", # friccion para gse alto y comercio
                      "pm_a_e", # friccion para gse alto y educacion
                      "pm_a_s", # friccion para gse alto y salud
                      "pm_a_o", # friccion para gse alto y oficinas
                      "pm_a_p"] 

    df_pm_gse_proposito = pd.DataFrame(np.random.randint(0,100,size=(od_matrix.shape[0], len(list_particion))), columns=list_particion)
    
    df_pm_gse_proposito[list_particion] = np.exp(df_pm_gse_proposito[list_particion])
    
    df_pm_gse_proposito[list_particion] = df_pm_gse_proposito[list_particion].div(df_pm_gse_proposito[list_particion].sum(axis=0), axis=1)
    
    return df_pm_gse_proposito

def join_od_pm(od_matrix, df_pm_gse_proposito):
    """
    Une la matriz OD con la matriz de partición modal.

    Args:
        od_matrix (DataFrame): DataFrame de matriz origen destino con informacion de usos, poblacion por gse, viaje con valores de distribucion calculado
        df_pm_gse_proposito (DataFrame):  DataFrame que contiene la partición modal según GSE y propósito.

    Returns:
        final_matrix (DataFrame): DataFrame que contiene la información de ambos DF's de entrada.

    """
    final_matrix = pd.merge(od_matrix, df_pm_gse_proposito, left_index = True, right_index= True)

    return final_matrix


def matrix_a_csv(final_matrix, dict_paths, nombre_matriz):
    """
    Exporta la matriz final a archivo .csv con el nombre ingresado por el usuario.

    Args:
        final_matrix (DataFrame): Matriz final a exportar.
        dict_paths (dict): Diccionario que contiene las rutas extraidas del archivo de configuración.
        nombre_matriz (str): Nombre del archivo .csv a exportar.

    """

    path_matriz = dict_paths["output"] + '/' + nombre_matriz + '.csv'

    final_matrix.to_csv(path_matriz, encoding='utf-8', index=False)

# Main

In [3]:
# ENTRADAS
## Se lee el archivo config
config_data = leer_config("../config.json")

## Se almacena el diccionario de tipos de uso de suelo
dict_uso_suelo = config_data["tipos_uso"]
## Se almacena el diccionario de betas para atracción de viajes
dict_betas_proposito = config_data["betas"]
## Se almacena diccionario de beta y utilidad compuesta a propositos para la generación de atracción.
dict_friccion = config_data["friccion"]
## Se almacena el diccionario de directorios
dict_paths = config_data["paths"]

## Se lee el shape de zonas
df_zonas = pd.DataFrame.spatial.from_featureclass(dict_paths["zonas"])
## Se lee la matriz OD
od_matrix = pd.read_excel(dict_paths["od_matrix"], index_col = 0)

# INICIALIZACIÓN USO Y GSE
## Se obtiene el número de filas del shape de zonas
n_rows = len(df_zonas)
## Se crea el diccionario que contiene la superficie repartida por cada zona por tipo de uso
dict_superficies = crear_dict_superficies(dict_uso_suelo, n_rows)
## Se generan arrays de porcentajes de distribución de los distintos GSE's en las zonas
np_gse = crear_np_gse(n_rows)    
## Crear listas de poblacion segun GSE (considerando 100 por zona, esto se podria modificar)
gse_bajo = np.intc(np_gse)[:,0]
gse_medio = np.intc(np_gse)[:,1]
gse_alto = np.intc(np_gse)[:,2]


# GENERACIÓN DE VIAJES
## Crear lista de proposito de viajes asumiendo que del total de población por GSE,un % aleatorio viaja por un propósito p
lista_gse_proposito = crear_gse_proposito(n_rows)

## Crear listas de porcentaje de gse bajo que viaja con un proposito determinado p
#v_b_comercio = np.intc(lista_gse_proposito[0][:,0] * gse_bajo)
v_b_comercio = lista_gse_proposito[0][:,0] * gse_bajo
v_b_educacion = lista_gse_proposito[0][:,1] * gse_bajo
v_b_salud = lista_gse_proposito[0][:,2] * gse_bajo
v_b_oficinas = lista_gse_proposito[0][:,3] * gse_bajo
v_b_parque = lista_gse_proposito[0][:,4] * gse_bajo

## Crear listas de porcentaje de gse medio que viaja con un proposito determinado p
v_m_comercio = lista_gse_proposito[1][:,0] * gse_medio
v_m_educacion = lista_gse_proposito[1][:,1] * gse_medio
v_m_salud = lista_gse_proposito[1][:,2] * gse_medio
v_m_oficinas = lista_gse_proposito[1][:,3] * gse_medio
v_m_parque = lista_gse_proposito[1][:,4] * gse_medio

## Crear listas de porcentaje de gse alto que viaja con un proposito determinado p
v_a_comercio = lista_gse_proposito[2][:,0] * gse_alto
v_a_educacion = lista_gse_proposito[2][:,1] * gse_alto
v_a_salud = lista_gse_proposito[2][:,2] * gse_alto
v_a_oficinas = lista_gse_proposito[2][:,3] * gse_alto
v_a_parque = lista_gse_proposito[2][:,4] * gse_alto


# ATRACCIÓN DE VIAJES
## Crear listas de atracción de viajes por proposito determinado p
a_comercio = crear_lista_atraccion(dict_betas_proposito, dict_superficies, "comercio")
a_educacion = crear_lista_atraccion(dict_betas_proposito, dict_superficies, "educacion")
a_salud = crear_lista_atraccion(dict_betas_proposito, dict_superficies, "salud")
a_oficinas = crear_lista_atraccion(dict_betas_proposito, dict_superficies, "oficinas")
a_parque = crear_lista_atraccion(dict_betas_proposito, dict_superficies, "parque")


# MATRIZ OD

## Crear data frame de zonas
df_zonas = crear_df_zonas(dict_superficies, gse_bajo, gse_medio, gse_alto)
## Crear data frame de viajes basado en listas de viajes
df_viajes = crear_df_viajes()
## Crear data frame de atracciones basado en listas de atracciones
df_atracciones = crear_df_atracciones()
## generar merge de datos
od_matrix = merge_od_matrix(od_matrix)


# FACTORES DE BALANCE
## Crear lista de factores de balance y actualizar od_matrix
list_factor_balance_a, list_factor_balance_b, od_matrix = crear_factor(od_matrix)


# CÁLCULO DE FRICCIONES
## Calcular fricciones sobre od_matrix
list_fricciones, od_matrix = calcular_friccion(od_matrix, dict_friccion)


# DISTRIBUCIÓN DE VIAJES
# crea distribuciones de viajes
list_distribucion, od_matrix = crear_distribucion(od_matrix, 
                                                    list_fricciones, 
                                                    list_factor_balance_b, 
                                                    list_factor_balance_a, 
                                                    df_viajes, 
                                                    df_atracciones)


# PARTICIÓN MODAL
## Se genera df con partición modal por GSE y propósito
df_pm_gse_proposito = crear_particion_modal(od_matrix)


# DATAFRAME FINAL
final_matrix = join_od_pm(od_matrix, df_pm_gse_proposito)

#EXPORTACIÓN MATRIZ FINAL
matrix_a_csv(final_matrix, dict_paths, "final_matrix")
