<a href="https://colab.research.google.com/github/endorgobio/NOEL/blob/main/pozuelo.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<p style="text-align: center;">
    <img alt="banner" height="230px" width="100%" src="https://docs.google.com/uc?export=download&id=1u24J7TwTrOJyxWrk0uFjIDhR_cuz_Mzk" hspace="10px" vspace="0px">
</p>

# <font color='FD6E72'> **Ciclo de vida del proyecto** </font>

Las etapas del ciclo de vida de un proyecto de analítica de datos suelen seguir un proceso estructurado para resolver problemas utilizando datos y modelos

<img src="https://docs.google.com/uc?export=download&id=1dxsDLcNuGDMydUUsM0HouRXKa4E84n8c" alt="picture" width="100%">





## <font color='#ff6d33'> **Definir el problema** </font>

Identificar y delimitar claramente el problema que se quiere resolver. Esto implica comprender las necesidades del negocio o del proyecto y traducirlas a un formato que pueda ser abordado mediante análisis de datos.
   - **Tareas**: Formular preguntas clave, definir las métricas de éxito, establecer los resultados esperados, y determinar las restricciones o limitaciones del problema.



## <font color='#ff6d33'> **Obtener datos** </font>
Recopilar los datos relevantes necesarios para abordar el problema.
   - **Tareas**: Identificar las fuentes de datos (internas o externas), extraer los datos, y asegurarse de su disponibilidad y formato adecuado para el análisis. Esto puede incluir consultas a bases de datos, scraping web, APIs, entre otros.



## <font color='#ff6d33'> **Preparar datos** </font>
Acondicionar los datos para que puedan ser utilizados en la creación del modelo.
   - **Tareas**: Limpiar los datos (manejo de datos faltantes, eliminación de duplicados, corrección de valores atípicos), transformar los datos (normalización, codificación de variables categóricas), y seleccionar las variables relevantes. También es común realizar análisis exploratorios de los datos (EDA) en esta etapa.



## <font color='#ff6d33'> **Crear el modelo** </font>
Desarrollar un modelo que permita apoyar la toma de decisiones con base en el problema identificado y los datos disponibles.
   - **Tareas**: Seleccionar la el tipo de modelo más apropiado, diseñar e implementar la estrategia de solución del modelo .



## <font color='#ff6d33'> **Validar el modelo** </font>
Comprobar que el modelo funciona correctamente y que la información generada responde a las preguntas formuladas y sirve como apoyo a la toma de decisiones
   - **Tareas**: Evaluar el rendimiento del modelo en un conjunto de datos de prueba, verificar su precisión, sensibilidad, y otros indicadores relevantes. Si el rendimiento no es adecuado, se pueden ajustar los hiperparámetros o explorar otros modelos.




## <font color='#ff6d33'> **Desplegar el modelo** </font>
Implementar el modelo en un entorno de producción donde pueda ser utilizado para apoyar la tomar decisiones o generar disntintos escenarios.
   - **Tareas**: Integrar el modelo en los sistemas operativos del negocio (APIs, dashboards, etc.), monitorizar el rendimiento del modelo en tiempo real, y realizar ajustes o actualizaciones si es necesario para mantener su eficacia a lo largo del tiempo.



Estas etapas **no siempre son lineales** y pueden requerir retrocesos o iteraciones. Por ejemplo:

* Al momento de preparar los datos nos demos cuenta que es necesario redefinir el problema en términos de la información que diponemos
* Al diseñar e implementar el modelo evidenciemos que requerimos obtener algunos datos o información que inicialmente no habiamos presupuestado
* Los resultados de la validación del modelo pueden llevar a una nueva fase de preparación de los datos o ajuste del modelo.
* Un modelo ya desplegado y siendo usado para apoyar la toma de decisiones, puede requerir ser actualizado, porque por ejemplo algunos de los supuestos o condiciones en los que se baso la modelación ya no son válidos

# <font color='FD6E72'> **Creación de modelos** </font>

Ahondaremos de momento en la etapa de creación del modelo por ser una de las etapas en las que la analitica prescriptiva se diferencia de los demas tipos de analitica, particularmente por la naturaleza de los modelos que emplea.










## <font color='#ff6d33'> **Modelo como abstracción de la realidad** </font>

Dentro de las múltiples acepciones de la palabra “modelo”, la que mejor se adapta al contexto de este curso es la que lo define como

> “un esquema teórico, generalmente en forma matemática, que representa un sistema o una realidad compleja, como la evolución económica de un país, con el propósito de facilitar su comprensión y estudio de su comportamiento” (Real Academia Española, 2023).

Un modelo siempre representa una abtracción de la realidad. Incorporar en un modelo todos los elementos y detalles que definen el sistema real lo harían, en la mayoria de los casos, impractico pars su proposito general de generar información que apoye la toma de decisiones.

## <font color='#ff6d33'> **Elementos de un modelo de optimización** </font>

Un modelo de optimización representa la selección de valores de un vector de **variables** que representan el conjunto de posibles elecciones o alternativas para las <font color='#85a900'> **decisiones** </font> en consideración, de manera que se optimize (maximice o minimice) una **función objetivo**, respetando un conjunto de **restricciones** que representan los límites técnicos de las posibles elecciones.

<img src="https://docs.google.com/uc?export=download&id=10Kjm3CQskO_zt5PoEPMRYEh6qleX_hp9" alt="picture" width="100%">



Las <font color='#85a900'> **variables** </font>  en un modelo de optimización pueden representar una amplia variedad de conceptos, como cantidades a producir, inventarios a mantener, flujos entre diferentes puntos de una red, asignación de recursos a actividades, cantidades a comprar, número de recursos requeridos en un período, tiempos de inicio de actividades, inclusión de elementos en diseños y elección entre varias alternativas, entre otros ejemplos.



Por su parte, las <font color='#85a900'> **restricciones** </font>  se utilizan para expresar las condiciones que se deben cumplir en el sistema que se esté modelando, tales como los límites de recursos disponibles, las demandas de ciertos productos, las políticas de funcionamiento que se hayan definido, entre otras posibilidades.



Por último, la <font color='#85a900'> **función objetivo** </font>  cuantifica y evalúa las consecuencias de las decisiones, y representa la meta u objetivo que se desea lograr. Las soluciones se comparan entre sí en función de la función objetivo. Por ejemplo, si se está minimizando un costo, la solución con la función objetivo más baja será considerada la mejor. Las funciones objetivo de los modelos de optimización pueden abarcar una amplia variedad de metas. Las más comunes suelen ser la minimización de costos o la maximización de utilidades, pero existen muchas otras posibilidades. Algunas de ellas incluyen: maximizar ingresos, maximizar rendimientos, maximizar el valor presente, maximizar el nivel de servicio, minimizar la infactibilidad, maximizar la satisfacción, maximizar la probabilidad de cumplir con ciertos requisitos, maximizar la robustez, minimizar el uso de recursos, minimizar los tiempos de ejecución, entre otros.


### <font color='#85a900'> **Ejemplo: nuestro primero modelo** </font>

Una compañia de galletas tiene un único horno que procesa un único tipo de galleta. El plan de demanda contiene las ordenes de 10 clientes (en miles de galletas) y la utilidad (en millones de pesos) que cada una de ellas genera

|        | Orden 1 | Orden 2 | Orden 3 | Orden 4 | Orden 5 | Orden 6 | Orden 7 | Orden 8 | Orden 9 | Orden 10 |
|--------|---------|---------|---------|---------|---------|---------|---------|---------|---------|----------|
| Cantidad |   16    |   29    |   24    |   20    |   17    |   30    |   32    |   28    |   20    |    20    |
| Utilidad  |   73    |   85    |   89    |   73    |   52    |   71    |   102    |   73    |   93    |    79    |

La politica de la empresa estipula que a un cliente se le despacha  el total de su demanda o en caso contrarion no se le despacha nada. Dado que la capcidad del horno es 110 mil galletas, y no es suficiente para satisfacer todos los clientes, deben priorizarse algunos de ellos. La decisión que debe tomarse es:


> **¿Cuáles de las ordenes deben producirse?**





* <font color='85a900'>**Decisiones** </font>

  Para cada pedido debe decidirse si producirlo o no producirlo

* <font color='85a900'>**Objetivo** </font>

  Generar la máxima utilidad posible con los pedidos producidos

* <font color='85a900'>**Restricciones** </font>

  La cantidad de unidades de galleta requerida por los pedidos a producir no debe sobrepasar la capacidad de la linea

## <font color='#ff6d33'> **Tipos de modelos de optimización** </font>

Dependiendo de la cantidad de funciones objetivo, el dominio de las variables, la estructura de las funciones objetivo y restricciones, y la naturaleza de la información utilizada para construir el modelo, se pueden tener distintos modelos de optimización.

<img src="https://docs.google.com/uc?export=download&id=1BhatYOlmUldF-3QlqkrYNl_odL0qhz2w" alt="picture" width="100%">



## <font color='#ff6d33'> **Metodología para la creación de modelos** </font>

Aunque la construcción de modelos de optimización es vista por algunos como un arte, creemos que ver dicha construcción como un proceso hace más fácil su aprendizaje y reproducción. Por lo tanto, definimos el siguiente proceso de cuatro etapas que rocoge las operaciones principales y que como evidenciaremos posteriormente, pueden iterarse hasta obtener un modelo satisfactorio:   

* **Definición de elementos del modelo y notación**: esta etapa implica la definición de los conjuntos, parámetros y variables de decisión que se usarán en el modelo, junto a su respectiva notación (matemática).
* **Verbalización de la estructura del modelo**: una vez definidos los elementos del modelo, se describe en palabras la estructura de este, especificando las decisiones a tomar, la función objetivo y las restricciones.
* **Formulación del modelo**: implica expresar el modelo de tal manera que pueda ser resuelto posteriormente bien sea mediante un método exacto o un método apróximado.
* **Implementación del modelo**: Corresponde a el desarrollo o programación de los recursos necesarios para dar solución al modelo


### <font color='85a900'> **Definición de elementos del modelo y notación** </font>

En la construcción de un modelo de optimización, se inicia definiendo los elementos que lo conforman y su respectiva notación. Estos elementos incluyen los **parámetros** o datos que se conocen, las **variables de decisión** que se utilizarán y los **conjuntos** en los cuales se definen los parámetros y variables mencionadas. Esta primera etapa del proceso de modelado busca responder a dos preguntas fundamentales:

* **¿Qué información se tiene disponible?** - parámetros de entrada  
* **¿Qué decisiones se deben tomar?** - variables de decisión

En optimización, cuando el modelo se formula como un programa matemático se utiliza una notación estándar en la que se asignan símbolos o letras del alfabeto a los conjuntos, parámetros y variables con el fin de facilitar su identificación al leer un modelo de optimización





En nuestro ejemplo, podriamos definir de momento:

* <font color='46B8A9'>**Conjuntos** </font>

  Tenemos un conjunto $P$ de **pedidos**

* <font color='46B8A9'>**Parámetros** </font>

  Se definen parámetros con base en la  información conocida asociada a cada elemento del conjunto de **pedidos** que definimos, estos parámetros son:
  * la **utilidad** $u_i$ generada por cada pedido $i$
  * la **cantidad** $w_i$ de galletas (cuanta capacidad del horno consume) cada pedido
  * la capacidad del horno $C$

* <font color='46B8A9'>**Deciciones** </font>

  Para cada **pedido** la variable $x_i$ representa la decisión de producirlo o no producirlo



### <font color='85a900'> **Verbalización de la estructura del modelo** </font>



La verbalización es la descripción en palabras del modelo de optimización que se está construyendo. Para ello, se deben responder tres preguntas fundamentales utilizando los elementos del modelo:
* **¿Qué se decide?** (variables de decisión),
* **¿Con cuál objetivo?** (función objetivo), y
* **¿Con que límites?** (restricciones).





En nuestro ejemplo, podriamos definir de momento:

* <font color='46B8A9'>**¿Qué se decide?** </font>

  Cuáles pedidos deben producirse

* <font color='46B8A9'>**¿Con cuál objetivo?** </font>

  Maximizar la uitilidad generada por los pedidos que se producen

* <font color='46B8A9'>**¿Con qué límites?** </font>

  * Los total cantidad de unidades requeridas por pedidos a producir no debe sobrepasar la capacidad del horno
  * Los pedidos no pueden fabricarse parcialmente. Es decir, se satisfacen completos o no se satisfacen en absoluto

La verbalización es una herramienta fundamental en la construcción de modelos de optimización por varias razones:
* Permite hacer explícita la estructura del modelo, detallando las variables de decisión, las restricciones y la función objetivo, incluso antes de que el modelo sea construido.
* Al trabajar en equipo, ayuda a unificar las ideas y opiniones de los miembros del equipo en torno a una misma estructura de modelo.
* Si el modelo será utilizado por otros usuarios o equipos, la verbalización permite comunicar claramente lo que hará el modelo y validar las expectativas del usuario antes de construirlo e implementarlo.
* Facilita la comunicación con personas que no son expertas en optimización al proporcionar una descripción no matemática de la estructura del modelo. Además, permite la comunicación efectiva en instancias en las cuales la presentación detallada de la formulación matemática puede no ser necesaria como en reuniones de trabajo.
* Sirve como una lista de verificación en el proceso de construcción del modelo de optimización, ya que permite verificar si todos los elementos que se quería incluir fueron modelados o no.
* Finalmente, se puede utilizar como entrada (`prompt`) en las herramientas de inteligencia artificial que generan automáticamente modelos matemáticos o código de computador como ChatGPT y otras herramientas de inteligencia artificial generativa. (ej. [chatOPT](https://chatopt-modelexp-9188d4d33593.herokuapp.com/))

####<font color='46B8A9'>**Ejercicio** </font>

Para evidenciar la importancia de una buena verbalización, vamos considerar el siguiente ejercicio:

Tome una hoja en blanco o cree un lienzo en una aplicación de dibujo en linea y siga las siguientes instrucciones:

1. Dibuje un rectángulo grande
2. En una de las esquinas del rectángulo dibuje una elipse
3. En el lado inferior del rectángulo dibuje cuatro rectángulos más pequeños y delgados
4. En otra de las esquinas del rectángulo dibuje un triángulo isósceles
5. En la elipse dibuje dos círculos pequeños
6. Sobre  la elipse dibuje un rectangulo pequeño  conteniendo dos circulos y en cada uno de dichos circulos dibuje un circulo negro
7. Dibuje dos triángulos isósceles pequeños, uno a cada lado del rectángulo pequeño
8. Dibuje un semicírculo sobre el lado inferior del rectángulo grande
9. Dibuje dos elipses negras en el rectángulo grande


Acabamos de seguir las instrucciones para la creación de un modelo con base en la verbalización que se nos dio de este. Podriamos preguntarnos:
* ¿Qué tanto nos fue posible reproducir el modelo con base en su verbalización? - ([verbalización vs modelo](https://drive.google.com/file/d/1p_clA24WFbhfgiPAVg3iIJoWnjXP6_j2/view?usp=drive_link))
* ¿Qué tanto representa el modelo la realidad? ([modelo vs realidad](https://drive.google.com/file/d/1aLvHtJ7v5bGpMerrmQLqxxbnl0A0XOAX/view?usp=drive_link))



### <font color='85a900'> **Formulación del modelo** </font>

La formulación del modelo expresa el mdoelo verbalizado en los terminos necesarios para darle solución.

En el caso en el que se recurre a una formulación matemática,
esta puede ser **concreta** o específica cuando los datos y la estructura del modelo están imbricados para un caso particular, o puede ser **abstracta** o general, en la cual la estructura del modelo no depende de los datos y se expresa usando la notación elegida en el primer paso.

En el caso de nuestro ejemplo, hemos planteado las dos formulaciones anteriormente:


Primero consideremos las **decisiones**, Para cada pedido $i$ debe decidirse si se produce o no:

> $x_i =
\begin{cases}
1 & \text{se produce el pedido } i , \\
0 & \text{no se produce el pedido } i
\end{cases}$

Nuestro **objetivo** es máximizar la utilidad
> $\text{Maximizar} \quad  Z = 73x_1 + 85x_2 + 89x_3 + 73x_4 + 52x_5 + 71x_6 + 51x_7 + 73x_8 + 93x_9 + 79x_{10}$

No debe **sobrepasarse la capacidad **de la linea
> $16x_1 + 29x_2 + 24x_3 + 20x_4 + 17x_5 + 30x_6 + 32x_7 + 28x_8 + 20x_9 + 20x_{10} \leq 110$

los pedidos no puden fragmentarse

> $x_1$, $x_2$, $x_3$, $x_4$, $x_5$, $x_6$, $x_7$, $x_8$, $x_9$ $\in \{0,1\}$ $




En una forma más compacta, usando la notación que definimos anteriormente, podria escribirse como:

\begin{align}
    \text{Maximize} \quad & Z = \sum_{i \in I} u_i x_i \\
    \text{Subject to}\\
    & \sum_{i \in I} w_i x_i \leq C \\
    & x_i \in \{0, 1\} \quad \forall i \in I
\end{align}

Alternativamente, dado el caso en el que no es posible formular matemáticamente el modelo o el método de solución aproximado que emplearemos no lo requiere. El problema podria representarse como:

* Un vector de decisiones en el que cada posición indica si se produce o no el pedido asociado a la posición. Es decir, el siguiente vector representa el caso en el que se producen los pedidos $\{1, 2, 5, 6\}$:
  
  >$x = [1,1,0,0,1,1,0,0,0,0,]$

* Un vector asociado a la utilidad de cada pedido y otro a la cantidad de galletas requerida por el
  > $u = [73, 85, 89, 73, 52, 71, 102, 73, 93, 79]$
  > $w = [16, 29, 24, 20, 17, 30, 32, 28, 20, 20]$

* Debemos maximizar la utilidad total, la cual podemos calcular como el producto elemento a elemnto (producto punto) de los pedidos seleccionados por su utilidad
>$\text{maximizar} \ u.x$

* Debemos garantizar que la cantidad total producida producida, la cual podemos calcular como el producto elemento a elemento (producto punto) de los pedidos seleccionados por la cantidad de galletas que requieren, no sobrepase la capacidad total
> $ w.x$ debe ser menor que $C$

### <font color='85a900'> **Implementación del modelo** </font>

En el caso en el cual formulamos matemáticamente el modelo y deseamos hacer uso de un `optimizador` para resolverlo. Debemos:


*   Escribir el modelo formulado en la sintaxis del **lenguaje de modelación** que escogimos
*   Pasar el modelo en el lenguaje de modelación a un **optimizador** (`solver`) que lo resuleva y nos retorne la información de la solución

Alteranativamente, si deseamos resolver el modelo para ser resuleto con un método aproximado. Usuaalmente debemos implementar en un lenguaje de programación el algoritmo que resuelve el modelo que describimos. Algunos de dichos algoritmos son, como hemos señalado anteriormente, heurísticos o metaheurísticos.

La siguente figura resume las opciones decritas:

<a target="_blank">
  <img src="https://docs.google.com/uc?export=download&id=1WelPJr41NE9Tj2HjjZ3Ld2K1eg8-_7kO" alt="Image description" style="width:200px;">
</a>



## <font color='#ff6d33'> **Modelos lógicos (Logic-based models)** </font>

Los modelos basados en lógica son descripciones hipotéticas de la cadena de causas y efectos que conducen a un resultado de interés. En el contexto de los sistemas de información, pueden incluir sistemas basados en reglas, representaciones del conocimiento experto y la obtención de conocimiento del dominio para apoyar la toma de decisiones proactiva en aplicaciones de análisis prescriptivo.

# <font color='FD6E72'> **Nuestro modelo extendido** </font>

Extenderemos el modelo que hemos venido discutiendo para evidenciar como la modelación no es un proceso lineal sino que en muchos casos requiere de iterar y devolverse a pasos anteriores de la metodología descrita



Una compañia de galletas tiene **cinco lineas** que procesan un único tipo de galleta. El plan de demanda contiene las ordenes de 10 clientes (en miles de galletas) y la utilidad (en millones de pesos) que cada una de ellas genera en cada uno de las lineas


|          | Orden 1 | Orden 2 | Orden 3 | Orden 4 | Orden 5 | Orden 6 | Orden 7 | Orden 8 | Orden 9 | Orden 10 |
|----------|---------|---------|---------|---------|---------|---------|---------|---------|---------|----------|
| Cantidad |   16    |   29    |   24    |   20    |   17    |   30    |   32    |   28    |   20    |    20    |
| Utilidad 1 |   73    |   85    |   89    |   73    |   52    |   71    |   102   |   73    |   93    |    79    |
| Utilidad 2 |   67    |   79    |   88    |   65    |   50    |   72    |   98    |   70    |   90    |    75    |
| Utilidad 3 |   70    |   82    |   87    |   68    |   53    |   69    |   99    |   72    |   91    |    77    |
| Utilidad 4 |   75    |   84    |   86    |   71    |   51    |   70    |   101   |   74    |   92    |    78    |
| Utilidad 5 |   72    |   81    |   85    |   66    |   54    |   73    |   97    |   71    |   89    |    76    |


La política de la empresa estipula que a un cliente se le despacha  el total de su demanda o en caso contrarion no se le despacha nada. La capacidad de cada linea es 55 mil galletas, pero alistar cualquiera de las lineas sin importar el número de galletas que se produzcan en ella tiene un costo de 200. La decisión que debe tomarse es:


> **¿Cuáles de las ordenes deben producirse y en que líneas deben hacerse?**


## <font color='#ff6d33'> **Verbalizar el problema** </font>

* <font color='85a900'>**Decisiones** </font>
  * Debe decidirse cuáles lineas activar (alistar)
  * Para cada pedido debe decidirse si producirlo o no producirlo y en caso de producirlo en cuál de las lineas debería producirse

* <font color='85a900'>**Objetivo** </font>

  Generar la máxima utilidad entendida como la utilidad generada por los pedidos producidos menos el costo de alistar las líneas que entran en operación

* <font color='85a900'>**Restricciones** </font>

  * La cantidad de unidades de galleta requerida por los pedidos a producir en cada línea no debe sobrepasar su capacidad
  * Cada orden debe producirse cuando más en una linea
  * Las ordenes no pueden fraccionarse

## <font color='#ff6d33'> **Modelo matemático** </font>

### <font color='85a900'> **Formulación** </font>

Es posible modelar este problema mediante expresiones mátematicas:

Primero consideremos las decisiones,

* Para cada linea $j$ debe decidirse si se activa (alista):
  >  $y_{j} =
  \begin{cases}
  1 & \text{Si se activa la línea } j, \\
  0 & \text{Si No se activa la línea } j
  \end{cases}$

* Para cada pedido $i$ debe decidirse si se produce o no en la linea $j$:

  > $x_{ij} =
  \begin{cases}
  1 & \text{se produce el pedido } i \text{ en la línea } j, \\
  0 & \text{ no se produce el pedido } i \text{ en la línea } j, \\
  \end{cases}$

Nuestro objetivo es máximizar la utilidad total. Esta esta compuesta por dos partes:

* La utilidad de los pedidos producidos

  > $\text{ingreso} =  73x_{1,1} + 85x_{2,1} + \ldots + 93x_{9,1} + 79x_{10,1} + 79x_{1,2} + 88x_{2,2} + \ldots + 90x_{9,2} + 75x_{10,2}$

* El costo de activar las lineas
  > $\text{egreso} = 200y_1 + 200y_2 + 200y_3 + 200y_5 + 200y_5

Siendo el objetivo
> $\text{maximizar} \quad \text{ingresos} - \text{egresos}$


No debe sobrepasarse la capacidad de la linea
> $16x_{1,1} + 29x_{2,1} + 24x_{3,1} + 20x_{4,1} + 17x_{5,1} + 30x_{6,1} + 32x_{7,1} + 28x_{8,1} + 20x_{9,1} + 20x_{10,1} \leq 55$
> $16x_{1,2} + 29x_{2,2} + 24x_{3,2} + 20x_{4,2} + 17x_{5,2} + 30x_{6,2} + 32x_{7,2} + 28x_{8,2} + 20x_{9,2} + 20x_{10,2} \leq 55$
> $16x_{1,3} + 29x_{2,3} + 24x_{3,3} + 20x_{4,3} + 17x_{5,3} + 30x_{6,3} + 32x_{7,3} + 28x_{8,3} + 20x_{9,3} + 20x_{10,3} \leq 55$
> $16x_{1,4} + 29x_{2,4} + 24x_{3,4} + 20x_{4,4} + 17x_{5,4} + 30x_{6,4} + 32x_{7,4} + 28x_{8,4} + 20x_{9,4} + 20x_{10,4} \leq 55$
> $16x_{1,5} + 29x_{2,5} + 24x_{3,5} + 20x_{4,5} + 17x_{5,5} + 30x_{6,5} + 32x_{7,5} + 28x_{8,5} + 20x_{9,5} + 20x_{10,5} \leq 55$

Cada orden se procesa cuando más en una línea
> $\begin{align*}
  x_{1,1} + x_{1,2} + x_{1,3} + x_{1,4}+ x_{1,5} \leq 1 \\
  x_{2,1} + x_{2,2} + x_{2,3} + x_{2,4} + x_{2,5} \leq 1 \\
  x_{3,1} + x_{3,2} + x_{3,3} + x_{3,4} + x_{3,5} \leq 1 \\
  x_{4,1} + x_{4,2} + x_{4,3} + x_{4,4} + x_{4,5} \leq 1 \\
  x_{5,1} + x_{5,2} + x_{5,3} + x_{5,4} + x_{5,5} \leq 1 \\
  x_{6,1} + x_{6,2} + x_{6,3} + x_{6,4} + x_{6,5} \leq 1 \\
  x_{7,1} + x_{7,2} + x_{7,3} + x_{7,4} + x_{7,5} \leq 1 \\
  x_{8,1} + x_{8,2} + x_{8,3} + x_{8,4} + x_{8,5} \leq 1 \\
  x_{9,1} + x_{9,2} + x_{9,3} + x_{9,4} + x_{9,5} \leq 1 \\
  x_{10,1} + x_{10,2} + x_{10,3} + x_{10,4} + x_{10,5} \leq 1
\end{align*}$

LAs ordenes no pueden fraccionarse
> $x_{1,1}, x_{2,1} \ldots x_{9,5}, x_{10,5} \in \{0,1\}$



### <font color='85a900'> **Implementación** </font>

El modelo se implementa en un **lenguaje de modelación** y se resuelve haciendo uso de un **optimizador**

In [None]:
!pip install pyomo
!pip install highspy

Collecting pyomo
  Downloading Pyomo-6.8.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (8.0 kB)
Collecting ply (from pyomo)
  Downloading ply-3.11-py2.py3-none-any.whl.metadata (844 bytes)
Downloading Pyomo-6.8.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (13.3 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m13.3/13.3 MB[0m [31m36.6 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading ply-3.11-py2.py3-none-any.whl (49 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m49.6/49.6 kB[0m [31m1.6 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: ply, pyomo
Successfully installed ply-3.11 pyomo-6.8.0
Collecting highspy
  Downloading highspy-1.7.2-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (10 kB)
Downloading highspy-1.7.2-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (2.1 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m2.1/2.1 MB[0m [31m26.0 MB/s

In [None]:
from pyomo.environ import *

def create_multiknapsack_model(values, weigths, capacity, cost_setup, linked=False):
    # Create a concrete Pyomo model
    model = ConcreteModel()

    n_items = len(weigths.keys())
    n_knapsacks = len(capacity.keys())

    # Define sets
    model.N = Set(initialize=list(range(1, n_items+1)))  # Set of items
    model.M = Set(initialize=list(range(1, n_knapsacks+1)))  # Set of knapsacks

     # Define parameters
    model.v = Param(model.N, model.M, initialize=values)   # Values of items for each knapsack
    model.w = Param(model.N, initialize=weigths)   # Weights of items
    model.C = Param(model.M, initialize=capacity)   # Capacities of knapsacks

    # Define decision variables
    model.x = Var(model.N, model.M, domain=Binary)  # Binary variables for item placement
    model.y = Var(model.M, domain=Binary)  # Binary variables for lines

    # Objective function: Maximize total value
    def objective_rule(model):
        return sum(model.v[i, k] * model.x[i, k] for i in model.N for k in model.M) - sum(cost_setup[k] * model.y[k] for k in model.M)
    model.obj = Objective(rule=objective_rule, sense=maximize)

    # Constraint 1: Capacity constraint for each knapsack
    def capacity_constraint(model, k):
      if linked:
        return sum(model.w[i] * model.x[i, k] for i in model.N) <= model.C[k]*model.y[k]
      else:
        return sum(model.w[i] * model.x[i, k] for i in model.N) <= model.C[k]
    model.capacity_constraints = Constraint(model.M, rule=capacity_constraint)

    # Constraint 2: Each item can be placed in at most one knapsack
    def item_assignment_constraint(model, i):
        return sum(model.x[i, k] for k in model.M) <= 1
    model.item_constraints = Constraint(model.N, rule=item_assignment_constraint)

    return model


Corramos la instancia de ejemplo

In [None]:
# Utilities
import pandas as pd
values = {
    (1, 1): 73, (1, 2): 67, (1, 3): 70, (1, 4): 75, (1, 5): 72,
    (2, 1): 85, (2, 2): 79, (2, 3): 82, (2, 4): 84, (2, 5): 81,
    (3, 1): 89, (3, 2): 88, (3, 3): 87, (3, 4): 86, (3, 5): 85,
    (4, 1): 73, (4, 2): 65, (4, 3): 68, (4, 4): 71, (4, 5): 66,
    (5, 1): 52, (5, 2): 50, (5, 3): 53, (5, 4): 51, (5, 5): 54,
    (6, 1): 71, (6, 2): 72, (6, 3): 69, (6, 4): 70, (6, 5): 73,
    (7, 1): 102, (7, 2): 98, (7, 3): 99, (7, 4): 101, (7, 5): 97,
    (8, 1): 73, (8, 2): 70, (8, 3): 72, (8, 4): 74, (8, 5): 71,
    (9, 1): 93, (9, 2): 90, (9, 3): 91, (9, 4): 92, (9, 5): 89,
    (10, 1): 79, (10, 2): 75, (10, 3): 77, (10, 4): 78, (10, 5): 76
}


# quiantity
weigths = {1: 16, 2: 29, 3: 24, 4: 20, 5: 17, 6: 30, 7: 32, 8: 28, 9: 20, 10: 20}

# Capacities of the two knapsacks
capacity= {1: 55, 2: 55, 3: 55, 4: 55, 5: 55}

# Cost of setting up each knapsack
cost_setup = {1: 150, 2: 150, 3: 150, 4: 150, 5: 150}

# Create the model
model = create_multiknapsack_model(values, weigths, capacity, cost_setup, linked = False)

# Solve the model using a solver
solver = SolverFactory('appsi_highs')
results = solver.solve(model, tee=False)

# Display results
print("Objective value (Total value):", model.obj())


Objective value (Total value): 788.0


Obtener valor de las variables de decision

In [None]:
def get_variables(model, capacity):
  # obtener las x
  data = []
  for i in model.N:
      for k in model.M:
          if model.x[i, k].value == 1:
              row = [i, k, model.v[i,k], model.w[i]]

              data.append(row)
              break
  df_x = pd.DataFrame(data, columns=['Item', 'Line', 'Value', 'Weight'])
  # obtener las y
  data = []
  for k in model.M:
    if model.y[k].value == 1:
      row = [k, model.y[k].value, capacity[k],'white', ]
    else:
      row = [k, model.y[k].value, capacity[k],'grey']
    data.append(row)
  df_y = pd.DataFrame(data, columns=['Line', 'activate', 'capacity','color'])

  return df_x, df_y


df_x, df_y = get_variables(model, capacity)


In [None]:
df_x




Unnamed: 0,Item,Line,Value,Weight
0,1,4,75,16
1,2,3,82,29
2,3,2,88,24
3,4,1,73,20
4,5,5,54,17
5,6,5,73,30
6,7,1,102,32
7,8,4,74,28
8,9,2,90,20
9,10,3,77,20


In [None]:
df_y

Unnamed: 0,Line,activate,capacity,color
0,1,0.0,55,grey
1,2,0.0,55,grey
2,3,0.0,55,grey
3,4,0.0,55,grey
4,5,0.0,55,grey


In [None]:
import plotly.graph_objects as go

def graph_bar(df_x, df_y):
  layout = go.Layout(
      title='Overlapping Bars Example',
      barmode='overlay'
  )

  # Create the figure
  fig = go.Figure(layout=layout)



  # Calculate the total width and offset for each bar
  total_width = 0.8
  offset = total_width / 2

  # Add the bars
  fig.add_trace(go.Bar(x=df_x['Weight'], y=df_x['Line'], marker_color=df_x['Item'], orientation='h',  width=0.5, showlegend=False))
  fig.add_trace(go.Bar(x=df_y['capacity'], y=df_y['Line'], orientation='h',  width=0.8, marker_color=df_y['color'], opacity=0.5, name="no activa"))

  # return
  return fig

fig = graph_bar(df_x, df_y)
fig.show()

Note que a pesar de no estar activo ninguno de las líneas se estan asignando pedidos a ellos. Esto se debe a que no hemos relacionado las dos variables de decision. En este caso en particular, deberemos modificar la restricción de capacidad así:

> La cantidad de unidades de galleta requerida por los pedidos a producir en cada línea no debe sobrepasar su capacidad si la línea esta activa o debe ser cero si la línea no esta activa.

En términos mátematicos esto lo logramos al múltiplicar el lado derecho por la variable de activación de la línea. Para la restricción de capacidad de la primera línea se vería así:

>  $16x_{1,1} + 29x_{2,1} + 24x_{3,1} + 20x_{4,1} + 17x_{5,1} + 30x_{6,1} + 32x_{7,1} + 28x_{8,1} + 20x_{9,1} + 20x_{10,1} \leq 55 y_1$

De forma similar se haría para las demas líneas.


Introducimos esta modificación en nuestro modelo. Por simplicidad, se ha implementado de modo que el valor del parametro `linked=True` significa que debe considerarse la nueva restricción:

Tendríamos entonces

In [None]:
# Create the model
model = create_multiknapsack_model(values, weigths, capacity, cost_setup, linked=True)

# Solve the model using a solver
solver = SolverFactory('appsi_highs')
results = solver.solve(model, tee=False)

# Display results
print("Objective value (Total value):", model.obj())

# get results
df_x, df_y = get_variables(model, capacity)

# graph results
fig = graph_bar(df_x, df_y)
fig.show()

Objective value (Total value): 118.99999999999977


# <font color='FD6E72'> **Referencias** </font>

Gartner, 2016. "2017 Planning Guide for Data and Analytics"