# Lista ordenada, panama papers - Solución

<b><i style="font-size:13px">Tags: </i></b><i style="font-size:11px">TO DO...</i>

## Enunciado

Recientemente la firma de abogados Mossack Fonseca fue hackeada, dejando una fuga de 11.5 millones de transacciones bancarias relacionas con empresas offshore en Panamá. El escándalo conocido como “The Panama Papers” ha revelado cientos de nombres de multimillonarios alrededor del mundo que al parecer utilizaban dichas empresas para evadir impuestos. Actualmente, la firma *International Consortium of Investigative Journalists* (ICIJ) es quien está adelantando las primeras investigaciones, no obstante, procesar ese volumen de información requiere de una organización y planeación importante. En particular, ICIJ quiere construir una lista **ordenada** de 100 personas que se encuentren involucrados en estos documentos de tal forma que las agencias oficiales las investiguen primero.

En la base de datos se ha identificado una serie de personas involucradas ($I$), así como una lista de empresas offshore ($O$).
Además, ICIJ ha categorizado a las empresas en los subconjuntos $E_{i}$, que representan las empresas que están relacionadas con cada persona $i\in I$. De cada empresa $j\in O$ en la base de datos, se conoce el valor de sus activos financieros en cada año desde su creación hasta el 2021 ($a_{j\ t}$) y el año en el que fue creada ($c_{j}$). De igual forma, de cada persona se conoce su país de procedencia ($p_{i}$).

Con la información anterior, se debe construir una lista **ordenada** que cumpla con una serie de condiciones. Dado que la lista deseada es de tamaño 100, no todas las personas estarán en la lista (es decir, $|I|>100$). Por otro lado, algunos países (conjunto $P$) son más eficientes en el proceso de enjuiciamiento de sus criminales. En este sentido, se quiere garantizar que al menos el 80% de la lista esté compuesta por personas oriundas de dichos países. Además, se sabe que muchas de las personas involucradas son familia entre sí, haciendo necesario entonces que si una persona se agrega a la lista, entonces todos sus familiares deben estar en la lista. El parámetro $f_{i\ k}$ es un indicador binario que toma el valor de 1 si la persona $i\in I$ es familiar de la persona $k\in I$.

En cuanto al **orden** de la lista de personas, se requiere que sea **ascendiente** con respecto al año de la compañía más antigua con la cual estén relacionados. Para romper posibles empates, el **orden** de la lista debe ser **descendiente** de acuerdo al promedio sobre los años de los activos de cada persona. El promedio sobre los años de los activos de cada persona corresponde a la suma del promedio anual de los activos de cada empresa que con la que esté relacionada. Asuma que se ignora el valor del dinero en el tiempo.

Usted es el nuevo consultor de ICIJ experto en optimización y le han pedido que formule un modelo de optimización lineal para encontrar dicha lista ordenada que respete el primer criterio de ordenamiento y que busque mediante la función ojetivo romper posibles empates del primer criterio.

## TO.DO: Tablas

|Col 1|Col 2|
|:---:|:---:|
|1,1|1,2|
|2,1|2,2|

## Formulación matemática

### Conjuntos:

$$
\begin{align}
    I:& \text{ conjunto de empresas involucradas.}\\
    O:& \text{ conjunto de empresas }\textit{offshore.}\\
    P:& \text{ conjunto de paises eficientes en procesos de enjuiciamiento.}\\
    T:& \text{ conjunto de años desde la creación de la empresa más antigua hasta el 2021.}\\
    L:& \text{ conjunto de posiciones de la lista definitiva. } L = \{1,\cdots,100\}.
\end{align}
$$

### Subconjuntos:

$$
\begin{align}
    E_{i}:& \text{ conjunto de empresas relacionadas a la persona } i \in I.\\
\end{align}
$$

### Parámetros:

$$
\begin{align}
    c_{j}:& \text{ año de creación de la empresa } j\in O.\\
    a_{j\ t}:& \text{ activos financieros en cada año } t\in T \text{ de la empresa } j \in E \text{ tal que }t\geq c_{j}.\\
    p_{i}:& \text{ país de procedencia de la persona } i\in I.\\
    f_{i\ k}:& \text{ indicador binario de valor 1 si la persona } i\in I \text{ es familiar de la persona } k\in I\text{. 0 de lo contrario.}\\
    por:& \text{ porcentaje de personas en la lista cuyo país de origen pertenece al conjunto }P.
\end{align}
$$

### Variables de decisión:

$$
\begin{align}
x_{i\ l}:&\begin{cases}1\text{,}&\text{ si se asigna a la persona }i\in I\text{ a la posición de la lista}l\in L .\\ 0\text{,}& \text{ d.l.c.}  \end{cases}
\end{align}
$$

### Restricciones:

Cada posición en la lista solo puede tener una persona asignada.

$$
\begin{align}
    \sum_{i\in I}x_{i\ l} &= 1, &\forall l\in L.
\end{align}
$$

Cada persona puede tener a lo sumo una posición en la lista.

$$
\begin{align}
    \sum_{l\in L}x_{i\ l} &\leq 1, &\forall i\in I.
\end{align}
$$

El porcentaje de personas oriundas de paises pertenecientes a $P$ asignadas a la lista debe ser mayor al 80%.

$$
\begin{align}
    \sum_{i\in I|p_{i}\in P}\sum_{l\in L}x_{i\ l} &\geq por\% \cdot \sum_{i\in I}\sum_{l\in L}x_{i\ l}.
\end{align}
$$

Si una persona se agrega a la lista, entonces todos sus familiares deben estar en la lista.

$$
\begin{align}
    \sum_{k\in I}f_{i\ k} \cdot \sum_{l\in L}x_{i\ l} &\leq \sum_{k\in I}\sum_{l\in L}f_{i\ k} x_{k\ l} , &\forall i\in I.
\end{align}
$$

El orden de la lista debe ser ascendiente según el año en que se creó la compañía más antigua relacionada con la persona asignada.

$$
\begin{align}
    \sum_{i\in I}\min_{j\in E_{i}}\{ c_{j} \}\cdot x_{i\ l} &\leq \sum_{i\in I}\min_{j\in E_{i}}\{ c_{j} \}\cdot x_{i\ l+1} , &\forall l\in L | l < |L|.
\end{align}
$$

#### Naturaleza de las variables
La naturaleza de las variables es en este caso binaria.

$$
\begin{align}
    x_{i\ l} &\in \{0,1\}, &\forall i\in I,\ l\in L.
\end{align}
$$

#### Función Objetivo

El orden de la lista es descendiente según el promedio sobre los años de los activos de la persona asignada.

$$
      \min \sum_{i\in I}\sum_{l\in L}\left(l \cdot x_{i\ l} \cdot \sum_{j\in E_{i}}\frac{\sum_{t\in T|t\geq c_{j}}a_{j\ t}}{2021 - c_{j}}\right ).
$$

Alternativamente, puede plantearse la siguiene función objetivo:

$$
    \min \sum_{l\in L|l<|L|}\left(\sum_{i\in I}x_{i\ l+1} \cdot \sum_{j\in E_{i}}\frac{\sum_{t\in T|t\geq c_{j}}a_{j\ t}}{2021 - c_{j}} - \sum_{i\in I}x_{i\ l} \cdot \sum_{j\in E_{i}}\frac{\sum_{t\in T|t\geq c_{j}}a_{j\ t}}{2021 - c_{j}}\right ).
$$

## Formulación matemática completa


$$
\begin{align}
    I:& \text{ conjunto de empresas involucradas.}\\
    O:& \text{ conjunto de empresas }\textit{offshore.}\\
    P:& \text{ conjunto de paises eficientes en procesos de enjuiciamiento.}\\
    T:& \text{ conjunto de años desde la creación de la empresa más antigua hasta el 2021.}\\
    L:& \text{ conjunto de posiciones de la lista definitiva. } L = \{1,\cdots,100\}.
\end{align}
$$

$$
\begin{align}
    E_{i}:& \text{ conjunto de empresas relacionadas a la persona } i \in I.\\
\end{align}
$$

$$
\begin{align}
    c_{j}:& \text{ año de creación de la empresa } j\in O.\\
    a_{j\ t}:& \text{ activos financieros en cada año } t\in T \text{ de la empresa } j \in E \text{ tal que }t\geq c_{j}.\\
    p_{i}:& \text{ país de procedencia de la persona } i\in I.\\
    f_{i\ k}:& \text{ indicador binario de valor 1 si la persona } i\in I \text{ es familiar de la persona } k\in I\text{. 0 de lo contrario.}\\
    por:& \text{ porcentaje de personas en la lista cuyo país de origen pertenece al conjunto }P.
\end{align}
$$

$$
\begin{align}
    \sum_{i\in I}x_{i\ l} &= 1, &\forall l\in L.
\end{align}
$$

$$
\begin{align}
    \sum_{l\in L}x_{i\ l} &\leq 1, &\forall i\in I.
\end{align}
$$

$$
\begin{align}
    \sum_{i\in I|p_{i}\in P}\sum_{l\in L}x_{i\ l} &\geq por\% \cdot \sum_{i\in I}\sum_{l\in L}x_{i\ l}.
\end{align}
$$

$$
\begin{align}
    \sum_{k\in I}f_{i\ k} \cdot \sum_{l\in L}x_{i\ l} &\leq \sum_{k\in I}\sum_{l\in L}f_{i\ k} x_{k\ l} , &\forall i\in I.
\end{align}
$$

$$
\begin{align}
    \sum_{i\in I}\min_{j\in E_{i}}\{ c_{j} \}\cdot x_{i\ l} &\leq \sum_{i\in I}\min_{j\in E_{i}}\{ c_{j} \}\cdot x_{i\ l+1} , &\forall l\in L | l < |L|.
\end{align}
$$

$$
\begin{align}
    x_{i\ l} &\in \{0,1\}, &\forall i\in I,\ l\in L.
\end{align}
$$

$$
      \min \sum_{i\in I}\sum_{l\in L}\left(l \cdot x_{i\ l} \cdot \sum_{j\in E_{i}}\frac{\sum_{t\in T|t\geq c_{j}}a_{j\ t}}{2021 - c_{j}}\right ).
$$

## Implementación

Se resuelve el modelo planteado utilizando la librería de PulP en Python.

In [7]:
# Implemente en esta celda su formulación del problema
# se importa la libreria de PulP
import pulp as lp

#-----------------
# Conjuntos
#-----------------
# Personas involucradas
I = [ "Alfaima", "Juanfe", "Sofia", "Valentina" ]

# Empresas Offshore
O = [ ]

# Paises eficientes
P = [ ]

# Años desde la creación de la empresa más antigua
T = [ ]

# Posiciones en la lista
L = [i for i in range(1,101)]

#-----------------
# Subconjuntos
#-----------------
# Empresas relacionadas a la persona i en I
E = {i: [] for i in I}

#-----------------
# Parámetros
#-----------------
# Año de creación de la empresa j en O
c = {j: 0 for j in O}

# Activos de la empresa j en O para el año t en T tal que t >= c_j
a = {(j, t): 0 for j in O for t in T if t >= c[j]}

# Pais de origen de la persona i en I
p = {i: "" for i in I}

# 1 si la persona i en I es familiar de la persona k en K. 0 d.l.c.
f = {(i, k): 0 for i in I for k in I}

# porcentaje de personas en la lista cuyo país de origen debe pertenecer al conjunto P
por = 80

#-------------------------------------
# Creación del objeto problema en PuLP
#-------------------------------------
#Crea el problema para cargarlo con la instancia 
prob = lp.LpProblem("Listado-Panama-Papers", lp.const.LpMinimize)

#-----------------------------
# Variables de Decisión
#-----------------------------
x = lp.LpVariable.dicts('x',[(i, l) for i in I for l in L], cat = lp.const.LpBinary) #si la persona i en I es asignada a la lista en la posición l in L

#-----------------------------
# Función objetivo
#-----------------------------
# Crea la expresión que busca ordenar de forma ascendiente los activos promedios anuales.
prob += lp.lpSum(l * x[(i, l)] * lp.lpSum(a[(j, t)] * 1 / (2021 - c[j]) for j in E[i] for t in T if t >= c[j]) for i in I for l in L)

#-----------------------------
# Restricciones
#-----------------------------
# Expresión que solo permite a una persona por posición en la lista
for l in L:
    prob += lp.lpSum(x[(i, l)] for i in I) == 1

# Expresión que permite máximo una posición en la lista por persona
for i in I:
    prob += lp.lpSum(x[(i, l)] for l in L) <= 1
    
# El porcentaje de personas oriundas de paises pertenecientes a P asignadas a la lista debe ser mayor al 80%
prob += lp.lpSum(x[(i, l)] for i in I for l in L if p[i] in P) >= por/100 * lp.lpSum(x[(i, l)] for i in I for l in L)

# Si una persona se agrega a la lista, entonces todos sus familiares deben estar en la lista.
for i in I:
    prob += lp.lpSum(f[(i, k)] * lp.lpSum(x[(i, l)] for l in L) for k in I) <= lp.lpSum(f[(i, k)] * x[k, l] for k in I for l in L)

# El orden de la lista debe ser ascendiente según el año en que se creó la compañía más antigua relacionada con la persona asignada.
for l in L:
    if l < len(L):
        prob += lp.lpSum(min([c[j] for j in E[i]]) * x[i, l] for i in I) <= lp.lpSum(min([c[j] for j in E[i]]) * x[i, l + 1] for i in I)

#-----------------------------
# Invocar el optimizador
#-----------------------------
# Optimizar el modelo con CBC (default de PuLP)
prob.solve()

#-----------------------------
# Imprimir resultados
#-----------------------------
# Imprimir estado final del optimizador.
print(f"Estado (optimizador): {lp.LpStatus[prob.status]}")

# Imprimir la lista de personas a investigar.
for l in L:
    for i in I:
        if x[i, l].value() == 1:
            print(f"{l}: {i}")

ValueError: min() arg is an empty sequence

## Créditos

Equipo de Optimización<br>
Autor: Jorge Huertas, Alejandro Mantilla<br>
Edición: Alfaima Solano<br>
Instancias: Alejandro Mantilla<br>
Fecha: 05/05/2021