In [4]:
import cvxpy as cp
import numpy as np
import pandas as pd
import mosek
import matplotlib.pyplot as plt
import matplotlib.cm as cm
import time
import networkx as nx
import random


from typing import Tuple
from itertools import product

## Questão 1: Arranha-céus!

### a)

### b)

### c)

\begin{align*}
    \text{Encontrar }   & x_{ijk} \hspace{20pt} \text{(Alocar o número } k \text{ à posição } (i,j) \text{ do tabuleiro)}\\
    \text{sujeito a }   & \sum_{k} x_{ijk} = 1 \quad \forall  i,j  \hspace{20pt} \text{(Alocar apenas um número em cada casa)} \\
                        & \sum_{i} x_{ijk} = 1 \quad \forall  j,k  \hspace{20pt} \text{(Apenas um número em cada coluna)} \\
                        & \sum_{j} x_{ijk} = 1 \quad \forall  i,k  \hspace{20pt} \text{(Apenas um número em cada linha)} \\
                        & 0 \leq \sum_k( x_{ik} - x_{lk} ) \leq ny_{im} \quad \forall i \in r_m; \: \forall l \in 1,...,i-1; \: \forall r_m \in R \\
                        & x_{ijk} = 1 \quad \forall i,j,k: \: \text{board}(i,j) = k \hspace{20pt} \text{(Fixar valores do tabuleiro inicial)}\\
                        & x_{ijk}\in \mathbb{B} \quad \forall  i,j,k \in 0,...,n  \hspace{20pt} \text{(Variáveis de decisão binárias - alturas dos prédios)} \\
                        & y_{lm} \in \mathbb{B} \quad \forall  l\in 0,...,n; \: \forall m \in R \hspace{20pt} \text{(Variáveis auxiliares - indicatrizes de visibilidade)} \\
                        & \\
    \text{onde }        & R \text{ é o conjunto de fileiras onde há restrição de visão, e } r_i \text{ é o conjunto de casas da i-ésima fileira, ordenadas à partir de seu início.}
\end{align*}

No modelo acima, é importante ressaltar que os índices $l$ das variáveis de visibilidade indexam as casas do tabuleiro em uma dada fileira, _na ordem definida pela fileira_. Ou seja, os índices $l$ podem  indexar as casas na ordem inversa da indexação do tabuleiro, se a restrição de visibilidade for dada à partir da direita ou do lado de baixo do tabuleiro.

In [5]:
def SolveSkyscraper(board:np.ndarray, sightlines:list[tuple]) -> np.ndarray:
    """

    Args:
        board (np.ndarray): A square array filled with one digit integers. Cells with a zero correpsond to empty cells.
        sightlines (np.ndarray): A list containing the information for the sightline constraints. 
                                 Each entry is a tuple where the first item is the number of visible highrises from the 
                                 observation point, and the second item is an ordered list of the cells composing the sightline. 

    Returns:
        np.ndarray: An array containing the height of each cell in the board.
    """

    boardSize = len(board[:,0])
    digits = range(boardSize)
    nbSightlines = len(sightlines)
    # sightlineConstraints = sightlines[:, 0]
    # sightlineCells = sightlines[:, 1]

    # decision variables
    decisionVars = np.empty((boardSize, boardSize, boardSize), dtype=object)
    for i in digits:
        for j in digits:
            for k in digits:
                decisionVars[i,j,k] = cp.Variable(boolean=True, name=f"x_{i}{j}{k}")
    
    sightlineConstraints = []

    for sightline in sightlines:
        direction = sightline[0]
        rowOrColumn = sightline[1]
        sightlineCounters = cp.Variable(boardSize, boolean=True, name='y_'+direction+rowOrColumn)
        match direction:
            case 'u':
                for i in range(boardSize):
                    sightlineConstraints += [0 <= cp.sum(decisionVars[i, rowOrColumn, :])]
                    sightlineConstraints += [cp.sum(decisionVars[i, rowOrColumn, :]) <= boardSize*sightlineCounters[i]]
            case 'd':
                for i in reversed(range(boardSize)):
                    sightlineConstraints += [0 <= cp.sum(decisionVars[i, rowOrColumn, :])]
                    sightlineConstraints += [cp.sum(decisionVars[i, rowOrColumn, :]) <= boardSize*sightlineCounters[i]]
                pass
            case 'l':
                pass
            case 'r':
                pass
        


    sightlineCounters = np.empty((nbSightlines, boardSize), dtype=object)
    for l in digits:
        for m in nbSightlines:
            sightlineCounters[l,m] = cp.Variable(boolean=True, name=f"y_{l}{m}")

    # constraints
    constraints = []
    # one single value per cell
    for i in digits:
        for j in digits:
            constraints += [np.sum(decisionVars[i,j,:]) == 1]

    # uniqueness in every column
    for j in digits:
        for k in digits:
            constraints += [np.sum(decisionVars[:,j,k]) == 1]
    
    # uniqueness in every row
    for i in digits:
        for k in digits:
            constraints += [np.sum(decisionVars[i,:,k]) == 1]

    # initial board values 
    for i in digits:
        for j in digits:
            boardValue = board[i,j]
            if boardValue != 0:
                constraints.append(decisionVars[i, j, board[i,j] - 1] == 1)

    objective = cp.Minimize(0)

    lp = cp.Problem(objective, constraints)
    lp.solve(solver="MOSEK", verbose=False)

    return decisionVars

sightlineConstraints = sightlines[:, 0]
sightlineCells = sightlines[:, 1]

NameError: name 'sightlines' is not defined

## Questão 2: Plantação de tomates!

### a) Estratégia gulosa
A estratégia gulosa funciona para o exemplo simples onde o jardim é dado por

| 5 | 3 | 5 |

Um contra exemplo à essa estratégia é o jardim 

| 3 | 5 | 3 |

Nesse último caso, a estratégia gulosa nos dá uma delicioncisade total de 5, sendo que o ótimo é na realidade 6.

### b)

Para um problema de tamanho $n$, podemos escrever a sua solução ótima em termos de soluções ótimas de problemas menores. Preenchendo o jardim da esquerda para a direita (onde indexamos a primeira casa por $0$ e a última por $n$), temos que a solução de tamanho $S_n$ pode ser escrita como 

$$ S_n = \max\{S_{n-1},\, S_{n-2} + T_n\} $$

Isso pode ser interpretado como o máximo dentre duas opções possíveis: 

1) Não plantar um tomate na última casa, pois a penúltima já contém um tomate
2) Plantar um tomate na última casa, ao custo de não ter um tomate plantado na penúltima casa, para manter a solução factível

Teremos também dois casos base para a recursão, sendo eles $S_1 = T_1$ e $S_2 = \max\{ T_1,\, T_2 \}$.

Esse no entanto não é o método mais eficiente de se implementar a resolução do problema. Podemos usar as técnicas de programação dinâmica vistas em aula para calcular as soluções de cada subproblema de forma iterativa, evitando o recálculo de soluções. Como as soluções são indexadas por apenas uma variável (o tamanho do jardim), podemos criar um algoritmo de complexidade O(n) para resolver esse problema, calculando iterativamente as soluções $S_n,\: n>2$ a partir de $S_1$ e $S_2$.

### c) Programa linear

\begin{align*}
    \text{Maximizar }   & \sum_{i=1}^{n} T_i x_i \hspace{20pt} \text{(Deliciosidade total)}\\
    \text{sujeito a }   & \; x_i + x_{i+1} \leq 1 \quad \forall i \in \{1,..., n-1\}  \hspace{20pt} \text{(Não plantar dois tomates em casas adjacentes)} \\
                        & x_{i}\in \mathbb{B} \quad \forall  i  \hspace{20pt} \text{(Variáveis de decisão binárias - plantar ou não plantar tomate em cada casa)} \\
                        & T_{i}\in \mathbb{Z} \quad \forall  i  \hspace{20pt} \text{(Deliciosidades inteiras e positivas)} \\
\end{align*}

### d)



In [None]:
def TomatoLinearProgram(deliciousnessMap:np.ndarray):
    
    probSize = len(deliciousnessMap)

    # decision variables
    decisionVars = cp.Variable(probSize, boolean=True, name="stop")

    # constraints
    constraints = []
    # no adjacent tomatoes
    for i in range(probSize-1):
        constraints += [decisionVars[i] + decisionVars[i+1] <= 1]

    objective = cp.Maximize(decisionVars @ deliciousnessMap)

    # solving 
    lp = cp.Problem(objective, constraints)
    lp.solve(solver="MOSEK", verbose=False)

    # printing solution
    print("Solution: ", decisionVars.value)
    print("Objective: ", lp.value)
    
    return 


def TomatoRecursion(deliciousnessMap:np.ndarray) -> np.ndarray:

    # base cases
    if len(deliciousnessMap) == 1:
        return deliciousnessMap[0]
    elif len(deliciousnessMap) == 2:
        return max(deliciousnessMap[0], deliciousnessMap[1])
    # recursion relation
    else:
        return max(TomatoRecursion(deliciousnessMap[:-1]), TomatoRecursion(deliciousnessMap[:-2]) + deliciousnessMap[-1])


def TomatoIteration(deliciousnessMap:np.ndarray) -> np.ndarray:
    
    probSize = len(deliciousnessMap)
    solutions = np.zeros(probSize)

    # base cases
    solutions[0] = deliciousnessMap[0]
    solutions[1] = max(deliciousnessMap[0], deliciousnessMap[1])
    
    # building new solutions based on previous known solutions
    for i in range(2, probSize):
        solutions[i] = max(solutions[i-1], solutions[i-2] + deliciousnessMap[i])
        
    return solutions


deliciousnessMap1 = [5, 12, 10, 7, 15, 10, 11, 5, 8, 10]
deliciousnessMap2 = [10, 12, 5, 12, 20, 18, 5, 3, 2, 8]

testCase = deliciousnessMap1

print("Recursive solution: ", TomatoRecursion(testCase))
print()
print("Iterative solution: ", TomatoIteration(testCase)[-1])
print()
print("Linear programming solution: ")
TomatoLinearProgram(testCase)

Recursive solution:  51

Iterative solution:  51.0

Linear programming solution: 
Solution:  [1. 0. 1. 0. 1. 0. 1. 0. 0. 1.]
Objective:  51.0


## Questão 3: Dois problemas fundamentais em grafos bipartidos

### a)

Seja $G(V, E)$ um grafo qualquer. Por definição cada aresta pertencente a um emparelhamento qualquer $Y$ está relacionada a dois nós, distintos dos nós de qualquer outra aresta de $Y$. Podemos estão escolher, para cada aresta do emparelhamento, um de seus nós. Esse novo conjunto de nós $S$ cobre todas as arestas de $Y$, mas não todas as arestas de $G$, pois $Y \subseteq E$. No caso específico que $Y = E$, esse procedimento nos dá a cobertura mínima do grafo, e então $|Y| = |S|$, porém no caso mais geral precisaremos de nós adicionais em $S$ para que esse conjunto cubra as arestas que não pertencem a $Y$, e portanto $|Y| \leq |S|$.

Esse raciocínio pode ser aplicado a qualquer emparelhamento e cobertura, e portanto inclui também o emparelhamento máximo e a cobertura mínima de $G$.

### b) Emparelhamento máximo

\begin{align*}
    \text{Maximizar }   & \sum_{(i,j)\in E} x_{ij} \hspace{20pt} \text{(Maximizar conjunto de emparalhamento)}\\
    \text{sujeito a }   & \sum_{j} x_{ij} \leq 1 \quad \forall i \in V  \hspace{20pt} \text{(No máximo uma aresta associada a um vértice }i\text{)} \\
                        & x_{ij}\in \mathbb{B} \quad \forall  (i,j)\in E  \hspace{20pt} \text{(Variáveis de decisão binárias)} \\
                                                & \\
    \text{onde }        & G(V,E) \text{ é um grafo com conjunto de nós } V \text{e conjunto de arestas } E     
\end{align*}

Como o problema é definido em um grafo não direcionado, temos a relação $x_{ij} = x_{ji}$. Isso nos garante uma relação 1-1 na atribuição de arestas entre nós (cada nó tem apenas uma aresta entrando/saindo dele), uma característica necessária no problema de atribuição clássico. Vemos assim que esse problema corresponde a um conjunto de instâncias específicas do problema de atribuição, onde os custos de atribuição são todos iguais a $1$. Como visto em aula, a matriz de restrições do problema de atribuição é totalmente unimodular, e portanto sabemos que a solução do problema relaxado é a mesma do problema com retrição de integralidade.  

### c) Cobertura mínima

\begin{align*}
    \text{Minimizar }   & \sum_{i\in V} x_{i} \hspace{20pt} \text{(Minimizar conjunto de cobertura)}\\
    \text{sujeito a }   & \; x_{i} + x_{j} >= 1 \quad \forall (i,j) \in E  \hspace{20pt} \text{(Toda aresta possui um de seus nós na cobertura} \\
                        & x_{i}\in \mathbb{B} \quad \forall  i\in V  \hspace{20pt} \text{(Variáveis de decisão binárias)} \\
                        & \\
    \text{onde }        & G(V,E) \text{ é um grafo com conjunto de nós } V \text{e conjunto de arestas } E             
\end{align*}

A matriz de restrições do problema de cobertura mínima é dada por uma matriz $M \in \mathbb{R}^{|E|\times|V|}$, cujas entradas não-nulas são todas iguais a $1$. Além disso, toda linha dessa matriz possui apenas dois elementos não-nulos e iguais a $1$. Dessa forma, vemos que a matriz transposta $M^T$ atende as duas condições suficientes para unimoduaridade total:

1) Todos os seus elementos pertencem ao conjunto $\{-1,0,1\}$
2) Cada coluna possui no máximo dois coeficientes não-nulos
3) Podemos particionar as suas linhas em dois conjuntos de forma que, para cada coluna, a diferença da soma dos elementos de cada partição é nula. 

As condições 1 e 2 vêm diretamente da construção da matriz de restrições do problema. A propriedade 3 é válida pois cada coluna nesse caso possui _exatamente_ dois elementos não nulos e iguais a $1$, bastando assim ordenar as linhas de $M^T$ de forma a deixar sempre esses elementos em partições distintas. Finalmente, sabemos que se $M^T$ é totalmente unimodular, então sua transposta $M$ também é, e podemos concluir então que a solução ótima do problema relaxado corresponde àquela do problema com restrições de integralidade. 


### d)

Para provar a relação de dualidade entre os dois problemas, podemos seguir os passos vistos em aula para o problema de atribuição. Sabemos que para um problema linear na forma padrão, temos a relação de dualidade:

$$ \begin{array}{rl}
    \text{Minimizar} & f^Tx \\
    \text{sujeito a} & Ax = b \\
                    & x \geq 0
\end{array}
\quad \implies \quad
\begin{array}{rl}
    \text{Maximizar} & b^T\lambda \\
    \text{sujeito a} & A^T\lambda \leq f \\
    &
\end{array} $$


Tomando o problema de cobertura mínima como prmial, criamos então um conjunto de variáveis de folga $s_{ij},\: (i,j)\in E$, cada uma associada a uma das restrições de desigualdade do problema primal. Com isso, podemos escrever o problema primal em sua forma padrão:





\begin{align*}
    \text{Minimizar }   & \sum_{i\in V} x_{i} \\
    \text{sujeito a }   & \; x_{i} + x_{j} - s_{ij} = 1 \quad \forall (i,j) \in E  \\
                        & x_{i}, s_{ij}\in \mathbb{B} \quad \forall  i\in V \\         
\end{align*}


Fazendo o paralelo com a formulação padrão, temos os vetores $f=[1,...,1,0,...,0]\in \mathbb{R}^{|V|+|E|}$,  $b=[1,...,1]\in \mathbb{R}^{|E|}$, e $A \in \mathbb{R}^{(|V|+|E|)\times |E|}$ uma matriz totalmente unimodular (a adição de uma linha com coeficientes $-1$ das variáveis de folga não altera a unimodularidade de $A$).

Como temos uma restrição para cada aresta no caso primal, as variáveis de decisão do problema dual podem ser indexadas em função das arestas. O vetor $\lambda$ tem então dimensão $|E|$, compatível com a multiplicação matricial com $A^T$. Os elementos não-nulos de $A^T$




É importante notar que a relação de $u_i$ com os nós do grafo não é necessariamente direta. Sabemos que o número de variáveis $u_i$ é igual ao número de nós

Por fim, como consequência da unimodularidade total de $A$, temos uma relação de dualidade forte para os problemas de cobertura mínima e emparelhamento máximo, mostrando que o tamanho das soluções ótimas de ambos é igual.

## Questão 4: O Princípio da Casa dos Pombos

### a)

### b)

### c)



## Questão 5: Pudim, o pinguim comilão.

### a)

O problema só é factível se não houver nenhum segmento da viagem de comprimento maior de que $m$, a distância máxima que Pudim pode viajar sem comer. Mais formalmente, o problema é factível somente se $F_i - F_{i-1} \leq m \quad \forall i \in \{ 2,...,n \}$.

### b)

\begin{align*}
    \text{Minimizar }   & \sum_{i=1}^{n} x_i \hspace{20pt} \text{(Total de paradas realizadas)}\\
    \text{sujeito a }   & \sum_{i\in Cj}x_i \geq  1 \quad \forall j \in \{1,..., n\}  \hspace{20pt} \text{(Toda parada possui uma parada anterior dentro do alcance máximo)} \\
                        & x_{i}\in \mathbb{B} \quad \forall  i  \hspace{20pt} \text{(Variáveis de decisão binárias - parar ou não no buraco de pesca)} \\
                        & F_{i}\in \mathbb{Z} \quad \forall  i  \hspace{20pt} \text{(Distâncias inteiras e positivas)} \\
                        & \\
    \text{onde }   & Cj \equiv \{ i:\, F_j - F_i <= m \} \hspace{20pt} \text{(Conjunto de paradas anteriores a } j \text{ a uma distância menor que } m\text{)}
\end{align*}

É importante ressaltar que, na modelagem acima, uma instância infactível do problema em teoria não gerará um modelo linear infactível. A infactibilidade do modelo no solver se dá devido à adição de uma restrição onde a soma de um conjunto vazio de variáveis de decisão deve ser maior ou igual a $1$ (em uma instância infactível, pelo menos um dos conjuntos $C_j$ é vazio). No entanto, isso poderia também ser interpretado matematicamente como uma restrição vazia, então algum cuidado deve ser tomado na interepretação dos resultados em função da implementação usada.

### c)

Seja $S(i)$ a solução ótima para o percurso até a parada $i$ ($S_i$ é o conjunto dos pontos de parada utilizados), sendo então o conjunto de paradas restantes do trajeto $R = \{ i+1,..,n \}$. Provaremos por absurdo que a escolha gulosa é a melhor escolha para o próximo passo da indução. Se a escolha gulosa é dada pela parada $k\in R$, mas ela não minimiza $|S(k)|$, então temos duas alternativas:

1) Existe algum $k'>k$ ao alcance de Pudim quando este está em $i$. Nesse caso, temos um absurdo pois a escolha gulosa implica em selecionar a última parada factível à partir de $i$.
2) A suposta solução melhor que a gulosa envolve algum $k' < k$. Como $k$ está ao alcance de Pudim em $i$, então podemos pular $k'$ e continuar com o mesmo número de paradas. 

Logo, se $S(i)$ é a solução ótima para $\{1,...,i\}$, então $S(k)$ dada pela estratégia gulosa é a solução ótima para $\{1,...,i,...,k\}$. O caso base da indução é dado por $S(1) = \{0\}$, o ponto de início da viagem.  

[talvez seja necessário usar indução completa sobre todas as paradas ao alcance de pudim em $i$, ao invés do raciocínio acima ?] 

In [6]:
# problem input
F = [0, 3, 4, 6, 10, 12]
m = 4

# decision variables
decisionVars = cp.Variable(len(F), boolean=True, name="stop")

# constraints
constraints = []

# creating list of valid previous stops for each stop in the journey
allValidStops = []
for i in range(1, len(F)):
    validStops = []
    for j in range(i-1, -1, -1):
        if F[i] - F[j] <= m:
            validStops += [j]
    allValidStops.append(validStops)

# all stops must have at least one previous valid stop
for i in range(len(F)-1):
    constraints += [cp.sum(decisionVars[allValidStops[i]]) >= 1]

# start and end of the journey
constraints += [decisionVars[-1] == 1]
constraints += [decisionVars[0] == 1]

objective = cp.Minimize(cp.sum(decisionVars))

# solving 
lp = cp.Problem(objective, constraints)
lp.solve(solver="MOSEK", verbose=False)

# printing model and solution
print(lp)
print()
print("Solução: ", decisionVars.value)

minimize Sum(stop, None, False)
subject to 1.0 <= Sum(stop[0], None, False)
           1.0 <= Sum(stop[1, 0], None, False)
           1.0 <= Sum(stop[2, 1], None, False)
           1.0 <= Sum(stop[3], None, False)
           1.0 <= Sum(stop[4], None, False)
           stop[5] == 1.0
           stop[0] == 1.0

Solução:  [1. 0. 1. 1. 1. 1.]
