# Clase 32

Para una mejor visualización entrar al siguiente [link](https://nbviewer.jupyter.org/github/racsosabe/Miscelanea/blob/master/UPC/Clase%2031%20-%20Greedy%20II.ipynb)

**Nota:** La clase 31 fue upsolving del contest de Segment Tree.

# Requisitos Previos

* Matemática Básica
* Matemática Discreta

## Optimal Offline Caching

Consideremos que tenemos un caché que puede almacenar hasta $k$ elementos y una secuencia $d$ de $m$ accesos a elementos. Se define un *cache miss* o fallo de caché si al momento de solicitar el elemento $x$, este no se encuentra presente en el caché. En este caso, se debe tomar un elemento del caché y reemplazarlo con el elemento $x$ que estará en la memoria principal. Se define un *cache hit* o éxito de caché si al momento de solicitar el elemento $x$, este está en el caché.

Nuestro objetivo es plantear qué elementos deben ser reemplazados en cada unidad de tiempo para minimizar la cantidad de accesos a la memoria principal.

Definimos una **programación reducida** como una programación de inserciones al caché tal que un elemento solo es accedido en memoria principal cuando es solicitado (de ser necesario).

![Reduced 1](https://i.imgur.com/3hMEjtr.png)

**Afirmación:** Dada una programación no reducida $S$, podemos transformarla en una programación reducida $S'$ sin aumentar la cantidad de accesos a la memoria principal.

**Prueba:**

Consideremos que $S$ inserta en el caché al elemento $d$ en el tiempo $t$ **sin haber sido solicitado**. Sea $c$ el elemento que fue reemplazado por $d$ cuando este se insertó, entonces tenemos 2 posibles casos:

1) $d$ es reemplazado por un elemento $e$ en el tiempo $t'$: La cantidad de accesos a memoria principal de $S$ es 1 mayor que de $S'$ (para reemplazar $d$ por $e$ debemos acceder a $e$ en la memoria principal).

2) $d$ es solicitado en el tiempo $t'$: La cantidad de accesos a memoria principal de $S$ y $S'$ son iguales.

![Reduced 2](https://i.imgur.com/l7iml3R.png)

Lo anterior nos da la idea de que la programación óptima siempre es reducida.

### Farthest-in-Future

El esquema *farthest-in-future* nos propone reemplazar aquél elemento que será solicitado en el futuro más lejano de entre todos los presentes en el caché.

**Teorema:** El esquema *farthest-in-future* nos da una respuesta óptima.

**Prueba:** [A study of replacement algorithms for a virtual-storage computer](https://sci-hub.tw/https://doi.org/10.1147/sj.52.0078)

### Problema para implementar

- [Introspective Caching](https://onlinejudge.org/index.php?option=com_onlinejudge&Itemid=8&page=show_problem&problem=2599)

## Regla de Johnson

Consideremos que tenemos 2 máquinas y $n$ trabajos que se deben procesar **$a_{i}$ minutos en la primera máquina y luego de eso $b_{i}$ minutos en la segunda máquina**. Se nos pide determinar un ordenamiento para procesarlas con la finalidad de reducir la cantidad de tiempo total.

Una primera observación que podemos hacer es intentar que los trabajos en la primera máquina sean realizados sin tiempo de espera.

Plantearemos un primer lema que nos ayude a plantear un ordenamiento:

**Lema:** Se puede usar el mismo ordenamiento $p$ para ambas máquinas sin aumentar el tiempo total.

**Prueba:**

Consideremos la permutación $p_{1}$ aplicada a los trabajos en la primera máquina y $p_{2}$ aplicada a los trabajos en la segunda. Podemos definir una **inversión** a un par $(i, j)$ tal que:

$$ ord_{p_{1}}(i) > ord_{p_{1}}(j) \text{ y } ord_{p_{2}}(i) < ord_{p_{2}}(j) $$

Donde $ord_{p}(x)$ es igual a la posición $pos$ tal que $p_{pos} = x$.

En términos simples, es un par de posiciones tales que en la primera máquina se procesa $j$ antes que $i$, pero en la segunda se procesa $i$ antes que $j$.

Sean $L_{X}(i)$ y $R_{X}(i)$ los tiempos de inicio y fin del procesamiento del trabajo $i$ en la máquina $X$, entonces si $ord_{p_{1}}(i) > ord_{p_{1}}(j)$ se debe cumplir que $R_{A}(j) \leq L_{A}(i)$, mientras que si $ ord_{p_{2}}(i) < ord_{p_{2}}(j)$ se debe cumplir que $R_{B}(i) \leq L_{B}(j)$.

Consideremos que $OPT$ es un par de permutaciones $p_{1}'$ y $p_{2}'$ que son ordenamientos óptimos y al mismo tiempo tienen la mínima cantidad positiva de inversiones posible.

Notemos que si existe al menos una inversión, entonces existe una posición $i$ tal que $(p_{2}'(i - 1), p_{2}'(i))$ es una inversión; por lo tanto se debe cumplir que:

$$ ord_{p_{1}}(p_{2}'(i - 1)) > ord_{p_{1}}(p_{2}'(i)) $$

Lo que implica que:

$$ R_{A}'(p_{2}'(i)) \leq L_{A}'(p_{2}'(i - 1)) \text{ y } R_{B}'(p_{2}'(i - 1)) \leq L_{B}'(p_{2}'(i)) $$

Sin embargo, ya que $i$ debe terminarse de procesar en $A$ antes de empezar a ser procesado en $B$, se cumple que:

$$ R_{A}'(p_{2}'(i - 1)) \leq L_{B}'(p_{2}'(i)) $$

Ya que 

$$ R_{A}'(p_{2}(i)) \leq L_{A}'(p_{2}(i - 1)) \leq R_{A}'(p_{2}(i - 1)) \leq L_{B}'(p_{2}(i - 1)) $$

y

$$ R_{A}'(p_{2}(i - 1)) \leq L_{B}'(p_{2}(i - 1)) \leq R_{B}'(p_{2}(i - 1)) \leq L_{B}'(p_{2}(i)) $$

Podemos realizar un swap entre las posiciones $(i - 1, i)$ en la permutación $p_{2}$ y notamos que dicho cambio es válido y no generará mayor tiempo total (la suma de los tiempos es $t_{p_{2}(i - 1)} + t_{p_{2}(i)}$ de todas formas).

Lo anterior nos permite concluir que podemos reducir la cantidad de inversiones en $1$ y aún así mantener la respuesta como óptima, lo cual es una contradicción respecto a que $r$ exista.

Podemos usar un argumento similar para cambiar la permutación $p_{1}'$ y obtener otra respuesta óptima con menos inversiones, por lo que concluimos que existe una solución óptima con 0 inversiones, lo cual implica que ambas permutaciones son iguales.

Ahora nuestro problema se ha reducido a encontrar un ordenamiento para ambas máquinas.

Se puede probar ([Pueden ver el razonamiento aquí](https://www.rand.org/content/dam/rand/pubs/papers/2008/P402.pdf)) que si ordenamos los trabajos por $\min(a_{i}, b_{i})$, podemos usar el siguiente algoritmo para obtener el ordenamiento óptimo final:

```C++
vector<int> order(n);
iota(order.begin(), order.end(), 0);
sort(order.begin(), order.end(), [&] (int i, int j){
    return min(a[i], b[i]) < min(a[j], b[j]);
});
vector<int> p(n);
int l = 0, r = n - 1;
for(auto e : order){
    if(a[e] <= b[e]) p[l++] = e;
    else p[r--] = e;
}
```

## Exchange Arguments

La técnica de **exchange arguments** se suele usar para probar un determinado ordenamiento óptimo de un conjunto de datos. La estrategia que se usa es la siguiente:

1. Definir un ordenamiento para los elementos a considerar. Este paso suele estar precedido por analizar la naturaleza de la solución de manera adecuada.

2. Probar que el ordenamiento es no es sub-óptimo para un par de elementos, es decir, que si tengo los elementos $a$ y $b$, entonces el colocar $a$ antes que $b$ no es peor que colocar a $b$ antes que a $a$ según nuestro comparador $\preceq$

3. Se puede probar por Principio del Buen Orden que existe una solución óptima con $0$ inversiones respecto a $preceq$.

### Problemas para resolver en clase

- [Pieces of Parentheses](https://open.kattis.com/problems/piecesofparentheses)
- [Installing Apps](https://open.kattis.com/problems/installingapps)
- [Zabuton](https://atcoder.jp/contests/cf17-final/tasks/cf17_final_d)
- [Complete the Projects (hard version)](https://codeforces.com/contest/1203/problem/F2)
- [Tower](https://atcoder.jp/contests/dp/tasks/dp_x)
- [Zadanie Bohater](https://szkopul.edu.pl/problemset/problem/ULukIWoWps4jlJ2iCQTqGczV/site/?key=statement)