# Programación Dinámica

## Conocimientos Previos

- Recursión: Recordar que una recursión es una función que se llama a sí misma para procesar una solución, de forma que al menos uno de sus parámetros se acerque a un caso trivial (base).

- Backtracking: Recordar que el Backtracking es una forma de Búsqueda Completa que usa recursión para atravesar todos los posibles estados de un problema, pero usando criterios de corte para no analizar casos que no tienen sentido o beneficio para nuestras soluciones.

## Definición

**Programación Dinámica** es una técnica para diseñar algoritmos, basada en la propiedad de subestructura óptima, cuyo fin es optimizar la complejidad temporal de un algoritmo aumentando la complejidad espacial de este, aprovechando que el espacio de búsqueda es lo suficientemente pequeño de acuerdo a lo necesitado. Por lo general se usa para resolver problemas de optimización: maximizar o minimizar una función en base a determinadas restricciones.

### ¿Qué se entiende por subestructura óptima?

La subestructura óptima se puede ver como que la solución de la transición de un estado hacia otros (recordemos que se forma un Grafo Dirigido Acíclico) tiene un valor asociado $f(u,v)$ (valor asociado de ir del estado $u$ al estado $v$), entonces para cualquier punto $i$ en el camino desde $u$ hasta $v$ se da que $f(u,i)$ es la solución óptima (depende del problema), al igual que $f(i,v)$.

Para analizarlo mejor, veamos un ejemplo:

#### Camino simple más corto de un nodo a otro

El problema clásico del camino más corto de un nodo $u$ a un nodo $v$ presenta subestructura óptima, puesto que si definimos $f(a,b)$ como la longitud del camino más corto del nodo $a$ a $b$, notaremos que para cada $i$ en el camino entre $a$ y $b$ se tiene que dar que:

$$ f(u,i) = \min\limits_{i\text{ esta en el camino u}\leadsto v}{w(u,p_{1},p_{2},\ldots,p_{k},i)} $$

Donde $w(u,p_{1},p_{2},\ldots,p_{k},i)$ es la función que calcula la longitud del camino $a\leadsto p_{1} \leadsto \cdots \leadsto i $.

Es sencillo notar que:

$$ f(u,v) = f(u,i) + f(i,v) $$

Esto es verdadero por el simple hecho de que para cualquier camino $(u,\ldots,y,\ldots,v)$ se dará que:

$$ f(u,y) + f(y,b) \leq w(u,\ldots,y) + w(y,\ldots,v) $$

Llegando a que deben ser ambos subcaminos los más cortos para que el camino en sí también lo sea.

#### Camino simple más largo de un nodo a otro

Ahora la pregunta es ¿El camino simple más largo tiene subestructura óptima? La respuesta es no, analicemos el siguiente ejemplo:

![](pictures/Grafo1.png)

Notemos que el camino simple más largo de $a$ a $d$ tiene longitud 2, siendo alguno de estos: 

$$ a \leadsto b \leadsto d \vee a \leadsto c \leadsto d $$

Sin embargo, el camino más largo de $a$ a $b$ es:

$$ a \leadsto c \leadsto d \leadsto b $$

Que tiene longitud 3, por lo que:

$$ f(a,d) \neq f(a,b) + f(b,d) $$

Concluyendo que no tiene subestructura óptima.

## Almacenamiento

En la definición, señalamos que la Programación Dinámica (DP a partir de ahora) utiliza memoria por obtener mejor resultado en tiempo, ahora veremos un ejemplo para reconocer por qué se da esto.

Recordemos el problema de hallar el $n$-ésimo número de la sucesión de Fibonacci:

$$ F(n) = F(n-1) + F(n-2) $$

Si recordamos el arbol de recurrencia que se forma, notaremos que tiene una complejidad exponencial $O(\phi^{n})$. Pero es sencillo ver que hay valores $F(i)$ intermedios que siempre se repiten, por lo que repetimos cálculos innecesariamente. La solución a esto es el **Almacenamiento (*Memoization*)**.

Gracias al almacenamiento, nos basta almacenar un valor *dummy* inicial, que señale que la respuesta para este estado aun no ha sido procesada para ejecutar la solución; y en el caso que sí lo esté, devuelva la solución ya calculada.

Siendo esto así, marcamos los valores que evitaríamos volver a calcular para el caso $F(6)$

![](pictures/FiboGraph.png)

Los cuadrados señalan los estados que fueron visitados cuando ya se tenia la respuesta almacenada, por lo que simplemente se devolvieron sus soluciones, optimizando la solución del problema.

Las complejidades en los problemas que usan DP son calculadas de la siguiente manera, lo cual es muy lógico si recordamos que la estructura es un DAG:

$$ T(DP) = T(\text{Cantidad de estados})\cdot T(\text{Procesamiento por estado}) $$

En el caso de fibonacci obtendríamos algo de la siguiente manera:

```Cpp
long long f(int n){
    if(n <= 1) return n;
    if(F[n]!=dummy) return F[n];
    return F[n] = f(n-1)+f(n-2);
}
```

Donde el valor de $dummy$ es constante y por lo general un valor absurdo para la solución. Además $F[n]$ es un arreglo global donde se almacenarán las soluciones para cada estado (en este caso $fibo(n)$).

## Tipos de Programación Dinámica

Hay dos tipos de DP: Iterativo y Recursivo. Cada uno de estos métodos tiene sus ventajas y desventajas, y se deben aprovechar según convenga en el problema.

### DP Recursivo

El DP Recursivo es la versión más simple de DP, puesto que basta con tomar un Backtracking con elementos fácilmente asociables a una DAT(*Direct Access Table*, la mayoria de veces es un arreglo) o Estructura de Datos eficiente y aplicar el método de Almacenamiento (como vimos en el Fibonacci anterior). Un ejemplo para este tipo de problemas es el clásico **Problema de la Mochila 0-1**.

La estrategia que plantea el DP recursivo es tomar un estado, procesar toda su solución y luego almacenar este resultado para que sea re utilizado por algún otro estado, probando que siempre será posible realizar este procedimiento sin problemas.

#### Problema de la Mochila 0-1

La estructura de Backtracking para que el Problema de la Mochila sea resuelto con una función que devuelva la máxima ganancia que se puede obtener sería algo así:

```Cpp
long long Knapsack(int pos, int left){
    if(pos == n){
        return 0; // Aca termina todo, devolvemos 0
    }
    if(w[pos] <= left){ // Si podemos tomar
        return max(v[pos]+Knapsack(pos+1,left-w[pos]),Knapsack(pos+1,left)); // Maximizamos
    }
    else return Knapsack(pos+1,left); // Unica opcion
}
```

Este algoritmo itera sobre todas las posibilidades válidas del problema, además sus parámetros son valores fácilmente asociables a una DAT (pueden ser usados como los índices de una matriz) y lo más importante de todo: Es fácil de pensar y sencilla de programar.

Ahora, debemos agregar solamente 1 paso a esta función para que se vuelva un DP recursivo: Almacenamiento, considerando que guardaremos las respuestas en una tabla $memo$ de $n\times C$ (para todas las posiciones posibles y capacidades posibles).

```Cpp
long long DPKnapsack(int pos, int left){
    if(pos == n){
        return 0;
    }
    if(memo[pos][left]!=dummy) return memo[pos][left];
    if(w[pos] <= left){
        return memo[pos][left] = max(v[pos]+DPKnapsack(pos+1,left-w[pos]),DPKnapsack(pos+1,left));
    }
    else{
        return memo[pos][left] = DPKnapsack(pos+1,left);
    }
}
```

Así logramos reducir una complejidad exponencial de $O(2^{n})$ a $O(nC)$. La respuesta nos la dará $DPKnapsack(0,C)$.

### DP Iterativo

El DP Iterativo es la versión un poco más complicada de pensar de manera directa, pero es igual de sencilla una vez se tiene suficiente experiencia con "invertir" el DP recursivo.

La estrategia para realizar un DP iterativo es pensar en que el orden correcto para resolver el problema es:

1) Casos base: Una vez que se logran formar sus soluciones podemos construir las demás

2) Espacio de búsqueda no trivial: No son casos base, pero servirán para formar respuestas de estados posteriores

Básicamente, llenaremos los casos base del problema en la tabla del DP, para luego construir las soluciones de los demás estados mediante iteraciones.

Veremos uno de los clásicos ejemplos para el DP Iterativo

#### Longest Increasing Subsequence

El problema de la Subsecuencia Creciente Más Larga nos da una secuencia $A = \{a_{1},a_{2},\ldots,a_{n}\}$ y nos pide como respuesta $|LIS|$, donde $LIS = \{a_{i_{1}},a_{i_{2}},\ldots,a_{i_{k}}\}$ tal que:

$$ i_{j} < i_{k} \forall j < k \wedge a_{i_{j}} < a_{i_{k}} \forall j < k $$

Y además $|LIS|$ es la máxima posible de entre todas las posibles.

Notemos que un algoritmo de Búsqueda Completa analizaría todas las subsecuencias posibles, siendo su complejidad estimada de $O(2^{n})$, intentaremos mejorar esta perspectiva.

Primero definamos la tabla de DP y sus parámetros, probemos:

$$ memo[i] = \text{Tamaño de la LIS que termina tomando el elemento de posición i} $$

Claramente, un caso base es la posición $i=0$, pues la única opción que tiene es tomar solo ese elemento, teniendo como respuesta $1$, además todos los $memo[i]$ tendrán valor mínimo igual a $1$ por la misma situación. Para el resto de los casos, nos basta con ver que cualquier subsecuencia que termine en el elemento $a_{i}$ tiene la forma:

$$ a_{p_{1}}, a_{p_{2}}, \cdots, a_{p_{m-1}}, a_{i} $$

Donde $a_{p_{m-1}} < a_{i}$ es lo único que nos interesará, puesto que podemos aprovechar la definición de $memo$ para llegar a que:

$$ memo[i] = memo[j] + 1 $$

Para alguna posición $j$ tal que $a_{j} < a_{i}$, pero como la estrategia del DP es probar todas las posibilidades, entonces:

$$ memo[i] = \max\limits_{a_{j} < a_{i}\wedge j<i}{memo[j] + 1} $$

Finalmente, notamos que la misma forma de $memo$ señala que debemos resolver el problema para todos los $j$ menores que $i$ antes de llegar a $i$, por lo que nuestro DP iterativo será de la siguiente manera:

```Cpp
memo[0] = 1; // Caso base
for(int i=1; i<n; i++){
    memo[i] = 1; // Caso trivial, siempre es posible
    for(int j=0; j<i; j++){
        if(A[j] < A[i] and memo[i] < memo[j]+1){ // Si es valida y maximiza
            memo[i] = memo[j]+1;
        }
    }
}
```

Sin embargo, esta parte del algoritmo solamente calcula $memo[i]$, no exactamente la respuesta, por lo que deberemos mantener una variable $ans$ que se maximice dentro de la iteración o con una iteración extra luego del procesamiento.

```Cpp
int ans = 0;
for(int i=0; i<n; i++){
    ans = max(ans,memo[i]);
}
```

#### Tip para formar DP Iterativo

Una forma eficiente de obtener un DP iterativo es primero formar la recursión para un DP recursivo y luego analizar el flujo de la dirección de los estados, para saber qué estados dependen de cuáles y lograr identificar en qué orden se deben plantear las iteraciones.

Analicemos el problema de la mochila para reconocer cómo "invertir" un DP recursivo:

Consideremos un estado $DP(i,l)$, este se verá afectado por $DP(i+1,l)$ y $DP(i+1,l-w[pos])$ en el peor de los casos, lo que quiere decir que el flujo del primer parámetro es en aumento, mientras que el del segundo parámetro es en descenso. Lo que quiere decir que debemos invertir estas transiciones para llegar a la siguiente iteración:

```Cpp
for(int l=0; l<=C; i++) memo[n][l] = 0; // Casos base
for(int i=n-1; i>=0; i--){ // Invertimos el flujo de la posicion
    for(int l=0; l<=C; l++){ // Invertimos el flujo de la capacidad
        memo[i][l] = memo[i+1][l]; // No tomamos nada;
        if(w[pos] <= l) memo[i][l] = max(memo[i][l],v[pos]+memo[i+1][l-w[pos]); // Podemos tomar, maximizamos
    }
}
```

En este caso, la complejidad será la misma $O(nC)$, además la respuesta del problema estará almacenada en $memo[0][C]$. Este método es bastante bueno para hallar DP Iterativos, pero no es absoluto.

#### Ponga a prueba su criterio

Suponga que tiene un arreglo $C[n][n]$ que determinará los pesos de segmentos $A[i\ldots j]$, además necesita almacenar en un arreglo extra el valor de 

$$ F[i][j] = \max\limits_{i \leq x \leq y \leq j}{C[x][y]} $$

Determine cómo realizar el DP Iterativo de este problema, considerando que debe formar la tabla $F$.

### Comparación entre ambos tipos de DP

Hay diferencias considerables entre los dos tipos de DP, algunas de las más importantes son las siguientes:

|                DP Recursivo                |                     DP Iterativo                     |
|:------------------------------------------:|:----------------------------------------------------:|
|        No pasa por todos los estados       |              Pasa por todos los estados              |
|   Necesita de todos los estados posibles   |  Puede necesitar solo algunos estados en su proceso  |
|  Necesita inicializar la tabla con dummys  |      Necesita inicializar solo los estados base      |
| Puede generar RTE por la pila del programa |         No usa mucho de la pila del programa         |
| Puede generar TLE en casos extremos        |  Permite calcular la complejidad de manera sencilla  |

### Compresión de memoria

La principal ventaja del DP Iterativo sobre el DP Recursivo es que se puede hacer **Compresión de memoria**, lo que implica que no es necesario usar todos los estados para calcular la respuesta final, solamente basta con algunos. Veamos el ejemplo del problema de la mochila:

$DP(i,l)$ podia ser modificado por $DP(i+1,l)$ y $DP(i+1,l-w[pos])$ en el peor de los casos, por lo que no podemos descartar ninguna capacidad, pero si notamos bien, el parámetro de posición se vuelve irrelevante una vez que lo aumentamos dos veces. Esto quiere decir que podemos mantener una matriz de $2\times C$ y la respuesta final la guardaremos en $memo[0][C]$. Ahora, la pregunta es: ¿Cómo podemos usar la matriz sin entrecruzar los datos, además de saber de qué estados venimos? Para este caso en particular, aprovecharemos la paridad de la posición para guardar su respuesta, así sabremos exactamente de qué fila estamos viniendo.

Para verlo mejor, basta con hacer el siguiente cambio:

```Cpp
for(int l=0; l<=C; i++) memo[n&1][l] = 0; // Casos base con paridad de n
for(int i=n-1; i>=0; i--){ // Invertimos el flujo de la posicion
    for(int l=0; l<=C; l++){ // Invertimos el flujo de la capacidad
        memo[i&1][l] = memo[(i+1)&1][l]; // No tomamos nada;
        if(w[pos] <= l) memo[i&1][l] = max(memo[i&1][l],v[pos]+memo[(i+1)&1][l-w[pos]); // Podemos tomar, maximizamos
    }
}
```
Obviamente la respuesta estará en $memo[0\&1][C] = memo[0][C]$ como señalamos anteriormente.

### Problemas Clásicos de DP

#### Rod Cutting

El enunciado del problema de Rod Cutting se resume a lo siguiente:

Determinar la máxima ganancia que se puede obtener de cortar una barra de madera en piezas, tales que para cada longitud se tenga asociado un precio estático.

Matemáticamente se puede ver como:

$$ f(L) = \max\limits_{\sum\limits_{i=1}^{k}x_{k} = L}{\sum\limits_{j=1}^{k}p(x_{k})} $$

Donde $p(x)$ es la ganancia por una barra de longitud $x$.

Podemos ver que este problema es equivalente a elegir en qué punto cortar de la barra, por lo que tendríamos la opción de cortar o no para cada uno de estos, siendo la cantidad $L-1$. Debido a lo anterior, presumiblemente obtendríamos una complejidad exponencial $O(2^{L})$ si nos animáramos a usar un algoritmo de Búsqueda Completa.

Lo que debemos considerar para este problema es algo similar a lo que hicimos para LIS, que es definir una función con la cual nos apoyaremos para probar todas las posibilidades de transición y así formar la respuesta:

$$ DP(L) = \text{Maxima ganancia posible con una barra de longitud L} $$

Entonces, notemos que podemos realizar cortes donde deseemos, pero la respuesta de la barra restante debe ser máxima para que el resultado final también sea máximo:

$$ DP(L) = \max\limits_{c=1}^{L}{p(c) + DP(L-c)} $$

Además el caso base es $DP(0) = 0$ y estamos realizando un corte de tamaño $c$. Para saber la forma de su versión iterativa solo basta con notar que el parámetro de longitud de la barra va decreciendo, por lo que para formar la respuesta de $DP(L)$ deberemos obtener las respuestas de todos los valores $i < L$.

Versión Recursiva:

```Cpp
long long DP(int len){
    if(len == 0) return 0;
    if(memo[len]!=dummy) return memo[len];
    int ans = 0;
    for(int c=1; c<=len; c++){
        ans = max(p[c]+DP(len-c));
    }
    return memo[len] = ans;
}
```

Versión Iterativa:

```Cpp
memo[0] = 0;
for(int i=1; i<=L; i++){
    memo[i] = p[i]; // Caso trivial, siempre se puede obtener el valor de la barra completa
    for(int j=1; j<i; j++){ // Considerando cortes no triviales
        memo[i] = max(memo[i],memo[i-j]+p[j]);
    }
}
```

Para obtener la solución de $L$ basta con llamar $DP(L)$ o tomar el valor de $memo[L]$, además podemos notar (por la solución iterativa) que su complejidad fue reducida a $O(L^{2})$.

##### Ponga a prueba su criterio

Señale por qué el problema de Rod Cutting no puede ser resuelto con el siguiente algoritmo:

Definimos $d_{i} = \frac{p_{i}}{i}$, entonces tomo la longitud con mayor densidad y la quito hasta que la longitud restante no sea suficiente, y repetir hasta que ya no tenga más longitud que cortar.

Si no llegó a encontrar una solución, entre a este link (Solo si pensó por al menos 2 horas): [Contraejemplo](https://walkccc.github.io/CLRS/Chap15/15.1/)

#### 1D Range Sum

El problema de 1D Range Sum nos da un arreglo $A[n]$ y nos pide hallar la máxima suma de algún subarreglo de $A$:

$$ Ans = \max\limits_{1\leq i \leq j \leq n}{\sum\limits_{k=i}^{j}A_{k}} $$

La solución con Búsqueda Completa tomaría una complejidad de $O(n^{3})$, dada por el siguiente algoritmo:

```Cpp
long long ans = 0;
for(int i=0; i<n; i++){
    for(int j=i; j<n; j++){
        long long subarray_sum = 0;
        for(int k=i; k<=j; k++){
            subarray_sum += A[k];
        }
        ans = max(ans,subarray_sum);
    }
}
```

Sin embargo, esta solución no es muy eficiente, solo soporta valores de $n$ hasta 700 aproximadamente.

Veremos dos soluciones posibles para este caso, una más eficiente que la otra:

##### Sumas Acumuladas

El método de sumas acumuladas plantea almacenar en un arreglo extra $S$ lo siguiente:

$$ S[i] = \sum\limits_{k=0}^{i}A_{k} $$

De manera que podemos hallar $\sum\limits_{k=i}^{j}A_{k}$ en $O(1)$, usando $S[j]-S[i-1]$. La implementación que facilita esto está indexada desde 1:

```Cpp
S[0] = 0;
for(int i=1; i<=n; i++){
    S[i] = S[i-1] + A[i-1]; // A si esta indexada desde 0
}
long long ans = 0;
for(int i=1; i<=n; i++){
    for(int j=i; j<=n; j++){
        long long subarray_sum = S[j]-S[i-1];
        ans = max(ans,subarray_sum);
    }
}
```

Ahora realizamos un procedimiento $O(n)$ junto con un procesamiento de respuesta de $O(n^{2})$, mucho más eficiente que el método de Búsqueda Completa. Este algoritmo funcionará con valores de $n$ hasta de 17000 aproximadamente, lo cual no será suficiente para algunos problemas.

##### Algoritmo de Kadane

El algoritmo de Kadane es plantea optimizar nuestro procedimiento a un algoritmo $O(n)$, basado en el siguiente criterio:

- Si hasta ahora tengo un subarreglo que tiene suma negativa, obtendré un mejor resultado si es que reinicio el subarreglo y la suma hasta ahora se vuelve 0.

Lo cual suena bastante lógico, todo número negativo es menor que 0, por lo que si deseamos maximizar la suma nos conviene empezar desde un 0 que desde algun valor negativo.

El procedimiento que se usa ahora es similar al de LIS, manteniendo la máxima suma de algún subarreglo que termine en la posición actual, para maximizar la respuesta global luego de procesar esta respuesta. Para esto presentaremos algunas variables:

- `maximo_hasta_aqui`: Es el valor de la suma máxima de todos los subarreglos que terminan en la posición $i$.
- `maximo_global`: Es el valor que tendrá la respuesta al finalizar el procedimiento.

Ahora, supongamos que estamos en una posición $i$ y tenemos el valor de `maximo_hasta_aqui` de la posición anterior, entonces tenemos dos opciones:

1) Agregar el elemento de la posición $i$ a `maximo_hasta_aqui`, lo cual es válido porque seguiría siendo un subarreglo.

2) Tomar solamente el elemento de la posición $i$, caso trivial.

Eso quiere decir que para actualizar el valor de `maximo_hasta_aqui` basta con tomar:

$$ maximo\_hasta\_aqui = \max{\left(maximo\_hasta\_aqui+A[i],A[i]\right)} $$

Sin embargo, este nuevo valor puede ser negativo, así que tendremos la opción de "reiniciar" el valor a $0$, considerando que no tomaremos ningún valor.

$$ maximo\_hasta\_aqui = \max{\left(maximo\_hasta\_aqui+A[i],A[i],0\right)} $$

Luego de procesar el resultado de `maximo_hasta_aqui` maximizamos `maximo_global`. Su implementación es sencilla y fácil de programar:

```Cpp
long long maximo_global = 0;
long long maximo_hasta_aqui = 0;
for(int i=0; i<n; i++){
    maximo_hasta_aqui = max(maximo_hasta_aqui+A[i],A[i]); // Primera decision: Agregar o tomar solo la posicion
    maximo_hasta_aqui = max(maximo_hasta_aqui,0); // Segunda decision: Mantener o reiniciar
    maximo_global = max(maximo_global,maximo_hasta_aqui); // Maximizar el global
}
```

Este algoritmo es mucho más eficiente que los anteriores, teniendo una complejidad espacial $O(1)$ y una temporal de $O(n)$. También se puede expandir a más dimensiones.

#### 2D Range Sum

El problema 2D Range Sum tiene el mismo contexto que el 1D, pero esta vez es aplicado a matrices, para este caso daremos solamente la solución de sumas acumuladas que usa el Principio Inclusión Exclusión para calcular las sumas de las submatrices.

Primero, como dicta el método, generaremos una matriz extra $S$ tal que $S[i,j]$ tendrá la suma de todos los elementos de $A$ que estén en la submatriz $(0,0) \rightarrow (i,j)$. Ahora la pregunta principal es: ¿Cómo calcular los valores de $S[i,j]$ en O(n^{2})?

La respuesta es: Principio Inclusión-Exclusión.

Notemos que si ya tenemos los valores de $S[i-1,j]$, $S[i-1,j-1]$ y $S[i,j-1]$ podemos formar $S[i,j]$ en $O(1)$:

| i-1,j-1 | i-1,j |
|:-------:|:-----:|
|  i,j-1  |  i,j  |

En primer lugar, agregamos $A[i,j]$ a $S[i,j]$. Luego de esto, podemos agregar $S[i-1,j]$, entonces nos faltaría la fila $i$ hasta la posición $j-1$:

$$ S[i,j] = A[i,j] + S[i-1,j] + \sum\limits_{k=0}^{j-1}A[i,k] $$

Pero, si lo vemos como submatrices, es sencillo notar que:

$$ \sum\limits_{k=0}^{j-1}A[i,k] = S[i,j-1] - S[i-1,j-1] $$

Llegaremos finalmente a que:

$$ S[i,j] = A[i,j] + S[i-1,j] + S[i,j-1] - S[i-1,j-1] $$

Y con esto logramos el preprocesamiento en $O(n^{2})$. Ahora debemos verificar que podemos calcular la suma de una submatriz cualquiera en $O(1)$ también, para que nuestro trabajo sea $O(n^{4})$ fijando los límites del rectángulo. Supongamos que deseamos la submatriz $(f1,c1)\rightarrow(f2,c2)$, entonces se da lo inverso al preprocesamiento:

Notemos que primero debemos quitar las filas y columnas extra, por lo que restaremos $S[f1-1,c2]$ y $S[f2,c1-1]$ a $S[f2,c2]$. Pero esto restaria dos veces el valor de la submatriz $S[f1-1,c1-1]$, por lo que la agregaremos una vez para compensar.

$$ Suma[f1:f2,c1:c2] = S[f2,c2] - S[f1-1,c2] - S[f2,c1-1] + S[f1-1,c1-1] $$

Cabe recordar que si los índices no están definidos (negativos), entonces se asume el valor de $S[a,b]$ es 0.

Finalmente la implementación sería:

```Cpp
for(int i=0; i<n; i++){
    for(int j=0; j<m; j++){
        S[i][j] = A[i][j]; // Siempre se agrega
        if(i > 0) S[i][j] += S[i-1][j]; // Si existe, sumar
        if(j > 0) S[i][j] += S[i][j-1]; // Si existe, sumar
        if(i > 0 and j > 0) S[i][j] -= S[i-1][j-1]; // Si existe, restar
    }
}
long long ans = 0;
for(int f1=0; f1<n; f1++){
    for(int f2=f1; f2<n; f2++){
        for(int c1=0; c1<m; c1++){
            for(int c2=c1; c2<m; c2++){
                long long suma = S[f2][c2]; // Siempre se agrega
                if(f1 > 0) suma -= S[f1-1][c2]; // Si existe, restar
                if(c1 > 0) suma -= S[f2][c1-1]; // Si existe, restar
                if(f1 > 0 and c1 > 0) suma += S[f1-1][c1-1]; // Si existe, sumar
                ans = max(ans,suma);
            }
        }
    }
}
```

Es facil ver que el algoritmo en si tiene complejidad $O(n^{2}m^{2})$, siendo $n$ y $m$ las dimensiones de $A$.

### Sección de Problemas

Practique con los siguientes problemas:

- [Easy Longest Increasing Subsequence](http://www.spoj.com/problems/ELIS/)
- [BATMAN3](http://www.spoj.com/problems/BAT3/)
- [Greenhouse Effect](http://codeforces.com/contest/269/problem/B)
- [Maximum Sub-sequence Product](https://uva.onlinejudge.org/index.php?option=com_onlinejudge&Itemid=8&category=24&page=show_problem&problem=728)
- [The jackpot](https://uva.onlinejudge.org/index.php?option=com_onlinejudge&Itemid=8&category=24&page=show_problem&problem=1625)
- [Maximum Sum](https://uva.onlinejudge.org/index.php?option=com_onlinejudge&Itemid=8&category=24&page=show_problem&problem=44)
- [Largest Submatrix](https://uva.onlinejudge.org/index.php?option=com_onlinejudge&Itemid=8&category=24&page=show_problem&problem=777)
- [Take the Land](https://uva.onlinejudge.org/index.php?option=com_onlinejudge&Itemid=8&category=24&page=show_problem&problem=1015)