# 1. Problema del Subarray máximo

Este algoritmo tiene como objetivo encontrar la suma máxima en  los subarreglos, que estan contenidos en un arreglo unimensional.

Algunas consideraciones son que uno de los subarreglo pueden venir vacíos, de ser así, la suma de estos será: 0 y que los valores que puede tener los subarreglos son contenidos en los números racionales, es decir, puede tener números positivos, negativos o cero.

**Entrada**: Secuencia de n números $[a_1,a_2,...,a_n]$

**Salida**: Sub-arreglo $[a_i,..,a_j]$, tal que la suma de los elementos es mayor o igual a cualquier otro sub-arreglo, es decir, $\sum\limits_{k=i}^j a_k \geq \sum\limits_{k=i'}^{j'} a_k$ , para cualquier par $(i',j')$, con $i' \leq j'\leq n$.

![image](https://media.geeksforgeeks.org/wp-content/cdn-uploads/kadane-Algorithm.png)

##Aplicaciones para el algoritmo

* En el análisis de imágenes, cuando se trata de encontrar el área más brillante de una imagen, se ocupa este algoritmo. La imagen debe de ser un mapa de bits (archivos con extensión .bmp). La imagen se transforma en una matriz en la que cada valor equivale al brillo de cada pixel.

Ese es el uso más fácil de entender. Sin embargo no es el único, también en el análisis de las subsecuencias genómicas y en la minería de datos de utiliza este algoritmo. En el ejemplo que ves en esta página se utilizan valores positivos y negativos, en los usos de la vida real que ya te mostramos se utiliza otro rango de valores.





# 2. SubarrayMaximo


## 2.1 Codigo

In [None]:
import matplotlib.pyplot as plt
import time
from termcolor import colored
import numpy as np
import random
import math
 
# find max crossing subarray in linear time
def MaxSubArrayMid(A, low, mid, high):
    max_left, max_right = -1, -1
 
    #Parte izquierda del subarreglo
    left_sum = float("-Inf")
    sum = 0
    for i in range(mid, low - 1, -1):
        sum += A[i]
        if (sum > left_sum):
            left_sum = sum
            max_left = i
 
    # Parte derecha del Subarreglo
    right_sum = float("-Inf")
    sum = 0
    for j in range(mid + 1, high + 1):
        sum += A[j]
        if (sum > right_sum):
            right_sum = sum
            max_right = j
 
    return max_left, max_right, left_sum + right_sum
 

# time complexity: n*logn
def MaxSubArray(A, low, high,verbose = False):
    if (high == low):
        return low, high, A[low]
    else:
        mid = math.floor((low + high) / 2)
        left_low, left_high, left_sum = MaxSubArray(A, low, mid)
        if verbose == True:
          print("subarreglo 1: ",left_low, left_high, left_sum)
        right_low, right_high, right_sum = MaxSubArray(A, mid + 1, high)
        if verbose == True:
          print("subarreglo 2: ",right_low, right_high, right_sum)
        cross_low, cross_high, cross_sum = MaxSubArrayMid(A, low, mid, high)
        if verbose == True:
          print("subarreglo 3: ",cross_low, cross_high, cross_sum)
        if (left_sum >= right_sum and left_sum >= cross_sum):
            return left_low, left_high, left_sum
        elif (right_sum >= left_sum and right_sum >= cross_sum):
            return right_low, right_high, right_sum
        else:
            return cross_low, cross_high, cross_sum
 


# Kadane’s Algorithm
def maxSubArraySum(a, size):
    max_so_far = float("-inf")
    max_ending_here = 0
 
    for i in range(size):
        max_ending_here = max_ending_here + a[i]
        if (max_so_far < max_ending_here):
            max_so_far = max_ending_here
 
        if max_ending_here < 0:
            max_ending_here = 0
 
    return max_so_far

 
# ejemplos
A = [-2,-5,17,-2,9,-8,5,-6]
# A = [-2, 2, -3, 4, -1, 2, 1, -5, 3]
# A = [0,-2, 3, 5, -1, 2]
# A = [-9, -2, -3, -5, -3]
# A = [1, 2, 3, 4, 5]
# A = [-2, -3, 4, -1, -2, 1, 5, -3]

print('using divide and conquer...')
aindex,bindex,max = MaxSubArray(A, 0, len(A) - 1)
print("el indice del inicio  del sub arreglo es: ",aindex)
print("el indice del termino del sub arreglo es: ",bindex)
print("la suma del subarreglo es: ",max)

using divide and conquer...
el indice del inicio  del sub arreglo es:  2
el indice del termino del sub arreglo es:  4
la suma del subarreglo es:  24


In [None]:
A = [-3,1,-2,2,-1,2]
print("Arreglo de entrada: ", a)
aindex,bindex,max =MaxSubArray(A, 0, len(A)-1)
print("La suma maxima es: ", max)
print("El arreglo comienza en la posición", aindex, "y termina en la posición", bindex)

 

Arreglo de entrada:  [4, -1, 3, -7]
La suma maxima es:  3
El arreglo comienza en la posición 3 y termina en la posición 5


## 2.2 Descripcion del algoritmo

El principio para la resolucion del problema consiste en el metodo divide y venceras.
Por lo que el problema se divide en subproblemas mas pequeños hasta llegar al caso base de manera recursiva.

En este caso del subarreglo maximo, la idea es encontrar el subarreglo mas grande dentro del arreglo **A[low .... high]**, donde mid será la posicion central del arreglo.

Luego de encontrar la posicion central se resuelven los subarreglos **A[low .... mid]** y **A[mid + 1 .... high]**. Cualquier subconjunto continuo **A[i .... j]** de **A[low .... high]** debe ser una de las siguientes tres situaciones:

1. Está completamente en el subarreglo **A[low....high]**, por lo que **(low <= i <= j <= mid)**
2. Está completamente ubicado en el subarreglo **A[mid+....high]**, por lo que **(mid <= i <= j <= high)**.
3. El punto medio está cruzado, por lo que **(low <= i <= mid < j <= high)**.


por lo tanto el subarray maximo debe ser el mas grande de los tres casos anteriores, para el caso 1 y el caso 2, se pueden resolver de manera recursiva y todo lo que queda es encontrar la subarreglo mas grande que abarque el punto medio.
Cualquier subarreglo que cruza el punto medio se compone por dos subarreglos **A[i ... mid]** y **A[mid+1 .... j]**, para encontrar la combinacion maxima dentro de estos dos subarreglos se hace de manera lineal recorriendo el arreglo.

##2.3 Ejemplo:

Para el ejemplo usaremos el arreglo de la implementacion del codigo:
* **A = [4,-1,3,-7]**

Primero el algoritmo revisa si el arreglo es de largo 1, si no es asi continua la funcion llamandose a si misma para revisar las partes **left** y **right**

### Left

Para este sub arreglo se llamará a la funcion para el sub arreglo [4,-1], como su largo es mayor a 1 se vuelve a llamar a la funcion y retornará **left = [4]** y **right = [-1]**

Luego de llamar dos veces a MaxSubArray para ambos lados, buscaremos el subarreglo que contenga la suma mas grande y que contenga al centro del arreglo

Y al recorrer la parte izquierda tenemos [4] y en la pate derecha tenemos [-1] y como esta es nuestra unica opcion, tenemos que la suma mas grande que un subarreglo puede tener incluyendo el centro es **3**.

Luego comparamos los tres resultados y al final tenemos que la suma mayor de la parte **left** es **4**

### Right

Se repite el mismo proceso que con la anterior, llamamos a la función **maxSubArray** para los subarreglos [3] y [-7] y como estos son de largo 1, los retorna.

Una vez que terminamos con eso buscamos nuevamente al subarreglo que de la suma más alta y contenga al centro, y nos da que ese sería el [3,-7] con una suma de -4. Luego se comparan los resultados obtenidos y tenemos que la suma mayor es de 3.


### Arreglo mayor que incluya el centro

Una vez que terminamos de ver las ramas izquierdas y derechas del arreglo pasamos a revisar el arreglo que contenga al centro y de la mayor suma posible.

Por lo que revisamos el sub-arreglo izquierdo **a[low : mid] = [4,-1]** guardando su suma mas alta que es **3**.

Luego, vemos el derecho **a[mid+1 : high] = [3,-7]**
y tenemos que la suma mas alta es **3**. cuando sumamos ambos resultados nos queda que la suma es **6**.

### Comparacion Final

Ahora que tenemos los resultados y tenemos que: 
**left = 3**
**right = 3**
**cross = 6**
Retornamos **5** y los indices correspondientes que son **0** y **2** y el sub-arreglo Resultante es:

**A = [4,-1,3]**



## 2.4 Ejecucion paso a paso (verbose = True)

In [None]:
arr = [4,-1,3,-7]
contRecComp = [0,0]
maxSubArray(arr,contRecComp, verbose = True)

SubArreglo Izquierdo:  [4, -1]
SubArreglo Derecho:  [3, -7] 

SubArreglo Izquierdo:  [4]
SubArreglo Derecho:  [-1] 

Maximo Subarreglo que pasa por el medio:  [4, -1]
SubArreglo Izquierdo:  [3]
SubArreglo Derecho:  [-7] 

Maximo Subarreglo que pasa por el medio:  [3, -7]
Maximo Subarreglo que pasa por el medio:  [4, -1, 3]


(6, 0, 3)

# 3. Tiempo de Ejecucion

Estudiaremos y analizaremos el tiempo de ejecución del algoritmo MaxSubArray.
Como siempre, trabajaremos con un arreglo inicial de largo **n**. que tiene una complejidad de $O(n \log{n})$, para probar esto 

## Funcion de Recurrencia

La implementación de este algoritmo está basada en la **recursión**, por lo que para estudiar su tiempo de ejecución primero definiremos una **función de recurrencia** $T(n)$ donde $n$ es el tamaño del problema.

El **caso base** de este algoritmo corresponde a un sub-arreglo de tamaño $1$, y el algoritmo retorna este mismo sub-arreglo por lo que diremos que $T(1) = O(1)$, es decir, su tiempo de ejecución es **constante**.

En caso contrario cuando $n > 1$, el algoritmo ejecuta las siguientes operaciones:


*   Dividir el arreglo en $2$ y llamar recursivamente a la función 2 veces con estos sub-arreglos, es decir, $2 \cdot T(\frac{n}{2})$.
*   Se llama al algoritmo ***MaxSubArrayMid*** para encontrar el sub-arreglo máximo que contenga el elemento central del arreglo principal. Su implementación tiene **complejidad lineal** $O(n)$.

A partir de esto podemos establecer la **función de recurrencia** para el algoritmo MaxSubArray:

![Image](https://algoparc.ics.hawaii.edu/~nodari/teaching/s15/Notes/Topic-07/recurrence-merge-subarray.jpg)


## Teorema Maestro

Ahora que tenemos la función de recurrencia del algoritmo, podemos aplicar el **Teorema Maestro** para resolverla y así obtener una cota asintótica, ya que esta función cumple con la condición de ser de la forma: $T(n) \leq aT(n/b) + O(n^d)$.

Para aplicar este teorema, primero debemos identificar los parámetros $a, b$ y $d$ en nuestra función:

$T(n) = {2}T(n/{2}) + O(n^{{1}})$

Observando la función es fácil darse cuenta que estos corresponden a: $a = 2, b = 2 \ \text{y} \ d = 1$.

Ahora que tenemos los parámetros, debemos fijarnos en el teorema y ver el caso al que corresponde nuestra recurrencia:

$ T(n) = \begin{cases} 
      {O(n^d \log{n})} & \text{si }{a = b^d} \text{ [caso 1]} \\
      O(n^d) & \text{si } a < b^d \text{ [caso 2]} \\
      O(n^{\log_b{a}}) & \text{si } a > b^d \text{ [caso 3]} 
   \end{cases}
$

Como podemos ver, la función **cumple con el caso 1 del teorema maestro**, por lo que reemplazamos los parámetros y obtenemos que el **tiempo de ejecución de nuestro algoritmo corresponde a** $O(n \log{n})$.






# 4. Correctitud

***Teorema 1: Correctitud Función maxSubArray***



* La función maxSubArray recibe por entrada un arreglo de n elementos y devuelve el máximo subarreglo dentro de este.



***Teorema 2: Correctitud Función MaxCrossSubArray.***



* La funcion MaxCrossSubArray recibe dos subarreglos Left y Right y entrega tanto el máximo subarreglo que este entre estos dos como la suma que genera.


**Prueba del teorema 1** 

Para probar el teorema 1 usaremos inducción.

* **Caso base** : El arreglo tiene solo 1 elemento, el algoritmo retornará el unico elemento que se encuentra, al ser un elemento corresponde es la máxima suma que se puede generar.

* **Caso promedio ( n > 1)**: Se asume que el la función maxSubArray funcionará correctamente cuando exista más de un elemento en el arreglo, m < n.

  La funcion maxSubArray separará el arreglo de entrada en dos Subarreglo Right y Left de tamaño (n/2), volvera a procesar cada uno de estos subarreglos y dado que asumimos que la función sera correcta para cualquier m < n, estos subarreglos se procesaran correctamente.

 Para finalizar utilizando el teorema 3, asumimos que la funcion MaxCrossSubArray funcionará correctamente y por ende nos entregará el máximo subarray que contiene el elemento medio.



 **Prueba del teorema 2**

***Propiedad invariante de bucle***

Al inicio de cada iteracion nuestras variable maxLeft y maxRight contendrán la máxima suma de cada subarreglo.

* **Inicialización:** Al final de la primera iteración (i = 0), el elemento en la posición m - 0 es la suma máxima, y como el subarreglo debe tener al menos un elemento, se cumple la propiedad.


* **Mantención:** Aplicando inducción, se puede asumir que al comienzo de cada iteración, s es la suma máxima hasta la posición anterior a i. Para mantener la propiedad, los elementos entre m y m ± i se suman y luego se comparan el valor de s. Si el valor de la nueva suma es mayor a s, su valor se actualiza y se seguirá cumpliendo la propiedad invariante.

* **Correctitud:** La propiedad invariante es verdadera al inicio del bucle y se mantiene en cada iteración. Por lo tanto, se puede decir que al finalizar el algoritmo, el resultado será un subarreglo con la suma máxima desde la posición m hasta m ± n/2.





# 5. Experimentos



In [None]:
## Kadane

from sys import maxsize
def kadane(a,size):
  
  max_so_far = -maxsize - 1
  max_ending_here = 0
  start = 0
  end = 0
  s = 0
  
  for i in range(0,size):
  
    max_ending_here += a[i]
  
    if max_so_far < max_ending_here:
        max_so_far = max_ending_here
        start = s
        end = i
  
    if max_ending_here < 0:
        max_ending_here = 0
        s = i+1

  return max_so_far

## 5.1 Graficos



In [None]:


import matplotlib.pyplot as plt
import datetime
from timeit import repeat
import random
from termcolor import colored
import copy

#retorna un arreglo con valores entre -20 y 20 de largo n
def randomArray(n):
  array = np.zeros(n)
  for i in range (len(array)):
    array[i] = int(random.randint(1,40) - 20)
  return array



x=[]; y=[]
y1=[]

for n in range(5,500):

  a = random.sample(range(1, 1000), n)
  size = len(a)
  contador =[0,0]
  verbose = False
  #la función repeat está ejecutando 20 veces insertion_Sort con el arreglo a y retorna el mejor tiepo obtenido.
  t1 = repeat(setup="from __main__ import Kadane", stmt=f"Kadane({a},{size})", repeat=1, number=10)
  t2 = repeat(setup="from __main__ import maxSubArray", stmt=f"maxSubArray({a},{contador},{verbose})", repeat=1, number=10)
  x.append(n)
  y.append(t1)
  y1.append(t2)


maxSubArray(a, contador,verbose = False)

plt.plot(x, y)
plt.plot(x, y1)
plt.legend(["kadane ", "MaxSubArray"])

plt.xlabel('Tamaño del arreglo')
plt.ylabel('Tiempo en ms')
plt.show()
z = np.zeros(500)
y = np.zeros(500)




x = [n for n in range(0,500)]
for i in range (5,500):
  array = randomArray(i)
  start = time.time()
  maxSumKanade = kadane(array, len(array))
  end = time.time()
  y[i] = end - start

  start = time.time()
  contRecComp = [0,0]
  sumMac,indexA,indexB = maxSubArray(array, contRecComp)
  end = time.time()
  z[i] = end - start




plt.plot(x,y,z)
plt.legend(["Time kadane","Divide & Conquer",])

plt.xlabel('n')
plt.ylabel('time in s')
plt.show()
  







ImportError: ignored

El algoritmo con el principio divide y venceras tiene una complejidad de O(n log(n)) y el algoritmo de kedane tiene una complejidad de O(n) ya que el numero de operaciones depende directamente con el tamaño del problema

## experimento 2

In [None]:
#retorna un arreglo con valores entre -20 y 20 de largo n
def randomArray(n):
  array = np.zeros(n)
  for i in range (len(array)):
    array[i] = int(random.randint(1,40) - 20)
  return array

def MaxSubArrayN2(array):
  max = array[0]
  for i in range(0,len(array)):
    suma = 0
    for j in range(i,len(array)):
      suma = suma + array[j]
      if suma>max:
        max = suma
  
  return max


z = np.zeros(500)
y = np.zeros(500)
w = np.zeros(500)
x = [n for n in range(0,500)]
for i in range (5,500):
  array = randomArray(i)
  start = time.time()
  max = MaxSubArrayN2(array)
  end = time.time()
  y[i] = end - start

  start = time.time()
  contRecComp = [0,0]
  a,b,c = maxSubArray(array,contRecComp)
  end = time.time()
  z[i] = end - start

  start = time.time()
  maxSumKadane = maxSubArraySum(array, len(array))
  end = time.time()
  w[i] = end - start


plt.plot(x,y,z)
plt.plot(x, w)
plt.legend(["O(n^2)","Divide & Conquer","kadane method"])

plt.xlabel('n')
plt.ylabel('time in s')
plt.show()
  

TypeError: ignored

Se puede apreciar en el grafico que el metodo recorriendo el arreglo completo y probando todas las combinaciones es el metodo mas ineficiente, sin embargo es interesante como la curva del metodo D&C en este grafico parece ser insignificante.

Comparando este grafico y el anterior el metodo D&C parecia un poco ineficiente, pero al graficar los 3 metodos uno puede apreciar la importancia de implementar un metodo eficiente y que utilice pocos recursos