# Maximale Teilsumme
**Problemstellung:** Gegeben ist eine Struktur aus ganzen Zahlen. Finde eine zusammenhängende Teilstruktur mit maximaler Summe. Das Problem kann auf verschiedene Dimensionen übertragen werden, insbesondere der 2D-Fall ist relevant. Wir betrachten hier jedoch zunächst den eindiemnsionalen Fall.

## Problem 1D-MAXSUM
**Problemstellung:** Gegeben ist eine Folge ganzer Zahlen. Finde die zusammenhängende Sequenz von Zahlen, die addiert einen maximalen Wert besitzt. Keine Sequenz bzw. eine Sequenz der Länge 0 besitzt die Teilsumme 0.

**1D-Beispiel:** Beispiel ist aus [Solymosi 2017](https://rd.springer.com/chapter/10.1007/978-3-658-17546-7_2) entnommen: Wir haben den Kurs einer 1000-Euro-Aktie der Firma „MikroSofties“ verfolgt und wissen von jedem der letzten zehn Tage, wie viele Euro eine solche Aktie an diesem Tag an Wert gewonnen bzw. verloren hat (die folgende Tabelle zeigt ein Beispiel).

| Tag.          |1  | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10| 
|---------------|---|---|---|---|---|---|---|---|---|---|
| Gewinn/Verlust|5  |-8 |3  |3  |-5 |+7 |-2 |-7 |3  |5  | 

Insgesamt hat eine Aktie in den zehn Tagen ihren Wert um +4 Euro verändert (weil + 5 − 8 + 3 + 3 − 5 + 7 − 2 − 7 + 3 + 5 = +4 ist). Hätte man solche Aktien unmittelbar vor dem 3. Tag gekauft und unmittelbar nach dem 4. Tag verkauft, so hätte man pro Aktie 6 Euro Gewinn gemacht. Welchen maximalen Gewinn hätte man bei geschickter Wahl machen können?

### Funktionale Spezifikation:
**Eingabe:**
$F=\left( f_{1},\ldots ,f_{n}\right) ,f_{i}\in \mathbb{Z} $ mit
$w:\mathbb{Z} ^{\ast}\rightarrow \mathbb{Z} ,w\left( F\right) =\sum  \limits^{n}_{i=1}f_{i}.$
<!--img src="Bilder/SpezifikationMAXSUMEingabe.jpg">-->
**Ausgabe und funktionaler Zusammenhang:**
$w \in \mathbb{Z}$ und es gilt: $\exists G\subseteq F$ mit
$G=\left(f_{n},\ldots ,f_{k}\right),$ $1\leq h\leq k\leq n,f_{i}\in F \wedge \forall H\subseteq F:w\left( H\right) \leq w\left( G\right) =w$

<!--img src="Bilder/SpezifikationMAXSUMAusgabe.jpg"> -->

<!---
## Problem 2D-MAXSUM
**Problem in 2D:** Gegeben ist eine Matrix mit n Zeilen und m Spalten. Finde eine rechteckige Untertabelle, deren summierte Elemente maximal ist.

**2D-Beispiel**

**Praktische Relevanz:** Das Problem ist in der Bildbearbeitung, Genanalyse und Data Science relevant
-->

---
## Algorithmus 1
Naiver "Brute Force"-Ansatz: Wir bestimmen alle möglichen Teilfolgen, berechnen die jeweilige Summe und speichere die maximale Teilsumme.

In [9]:
def max_teil_summe1(folge):
    maxSumme = 0
    leftMax, rightMax =-1,-1
    size = len(folge)
    
    for i in range(0, size):
        for j in range(i, size):
            summe = 0
            for k in range(i, j+1):
                summe = summe + folge[k]
            if summe > maxSumme:
                maxSumme = summe
                leftMax = i
                rightMax = j
                    
    return maxSumme, leftMax, rightMax
    

folge1 = [5, -8, 3, 3, -5, 7, -2, -7, 3, 5]
folge2 = [0,0,-1,0,-1,0]
folge3 = [-2,1,4,-6,3,1,0,0,-3,]
maxSum, liX, reX = 0,-1,-1
maxSum, liX, reX  =max_teil_summe1(folge3)

print("Die maximale Teilsumme der Folge ", folge3,"ist",maxSum,"und liegt zwischen Position",liX,'und', reX)
  

Die maximale Teilsumme der Folge  [-2, 1, 4, -6, 3, 1, 0, 0, -3] ist 5 und liegt zwischen Position 1 und 2


### Analyse Algorithmus 1
**Informal bzw $O()$-Kalkül:** Der Algorithmus besitzt 3 ineinander geschachtelte Schleifen, die im schlimmsten Falle von 1 bis $n$ laufen, mit $n$ ist die Länge der Eingabefolge. Daher ist der Aufwand $O(n^{3})$

**Exakte Analyse der Laufzeit durch Bestimmung von $T_{a}(n)$:**
Der Algorithmus erzeugt jede mögliche Teilfolge. Wir betrachten die Anzahl und Länge aller möglichen Teilfolgen:
* Es gibt genau 1 Teilfolge der Länge $n$: [1,...,n]
* Es gibt genau 2 Teilfolgen der Länge $n-1$: [1,...,n-1], [2,...,n]
* Es gibt genau 3 Teilfolgen der Länge $n-2$:[1,...,n-2], [2,...,n-1], [3,...,n]
* ...dies lässt sich weiterführen bis Teilfolgen der Länge 1
* Es gibt genau $n$ Teilfolgen der Länge 1:[1],[2],...,[n]

Daraus lässt sich schließen, dass wir insgesamt $\sum\limits_{i=0}^{n}i=\frac{n(n+1)}{2}$ Teilfolgen betrachten müssen. Für jede müssen wir die Anzahl der Elemente in der innersten Schleife aufaddieren, vgl Codezeile <code>summe = summe + folge[k]</code>. Dies bedeutet, dass in jeder Teilfolge der Länge $m$ genau m Zuweisungen der o.g. Codezeile erfolgen. Das ergibt folgende Abschätzung:
<img src="Bilder/BerechnungExakterAufwandMAXSUM.jpg">
Es gilt also $T_{a}(n)=\frac{n^3}{6}+\frac{n^2}{2}+\frac{n}{3}=O(n^3)$


---
## Algorithmus 2

Eigentlich ist es unnötig, immer wieder die Summe auf 0 zu setzen, dann wieder neu zu berechnen und dann ein weiteres Folgeelement aufzuaddieren. Zwei Schleifen reichen also aus!

In [6]:
def max_teil_summe2(folge):
    maxSumme = 0
    leftMax, rightMax =-1,-1
    size = len(folge)
    
    for i in range(0, size):
        summe = 0
        for j in range(i, size):
            summe +=folge[j]
            if summe > maxSumme:
                maxSumme = summe
                leftMax = i
                rightMax = j
    return maxSumme, leftMax, rightMax


folge1 = [5, -8, 3, 3, -5, 7, -2, -7, 3, 5]
maxSum, liX, reX = 0,-1,-1
maxSum, liX, reX  =max_teil_summe2(folge1)

print("Die maximale Teilsumme der Folge ", folge1,"ist",maxSum,"und liegt zwischen Position",liX,'und', reX)
  

Die maximale Teilsumme der Folge  [5, -8, 3, 3, -5, 7, -2, -7, 3, 5] ist 8 und liegt zwischen Position 2 und 5


### Analyse Algorithmus 2
**Informal bzw. $O()$-Kalkül:** Der Algorithmus besitzt jetzt nur noch **2 ineinander geschachtelte Schleifen**, die im schlimmsten Falle von 1 bis $n$ laufen, mit $n$ ist die Länge der Eingabefolge. Daher ist der Aufwand **$O(n^{2})$**

---
## Algorithmus 3

Die Idee des Algorithmus folgt dem *Divide and Conquer*-Prinzip, das wir noch in vielen anderen Ansätzen wiederentdecken werden. Grundlegender Ansatz ist, dass wir die Suche nach der maximalen Teilsumme aufteilen in drei Fälle:
1. Suche im linken Teil der Mitte
2. Suche im rechten Teil der Mitte
3. Suche nach einer Teilsumme, die über die Mitte geht

Im *ersten* und *zweiten* Fall ist die Fragestellung ein simpler rekursiver Aufruf mit geänderten Werten für linke Seite, Mitte und rechte Seite. Interessant ist der **3. Fall**: Eine Teilsumme, die über die Mitte läuft ist über einen rekursiven Aufruf nur schwer zu berechnen. 

Man kann sich aber folgende Eigenschaft überlegen und zu Nutze machen: Ausgehend von der Mitte suchen wir jeweils eine rechte und linke Teilsumme bis zur jeweiligen linken bzw. rechten Grenze. Dabei speichern wir die Teilsumme und die jeweiligen Indizes nur ab, wenn die Teilsumme größer als 0 wird, da wir ansonsten auch eine leere Folge hätten nehmen könnten. Die neue Teilsumme im Fall 3 berechnet sich dann aus beiden Teil-Teilsummen für rechts und links der Mitte.


In [7]:
def max_mitte_teilsumme(folge,links,mitte,rechts):
    bisherMaxL = 0
    bisherSum = 0
    bisherMaxR = 0
    # speichere Indizes des besten Kandidaten in diesen Variablen
    maxL, maxR =-1,-1
      
    for i in range(mitte,links-1,-1):
    # suche maximale Teilsumme von der Mitte aus nach links rückwärts
        bisherSum+=folge[i]
        
        #wenn aktuelle Summe größer als bisherige
        if (bisherSum > bisherMaxL):
            bisherMaxL = bisherSum
            # speichere linken Index
            maxL =i
    
    
    bisherSum = 0
    for i in range(mitte+1,rechts+1):
    #suche maximale Teilsumme von der Mitte aus nach rechts vorwärts
        bisherSum+=folge[i]
        
        # wenn aktuelle Summe größer als bisherige
        if (bisherSum > bisherMaxR):
            bisherMaxR = bisherSum
            # speichere rechten Index
            maxR=i
    # Teilsumme berechnet sich aus linker und rechter Teilfolge         
    return bisherMaxL+bisherMaxR,maxL,maxR

def max_teilsumme_rekursiv(folge, links, rechts):
    laenge = len(folge)
    links = int(links)
    rechts = int(rechts)
    leftIx, rightIx = -1,-1
    
    if 0 <= links <= rechts < laenge:

        # Rekursionsanker, wenn nur 1 Element
        if links == rechts:
            # Teste ob Element kleiner al 0
            if folge[links] < 0:
                return 0,-1,-1
            else:
                # gib Wert und Grenzen zurück
                return folge[links],links,links
        else:
            # Teile und bearbeite
            mitte = (rechts+links)/2
            
            # Suche MAXSUM in linker Hälfte, liefere Summe, li / re Grenze
            maxLinks,l_l,r_l = max_teilsumme_rekursiv(folge, links, mitte)
            
            # Suche MAXSUM in rechter Hälfte, liefere Summe, li / re Grenze
            maxRechts,l_r,r_r = max_teilsumme_rekursiv(folge, mitte+1, rechts)   
            
            # Suche MAXSUM, die über die Mitte läuft
            maxMitte,l_m,r_m = max_mitte_teilsumme(folge,links,int(mitte),rechts)
            
            # Welche der drei ist die größte? Speicher Wert + Grenzen
            if maxLinks > maxRechts:
                maxIx,leftIx,rightIx = maxLinks,l_l,r_l
            else:
                maxIx,leftIx,rightIx = maxRechts,l_r,r_r
                
            if maxMitte > maxIx:
                return maxMitte, l_m, r_m
            else:
                return maxIx,leftIx,rightIx
            
    # Da lief etwas schief 
    return -1,-1,-1

def max_teil_summe3(folge):
    return max_teilsumme_rekursiv(folge, 0, len(folge)-1)

folge1 = [5, -8, 3, 3, -5, 7, -2, -7, 3, 5]
maxSum, liX, reX = 0,-1,-1
maxSum, liX, reX  =max_teil_summe3(folge1)

print("Die maximale Teilsumme der Folge ", folge1,"ist",maxSum,"und liegt zwischen Position",liX,'und', reX)

Die maximale Teilsumme der Folge  [5, -8, 3, 3, -5, 7, -2, -7, 3, 5] ist 8 und liegt zwischen Position 8 und 9


### Analyse Algorithmus 3

Informal bzw. $𝑂()$-Kalkül: Der Algorithmus ist rekursiv, daher kann die bekannte Analyse mit Zählen von Schleifen nicht eingesetzt werden. Ohne die Grundlagen hier zu vertiefen sei gesagt, dass der Ansatz des Aufteilens und Kombinierens analog zu einem bekannten Sortieralgorithmus (Merge-Sort) läuft. Diese hat eine Laufzeit von $O(n \log{n})$ wie auch der hier vorliegende Algorithmus.

---
## Algorithmus 4 (Kadane's Algorithm)

Es muss noch schneller gehen, denn jedes Element der Folge wird mehrmals angefasst. **Neue Idee**: Eine *Teilsumme* von 0 ist immer untere Schranke, da jede leere Folge die Teilsumme 0 hat. Summiere Elemente von links auf und speichere die bisher größte Teilsumme. Falls neue Teilsumme < 0, setze aktuelle Summe auf 0, da die Teilfolge nicht die größte sein kann. Man könnte ja erst beim nächsten Folgenglied beginnen. Die Grenzen der zu bestimmenden maximalen Teilfolge werden wie bei den anderen Verfahren mitberechnet.

In [8]:
def max_teil_summe4(folge):
    liMax = reMAx = liTmp = 0

    bisherMax = 0
    randMax = 0
    size = len(folge)
    
    for i in range(0, size):
        randMax = max(0, randMax + folge[i])
        
        if randMax == 0:
            liTmp = i+1
        if randMax > bisherMax:
            bisherMax = randMax
            liMax = liTmp
            reMax = i
    return bisherMax, liMax, reMax

folge1 = [5, -8, 3, 3, -5, 7, -2, -7, 3, 5]
maxSum, liX, reX = 0,-1,-1
maxSum, liX, reX  =max_teil_summe4(folge1)


print("Die maximale Teilsumme der Folge ", folge1,"ist",maxSum,"und liegt zwischen Position",liX,'und', reX)
   

Die maximale Teilsumme der Folge  [5, -8, 3, 3, -5, 7, -2, -7, 3, 5] ist 8 und liegt zwischen Position 2 und 5


### Analyse Kadane Algorithmus

Man erkennt schnell, dass die Laufzeit des Algorithmus $O(n)$ ist, da nur eine Schleife im Algorithmus vorhanden ist, die über alle Elemente läuft. Dies ist daher auch der beste Algorithmus für eine ungeordnete Liste von Werten, da jedes Element mindestens einmal angeschaut werden muss, ob es nicht das größte Element ist.

Diese Lösung wurde laut Wikipedia von Jay Kadane innerhalb von Minuten entwickelt, nachdem er bei einem Seminar an der Carnegie Mellon University von dem Problem gehört hatte (siehe [Wikipedia Artikel über Maximum Subarray Problem](https://en.wikipedia.org/wiki/Maximum_subarray_problem))

## Literatur

Solymosi, Grude: Grundkurs Algorithmen und Datenstrukturen, Kapitel 2, [Gleichwertige Lösungen](http://www.springer.com/cda/content/document/cda_downloaddocument/9783658061951-c1.pdf?SGWID=0-0-45-1469806-p176975498), siehe auch Link zum [Kapitel des Springerbuch](https://rd.springer.com/chapter/10.1007/978-3-658-17546-7_2), Springer Verlag, 2017

Wolfgang Urban, HIB Wien, Manuskript [Maximale Teilsummen](https://bio.informatik.uni-jena.de/wp/wp-content/uploads/2017/12/MaxPartSums.pdf), 2003 

Largest Sum Contiguous Subarray, Lösungen in verschiedenen Programmiersprachen, Geeks for geeks, siehe [Link](https://www.geeksforgeeks.org/largest-sum-contiguous-subarray/) 

Wikipedia, Maximum Subarray Problem, siehe [Link](https://en.wikipedia.org/wiki/Maximum_subarray_problem)

Tushar Roy, Maximum Sum Rectangular Submatrix in Matrix dynamic programming 2D Kadane Algorithm , [Youtube Tutorial](https://www.youtube.com/watch?v=yCQN096CwWM)