# Streams 


#### Andreas Morel-Forster, Marcel Lüthi</br>Departement Mathematik und Informatik, Universität Basel

Zu Beginn der Vorlesung haben wir gelernt, Werte in Variablen zu speichern. Für mehrere Werte konnten wir folgendes verwenden:

In [None]:
int i1 = 0;
int i2 = 2;

So konnten wir die Werte nur einzeln bearbeiten. Danach haben wir Arrays kennengelernt um eine Reihe von Elementen vom selben Typ zu speichern. Mit Schleifen war es möglich die Elemente effizient zu bearbeiten:

In [None]:
int[] arr = new int[4];
for(int i = 0; i < 4; i = i + 1) {
    arr[i] = i;
}

Wir haben jedoch auch die Limitierungen kennegelernt und gesehen, dass Arrays nicht sehr komfortabel zu benutzen sind. Deshalb haben wir dann unsere eigene `LinkedList` Klasse entwickelt. So haben wir eine erste Abstraktion kennengelernt, das Interface `List`, was das Arbeiten mit einer Reihe von Elementen noch einfacher macht. Java bietet aber noch weitere Abstraktionen. `Collection` ist ein Interface, welches alle möglichen Arten von *Sammlungen* von Elementen repräsentiert (siehe [API-Doc](https://docs.oracle.com/en/java/javase/17/docs/api/java.base/java/util/Collection.html)). Dazu gehört nicht nur `List` sondern auch Datenstrukturen wie `Set`, `Queue` oder `Map` (siehe [Übersicht der Collection Klassen](https://docs.oracle.com/en/java/javase/17/docs/api/java.base/java/util/doc-files/coll-overview.html)). 

Ein weitere Abstraktion ist `Iterable`. `Iterable` ist ein Interface, welches von einer Klasse implementiert werden muss, damit wir über die Elemente mit der erweiterten `for`-Schleife iterieren können. Das bearbeiten von einer Serie von Elementen wurde so noch komfortabler:

In [None]:
int[] arr = new int[4];
for(int e : arr) {
    e = 1;
}

Auf einer noch höheren Abstraktionsebene befindet sich die Klasse `Stream` ([API-Doc](https://docs.oracle.com/en/java/javase/17/docs/api/java.base/java/util/stream/Stream.html)).
Streams repräsentiert Folgen von Elementen.
Im Prinzip können diese Folgen sogar unendlich lange sein.
Die Folgen werden nur als ganzes bearbeitet.
Die jeweiligen Operationen werden jedoch elementweise auf der ganzen Folge angewendet.
Wir haben bereits `map` und `filter` kennen gelernt.
Streams erlauben keinen Zugriff auf die einzelnen Elemente.

In [None]:
// ... (Zelle kann nicht ausgeführt werden, und ist nur zur Demonstration)
list.map(x -> x + 2);
list.filter(x -> x % 2 == 0);

> Hinweis: In diesem Notebook beschränken wir uns auf den wesentlichen Java-Code und lassen umgebende Klassen oder Methoden meist weg. Dies ist so nur in Jupyter-Notebooks (und JShell) und nicht in regulärem Java-Code möglich.

### Streams erzeugen

Es gibt unterschiedliche Wege einen Stream zu erzeugen.
Naheliegend zum Thema LinkedList, schauen wir uns zuerst an, wie man einen Stream ausgehend von einer vorhanden Collection erzeugen kann.
Wir verwenden die `LinkedList` von Java und füllen diese mit den Zahlen 0 bis und mit 9.
Dafür verwenden wir einen uns schon lange bekannten `for`-Loop.
Davon erzeugen wir unseren ersten Stream.

In [5]:
import java.util.List;
import java.util.LinkedList;
import java.util.stream.Stream;

LinkedList<Integer> l = new LinkedList<Integer>();
for (int i = 0; i < 10; i = i + 1) {
    l.add(i);
}

Stream<Integer> intStream =  l.stream();

System.out.println(intStream);
// Die Ausgabe gibt den Typ und eine Speicheradresse aus, nicht die Elemente.
// Die Methode toString ist nicht überladen und es wird sehr wahrscheinlich diejenige von Object benutzt.

java.util.stream.ReferencePipeline$Head@7288a5c1


#### Miniübung

* Geben Sie die Variable `intStream` mit `System.out.println` aus. Was beoabachten Sie? Warum ist das so?

Es gibt auch Streams welche für konkrete, primitive Datentypen ausgelegt sind. Der wichtigste ist vielleicht `IntStream`. Auf diesem ist auch eine Methode definiert, die uns erlaubt Zahlen in einem gewissen Bereich einfach zu generieren.

Wir erzeugen erneut einen Stream mit den Zahlen von 0 bis und mit 9.

In [6]:
import java.util.stream.IntStream;

IntStream intStream = IntStream.range(0, 10);

Wir können einen `IntStream` in den entsprechenden Stream des zugehörigen nicht-primitiven Datentyps konvertieren.
Dazu steht die Methode `boxed` zur Verfügung.

#### Miniübung

* Was passiert, wenn Sie die folgende Zelle 2 mal ausführen? Verstehen Sie die Fehlermeldung?

In [7]:
Stream<Integer> integerStream = intStream.boxed();
// Diese Zelle ergibt beim zweiten Mal ausführen einen Fehler.
// Ein Stream kann nur einmal verwendet werden. Danach ist er verbraucht oder gar geschlossen.

### Zurück zur Collection

Die Elemente von einem Stream können wir mit Hilfe eines `Collectors` in eine Collection einfügen. Wir wandeln also den `Stream` um in eine `Collection`.

In [8]:
import java.util.stream.Collectors;

Für die Umwandlung können wir die Methode wählen, hier `toList`. Die Wahl bestimmt was für eine Collection zurück gegeben wird. Nachfolgend sehen wir einen weiteren Weg wie wir eine Liste mit den Zahlen von 0 bis und mit 9 füllen können. 

In [9]:
import java.util.List;

Stream<Integer> stream = IntStream.range(0, 10).boxed(); 

List<Integer> ll = stream.collect(Collectors.toList());

System.out.println(ll);

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


### Arbeiten mit Streams

Wir verändern die Elemente in eine Stream, indem wir Funktionen jeweils auf dem ganzen Stream ausführen.
Die wichtigsten Methoden in diesem Zusammenhang sind `map` und `filter`, welche wir ja schon kennen.

In [10]:
Stream<Integer> stream = IntStream.range(0, 10).boxed();

List<Integer> list = stream
    .map(x -> x * x)
    .collect(Collectors.toList());

System.out.println(list);

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]


In [11]:
Stream<Integer> stream = IntStream.range(0, 10).boxed();

List<Integer> list = stream
    .filter(x -> x % 2 == 0)
    .collect(Collectors.toList());

list

[0, 2, 4, 6, 8]

Es gibt aber eine vielzahl weiterer Methoden die auf Streams definiert sind und deren Verhalten durch einen, der Methode übergebenen, Lambda-Ausdruck bestimmt werden kann. Hier ein paar Beispiele:

In [12]:
Stream<Integer> stream = IntStream.range(0, 10).boxed();

// nimm solange eine Bedingung erfüllt ist
stream
    .takeWhile(i -> Math.sqrt(i) < 2)
    .collect(Collectors.toList())

[0, 1, 2, 3]

In [13]:
Stream<Integer> stream = IntStream.range(0, 10).boxed(); 

// teste ob für alle Elemente ein Prädikat true ergibt
stream
    .allMatch(i -> i * i > 50)

false

In [14]:
Stream<Integer> stream = IntStream.range(0, 10).boxed(); 

// teste ob mindestens für ein Element ein Prädikat zutrifft
stream
    .anyMatch(i -> i * i > 50)

true

In [15]:
Stream<Integer> stream = IntStream.range(0, 10).boxed(); // boxed um in in Integer umzuwandeln

// wendet eine Funktion auf jedes Element an
stream
    .forEach(s -> System.out.println(s));

0
1
2
3
4
5
6
7
8
9


In [16]:
Stream<Integer> stream = IntStream.range(0, 10).boxed(); // boxed um in in Integer umzuwandeln

// verwenden einer Methoden-Referenz
stream
    .forEach(System.out::println)

0
1
2
3
4
5
6
7
8
9


### Miniübung

* Was macht `anyMatch`? Was macht `allMatch`? Experimentieren Sie. 
* können Sie statt dem Lambda-Ausdruck in der Methode `forEach` eine Methodenreferenz nutzen um die Elemente auszugeben?

### Streams unendlicher Länge

*Hinweis:*  Die Nachfolgend eingeführten Beispiele sind sehr fortgeschritten und als Ausblick zu verstehen. Sie müssen diese nicht im Detail verstehen oder selbst umsetzen können. 

Wir können auch unendliche lange Sequenzen erzeugen.
Dazu verwenden wir die Klassen-Methode `iterate` von `Stream`.
Dieser Methode übergeben wir den Wert des ersten Elements sowie eine Funktion, welche basierend auf einem Element, das nächste berechnet.
Als Beispiel wird hier ein Stream aus fortlaufenden Zahlen erzeugt, beginnend mit der 1. 

In [17]:
Stream<Integer> infinitelyLongStream = Stream.iterate(1, (Integer i) -> i + 1);

Wir können wie bei endlichen Streams die Methoden `map`, oder `filter` verwenden um die Elemente zu transformieren. 
Das folgende Beispiel füllt eine Liste mit alle Quadratzahlen bis 1000, die durch 8 Teilbar sind.  

In [18]:
Stream<Integer> infinitelyLongStream = Stream.iterate(1, (Integer i) -> i + 1);

infinitelyLongStream
    .map(i -> (i * i))
    .filter(i -> i % 8 == 0)
    .takeWhile(i -> i < 1000)
    .collect(Collectors.toList())

[16, 64, 144, 256, 400, 576, 784]

Wir können auch einen unendlich lange Folge von Zufallszahlen erzeugen. Im Unterschied zur Methode `iterate` nimmt die Methode `generate` eine Methode ohne Parameter entgegen. Im Folgenden erzeugen wir mit Hilfe der Methodenreferenz `rng::nextInt` so lange Zufallszahlen, bis eine der Zahlen im Interval $[-10000, 10000]$ liegt. Dann zählen wir, wieviele Zahlen wir erzeugt haben, bis dies der Fall war. 

In [19]:
import java.util.Random;

Random rng = new Random();

Stream<Integer> randomStream = Stream.generate(rng::nextInt);

randomStream
    .takeWhile(i -> (i < -10000) || (i > 10000))
    .count()

452290

### Streams debuggen

Ein Problem bei Streams ist, dass diese nur jeweils einmal verwendet werden können. So können wir nach einem Aufruf der Methode `foreach` den Stream nicht noch für eine andere Operation wie zum Beispiel ein `map` verwenden.

Gerade beim Debuggen ist dies nicht sehr handlich.
Doch Java Streams bieten dafür die Methode `Stream<E> peek(Consumer c)` an.
Als Argument können wir einen *Consumer* angeben (siehe Übersicht [Functional Interfaces](https://docs.oracle.com/en/java/javase/17/docs/api/java.base/java/util/function/package-summary.html)).
Beim Debuggen können wir so zum Beispiel die Methodenreferenz `System.out::println` übergeben.

In [20]:
Stream<Integer> infinitelyLongStream = Stream.iterate(1, (Integer i) -> i + 1);

infinitelyLongStream
    .map(i -> (i * i))
    .filter(i -> i % 8 == 0)
    .takeWhile(i -> i < 1000)
    .peek(System.out::println)
    .collect(Collectors.toList())

16
64
144
256
400
576
784


[16, 64, 144, 256, 400, 576, 784]

#### Miniübung

* Verschieben Sie den Aufruf der Methode `peek` jeweils um eine Zeile *nach oben* und führen Sie den Code aus. Was beobachten Sie?
* Überlegen Sie sich folgendes: Wie ist es möglich, dass wir mit einer unendlich langen Sequenz arbeiten können? Sollte das nicht unendlich lange dauern und unendlich viel Speicher benötigen?
* Können Sie die nachfolgende `for`-Schleife umschreiben in funktionales Java?

In [21]:
long cnt = 0;
for(int i = 7000; i > 1234; i = i - 1) {
    if (i % 41 == 0 && i % 67 == 0) {
        System.out.println(i); // debug output
        cnt = cnt + 1;
    }
}
System.out.println(cnt);

5494
2747
2


In [22]:
long cnt = Stream.iterate(7000, i -> i - 1)
    .takeWhile(i -> i > 1234)
    .filter(i -> i % 41 == 0 && i % 67 == 0)
    .peek(System.out::println)
    .count();
    
System.out.println(cnt);

5494
2747
2
