# Streams 


##### Marcel Lüthi, Departement Mathematik und Informatik, Universität Basel

Ziemlich in den Anfängen dieser Vorlesung haben wir Arrays kennengelernt. Arrays sind ein Mechanismus von Java, um eine fixe Anzahl von Daten gleichen Typs zu speichern. Arrays sind direkt in die Programmiersprache Java integriert. Sie sind extrem schnell und erfahren spezielle Unterstützung auf der Java Virtual Machine. Jedoch sind sind sie nicht sehr komfortabel zu benutzen und es fehlen einige wichtige Funktionen, die wir in der täglichen Programmierung brauchen. Zum Beispiel gibt es keine Möglichkeit, die grösse von Arrays dynamisch zu verändern. 

Mit `List` haben wir eine erste Abstraktion kennengelernt, die das Arbeiten mit Sequenzen von Elementen einfacher macht. Java bietet aber noch weitere Abstraktionen. `Collection` ist ein Interface, welches alle möglichen Arten von *Sammlungen* von Elementen repräsentiert (siehe [API-Doc](https://docs.oracle.com/en/java/javase/17/docs/api/java.base/java/util/Collection.html). Dazu gehören nicht nur `List` sondern auch Datenstrukturen wie `Set`, `Queue` oder `Map` (siehe [Übersicht der Collection Klassen](https://docs.oracle.com/en/java/javase/17/docs/api/java.base/java/util/doc-files/coll-overview.html)). 

Ein weitere Abstraktion ist `Iterable`. Iterable ist ein Interface, welches von einer Klasse implementiert werden muss, damit wir über die Elemente mit dem erweiterten for-loop iteratieren können.

Auf einer noch höheren Abstraktionsebene befinden sich die Klasse `Stream` ([API-Doc](https://docs.oracle.com/en/java/javase/17/docs/api/java.base/java/util/stream/Stream.html)). Stream repräsentiert Folgen von Elementen, die sogar im Prinzip unendlich lang sein können und jeweils nur Elementweise, in der von der Folge vorgegebenen Reihenfolge, bearbeitet werden. Streams erlauben keinen Zugriff auf die einzelnen Elemente, sondern die Elemente können nur über Operationen wie `map` und `filter` bearbeitet werden. 

### Streams erzeugen

Streams werden typischerweise aus bereits vorhanden Collections, wie zum Beispiel Listen oder Arrays erzeugt. 

In [41]:
import java.util.List;
import java.util.LinkedList;
import java.util.stream.Stream;


LinkedList<Integer> l = new LinkedList<Integer>();
for (int i = 0; i < 10; i = i + 1) {
    l.add(i);
}


Stream<Integer> intStream =  l.stream();

#### Miniübung

* Geben Sie `intStream` mit `System.out.println` aus. Was beoabachten Sie? Warum ist das so?

Es gibt auch Streams, die für konkrete, primitive Datentypen spezialisiert sind. Der wichtigste ist vielleicht `IntStream`. Auf diesem ist auch eine Funktion definiert, die uns erlaubt Zahlen in einem gewissen Bereich einfach zu generieren. 

In [42]:
import java.util.stream.IntStream;

IntStream intStream = IntStream.range(0, 10);

Um einen `IntStream` in den entsprechenden Stream des zugehörigen nicht-primitiven Datentyps zu konvertieren, steht die Methode `boxed` zur Verfügung:

In [43]:
Stream<Integer> integerStream = intStream.boxed();

#### Miniübung

* Was passiert, wenn Sie die obige Zelle 2 mal ausführen? Verstehen Sie die Fehlermeldung?

### Collectors

Streams können wir mithilfe eines `Collectors` wieder in eine Liste umwandeln. 

In [44]:
import java.util.stream.Collectors;

In [45]:
import java.util.List;
Stream<Integer> stream = IntStream.range(0, 10).boxed(); 

List<Integer> ll = stream.collect(Collectors.toList());
System.out.println(ll);


[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


### Arbeiten mit Streams

Wir manipulieren die Elemente in eine Stream, indem wir Funktionen darauf ausführen. Die wichtigsten methoden in diesem Kontext sind `map` und `filter`.  

In [46]:
Stream<Integer> stream = IntStream.range(0, 10).boxed();

stream.map(x -> x * x).collect(Collectors.toList())

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

In [47]:
Stream<Integer> stream = IntStream.range(0, 10).boxed();

stream.filter(x -> x % 2 == 0).collect(Collectors.toList())

[0, 2, 4, 6, 8]

Es gibt aber eine Vielzahl weiterer Methoden die auf Streams definiert sind und als Argument einen Lambda-Ausdrück entgegennehmen, der auf jedem Element angewendet wird. Hier ein paar Beispiele:

In [48]:
Stream<Integer> stream = IntStream.range(0, 10).boxed(); // boxed um in in Integer umzuwandeln
stream.takeWhile(i -> Math.sqrt(i) < 5).collect(Collectors.toList())

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [49]:
Stream<Integer> stream = IntStream.range(0, 10).boxed(); 
stream.allMatch(i -> i * i > 50)

false

In [50]:
Stream<Integer> stream = IntStream.range(0, 10).boxed(); 
stream.anyMatch(i -> i * i > 50)

true

In [51]:
Stream<Integer> stream = IntStream.range(0, 10).boxed(); // boxed um in in Integer umzuwandeln
stream.forEach(s -> System.out.println(s));

0
1
2
3
4
5
6
7
8
9


### Miniübung

* Was macht `anyMatch`? Was macht `allMatch`? Experimentieren Sie. 
* können Sie statt dem Lambda-Ausdruck in der Methode `forEach` eine Methodenreferenz nutzen um die Elemente auszugeben?

### Streams unendlicher Länge

*Hinweis:*  Die Nachfolgend eingeführten Beispiele sind sehr fortgeschritten und als Ausblick zu verstehen. Sie müssen diese nicht im Detail verstehen oder selbst umsetzen können. 

Wir können auch unendliche lange Sequenzen erzeugen. Hier wird ein Stream aus fortlaufenden Zahlen erzeugt. 

In [52]:
Stream<Integer> infinitelyLongStream = Stream.iterate(1, (Integer i) -> i + 1);

Wir können wie mit endlichen Stream mittels `map`, `filter`, etc. die Elemente transformieren. 
Das folgende Beispiel berechnet alle Quadratzahlen bis 100, die durch 8 Teilbar sind.  

In [53]:
Stream<Integer> infinitelyLongStream = Stream.iterate(1, (Integer i) -> i + 1);

infinitelyLongStream.map(i -> (i * i)).filter(i -> i % 8 == 0).takeWhile(i -> i < 1000).collect(Collectors.toList())

[16, 64, 144, 256, 400, 576, 784]

Wir können auch einen unendlich lange Folge von Zusatzzahlen erzeugen. Im Folgenden erzeugen wir so lange Zufallszahlen, bis eine der Zahlen im Interval $[-10000, 10000]$ liegt. Dann zählen wir, wieviele Zahlen wir erzeugt haben, bis dies der Fall war. 

In [54]:
import java.util.Random;

Random rng = new Random();

Stream<Integer> randomStream = Stream.generate(rng::nextInt);

randomStream.takeWhile(i -> (i < -10000) || (i > 10000)).count()

32015

#### Miniübung

* Was für ein Funktionsobjekt nimmt `Stream.generate` entgegen (also Predicate, Consumer, Supplier, Operator)?
* Überlegen Sie sich folgendes: Wie ist es möglich, dass wir mit einer unendlich langen Sequenz arbeiten können? Sollte das nicht unendlich lange dauern?