# L√∂sungsmodelle entwerfen

![](../images/serenity/serenity8.jpg)

Flow-Design verfolgt einen verhaltensorientierten Ansatz. L√∂sungen werden von der SOLL-Funktionalit√§t her angegangen. F√ºr Flow-Design lautet die Frage zuerst: Was soll Software tun?

Nicht Datenstrukturen stehen also im Vordergrund, sondern Verhaltensstrukturen. Verhalten konsumiert und produziert Daten. Um zu wissen, wie Daten strukturiert sein sollen, ist also zuerst die Verhaltensproduktion zu kl√§ren.

Was wie womit getan werden soll, entsteht dabei zun√§chst in den K√∂pfen der Entwickler und auf Papier. Die Codierung ist zur√ºckgestellt, bis f√ºr ein klar umrissenes Problem die L√∂sung als Modell vorliegt.

Ein Modell versteht Flow-Design dabei ganz allgemein so:

> Modell = (Funktion, Beziehung, Funktion)\*

Ein Modell ist eine Menge von Tupeln, in denen je zwei Funktion in Beziehung zueinander gesetzt werden.

Wie auch immer Modelle dargestellt werden, aus ihnen m√ºssen programmiersprachliche Funktionen abgeleitet werden k√∂nnen. In Modellen findet sich keine Logik; sie sind deklarativ. Aber ihre Bausteine stehen f√ºr Funktionen, die sp√§ter in der Codierung mit Logik gef√ºllt werden.

Beziehungen zwischen Funktionen k√∂nnen unter anderem sein:

* Abh√§ngigkeit: Eine Funktion ruft eine andere auf.
* Sequenz: Eine Funktion steht in einem Fluss vor oder nach einer anderen.
* Parallelit√§t: Eine Funktion kann/muss parallel zu einer anderen ausgef√ºhrt werden.
* Aggregation: Zwei Funktionen sind in einem Modul zusammengefasst.
* Gemeinsame Daten: Zwei Funktionen nutzen dieselben Daten.
* Konkretisierung: Zwei Funktionen stehen in einer Vererbungsbeziehung.

Die Deklarativit√§t von Modellen im Flow-Design macht aus, dass ihre Bausteine f√ºr angenommene Probleml√∂sungen stehen. Entweder wird dann das Problem an anderer Stelle im Modell durch eine Verfeinerung gel√∂st. Oder eine im Modell offen gebliebene Annahme wird sp√§testens in der Codierung mittels Logik erf√ºllt.

![](images/df1.png)

Bei all dieser Allgemeinheit in der Definition von Modellen hat Flow-Design allerdings einen klaren Favoriten als Modellierungsansatz. Flow-Design steht f√ºr die √úberzeugung, dass Softwarel√∂sungen zun√§chst und ganz fundamental Produktionsprozesse sind, die auf Daten arbeiten und also als Datenfl√ºsse modelliert werden k√∂nnen. Der Entwurf im Flow-Design beginnt daher gemeinhin mit einer Datenflussmodellierung.

## Mit Datenfl√ºssen modellieren

Die Datenflussmodellierung beginnt gew√∂hnlich mit einer in der Analyse ermittelten Interaktion repr√§sentiert durch ein Nachrichtenpaar und ggf. Seiteneffekte. Ausgangspunkt ist eine Funktionseinheit, die Verhalten zeigen soll in Form einer klar definierten Datentransformation. Sie stellt die Wurzel des L√∂sungsansatzes dar. Sie repr√§sentiert die angenommen erf√ºllten Anforderungen.

![](images/df2.png)

Wie aufw√§ndig die L√∂sung eines so gestellten Verhaltensproblems sein mag, ist seiner formalen Darstellung nicht anzusehen. Das ist aber auch nicht n√∂tig, wie sich zeigen wird. Wichtiger ist die einfachheit der Darstellung und ihre Klarheit im Sinne einer Codierung.

### 0-dimensionale Datenfl√ºsse

Eine Funktionseinheit, die Input in Output √ºberf√ºhrt, ist das kleinstm√∂gliche Datenfluss-Modell. Sie entspricht einem Punkt im dreidimensionalen Raum, ist also 0-dimensional.

![](images/df3.png)

#### Notation

So leichtgewichtig die Notation f√ºr solch eine Repr√§sentanz einer Probleml√∂sung sein mag, so sind doch ein paar Hinweise angebracht:

* Eine Funktionseinheit dargestellt als "Blase" oder Kreis oder Ellipse, also als "runde Form" steht f√ºr etwas, das getan werden soll; sie l√∂st ein Problem durch ihre Transformation von Input zu Output. Deshalb ist ihre Benennung mit einem Verb oder einer Verbphrase sinnvoll. Ein Imperativ muss es nicht sein, aber darf es nat√ºrlich. Zudem sollte die Benennung relevant f√ºr das Umfeld sein, also orientiert an der Dom√§nensprache statt technisch. Au√üerdem - und vielleicht sogar am wichtigsten - sollte die Bennung keinen Hinweis auf die L√∂sung(simplementation) enthalten. Die wird im Modell nur gew√ºnscht, nicht gewusst. **Es geht im Modell ums Was und Warum, nicht ums Wie.**
* Datenfl√ºsse werden durch Pfeile zur und von der Funktionseinheit angezeigt. Pfeile werden im Flow-Design ausschlie√ülich f√ºr diesen Zweck benutzt! Pfeile stellen also keine Abh√§ngigkeiten dar, sondern unidirektionale Datenkan√§le, deren Quellen und Senken einander nicht kennen.
* Was flie√üt, wird immer (!) an Pfeilen in Klammern kurz beschrieben. Auch hier geht es vor allem ums Was, nicht ums Wie. Daten werden mit Substantiven benannt. Meist geschieht das in Kleinschreibung und ohne Datentyp, weil der offensichtlich ist. Aber es kann auch ein Datentyp explizit hinzugef√ºgt werden. Oder Daten werden in Gro√üschreibung benannt und stehen damit selbst f√ºr einen Datentyp.

![](images/df4.png)

##### Zustandsbehaftete Funktionseinheiten

Funktionseinheiten arbeiten vor allem auf dem Input, der in sie einflie√üt. Eintreffender Input triggert ihr Verhalten. Aber Funktionseinheiten sind nicht per se *pur*. Flow-Design hat kein Ideal von "pure functional units" wie die Funktionale Programmierung "pure functions" favorisiert. Flow-Design empfiehlt Zustandslosigkeit bzw. Seiteneffektfreiheit, wo sie sinnvoll und machbar sind. Doch wenn sich das (zun√§chst) als unintuitiv erweisen sollte, sind Zustand und Seiteneffekte v√∂llig akzeptable - sollten jedoch angezeigt werden.

![](images/df5.png)

Wie Zustand genau realisiert wird, ist wieder nicht Sache des Modells. Es soll vor allem klar gemacht werden, dass es eine Einflussgr√∂√üe f√ºr die Transformation gibt, die √ºber Nachrichten hinweg relevant ist.

Wenn Zustand an gewisser Stelle vermieden werden soll, kann er auch in den Fluss extrahiert werden:

![](images/df6.png)

Dasselbe gilt f√ºr Seiteneffekte. Die werden √ºber einen API hergestellt, der auch in spezifischeren Funktionseinheiten up-/downstream enger gekapselt werden k√∂nnte:

![](images/df7.png)

##### Datenstr√∂me

Die meisten Funktionseinheiten transformieren eine Input-Nachricht in eine Output-Nachricht. Dabei ist es unerheblich, ob Input oder Output aus einem Datum bestehen oder ein Feld sind, eine Liste oder eine andere Sammlung von vielen Daten.

![](images/df8.png)

Wenn Sammlungen (*collections*) flie√üen, kann deren Typ explizit angeben werden - z.B. `(dateiname[])`, `(dateinamen:List<string>)`. Im Allgemeinen ist das jedoch schon zu viel Implementationsdetail f√ºr ein Modell. Deshalb ziegt Flow-Design ein schlichtere Angabe f√ºr "mehrere Daten" vor, die "in einem Schwung" ein-/ausflie√üen: `(dateiname*)`. Der Datenangabe ist einfach nur unmittelbar und in der Klammer ein Sternchen nachzustellen.

![](images/df9.png)

Eine oft zu vernachl√§ssigende, am Ende jedoch sehr interessante Eigenschaft von Datenfl√ºssen im Gegensatz zu Kontrollfl√ºssen ist jedoch, dass alle Funktionseinheiten im Grunde *gleichzeitig* aktiv sind. Nur weil Daten produziert sind und ausflie√üen, hei√üt das nicht, dass eine Funktionseinheit die Kontrolle abgibt. Sie kann auch weiterarbeiten, w√§hrend der Output zu einer anderen Funktionseinheit flie√üt und gleichzeitig dort verarbeitet wird. Produzenten und Konsumenten sind grunds√§tzlich nebenl√§ufig und asynchron - und nur, wenn das nicht wichtig ist, werden sie sequenziell und synchron implementiert.

Die grunds√§tzliche Nebenl√§ufigkeit hat nun zur Folge, dass eine Funktionseinheit nicht nur einmal f√ºr einen Input einen Output produzieren kann, sondern mehrfach. Dann entsteht keine *collection* von Nachrichten, sondern ein *stream*. Jedes Element in solch einem  Strom ist eine eigene Nachricht. Angezeigt wird das im Modell durch ein Sternchen *hinter* der Klammer, z.B. `(dateiname)*`.

Str√∂me sind nur relevant zu markieren als Output. Die Anlieferung von Input erfolgt im Grunde immer als Strom. Notiert wird das nur nicht speziell; es ist normal. Auf jede Nachricht im Input-Strom reagiert eine Funktionseinheit dann.

![](images/df10.png)

#### √úbersetzung

"Bubbles don't crash" - das ist wahr und deshalb ist es Flow-Design wichtig, dass die "Bubbles" seiner Modelle m√∂glichst einfach in Code √ºbersetzt werden k√∂nnen, der crashen kann, um Modell-Ideen zu √ºberpr√ºfen.

Die naheliegende √úbersetzung einer Funktionseinheit ist die in eine Funktion:

![](images/df11.png)

In [None]:
int CalcAverage(IEnumerable<int> werte) {
    return werte.Sum() / werte.Count();
}

display($"Durchschnitt von [1,5,9,3]: {CalcAverage(new[]{1,5,9,3})}")

Das funktioniert gut, solange f√ºr jeden Input-Wert ein Output-Wert bzw. eine Output-Collection erzeugt wird. Und auch mit Tupeln funktioniert es, wenn die Programmiersprache Tupel direkt unterst√ºtzt oder man gewillt ist, f√ºr ein Tupel einen Datentypen zu definieren:

In [None]:
(T head, IEnumerable<T> tail) Split<T>(IEnumerable<T> list)
    => (list.First(), list.Skip(1));

var result = Split(new[]{2,7,9,3});
display($"head: {result.head}");
foreach(var e in result.tail) display($"  tail element: {e}");

Funktionen sind nat√ºrliche "Objekte" im Sinne von Alan Kay, weil sie f√ºr eine empfangene Nachricht - *dass* man sie aufruft und mit welchen Parametern man sie aufruft - ein Resulat herstellen, ohne zu wissen, woher sie aufgerufen wurden und wie das Resultat benutzt wird. Das PoMO wird eingehalten.

##### Datenstr√∂me

Allerdings k√∂nnen Funktionen f√ºr jedes eintreffende Nachricht, d.h. f√ºr jeden Aufruf, nur einmal ein Resultat herstellen (auch wenn das wom√∂glich aus mehreren Elementen besteht). Was aber, wenn Input in einen Strom von Resultaten umzuwandeln ist?

Hier bricht die √úbersetzung der "Blase" in eine Funktion. Bei genauerem Hinsehen ist es stattdessen so, dass die Punkte, wo Pfeile auf eine Funktionseinheit treffen und wo sie sie verlassen, getrennt √ºbersetzt werden:

* Ein eintreffender Pfeil wird in eine Funktion mit Parametern √ºbersetzt.
* Ein ausgehender Pfeil wird in ein Funktionsresultat oder eine *continuation* √ºbersetzt.

Ein Funktionsresultat ist dann m√∂glich, wenn nur einmal ein Output generiert wird. Andernfalls muss Output √ºber einen Funktionszeiger an die Umwelt weitergeschoben werden. Dieser Funktionszeiger muss eine *Prozedur* beschreiben (Funktion ohne R√ºckgabewert), deren Name nicht auf weitere downstream Verarbeitung des Output hindeutet, da sonst das PoMO verletzt w√ºrde.

![](images/df12.png)

In [42]:
IEnumerable<string> SplitIntoWords(string text)
    => text.Split(new[]{' ', '\n', '\t'}, StringSplitOptions.RemoveEmptyEntries);

var words = SplitIntoWords("the quick brown fox");
foreach(var w in words) display(w);

the

quick

brown

fox

In [43]:
void EnumerateWords(string text, Action<string> onWord)
    => text.Split(new[]{' ', '\n', '\t'}, StringSplitOptions.RemoveEmptyEntries).ToList()
           .ForEach(onWord);

EnumerateWords("humpty dumpty sat on a wall",
    word => display(word));

humpty

dumpty

sat

on

a

wall

Die Codierung eines Output-Datenkanals mit einer continuation ist die universellere. Aber sie ist weniger intuitiv und umst√§ndlicher. Deshalb zieht Flow-Design die √úbersetzung mit Funktionsresultaten vor, wo sie offensichtlich ist oder auch machbar durch Sprachkonstrukte wie Iteratoren (z.B. `IEnumerable<>` in C#).

Streams sind Mengen von einzelnen Werten. Wo sie naheliegend und n√ºtzlich im Modell sind, sollten sie angemessen in der √úbersetzung repr√§sentiert werden. Das ist mit continuations, also Funktionszeigern in vielen Programmiersprachen m√∂glich, wenn auch ein wenig gew√∂hnungsbed√ºrftig. Aber die Gew√∂hnung lohnt sich: die √úbersetzung von Modellen wird einfacher, die Testbarkeit des Codes steigt.

##### Zustand

Zustand bzw. Ressourcenzugriff sind Abh√§ngigkeiten einer Funktionseinheit. Sie werden als Abh√§ngigkeiten √ºbersetzt. Zustand ist dabei eine globale Variable im aggregierenden Modul einer Funktion:

![](images/df13.png)

In [44]:
class Accumulator {
    private int _value;
    
    public int Add(int a) {
        _value += a;
        return _value;
    }
}

var accu = new Accumulator();
display($"add 1: {accu.Add(1)}");
display($"add 2: {accu.Add(2)}");
display($"add 3: {accu.Add(3)}");

add 1: 1

add 2: 3

add 3: 6

### 1-dimensionale Datenfl√ºsse

Einzelne Funktionsheiten werden in Modellen zu Datenfl√ºssen mehrere Funktionseinheiten zusammengesetzt. Flow-Design nennt das auch "zusammenstecken" oder "verdrahten" in Anlehnung an elektronische Schaltungen, die √ºbrigens ganz nat√ºrlich dem PoMO folgen. Aus 0-dimensionalen Modellen werden so 1-dimensionale: viele punktuelle Funktionseinheiten zusammen ergeben einen linearen Fluss.

![](images/df14.png)

Wenn der Output einer Funktionseinheit in der Form dem Input einer anderen entspricht, k√∂nnen beide in eine producer-consumer Beziehung gebracht werden. Sie spannen dann einen Transformationsfluss auf.

Die √úbersetzung eines 1-dimensionalen Flusses ist trivial: die Funktionen der einzelnen Funktionseinheiten...

In [45]:
// Funktionseinheiten
int[] Map(string roman)
    => roman.ToCharArray()
            .Select(romanDigit => romanDigit switch {
                        'I' => 1, 'V' => 5, 'X' => 10,
                        'L' => 50, 'C' => 100, 'D' => 500,
                        'M' => 1000
                    })
            .ToArray();

int[] Negate(int[] values) {
    var negatedValues = (int[])values.Clone();
    for(var i=0; i<negatedValues.Length-1; i++)
    if (negatedValues[i]<negatedValues[i+1])
        negatedValues[i] *= -1;
    return negatedValues;
}

int Sum(IEnumerable<int> values) {
    var sum = 0;
    foreach(var v in values) sum += v;
    return sum;
}

 ...werden schlicht nacheinander aufgerufen. Der Compiler gibt Feedback, ob die Bausteine eines Datenflusses zueinander passen.

In [46]:
// Datenfluss
var values = Map("XIV");
values = Negate(values);
var decimalNumber = Sum(values);

display($"XIV={decimalNumber}");

XIV=14

In dieser √úbersetzung verliert das Modell des Datenflusses zwar seine Eigenschaft der grunds√§tzlichen Asynchronizit√§t seiner Transformationsschritte, doch das ist in den meisten F√§llen unerheblich. Datenfl√ºsse sind auch Datenfl√ºsse, wenn sie synchron operieren. Das Modell hat trotzdem einen hohen Wert durch seine Abstraktion.

Die Funktionseinheiten, die im 1-dimensionalen Datenfluss verdrahtet werden, sind (zun√§chst) Operationen. Der Datenfluss stellt ihre Integration dar: alle einzelnen Transformationen bilden in spezifischer Weise zusammengesteckt eine gr√∂√üere Transformation.

#### Datenstr√∂me

Solche √úbersetzung von 1-dimensionalen Fl√ºssen als L√∂sungen von gr√∂√üeren Problemen in Form einer Abfolge von L√∂sungen kleinerer Probleme funktionieren auch f√ºr Str√∂me von Einzeldaten statt Collections.

Datenstr√∂me sind n√ºtzlich, wenn...

* ...die Zahl der zu erzeugenden Output-Datenelemente unbekannt und wahrscheinlich gro√ü ist. In dem Fall soll vielleicht vermieden werden, alle Datenelemente in einer Collection im Hauptspeicher zu sammeln.
* ...die Generierung aller Output-Datenelemente erhebliche Zeit in Anspruch nimmt. In dem Fall sollen schon generierte Output-Daten schon downstream in Verarbeitung gehen, w√§hrend weitere beschafft werden.
* ...ein Datenfluss besser zu verstehen und/oder zu √ºbersetzen ist als Strom von Einzeldaten.

Als Beispiel daf√ºr mag die Traversierung eines Verzeichnisbaumes dienen, in dem Dateien eines bestimmten Typs gesucht werden, um sie zu analysieren. Zu ermitteln ist die Gesamtanzahl der Worte in relevanten Dateien.

![](images/df15.png)

Die Zahl der zu pr√ºfenden Dateien ist in so einem Szenario wom√∂glich schwer abzusch√§tzen und/oder die L√∂sung ist leichter "zu denken", wenn die Analyse sich auf einzelne Dateien konzentriert.

Zuerst die √úbersetzung der Funktionseinheiten, der Bausteine des Flusses. Jede ist nur eine kleine Operation mit wenigen Zeilen Code:

In [47]:
void EnumerateFiles(string path, Action<string> onFilename) {
    // Die Logik hier ist aufw√§ndiger als n√∂tig aus didaktischen Gr√ºnden, um einen Output-Strom zu erzeugen.
    var filenames = System.IO.Directory.GetFiles(path);
    foreach(var f in filenames) {
        onFilename(f);
    }
    
    var subdirectories = System.IO.Directory.GetDirectories(path);
    foreach(var d in subdirectories)
        EnumerateFiles(d,
              onFilename);
}

void FilterByEndOfFilename(string filename, string pattern, Action<string> onFilename) {
    if (filename.EndsWith(pattern))
        onFilename(filename);
}

string Load(string filename) 
    => System.IO.File.ReadAllText(filename);

string[] SplitIntoWords(string text)
    => text.Split(new[]{' ', '\n', '\t'}, StringSplitOptions.RemoveEmptyEntries);

void Print(string filename, int numberOfWords) {
    display($"{filename} with {numberOfWords} words");
}

Und dann die √úbersetzung des Flusses. Die mag ein wenig gew√∂hnungsbed√ºrftig sein in der Schachtelung der Lambda-Funktionen als continuations. Doch das verliert sich, wenn man es ein paar Mal geschrieben und gelesen hat. Der Gewinn der Gew√∂hnung liegt dann darin, eine geradlinige √úbersetzung f√ºr Datenfl√ºsse mit Str√∂men zu haben, die in jedem Schritt gut testbar ist.

In [49]:
EnumerateFiles("..",
    filename => FilterByEndOfFilename(filename, ".ipynb",
          filename => {
              var text = Load(filename);
              var words = SplitIntoWords(text);
              Print(filename, words.Length);
          })
);

../anforderungen.ipynb with 4475 words

../prozess.ipynb with 1827 words

../anforderung-logik-l√ºcke.ipynb with 3276 words

../index.ipynb with 125 words

../entwurf/entwurf_1.ipynb with 3485 words

../entwurf/.ipynb_checkpoints/entwurf_1-checkpoint.ipynb with 3388 words

../codierung/arbeitsorganisation.ipynb with 37 words

../codierung/.ipynb_checkpoints/arbeitsorganisation-checkpoint.ipynb with 37 words

../analyse/slicing.ipynb with 49 words

../analyse/.ipynb_checkpoints/slicing-checkpoint.ipynb with 49 words

../anatomie/radikale_oo.ipynb with 3736 words

../anatomie/ioda.ipynb with 3216 words

../anatomie/dimensionen.ipynb with 2475 words

../anatomie/.ipynb_checkpoints/radikale_oo-checkpoint.ipynb with 3736 words

../anatomie/.ipynb_checkpoints/dimensionen-checkpoint.ipynb with 2475 words

../anatomie/.ipynb_checkpoints/ioda-checkpoint.ipynb with 3216 words

../.ipynb_checkpoints/anatomie_1-checkpoint.ipynb with 3734 words

../.ipynb_checkpoints/anforderung-logik-l√ºcke-checkpoint.ipynb with 3276 words

../.ipynb_checkpoints/anatomie_3-checkpoint.ipynb with 3372 words

../.ipynb_checkpoints/prozess-checkpoint.ipynb with 1827 words

../.ipynb_checkpoints/index-checkpoint.ipynb with 115 words

../.ipynb_checkpoints/anatomie_2-checkpoint.ipynb with 2549 words

../.ipynb_checkpoints/anforderungen-checkpoint.ipynb with 4473 words

`EnumerateFiles` erzeugt f√ºr eine Input-Nachricht einen Strom von Output-Nachrichten. `FilterByEndOfFilename` hingegen hat die Aufgabe, Input zu verschlucken, falls er nicht dem Filterkriterium entspricht. Das klingt sehr unterschiedlich, ist letztlich jedoch dasselbe: Der Strom dient in beiden F√§llen zur Ausgabe einer unbekannten Zahl von Elementen, das k√∂nnen 1 oder 1000 sein - oder auch gar keines.

Eine Funktion, die ein Resultat mittels `return` liefert, ist gezwungen, eines zu produzieren, selbst wenn das `null` sein sollte. Eine Funktion, die ihr Resultat stattdessen √ºber eine continuation "hinausschiebt", kann auch entscheiden, gar kein Resultat zu liefern! Deshalb ist die √úbersetzung von Datenfluss-Funktionseinheiten in Funktionen mit continuation die universellere, wenn auch etwas aufw√§ndigere.

### 2-dimensionale Datenfl√ºsse

Funktionen sind in 0-dimensionalen und 1-dimensionalen Datenfl√ºssen die Container f√ºr Logik. Sie komponieren aus "Logikbausteinen" ein Verhalten, f√ºr das sie stehen.

Obwohl 1-dimensionale Datenfl√ºsse leicht zu verstehen sind auch in der √úbersetzung in Funktionsaufrufsequenzen, skalieren sie nicht. Mehr als 5 oder vielleicht 10 Funktionseinheiten "in einer Reihe" oder Funktionsaufrufe nacheinander, sind aus mehreren Gr√ºnden nicht praktikabel:

* Im Modell wie im Code sind so lange Sequenzen trotz ihrer formalen Einfachheit nicht mehr gut zu √ºberblicken.
* Die Gefahr, dass Datenfl√ºsse das SLA verletzen, steigt mit jeder weiteren Funktionseinheit.
* Die Wahrscheinlichkeit, dass es in Datenfl√ºssen Gruppen von Funktionseinheiten mit h√∂herer Koh√§sion untereinander gibt als zu anderen, steigt mit jeder weiteren Funktionseinheit.

Schon zum oben stehenden Datenfluss zur Analyse von Dateien kann gefragt werden, ob er f√ºr das Verst√§ndnis eine optimale L√§nge hat.

#### Integrationen als Bedeutungseinheiten

Einerseits hat ein Leser bei dem 1-dimensionalen Datenfluss "alles auf einmal im Blick". Alle Operationen stehen in einer Reihe. Andererseits muss ein Leser sich die Bedeutung des Ganzen aus den Bedeutungen der Teile erst zusammenreimen. Das ist bei 5 Funktionseinheiten schwieriger als bei 4, 3 oder 1.

Was tut der Datenfluss? Kann das mit 1 Funktionseinheit ausgedr√ºckt werden? Selbstverst√§ndlich!

![](images/df16.png)

Die eine Funktionseinheit integriert nun explizit die bisherigen Operationen.

Oder gibt es im Datenfluss noch Teile, die wiederum unter einem Begriff zusammengefasst werden k√∂nnen, um ihnen eine eigene Bedeutung zu geben? Beispiele daf√ºr w√§ren:

* Alles au√üer der Ausgabe k√∂nnte als Kernlogik zusammengefasst werden. Die Ausgabe eines Ergebnisses ist etwas ganz anderes, als das Ergebnis herzustellen. Dadurch w√ºrde die Ergebnisherstellung separat von der Benutzerschnittstelle testbar.
* Die Beschaffung der relevanten Dateinamen k√∂nnte zusammengefasst werden. Die Traversierung des Dateisystems ist etwas ganz anderes, als mit einer Datei umzugehen.
* Laden und Zerlegen einer Datei k√∂nnte zusammengefasst werden. Eine Datei als Text zu beschaffen, statt als Byteblock, ist schon eine Abstraktion, die der .NET Framework zur Verf√ºgung stellt. Warum nicht den Dateizugriff weiter abstrahieren und eine Datei als Collection von Worten repr√§sentieren?

Wie man sich entscheidet bei den Zusammenfassungen, ist weniger wichtig, als dass Zusammenfassungen zur Verbesserung der Verst√§ndlichkeit und der Testbarkeit m√∂glich und einfach sind. Die eine beste Zusammenfassung wird es wohl nicht geben. Da Integrationen von Teilfl√ºssen jedoch billig herzustellen und auch wieder aufzul√∂sen sind, kann die Integrationshierarchie jederzeit umgestellt werden.

Verst√§ndnis ver√§ndert sich mit der Zeit: Es wird aufgebaut durch Besch√§ftigung mit Code - aber es wird auch wieder abgebaut, wenn die Besch√§ftigung abnimmt. Eine Struktur, die dem heutigen Verst√§ndnis angemessen ist, passt wom√∂glich nicht mehr optimal zum morgigen Verst√§ndnis.

In dieser Hinsicht unterliegen Modelle und Code trotz ihrer Immaterialit√§t einem Verschlei√ü. Ohne, dass Code "sich bewegte" oder ver√§ndert w√ºrde, verliert er an "Verst√§ndlichkeitsqualit√§t". Das hat zwei Konsequenzen:

* Die Diskussion um die allerbeste Struktur sollte begrenzt werden. Die allerbeste Struktur, selbst wenn sie f√ºr heute gefunden werden k√∂nnte, ist morgen nicht mehr die allerbeste. Nach dem Herstellungszeitpunkt verliert jede auf Verst√§ndlichkeit getrimmte Struktur sofort und automatisch an Wert. Warum also bis aufs Letzte optimieren?
* Strukturen f√ºr Verst√§ndlichkeit sollten gewartet werden. D.h. sie sollten proaktiv in angemessenen Wartungsinverallen aufgesucht und dem aktuellen Verst√§ndnisstand angepasst werden. Sonst besteht die Gefahr, dass sie zur Unzeit als stark erodiert erfahren werden und viel M√ºhe beim Verst√§ndnis machen.

Die obigen Fragen zu m√∂glichen Integrationen sind daher nur Beispiele daf√ºr, dass und wie m√∂glichen Verst√§ndlichkeitsverbesserungen nachgesp√ºrt werden kann. Nach angemessenem Diskurs muss eine Entscheidung getroffen werden. Die k√∂nnte z.B. so aussehen:

![](images/df17.png)

Ein Datenflussmodell dehnt sich damit sichtbar in 2 Dimensionen aus:

* In der ersten Dimension wird Verhalten im Datenfluss erzeugt: am Anfang einflie√üerder Input wird schrittweise in am Ende ausflie√üenden Output transformiert.
* In der zweiten Dimension findet Abstraktion durch Komposition statt. Kompositionen - Operation wie Integration - fassen verschiedene Teilverhalten zu einem gr√∂√üeren, neuen Gesamtverhalten zusammen. Komposition ist die Abstraktion, die Bequemlichkeit in der Nutzung herstellt.

Kompositionen √§ndern am Verhalten nat√ºrlich nichts. Das Verhalten wird immer nur durch Logik (und Verteilung) beeinflusst. Aber Kompositionen √§ndern an der Verst√§ndlichkeit etwas. Deshalb ist auch der Einwand, dass in einer Integrationshierarchie Operationen und Integrationen wom√∂glich nur einmal verwendet werden, unerheblich. Wenn eine Komposition der Verst√§ndlichkeit oder Testbarkeit dient, dann muss sie nicht gleichzeitig der kurzfristigen Produktivit√§t dienen. Das ist n√§mlich der Zweck von Wiederverwendung.

#### √úbersetzung

Sind Integrationen f√ºr einen Fluss gefunden, lassen sie sich leicht √ºbersetzen: wie Operationen werden sie zu Funktionen. Das ist einerseits sehr n√ºtzlich und intuitiv. Andererseits hat es aber auch einen Nachteil.

Integrationen in Funktionen zu √ºbersetzen, liegt nahe, weil die Darstellung im Modell sich nicht von Operationen unterscheidet. Auch weil w√§hrend des Modellierungsprozesses nicht klar ist, ob Bl√§tter in einer Integrationshierarchie Operationen bleiben oder weiter verfeinert werden, d.h. "in Integrationen umklappen", w√§re eine unterschiedliche Darstellung bzw. Codierung hinderlich.

Andererseits verf√ºhrt die √úbersetzung von Integrationen in Funktionen dazu, Logik in sie "hineinzuschmuggeln". Das w√ºrde dem IOSP widersprechen und mindestens die Testbarkeit senken.

Letztlich √ºberwiegt jedoch f√ºr Flow-Design die Einfachheit. Integrationen werden also zu Funktionen:

In [72]:
void PrintWordsInFiles(string path, string pattern) {
    CountWordsInFiles(path, pattern,
        Print);
}

void CountWordsInFiles(string path, string pattern, Action<string,int> onFile) {
    EnumerateRelevantFiles(path, pattern,
        filename => {
            var words = LoadWordsFromFile(filename);
            onFile(filename, words.Length);
        });
}

void EnumerateRelevantFiles(string path, string pattern, Action<string> onFilename) {
    EnumerateFiles("..",
        filename => FilterByEndOfFilename(filename, pattern,
                      onFilename));
}

string[] LoadWordsFromFile(string filename) {
    var text = Load(filename);
    return SplitIntoWords(text);
}


PrintWordsInFiles("..", ".ipynb");

../anforderungen.ipynb with 4475 words

../prozess.ipynb with 1827 words

../anforderung-logik-l√ºcke.ipynb with 3276 words

../index.ipynb with 125 words

../entwurf/entwurf_1.ipynb with 4778 words

../entwurf/.ipynb_checkpoints/entwurf_1-checkpoint.ipynb with 4776 words

../codierung/arbeitsorganisation.ipynb with 37 words

../codierung/.ipynb_checkpoints/arbeitsorganisation-checkpoint.ipynb with 37 words

../analyse/slicing.ipynb with 49 words

../analyse/.ipynb_checkpoints/slicing-checkpoint.ipynb with 49 words

../anatomie/radikale_oo.ipynb with 3736 words

../anatomie/ioda.ipynb with 3216 words

../anatomie/dimensionen.ipynb with 2475 words

../anatomie/.ipynb_checkpoints/radikale_oo-checkpoint.ipynb with 3736 words

../anatomie/.ipynb_checkpoints/dimensionen-checkpoint.ipynb with 2475 words

../anatomie/.ipynb_checkpoints/ioda-checkpoint.ipynb with 3216 words

../.ipynb_checkpoints/anatomie_1-checkpoint.ipynb with 3734 words

../.ipynb_checkpoints/anforderung-logik-l√ºcke-checkpoint.ipynb with 3276 words

../.ipynb_checkpoints/anatomie_3-checkpoint.ipynb with 3372 words

../.ipynb_checkpoints/prozess-checkpoint.ipynb with 1827 words

../.ipynb_checkpoints/index-checkpoint.ipynb with 115 words

../.ipynb_checkpoints/anatomie_2-checkpoint.ipynb with 2549 words

../.ipynb_checkpoints/anforderungen-checkpoint.ipynb with 4473 words

#### Jo-Jo Modellierung

Im Flow-Design beginnt die Modellierung der L√∂sung eines Problem au√üen und beim Gesamtverhalten. Von dort setzt sich durch Zerlegung von gr√∂√üeren in kleinere Probleme nach innen fort. Sie ist verhaltensorientiert und schrittweise verfeinernd, d.h. rekursiv absteigend: Am Anfang steht eine Funktionseinheit als vorl√§ufige Operation. Deren Transformation wird dann jedoch zerlegt in Schritte, die durch n√§chste vorl√§ufige Operationen in einem Fluss vollst√§ndig geleistet wird, so dass die vorherige Funktionseinheit zu einer Integration wird. Und immer so weiter f√ºr jedes Blatt im 2-dimensionalen Datenflussbaum - bis man am Ende nicht mehr wei√ü, wie eine vorl√§ufige Operation weiter zerlegt werden soll. Dann wird aus der vorl√§ufigen Operation eine endg√ºltige.

Zumindest verl√§uft die Modellierung des Verhaltens idealerweise so. In der Praxis jedoch zeigt sich, dass nicht immer outside-in, top-down eine L√∂sung erkannt wird. Manchmal steht schon am Anfang ein sp√§tere Operation fest und die wird schrittweise an die Wurzel-Funktionseinheit bottom-up angebunden. Oder nach einem ersten Durchstich von der Wurzel bis zu den Operationen scheint es verst√§ndlichkeitsf√∂rdernd, weitere Integrationsebenen einzuziehen. Oder Kind-Knoten im Kompositionsbaum, die unter verschiedenen Eltern-Knoten h√§ngen, werden horizontal verschoben.

![](images/df18.png)

Flow-Design ist insofern weder strickt top-down, noch bottom-up, sondern geht in beide Richtungen vor oder schwingt auch mal seitw√§rts. Das passende Bild f√ºr ihre Bewegungsrichtung ist mithin ein Jo-Jo: der geht immer wieder runter und hoch oder bricht auch mal aus und kommt am Ende zur Ruhe. 

#### Logik in der Integration

Das IOSP ist glasklar: Eine Funktionseinheit ist entweder Operation und steht f√ºr Verhaltenserzeugung durch Logik. Oder sie ist eine Integration und stellt nur einen Fluss zwischen anderen Funktionseinheiten her, wof√ºr keine Logik n√∂tig ist.

Damit formuliert das Prinzip ein Soll, ein Ideal. Und dieses Ideal kann technisch auch immer implementiert werden.

Allerdings ist es eben ein Ideal. Das bedeutet, in seiner Reinheit kann es anderen Zielen auch mal im Wege stehen.

Flow-Design sieht dieses und andere Prinzipien daher pragmatisch. Ja, es soll stets das Ideal im Sinne von Korrektheit und Evolvierbarkeit angestrebt werden. Dabei soll aber auch Augenma√ü bewahrt werden. IOSP, PoMO usw. f√ºr langfristig hohe Produktivit√§t sind auszubalancieren mit Ma√ünahmen f√ºr funktionale und nicht-funktionale Qualit√§ten.

F√ºr Flow-Design sind deshalb gelegentliche "Spuren von Logik" in eigentlich integrierenden Funktionseinheiten akzeptabel. Nicht w√ºnschenswert, aber ok - wenn man denn wei√ü, was man da tut.

Meistens handelt es sich bei diesen Logik-Einsprengseln um Kontrollstrukturen oder triviale selbsterkl√§rende API-Aufrufe.

Als Beispiel mag nochmal die obige Dateianalyse dienen. Mit der Erlaubnis zu etwas Logik in der Integration k√∂nnte die √úbersetzung anders aussehen:

In [81]:
// Schmutzige Integration
void PrintWordsInFiles_v2(string path, string pattern) {
    foreach(var r in CountWordsInFiles_v2(path, pattern)) // Kontrollstrukturüò±
        Print(r.filename, r.numberOfWords);
}

// Schmutzige Integration
IEnumerable<(string filename, int numberOfWords)> CountWordsInFiles_v2(string path, string pattern) {
    foreach(var f in EnumerateRelevantFiles_v2(path, pattern)) { // Kontrollstrukturüò±
        var words = LoadWordsFromFile_v2(f);
        yield return (f, words.Length);
    };
}

// Schmutzige Integration
IEnumerable<string> EnumerateRelevantFiles_v2(string path, string pattern) {
    foreach(var f in EnumerateFiles_v2(path)) // Kontrollstrukturüò±
        if (IsRelevantFile(f, pattern)) // Kontrollstrukturüò±
            yield return f;
}

// Schmutzige Integration
string[] LoadWordsFromFile_v2(string filename) {
    var text = System.IO.File.ReadAllText(filename); // API-Aufrufüò±
    return SplitIntoWords(text);
}


// Ge√§nderte Operation f√ºr den Aufruf in einer schmutzigen Integration
IEnumerable<string> EnumerateFiles_v2(string path) {
    // Die Logik hier ist aufw√§ndiger als n√∂tig aus didaktischen Gr√ºnden, um einen Output-Strom zu erzeugen.
    var filenames = System.IO.Directory.GetFiles(path);
    foreach(var f in filenames) {
        yield return f; // Statt √ºber eine Continuation wird ein Strom jetzt mittel Iterator erzeugtü§î
    }
    
    var subdirectories = System.IO.Directory.GetDirectories(path);
    foreach(var d in subdirectories)
        foreach(var f in EnumerateFiles_v2(d))
            yield return f; //ü§î
}

// Ge√§nderte Operation f√ºr den Aufruf in einer schmutzigen Integration
bool IsRelevantFile(string filename, string pattern)
    => filename.EndsWith(pattern);


PrintWordsInFiles_v2("..", ".ipynb");

../anforderungen.ipynb with 4475 words

../prozess.ipynb with 1827 words

../anforderung-logik-l√ºcke.ipynb with 3276 words

../index.ipynb with 124 words

../entwurf/entwurf_1.ipynb with 5776 words

../entwurf/.ipynb_checkpoints/entwurf_1-checkpoint.ipynb with 5776 words

../codierung/arbeitsorganisation.ipynb with 37 words

../codierung/.ipynb_checkpoints/arbeitsorganisation-checkpoint.ipynb with 37 words

../analyse/slicing.ipynb with 49 words

../analyse/.ipynb_checkpoints/slicing-checkpoint.ipynb with 49 words

../anatomie/radikale_oo.ipynb with 3736 words

../anatomie/ioda.ipynb with 3216 words

../anatomie/dimensionen.ipynb with 2475 words

../anatomie/.ipynb_checkpoints/radikale_oo-checkpoint.ipynb with 3736 words

../anatomie/.ipynb_checkpoints/dimensionen-checkpoint.ipynb with 2475 words

../anatomie/.ipynb_checkpoints/ioda-checkpoint.ipynb with 3216 words

../.ipynb_checkpoints/anatomie_1-checkpoint.ipynb with 3734 words

../.ipynb_checkpoints/anforderung-logik-l√ºcke-checkpoint.ipynb with 3276 words

../.ipynb_checkpoints/anatomie_3-checkpoint.ipynb with 3372 words

../.ipynb_checkpoints/prozess-checkpoint.ipynb with 1827 words

../.ipynb_checkpoints/index-checkpoint.ipynb with 124 words

../.ipynb_checkpoints/anatomie_2-checkpoint.ipynb with 2549 words

../.ipynb_checkpoints/anforderungen-checkpoint.ipynb with 4473 words

In jeder einzelnen Methode h√§lt sich die Unsauberkeit in Bezug auf das IOSP in Grenzen. Die Methoden bleiben auch klein. Solange beides gegeben ist, steht aus Sicht von Flow-Design ein wenig "Schmutz" nichts entgegen. Wichtiger als die absolute Befolgung des Prinzips sind die Qualit√§ten, die es bef√∂rdert, hier: **Verst√§ndlichkeit und Testbarkeit. Solange diese Qualit√§ten auch trotz (oder wegen?) gewisser Unsauberkeit vorhanden sind, ist etwas Logik in einer Integrationsfunktion ok.**

[Solche "Schmutzreste"](https://ccd-school.de/2017/02/kontrollstrukturen-in-der-integration/) sind vor allem simple Schleifen, auch mal eine Fallunterscheidung oder ein trivialer API-Aufruf. **Wichtig ist, dass diese Logik so einfach ist, dass sie selbst nicht getestet werden muss.** Das ist z.B. hier der Fall:

```csharp
if (IsRelevantFile(f, pattern))
    yield return f;
```

Die `if`-Anweisung selbst kann nicht falsch geschrieben werden; der Compiler w√ºrde das beanstanden. Die eigentliche Logik steckt in der Funktion `IsRelevantFile`, zu der nun eine funktionale Abh√§ngigkeit besteht. Diese Logik ist durch die Auslagerung jedoch leicht testbar.

Wenn ein `if` in solcher Weise zur Lesbarkeit einer Integration beitr√§gt... Warum dann darauf verzichten? Flow-Design will mit seinen Prinzipien leiten, aber nicht darauf reiten.

√Ñhnlich sieht es f√ºr `foreach` aus, mit dem der Code auf Continuations verzichten kann, weil C# mit `yield return` es erlaubt, sehr einfach Iteratoren nach und nach mit Elementen zu f√ºllen.

#### Offen f√ºr Erweiterung, geschlossen f√ºr Ver√§nderung

Die Vorteile der Einhaltung von IOSP und PoMO liegen zun√§chst sichtbar in gr√∂√üerer Verst√§ndlichkeit und besserer Testbarkeit von Code. Logik wird ganz nat√ºrlich in kleine Einheiten "gezwungen". Flow-Design verzichtet ganz bewusst auf die M√∂glichkeit funktionaler Abh√§ngigkeiten, um Produktivit√§tsqualit√§ten verl√§sslicher herzustellen. [Functional dependencies considered harmful!](https://ralfw.de/2019/07/functional-dependencies-considered-harmful/) Freiwillige Selbstbeschr√§nkung beim Schreiben von Code f√∂rdert das sp√§tere und h√§ufigere Lesen und Ver√§ndern von Code.

Der positive Effekt des IOSP entstammt zun√§chst einer Zuspitzung des SRP: Integration und Operation sind formale Verantwortlichkeiten. W√§hrend √ºblicherweise das SRP inhaltlich bzw. auf das Verhalten angewandt wird, konzentriert sich das IOSP auf die Struktur von Code. Deshalb kann die Einhaltung des IOSP auch leicht √ºberpr√ºft werden, selbst wenn ein Leser mit einer Programmiersprache oder dem angestrebten Verhalten oder der Dom√§ne nur wenig vertraut ist.

Weiterhin bef√∂rdert das IOSP die Einhaltung des SLA. Wenn Funktionen keine funktionalene Abh√§ngigkeiten enthalten, dann liegt das, was sie zusammenfassen (Komposition) im Abstraktionsgrad n√§her beieinander.

Und schlie√ülich kann man das PoMO als eine Steigerung des *Interface Segregation Principle (ISP)* auffassen. Denn wenn downstream Konsumenten upstream Produzenten √ºber einen Funktionszeiger (continuation) bekannt gemacht werden, dann entspricht das einer Abh√§ngigkeit von einem Interface mit nur einer Methode. Es findet eine Funktionsinjektion in eine Funktion im Bedarfsfall statt.

Damit aber nicht genug! IOSP und PoMO sind auch ganz im Sinne des *(Polymorphic) Open/Closed Principle (OCP)*! [Robert C. Martin definiert das](https://drive.google.com/file/d/0BwhCYaYDn8EgN2M5MTkwM2EtNWFkZC00ZTI3LWFjZTUtNTFhZGZiYmUzODc1/view) wie folgt:

> Modules that conform to the open-closed principle have two primary attributes.
> 1. They are ‚ÄúOpen For Extension‚Äù. This means that the behavior of the module can be extended. That we can make the module behave in new and different ways as the requirements of the application change, or to meet the needs of new applications.
> 2. They are ‚ÄúClosed for Modification‚Äù. The source code of such a module is inviolate. No one is allowed to make source code changes to it.

Flow-Design √ºbersetzt "module" dabei allerdings in "Funktionseinheit" bzw. "Funktion" als eigentlich Verhalten erzeugende Strukturbestandteile. Und Flow-Design konkretisiert, was denn nicht ver√§ndert werden sollte: Logik. Logik ist schwer zu verstehen und schwer zu testen. Daher sollte man die Finger davon lassen, sobald sie einmal tut, was sie soll. Ver√§nderungen f√ºr neues Verhalten sollten nicht durch Ver√§nderung (modification) von Logik hergestellt werden - sondern durch neue, separate Logik (extension).

Dem leistet Flow-Design Vorschub durch den Verzicht auf funktionale Abh√§ngigkeiten. Operationen sieht Flow-Design als geschlossen an; ihre Logik sollte soweit m√∂glich nicht angetastet werden. Integrationen hingegen sind f√ºr Flow-Design offen. In Integrationen k√∂nnen Erweiterungen des Verhaltens leicht "zwischengeschaltet" werden.

Zun√§chst ein Szenario ohne IOSP: die Umwandlung r√∂mischer Zahlen in dezimale noch ohne Ber√ºcksichtigung der Subtraktionsregel.

In [85]:
int FromRoman(string romanNumber) {
    var decimalNumber = 0;
    for(var i=0; i<romanNumber.Length; i++) {
        switch(romanNumber[i]) {
            case 'I': decimalNumber += 1; break;
            case 'V': decimalNumber += 5; break;
            case 'X': decimalNumber += 10; break;
            // ...
        }
    }
    return decimalNumber;
}


display($"XVI={FromRoman("XVI")}")

XVI=16

Was tun, um auch die Anforderungen der Subtraktionsregel zu erf√ºllen? Die Logik von `FromRoman` muss *ver√§ndert* werden! Das ist riskant/schwierig.

Anders liegt der Fall, wenn eine L√∂sung - auch wenn sie klein ist - sauber modelliert und mit IOSP im Kopf √ºbersetzt wird. Sie s√§he dann z.B. so aus:

In [91]:
int FromRoman_OCP(string romanNumber) {
    var digitValues = Map(romanNumber);
    return digitValues.Sum();
}

int[] Map(string romanNumber)
    => romanNumber.ToCharArray().Select(Map).ToArray();
int Map(char romanDigit) => romanDigit switch {
    'I' => 1,
    'V' => 5,
    'X' => 10
    // ...
};


display($"XVI={FromRoman_OCP("XVI")}");
display($"XIV={FromRoman_OCP("XIV")}");

XVI=16

XIV=16

Noch leistet die L√∂sung nicht, was sie soll. Doch ohne Ver√§nderung einer Operation - `Map`, `Sum` - kann das ge√§ndert werden mit einer Erweiterung der Integration. Deren Extension besteht im "Dazwischenschieben" eines weiteren Funktionsaufrufs:

In [95]:
int FromRoman_OCP_extended(string romanNumber) {
    var digitValues = Map(romanNumber);
    digitValues = Negate(digitValues); // Erweiterungü§©
    return digitValues.Sum();
}

// Neue Logik, statt ver√§nderterü•≥
int[] Negate(IEnumerable<int> digitValues) {
    var negated = digitValues.ToArray();
    for(var i=0; i<negated.Length-1; i++)
        if (negated[i]<negated[i+1])
            negated[i] *= -1;
    return negated;
}


display($"XVI={FromRoman_OCP_extended("XVI")}");
display($"XIV={FromRoman_OCP_extended("XIV")}");

XVI=16

XIV=14

Durch die Trennung von Integration und Operation reduziert Flow-Design den Aufwand, um dem OCP zu dienen. Erweiterbarkeit ist ein grundlegendes Merkmal von Integrationen. Dass man daf√ºr Code im Fluss der Verhaltensherstellung anfassen muss, ist unerheblich. Das Risiko f√ºr Schaden (Regression) dadurch ist vergleichsweise klein. Wahrhaft risikoreiche Ver√§nderungen an Logik sind auf sehr √ºberschaubare Operationen begrenzt.

Die erste Frage beim Modellieren eines L√∂sungsansatzes f√ºr neues Verhalten lautet im Flow-Design: Kann das neue Verhalten hergestellt werden, in den lediglich Funktionseinheiten in einem Datenfluss zwischen andere gesetzt werden? √ñfter als man denkt, kann darauf mit Ja geantwortet werden. (Und wenn nicht, kann das als Anlass genommen werden, den bisherigen L√∂sungsansatz nocheinmal zu √ºberdenken, um ihn mittels IOSP n√§her ans OCP zu bringen.)

#### Stratified Design

Dem Verst√§ndnis eines Systems ist zutr√§glich, wenn man es aus unterschiedlicher Entfernung betrachten kann. Ist man n√§her dran, kann man Details untersuchen. Ist man weiter weg, gewinnt man √úberblick √ºber den Zusammenhang von Teilen.

Geografische Karten erlauben uns, in solcher Weise mit einem Terrain umzugehen. Wir ziehen sie z.B. zur Planung einer Reise in unterschiedlichem Ma√üstab heran. Eine Karte mit gro√üem Ma√üstab, z.B. eine Europa-Karte, gibt uns √úberblick f√ºr eine grobe Routenplanung. Eine topografische Karte hingegen zeigt uns eine eng begrenzte Umgebung mit viel mehr Einzelheiten. Werkzeuge wie Google Maps machen heute den Wechsel des Ma√üstabs besonders einfach.

F√ºr das Studium von Code ist es ebenfalls n√ºtzlich, den Ma√üstab seiner Darstellung wechseln zu k√∂nnen. Das Ganze sollte grob und im √úberblick betrachtet werden k√∂nnen; genauso sollte es m√∂glich sein, schrittweise hinein zu zoomen, um mehr und mehr Details zu sehen.

Gro√üe Ma√üst√§be stehen f√ºr ein hohes Abstraktionsniveau, kleine Ma√üst√§be f√ºr ein niedriges. Um hinein und heraus zoomen zu k√∂nnen, muss Code also unterschiedliche Abstraktionsniveaus aufweisen.

Tut er das z.B., wenn er nach dem weit verbreiteten Schichtenmodell strukturiert ist?

Als Beispiel ein kleines Programm, dass die Worte in einer Datei z√§hlt. Es besteht aus drei typischen Schichten:

* Presentationsschicht/Benutzerschnittstelle: Beschafft den Namen der zu verarbeitenden Datei aus der Umgebung und gibt das Ergebnis aus, das es von der Gesch√§ftslogik bekommt.
* Gesch√§ftslogikschicht: Ermittelt das Ergebnis, nachdem es von der Datenzugriffschicht den Dateiinhalt bekommen hat.
* Datenzugriffsschicht: L√§dt den Inhalt einer Datei.

/// schichtenmodell f√ºr das beispiel (erstmal nur klassennamen) (100)

Funktionale Abh√§ngigkeiten zeigen hier grunds√§tzlich √ºber die Schichten hinweg von oben nach unten. Ob das kaschiert wird mit DIP/IoC, ist unwesentlich. Und auch Schalen statt Schichten, wie in der Clean Architecture, machen keinen Unterschied. So oder so sind die Aspekte funktional voneinander abh√§ngig zur Laufzeit.

In [102]:
class Presentation {
    public static void CountWords(string filename) {
        var numberOfWords = Business.CountWords(filename);
        Console.WriteLine($"Number of significant words in '{filename}': {numberOfWords}");
    }
}

class Business {
    public static int CountWords(string filename) {
        var words = Dataaccess.Load(filename);
        var significantWords = words.Where(w => w.Length > 2);
        return significantWords.Count();
    }
}

class Dataaccess {
    public static IEnumerable<string> Load(string filename) {
        var text = System.IO.File.ReadAllText(filename);
        return text.Split(new[]{' ', '\t', '\n', '\r'}, StringSplitOptions.RemoveEmptyEntries);
    }
}


Presentation.CountWords("samples/poem.txt");

Number of significant words in 'samples/poem.txt': 72


Der Code ist das Terrain. Das Schichtenmodell ist eine Karte f√ºr dieses Terrain. Sie abstrahiert von den Details der Logik und sogar von den einzelnen Methoden. Das ist durchaus n√ºtzlich. Und das ganze Programm mit einem Betriebssystemprozess als Host abstrahiert sogar noch von den Klassen als Feinheiten der Implementation.

/// softwarezelle -* schichtenmodell -* code(101)

##### Abh√§ngigkeiten definieren das Abstraktionsgef√§lle

Aus diesem Bild wird ersichtlich, wie Abstraktion und Abh√§ngigkeit in Zusammenhang stehen: Abstraktion definiert einen Baum. Dessen Wurzel ist das Abstraktum, seine Bl√§tter sind die Details, von denen damit abgesehen wird.

/// abstraktionsbaum mit abh√§ngigkeiten; beispiel vllt mit "Geb√§ude" und dann "Wohnhaus", "Hochhaus", "Kirche" (102)

Das Abstrakte *besteht* aus dem Konkreten. Das Abstrakte ist somit vom Detail *abh√§ngig*, das in ihm unter einem Gesichtspunkt zusammengefasst ist. Die Abh√§ngigkeitsbeziehung weist vom Abstrakten zum Konkreten. In Richtung von Abh√§ngigkeiten f√§llt mithin das Abstraktionsniveau.

##### Abstraktionen im Flow-Design

Flow-Design ist vor allem mit Abstraktionen nach zwei Gesichtspunkten besch√§ftigt:

* Aggregation: Zusammenfassen von *√Ñhnlichem*; das, was gemeinsam ist, definiert die Abstraktion.
* Komposition: Zusammenfassen von *Verschiedenem*; das Neue, das durch die gegenseitige Erg√§nzung des Verschiedenen entsteht, macht die Abstraktion aus.

/// abstraktionsb√§ume f√ºr aggregation (irgendwas gemeinsames wird rausgezogen) und komposition (irgendwas neues entsteht) (103)

Das Mittel zur Aggregation sind Module. Das Mittel zur Komposition sind Integration und Operation.

Aggregation erzeugt √úberblick durch Ausblenden der Verschiedenartigkeit von Konkretem. Komposition erzeugt Neues durch Verschmelzen der Verschiedenartigkeit von Konkretem.

##### Fehlende Abstraktionen bei funktionaler Abh√§ngigkeit

Vor diesem Hintergrund wird deutlich, dass Code, der nach dem Schichtenmodell strukturiert ist, Abh√§ngigkeiten falsch im Sinne von Abstraktion einsetzt.

`Presentation.CountWords` als Wurzel des Abh√§ngigkeitsbaums kann noch als Repr√§sentant des Ganzen auf h√∂chster Abstraktionsebene angesehen werden; immerhin geht es um das Z√§hlen von Worten in einer Datei.

Aber wie steht es mit `Business.CountWords`? Liegt die Methode auf einem niedrigeren Abstraktionsniveau? Tut sie dasselbe, wie die von ihr abh√§ngige, nur eben konkreter? Ja, vielleicht k√∂nnte man das noch zugestehen. Es ja immerhin wieder um das Z√§hlen von Worten in einer Datei; dieses Mal wird deren Zahl als Ergebnis geliefert, statt auf dem Bildschirm ausgegeben.

Und schlie√ülich `Dataaccess.Load`: Ist damit die Probleml√∂sung auf einem niedrigeren Abstraktionsniveau beschrieben? Nein. Hier geht es nicht mehr ums Z√§hlen. Das ist deutlich sichtbar. Sp√§testens bei der Abh√§ngigkeit der Gesch√§ftslogik von der Datenzugriffslogik wird das Prinzip verletzt, dass Abh√§ngigkeiten vom Abstrakten auf das Konkrete verweisen sollen.

Abstraktionsniveaus sind dadurch gekennzeichnet, dass auf einem bestimmten Niveau jeweils das Ganze zu sehen ist, nur eben in einem gewissen Detaillierungsgrad. Das ist offensichtlich bei `Dataaccess.Load` nicht der Fall und schon bei `Business.CountWords` wackelt das Bild.

Die Abh√§ngigkeiten zwischen Methoden in einem Schichtenmodell beschreiben also keinen Abstraktionsbaum. Doch wie steht es mit dem Klassenbaum? Liegt eine `Presentation`-Klasse auf einem h√∂heren Abstraktionsniveau als eine `Business`- oder `Dataaccess`-Klasse? Tut `Presentation` das in Aggregation, was `Business` oder `Dataccess` tun? Hier antwortet Flow-Design ebenfalls mit Nein.

Eine Gesch√§ftslogik ist nicht dasselbe wie Datenzugriffslogik, nur eben auf einem anderen Abstraktionsniveau.

##### Dark Logic

Der Grund f√ºr diese "Missweisung" der Abh√§ngigkeiten ist ihre funktionale Natur. B√§ume funktionaler Abh√§ngigkeiten enthalten *dark logic*, d.h. Logik, die Verhaltensrelevant ist, aber nicht im Modell repr√§sentiert. Das wird deutlich bei einer Darstellung des L√∂sungsansatzes f√ºr die Wortz√§hlung als Datenflussdiagramm:

/// datenfluss f√ºr wortz√§hlung (103)

Der Input von `Business.CountWords` passt noch zum Input von `Presentation.CoundWords`, aber der Output passt nicht. Was passiert mit der hinausflie√üenden Zahl der Worte? Genauso bei `Business.CoundWords` und `Dataaccess.Load`: Wie wird aus einer collection von Strings eine Zahl?

Beides ist nur zu erkl√§ren mit dark logic: In der abh√§ngigen, integrierenden Funktionseinheit muss noch Logik stecken. Diese Logik widerspricht dem SLA:

```csharp
public static int CountWords(string filename) {
    var words = Dataaccess.Load(filename);
    var significantWords = words.Where(w => w.Length > 2);
    return significantWords.Count();
}
```

`Dataaccess.Load` liegt auf einem h√∂heren Abstraktionsniveau als die folgenden Zeilen, weil die Methode selbst Logik zu einer neuen Funktionalit√§t komponiert.

Laut IOSP kann das jedoch nicht sein.

Dark logic ist es, die Code schwer zu verstehen und schwer zu testen macht. Abh√§ngigkeitsdiagrammen von Funktionen, die *funktional* abh√§ngig sind, fehlt wesentliche Information, um zu verstehen, wie Verhalten hergestellt wird. Nicht, dass Logik explizit gezeigt werden m√ºsste; damit w√ºrde der Abstraktionszweck gebrochen. Aber Logik muss explizit repr√§sentiert werden.

Das ist, wozu die Einhaltung des IOSP f√ºhrt. Das IOSP macht dark logic sichtbar.

##### Stratified Design

Software strukturiert nach IOSP besteht nicht aus Schichten, sondern *Strata*. Jedes Stratum definiert dabei ein Abstraktionsniveau.

> "\[...\] expert engineers stratify complex designs. Each level is constructed as a stylized combination of interchangeable parts that are regarded as primitive at that level. The parts constructed at each level are used as primitives at the next level. Each level of a stratified design may be thought of as a specialized language with a variety of primitives and means of combination appropriate to that level of detail.", Abelson & Sussman in "Lisp: A Language for Stratified Design"

Das Schichtenmodell (oder auch eine Clean Architecture) sind keine Repr√§sentaten von *stratified design*. L√∂sungen existieren dort nicht auf unterschiedlichen Abstraktionsniveaus, weil Schichten/Schalten funktional von einander abh√§ngig sind.

Anders jedoch im Flow-Design. Hier ein Datenfluss-Modell f√ºr das Wortz√§hlungsproblem:

/// datenfluss f√ºr das wortz√§hlungsproblem (104)

In diesem Modell existiert keine dark logic mehr. Die L√∂sung wird auf in zwei Strata komplett beschrieben:

/// zwei strata f√ºr das wortz√§hlungsproblem: nur die wurzel / nur der flow (105)

Die gesamte Logik ist in Operationen verpackt.

Das h√∂chste Abstraktionsniveau wurde durch das IOSP explizit eingef√ºhrt: die Klasse `CountWords` mit der Methode `Run`, die beide f√ºr Integration stehen. `CountWords` integriert die Aspekt-Klassen `Presentation`, `Business` und `Dataaccess`. `Run` integriert deren Methoden.

In [104]:
class CountWords {
    public static void Run(string filename) {
        var words = Dataaccess.Load(filename);
        var numberOfWords = Business_Stratified.CountWords(words);
        Presentation_Stratified.DisplayResult(filename, numberOfWords);
    }
}


class Presentation_Stratified {
    public static void DisplayResult(string filename, int numberOfWords) {
        Console.WriteLine($"Number of significant words in '{filename}': {numberOfWords}");
    }
}

class Business_Stratified {
    public static int CountWords(IEnumerable<string> words) {
        var significantWords = words.Where(w => w.Length > 2);
        return significantWords.Count();
    }
}


CountWords.Run("samples/poem.txt");

Number of significant words in 'samples/poem.txt': 72


Was vorher funktional abh√§ngig war, steht jetzt in einer Sequenz im Datenfluss in `Run`. So ist es richtig, wenn es keine Unterschiede im Abstraktionsniveau gibt.

Im Beispiel macht die Gesch√§ftslogik klar, wieviel plausibler das ist. Sie ist jetzt nicht mehr abh√§ngig vom Datenzugriff. Warum sollte sie das auch sein? Welchen Grund gibt es, dass Dom√§nenlogik sich Daten aus einer Ressource beschaffen sollte? Warum sollte Dom√§nenlogik Kenntnis von einer Ressource haben?

Das Schichtenmodell erkl√§rt das nicht. Die Clean Architecture erkl√§rt das auch nicht, obwohl auch dort zur Laufzeit (!) noch innere Schalen √§u√üere aufrufen.

Um den Kern einer Software wirklich von der Umwelt zu isolieren, darf es keine funktionalen Abh√§ngigkeiten zwischen ihm und der Umwelt gehen. Funktionale Abh√§ngigkeiten sind schlicht ein Widerspruch zum SLA. Mit ihnen w√ºrde die Gesch√§ftslogik auf ein h√∂heres Abstraktionsniveau gehoben als der Datenzugriff. Dort hat sie jedoch nichts zu suchen. Gesch√§ftslogik ist nicht abstrakter als Datenzugriffslogik. Vielleicht ist sie zentraler, wichtiger, aber nicht abstrakter.

##### Strata verstanden als Sprachen

Die L√∂sung wird mit drei Sprache beschrieben:

* Die h√∂chste Sprache besteht nur aus einem Wort: `Run`.
* Die niedrigere Sprache besteht aus drei Worten: `Load`, `CountWords` und `DisplayResult`.
* Die niedrigste Sprache besteht aus den Logik-Anweisungen in den Operationen.

Der Jo-Jo Entwurf von Flow-Design kann also als Sprachentwurf verstanden werden. Mit welchen sukzessive "primitiveren" - oder besser: allgemeineren - Sprachen l√§sst sich eine L√∂sung formulieren.

Die h√∂chste Sprache bzw. die spezifischste besteht dabei immer nur aus einem Wort. Im Grunde ist es ein ["Sesam, √∂ffne dich"](https://de.wikipedia.org/wiki/Ali_Baba) oder ["simsalabim"](https://de.wikipedia.org/wiki/Zauberspruch): das ganze Problem m√∂ge sich wie von Zauberhand durch Aufruf dieses einen Wortes in Luft aufl√∂sen.

Demgegen√ºber besteht die primitivste, allgemeinste Sprache immer aus allen Worten der zugrundgelegten Plattform aus Programmiersprache, Bibliotheken, Frameworks, APIs.

Und zwischen diesen beiden k√∂nnen beliebig viele weitere Sprachen eingezogen werden. Bei trivialen Problem m√∂gen die h√∂chste und primitivste ausreichen. Alle interessanten Probleme jedoch werden am besten durch Spezialsprachen gel√∂st, die aufeinander aufbauen.

Dazu ist es nicht n√∂tig, *Domain Specific Languages (DSL)*, gar grafische, zu entwickeln. Simple Funktionen (und Module) gen√ºgen.

Im Flow-Design gleichen sich diese Sprachen alle in ihrer Syntax, die durch Datenfl√ºsse (und nicht-funktionale Abh√§ngigkeiten) vorgegeben ist. Das Vokabular jedoch ist zu (er)finden.

In Bezug auf ein etwas erweitertes Wortz√§hlungsproblem lie√üen sich z.B. weitere Abstraktionsebenen mit eigenem Vokabular einziehen. Das k√∂nnte so aussehen:

/// neue datenflusshierarchie f√ºr wortz√§hlung mit mehr integrationsebenen (106)

Im Code ist Logik nun in kleinere Einheiten verpackt. Die Funktionen sind feingranularer, das Vokabular also differenzierter (siehe Klassen der Gesch√§fts- und Datenzugriffslogik):

In [110]:
class CountWords_v2 {
    public static void Run(string filename) {
        var words = Dataaccess_Stratified.Load(filename);
        var numberOfWords = Business_Stratified_v2.CountWords(words);
        Presentation_Stratified.DisplayResult(filename, numberOfWords);
    }
}

class Business_Stratified_v2 {
    public static int CountWords(IEnumerable<string> words) {
        var significantWords = FilterShort(words);
        significantWords = FilterNumbers(significantWords);
        return significantWords.Count();
    }
    
    private static IEnumerable<string> FilterShort(IEnumerable<string> words)
        => words.Where(w => w.Length > 2);
    
    private static IEnumerable<string> FilterNumbers(IEnumerable<string> words) {
        return words.Where(IsNoNumber);
        
        bool IsNoNumber(string candidateWord)
            => int.TryParse(candidateWord, out var _) is false;
    }
}

class Dataaccess_Stratified {
    public static IEnumerable<string> Load(string filename) {
        var text = LoadText(filename);
        return SplitIntoWords(text);
    }
    
    private static string LoadText(string filename)
        => System.IO.File.ReadAllText(filename);
    
    private static IEnumerable<string> SplitIntoWords(string text)
        => text.Split(new[]{' ', '\t', '\n', '\r'}, StringSplitOptions.RemoveEmptyEntries);
}


CountWords_v2.Run("samples/poem.txt");

Number of significant words in 'samples/poem.txt': 72


Die L√∂sung besteht jetzt aus drei Strata:

1. `Run`
2. `Load`, `CountWords`, `DisplayResult`
3. `LoadText`, `SplitIntoWords`, `FilterShort`, `FilterNumbers`, `Count`, `DisplayResult`

Das Vokabular wechselt von Stratum zu Stratum. Die Funktionseinheiten werden allgemeiner und allgemeiner, d.h. ihr Einsatzbereich wird gr√∂√üer und gr√∂√üer. Je tiefer ein Stratum liegt, desto gr√∂√üer die potenzielle Wiederverwendbarkeit der Funktionseinheiten in dar√ºberliegenden Strata.

Tendenziell werden Funktionseinheiten eines Stratums nur im direkt dar√ºber liegenden benutzt. Gelegentlich greifen jedoch auch weiter oben liegende Strata darauf zu. Manches Vokabular ist dann so grundlegend, dass es sich durch mehrere Abstraktionsebenen durchzieht. Streng genommen k√∂nnte das als Versto√ü gegen das SLA angesehen werden - doch im Einzelfall mag das besser verst√§ndlich sein als weitere Kapselungen in den einzelnen Strata.

Deshalb ist auch Logik hier und da in der Integration im Flow-Design geduldet. Logik ist das Vokabular des Terrains und sollte deshalb nicht in einem Stratum der Abstraktion auftauchen - au√üer eben in Einzelf√§llen. Beispiel daf√ºr hier ist `Count` in `Business_Stratified_v2.CountWords`, deren Aufruf zum dritten Stratum gerechnet wird.

Unterhalb der Strata der Abstraktion liegt dann die Logik selbst. Ohne Operationen, Integrationen und Module ist sie quasi nackt. Jedes Detail ist sichtbar - aber die L√∂sung in dieser Weise entschleiert ist schwer verst√§ndlich und ihre Aspekte sind nicht getrennt testbar.

In [117]:
var filename = "samples/poem.txt";

var text = System.IO.File.ReadAllText(filename);
IEnumerable<string> words = text.Split(new[]{' ', '\t', '\n', '\r'}, StringSplitOptions.RemoveEmptyEntries);

words = words.Where(w => w.Length > 2);
words = words.Where(w => int.TryParse(w, out var _) is false);
var numberOfWords = words.Count();

Console.WriteLine($"Number of significant words in '{filename}': {numberOfWords}");

Number of significant words in 'samples/poem.txt': 72


##### Zusammenfassung

Code aufgebaut aus Strata wachsender Abstraktion um einen Kern aus Logik herum versprechen bessere Verst√§ndlichkeit und Ver√§nderbarkeit. Das meinen nicht nur Abselson und Sussman, sondern auch Alan Kay, [der dabei ebenfalls von einer Hierarchie von Sprachen spricht](https://www.tele-task.de/lecture/video/2772/#t=3283).

/// schalen von strata mit logik im kern (107)

Nichts anderes geschieht ja auch ganz grunds√§tzlich, wenn man L√∂sungen mit Logik in einer modernen Programmiersprache formuliert. Selbst die reine Logik der obigen Wortz√§hlungslogik l√§sst sich als abstraktes Stratum verstehen oberhalb des Stratums der .NET *Intermediate Language (IL)*, das wiederum auf dem Stratum des Prozessor-Maschinencodes liegt, der den tats√§chlich ausgef√ºhrten Microcode abstrahiert.

/// schalen weiterf√ºhren unterhalb der logik mit microcode im kern (108)

Warum also diese erfolgreiche Methode nicht oberhalb der Logik ebenfalls anwenden?

Mit den Datenfl√ºssen des Flow-Design geschieht das quasi nat√ºrlich durch die Anwendung von IOSP und PoMO. Dennoch ist die Vorstellung, in Strata von Sprache zu denken, ein gutes Hilfsmittel, um hierarchische Datenfl√ºsse zu entwerfen.

Und zur Analyse von funktionalen Hierarchien erweist sich das Prinzip n√ºtzlich, dass Abh√§ngigkeiten nur in Richtung des Abstraktionsgef√§lles zeigen sollen, also von hoher Abstraktion zu niedriger. MVC, Schichtenmodell, Clean Architecture oder auch alle Entwurfsmuster k√∂nnen daraufhin √ºberpr√ºft werden, ob ihre Abh√§ngigkeiten dem entsprechen. Tun sie das nicht, ist aus Sicht von Flow-Design zumindest Vorsicht angezeigt. Allemal die Verst√§ndlichkeit mag dann geringer als m√∂glich sein.

In [None]:
### 3-dimensionale Datenfl√ºsse

mehrere ein/ausg√§nge

datenstr√∂me explizit beenden