### 2-dimensionale Datenflüsse

Funktionen sind in 0-dimensionalen und 1-dimensionalen Datenflüssen die Container für Logik. Sie komponieren aus "Logikbausteinen" ein Verhalten, für das sie stehen.

Obwohl 1-dimensionale Datenflüsse leicht zu verstehen sind auch in der Übersetzung in Funktionsaufrufsequenzen, skalieren sie nicht. Mehr als 5 oder vielleicht 10 Funktionseinheiten "in einer Reihe" oder Funktionsaufrufe nacheinander, sind aus mehreren Gründen nicht praktikabel:

* Im Modell wie im Code sind so lange Sequenzen trotz ihrer formalen Einfachheit nicht mehr gut zu überblicken.
* Die Gefahr, dass Datenflüsse das SLA verletzen, steigt mit jeder weiteren Funktionseinheit.
* Die Wahrscheinlichkeit, dass es in Datenflüssen Gruppen von Funktionseinheiten mit höherer Kohäsion untereinander gibt als zu anderen, steigt mit jeder weiteren Funktionseinheit.

Schon zum oben stehenden Datenfluss zur Analyse von Dateien kann gefragt werden, ob er für das Verständnis eine optimale Länge hat.

#### Integrationen als Bedeutungseinheiten

Einerseits hat ein Leser bei dem 1-dimensionalen Datenfluss "alles auf einmal im Blick". Alle Operationen stehen in einer Reihe. Andererseits muss ein Leser sich die Bedeutung des Ganzen aus den Bedeutungen der Teile erst zusammenreimen. Das ist bei 5 Funktionseinheiten schwieriger als bei 4, 3 oder 1.

Was tut der Datenfluss? Kann das mit 1 Funktionseinheit ausgedrückt werden? Selbstverständlich!

![](images/df16.png)

Die eine Funktionseinheit integriert nun explizit die bisherigen Operationen.

Das "Verfeinerungsdach" ist dabei sozusagen ein grafisches *pin-zoom* wie beim Hineinzoomen in eine Google Map. Es ist ein Symbol, das Abhängigkeit anzeigt, aber keine funktionale. Insofern ist es mehr als nur eine Reihe von Abhängigkeiten ohne "horizontalen" Zusammenhang.

![](images/df16a.png)

Und was, wenn es weitere Teil im Datenfluss gibt, die wiederum unter einem Begriff zusammengefasst werden könnten, um ihnen eine eigene Bedeutung zu geben? Beispiele dafür wären:

* Alles außer der Ausgabe könnte als Kernlogik zusammengefasst werden. Die Ausgabe eines Ergebnisses ist etwas ganz anderes, als das Ergebnis herzustellen. Dadurch würde die Ergebnisherstellung separat von der Benutzerschnittstelle testbar.
* Die Beschaffung der relevanten Dateinamen könnte zusammengefasst werden. Die Traversierung des Dateisystems ist etwas ganz anderes, als mit einer Datei umzugehen.
* Laden und Zerlegen einer Datei könnte zusammengefasst werden. Eine Datei als Text zu beschaffen, statt als Byteblock, ist schon eine Abstraktion, die der .NET Framework zur Verfügung stellt. Warum nicht den Dateizugriff weiter abstrahieren und eine Datei als Collection von Worten repräsentieren?

Wie man sich entscheidet bei den Zusammenfassungen, ist weniger wichtig, als dass Zusammenfassungen zur Verbesserung der Verständlichkeit und der Testbarkeit möglich und einfach sind. Die eine beste Zusammenfassung wird es wohl nicht geben. Da Integrationen von Teilflüssen jedoch billig herzustellen und auch wieder aufzulösen sind, kann die Integrationshierarchie jederzeit umgestellt werden.

Verständnis verändert sich mit der Zeit: Es wird aufgebaut durch Beschäftigung mit Code - aber es wird auch wieder abgebaut, wenn die Beschäftigung abnimmt. Eine Struktur, die dem heutigen Verständnis angemessen ist, passt womöglich nicht mehr optimal zum morgigen Verständnis.

In dieser Hinsicht unterliegen Modelle und Code trotz ihrer Immaterialität einem Verschleiß. Ohne, dass Code "sich bewegte" oder verändert würde, verliert er an "Verständlichkeitsqualität". Das hat zwei Konsequenzen:

* Die Diskussion um die allerbeste Struktur sollte begrenzt werden. Die allerbeste Struktur, selbst wenn sie für heute gefunden werden könnte, ist morgen nicht mehr die allerbeste. Nach dem Herstellungszeitpunkt verliert jede auf Verständlichkeit getrimmte Struktur sofort und automatisch an Wert. Warum also bis aufs Letzte optimieren?
* Strukturen für Verständlichkeit sollten gewartet werden. D.h. sie sollten proaktiv in angemessenen Wartungsinverallen aufgesucht und dem aktuellen Verständnisstand angepasst werden. Sonst besteht die Gefahr, dass sie zur Unzeit als stark erodiert erfahren werden und viel Mühe beim Verständnis machen.

Die obigen Fragen zu möglichen Integrationen sind daher nur Beispiele dafür, dass und wie möglichen Verständlichkeitsverbesserungen nachgespürt werden kann. Nach angemessenem Diskurs muss eine Entscheidung getroffen werden. Die könnte z.B. so aussehen:

![](images/df17.png)

Ein Datenflussmodell dehnt sich damit sichtbar in 2 Dimensionen aus:

* In der ersten Dimension wird Verhalten im Datenfluss erzeugt: am Anfang einfließerder Input wird schrittweise in am Ende ausfließenden Output transformiert.
* In der zweiten Dimension findet Abstraktion durch Komposition statt. Kompositionen - Operation wie Integration - fassen verschiedene Teilverhalten zu einem größeren, neuen Gesamtverhalten zusammen. Komposition ist die Abstraktion, die Bequemlichkeit in der Nutzung herstellt.

Kompositionen ändern am Verhalten natürlich nichts. Das Verhalten wird immer nur durch Logik (und Verteilung) beeinflusst. Aber Kompositionen ändern an der Verständlichkeit etwas. Deshalb ist auch der Einwand, dass in einer Integrationshierarchie Operationen und Integrationen womöglich nur einmal verwendet werden, unerheblich. Wenn eine Komposition der Verständlichkeit oder Testbarkeit dient, dann muss sie nicht gleichzeitig der kurzfristigen Produktivität dienen. Das ist nämlich der Zweck von Wiederverwendung.

#### Übersetzung

Sind Integrationen für einen Fluss gefunden, lassen sie sich leicht übersetzen: wie Operationen werden sie zu Funktionen. Das ist einerseits sehr nützlich und intuitiv. Andererseits hat es aber auch einen Nachteil.

Integrationen in Funktionen zu übersetzen, liegt nahe, weil die Darstellung im Modell sich nicht von Operationen unterscheidet. Auch weil während des Modellierungsprozesses nicht klar ist, ob Blätter in einer Integrationshierarchie Operationen bleiben oder weiter verfeinert werden, d.h. "in Integrationen umklappen", wäre eine unterschiedliche Darstellung bzw. Codierung hinderlich.

Andererseits verführt die Übersetzung von Integrationen in Funktionen dazu, Logik in sie "hineinzuschmuggeln". Das würde dem IOSP widersprechen und mindestens die Testbarkeit senken.

Letztlich überwiegt jedoch für Flow-Design die Einfachheit. Integrationen werden also zu Funktionen:

In [72]:
void PrintWordsInFiles(string path, string pattern) {
    CountWordsInFiles(path, pattern,
        Print);
}

void CountWordsInFiles(string path, string pattern, Action<string,int> onFile) {
    EnumerateRelevantFiles(path, pattern,
        filename => {
            var words = LoadWordsFromFile(filename);
            onFile(filename, words.Length);
        });
}

void EnumerateRelevantFiles(string path, string pattern, Action<string> onFilename) {
    EnumerateFiles("..",
        filename => FilterByEndOfFilename(filename, pattern,
                      onFilename));
}

string[] LoadWordsFromFile(string filename) {
    var text = Load(filename);
    return SplitIntoWords(text);
}


PrintWordsInFiles("..", ".ipynb");

../anforderungen.ipynb with 4475 words

../prozess.ipynb with 1827 words

../anforderung-logik-lücke.ipynb with 3276 words

../index.ipynb with 125 words

../entwurf/entwurf_1.ipynb with 4778 words

../entwurf/.ipynb_checkpoints/entwurf_1-checkpoint.ipynb with 4776 words

../codierung/arbeitsorganisation.ipynb with 37 words

../codierung/.ipynb_checkpoints/arbeitsorganisation-checkpoint.ipynb with 37 words

../analyse/slicing.ipynb with 49 words

../analyse/.ipynb_checkpoints/slicing-checkpoint.ipynb with 49 words

../anatomie/radikale_oo.ipynb with 3736 words

../anatomie/ioda.ipynb with 3216 words

../anatomie/dimensionen.ipynb with 2475 words

../anatomie/.ipynb_checkpoints/radikale_oo-checkpoint.ipynb with 3736 words

../anatomie/.ipynb_checkpoints/dimensionen-checkpoint.ipynb with 2475 words

../anatomie/.ipynb_checkpoints/ioda-checkpoint.ipynb with 3216 words

../.ipynb_checkpoints/anatomie_1-checkpoint.ipynb with 3734 words

../.ipynb_checkpoints/anforderung-logik-lücke-checkpoint.ipynb with 3276 words

../.ipynb_checkpoints/anatomie_3-checkpoint.ipynb with 3372 words

../.ipynb_checkpoints/prozess-checkpoint.ipynb with 1827 words

../.ipynb_checkpoints/index-checkpoint.ipynb with 115 words

../.ipynb_checkpoints/anatomie_2-checkpoint.ipynb with 2549 words

../.ipynb_checkpoints/anforderungen-checkpoint.ipynb with 4473 words

#### Jo-Jo Modellierung

Im Flow-Design beginnt die Modellierung der Lösung eines Problem außen und beim Gesamtverhalten. Von dort setzt sich durch Zerlegung von größeren in kleinere Probleme nach innen fort. Sie ist verhaltensorientiert und schrittweise verfeinernd, d.h. rekursiv absteigend: Am Anfang steht eine Funktionseinheit als vorläufige Operation. Deren Transformation wird dann jedoch zerlegt in Schritte, die durch nächste vorläufige Operationen in einem Fluss vollständig geleistet wird, so dass die vorherige Funktionseinheit zu einer Integration wird. Und immer so weiter für jedes Blatt im 2-dimensionalen Datenflussbaum - bis man am Ende nicht mehr weiß, wie eine vorläufige Operation weiter zerlegt werden soll. Dann wird aus der vorläufigen Operation eine endgültige.

Zumindest verläuft die Modellierung des Verhaltens idealerweise so. In der Praxis jedoch zeigt sich, dass nicht immer outside-in, top-down eine Lösung erkannt wird. Manchmal steht schon am Anfang ein spätere Operation fest und die wird schrittweise an die Wurzel-Funktionseinheit bottom-up angebunden. Oder nach einem ersten Durchstich von der Wurzel bis zu den Operationen scheint es verständlichkeitsfördernd, weitere Integrationsebenen einzuziehen. Oder Kind-Knoten im Kompositionsbaum, die unter verschiedenen Eltern-Knoten hängen, werden horizontal verschoben.

![](images/df18.png)

Flow-Design ist insofern weder strickt top-down, noch bottom-up, sondern geht in beide Richtungen vor oder schwingt auch mal seitwärts. Das passende Bild für ihre Bewegungsrichtung ist mithin ein Jo-Jo: der geht immer wieder runter und hoch oder bricht auch mal aus und kommt am Ende zur Ruhe. 

#### Logik in der Integration

Das IOSP ist glasklar: Eine Funktionseinheit ist entweder Operation und steht für Verhaltenserzeugung durch Logik. Oder sie ist eine Integration und stellt nur einen Fluss zwischen anderen Funktionseinheiten her, wofür keine Logik nötig ist.

Damit formuliert das Prinzip ein Soll, ein Ideal. Und dieses Ideal kann technisch auch immer implementiert werden.

Allerdings ist es eben ein Ideal. Das bedeutet, in seiner Reinheit kann es anderen Zielen auch mal im Wege stehen.

Flow-Design sieht dieses und andere Prinzipien daher pragmatisch. Ja, es soll stets das Ideal im Sinne von Korrektheit und Evolvierbarkeit angestrebt werden. Dabei soll aber auch Augenmaß bewahrt werden. IOSP, PoMO usw. für langfristig hohe Produktivität sind auszubalancieren mit Maßnahmen für funktionale und nicht-funktionale Qualitäten.

Für Flow-Design sind deshalb gelegentliche "Spuren von Logik" in eigentlich integrierenden Funktionseinheiten akzeptabel. Nicht wünschenswert, aber ok - wenn man denn weiß, was man da tut.

Meistens handelt es sich bei diesen Logik-Einsprengseln um Kontrollstrukturen oder triviale selbsterklärende API-Aufrufe.

Als Beispiel mag nochmal die obige Dateianalyse dienen. Mit der Erlaubnis zu etwas Logik in der Integration könnte die Übersetzung anders aussehen:

In [81]:
// Schmutzige Integration
void PrintWordsInFiles_v2(string path, string pattern) {
    foreach(var r in CountWordsInFiles_v2(path, pattern)) // Kontrollstruktur😱
        Print(r.filename, r.numberOfWords);
}

// Schmutzige Integration
IEnumerable<(string filename, int numberOfWords)> CountWordsInFiles_v2(string path, string pattern) {
    foreach(var f in EnumerateRelevantFiles_v2(path, pattern)) { // Kontrollstruktur😱
        var words = LoadWordsFromFile_v2(f);
        yield return (f, words.Length);
    };
}

// Schmutzige Integration
IEnumerable<string> EnumerateRelevantFiles_v2(string path, string pattern) {
    foreach(var f in EnumerateFiles_v2(path)) // Kontrollstruktur😱
        if (IsRelevantFile(f, pattern)) // Kontrollstruktur😱
            yield return f;
}

// Schmutzige Integration
string[] LoadWordsFromFile_v2(string filename) {
    var text = System.IO.File.ReadAllText(filename); // API-Aufruf😱
    return SplitIntoWords(text);
}


// Geänderte Operation für den Aufruf in einer schmutzigen Integration
IEnumerable<string> EnumerateFiles_v2(string path) {
    // Die Logik hier ist aufwändiger als nötig aus didaktischen Gründen, um einen Output-Strom zu erzeugen.
    var filenames = System.IO.Directory.GetFiles(path);
    foreach(var f in filenames) {
        yield return f; // Statt über eine Continuation wird ein Strom jetzt mittel Iterator erzeugt🤔
    }
    
    var subdirectories = System.IO.Directory.GetDirectories(path);
    foreach(var d in subdirectories)
        foreach(var f in EnumerateFiles_v2(d))
            yield return f; //🤔
}

// Geänderte Operation für den Aufruf in einer schmutzigen Integration
bool IsRelevantFile(string filename, string pattern)
    => filename.EndsWith(pattern);


PrintWordsInFiles_v2("..", ".ipynb");

../anforderungen.ipynb with 4475 words

../prozess.ipynb with 1827 words

../anforderung-logik-lücke.ipynb with 3276 words

../index.ipynb with 124 words

../entwurf/entwurf_1.ipynb with 5776 words

../entwurf/.ipynb_checkpoints/entwurf_1-checkpoint.ipynb with 5776 words

../codierung/arbeitsorganisation.ipynb with 37 words

../codierung/.ipynb_checkpoints/arbeitsorganisation-checkpoint.ipynb with 37 words

../analyse/slicing.ipynb with 49 words

../analyse/.ipynb_checkpoints/slicing-checkpoint.ipynb with 49 words

../anatomie/radikale_oo.ipynb with 3736 words

../anatomie/ioda.ipynb with 3216 words

../anatomie/dimensionen.ipynb with 2475 words

../anatomie/.ipynb_checkpoints/radikale_oo-checkpoint.ipynb with 3736 words

../anatomie/.ipynb_checkpoints/dimensionen-checkpoint.ipynb with 2475 words

../anatomie/.ipynb_checkpoints/ioda-checkpoint.ipynb with 3216 words

../.ipynb_checkpoints/anatomie_1-checkpoint.ipynb with 3734 words

../.ipynb_checkpoints/anforderung-logik-lücke-checkpoint.ipynb with 3276 words

../.ipynb_checkpoints/anatomie_3-checkpoint.ipynb with 3372 words

../.ipynb_checkpoints/prozess-checkpoint.ipynb with 1827 words

../.ipynb_checkpoints/index-checkpoint.ipynb with 124 words

../.ipynb_checkpoints/anatomie_2-checkpoint.ipynb with 2549 words

../.ipynb_checkpoints/anforderungen-checkpoint.ipynb with 4473 words

In jeder einzelnen Methode hält sich die Unsauberkeit in Bezug auf das IOSP in Grenzen. Die Methoden bleiben auch klein. Solange beides gegeben ist, steht aus Sicht von Flow-Design ein wenig "Schmutz" nichts entgegen. Wichtiger als die absolute Befolgung des Prinzips sind die Qualitäten, die es befördert, hier: **Verständlichkeit und Testbarkeit. Solange diese Qualitäten auch trotz (oder wegen?) gewisser Unsauberkeit vorhanden sind, ist etwas Logik in einer Integrationsfunktion ok.**

[Solche "Schmutzreste"](https://ccd-school.de/2017/02/kontrollstrukturen-in-der-integration/) sind vor allem simple Schleifen, auch mal eine Fallunterscheidung oder ein trivialer API-Aufruf. **Wichtig ist, dass diese Logik so einfach ist, dass sie selbst nicht getestet werden muss.** Das ist z.B. hier der Fall:

```csharp
if (IsRelevantFile(f, pattern))
    yield return f;
```

Die `if`-Anweisung selbst kann nicht falsch geschrieben werden; der Compiler würde das beanstanden. Die eigentliche Logik steckt in der Funktion `IsRelevantFile`, zu der nun eine funktionale Abhängigkeit besteht. Diese Logik ist durch die Auslagerung jedoch leicht testbar.

Wenn ein `if` in solcher Weise zur Lesbarkeit einer Integration beiträgt... Warum dann darauf verzichten? Flow-Design will mit seinen Prinzipien leiten, aber nicht darauf reiten.

Ähnlich sieht es für `foreach` aus, mit dem der Code auf Continuations verzichten kann, weil C# mit `yield return` es erlaubt, sehr einfach Iteratoren nach und nach mit Elementen zu füllen.

#### Offen für Erweiterung, geschlossen für Veränderung

Die Vorteile der Einhaltung von IOSP und PoMO liegen zunächst sichtbar in größerer Verständlichkeit und besserer Testbarkeit von Code. Logik wird ganz natürlich in kleine Einheiten "gezwungen". Flow-Design verzichtet ganz bewusst auf die Möglichkeit funktionaler Abhängigkeiten, um Produktivitätsqualitäten verlässlicher herzustellen. [Functional dependencies considered harmful!](https://ralfw.de/2019/07/functional-dependencies-considered-harmful/) Freiwillige Selbstbeschränkung beim Schreiben von Code fördert das spätere und häufigere Lesen und Verändern von Code.

Der positive Effekt des IOSP entstammt zunächst einer Zuspitzung des SRP: Integration und Operation sind formale Verantwortlichkeiten. Während üblicherweise das SRP inhaltlich bzw. auf das Verhalten angewandt wird, konzentriert sich das IOSP auf die Struktur von Code. Deshalb kann die Einhaltung des IOSP auch leicht überprüft werden, selbst wenn ein Leser mit einer Programmiersprache oder dem angestrebten Verhalten oder der Domäne nur wenig vertraut ist.

Weiterhin befördert das IOSP die Einhaltung des SLA. Wenn Funktionen keine funktionalene Abhängigkeiten enthalten, dann liegt das, was sie zusammenfassen (Komposition) im Abstraktionsgrad näher beieinander.

Und schließlich kann man das PoMO als eine Steigerung des *Interface Segregation Principle (ISP)* auffassen. Denn wenn downstream Konsumenten upstream Produzenten über einen Funktionszeiger (continuation) bekannt gemacht werden, dann entspricht das einer Abhängigkeit von einem Interface mit nur einer Methode. Es findet eine Funktionsinjektion in eine Funktion im Bedarfsfall statt.

Damit aber nicht genug! IOSP und PoMO sind auch ganz im Sinne des *(Polymorphic) Open/Closed Principle (OCP)*! [Robert C. Martin definiert das](https://drive.google.com/file/d/0BwhCYaYDn8EgN2M5MTkwM2EtNWFkZC00ZTI3LWFjZTUtNTFhZGZiYmUzODc1/view) wie folgt:

> Modules that conform to the open-closed principle have two primary attributes.
> 1. They are “Open For Extension”. This means that the behavior of the module can be extended. That we can make the module behave in new and different ways as the requirements of the application change, or to meet the needs of new applications.
> 2. They are “Closed for Modification”. The source code of such a module is inviolate. No one is allowed to make source code changes to it.

Flow-Design übersetzt "module" dabei allerdings in "Funktionseinheit" bzw. "Funktion" als eigentlich Verhalten erzeugende Strukturbestandteile. Und Flow-Design konkretisiert, was denn nicht verändert werden sollte: Logik. Logik ist schwer zu verstehen und schwer zu testen. Daher sollte man die Finger davon lassen, sobald sie einmal tut, was sie soll. Veränderungen für neues Verhalten sollten nicht durch Veränderung (modification) von Logik hergestellt werden - sondern durch neue, separate Logik (extension).

Dem leistet Flow-Design Vorschub durch den Verzicht auf funktionale Abhängigkeiten. Operationen sieht Flow-Design als geschlossen an; ihre Logik sollte soweit möglich nicht angetastet werden. Integrationen hingegen sind für Flow-Design offen. In Integrationen können Erweiterungen des Verhaltens leicht "zwischengeschaltet" werden.

Zunächst ein Szenario ohne IOSP: die Umwandlung römischer Zahlen in dezimale noch ohne Berücksichtigung der Subtraktionsregel.

In [85]:
int FromRoman(string romanNumber) {
    var decimalNumber = 0;
    for(var i=0; i<romanNumber.Length; i++) {
        switch(romanNumber[i]) {
            case 'I': decimalNumber += 1; break;
            case 'V': decimalNumber += 5; break;
            case 'X': decimalNumber += 10; break;
            // ...
        }
    }
    return decimalNumber;
}


display($"XVI={FromRoman("XVI")}")

XVI=16

Was tun, um auch die Anforderungen der Subtraktionsregel zu erfüllen? Die Logik von `FromRoman` muss *verändert* werden! Das ist riskant/schwierig.

Anders liegt der Fall, wenn eine Lösung - auch wenn sie klein ist - sauber modelliert und mit IOSP im Kopf übersetzt wird. Sie sähe dann z.B. so aus:

In [91]:
int FromRoman_OCP(string romanNumber) {
    var digitValues = Map(romanNumber);
    return digitValues.Sum();
}

int[] Map(string romanNumber)
    => romanNumber.ToCharArray().Select(Map).ToArray();
int Map(char romanDigit) => romanDigit switch {
    'I' => 1,
    'V' => 5,
    'X' => 10
    // ...
};


display($"XVI={FromRoman_OCP("XVI")}");
display($"XIV={FromRoman_OCP("XIV")}");

XVI=16

XIV=16

Noch leistet die Lösung nicht, was sie soll. Doch ohne Veränderung einer Operation - `Map`, `Sum` - kann das geändert werden mit einer Erweiterung der Integration. Deren Extension besteht im "Dazwischenschieben" eines weiteren Funktionsaufrufs:

In [95]:
int FromRoman_OCP_extended(string romanNumber) {
    var digitValues = Map(romanNumber);
    digitValues = Negate(digitValues); // Erweiterung🤩
    return digitValues.Sum();
}

// Neue Logik, statt veränderter🥳
int[] Negate(IEnumerable<int> digitValues) {
    var negated = digitValues.ToArray();
    for(var i=0; i<negated.Length-1; i++)
        if (negated[i]<negated[i+1])
            negated[i] *= -1;
    return negated;
}


display($"XVI={FromRoman_OCP_extended("XVI")}");
display($"XIV={FromRoman_OCP_extended("XIV")}");

XVI=16

XIV=14

Durch die Trennung von Integration und Operation reduziert Flow-Design den Aufwand, um dem OCP zu dienen. Erweiterbarkeit ist ein grundlegendes Merkmal von Integrationen. Dass man dafür Code im Fluss der Verhaltensherstellung anfassen muss, ist unerheblich. Das Risiko für Schaden (Regression) dadurch ist vergleichsweise klein. Wahrhaft risikoreiche Veränderungen an Logik sind auf sehr überschaubare Operationen begrenzt.

Die erste Frage beim Modellieren eines Lösungsansatzes für neues Verhalten lautet im Flow-Design: Kann das neue Verhalten hergestellt werden, in den lediglich Funktionseinheiten in einem Datenfluss zwischen andere gesetzt werden? Öfter als man denkt, kann darauf mit Ja geantwortet werden. (Und wenn nicht, kann das als Anlass genommen werden, den bisherigen Lösungsansatz nocheinmal zu überdenken, um ihn mittels IOSP näher ans OCP zu bringen.)

#### Stratified Design

Dem Verständnis eines Systems ist zuträglich, wenn man es aus unterschiedlicher Entfernung betrachten kann. Ist man näher dran, kann man Details untersuchen. Ist man weiter weg, gewinnt man Überblick über den Zusammenhang von Teilen.

Geografische Karten erlauben uns, in solcher Weise mit einem Terrain umzugehen. Wir ziehen sie z.B. zur Planung einer Reise in unterschiedlichem Maßstab heran. Eine Karte mit großem Maßstab, z.B. eine Europa-Karte, gibt uns Überblick für eine grobe Routenplanung. Eine topografische Karte hingegen zeigt uns eine eng begrenzte Umgebung mit viel mehr Einzelheiten. Werkzeuge wie Google Maps machen heute den Wechsel des Maßstabs besonders einfach.

Für das Studium von Code ist es ebenfalls nützlich, den Maßstab seiner Darstellung wechseln zu können. Das Ganze sollte grob und im Überblick betrachtet werden können; genauso sollte es möglich sein, schrittweise hinein zu zoomen, um mehr und mehr Details zu sehen.

Große Maßstäbe stehen für ein hohes Abstraktionsniveau, kleine Maßstäbe für ein niedriges. Um hinein und heraus zoomen zu können, muss Code also unterschiedliche Abstraktionsniveaus aufweisen.

Tut er das z.B., wenn er nach dem weit verbreiteten Schichtenmodell strukturiert ist?

Als Beispiel ein kleines Programm, dass die Worte in einer Datei zählt. Es besteht aus drei typischen Schichten:

* Presentationsschicht/Benutzerschnittstelle: Beschafft den Namen der zu verarbeitenden Datei aus der Umgebung und gibt das Ergebnis aus, das es von der Geschäftslogik bekommt.
* Geschäftslogikschicht: Ermittelt das Ergebnis, nachdem es von der Datenzugriffschicht den Dateiinhalt bekommen hat.
* Datenzugriffsschicht: Lädt den Inhalt einer Datei.

![](images/df100.png)

Funktionale Abhängigkeiten zeigen hier grundsätzlich über die Schichten hinweg von oben nach unten. Ob das kaschiert wird mit DIP/IoC, ist unwesentlich. Und auch Schalen statt Schichten, wie in der Clean Architecture, machen keinen Unterschied. So oder so sind die Aspekte funktional voneinander abhängig zur Laufzeit.

In [102]:
class Presentation {
    public static void CountWords(string filename) {
        var numberOfWords = Business.CountWords(filename);
        Console.WriteLine($"Number of significant words in '{filename}': {numberOfWords}");
    }
}

class Business {
    public static int CountWords(string filename) {
        var words = Dataaccess.Load(filename);
        var significantWords = words.Where(w => w.Length > 2);
        return significantWords.Count();
    }
}

class Dataaccess {
    public static IEnumerable<string> Load(string filename) {
        var text = System.IO.File.ReadAllText(filename);
        return text.Split(new[]{' ', '\t', '\n', '\r'}, StringSplitOptions.RemoveEmptyEntries);
    }
}


Presentation.CountWords("samples/poem.txt");

Number of significant words in 'samples/poem.txt': 72


Der Code ist das Terrain. Das Schichtenmodell ist eine Karte für dieses Terrain. Sie abstrahiert von den Details der Logik und sogar von den einzelnen Methoden. Das ist durchaus nützlich. Und das ganze Programm mit einem Betriebssystemprozess als Host abstrahiert sogar noch von den Klassen als Feinheiten der Implementation.

![](images/df101.png)

##### Abhängigkeiten definieren das Abstraktionsgefälle

Aus diesem Bild wird ersichtlich, wie Abstraktion und Abhängigkeit in Zusammenhang stehen: Abstraktion definiert einen Baum. Dessen Wurzel ist das Abstraktum, seine Blätter sind die Details, von denen damit abgesehen wird.

![](images/df102.png)

Das Abstrakte *besteht* aus dem Konkreten. Das Abstrakte ist somit vom Detail *abhängig*, das in ihm unter einem Gesichtspunkt zusammengefasst ist. Die Abhängigkeitsbeziehung weist vom Abstrakten zum Konkreten. In Richtung von Abhängigkeiten fällt mithin das Abstraktionsniveau.

##### Abstraktionen im Flow-Design

Flow-Design ist vor allem mit Abstraktionen nach zwei Gesichtspunkten beschäftigt:

* Aggregation: Zusammenfassen von *Ähnlichem*; das, was gemeinsam ist, definiert die Abstraktion.
* Komposition: Zusammenfassen von *Verschiedenem*; das Neue, das durch die gegenseitige Ergänzung des Verschiedenen entsteht, macht die Abstraktion aus.

![](images/df103.png)

Das Mittel zur Aggregation sind Module. Das Mittel zur Komposition sind Integration und Operation.

Aggregation erzeugt Überblick durch Ausblenden der Verschiedenartigkeit von Konkretem. Komposition erzeugt Neues durch Verschmelzen der Verschiedenartigkeit von Konkretem.

##### Fehlende Abstraktionen bei funktionaler Abhängigkeit

Vor diesem Hintergrund wird deutlich, dass Code, der nach dem Schichtenmodell strukturiert ist, Abhängigkeiten falsch im Sinne von Abstraktion einsetzt.

`Presentation.CountWords` als Wurzel des Abhängigkeitsbaums kann noch als Repräsentant des Ganzen auf höchster Abstraktionsebene angesehen werden; immerhin geht es um das Zählen von Worten in einer Datei.

Aber wie steht es mit `Business.CountWords`? Liegt die Methode auf einem niedrigeren Abstraktionsniveau? Tut sie dasselbe, wie die von ihr abhängige, nur eben konkreter? Ja, vielleicht könnte man das noch zugestehen. Es ja immerhin wieder um das Zählen von Worten in einer Datei; dieses Mal wird deren Zahl als Ergebnis geliefert, statt auf dem Bildschirm ausgegeben.

Und schließlich `Dataaccess.Load`: Ist damit die Problemlösung auf einem niedrigeren Abstraktionsniveau beschrieben? Nein. Hier geht es nicht mehr ums Zählen. Das ist deutlich sichtbar. Spätestens bei der Abhängigkeit der Geschäftslogik von der Datenzugriffslogik wird das Prinzip verletzt, dass Abhängigkeiten vom Abstrakten auf das Konkrete verweisen sollen.

Abstraktionsniveaus sind dadurch gekennzeichnet, dass auf einem bestimmten Niveau jeweils das Ganze zu sehen ist, nur eben in einem gewissen Detaillierungsgrad. Das ist offensichtlich bei `Dataaccess.Load` nicht der Fall und schon bei `Business.CountWords` wackelt das Bild.

Die Abhängigkeiten zwischen Methoden in einem Schichtenmodell beschreiben also keinen Abstraktionsbaum. Doch wie steht es mit dem Klassenbaum? Liegt eine `Presentation`-Klasse auf einem höheren Abstraktionsniveau als eine `Business`- oder `Dataaccess`-Klasse? Tut `Presentation` das in Aggregation, was `Business` oder `Dataccess` tun? Hier antwortet Flow-Design ebenfalls mit Nein.

Eine Geschäftslogik ist nicht dasselbe wie Datenzugriffslogik, nur eben auf einem anderen Abstraktionsniveau.

##### Dark Logic

Der Grund für diese "Missweisung" der Abhängigkeiten ist ihre funktionale Natur. Bäume funktionaler Abhängigkeiten enthalten *dark logic*, d.h. Logik, die Verhaltensrelevant ist, aber nicht im Modell repräsentiert. Das wird deutlich bei einer Darstellung des Lösungsansatzes für die Wortzählung als Datenflussdiagramm:

![](images/df103a.png)

Der Input von `Business.CountWords` passt noch zum Input von `Presentation.CoundWords`, aber der Output passt nicht. Was passiert mit der hinausfließenden Zahl der Worte? Genauso bei `Business.CoundWords` und `Dataaccess.Load`: Wie wird aus einer collection von Strings eine Zahl? Nicht einmal das formale Konsistenzkriterium von Datenflüssen, dass Input und Output einer Funktionseinheit zum Input und Output ihrer Verfeinerung passen muss, ist nicht eingehalten.

Beides ist nur zu erklären mit dark logic: In der abhängigen, integrierenden Funktionseinheit muss noch Logik stecken. Diese Logik widerspricht dem SLA:

```csharp
public static int CountWords(string filename) {
    var words = Dataaccess.Load(filename);
    var significantWords = words.Where(w => w.Length > 2);
    return significantWords.Count();
}
```

`Dataaccess.Load` liegt auf einem höheren Abstraktionsniveau als die folgenden Zeilen, weil die Methode selbst Logik zu einer neuen Funktionalität komponiert.

Laut IOSP kann das jedoch nicht sein.

Dark logic ist es, die Code schwer zu verstehen und schwer zu testen macht. Abhängigkeitsdiagrammen von Funktionen, die *funktional* abhängig sind, fehlt wesentliche Information, um zu verstehen, wie Verhalten hergestellt wird. Nicht, dass Logik explizit gezeigt werden müsste; damit würde der Abstraktionszweck gebrochen. Aber Logik muss explizit repräsentiert werden.

Das ist, wozu die Einhaltung des IOSP führt. Das IOSP macht dark logic sichtbar.

##### Stratified Design

Software strukturiert nach IOSP besteht nicht aus Schichten, sondern *Strata*. Jedes Stratum definiert dabei ein Abstraktionsniveau.

> "\[...\] expert engineers stratify complex designs. Each level is constructed as a stylized combination of interchangeable parts that are regarded as primitive at that level. The parts constructed at each level are used as primitives at the next level. Each level of a stratified design may be thought of as a specialized language with a variety of primitives and means of combination appropriate to that level of detail.", Abelson & Sussman in "Lisp: A Language for Stratified Design"

Das Schichtenmodell (oder auch eine Clean Architecture) sind keine Repräsentaten von *stratified design*. Lösungen existieren dort nicht auf unterschiedlichen Abstraktionsniveaus, weil Schichten/Schalten funktional von einander abhängig sind.

Anders jedoch im Flow-Design. Hier ein Datenfluss-Modell für das Wortzählungsproblem:

![](images/df104.png)

In diesem Modell existiert keine dark logic mehr. Die Lösung wird in zwei Strata komplett beschrieben:

![](images/df105.png)

Die gesamte Logik ist in Operationen verpackt.

Das höchste Abstraktionsniveau wurde durch das IOSP explizit eingeführt: die Klasse `CountWords` mit der Methode `Run`, die beide für Integration stehen. `CountWords` integriert die Aspekt-Klassen `Presentation`, `Business` und `Dataaccess`. `Run` integriert deren Methoden.

In [104]:
class CountWords {
    public static void Run(string filename) {
        var words = Dataaccess.Load(filename);
        var numberOfWords = Business_Stratified.CountWords(words);
        Presentation_Stratified.DisplayResult(filename, numberOfWords);
    }
}


class Presentation_Stratified {
    public static void DisplayResult(string filename, int numberOfWords) {
        Console.WriteLine($"Number of significant words in '{filename}': {numberOfWords}");
    }
}

class Business_Stratified {
    public static int CountWords(IEnumerable<string> words) {
        var significantWords = words.Where(w => w.Length > 2);
        return significantWords.Count();
    }
}


CountWords.Run("samples/poem.txt");

Number of significant words in 'samples/poem.txt': 72


Was vorher funktional abhängig war, steht jetzt in einer Sequenz im Datenfluss in `Run`. So ist es richtig, wenn es keine Unterschiede im Abstraktionsniveau gibt.

Im Beispiel macht die Geschäftslogik klar, wieviel plausibler das ist. Sie ist jetzt nicht mehr abhängig vom Datenzugriff. Warum sollte sie das auch sein? Welchen Grund gibt es, dass Domänenlogik sich Daten aus einer Ressource beschaffen sollte? Warum sollte Domänenlogik Kenntnis von einer Ressource haben?

Das Schichtenmodell erklärt das nicht. Die Clean Architecture erklärt das auch nicht, obwohl auch dort zur Laufzeit (!) noch innere Schalen äußere aufrufen.

Um den Kern einer Software wirklich von der Umwelt zu isolieren, darf es keine funktionalen Abhängigkeiten zwischen ihm und der Umwelt gehen. Funktionale Abhängigkeiten sind schlicht ein Widerspruch zum SLA. Mit ihnen würde die Geschäftslogik auf ein höheres Abstraktionsniveau gehoben als der Datenzugriff. Dort hat sie jedoch nichts zu suchen. Geschäftslogik ist nicht abstrakter als Datenzugriffslogik. Vielleicht ist sie zentraler, wichtiger, aber nicht abstrakter.

##### Strata verstanden als Sprachen

Die Lösung wird mit drei Sprache beschrieben:

* Die höchste Sprache besteht nur aus einem Wort: `Run`.
* Die niedrigere Sprache besteht aus drei Worten: `Load`, `CountWords` und `DisplayResult`.
* Die niedrigste Sprache besteht aus den Logik-Anweisungen in den Operationen.

Der Jo-Jo Entwurf von Flow-Design kann also als Sprachentwurf verstanden werden. Mit welchen sukzessive "primitiveren" - oder besser: allgemeineren - Sprachen lässt sich eine Lösung formulieren.

Die höchste Sprache bzw. die spezifischste besteht dabei immer nur aus einem Wort. Im Grunde ist es ein ["Sesam, öffne dich"](https://de.wikipedia.org/wiki/Ali_Baba) oder ["simsalabim"](https://de.wikipedia.org/wiki/Zauberspruch): das ganze Problem möge sich wie von Zauberhand durch Aufruf dieses einen Wortes in Luft auflösen.

Demgegenüber besteht die primitivste, allgemeinste Sprache immer aus allen Worten der zugrundgelegten Plattform aus Programmiersprache, Bibliotheken, Frameworks, APIs.

Und zwischen diesen beiden können beliebig viele weitere Sprachen eingezogen werden. Bei trivialen Problem mögen die höchste und primitivste ausreichen. Alle interessanten Probleme jedoch werden am besten durch Spezialsprachen gelöst, die aufeinander aufbauen.

Dazu ist es nicht nötig, *Domain Specific Languages (DSL)*, gar grafische, zu entwickeln. Simple Funktionen (und Module) genügen.

Im Flow-Design gleichen sich diese Sprachen alle in ihrer Syntax, die durch Datenflüsse (und nicht-funktionale Abhängigkeiten) vorgegeben ist. Das Vokabular jedoch ist zu (er)finden.

In Bezug auf ein etwas erweitertes Wortzählungsproblem ließen sich z.B. weitere Abstraktionsebenen mit eigenem Vokabular einziehen. Das könnte so aussehen:

![](images/df106.png)

Im Code ist Logik nun in kleinere Einheiten verpackt. Die Funktionen sind feingranularer, das Vokabular also differenzierter (siehe Klassen der Geschäfts- und Datenzugriffslogik):

In [110]:
class CountWords_v2 {
    public static void Run(string filename) {
        var words = Dataaccess_Stratified.Load(filename);
        var numberOfWords = Business_Stratified_v2.CountWords(words);
        Presentation_Stratified.DisplayResult(filename, numberOfWords);
    }
}

class Business_Stratified_v2 {
    public static int CountWords(IEnumerable<string> words) {
        var significantWords = FilterShort(words);
        significantWords = FilterNumbers(significantWords);
        return significantWords.Count();
    }
    
    private static IEnumerable<string> FilterShort(IEnumerable<string> words)
        => words.Where(w => w.Length > 2);
    
    private static IEnumerable<string> FilterNumbers(IEnumerable<string> words) {
        return words.Where(IsNoNumber);
        
        bool IsNoNumber(string candidateWord)
            => int.TryParse(candidateWord, out var _) is false;
    }
}

class Dataaccess_Stratified {
    public static IEnumerable<string> Load(string filename) {
        var text = LoadText(filename);
        return SplitIntoWords(text);
    }
    
    private static string LoadText(string filename)
        => System.IO.File.ReadAllText(filename);
    
    private static IEnumerable<string> SplitIntoWords(string text)
        => text.Split(new[]{' ', '\t', '\n', '\r'}, StringSplitOptions.RemoveEmptyEntries);
}


CountWords_v2.Run("samples/poem.txt");

Number of significant words in 'samples/poem.txt': 72


Die Lösung besteht jetzt aus drei Strata:

1. `Run`
2. `Load`, `CountWords`, `DisplayResult`
3. `LoadText`, `SplitIntoWords`, `FilterShort`, `FilterNumbers`, `Count`, `DisplayResult`

![](images/df106a.png)

Das Vokabular wechselt von Stratum zu Stratum. Die Funktionseinheiten werden allgemeiner und allgemeiner, d.h. ihr Einsatzbereich wird größer und größer. Je tiefer ein Stratum liegt, desto größer die potenzielle Wiederverwendbarkeit der Funktionseinheiten in darüberliegenden Strata.

Tendenziell werden Funktionseinheiten eines Stratums nur im direkt darüber liegenden benutzt. Gelegentlich greifen jedoch auch weiter oben liegende Strata darauf zu (siehe `DisplayResult` im obigen Beispiel). Manches Vokabular ist dann so grundlegend, dass es sich durch mehrere Abstraktionsebenen durchzieht. Streng genommen könnte das als Verstoß gegen das SLA angesehen werden - doch im Einzelfall mag das besser verständlich sein als weitere Kapselungen in den einzelnen Strata.

Deshalb ist auch Logik hier und da in der Integration im Flow-Design geduldet. Logik ist das Vokabular des Terrains und sollte deshalb nicht in einem Stratum der Abstraktion auftauchen - außer eben in Einzelfällen. Beispiel dafür hier ist `Count` in `Business_Stratified_v2.CountWords`, deren Aufruf zum dritten Stratum gerechnet wird.

Unterhalb der Strata der Abstraktion liegt dann die Logik selbst. Ohne Operationen, Integrationen und Module ist sie quasi nackt. Jedes Detail ist sichtbar - aber die Lösung in dieser Weise entschleiert ist schwer verständlich und ihre Aspekte sind nicht getrennt testbar.

In [117]:
var filename = "samples/poem.txt";

var text = System.IO.File.ReadAllText(filename);
IEnumerable<string> words = text.Split(new[]{' ', '\t', '\n', '\r'}, StringSplitOptions.RemoveEmptyEntries);

words = words.Where(w => w.Length > 2);
words = words.Where(w => int.TryParse(w, out var _) is false);
var numberOfWords = words.Count();

Console.WriteLine($"Number of significant words in '{filename}': {numberOfWords}");

Number of significant words in 'samples/poem.txt': 72


##### Zusammenfassung

Code aufgebaut aus Strata wachsender Abstraktion um einen Kern aus Logik herum versprechen bessere Verständlichkeit und Veränderbarkeit. Das meinen nicht nur Abselson und Sussman, sondern auch Alan Kay, [der dabei ebenfalls von einer Hierarchie von Sprachen spricht](https://www.tele-task.de/lecture/video/2772/#t=3283).

![](images/df107.png)

Nichts anderes geschieht ja auch ganz grundsätzlich, wenn man Lösungen mit Logik in einer modernen Programmiersprache formuliert. Selbst die reine Logik der obigen Wortzählungslogik lässt sich als abstraktes Stratum verstehen oberhalb des Stratums der .NET *Intermediate Language (IL)*, das wiederum auf dem Stratum des Prozessor-Maschinencodes liegt, der den tatsächlich ausgeführten Microcode abstrahiert.

![](images/df108.png)

Warum also diese erfolgreiche Methode nicht oberhalb der Logik ebenfalls anwenden?

Mit den Datenflüssen des Flow-Design geschieht das quasi natürlich durch die Anwendung von IOSP und PoMO. Dennoch ist die Vorstellung, in Strata von Sprache zu denken, ein gutes Hilfsmittel, um hierarchische Datenflüsse zu entwerfen.

Und zur Analyse von funktionalen Hierarchien erweist sich das Prinzip nützlich, dass Abhängigkeiten nur in Richtung des Abstraktionsgefälles zeigen sollen, also von hoher Abstraktion zu niedriger. MVC, Schichtenmodell, Clean Architecture oder auch alle Entwurfsmuster können daraufhin überprüft werden, ob ihre Abhängigkeiten dem entsprechen. Tun sie das nicht, ist aus Sicht von Flow-Design zumindest Vorsicht angezeigt. Allemal die Verständlichkeit mag dann geringer als möglich sein.