In [2]:
%classpath add jar "/home/myuser/graph.jar"

## Rezeptempfehlungen
Stellen Sie sich vor, Sie wollen für sich zu Hause etwas ähnliches aufbauen, wie die vielen Rezeptwebsites und Apps, die es bereits gibt. Der Unterschied ist jedoch, dass Sie dafür ausschließlich Rezepte nutzen wollen, die Sie bei sich zu Hause haben und kennen. Ihre Zielvorstellung ist, ein paar (vorhandene) Lebensmittel einzutippen und Vorschläge für Rezepte zu bekommen, die diese als Zutaten benötigen.

### 1. Schritt
Ihnen ist klar, dass ein Graph die ideale Datenstruktur dafür darstellt. Zuerst überlegen Sie sich also, was sich am besten für die Knoten und Kanten eignet und erstellen eine "Dummy-Datenstruktur". Dafür nutzen Sie die aus den Übungen bekannte Graphen Library.

In [3]:
import graph.AbstractEdge;
import graph.GraphEdgeList;
import graph.Vertex;

In [13]:
private static GraphEdgeList<Integer, String> createGraph() {
    GraphEdgeList<Integer, String> graph = new GraphEdgeList<>();

        // Recipes
        Vertex<String> recipe1 = graph.insertVertex(new Vertex<>("Recipe: Greek Salad"));
        Vertex<String> recipe2 = graph.insertVertex(new Vertex<>("Recipe: Spaghetti Carbonara"));
        Vertex<String> recipe3 = graph.insertVertex(new Vertex<>("Recipe: Caprese Salad"));
        Vertex<String> recipe4 = graph.insertVertex(new Vertex<>("Recipe: Tomato Basil Soup"));

        // Ingredients
        Vertex<String> ingredient1 = graph.insertVertex(new Vertex<>("Tomato"));
        Vertex<String> ingredient2 = graph.insertVertex(new Vertex<>("Feta"));
        Vertex<String> ingredient3 = graph.insertVertex(new Vertex<>("Cucumber"));
        Vertex<String> ingredient4 = graph.insertVertex(new Vertex<>("Spaghetti"));
        Vertex<String> ingredient5 = graph.insertVertex(new Vertex<>("Egg"));
        Vertex<String> ingredient6 = graph.insertVertex(new Vertex<>("Pancetta"));
        Vertex<String> ingredient7 = graph.insertVertex(new Vertex<>("Parmesan"));
        Vertex<String> ingredient8 = graph.insertVertex(new Vertex<>("Mozzarella"));
        Vertex<String> ingredient9 = graph.insertVertex(new Vertex<>("Basil"));
        Vertex<String> ingredient10 = graph.insertVertex(new Vertex<>("Olive Oil"));

        // Greek Salad
        graph.insertEdge(ingredient1, recipe1, 0); // Tomato
        graph.insertEdge(ingredient2, recipe1, 0); // Feta
        graph.insertEdge(ingredient3, recipe1, 0); // Cucumber

        // Spaghetti Carbonara
        graph.insertEdge(ingredient4, recipe2, 0); // Spaghetti
        graph.insertEdge(ingredient5, recipe2, 0); // Egg
        graph.insertEdge(ingredient6, recipe2, 0); // Pancetta
        graph.insertEdge(ingredient7, recipe2, 0); // Parmesan

        // Caprese Salad (similar to Greek Salad)
        graph.insertEdge(ingredient1, recipe3, 0); // Tomato
        graph.insertEdge(ingredient8, recipe3, 0); // Mozzarella
        graph.insertEdge(ingredient9, recipe3, 0); // Basil
        graph.insertEdge(ingredient10, recipe3, 0); // Olive Oil

        // Tomato Basil Soup
        graph.insertEdge(ingredient1, recipe4, 0); // Tomato
        graph.insertEdge(ingredient9, recipe4, 0); // Basil
        graph.insertEdge(ingredient10, recipe4, 0); // Olive Oil

    return graph;
}

In [14]:
GraphEdgeList<Integer, String> graph = createGraph();

Dieses Grundgerüst an Rezepten wollen Sie sich nun erstmal anschauen (könnenn). Da Sie sich noch nicht auf ein finales System oder visuelle Darstellung festgelegt haben, lassen Sie sich von ChatGPT eine Methode schreiben, die den Graph als sogenanntes dot-file speichert (dot ist ein Dateiformat, das von <u>[Graphviz](https://graphviz.org/)</u> verwendet wird, einem hilfreichen kleinen Tool, um Graphen schnell und schön zu zeichnen).

In [15]:
private static void saveGraphAsDot(GraphEdgeList<Integer, String> graph, String filename) {
    try (FileWriter writer = new FileWriter(filename)) {
        writer.write("digraph RecipeGraph {\n");

        // Write vertices
        for (Vertex<String> vertex : graph.vertices()) {
            writer.write("  \"" + vertex.getElement() + "\";\n");
        }

        // Write edges
        for (AbstractEdge<Integer> edge : graph.edges()) {
            Vertex<String>[] incidentVertices = graph.endVertices(edge);
            Vertex<String> source = incidentVertices[0];
            Vertex<String> target = incidentVertices[1];
            writer.write("  \"" + source.getElement() + "\" -> \"" + target.getElement() + "\";\n");
        }

        writer.write("}");
    } catch (IOException e) {
        e.printStackTrace();
    }
}

In [16]:
// Save the graph as a DOT file
saveGraphAsDot(graph, "recipe_graph.dot");

Die so erzeugte Datei sieht folgendermaßen aus und nun kann unter Windows mit dem Befehl: <Link-zu-Graphviz>\dot.exe -Tpng -o recipe_graph.png recipe_graph.dot (den man auf der Konsole ausführt) der Graph gezeichnet werden:
 <br>  <br>
digraph RecipeGraph { <br>
  "Recipe: Greek Salad"; <br>
  "Recipe: Spaghetti Carbonara"; <br>
  "Recipe: Caprese Salad"; <br>
  "Recipe: Tomato Basil Soup"; <br>
  "Tomato"; <br>
  "Feta"; <br>
  "Cucumber"; <br>
  "Spaghetti"; <br>
  "Egg"; <br>
  "Pancetta"; <br>
  "Parmesan"; <br>
  "Mozzarella"; <br>
  "Basil"; <br>
  "Olive Oil"; <br>
  "Tomato" -> "Recipe: Greek Salad"; <br>
  "Feta" -> "Recipe: Greek Salad"; <br>
  "Cucumber" -> "Recipe: Greek Salad"; <br>
  "Spaghetti" -> "Recipe: Spaghetti Carbonara"; <br>
  "Egg" -> "Recipe: Spaghetti Carbonara"; <br>
  "Pancetta" -> "Recipe: Spaghetti Carbonara"; <br>
  "Parmesan" -> "Recipe: Spaghetti Carbonara"; <br>
  "Tomato" -> "Recipe: Caprese Salad"; <br>
  "Mozzarella" -> "Recipe: Caprese Salad"; <br>
  "Basil" -> "Recipe: Caprese Salad"; <br>
  "Olive Oil" -> "Recipe: Caprese Salad"; <br>
  "Tomato" -> "Recipe: Tomato Basil Soup"; <br>
  "Basil" -> "Recipe: Tomato Basil Soup"; <br>
  "Olive Oil" -> "Recipe: Tomato Basil Soup"; <br>
} <br>

![Alt Text]("/home/myuser/recipe_graph.png")

Mit diesem Grundgerüst an Graph, implementieren Sie den nächsten Schritt: die eigentliche Empfehlung. Aus Graphentheoretischer Sicht ist das nichts anderes, als zwei Knoten im Graphen suchen und ihre nächsten Nachbarn geschickt aufzulisten. Dementsprechend wird nun eine Methode erzeugt, die sowohl den Graph als auch die zu suchenden Zutaten übergeben bekommt. Im ersten Schritt sind nur zwei Zutaten zugelassen, um die Implementierung zu Beginn richtig aufzusetzen und später erweitern zu können.

In [21]:
private static void findRecipes(GraphEdgeList<Integer, String> graph, String ingredient1, String ingredient2) {
    System.out.println("Recipes for ingredients: " + ingredient1 + ", " + ingredient2);
    boolean found = false;

    for (Vertex<String> vertex : graph.vertices()) {
        String recipe = vertex.getElement();

        boolean hasIngredient1 = false;
        boolean hasIngredient2 = false;

        Collection<AbstractEdge<Integer>> connections = graph.incidentEdges(vertex);
        for (AbstractEdge<Integer> edge : connections) {
            Vertex<String> ingredientVertex = graph.opposite(vertex, edge);
            String ingredient = ingredientVertex.getElement();
            if (ingredient.equals(ingredient1)) {
                hasIngredient1 = true;
            } else if (ingredient.equals(ingredient2)) {
                hasIngredient2 = true;
            }
        }

        if (hasIngredient1 && hasIngredient2) {
            System.out.println(recipe);
            found = true;
        }
    }

    if (!found) {
        System.out.println("No recipes found for the given ingredients.");
    }
}

In [22]:
// Example: Find recipes with given ingredients
findRecipes(graph, "Tomato", "Feta");

Recipes for ingredients: Tomato, Feta
Recipe: Greek Salad


Idealerweise wächst das Programm mit der Zeit und ist in der Lage aus vielen Rezepten zu lesen. Dabei gibt es verschiedene Fehlerquellen, die auftreten können. Um nun sicherzustellen, dass beim Rezepte auf Basis von Zutaten suchen, wirklich nur Rezepte ausgegeben werden, ergänzen Sie eine kleine Bedingung in der Methode. Sollten nun mal aus irgendeinem Grund mehrere Zutaten direkt miteinander verbunden sein und nicht nur indirekt über ein Rezept, ist sichergestellt, dass nur Rezepte ausgegeben werden.

In [23]:
    private static void findRecipes(GraphEdgeList<Integer, String> graph, String ingredient1, String ingredient2) {
        System.out.println("Recipes for ingredients: " + ingredient1 + ", " + ingredient2);
        boolean found = false;

        for (Vertex<String> vertex : graph.vertices()) {
            String recipe = vertex.getElement();
            if (!recipe.startsWith("Recipe: ")) {
                continue; // Skip ingredients
            }

            boolean hasIngredient1 = false;
            boolean hasIngredient2 = false;

            Collection<AbstractEdge<Integer>> connections = graph.incidentEdges(vertex);
            for (AbstractEdge<Integer> edge : connections) {
                Vertex<String> ingredientVertex = graph.opposite(vertex, edge);
                String ingredient = ingredientVertex.getElement();
                if (ingredient.equals(ingredient1)) {
                    hasIngredient1 = true;
                } else if (ingredient.equals(ingredient2)) {
                    hasIngredient2 = true;
                }
            }

            if (hasIngredient1 && hasIngredient2) {
                System.out.println(recipe);
                found = true;
            }
        }

        if (!found) {
            System.out.println("No recipes found for the given ingredients.");
        }
    }


In [24]:
findRecipes(graph, "Tomato", "Feta");
findRecipes(graph, "Tomato", "Olive Oil");
findRecipes(graph, "Tomato", "Basil");

Recipes for ingredients: Tomato, Feta
Recipe: Greek Salad
Recipes for ingredients: Tomato, Olive Oil
Recipe: Caprese Salad
Recipe: Tomato Basil Soup
Recipes for ingredients: Tomato, Basil
Recipe: Caprese Salad
Recipe: Tomato Basil Soup


Das klappt schon ganz gut. Als nächstes möchten wir die Möglichkeit haben, Rezepte auch dynamisch hinzufügen zu können, d.h. über eine Textdatei oder vielleicht sogar indem wir sie von einem Link auslesen.

## Introduction to Streams in Java

In Java, streams are used to perform input and output (I/O) operations. Streams represent a sequence of data bytes or characters flowing between a source and a destination.

### Byte Streams

Byte streams are used to read and write raw binary data. They are typically used for handling binary files or low-level data.

### Character Streams

Character streams are used to read and write text data as a stream of characters. They handle character encoding automatically and are suitable for reading and writing text files.

Let's demonstrate how to read text from a file using byte streams and character streams in Java.

In [None]:
try {
    // Read text from a file using byte stream (FileInputStream)
    FileInputStream byteStream = new FileInputStream("example.txt");
    int data;
    while ((data = byteStream.read()) != -1) {
        System.out.print((char) data);
    }
    byteStream.close();
    
    System.out.println("\n\n---\n");
    
    // Read text from a file using character stream (FileReader)
    FileInputStream charStream = new FileInputStream("example.txt");
    while ((data = charStream.read()) != -1) {
        System.out.print((char) data);
    }
    charStream.close();
} catch (IOException e) {
    e.printStackTrace();
}


Wir haben bereits absolute und relative Pfade genutzt, um Dateien vom Computer einzulesen, für unser neuestes Projekt stehen wir jedoch vor der Herausforderung, dass wir noch nicht entschieden haben, auf welchem System es am Ende laufen soll (Windows, Mac, Linux, ...). Es gibt im Endeffekt zwei Möglichkeiten, den Pfad der einzulesenden Datei so abzuspeichern, dass dieser auf jedem System gefunden werden kann:
* mit aufwendigen switch/if-else Abfragen, um die Systempfade richtig zu setzen
* Nutzen von bestehender Javafunktionalität

Wir entscheiden uns für den zweiten Weg und schreiben nun eine Methode, um Dateien einzulesen. Diese Methode hat als Eingabeparameter den Graph sowie den absoluten Pfad zur Datei und wandelt diesen Pfad dann systemspezifisch um, liest die Datei ein und fügt die neuen Knoten und Kanten dem bestehenden Graph hinzu.

In [None]:
private static void addRecipeFromFile(GraphEdgeList<Integer, String> graph, String filePath) {
    // Convert the file path to system-specific format
    String systemSpecificPath = Paths.get(filePath).toString();

    try (BufferedReader reader = new BufferedReader(new FileReader(systemSpecificPath))) {
        String nameLine = reader.readLine();
        String ingredientsLine = reader.readLine();

        if (nameLine != null && ingredientsLine != null) {
            String recipeName = nameLine.split(": ")[1];
            String[] ingredients = ingredientsLine.split(": ")[1].split(", ");

            // Insert the recipe vertex
            Vertex<String> recipeVertex = graph.insertVertex(new Vertex<>(recipeName));

            // Insert ingredient vertices and edges
            Map<String, Vertex<String>> ingredientMap = new HashMap<>();
            for (Vertex<String> vertex : graph.vertices()) {
                ingredientMap.put(vertex.getElement(), vertex);
            }

            for (String ingredient : ingredients) {
                Vertex<String> ingredientVertex = ingredientMap.get(ingredient);
                if (ingredientVertex == null) {
                    ingredientVertex = graph.insertVertex(new Vertex<>(ingredient));
                    ingredientMap.put(ingredient, ingredientVertex);
                }
                graph.insertEdge(ingredientVertex, recipeVertex, 0);
            }
        }
    } catch (IOException e) {
        e.printStackTrace();
    }
}

Eine weitere Herausforderung sind Sprachen. Auf einem englischsprachigen System sind keine deutschen Umlaute bekannt usw. 

Nun können wir erfolgreich mehrere Rezepte einlesen und kennen die Hürden von ASCII und Umlauten. Als nächstes nehmen wir uns das Suchen und Finden der Rezepte vor:
In der ersten Implementierung oben haben wir es der Library überlassen, passende Knoten zu finden. Aber ist das die beste Möglichkeit? Kann die dort vorhandene Methode auch mit nicht perfekt passendem Text umgehen? Also zum Beispiel: wenn ich "Tomate" eingebe, statt "Tomaten" oder "Tomte" (=hier ist der Tippfehler gemeint, nicht die Band). Wir sollten uns also noch mit dem sog. String-Matching beschäftigen, bevor wir weitermachen können.

Was für uns Menschen trivial erscheinen mag, ist für den Computer ungleich viel schwerer: In einem (großen) Datensatz nach einem Textpattern suchen und dieses finden. Wir schauen uns folgenden vier Möglichkeiten genauer an:
* naiver Ansatz
* Boyer-Moore-Algorithmus
* Levenshtein-Distanz
* Regular Expressions

