In [3]:
%classpath add jar "/home/myuser/graph.jar"

## Rezeptempfehlungen
Stellen Sie sich vor, Sie wollen für sich zu Hause etwas ähnliches aufbauen, wie die vielen Rezeptwebsites und Apps, die es bereits gibt. Der Unterschied ist jedoch, dass Sie dafür ausschließlich Rezepte nutzen wollen, die Sie bei sich zu Hause haben und kennen. Ihre Zielvorstellung ist, ein paar (vorhandene) Lebensmittel einzutippen und Vorschläge für Rezepte zu bekommen, die diese als Zutaten benötigen.

### 1. Schritt
Ihnen ist klar, dass ein Graph die ideale Datenstruktur dafür darstellt. Zuerst überlegen Sie sich also, was sich am besten für die Knoten und Kanten eignet und erstellen eine "Dummy-Datenstruktur". Dafür nutzen Sie die aus den Übungen bekannte Graphen Library.

In [4]:
import graph.AbstractEdge;
import graph.GraphEdgeList;
import graph.Vertex;
import java.nio.file.Paths;

In [5]:
private static GraphEdgeList<Integer, String> createGraph() {
    GraphEdgeList<Integer, String> graph = new GraphEdgeList<>();

        // Rezepte
        Vertex<String> rezept1 = graph.insertVertex(new Vertex<>("Rezept: Griechischer Salat"));
        Vertex<String> rezept2 = graph.insertVertex(new Vertex<>("Rezept: Spaghetti Carbonara"));
        Vertex<String> rezept3 = graph.insertVertex(new Vertex<>("Rezept: Caprese-Salat"));
        Vertex<String> rezept4 = graph.insertVertex(new Vertex<>("Rezept: Tomaten-Basilikum-Suppe"));
        
        // Zutaten
        Vertex<String> zutat1 = graph.insertVertex(new Vertex<>("Tomate"));
        Vertex<String> zutat2 = graph.insertVertex(new Vertex<>("Feta"));
        Vertex<String> zutat3 = graph.insertVertex(new Vertex<>("Gurke"));
        Vertex<String> zutat4 = graph.insertVertex(new Vertex<>("Spaghetti"));
        Vertex<String> zutat5 = graph.insertVertex(new Vertex<>("Ei"));
        Vertex<String> zutat6 = graph.insertVertex(new Vertex<>("Pancetta"));
        Vertex<String> zutat7 = graph.insertVertex(new Vertex<>("Parmesan"));
        Vertex<String> zutat8 = graph.insertVertex(new Vertex<>("Mozzarella"));
        Vertex<String> zutat9 = graph.insertVertex(new Vertex<>("Basilikum"));
        Vertex<String> zutat10 = graph.insertVertex(new Vertex<>("Olivenöl"));

        // Griechischer Salat
        graph.insertEdge(zutat1, rezept1, 0); // Tomate
        graph.insertEdge(zutat2, rezept1, 0); // Feta
        graph.insertEdge(zutat3, rezept1, 0); // Gurke
        
        // Spaghetti Carbonara
        graph.insertEdge(zutat4, rezept2, 0); // Spaghetti
        graph.insertEdge(zutat5, rezept2, 0); // Ei
        graph.insertEdge(zutat6, rezept2, 0); // Pancetta
        graph.insertEdge(zutat7, rezept2, 0); // Parmesan
        
        // Caprese-Salat (ähnlich wie Griechischer Salat)
        graph.insertEdge(zutat1, rezept3, 0); // Tomate
        graph.insertEdge(zutat8, rezept3, 0); // Mozzarella
        graph.insertEdge(zutat9, rezept3, 0); // Basilikum
        graph.insertEdge(zutat10, rezept3, 0); // Olivenöl
        
        // Tomaten-Basilikum-Suppe
        graph.insertEdge(zutat1, rezept4, 0); // Tomate
        graph.insertEdge(zutat9, rezept4, 0); // Basilikum
        graph.insertEdge(zutat10, rezept4, 0); // Olivenöl

    return graph;
}

In [6]:
GraphEdgeList<Integer, String> graph = createGraph();

Dieses Grundgerüst an Rezepten wollen Sie sich nun erstmal anschauen (könnenn). Da Sie sich noch nicht auf ein finales System oder visuelle Darstellung festgelegt haben, lassen Sie sich von ChatGPT eine Methode schreiben, die den Graph als sogenanntes dot-file speichert (dot ist ein Dateiformat, das von <u>[Graphviz](https://graphviz.org/)</u> verwendet wird, einem hilfreichen kleinen Tool, um Graphen schnell und schön zu zeichnen).

In [7]:
private static void saveGraphAsDot(GraphEdgeList<Integer, String> graph, String filename) {
    try (FileWriter writer = new FileWriter(filename)) {
        writer.write("digraph RecipeGraph {\n");

        // Write vertices
        for (Vertex<String> vertex : graph.vertices()) {
            writer.write("  \"" + vertex.getElement() + "\";\n");
        }

        // Write edges
        for (AbstractEdge<Integer> edge : graph.edges()) {
            Vertex<String>[] incidentVertices = graph.endVertices(edge);
            Vertex<String> source = incidentVertices[0];
            Vertex<String> target = incidentVertices[1];
            writer.write("  \"" + source.getElement() + "\" -> \"" + target.getElement() + "\";\n");
        }

        writer.write("}");
    } catch (IOException e) {
        e.printStackTrace();
    }
}

In [8]:
// Save the graph as a DOT file
saveGraphAsDot(graph, "recipe_graph.dot");

Die so erzeugte Datei sieht folgendermaßen aus und nun kann unter Windows mit dem Befehl: <Link-zu-Graphviz>\dot.exe -Tpng -o recipe_graph.png recipe_graph.dot (den man auf der Konsole ausführt) der Graph gezeichnet werden:
 <br>  <br>
digraph RecipeGraph { <br>
  "Recipe: Greek Salad"; <br>
  "Recipe: Spaghetti Carbonara"; <br>
  "Recipe: Caprese Salad"; <br>
  "Recipe: Tomato Basil Soup"; <br>
  "Tomato"; <br>
  "Feta"; <br>
  "Cucumber"; <br>
  "Spaghetti"; <br>
  "Egg"; <br>
  "Pancetta"; <br>
  "Parmesan"; <br>
  "Mozzarella"; <br>
  "Basil"; <br>
  "Olive Oil"; <br>
  "Tomato" -> "Recipe: Greek Salad"; <br>
  "Feta" -> "Recipe: Greek Salad"; <br>
  "Cucumber" -> "Recipe: Greek Salad"; <br>
  "Spaghetti" -> "Recipe: Spaghetti Carbonara"; <br>
  "Egg" -> "Recipe: Spaghetti Carbonara"; <br>
  "Pancetta" -> "Recipe: Spaghetti Carbonara"; <br>
  "Parmesan" -> "Recipe: Spaghetti Carbonara"; <br>
  "Tomato" -> "Recipe: Caprese Salad"; <br>
  "Mozzarella" -> "Recipe: Caprese Salad"; <br>
  "Basil" -> "Recipe: Caprese Salad"; <br>
  "Olive Oil" -> "Recipe: Caprese Salad"; <br>
  "Tomato" -> "Recipe: Tomato Basil Soup"; <br>
  "Basil" -> "Recipe: Tomato Basil Soup"; <br>
  "Olive Oil" -> "Recipe: Tomato Basil Soup"; <br>
} <br>
![](recipe_graph.png)

Mit diesem Grundgerüst an Graph, implementieren Sie den nächsten Schritt: die eigentliche Empfehlung. Aus graphentheoretischer Sicht ist das nichts anderes, als zwei Knoten im Graphen suchen und ihre nächsten Nachbarn geschickt aufzulisten. Dementsprechend wird nun eine Methode erzeugt, die sowohl den Graph als auch die zu suchenden Zutaten übergeben bekommt. Im ersten Schritt sind nur zwei Zutaten zugelassen, um die Implementierung zu Beginn richtig aufzusetzen und später erweitern zu können.

In [9]:
private static void findRecipes(GraphEdgeList<Integer, String> graph, String ingredient1, String ingredient2) {
    System.out.println("Rezepte zu folgenden Zutaten: " + ingredient1 + ", " + ingredient2);
    boolean found = false;

    for (Vertex<String> vertex : graph.vertices()) {
        String recipe = vertex.getElement();

        boolean hasIngredient1 = false;
        boolean hasIngredient2 = false;

        Collection<AbstractEdge<Integer>> connections = graph.incidentEdges(vertex);
        for (AbstractEdge<Integer> edge : connections) {
            Vertex<String> ingredientVertex = graph.opposite(vertex, edge);
            String ingredient = ingredientVertex.getElement();
            if (ingredient.equals(ingredient1)) {
                hasIngredient1 = true;
            } else if (ingredient.equals(ingredient2)) {
                hasIngredient2 = true;
            }
        }

        if (hasIngredient1 && hasIngredient2) {
            System.out.println(recipe);
            found = true;
        }
    }

    if (!found) {
        System.out.println("Keine passenden Rezepte gefunden.");
    }
}

In [10]:
// Example: Find recipes with given ingredients
findRecipes(graph, "Tomate", "Feta");

Rezepte zu folgenden Zutaten: Tomate, Feta
Rezept: Griechischer Salat


Idealerweise wächst das Programm mit der Zeit und ist in der Lage aus vielen Rezepten zu lesen. Dabei gibt es verschiedene Fehlerquellen, die auftreten können. Um nun sicherzustellen, dass beim Rezepte auf Basis von Zutaten suchen, wirklich nur Rezepte ausgegeben werden, ergänzen Sie eine kleine Bedingung in der Methode. Sollten nun mal aus irgendeinem Grund mehrere Zutaten direkt miteinander verbunden sein und nicht nur indirekt über ein Rezept, ist sichergestellt, dass nur Rezepte ausgegeben werden.

In [11]:
private static void findRecipes(GraphEdgeList<Integer, String> graph, String ingredient1, String ingredient2) {
    System.out.println("Rezepte zu folgenden Zutaten:" + ingredient1 + ", " + ingredient2);
    boolean found = false;

    for (Vertex<String> vertex : graph.vertices()) {
        String recipe = vertex.getElement();
        if (!recipe.startsWith("Rezept: ")) {
            continue; // Skip ingredients
        }

        boolean hasIngredient1 = false;
        boolean hasIngredient2 = false;

        Collection<AbstractEdge<Integer>> connections = graph.incidentEdges(vertex);
        for (AbstractEdge<Integer> edge : connections) {
            Vertex<String> ingredientVertex = graph.opposite(vertex, edge);
            String ingredient = ingredientVertex.getElement();
            if (ingredient.equals(ingredient1)) {
                hasIngredient1 = true;
            } else if (ingredient.equals(ingredient2)) {
                hasIngredient2 = true;
            }
        }

        if (hasIngredient1 && hasIngredient2) {
            System.out.println(recipe);
            found = true;
        }
    }

    if (!found) {
        System.out.println("Keine passenden Rezepte gefunden.");
    }
}


In [12]:
findRecipes(graph, "Tomate", "Feta");
findRecipes(graph, "Tomate", "Olivenöl");
findRecipes(graph, "Tomate", "Basilikum");

Rezepte zu folgenden Zutaten:Tomate, Feta
Rezept: Griechischer Salat
Rezepte zu folgenden Zutaten:Tomate, Olivenöl
Rezept: Caprese-Salat
Rezept: Tomaten-Basilikum-Suppe
Rezepte zu folgenden Zutaten:Tomate, Basilikum
Rezept: Caprese-Salat
Rezept: Tomaten-Basilikum-Suppe


Das klappt schon ganz gut. Als nächstes möchten Sie die Möglichkeit haben, Rezepte auch dynamisch hinzufügen zu können, d.h. über eine Textdatei oder vielleicht sogar indem Sie sie von einem Link auslesen.
Sie haben bereits absolute und relative Pfade genutzt, um Dateien vom Computer einzulesen, für das neueste Projekt stehen Sie jedoch vor der Herausforderung, dass Sie noch nicht entschieden haben, auf welchem System es am Ende laufen soll (Windows, Mac, Linux, ...). Es gibt im Endeffekt zwei Möglichkeiten, den Pfad der einzulesenden Datei so abzuspeichern, dass dieser auf jedem System gefunden werden kann:
* mit aufwendigen switch/if-else Abfragen, um die Systempfade richtig zu setzen
* Nutzen von bestehender JavafunktionalitätSie
Wir entscheiden uns für den zweiten Weg und schreiben nun eine Methode, um Dateien einzulesen. Diese Methode hat als Eingabeparameter den Graph sowie den absoluten Pfad zur Datei und wandelt diesen Pfad dann systemspezifisch um, liest die Datei ein und fügt die neuen Knoten und Kanten dem bestehenden Graph hinzu.

In [13]:
private static void addRecipeFromFile(GraphEdgeList<Integer, String> graph, String filePath) {
    // Convert the file path to system-specific format
    String systemSpecificPath = Paths.get(filePath).toString();
    System.out.println("Zu Demonstrationszwecken, dies ist der eingegebene Pfad: " + filePath);
    System.out.println("Zu Demonstrationszwecken, dies ist der vom System generierte Pfad: " + systemSpecificPath);

    try (BufferedReader reader = new BufferedReader(new FileReader(systemSpecificPath))) {
        String nameLine = reader.readLine();
        String ingredientsLine = reader.readLine();

        if (nameLine != null && ingredientsLine != null) {
            String recipeName = nameLine.split(": ")[1];
            String[] ingredients = ingredientsLine.split(": ")[1].split(", ");

            // Insert the recipe vertex
            Vertex<String> recipeVertex = graph.insertVertex(new Vertex<>(recipeName));

            // Insert ingredient vertices and edges
            Map<String, Vertex<String>> ingredientMap = new HashMap<>();
            for (Vertex<String> vertex : graph.vertices()) {
                ingredientMap.put(vertex.getElement(), vertex);
            }

            for (String ingredient : ingredients) {
                Vertex<String> ingredientVertex = ingredientMap.get(ingredient);
                if (ingredientVertex == null) {
                    ingredientVertex = graph.insertVertex(new Vertex<>(ingredient));
                    ingredientMap.put(ingredient, ingredientVertex);
                }
                graph.insertEdge(ingredientVertex, recipeVertex, 0);
            }
        }
    } catch (IOException e) {
        e.printStackTrace();
    }
}

In [14]:
addRecipeFromFile(graph, "/home/myuser/example.txt");

Zu Demonstrationszwecken, dies ist der eingegebene Pfad: /home/myuser/example.txt
Zu Demonstrationszwecken, dies ist der vom System generierte Pfad: /home/myuser/example.txt


Als nächstes nehmen Sie sich das Suchen und Finden der Rezepte vor:
In der ersten Implementierung oben haben Sie es der Library überlassen, passende Knoten zu finden. Aber ist das die beste Möglichkeit? Kann die dort vorhandene Methode auch mit nicht perfekt passendem Text umgehen? Also zum Beispiel: wenn man "Tomate" eingibt, statt "Tomaten" oder "Tomte" (= hier ist der Tippfehler gemeint, nicht die Band). Wir sollten uns also noch mit dem sog. String-Matching beschäftigen, bevor wir weitermachen können.

Was für uns Menschen trivial erscheinen mag, ist für den Computer ungleich viel schwerer: In einem (großen) Datensatz nach einem Textpattern suchen und dieses finden. Sie schauen sich die folgenden drei Möglichkeiten genauer an:

- naiver Ansatz
- Boyer-Moore-Algorithmus
- Regular Expressions



In allen drei Fällen wird ein sog. Pattern (ein Muster) festgelegt, welches es im zu durchsuchenden Text zu finden gilt. Der naive Ansatz geht dabei einfach nur von links nach rechts durch den Text (ein beliebig langer String) durch und vergleicht elementweise, ob das Muster gefunden werden kann. Nach dem Vergleich wird das Muster um genau eine Position weitergeschoben und der Vergleich wiederholt. Man kann sich somit zwar sicher sein, dass alle vorhandenen Muster auch wirklich gefunden werden, es dauert jedoch ziemlich lange.

In [15]:
private static boolean naiveStringSearch(String text, String pattern) {
    int n = text.length();
    int m = pattern.length();

    for (int i = 0; i <= n - m; i++) {
        int j;
        for (j = 0; j < m; j++) {
            if (text.charAt(i + j) != pattern.charAt(j)) {
                break;
            }
        }
        if (j == m) {
            return true;
        }
    }
    return false;
}

Beim Boyer-Moore-Algorithmus wird der Text von links nach rechts durchsucht und das zu findende Muster von rechts nach links geprüft. Sobald ein Mismatch auftritt, wird das gesamte Muster weitergeschoben:

- falls das nicht passende Zeichen im Muster vorhanden ist, wird das Muster solange weitergeschoben, bis das im Muster vorkommende Zeichen und das Zeichen, das den Mismatch ausgelöst hat, übereinander liegen.
- falls das nicht passende Zeichen nicht im Muster vorhanden ist, wir das gesamte Muter HINTER das Zeichen verschoben, das den Mismatch ausgelöst hat.

Durch diese Vorgehensweise kann schon deutlich schneller und effizienter gesucht werden.

In [16]:
private static boolean boyerMooreSearch(String text, String pattern) {
    int[] badChar = buildBadCharTable(pattern);
    int m = pattern.length();
    int n = text.length();
    int s = 0;

    while (s <= (n - m)) {
        int j = m - 1;

        while (j >= 0 && pattern.charAt(j) == text.charAt(s + j)) {
            j--;
        }

        if (j < 0) {
            return true;
        } else {
            s += Math.max(1, j - badChar[text.charAt(s + j)]);
        }
    }
    return false;
}

// erstellt eine Tabelle zur Verwaltung der letzten Vorkommen jedes Zeichens im Muster. 
// ermöglicht es, das Muster beim Auftreten eines Mismatches effizient weiterzuschieben, 
// indem Position des letzten Vorkommens des nicht passenden Zeichens im Muster angegeben wird
private static int[] buildBadCharTable(String pattern) {
    final int ALPHABET_SIZE = 256;
    int[] badChar = new int[ALPHABET_SIZE];

    for (int i = 0; i < ALPHABET_SIZE; i++) {
        badChar[i] = -1;
    }

    for (int i = 0; i < pattern.length(); i++) {
        badChar[pattern.charAt(i)] = i;
    }

    return badChar;
}

Nun muss noch die findRecipes Methode angepasst werden:

In [17]:
private static void findRecipes(GraphEdgeList<Integer, String> graph, String ingredient1, String ingredient2) {
    System.out.println("Rezepte zu folgenden Zutaten:" + ingredient1 + ", " + ingredient2);
    boolean found = false;

    for (Vertex<String> vertex : graph.vertices()) {
        String recipe = vertex.getElement();
        if (!recipe.startsWith("Rezept: ")) {
            continue; // Skip ingredients
        }

        boolean hasIngredient1 = false;
        boolean hasIngredient2 = false;

        Collection<AbstractEdge<Integer>> connections = graph.incidentEdges(vertex);
        for (AbstractEdge<Integer> edge : connections) {
            Vertex<String> ingredientVertex = graph.opposite(vertex, edge);
            String ingredient = ingredientVertex.getElement();
            if (naiveStringSearch(ingredient, ingredient1) || boyerMooreSearch(ingredient, ingredient1)) {
                hasIngredient1 = true;
            } else if (naiveStringSearch(ingredient, ingredient2) || boyerMooreSearch(ingredient, ingredient2)) {
                hasIngredient2 = true;
            }
        }

        if (hasIngredient1 && hasIngredient2) {
            System.out.println(recipe);
            found = true;
        }
    }

    if (!found) {
        System.out.println("Keine passenden Rezepte gefunden.");
    }
}

In [18]:
findRecipes(graph, "Tomta", "Feta");

Rezepte zu folgenden Zutaten:Tomta, Feta
Keine passenden Rezepte gefunden.


Leider funktioniert das Prüfen auf Tippfehler in der Form nur mit Buchstaben, die am Anfang oder Ende fehlen, nicht mit Vertauschungen oder Buchstaben, die mitten im Wort fehlen. Dies lässt sich z.B. mit regular expressions umsetzen:

In [19]:
public static boolean isTomate(String input) {
    // Regex pattern to match common typos for "Tomate"
    String regex = "T(?:o(?:m(?:[ae]t|te)|ate)|oma[et])";
    Pattern pattern = Pattern.compile(regex, Pattern.CASE_INSENSITIVE);
    Matcher matcher = pattern.matcher(input);
    return matcher.matches();
}

In [20]:
isTomate("Tomte");

true

Der Nachteil an diesem Vorgehen ist jedoch, dass es für jede Rezeptzutat einzeln implementiert werden muss. Andere Möglichkeiten, die jedoch über die Vorlesungsinhalte hinausführen, sind z.B. die Levenshtein-Distanz oder eine fuzzy-search.