In [2]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import plotly.express as px

# 🍭 Cluster 003: Flavour Insights

_Datenexploration und Analyse der Flavour-Profile aus dem Leafly Strain Dataset_

---

## Inhaltsverzeichnis

1. [Setup & Overview](#setup--overview)
2. [DataFrame Struktur](#dataframe-struktur)
3. [Deskriptive Statistik](#deskriptive-statistik)
4. [Visualisierung der Flavours](#visualisierung-der-flavours)
5. [Weitere Analysen & Ideen](#weitere-analysen--ideen)
6. [Fazit & To Dos](#fazit--to-dos)

---

> _Hinweis: Der DataFrame enthält bereits die wichtigsten Flavour-Scores pro Strain sowie den Strain-Namen und das durchschnittliche Rating._


---
## <a id="setup--overview"></a>1. Setup & Overview

- Dieses Notebook untersucht die Flavour-Scores verschiedener Strains auf Basis des Leafly-Datensatzes.
- Für jeden Strain sind die wichtigsten Flavour-Merkmale als separate Spalten enthalten.
---


In [3]:
df = pd.read_csv("../csv/strains.csv")
df = df.set_index("id").sort_values("id")

In [None]:
flavor_cols = [
    col for col in df.columns if col.startswith("flavor_") and col.endswith("_score")
]
df_flavors = df[["averageRating", "name"] + flavor_cols]

In [7]:
df_flavors.head()

Unnamed: 0_level_0,name,averageRating,flavor_ammonia_score,flavor_apple_score,flavor_apricot_score,flavor_berry_score,flavor_blueCheese_score,flavor_blueberry_score,flavor_butter_score,flavor_cheese_score,...,flavor_strawberry_score,flavor_sweet_score,flavor_tar_score,flavor_tea_score,flavor_tobacco_score,flavor_treeFruit_score,flavor_tropical_score,flavor_vanilla_score,flavor_violet_score,flavor_woody_score
id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
1,AK-47,4.060496,-0.524449,-1.263211,-1.521205,-1.26094,-1.455552,-1.477364,-1.454589,-1.259149,...,-1.495604,-0.08695,0.299993,-0.269964,1.924542,-0.5466,-0.90239,-1.32738,-0.923616,1.565616
2,Chemdawg,4.26246,0.272779,-1.188178,-1.106155,-1.092478,-1.237233,-1.203048,-1.030617,-1.085952,...,-1.243357,-0.695649,0.052855,-0.640874,-0.168703,-0.890516,-1.038792,-1.186957,-1.250729,0.258957
3,Mr. Nice Guy,4.103067,-1.075217,-1.302872,-1.705689,-0.876851,-1.312388,-1.164363,-1.220014,-1.150885,...,-1.247961,0.820083,-0.121315,-0.224522,-0.498152,-0.223382,-0.860087,-1.302634,-0.766799,1.301704
6,Super Silver Haze,4.355109,0.459234,-1.175719,-0.923911,-1.241023,-1.344886,-1.430461,-0.911304,-1.039815,...,-1.452236,0.649875,-1.465384,-0.027229,-0.474655,-0.279417,-0.357794,-1.322126,-1.566659,0.325602
7,Northern Lights #5,4.267677,-0.851163,0.001281,0.979422,-0.809269,,-0.675047,-1.021054,-1.012379,...,-0.894331,0.749584,-0.774828,0.213428,,-0.665797,-0.745234,-1.223921,-1.68435,-0.12015


---
## <a id="dataframe-struktur"></a>2. DataFrame Struktur

- Überblick über die Spalten und Beispiel-Datensätze (`df_flavors.head()`, `df_flavors.info()`).
- Felder: name, averageRating, flavor_ammonia_score, flavor_apple_score, ..., flavor_woody_score.
---


---

## <a id="deskriptive-statistik"></a>3. Deskriptive Statistik

- Verteilungen, Kenngrößen, Ausreißer.
- Genutzte Methoden: `describe()`, `isnull().sum()`, `mean()`, `median()`, `quantile()`, `corr()`.
- Besonderheiten und Anmerkungen.

---


---
## <a id="visualisierung-der-flavours"></a>4. Visualisierung der Flavours

- Häufigkeits- oder Verteilungsplots der Flavour-Scores (z.B. welche Flavours kommen am häufigsten vor?).
- Boxplots oder Histogramme ausgewählter Flavours.
- Heatmap: Korrelationen zwischen den Flavour-Scores.
---


## <a id="weitere-analysen--ideen"></a>5. Weitere Analysen & Ideen

-   Top-Strains pro Flavour (Barplots/Tables).
-   Cluster-Analyse nach Flavour-Profilen.
-   Zusammenhang von averageRating und bestimmten Flavours.
-   Ausreißer & Besonderheiten in den Flavour-Profilen.

---

## <a id="fazit--to-dos"></a>6. Fazit

-   Wichtigste Erkenntnisse der Analyse.
-   Offene Fragen und nächste Schritte.

---
