# Wie können Marienkäfer von Raupen unterschieden werden?
**Idee: Schwellenwert**

## Vorbereitung

<div class="alert alert-block alert-success">

Uns liegt also ein Datensatz für 20 Marienkäfer und Raupen vor. Diese Daten benutzen wir, um das System zu **trainieren**, damit es später unbekannte Insekten als Käfer bzw. Raupe erkennen kann.

<div class="alert alert-block alert-info">

Zur Vorbereitung werden wieder einige notwendige Bibliotheken sowie die Daten eingelesen.
    
**Führe also die folgenden beiden Zellen aus:**

In [None]:
import pandas as pd
import plotly.express as px
from PyTree import ClassificationTree as ct
import ipywidgets as widgets

color_map = {'Marienkäfer': 'orange', 'Raupe': 'lightblue'}

data_x = "Breite"
data_y = "Länge"
target = "Insekt"
breite=800
hoehe=600

In [None]:
df_kaefer = pd.read_csv("Daten/Kaefer_20_int_mm.csv", sep=";")
display(df_kaefer)

In [None]:
max_x = max(df_kaefer ["Breite"])
min_x = min(df_kaefer ["Breite"])
max_y = max(df_kaefer ["Länge"])
min_y = min(df_kaefer ["Länge"])

delta_x = (max_x - min_x)
delta_y = (max_y - min_y)

bereich_x = [int(min_x - delta_x*0.05), int(max_x + delta_x*0.05)]
bereich_y = [int(min_y - delta_y*0.05), int(max_y + delta_y*0.05)]

## Schwellenwert

<div class="alert alert-block alert-info">

**Zur Erinnerung** hier nochmal das Streudiagramm:

In [None]:
fig = px.scatter(
    df_kaefer,
    x=data_x,
    y=data_y,
    color=target,
    color_discrete_map=color_map,
    width=breite,
    height=hoehe,
    range_x=bereich_x,
    range_y=bereich_y,
)

fig.update_traces(marker=dict(size=10, line=dict(width=1, color="black")))

fig.show()

<div class="alert alert-block alert-success">

**Wie können wir anhand dieser Graphik die Raupen und die Marienkäfer unterscheiden?**

<div class="alert alert-block alert-success">
Das obige Streudiagramm wird durch eine Kleinigkeit ergänzt. 

In [None]:
hor = 59
fig = px.scatter(
    df_kaefer,
    x=data_x,
    y=data_y,
    color=target,
    color_discrete_map=color_map,
    width=breite,
    height=hoehe,
    range_x=bereich_x,
    range_y=bereich_y,
)

fig.update_traces(marker=dict(size=10, line=dict(width=1, color="black")))

fig.update_layout(
    shapes=[
        dict(
            type="line",
            yref="y1",
            y0=hor,
            y1=hor,
            xref="x1",
            x0=bereich_x[0],
            x1=bereich_x[1],
            line=dict(color="Red", width=1),
        )
    ]
)

fig.add_annotation(
    x=60, y=hor, text="Schwellenwert der Länge=" + str(hor), showarrow=True,
)

fig.show()

<div class="alert alert-block alert-warning">

#### *Aufgabe:* 
    
Beschreibe, welche Bedeutung die eingezeichnete waagerechte Linie hat.
    
- *Beachte, dass einige Marker genau auf der Linie liegen!* 
    
   - **Diese Marker gehören dann zu dem Bereich unterhalb der Linie!**

- Welche Maße haben diese Insekten?


<div class="alert alert-block alert-info">
    
Hier bitte deine Beschreibung eingeben.
    
</div>

<div class="alert alert-block alert-warning">

#### *Aufgabe:* 
   
Nehmen wir jetzt einmal an, dass wir alle Insekten in zwei Klassen einteilen:
    
- Insekten, deren Marker oberhalb der eingezeichneten Linie liegt.
    - Wir nennen sie ***Raupe***.
- Insekten, deren Marker auf der Linie oder unterhalb der Linie liegt.
    - Wir nennen sie ***Käfer***.
    
Finde heraus, wie viele Insekten dann falsch benannt werden.

<div class="alert alert-block alert-info">
    
Hier bitte deine Lösung eingeben.
    
</div>

<div class="alert alert-block alert-success">

**Der** ***Schwellenwert*** **ist der Wert eines Attributes, der die Daten in zwei Klassen aufteilt.**
    
In dem dargestellten Diagramm ist der Schwellenwert 59
    
In dem Beispiel gibt es zwei Arten von Insekten:
- Insekten, deren Länge größer ist als der Schwellenwert 59
- Insekten, deren Länge nicht größer ist als der Schwellenwert 59, die also 59 mm lang oder kürzer als 59 mm sind.
    
**Man erkennt, dass alle Insekten, deren Länge größer ist als der Schwellenwert 59, Raupen sind.**

<div class="alert alert-block alert-warning">

#### *Aufgabe:*

Begründe, weshalb man keine Aussage über diejenigen Insekten machen kann, deren Länge nicht größer als 59 ist.

<div class="alert alert-block alert-info">
    
Hier bitte deine Begründung eingeben.
    
</div>

### Fehler bei der Wahl des Schwellenwertes

<div class="alert alert-block alert-success">
    
Schau dir noch einmal das Streudiagramm an, in dem der Schwellenwert 59 als waagerechte Linie dargestellt ist.
    
Diese Linie teilt die Graphik in zwei Teile. Das wird noch durch unterlegte Farben verdeutlicht: 

In [None]:
hor = 60
fig = px.scatter(
    df_kaefer,
    x=data_x,
    y=data_y,
    color=target,
    color_discrete_map=color_map,
    width=breite,
    height=hoehe,
    range_x=bereich_x,
    range_y=bereich_y,
)

fig.update_traces(marker=dict(size=10, line=dict(width=1, color="black")))

fig.update_layout(
    shapes=[
        dict(
            type="line",
            yref="y1",
            y0=hor,
            y1=hor,
            xref="x1",
            x0=bereich_x[0],
            x1=bereich_x[1],
            line=dict(color="Red", width=1),
        ),
        dict(
            type="rect",
            yref="y1",
            y0=hor,
            y1=bereich_y[1],
            xref="x1",
            x0=bereich_x[0],
            x1=bereich_x[1],
            fillcolor=color_map["Raupe"],
            opacity=0.3,
            layer="below",
            line_width=0,
        ),
        dict(
            type="rect",
            yref="y1",
            y0=bereich_y[0],
            y1=hor,
            xref="x1",
            x0=bereich_x[0],
            x1=bereich_x[1],
            fillcolor=color_map["Marienkäfer"],
            opacity=0.3,
            layer="below",
            line_width=0,
        ),
    ]
)

fig.add_annotation(
    x=60, y=hor, text="Schwellenwert der Länge=" + str(hor), showarrow=True,
)

fig.show()

<div class="alert alert-block alert-success">
    
Mehrere Insekten sind Raupen, obwohl ihre Länge nicht größer als 59 ist.
    
Wenn wir also alle diese Insekten als Käfer klassifizieren würden, hätten wir einige Fehler gemacht. 
    
- **Du kannst ja einmal zählen, wie viele Fehler das sind.**
    
Wenn du dir nicht sicher bist, welche Maße das Insekt hat, kannst Du dazu den Cursor auf die jeweilige Marke bewegen; dann wird die zug. Länge angezeigt. Wenn dieser Wert kleiner oder gleich 59 und das Insekt eine Raupe ist, ist das Insekt also fehlerhaft klassifiziert.
    
**Hinweis:** Wenn eine Marke genau auf der Linie liegt, wird sie zu dem unteren Bereich gezähl!
    
Das Zählen ist wahrscheinlich mühsam. Ein kleines Programm nimmt dir die Arbeit ab. Kontrolliere, ob du korrekt gezählt hast. Öffne dazu die Lösung und aktiviere die Zelle.

In [None]:
tree = ct.DecisionTree(target=target, data=df_kaefer)
tree.manual_split(attribute="Länge", threshold=69, node_nr=1)
tree.calculate_errors(data=df_kaefer)

<div class="alert alert-block alert-warning">

#### *Aufgabe:*

Die waagerechte Linie wurde auf der Höhe von `Länge=59` in das Diagramm intuitiv eingezeichnet. Der Wert 62 wäre sicherlich auch möglich gewesen. 
    
*Wie viele Fehlklassifikationen hätten sich dann ergeben?*

Es wären dann 5 Insekten falsch zugeordnet worden. Siehe dazu auch das kleine Programm hier:  

In [None]:
tree = ct.DecisionTree(target=target, data=df_kaefer)
tree.manual_split(attribute="Länge", threshold=62, node_nr=1)
tree.calculate_errors(data=df_kaefer)

## Bester Schwellenwert

<div class="alert alert-block alert-warning">
Jetzt kannst Du einmal versuchen, andere Schwellenwert zu nutzen.

- Dazu kannst du in der folgenden Zelle mit dem Schieber den Schwellenwert verändern. 
- Alternativ kannst du in der übernächsten Zelle den Schwellenwert in einer Eingabebox auswählen. 

Das entsprechende Streudiagramm mit der Angabe der Fehlklassifikationen wird dann angezeigt.

In [None]:
def fehler_laenge(schwellenwert):
    anz = 0
    for i in range (len (df_kaefer["Länge"])):
        if df_kaefer["Länge"][i] <= schwellenwert and df_kaefer["Insekt"][i] == "Raupe":
            anz += 1
    for i in range (len (df_kaefer["Länge"])):
        if df_kaefer["Länge"][i] > schwellenwert and df_kaefer["Insekt"][i] == "Marienkäfer":
            anz += 1
    return anz

In [None]:
start = (min_y + max_y) // 2

slider_l = widgets.FloatSlider(
    value=start,
    min=int(min_y+1),
    max=int(max_y-1),
    step=1,
    description="",
    layout=widgets.Layout(width="50%"),
)


def fehlersumme_l(threshold):
    tree = ct.DecisionTree(target=target, data=df_kaefer)
    tree.manual_split(attribute="Länge", threshold=threshold, node_nr=1)
    return fehler_laenge (threshold)
    # return tree.calculate_errors(data=df_kaefer)


def makeFigure_l(schwellenwert):
    fig = px.scatter(
        df_kaefer,
        x=data_x,
        y=data_y,
        color=target,
        color_discrete_map=color_map,
        width=breite,
        height=hoehe,
        range_x=bereich_x,
        range_y=bereich_y,
    )

    fig.update_traces(marker=dict(size=10, line=dict(width=1, color="black")))

    fig.update_layout(
        shapes=[
            dict(
                type="line",
                yref="y1",
                y0=schwellenwert,
                y1=schwellenwert,
                xref="x1",
                x0=bereich_x[0],
                x1=bereich_x[1],
                line=dict(color="Red", width=1),
            ),
            dict(
                type="rect",
                yref="y1",
                y0=schwellenwert,
                y1=bereich_y[1],
                xref="x1",
                x0=bereich_x[0],
                x1=bereich_x[1],
                fillcolor=color_map["Raupe"],
                opacity=0.3,
                layer="below",
                line_width=0,
            ),
            dict(
                type="rect",
                yref="y1",
                y0=bereich_y[0],
                y1=schwellenwert,
                xref="x1",
                x0=bereich_x[0],
                x1=bereich_x[1],
                fillcolor=color_map["Marienkäfer"],
                opacity=0.3,
                layer="below",
                line_width=0,
            ),
        ]
    )

    fig.add_annotation(
        x=62,
        y=schwellenwert,
        text="SW=" + str(int(schwellenwert)),
        showarrow=True,
        xshift=20,
    )

    fig.add_annotation(
        x=63,
        y=schwellenwert,
        text="Fehler: " + str(fehlersumme_l(schwellenwert)),
        showarrow=False,
        yshift=50,
    )
    return fig


def on_value_change_l(event):

    with output_l:
        output_l.clear_output()
        sw_l = event["new"]
        fs_l = fehlersumme_l(sw_l)
        fig = makeFigure_l(sw_l)
        fig.show()


slider_l.observe(on_value_change_l, names="value")

output_l = widgets.interactive_output(fehlersumme_l, {"threshold": slider_l})

display(
    widgets.VBox([widgets.Label("Schwellenwert für die Länge"), slider_l, output_l])
)
sw_l = start
fs_l = fehlersumme_l(sw_l)
fig = makeFigure_l(sw_l)
with output_l:
    fig.show()

In [None]:
start = (min_y + max_y) // 2

sw_widget = widgets.BoundedFloatText(
    value=start,
    min=int(min_y+1),
    max=int(max_y-1),
    step=1,
    description="",
    layout=widgets.Layout(width="20%"),

    disabled=False
)


def fehlersumme_l(threshold):
    tree = ct.DecisionTree(target=target, data=df_kaefer)
    tree.manual_split(attribute="Länge", threshold=threshold, node_nr=1)
    return fehler_laenge (threshold)
    # return tree.calculate_errors(data=df_kaefer)


def makeFigure_l(schwellenwert):
    fig = px.scatter(
        df_kaefer,
        x=data_x,
        y=data_y,
        color=target,
        color_discrete_map=color_map,
        width=breite,
        height=hoehe,
        range_x=bereich_x,
        range_y=bereich_y,
    )

    fig.update_traces(marker=dict(size=10, line=dict(width=1, color="black")))

    fig.update_layout(
        shapes=[
            dict(
                type="line",
                yref="y1",
                y0=schwellenwert,
                y1=schwellenwert,
                xref="x1",
                x0=bereich_x[0],
                x1=bereich_x[1],
                line=dict(color="Red", width=1),
            ),
            dict(
                type="rect",
                yref="y1",
                y0=schwellenwert,
                y1=bereich_y[1],
                xref="x1",
                x0=bereich_x[0],
                x1=bereich_x[1],
                fillcolor=color_map["Raupe"],
                opacity=0.3,
                layer="below",
                line_width=0,
            ),
            dict(
                type="rect",
                yref="y1",
                y0=bereich_y[0],
                y1=schwellenwert,
                xref="x1",
                x0=bereich_x[0],
                x1=bereich_x[1],
                fillcolor=color_map["Marienkäfer"],
                opacity=0.3,
                layer="below",
                line_width=0,
            ),
        ]
    )

    fig.add_annotation(
        x=62,
        y=schwellenwert,
        text="SW=" + str(int(schwellenwert)),
        showarrow=True,
        xshift=20,
    )

    fig.add_annotation(
        x=63,
        y=schwellenwert,
        text="Fehler: " + str(fehlersumme_l(schwellenwert)),
        showarrow=False,
        yshift=50,
    )
    return fig


def on_value_change_l(event):

    with output_l:
        output_l.clear_output()
        sw_l = event["new"]
        fs_l = fehlersumme_l(sw_l)
        fig = makeFigure_l(sw_l)
        fig.show()


sw_widget.observe(on_value_change_l, names="value")

output_l = widgets.interactive_output(fehlersumme_l, {"threshold": sw_widget})

display(
    widgets.VBox([widgets.Label("Schwellenwert für die Länge"), sw_widget, output_l])
)
sw_l = start
fs_l = fehlersumme_l(sw_l)
fig = makeFigure_l(sw_l)
with output_l:
    fig.show()

<div class="alert alert-block alert-warning">

#### *Aufgabe:*

Bei welchem Schwellenwert ist die Anzahl der Fehler am kleinsten? (Es gibt wahrscheinlich mehrere davon!)
    
- Aktiviere die Zelle, in der der beste Schwellenwert definiert ist.
- Führe dann die darauf folgende Zelle aus.
    
Dann erkennst du erneut die waagerechte Aufteilung der 20 Insekten in zwei Klassen.

In [None]:
 # besterSchwellenwert zum Beispiel
besterSchwellenwert = 52

In [None]:
hor = besterSchwellenwert
fig = px.scatter(
    df_kaefer,
    x=data_x,
    y=data_y,
    color=target,
    color_discrete_map=color_map,
    width=breite,
    height=hoehe,
    range_x=bereich_x,
    range_y=bereich_y,
)

fig.update_traces(marker=dict(size=10, line=dict(width=1, color="black")))

fig.update_layout(
    shapes=[
        dict(
            type="line",
            yref="y1",
            y0=hor,
            y1=hor,
            xref="x1",
            x0=bereich_x[0],
            x1=bereich_x[1],
            line=dict(color="Red", width=1),
        ),
        dict(
            type="rect",
            yref="y1",
            y0=hor,
            y1=bereich_y[1],
            xref="x1",
            x0=bereich_x[0],
            x1=bereich_x[1],
            fillcolor=color_map["Raupe"],
            opacity=0.3,
            layer="below",
            line_width=0,
        ),
        dict(
            type="rect",
            yref="y1",
            y0=bereich_y[0],
            y1=hor,
            xref="x1",
            x0=bereich_x[0],
            x1=bereich_x[1],
            fillcolor=color_map["Marienkäfer"],
            opacity=0.3,
            layer="below",
            line_width=0,
        ),
    ]
)

fig.add_annotation(
    x=55, y=hor, text="Möglicher bester Schwellenwert=" + str(hor), showarrow=True,
)

fig.show()

<div class="alert alert-block alert-success">
    
Es kann passieren, dass in dem  Streudiagramm oberhalb der waagerechten Linie, die den besten Schwellenwert darstellt, auch Symbole für Marienkäfer auftauchen.
        
Das erscheint auf den ersten Blick seltsam! Denn bei einem Schwellenwert von 59 wurden **alle** Käfer richtig erkannt. Einige Raupen (nämlich 4), deren Länge nicht größer als 59 ist, wurden fälschlicherweise als Käfer klassifiziert.

Benutzt man als Schwellenwert jetzt den Wert 52, werden sowohl einige Raupen als auch einige Käfer falsch klassifiziert. Insbesondere entstehen jetzt auch Fehler bei Käfern.
    
**Jedoch ist wichtig zu bedenken:**
    
- Wenn man als Schwellenwert 59 benutzt, werden 4 Insekten falsch klassifiziert.
- Wenn man als Schwellenwert 52 benutzt, werden nur 3 Insekten falsch klassifiziert. Die Gesamtzahl der Fehler ist dann also am geringsten.
    
Der für uns **beste Schwellenwert** ist also derjenige Wert, bei dem insgesamt die wenigsten Fehler gemacht werden, und **nicht** der Wert, bei dem alle Objekte einer Klasse (hier z.B. alle Marienkäfer) korrekt klassifiziert werden.
    
**Hinweis:** Es gibt noch andere Kriterien, einen möglichst guten Schwellenwert zu definieren. Wir benutzen hier denjenigen Schwellenwert, bei dem möglichst wenige Insekten falsch klassifiziert werden.

<div class="alert alert-block alert-success">
    
Mit Hilfe des Schwellenwertes haben wir einen sog. **Datensplit** erzeugt, haben also die 20 Daten in zwei Teile geteilt:
- Ein Teil der Daten wurde als Raupe gekennzeichnet.
    - Das waren diejenigen Insekten, die länger als 52 sind.
- Der andere Teil, also die Insekten, die *nicht* länger als 52 sind, wurden als Marienkäfer bezeichnet.
    
**Beachte**, dass es dabei zu einigen Fehlbezeichnungen gekommen ist. 
    
Bei genauem Hinsehen erkennt man sogar weitere Details:
- 1 Marienkäfer mit einer Länge von 55 wird fälschlicherweise als Raupe bezeichnet.
- 2 Raupen, die alle eine Länge von 55 oder weniger haben, werden als Käfer interpretiert.
    

## Klassifikation mit Hilfe der Breite der Insekten

<div class="alert alert-block alert-success">

In dem Streudiagramm erkennt man, dass bei einem Schwellenwert von 0.51 einige (14) Insekten fehlerhaft klassifiziert werden.
    
Jedoch haben wir bisher die ausschließlich Länge der Insekten benutzt, um die beiden Klassen zu unterscheiden.
    
In den folgenden beiden Zellen kannst du statt der Länge jetzt einmal probieren, einen guten Schwellenwert für die Breite der Insekten zu finden.
    
- Du findest dort erneut einen Schieberegler oder eine Eingabebox, so dass du einen Schwellenwert für die Breite einstellen kannst. Das Streudiagramm und die Fehlklassifikationen werden dann angezeigt.

In [None]:
start = (min_x + max_x) // 2

slider_r = widgets.FloatSlider(
    value=start,
    min=int(min_x+1),
    max=int(max_x-1),
    step=1,
    description="",
    layout=widgets.Layout(width="50%"),
)


def fehlersumme_r(threshold):
    tree = ct.DecisionTree(target=target, data=df_kaefer)
    tree.manual_split(attribute="Breite", threshold=threshold, node_nr=1)
    return tree.calculate_errors(data=df_kaefer)


def makeFigure_r(schwellenwert):
    fig = px.scatter(
        df_kaefer,
        x=data_x,
        y=data_y,
        color=target,
        color_discrete_map=color_map,
        width=breite,
        height=hoehe,
        range_x=bereich_x,
        range_y=bereich_y,
    )

    fig.update_traces(marker=dict(size=10, line=dict(width=1, color="black")))

    fig.update_layout(
        shapes=[
            dict(
                type="line",
                yref="y1",
                x0=schwellenwert,
                x1=schwellenwert,
                xref="x1",
                y0=bereich_y[0],
                y1=bereich_y[1],
                line=dict(color="Red", width=1),
            ),
            dict(
                type="rect",
                yref="y1",
                x0=schwellenwert,
                x1=bereich_x[1],
                xref="x1",
                y0=bereich_y[0],
                y1=bereich_y[1],
                fillcolor=color_map["Marienkäfer"],
                opacity=0.3,
                layer="below",
                line_width=0,
            ),
            dict(
                type="rect",
                yref="y1",
                x0=bereich_x[0],
                x1=schwellenwert,
                xref="x1",
                y0=bereich_y[0],
                y1=bereich_y[1],
                fillcolor=color_map["Raupe"],
                opacity=0.3,
                layer="below",
                line_width=0,
            ),
        ]
    )

    fig.add_annotation(
        y=80,
        x=schwellenwert,
        text="Schwellenwert der Breite=" + str(int(schwellenwert)),
        showarrow=False,
        # xshift=20,
    )

    fig.add_annotation(
        y=75,
        x=schwellenwert,
        text="Fehler: " + str(fehlersumme_r(schwellenwert)),
        showarrow=False,
        #yshift=-20,
    )
    return fig


def on_value_change_r(event):

    with output_r:
        output_r.clear_output()
        sw_r = event["new"]
        fs_r = fehlersumme_r(sw_r)
        fig = makeFigure_r(sw_r)
        fig.show()


slider_r.observe(on_value_change_r, names="value")

output_r = widgets.interactive_output(fehlersumme_r, {"threshold": slider_r})

display(
    widgets.VBox([widgets.Label("Schwellenwert für die Breite"), slider_r, output_r])
)
sw_r = start
fs_r = fehlersumme_l(sw_r)
fig = makeFigure_r(sw_r)
with output_r:
    fig.show()

In [None]:
start = (min_x + max_x) // 2

sr_widget = widgets.BoundedFloatText(
    value=start,
    min=int(min_x+1),
    max=int(max_x-1),
    step=1,
    description="",
    layout=widgets.Layout(width="20%"),

    disabled=False
)

def fehlersumme_r(threshold):
    tree = ct.DecisionTree(target=target, data=df_kaefer)
    tree.manual_split(attribute="Breite", threshold=threshold, node_nr=1)
    return tree.calculate_errors(data=df_kaefer)

def makeFigure_r(schwellenwert):
    fig = px.scatter(
        df_kaefer,
        x=data_x,
        y=data_y,
        color=target,
        color_discrete_map=color_map,
        width=breite,
        height=hoehe,
        range_x=bereich_x,
        range_y=bereich_y,
    )

    fig.update_traces(marker=dict(size=10, line=dict(width=1, color="black")))

    fig.update_layout(
        shapes=[
            dict(
                type="line",
                yref="y1",
                x0=schwellenwert,
                x1=schwellenwert,
                xref="x1",
                y0=bereich_y[0],
                y1=bereich_y[1],
                line=dict(color="Red", width=1),
            ),
            dict(
                type="rect",
                yref="y1",
                x0=schwellenwert,
                x1=bereich_x[1],
                xref="x1",
                y0=bereich_y[0],
                y1=bereich_y[1],
                fillcolor=color_map["Marienkäfer"],
                opacity=0.3,
                layer="below",
                line_width=0,
            ),
            dict(
                type="rect",
                yref="y1",
                x0=bereich_x[0],
                x1=schwellenwert,
                xref="x1",
                y0=bereich_y[0],
                y1=bereich_y[1],
                fillcolor=color_map["Raupe"],
                opacity=0.3,
                layer="below",
                line_width=0,
            ),
        ]
    )

    fig.add_annotation(
        y=80,
        x=schwellenwert,
        text="Schwellenwert der Breite=" + str(int(schwellenwert)),
        showarrow=False,
        # xshift=20,
    )

    fig.add_annotation(
        y=75,
        x=schwellenwert,
        text="Fehler: " + str(fehlersumme_r(schwellenwert)),
        showarrow=False,
        #yshift=-20,
    )
   
    return fig


def on_value_change_r(event):

    with output_r:
        output_r.clear_output()
        sw_r = event["new"]
        fs_r = fehlersumme_r(sw_r)
        fig = makeFigure_r(sw_r)
        fig.show()


sr_widget.observe(on_value_change_r, names="value")

output_r = widgets.interactive_output(fehlersumme_r, {"threshold": sr_widget})

display(
    widgets.VBox([widgets.Label("Schwellenwert für die Breite"), sr_widget, output_r])
)
sw_r = start
fs_r = fehlersumme_r(sw_r)
fig = makeFigure_r(sw_r)
with output_r:
    fig.show()

<div class="alert alert-block alert-warning">

#### *Aufgabe:*

Bei welchem Schwellenwert ist die Anzahl der Fehler am kleinsten?

<div class="alert alert-block alert-success">

Der beste Schwellenwert für die Breite beträgt 0.36, denn dabei werden 16 Insekten falsch klassifiziert.
    
In dem obigen Abschnitt
    
[Bester Schwellenwert](#Bester-Schwellenwert)
    
haben wir erkannt, dass 14 die minimale Anzahl der Fehlklassifikationen ist, wenn wir als Unterscheidungsmerkmal die Länge der Insekten benutzen. Das ist also offenbar besser als hier. Wir werden also die Insekten zunächst mit Hilfe der Länge klassifizieren.