# Wie können Marienkäfer von Raupen unterschieden werden?
**Graphische Darstellung der Daten**

## Vorbereitung

<div class="alert alert-block alert-success">

Uns liegt also ein Datensatz für 20 Marienkäfer und Raupen vor. Diese Daten benutzen wir, um das System zu **trainieren**, damit es später unbekannte Insekten als Käfer bzw. Raupe erkennen kann.

<div class="alert alert-block alert-info">

Zur Vorbereitung werden wieder einige notwendige Bibliotheken sowie die Daten eingelesen.
    
**Führe also die folgenden beiden Zellen aus:**

In [None]:
import pandas as pd

In [None]:
df_kaefer = pd.read_csv("Daten/Kaefer_20_int_mm.csv", sep=";")
display(df_kaefer)

# Folgendes DF zur testausgabe
df_leer = pd.DataFrame()
df_leer['Breite'] = [] 
df_leer['Länge'] = [] 
df_leer['Insekt'] = [] 

In [None]:
max_x = max(df_kaefer ["Breite"])
min_x = min(df_kaefer ["Breite"])
max_y = max(df_kaefer ["Länge"])
min_y = min(df_kaefer ["Länge"])

delta_x = (max_x - min_x)
delta_y = (max_y - min_y)

bereich_x = [int(min_x - delta_x*0.05), int(max_x + delta_x*0.05)]
bereich_y = [int(min_y - delta_y*0.05), int(max_y + delta_y*0.05)]

## Streudiagramm

<div class="alert alert-block alert-success">
    
Im Folgenden ist ein **Streudiagramm** dargestellt. Hier werden die Insekten als Punkte in einem **Koordinatensystem** eingetragen.

<img src="Bilder/Beispieldiagramm_Marienkaefer_Raupe_mm.png" alt="Streudiagramm" style="float: left;">

In diesem Diagramm sind die Informationen für zwei Insekten dargestellt.

<div class="alert alert-block alert-warning">
   
#### *Aufgabe:*
    
Beschreibe, welche Informationen durch das Streudiagramm dargestellt werden.
    

<div class="alert alert-block alert-info">
    
Hier bitte deine Beschreibung eingeben.
    
</div>

<div class="alert alert-block alert-warning">
   
#### *Aufgabe:* 
    
Gib an, welche Maße (Länge / Breite) die im Streudiagramm dargestellten Insekten sind.
    

<div class="alert alert-block alert-info">
    
Hier bitte deine Lösung eingeben.
    
</div>

<div class="alert alert-block alert-warning">
   
#### *Aufgabe:*

Erstelle ein Streudiagramm auf Papier und trage die Daten von folgenden Marienkäfern und Raupen als Punkte dort ein.
    
Zeilennummer | Breite | Länge | Insekt
-------------| ------ | ------| ------
0            | 15     | 5     | Marienkäfer
1            | 5      | 20    | Raupe
2            | 9      | 10    | Marienkäfer
3            | 16     | 13    | Marienkäfer
4            | 12     | 24    | Raupe

<div class="alert alert-block alert-warning">
   
#### *Aufgabe:*
    
Trage die Daten der folgenden vier Insekten zusätzlich in Dein Streudiagramm ein.
    
- Bestimme - auf Grundlage ihrer Größe (Breite / Länge) die Insektenklasse (Käfer oder Raupe).
- Begründe Deine Entscheidung.

Zeilennummer | Breite | Länge | Insekt?
-------------|--------|-------|------
0            | 15     | 10    |
1            | 5      | 20    |
3            | 20     | 10    |
4            | 12     | 15    |


<div class="alert alert-block alert-info">
    
Hier bitte deine Lösung eingeben.
    
</div>

<div class="alert alert-block alert-warning">
   
#### *Aufgabe:*
 
Beurteile, wie zuverlässig Deine Vorhersage für die vier Insekten ist.
    

<div class="alert alert-block alert-info">
    
Hier bitte deinen Kommentar eingeben.
    
</div>

## Streudiagramm selber erzeugen

<div class="alert alert-block alert-info">

**Bitte zunächst die folgende Code-Zelle ausführen.**
    
Hier werden einige Bibliotheken importiert, wichtige Einstellungen vorgenommen sowie notwendige Variablen definiert:

In [None]:
import plotly.express as px

color_map = {'Marienkäfer': 'orange', 'Raupe': 'lightblue'}

data_x = "Breite"
data_y = "Länge"
target = "Insekt"
breite=800 # des Canvas
hoehe=600 # des Canvas
#bereich_x=[-1, 70]
#bereich_y=[-1, 100]

<div class="alert alert-block alert-success">
Hier lernst du kennen, dass man Daten unter gewissen Bedingungen graphisch darstellen kann. 
    
Dazu müssen alle Daten zwei Attribute besitzen (in unserem Beispiel `Länge` und `Breite`), deren Werte man auf zwei Achsen wiederfinden kann.
  
Eine solche Graphik nannt man **Streudiagramm**.

<div class="alert alert-block alert-success">
Im Folgenden wird das Streudiagramm mit den Daten der 200 Insekten (100 Marienkäfer und 100 Raupen) dargestellt.
    
- **Wenn du den Cursor auf einen Punkt in der Graphik bewegst, bekommst du Informationen angezeigt.**

In [None]:
fig = px.scatter(
    df_kaefer,
    #df_leer,  # zum Testen!
    x=data_x,
    y=data_y,
    color=target,
    color_discrete_map=color_map,
    width=breite,
    height=hoehe,
    range_x=bereich_x,
    range_y=bereich_y,
)

fig.update_traces(marker=dict(size=10, line=dict(width=1, color="black")))

fig.show()

<div class="alert alert-block alert-warning">

### *Aufgabe: Beschreibe, welche Informationen Du erkennen kannst.*

<div class="alert alert-block alert-info">
    
Hier bitte deine Beschreibung eingeben.
    
</div>