<figure>
  <IMG SRC="https://upload.wikimedia.org/wikipedia/commons/thumb/d/d5/Fachhochschule_Südwestfalen_20xx_logo.svg/320px-Fachhochschule_Südwestfalen_20xx_logo.svg.png" WIDTH=250 ALIGN="right">
</figure>

# Programmierung für KI
### Winterersemester 2025/26
Prof. Dr. Heiner Giefers

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.cm as cm
import matplotlib.font_manager
from matplotlib.patches import Rectangle, PathPatch
from matplotlib.textpath import TextPath
import matplotlib.transforms as mtrans

MPL_BLUE = '#11557c'


def get_font_properties():
    # The original font is Calibri, if that is not installed, we fall back
    # to Carlito, which is metrically equivalent.
    if 'Calibri' in matplotlib.font_manager.findfont('Calibri:bold'):
        return matplotlib.font_manager.FontProperties(family='Calibri',
                                                      weight='bold')
    if 'Carlito' in matplotlib.font_manager.findfont('Carlito:bold'):
        print('Original font not found. Falling back to Carlito. '
              'The logo text will not be in the correct font.')
        return matplotlib.font_manager.FontProperties(family='Carlito',
                                                      weight='bold')
    print('Original font not found. '
          'The logo text will not be in the correct font.')
    return None


def create_icon_axes(fig, ax_position, lw_bars, lw_grid, lw_border, rgrid):
    """
    Create a polar axes containing the matplotlib radar plot.

    Parameters
    ----------
    fig : matplotlib.figure.Figure
        The figure to draw into.
    ax_position : (float, float, float, float)
        The position of the created Axes in figure coordinates as
        (x, y, width, height).
    lw_bars : float
        The linewidth of the bars.
    lw_grid : float
        The linewidth of the grid.
    lw_border : float
        The linewidth of the Axes border.
    rgrid : array-like
        Positions of the radial grid.

    Returns
    -------
    ax : matplotlib.axes.Axes
        The created Axes.
    """
    with plt.rc_context({'axes.edgecolor': MPL_BLUE,
                         'axes.linewidth': lw_border}):
        ax = fig.add_axes(ax_position, projection='polar')
        ax.set_axisbelow(True)

        N = 7
        arc = 2. * np.pi
        theta = np.arange(0.0, arc, arc / N)
        radii = np.array([2, 6, 8, 7, 4, 5, 8])
        width = np.pi / 4 * np.array([0.4, 0.4, 0.6, 0.8, 0.2, 0.5, 0.3])
        bars = ax.bar(theta, radii, width=width, bottom=0.0, align='edge',
                      edgecolor='0.3', lw=lw_bars)
        for r, bar in zip(radii, bars):
            color = *cm.jet(r / 10.)[:3], 0.6  # color from jet with alpha=0.6
            bar.set_facecolor(color)

        ax.tick_params(labelbottom=False, labeltop=False,
                       labelleft=False, labelright=False)

        ax.grid(lw=lw_grid, color='0.9')
        ax.set_rmax(9)
        ax.set_yticks(rgrid)

        # the actual visible background - extends a bit beyond the axis
        ax.add_patch(Rectangle((0, 0), arc, 9.58,
                               facecolor='white', zorder=0,
                               clip_on=False, in_layout=False))
        return ax


def create_text_axes(fig, height_px):
    """Create an axes in *fig* that contains 'matplotlib' as Text."""
    ax = fig.add_axes((0, 0, 1, 1))
    ax.set_aspect("equal")
    ax.set_axis_off()

    path = TextPath((0, 0), "matplotlib", size=height_px * 0.8,
                    prop=get_font_properties())

    angle = 4.25  # degrees
    trans = mtrans.Affine2D().skew_deg(angle, 0)

    patch = PathPatch(path, transform=trans + ax.transData, color=MPL_BLUE,
                      lw=0)
    ax.add_patch(patch)
    ax.autoscale()


def make_logo(height_px, lw_bars, lw_grid, lw_border, rgrid, with_text=False):
    """
    Create a full figure with the Matplotlib logo.

    Parameters
    ----------
    height_px : int
        Height of the figure in pixel.
    lw_bars : float
        The linewidth of the bar border.
    lw_grid : float
        The linewidth of the grid.
    lw_border : float
        The linewidth of icon border.
    rgrid : sequence of float
        The radial grid positions.
    with_text : bool
        Whether to draw only the icon or to include 'matplotlib' as text.
    """
    dpi = 100
    height = height_px / dpi
    figsize = (5 * height, height) if with_text else (height, height)
    fig = plt.figure(figsize=figsize, dpi=dpi)
    fig.patch.set_alpha(0)

    if with_text:
        create_text_axes(fig, height_px)
    ax_pos = (0.535, 0.12, .17, 0.75) if with_text else (0.03, 0.03, .94, .94)
    ax = create_icon_axes(fig, ax_pos, lw_bars, lw_grid, lw_border, rgrid)

    return fig, ax

In [None]:
fig, ax = make_logo(height_px=300, lw_bars=0.7, lw_grid=0.5, lw_border=1, rgrid=[1, 3, 5, 7])
fig.savefig('matplotliblogo300.png')

In [None]:
import matplotlib as mpl

In [None]:
from IPython.core.display import HTML
HTML("""
<style>
ul {
    margin-top: 0.3em !important;
    margin-bottom: 0.3em !important;
    padding-left: 1em !important; /* Einzug anpassen */
}
</style>
""")

<figure>
  <IMG SRC="https://upload.wikimedia.org/wikipedia/commons/thumb/d/d5/Fachhochschule_Südwestfalen_20xx_logo.svg/320px-Fachhochschule_Südwestfalen_20xx_logo.svg.png" WIDTH=400 ALIGN="right">
</figure>

# Programmierung für KI
### Wintersemester 2025/26
Prof. Dr. Heiner Giefers

# Agenda

### 1. (Probe- ) Klausur

### 2. Projektvorstellungen

### 3. Visualisierung von Daten mit Matplotlib

## Klausuren am 31. Januar und 7. Februar 2026

- Einstündiger Programmiert-Test
- Papier-basiert
- Als Hilfsmittel ist ein doppeleitig handbeschriebenes DIN-A4-Blatt zugelassen

## Probeklausur

- Probeklausur zum Download über [Moodle](https://elearning.fh-swf.de/course/view.php?id=25765) 
- Nehmen Sie sich 1h Zeit, um die Probeklausur unter "Realbedingungen" zu bearbeiten

## Projekte

- Abgabe (Quellcode, Daten, README, requirements.txt, ....) über [Moodle](https://elearning.fh-swf.de/course/view.php?id=25765) bis **Samstag, 31. Januar 2026**
- Termine für die Projektvorstellung können über die Moodle-Seite gebucht werden
- Falls keiner der angegeben Termine für Sie machbar ist, kontaktieren Sie Prof. Dorka oder mich
- 15-20 Minuten Präsentation, 10-15 Minuten Fragen
- Alle TN müssen bei der Präsentation anwesend sein
- In etwa gleicher Redeanteil für alle TN
- Evtl. (sehr) kurze Demo


## Auswertung der Veranstaltungsevaluation
(ChatGPT 5.2 Prompt: *Fasse mir diese Evaluation in 5 Bulletpunkten zusammen*)
- Sehr positive Gesamtbewertung: Hohe Zufriedenheit mit dem Modul insgesamt (MW 1,78) sowie mit Lehrveranstaltungen (MW 1,70) und Lernmaterialien (MW 1,56); Rücklauf 27 Studierende
- Starke Lehre: Lehrende werden als motiviert, verständlich und sehr responsiv wahrgenommen (z. B. Eingehen auf Fragen MW 1,15; klare Lernziele MW 1,44)
- Gute Materialien: Lernmaterialien sind klar strukturiert, praxisnah und gut abgestimmt mit den Veranstaltungen (Indikator MW 1,51)
- Hoher Workload: Mehrheit empfindet den Arbeitsaufwand als (ein wenig bis wesentlich) höher als vorgesehen (≈ 67 %)
- Verbesserungspotenzial: Wunsch nach mehr Zeit/Terminen, stärkerer Anfängerfreundlichkeit, besserer Klausurabstimmung sowie mehr (optionalen) Übungs- und Feedbackformaten

<figure>
  <IMG SRC="matplotliblogo300.png" ALIGN="right">
</figure>

    
   
# Visualisierung von Daten in Python

## Vorab...

In dieser Veranstaltung geht es darum, wie man mathematische Abbildungen (*Plots*) in mit der Bibliothek *Matplotlib* in Python Python umsetzt.

Es geht *nicht* (oder nur am Rande) darum, wie man gute Abbildungen gestaltet.

- Claus O. Wilke, [*Fundamentals of Data Visualization*](https://clauswilke.com/dataviz/), O’Reilly, 2019.
- Shirin Elsinghorst, [*The Good, the Bad and the Ugly: Analysen effektiv visualisieren und kommunizieren*](https://docs.google.com/presentation/d/e/2PACX-1vR4pD2EmW9Gzxr1Q3qwgjEYkU64o2-ThlX1mXqfNQ2EKteVUVt6Qg2ImEKKi9XLv-Iutb3lD8esLyU7/pub?start=false&loop=false&delayms=3000&slide=id.g58b36409ef_0_0), data2day Workshop, 2020


## Matplotlib

- *matplotlib* ist eine Python Bibliothek zum Plotten von 2D Grafiken
- OpenSource Projekt seit 2002
- Der Funktionsumfang der Bibliothek ist sehr groß
- Für die Darstellung spezieller Graphen gibt es viele Beispiele in der Matplotlib [Galerie](https://matplotlib.org/stable/gallery)

### Matplotlib importieren

Genau wie bei Numpy mit `np` importieren wir standardmäßig Matplotlib unter dem Namen `mpl`

```python
import matplotlib as mpl
```

### PyPlot

- Pyplot ist ein Matplotlib-Modul, das eine MATLAB-ähnliche Schnittstelle bietet
- Funktioniert wie eine Kommandozeile
- Eine Abbildung kann erstellt und sukzessive verändert/erweitert werden
- Pyplot ist die Schnittstelle, die wir für die allermeisten Matplotlib-Funktionen verwenden

```python
import matplotlib.pyplot as plt
```

In [None]:
import matplotlib as mpl
import matplotlib.pyplot as plt

### Styles

- Ein [*Style*](https://matplotlib.org/stable/gallery/style_sheets/style_sheets_reference.html) legt allgemeine Eingeschften der Plots fest: Farbschema, Schriftgröße, Hintergrundfarbe, etc.
- Der `default` Style passt für die meisten Anwendungsfälle
- `dark_background` kann nützlich sein, wenn Sie Abbildungen für eine Website oder einen Foliensatz mit dunklem Hintergrund generieren wollen

In [None]:
#plt.style.use('dark_background')
plt.style.use('default')
mpl.rcParams['figure.figsize'] = (8, 3)

### Plots anzeigen

- Wenn Sie Matplotlib in Jupyter Notebook Zellen verwenden, wird die Abbildung nach jeder Zelle *ausgewertet* und angezeigt
- In einem Python Skript funktioniert das nicht automatisch
- Mit `plt.show()` werden alle aktiven Grafiken ausgewertet und angezeigt

```python
# ------- file: myplot.py ------
import matplotlib.pyplot as plt
import numpy as np

x = np.linspace(0, 10, 100)
plt.plot(x, np.sin(x))
plt.show()
```

Im Notebook erfolgt die Auswertung automatisch

In [None]:
import numpy as np
plt.figure()
x = np.linspace(0, 3*np.pi, 100)
plt.plot(x, np.sin(x), '-')
plt.plot(x, np.cos(x), '--');

### Grafiken speichern

- Eine praktische Eigenschaft der Matplotlib ist die Fähigkeit, Grafiken in verschiedenen Bildformaten abzuspeichern
- Man kann eine Grafik sehr einfach über das `savefig()` Kommando speichern
- Über den angegeben Dateinamen findet Matplotlib das gewünschte Format

In [None]:
plt.savefig('Sinus_und_Cosinus.png')

Nach diesem Kommando sollte es eine entsprechende Datei im aktuellen Verzeichnis geben

In [None]:
!ls -lh Sinus_und_Cosinus.png

Schauen wir uns die erzeugte Bilddatei an:

In [None]:
from IPython.display import Image
Image('Sinus_und_Cosinus.png')    

**Warum ist die Abbildung leer?**

Nach einer Code-Zelle ist die bisherige Figure nicht mehr aktiv.

In [None]:
import numpy as np
x = np.linspace(0, 3*np.pi, 100)
plt.plot(x, np.sin(x), '-')
plt.plot(x, np.cos(x), '--');
plt.savefig('Sinus_und_Cosinus.png')

In [None]:
from IPython.display import Image
Image('Sinus_und_Cosinus.png')

`savefig()` kennt noch viele weitere Dateiformate. Eine vollständige Liste erhalten die ebenfalls von Matplotlib:

In [None]:
  
     plt.gcf().canvas.get_supported_filetypes()

### Die 2 Schnittstellen von Matplotlib

- Wie wir gesehen haben, kann das Verhalten von Matplotlib  verwirrend ein
- Ein Grund ist, dass es 2 Verwendungsmöglichkeiten für PyPlot gibt:

1. **Die MATLAB-artige Schnittstelle**
2. **Die objektorientierte Schnittstelle**

#### Die MATLAB-artige Schnittstelle

- Matplotlib wurde ursprünglich als Python-Alternative für (die Plotting-Funktionen von) MATLAB etwickelt
- Viele MATLAB Funktionen zum Visualisieren lassen sich 1:1 mit `plt` umsetzen
- Beachten Sie, dass es in folgendem Beispiel keine *Variablen* gibt:

In [None]:
plt.figure()  # Abbildung erzeugen

# Erzeuge das erste (von 2) Koordinatensystem(en)
plt.subplot(2, 1, 1) # (Zeilen, Spalten, aktuelle Achse)
plt.plot(x, np.sin(x))

# Erzeuge das zweite Koordinatensystem
plt.subplot(2, 1, 2)
plt.plot(x, np.cos(x));

- Wir sehen hier keine Variablen, allerdings gibt es einen *versteckten Zustand*
- PyPlot verwaltet intern ein **current figure**, also eine aktuelle Abbildung und aktuelle Koordinatensysteme
- Alle `plt.`-Kommandos werden auf diese Objekte angewendet

- Normalerweise *sehen* Sie diese Objekte nicht
- Man kann Referenz auf diese internen Objekte beziehen
- `plt.gcf()` (*get current figure*) liefert eine Referenz auf das *Figure* Objekt
- `plt.gca()` (*get current axes*) liefert eine Referenz auf ein *Axes* Objekt
- Manche Funktionen müssen *über* diese Objekte aufgerufen werden

`plt.gcf().canvas.get_supported_filetypes()`

#### Die objektorientierte Schnittstelle

- Für komplexere Grafiken ist es sinnvoll, direkt die objektorientierte Schnittstelle zu verwenden
- `plt.subplots(N)` liefert ein 2-Tupel mit Referenzen auf die PyPlot Objekte
   1. Referenz auf die Abbildung (*Figure*)
   2. Eine Liste mit *N* Referenzen auf Koordinatensysteme (*Axes*)
   
- Normalerweise werden die Elemente des Tupels `fig` und `ax` genannt
- `fig, ax = plt.subplots(2)`
- Es zeugt von gutem Stil, sich an solche Konventionen zu halten

In [None]:
# Erstelle eine Abbildung mit Koordinatensystemen
fig, ax = plt.subplots(2)

# Plotte explizit in bestimmte Koordinatensysteme
ax[0].plot(x, np.sin(x))
ax[1].plot(x, np.cos(x));

![](https://miro.medium.com/max/1000/1*CANkzqegZcHv9znE1U4s7A.png)

## Kurvendiagramme

- Die vermutliche häufigste Diagramm-Art sind Kurvendiagramme
- Beispiel: Graph einer Funktion $y = f(x)$.

In [None]:
plt.style.use('seaborn-v0_8-whitegrid')
fig, ax = plt.subplots()

x = np.linspace(0, 10, 1000)
ax.plot(x, np.sin(x));

Wir können mehrere *Plots* in das selbe Koordinatensystem Zeichnen, indem wir die `plot`-Methode mehrfach aufrufen (bevor die Abbildung ausgewertet wird)

In [None]:
plt.plot(x, np.sin(x))
plt.plot(x, np.cos(x))

### Plots modifizieren: Linien
- Die `plot`-Methode besitzt diverse optionale Parameter
- Die Farbe der Kurve kann über den Parameter `color` eingestellt werden
- Auch hierfür gibt es verschiedene Möglichkeiten

In [None]:
plt.plot(x, x+1, color='blue')        # per Name
plt.plot(x, x+2, color='g')           # per Kurzname (rgbcmyk)
plt.plot(x, x+3, color='0.25')        # Graustufen zwischen 0 and 1
plt.plot(x, x+4, color='#FFDD44')     # Hex-Code (RRGGBB von 00 bis FF)
plt.plot(x, x+5, color=(1.0,0.2,0.3)) # RGB Tupel, Werte von 0 bis 1
plt.plot(x, x+6, color='chartreuse'); # HTML Farb-Namen

Wenn Sie keine `color` angeben, wechselt PyPlot durch das voreingestellte Farbschema.

In [None]:
plt.plot(x, x+1)
plt.plot(x, x+2)
plt.plot(x, x+3)
plt.plot(x, x+4)
plt.plot(x, x+5)
plt.plot(x, x+6)

Mit einem `plot`-Aufruf können ebenfalls mehrere Funktionen geplottet werden.

In [None]:
plt.plot(x, x+1, x, x+2, x, x+3, x, x+4, x, x+5, x, x+6);

Neben der Farbe kann auch die Linienform angepasst werden. Dies geschieht über den `linestyle` Parameter

In [None]:
plt.plot(x, x + 0, linestyle='solid')
plt.plot(x, x + 1, linestyle='dashed')
plt.plot(x, x + 2, linestyle='dashdot')
plt.plot(x, x + 3, linestyle='dotted');
#ODER:
plt.plot(x, x + 6, linestyle='-')   # solid
plt.plot(x, x + 7, linestyle='--')  # dashed
plt.plot(x, x + 8, linestyle='-.')  # dashdot
plt.plot(x, x + 9, linestyle=':');  # dotted

`linestyle` und `color` können in eine Art *Formatstring* zusammengefasst werden

In [None]:
plt.plot(x, x + 0, '-g')   # solid Grün
plt.plot(x, x + 1, '--c')  # dashed Cyan
plt.plot(x, x + 2, '-.k')  # dashdot Schwarz
plt.plot(x, x + 3, ':r');  # dotted Rot

### Plots modifizieren: Grenzen der Koordinatenachsen 

- Matplotlib leitet Grenzen für die Koordinatenachsen automatisch her
- Manchmal möchte man die Grenzen selbst einstellen
- Hierzu dienen die Methoden `plt.xlim()` und `plt.ylim()`

In [None]:
plt.figure()
plt.subplot(1,2,1)
plt.plot(x, np.sin(x))
plt.subplot(1,2,2)
plt.plot(x, np.sin(x))
plt.xlim(0, 2*np.pi)
plt.ylim(-1.5, 1.5);
#plt.ylim(1.5, -1.5);

Bei der objektorientierten Schnittstelle heißen die `xlim()` und `ylim()` Funktionen übrigens anders, nämlich 
 `set_xlim()` und `set_ylim()`
 
*(Habe ich schon erwähnt, dass die beiden Schnittstellen von PyPlot oft verwirren?)*

In [None]:
fix, ax = plt.subplots(1,2)
ax[0].plot(x, np.sin(x))
ax[1].plot(x, np.sin(x))

ax[1].set_xlim(0, 10)
ax[1].set_ylim(-1, 1);

Mit `plt.axis()` können die `x` und `y` Grenzen gemeinsam gesetzt werden, als Liste von 4 Werten`[xmin, xmax, ymin, ymax]`

In [None]:
plt.plot(x, np.sin(x))
plt.axis([-1, 11, -1.5, 1.5]);

### Plots modifizieren: Titel von Graphen und Achsen

- Bei einer guten Abbildung sind immer die Achsen beschriftet
- Bei mehreren Kurven sollte es eine Legende geben
- Graphen können einen Titel besitzen

In [None]:
plt.plot(x, np.sin(x))
plt.title("Sinuskurve")
plt.xlabel("x", size=16)
plt.ylabel("sin(x)", size=16);

- Über den Parameter `label` der Methode `plot` kann einer Kurve ein Name verliehen werden
- Diese Namen werden in die Legende übernommen
- Eine Legende kann mit `plt.legend()` dem Graphen hinzugefügt werden
- Die Positionierung erfolgt automatisch oder über den Parameter `loc`

In [None]:
plt.plot(x, np.sin(x), '-g', label='sin(x)')
plt.plot(x, np.cos(x), ':b', label='cos(x)')
plt.legend(loc="lower left");

- Viele `.plt`-Funktionen der MATLAB-artigen Schnittstelle lassen sich genauso mit der objektorientierten Schnittstelle verwenden#
- Leider gilt das nicht für alle Funktionen, hier einige Unterschiede

- ``plt.xlabel()``  → ``ax.set_xlabel()``
- ``plt.ylabel()``  → ``ax.set_ylabel()``
- ``plt.xlim()``    → ``ax.set_xlim()``
- ``plt.ylim()``    → ``ax.set_ylim()``
- ``plt.title()``   → ``ax.set_title()``

In der objektorientierten Variante können alle Parameter gleichzeitig über die `set()`-Funktion eingestellt werden:

In [None]:
fig, ax = plt.subplots()
ax.plot(x, np.sin(x))
ax.set(xlim=(0, 10), ylim=(-2, 2), xlabel='x', ylabel='sin(x)',
       title='Sinuskurve');

## Streudiagramme

- Streudiagramme sind in der Statistik und zur Datenanalyse sehr verbreitet
- Simple Idee: Statt einer verbunden Kurve plotte nur die Punkte
- Da bei `plot` die Funktion als *x* und *y* Koordianten übergeben wird, kann `plot` auch Streudiagramme erzeugen

In [None]:
x = np.linspace(0, 10, 30)
y = np.sin(x)
#plt.plot(x, y, 'o', color='k');
plt.plot(x, np.sin(x), linestyle='', marker='o', color='k');
plt.plot(x, np.cos(x), 'o', color='r');

- Als *Marker* können verschiedene Symbole verwendet werden

In [None]:
import numpy.random as rng
plt.figure(figsize=(9,6))
for marker in ['o', '.', ',', 'x', '+', 'v', '^', '<', '>', 's', 'd']:
    plt.plot(rng.rand(3), rng.rand(3), marker, markersize=8,
             label=f"'{marker}'")
plt.legend(fontsize=14)
plt.xlim(0, 1.2);

#### "Echte" Streudiagramme mit `plt.scatter`

Die bessere Alternative um Streudiagramme zu erzeugen ist die Funktion `plt.scatter`

In [None]:
x = np.linspace(0, 10, 30)
y = np.sin(x)
plt.scatter(x, y, marker='o');

- `plt.scatter` hat mehr Einstellungsmöglichkeiten als  `plt.plot`
- Jeder einzelne Punkt kann formatiert werden, bzw. die Daten geben die Formatierung vor
- So lassen sich drei (und mehr) Dimensionen in einem 2D-Plot darstellen

In [None]:
x = []
for i in range(4):
    x.append(rng.randn(20))
plt.scatter(x[0], x[1], c=x[2], s=np.abs(1000*x[3]), alpha=0.5, cmap='viridis')
plt.colorbar();  # Zeige die Farbskala

- Streudiagramme helfen bei der Datenanalyse, um zu verstehen, wie Datenpunkte anhand von *Merkmalen* angeordnet sind.
- Beispiel: Iris Datensatz mit Schwertlilienarten nach ihren Blütenblättern (*setal*) und Kronenblättern (*petal*) vermessen

In [None]:
from sklearn.datasets import load_iris
iris = load_iris()
merkmale = iris.data.T
art = iris.target
plt.scatter(merkmale[3], merkmale[1], alpha=0.6, marker='s', c=art, cmap='viridis')
plt.xlabel(iris.feature_names[3])
plt.ylabel(iris.feature_names[1]);

## Plots beschriften

In [None]:
x = np.linspace(-1.5, 1.5, 30)
px = 0.8
py = px**2

plt.plot(x, x**2, "b-", px, py, "ro")
plt.text(0, 1.5, "Quadratfunktion\n$y = x^2$", fontsize=20, color='blue', horizontalalignment="center")
plt.text(px-0.05, py, "Ein Punkt", ha="right", weight="heavy")
plt.text(px, py, "x = %0.2f\n\ny = %0.2f"%(px, py), rotation=45, color='red')

## 3D-Plots

In [None]:
ax = plt.axes(projection='3d')

# Data for a three-dimensional line
zline = np.linspace(0, 15, 1000)
xline = np.sin(zline)
yline = np.cos(zline)
ax.plot3D(xline, yline, zline, 'gray')

# Data for three-dimensional scattered points
zdata = 15 * np.random.random(100)
xdata = np.sin(zdata) + 0.1 * np.random.randn(100)
ydata = np.cos(zdata) + 0.1 * np.random.randn(100)
ax.scatter3D(xdata, ydata, zdata, c=zdata, cmap='Greens');

In [None]:
def f(x, y):
    return np.sin(np.sqrt(x ** 2 + y ** 2))

x = np.linspace(-6, 6, 30)
y = np.linspace(-6, 6, 30)

X, Y = np.meshgrid(x, y)
Z = f(X, Y)
ax = plt.axes(projection='3d')
ax.plot_surface(X, Y, Z, rstride=1, cstride=1, cmap='viridis', edgecolor='none');

## GIFs erzeugen

In [None]:
from matplotlib.animation import FuncAnimation

fig, ax = plt.subplots()
ax.axis([0, 4*np.pi, -1, 1]);
x = np.linspace(0,2*np.pi,50)

it = 63 # (2*PI)/0.1
p = 0

def my_plot(i):
    global p
    ax.clear()
    ax.plot(x, np.sin(x - p), color='r')
    p += 0.1
    return

anim = FuncAnimation(fig, my_plot, frames=np.arange(0, it), interval=50, repeat=True)
anim.save('simple.gif', dpi=80, writer='pillow')

In [None]:
from IPython.display import Image
Image('simple.gif')

## Quellen

[1] Jake VanderPlas, [*Python Data Science Handbook*](https://github.com/jakevdp/PythonDataScienceHandbook), O'Reilly, 2016.

Die Covid-Daten stammen von [*Our World in Data*](https://ourworldindata.org/) und wurden dem Git-Repository [https://github.com/owid/covid-19-data](https://github.com/owid/covid-19-data) entnommen.

[2] Hasell, J., Mathieu, E., Beltekian, D. *et al.*. *A cross-country database of COVID-19 testing*, Sci Data 7, 345 (2020). [https://doi.org/10.1038/s41597-020-00688-8](https://doi.org/10.1038/s41597-020-00688-8)

## Beispiel: GISTEMP (Temperatur-Anomalien) visualisieren
- Datensatz: GISTEMP v4 (monatliche globale Temperatur-Anomalien) vom Goddard Institute for Space Studies (GISS), NASA
- Wir verwenden Pandas, um die Zeitreihen zu laden, zu filtern und umzustrukturieren (Jahr, Tag)
- Mit Matplotlib + Colormap werden die Jahre von 1880 bis 2025 farblich kodiert, von Blau (=früher) bis Dunkelrot (=heute)
- Ergebnis: überlagerte Monatsverläufe pro Jahr + Hervorhebung des letzten Jahres (2025)

In [None]:
import requests
#url = "https://data.giss.nasa.gov/gistemp/graphs/graph_data/GISTEMP_Seasonal_Cycle_since_1880/graph.csv"
url = "https://raw.githubusercontent.com/fhswf/datasets/refs/heads/main/gistemp.csv"
headers={'User-Agent': 'Mozilla/5.0'} 
r = requests.get(url, headers=headers)
if r.status_code == 200:
    try:
        f = open("gistemp.csv", 'wb')
        f.write(r.content)
    except:
        print("Irgendetwas ist schief gegangen!")
else:
    print("Status code",  r.status_code)

In [None]:
temp = pd.read_csv("gistemp.csv", skiprows=1)
# Jahr/Monat-Index-Spalten erzeugen (wie in deinem Plot-Code erwartet)
temp["Jahr"] = (temp["Year"] // 1).astype(int)
temp["Tag"]  = ((temp["Year"] - temp["Jahr"]) * 365).astype(int)


colors = mpl.colormaps['jet']
step   = 20
first  = 1880
last   = 2025

plt.figure(figsize=(15,10))

def plot_year(df, year, first, last, colors, lab):
    df_jahr = df[df["Jahr"]==year]
    col = colors(1-(last-d)/(last-first+1))
    plt.plot(df_jahr["Tag"],df_jahr["Anomaly"], c=col, label=lab)

# Jahre
for d in range(first,last-step+1,step):
    plot_year(temp, d, first, last, colors, str(d))
    for j in range(1,step):
        plot_year(temp, d+j, first, last, colors, None)

col = colors(0.99)
t_jahr = temp[temp["Jahr"]==last]
plt.plot(t_jahr["Tag"],t_jahr["Anomaly"], '-', c=col, label=str(last))    
plt.plot(t_jahr["Tag"],t_jahr["Anomaly"], '-o', c=col)        

# Legende
leg = plt.legend(loc="upper left", fontsize=14)

# X-Ticks
monate = ['Jan', 'Feb', 'Mrz', 'Apr', 'Mai', 'Jun', 'Jul', 'Aug', 'Sep', 'Okt', 'Nov', 'Dez']
tage   = sorted(set(temp["Tag"].values))
assert len(tage)==12
plt.xticks(tage,monate, fontsize=16)

# letzter Datenpunkt = Nov 2025
t_last = t_jahr["Anomaly"].values[-1]
plt.annotate(
    "Nov 2025",
    xy=(tage[-2], t_last),          # November = vorletzter Monat
    xytext=(tage[-2]-22, t_last+1.2),
    size=22,
    arrowprops=dict(arrowstyle="-", ls="dashed"),
    va="center"
)
    

# Label/Quelle
plt.annotate('Seasonal cycle from MERRA2.', xy=(150,-3.9), size=18, alpha=0.6)
plt.xlim([tage[0], tage[-1]])
plt.ylim([-4,3])

# Titel
plt.title("GISTEMP Seasonal Cycle since 1880", fontsize=22)
plt.ylabel("Anomaly (°C) (w.r.t 1980-2015)", fontsize=20)
plt.savefig("mygistemp.png")

In [None]:
from IPython.display import Image
Image('mygistemp.png')

## Beispiel: Covid-Daten visualisieren

- Beispiel für eine Visualisierung, bei der Matplotlib *nicht mehr ausreicht*
- Auch hier verwenden wir *Pandas* um die Daten zu verwalten
- Zusätzlich verwenden wir *Plotly* und *GeoJson*

In [None]:
import sys
!{sys.executable} -m pip install geojson

In [None]:
import numpy as np
import csv
import requests
import io
import pandas as pd
import plotly.express as px
import geojson

In [None]:
import requests
import os.path
import os

if not os.path.isfile("owid-covid-data.csv"):
    url = "https://covid.ourworldindata.org/data/owid-covid-data.csv"
    headers={'User-Agent': 'Mozilla/5.0'} 
    r = requests.get(url, headers=headers)
    if r.status_code == 200:
        try:
            f = open("owid-covid-data.csv", 'wb')
            f.write(r.content)
        except:
            print("Irgendetwas ist schief gegangen!")
    else:
        print("Status code",  r.status_code)

sizeinbyte = os.path.getsize('owid-covid-data.csv')
print(f"Die Datei ist {sizeinbyte/10**6:.2f} MB groß")

In [None]:
import pandas as pd
df=pd.read_csv("owid-covid-data.csv")
print(f"Die Anzahl aller Einträge ist {df.size}")   

Um sich einen ersten Eindruck von der Tabelle zu machen, kann man eine Reihe von Pandas-Methoden aufrufen:
- `df.head(k)` zeigt die ersten `k` Einträge der Tabelle. Sie werden sehen, dass die Daten nach Ländern sortiert sind
- `df.info()` zeigt Informationen zu den Spalten der Tabelle
- `df.describe()` Gibt einige statistische Kennzahlen zu den Daten aus

In [None]:
df.head(10)

In [None]:
df.info()

Wenn Sie die Daten nach einer anderen Spalte sortieren wollen, geht das mit der `sort_by_values` Methode:

In [None]:
df_date = df.sort_values(by='date')
df_date

- Der Datensatz enthält nicht die in DE häufig verwendete Maß der *7-Tage Inzidenz*
- Wir können es allerdings aus den neuen Fällen pro Tag berechnen.
  - Um eine Normalisierung gemäß der Einwohnerzahlen zu erreichen, verwendenden wir die Spalte `new_cases_per_million`
  - Diese kann allerdings fehlende Werte enthalten, z.B. weil für einige Länder an bestimmten Tagen keine Daten vorlagen
  - Um diese fehlenden Werte zu *schätzen*, interpolieren wir. D.h. wir nehmen an, bei einer *Lücke* würden sie Werte linear fortlaufen. Also bei der folge `2, 3, NaN, 7, 8` würde das `NaN` durch `5` ersetzt.

- Weiteres Problem: Die Tabelle ist nach Daten sortiert, alle Länder stehen also vermischt in der Tabelle
- Wir verwenden die `groupby`-Methode um die Tabelle in Länder-Gruppen zu blocken

In [None]:
# YOUR CODE HERE
raise NotImplementedError()

### Inzidenzen Visualisieren

Für die Darstellung der weltweiten Inzidenz-Werte, eignet sich ein Plot als Weltkarte die wir z.B. mit der *Plotly* Methode `choropleth` erzeugen können.

In [None]:
def inzidenzen_als_karte(df):
    fig = px.choropleth(df, locations="iso_code",
                    color="Inzidenz",
                    #scope='europe',
                    range_color = [0,200],
                    hover_name="location",
                    animation_frame="date",
                    title = "Corvid: weltweite 7-Tages Inzidenz",
                    color_continuous_scale=px.colors.sequential.Jet)
    fig["layout"].pop("updatemenus")
    return fig

In [None]:
fig = inzidenzen_als_karte(df_cleaned)
fig.show()

In [None]:
df0 = df_cleaned[df_cleaned["iso_code"].str.len() == 3].copy()
df0 = df0.sort_values("date")
df0 = df0[df0["date"] == df0["date"].iloc[0]]

fig = px.choropleth(df0, locations="iso_code", color="Inzidenz",
                    hover_name="location", range_color=[0,200],
                    color_continuous_scale=px.colors.sequential.Jet)
fig.show()

Um bestimmte Zeilen eines DataFrames herauszufiltern, kann man bei der Auswahl der Spalten Bedingungen angeben.
So können wir z.B. die Werte aus Deutschland aus der Tabelle herausfiltern:

In [None]:
df_de = df[df['iso_code']=='DEU']

print(f"Die Anzahl aller Einträge aus Deutschland ist {df_de.size}")
df_de.head()

Damit können wir die Inzidenz-Werte für Deutschland (`DEU`), Großbritannien (`GBR`) und USA (`USA`) in einen gemeinsamen Graphen plotten.

In [None]:
# YOUR CODE HERE
raise NotImplementedError()

![](Inzidenzen.png)

## Backup

In [None]:
!curl https://miro.medium.com/max/1000/1*CANkzqegZcHv9znE1U4s7A.png -o "mpl_overview.png"