# Matplotlib inleiding
## twee imports
De import die je het meest ziet is matplotlib.pyplot. Maar soms zie je ook gewoon matplotlib. Eenvoudig gezegd is pyplot een gebruiksvriendelijke toegang tot de basisfunctionaliteit in matplotlib.

In de volgende voorbeelden gebruiken we beide imports en maken we een plot op twee manieren. Let op: de manier met alleen matplotlib werkt alleen in een pure Jupyterlab-omgeving (dus niet in VSCode)

## Alleen matplotlib
De volgende code werkt alleen in een pure jupyterlab omgeving (zoals Google Colab). Dus niet in VSCode. We krijgen hier de interne werking van matplotlib te zien: een grafiek wordt op een FigureCanvasAgg gezet en vervolgens wordt canvas getekend. (dit wil je niet doen voor elke grafiek)

In [None]:
from matplotlib.figure import Figure
from matplotlib.backends.backend_agg import FigureCanvasAgg
fig = Figure(figsize=(5,3))
ax = fig.add_subplot()
ax.plot([1, 2, 3, 4], [10, 20, 25, 30])
ax.set_xlabel("x")
ax.set_ylabel("y")
ax.set_title("Plot met matplotlib.figure.Figure")
canvas = FigureCanvasAgg(fig)
canvas.draw()

display(fig)

## Met matplotlib.pyplot
Dit is de meer gebruiksvriendelijke manier. Maar hier zijn er twee manieren om een grafiek te maken.
### De expliciete "Axes" interface
Dit is voor meer uitgebreide plots waarbij we eventueel meerdere grafieken kunnen maken. Een 'figure' is de volledige tekening. Een 'ax' is de grafiek of plot. We maken de grafiek, passen die aan en tekenen. (let op de ; na het laatste statement. Probeer die maar eens weg te laten)

In [None]:
import matplotlib.pyplot as plt

fig = plt.figure()
ax = fig.subplots(1)
ax.set_xlabel("x")
ax.set_ylabel("y")
ax.set_title("Plot met ax object")
ax.plot([1, 2, 3, 4], [10, 20, 25, 30]);

## De implicite "pyplot" interface
Hier is geen sprake meer van "ax". De module pyplot maakt die zelf aan achter de schermen. De functies .xlabel(), .ylabel() en .title() worden door pyplot "vertaald" naar ax.set_xlabel(), ax.set_ylabel() en ax.set_title().

In [None]:
import matplotlib.pyplot as plt
plt.plot([1, 2, 3, 4], [10, 20, 25, 30])
plt.xlabel("x")
plt.ylabel("y")
plt.title("plot met pyplot interface");

## Meerdere grafieken tekenen
Het verschil tussen de twee wordt duidelijker wanneer we twee grafieken maken. Eerst met de impliciete pyplot interface:

In [None]:
plt.figure(figsize=(6, 7)) # maak een 'figuur' van 6 inches breed en 7 inches hoog

plt.subplot(2, 1, 1) # rijen, kolommen, nummer van plot
plt.plot([1, 2, 3], [10, 20, 30])
# maak tweede plot
plt.subplot(2, 1, 2) # tweede plot (op de tweede rij)
plt.plot([1, 2, 3], [6, 5, 4]);
plt.xlabel("x")
plt.ylabel("y")
# maar hoe kan ik de labels van de eerste grafiek nog wijzigen? Ik heb geen verwijzing meer
plt.show() # nodig in een Python script. Hier gebruiken we het in plaats van de ;

Vervolgens met de object-georiënteerde expliciete interface. We hebben een referentie naar elke grafiek via de ax numpy-array. Dit is meer geschikt voor productiecode (waar je dikwijls meerdere grafieken naast elkaar wil zetten). De impliciete interface is handig wanneer je snel een grafiek wil maken. 

In [None]:
fig, ax = plt.subplots(2, 1)  # we maken twee ax-objecten in 2 rijen en 1 kolom 
fig.set_size_inches(6, 7) # zorg voor genoeg plaats om x-label toe te voegen
fig.subplots_adjust(hspace=0.4) #plaats tussen de grafieken
ax[0].plot([1, 2, 3], [4, 5, 6])  # eerste grafiek
ax[1].plot([1, 2, 3], [6, 5, 4])  # tweede grafiek
# ik moet voor beide grafieken nog een x- en y-label toevoegen:

for as_ in ax:
    as_.set_xlabel("x")
    as_.set_ylabel("y")
plt.show() 

## Kleuren en stijlen
Er zijn verschillende manieren (stijlen) om grafieken weer te geven. Je kunt hier een voorbeeldweergave zien van deze verschillende stijlen:
https://matplotlib.org/gallery/style_sheets/style_sheets_reference.html

In [None]:
plt.style.available

De standaard stijl is 'classic'

In [None]:
import numpy as np
rng = np.random.default_rng(42)
x = np.linspace(1, 10)
for index in range(3):
    y = rng.integers(0, (index + 1) * 3, size=x.size)
    plt.scatter(x, y, label=index)
plt.legend()
plt.show()

Maar we kunnen ook eens kijken hoe we dit beter kunnen weergeven voor mensen die kleurenblind zijn

In [None]:
plt.style.use('seaborn-v0_8-colorblind')
rng = np.random.default_rng(42)
x = np.linspace(1, 10)
for index in range(3):
    y = rng.integers(0, (index + 1) * 3, size=x.size)
    plt.scatter(x, y, label=index)
plt.legend()
plt.show()

## Let op met de twee manieren van werken:
- plt.xlabel() wordt ax.set_xlabel()
- plt.ylabel() wordt ax.set_ylabel()
- plt.xlim() wordt ax.set_xlim()
- plt.ylim() wordt ax.set_ylim()
- plt.title() wordt ax.set_title() 

Waarom? Geen idee. (historisch gegroeid: plt volgt de MATLAB interface, ax is object-georiënteerd met setters)

## Voorbeeld: aandelenkoers van Amazon

In [None]:
from pathlib import Path
from zipfile import ZipFile
import requests
URL = 'https://www.kaggle.com/api/v1/datasets/download/adilshamim8/amazon-stock-price-history'
data = requests.get(URL)
AMAZON_ZIP= "amazon_stock_price.zip"
amazon_zip_path = Path(AMAZON_ZIP)
if not amazon_zip_path.exists():
    with open(AMAZON_ZIP, mode='wb') as f:
        f.write(data.content)
    with open(AMAZON_ZIP, 'rb') as f:
        ZipFile(f).extractall()
AMAZON_CSV = 'Amazon_stock_data.csv'


In [None]:
import pandas as pd
AMAZON_CSV = 'Amazon_stock_data.csv'
df = pd.read_csv(AMAZON_CSV)
df.head()

In [None]:
df.info()

## Alleen noodzakelijke data inlezen
We lezen alleen de kolommen Date en Close. Date moet geïnterpreteerd worden als een datum en is de indexkolom

In [None]:
df = pd.read_csv(AMAZON_CSV, usecols=['Date', 'Close'], parse_dates=['Date'], index_col=['Date'])
df.info()

In [None]:
print(df.index.min())
print(df.index.max())


We willen de slotkoers plotten vanaf 1 januari 2000

In [None]:

y = df.loc[pd.to_datetime('2000-01-01'):]
x = df.index[df.index >= pd.to_datetime('2000-01-01')]
plt.plot(x, y)
plt.title('Beurskoers Amazon van 1 jan 2000 tot en met 31 dec 2025')
plt.xlabel('Datum')
plt.ylabel('Slotkoers in USD')
plt.show()

## En met de objectgeoriënteerde axes?

In [None]:
fig,ax = plt.subplots(1)
ax.plot(x, y)
ax.set_xlabel('Datum')
ax.set_ylabel('Slotkoers in USD')
ax.set_title('Beurskoers Amazon van 1 jan 2000 tot en met 31 dec 2025')
plt.show()

## De figuur bewaren
We kunnen de figuur ook bewaren als bestand

In [69]:
fig.savefig('amazon.png')