# Analyse Moeilijk

1. Lees de wedstrijden csv

In [None]:
def lees_wedstrijden(bestandsnaam, delimiter):
    """Leest de wedstrijden uit een CSV-bestand en retourneert een lijst met wedstrijden."""
    wedstrijden = []
    with open(bestandsnaam, newline='', encoding='utf-8') as csvfile:
        reader = csv.DictReader(csvfile, delimiter=delimiter)
        for row in reader:
            wedstrijden.append(row)
    return wedstrijden

2. Bereken het gemiddelde per match

In [None]:

def bereken_gemiddelde_doelpunten(wedstrijden):
    """Berekent het gemiddelde aantal doelpunten per match per seizoen."""
    gemiddelde_doelpunten = {}
    for wedstrijd in wedstrijden:
        seizoen = wedstrijd['Seizoen']
        totale_doelpunten = int(wedstrijd['FinaleStandThuisploeg']) + int(wedstrijd['FinaleStandUitploeg'])
        if seizoen not in gemiddelde_doelpunten:
            gemiddelde_doelpunten[seizoen] = {'totaal': totale_doelpunten, 'aantal': 1}
        else:
            gemiddelde_doelpunten[seizoen]['totaal'] += totale_doelpunten
            gemiddelde_doelpunten[seizoen]['aantal'] += 1
    for seizoen in gemiddelde_doelpunten:
        gemiddelde_doelpunten[seizoen] = gemiddelde_doelpunten[seizoen]['totaal'] / gemiddelde_doelpunten[seizoen]['aantal']
    return gemiddelde_doelpunten


3. Stel het grafiek op.

In [None]:
def plot_gemiddelde_doelpunten(gemiddelde_doelpunten):
    """Zet het gemiddelde aantal doelpunten per match per seizoen uit in een lijngrafiek."""
    seizoenen = list(gemiddelde_doelpunten.keys())
    doelpunten = list(gemiddelde_doelpunten.values())
    
    # Formateer de seizoenen voor betere leesbaarheid
    seizoenen_labels = [seizoen.replace('/', '-') for seizoen in seizoenen]
    
    plt.plot(seizoenen_labels, doelpunten, marker='o')
    plt.xlabel('Seizoen')
    plt.ylabel('Gemiddelde doelpunten per match')
    plt.title('Gemiddelde doelpunten per match per seizoen')
    plt.grid(True)
    
    # Roteer de x-as voor betere leesbaarheid
    plt.xticks(rotation=45)
    
    plt.show()

4. Stelt de p en t-test op.

In [None]:
def statistische_test(gemiddelde_doelpunten):
    """Voert een t-test uit om te bepalen of er de laatste jaren significant minder doelpunten worden gemaakt."""
    recente_seizoenen = list(gemiddelde_doelpunten.keys())[-7:]
    oude_seizoenen = list(gemiddelde_doelpunten.keys())[:-7]
    recente_gemiddelde = [gemiddelde_doelpunten[seizoen] for seizoen in recente_seizoenen]
    oude_gemiddelde = [gemiddelde_doelpunten[seizoen] for seizoen in oude_seizoenen]
    t_stat, p_value = stats.ttest_ind(recente_gemiddelde, oude_gemiddelde)
    return t_stat, p_value

5. Roept de functie's op en print de T en p-test af.

In [None]:
# Lees de reguliere competitie wedstrijden uit het CSV-bestand met puntkomma als scheidingsteken
wedstrijden = lees_wedstrijden('clean_matches.csv', ';')

# Bereken het gemiddelde aantal doelpunten per match per seizoen
gemiddelde_doelpunten = bereken_gemiddelde_doelpunten(wedstrijden)

# Plot het gemiddelde aantal doelpunten per match per seizoen
plot_gemiddelde_doelpunten(gemiddelde_doelpunten)

# Voer een t-test uit om te bepalen of er de laatste jaren significant minder doelpunten worden gemaakt
t_stat, p_value = statistische_test(gemiddelde_doelpunten)
print(f"T-statistiek: {t_stat}, P-waarde: {p_value}")