# Voorspellen met Monte carlo

### Opdracht 
We gaan proberen om een voorspelling te doen over de uitslag van een (verkleinde) voetbalpool om te zien wie er waarschijnlijk gaat winnen. We gaan deze voorspelling doen aan de hand van de  Random Number Generator en het principe vanMonte Carlo Simulatie.

Maak een Monte Carlo Simulatie die meerdere keren (duizenden) de competitie speelt met gebruik van deze tabel van kansen. Hoe vaker je een competitie speelt, hoe nauwkeuriger je voorspelling wordt. Houd bij hoeveel punten elk team scoort in de competitie (3 punten voor winst, 1 punt voor gelijk, 0 voor verlies), en maak een overzicht (ranking) van de teams.

<img src = "tabelMC.PNG">

### Verdiepend (voor een 8 of hoger): 
In het bovenstaande hebben we ervoor gekozen om geen rekening te houden met doelsaldo's. Om een betere, granuleerder beeld te schetsen van de waarschijnlijk uitkomst van een competitie, zal je ook doelpunten moeten bijhouden. Om dit voor elkaar te krijgen zal je de potjes die teams tegen elkaar spelen moeten uitbreiden: in plaats van alleen maar winst/gelijkspel/verlies te berekenen aan de hand van de kansen, moet je random gaan bepalen hoeveel doelpunten er gescoord zullen worden. Om dit te doen, kan je een Poisson-verdeling gebruiken (Koppelingen naar een externe site.) om te bepalen wat de kans is op een aantal doelpunten voor/tegen in een partij. Gebruik hiervoor de volgende gemiddelden

<img src = "win_verlies_doelpunten_teams.PNG">

Waarbij:

    HS staat voor "average home score", ofwel gemiddelde aantal doelpunten voor als dit team thuis speelt;
    HC staat voor "average home conceded", ofwel gemiddelde aantal doelpunten tegen als dit team thuis speelt;
    AS staat voor "average away score"; 
    AC staat voor "average away conceded".

Je kan nu de kansverdeling op doelpunten voor/tegen berekenen door de kracht van de thuisspelende partij en de uitspelende partij te middelen; dat wil zeggen, om een indicatie te krijgen van het gemiddelde aantal doelpunten dat door Ajax thuis tegen PSV wordt gescoord: (HS(Ajax) + AC(PSV)) / 2 --> (3.2 + 1.3) / 2 = 2.25. 

Bewerk je Monte Carlo Simulatie zodanig dat ook doelsaldo's berekend worden, en maak een nieuwe tabel van de waarschijnlijke positionering van elk team. Zie je een verschuiving in de resultaten?

In [None]:
import matplotlib.pyplot as plt

# Pseudo Random Number Generators (PRNG)

Voor deze opdracht wordt er twee pseudo random number generators( prng ) gebruikt:
1. Linear Congruential method 
2. Middle Square Method 

Voor elke prng is een functie **randdec** geimplementeerd.<br>
De functie **randdec()** schaalt de gegenereerde willekeurig getal naar een waarde tussen de 0 en 1. Deze willekeurig getal wordt gebruikt bij het bepalen van de doelpunten voor een thuisploeg en tegenstander.

## 1. Linear Congruential method

Een class maken waar we willekeurige getallen genereren op basis van de Linear congruential algoritme.
De formule voor de Linear Congruential method luid als volgt: <br>
**X n+1 = (a * Xn + c) mod m**
waar
* a= multiplier
* c = increment
* Xn als n = 0 => seed (starting value)
* m = modulus

De implementatie van de Linear Congruential method is te vinden in het *linear_congruential.py* in de folder *prng*


In [None]:
from prng.linear_congruential import LCR

#### Voorbeeld met de Linear congruential method 
Het is belangrijk om een ​​groot *seed* te geven om een ​​meer willekeurig getal te genereren en korte cycli / herhaling te voorkomen.

In [None]:
rng = LCR(1664525, 1013904223, 2 ** 32,  20200420162000)
lst = []
for i in range(100):
    lst.append(rng.randdec())
print(lst[:10])

In [None]:
plt.plot(lst)
plt.title("Distribution of the random number LCR")

Door een 100 random number te gegeneren zie we dat er geen herhaling voorkomen.De parameters in het gedefinieerde LCR-object zal worden gebruikt voor ons Monte Carlo-probleem.

## Middle square 

Een class maken met functie die willekeurig getallen generenen met de Middle square algoritme.De formule voor de Middle Square method luid als volgt:

**Xn+1 = middle n digits ( Xn )^2**

In [None]:
from prng.middle_square import MiddleSquare

#### Voorbeeld van de the Middle Square method
Een nadeel van de Middle Square algoritme is, dat er een bepaalde x waar de algoritme alleen maar 0 of een constante waarde genereren.Er is belangrijk dat er een grote seed wordt gekozen om zoveel mogelijk willekeurige getallen te genereren voordat de algoritme 0 / constante waarde bereikt.

In [None]:
mds = MiddleSquare(2**32)

In [None]:
list_random_number = []
for _ in range(1000):
    list_random_number.append(mds.randdec())
print(list_random_number[0:10])

In [None]:
plt.plot(list_random_number)
plt.title("Distribution of the random numbers using the Middle Square Algorithm")

Uit de bovenstaande grafiek is er te zien dat voor 1000 getallen bereikt de algoritme niet 0 of een constante waarde.
De parameters in het gedefinieerde MiddleSquare-object zal worden gebruikt voor ons Monte Carlo-probleem.

## Resultaten 

In [None]:
from voetbal.teams import Team
from voetbal.tournament import Tournament
from monte_carlo import MC

Elke wedstrijd heeft een plaats in het eindklassement (rangschikking 1e, 2e, 3e, 4e en 5e). De waarschijnlijkheid dat een team een ​​specifieke plaats behaalt in de laatste klassering = het aantal keren dat het team op een specifieke plaats is geclassificeerd / totaal aantal competities in een kampioenschap.

In onze Monte carlo-functie voeren we n kampioenschappen uit. <br>
**x** = het aantal keren dat het team op een specifieke plaats is geclassificeerd<br>
**n** = het aantal iteratie van je MC<br>
De kans zal zijn **x/n**


In [None]:
rng_lcr = LCR(1664525, 1013904223, 2 ** 32,  20200420162000)

In [None]:
n = 1000
MC(n, rng_lcr, 'probability list')

In [None]:
MC(n, rng_lcr,'verdiepend')

In [None]:
rng_mds = MiddleSquare(2**32)

In [None]:
MC(n, rng_mds, 'probability list')

In [None]:
MC(n, rng_mds, 'verdiepend')

Er is duidelik een verschuiving te zien tussen de resultaten met en zonder Poisson distribution en de twee PRNG.
De resultaten zonder de Poisson distribution is meer verzadigd.De resultaten met de Poisson distribution is er duidelijk te zien welke team de grootste kans heeft voor een bepaalde ranking.