# Blackjack: Strategie of geluk?

## Introductie

In dit onderzoek gaan we een database visualiseren. In de visualisatie gaan we onderzoeken of Blackjack voornamelijk draait om puur geluk of dat een goede strategie meer succes oplevert. We zullen deze vraag beantwoorden door het analyseren van een grote dataset bestaande uit 900.000 Blackjack-handen. Aan de hand van de database zal er worden gekeken naar het gokspel Black Jack. Er is gekozen voor het spel Blackjack aangezien dit spel de hoogste teruggave heeft van alle kansspelen. De house edge, oftewel het percentage wat het Casino extra kans heeft om te winnen is 2% (Cai, 2022) Daarom wordt er bij dit spel onderzocht of het geluk is of dat er ook nog een strategie bij komt kijken.

Aan de ene kant van het spectrum hebben we het perspectief dat Blackjack een spel van puur geluk is. Het verloop van het spel hangt af van de kaarten die je ontvangt en de kaart die de dealer heeft. Je hebt geen invloed op welke kaarten je krijgt en welke al op tafel liggen. Daarom ben je volledig afhankelijk van geluk om te winnen.

Aan de andere kant hebben we het perspectief van strategie. Er bestaan verschillende strategieën die je kunt toepassen bij Blackjack. Deze strategieën hebben verschillende ideeën over wat de beste zet is bij verschillende kaartcombinaties. Het concept achter deze strategieën is dat ze over een langere periode meer winst opleveren. Deze strategieën worden ontwikkeld met behulp van machine learning en kunnen consistente resultaten opleveren op de lange termijn.

In deze data story visualisatie zullen we de data van 900.000 Blackjack-handen onderzoeken om te zien of er patronen zijn die wijzen op een voordeel van geluk of strategie. We zullen verschillende visuele weergaven gebruiken om inzicht te geven in de resultaten en conclusies te trekken. Of je nu een doorgewinterde Blackjack-speler bent of gewoon geïnteresseerd bent in het spel, deze visualisatie biedt een fascinerende kijk op de rol van geluk en strategie in Blackjack. 


In [87]:
import pandas as pd
import plotly.express as px
import plotly.graph_objs as go
import seaborn as sb

## De dataset

Wij hebben om de dataset voor te bereiden weinig hoeven aan te passen, we hebben uit het excel bestand de nummering gehaald van de rijen ,die maakt pandas namelijk zelf al aan en was dus niet nodig. Verder hebben we ook de plwinamt en de dlwinamt eruit gehaald omdat het voor ons niet interessant is hoeveel geld er is gewonnen. Verder gaan al de variabelen in de data set over de kaarten die worden getrokken en over de uitkomst van het spel en zijn dus erg relevant.

In [88]:
df = pd.read_csv(r'blackjack.csv', sep= ';')

df

Unnamed: 0,PlayerNo,card1,card2,card3,card4,card5,sumofcards,dealcard1,dealcard2,dealcard3,dealcard4,dealcard5,sumofdeal,blkjck,winloss,plybustbeat,dlbustbeat,ply2cardsum
0,Player1,7,10,0,0,0,17,10,8,0,0,0,18,nowin,Loss,Beat,Dlwin,17
1,Player2,10,9,0,0,0,19,10,8,0,0,0,18,nowin,Win,Plwin,Beat,19
2,Player3,9,8,0,0,0,17,10,8,0,0,0,18,nowin,Loss,Beat,Dlwin,17
3,Player4,2,10,0,5,0,17,10,8,0,0,0,18,nowin,Loss,Beat,Dlwin,12
4,Player5,10,2,0,5,0,17,10,8,0,0,0,18,nowin,Loss,Beat,Dlwin,12
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
899995,Player2,10,7,0,0,0,17,3,9,4,2,0,18,nowin,Loss,Beat,Dlwin,17
899996,Player3,6,1,10,0,0,17,3,9,4,2,0,18,nowin,Loss,Beat,Dlwin,7
899997,Player4,4,2,9,0,0,15,3,9,4,2,0,18,nowin,Loss,Beat,Dlwin,6
899998,Player5,9,10,0,0,0,19,3,9,4,2,0,18,nowin,Win,Plwin,Beat,19


## Uitleg Blackjack

Leuk dat we een idee hebben maar wat is Blackjack eigenlijk? Blackjack is een kaartspel dat wordt gespeeld door de dealer en de spelers. De dealer deelt elke ronde de kaarten uit. Het doel van de spelers is om zo dichtbij de 21 te komen zonder eroverheen te gaan. Een speler wint als hij of zij een hogere score heeft dan de dealer.

Het spel wordt gespeeld met één of meerdere normale kaartspellen. Deze kaartspellen  hebben elk 52 kaarten. De kaarten 2-10 hebben hun eigen waarde, de plaatjes zijn elk 10 punten waard. De aas kan 1 of 11 punten zijn, dit is afhankelijk van wat het beste bij de speler.

Aan het begin van het spel zet elke speler zijn inzet op tafel. Hierna krijgt elke speler inclusief de dealer twee kaarten. De spelers krijgen hun kaarten open en de dealer krijgt één kaart open en de andere dicht. 


In [89]:
allin_df = df[df['sumofcards'] >= 21]

win_count = allin_df[allin_df['winloss'] == 'Win'].shape[0]
loss_count = allin_df[allin_df['winloss'] == 'Loss'].shape[0]
push_count = allin_df[allin_df['winloss'] == 'Push'].shape[0]

circle_data = {
    'Result': ['Win', 'Loss', 'Push'],
    'Count': [win_count, loss_count, push_count]}

circle_df = pd.DataFrame(circle_data)

colors = ['red', 'green', 'blue']
fig = px.pie(circle_df, values='Count', names='Result', color_discrete_sequence=colors)


fig.update_layout(
    title='Figuur 1: Win kans bij nooit stoppen')

fig.show()

De eerste strategie die we gaan bekijken is: Wat gebeurt er als je altijd pakt wanneer dit kan, dit zorgt ervoor dat je dus of 21 oftewel blackjack hebt of dat je bust en alles verliest. In figuur 1 is de strategie alles pakken weergeven. Dit levert een winstpercentage op van 32,4%. Dit is dus geen goede strategie om te winnen. Hieruit kunnen we dus concluderen dat helemaal niet nadenken en gewoon vertrouwen op je geluk niet een goede aanpak is. Er zal dus iets van overweging aan te pas moeten komen.

In [90]:
stop17_df = df[df['sumofcards'] >= 17]

win_count = stop17_df[stop17_df['winloss'] == 'Win'].shape[0]
loss_count = stop17_df[stop17_df['winloss'] == 'Loss'].shape[0]
push_count = stop17_df[stop17_df['winloss'] == 'Push'].shape[0]

circle_data = {
    'Result': ['Win', 'Loss', 'Push'],
    'Count': [win_count, loss_count, push_count]}

circle_df = pd.DataFrame(circle_data)

fig = px.pie(circle_df, values='Count', names='Result', color_discrete_sequence=colors)

fig.update_layout(
    title='Figuur 2: Win kans bij stoppen 17'
)

fig.show()

In figuur 2 is de strategie 17 punten halen en dan niet meer pakken. Bij deze strategie is de winstkans 43,8%. Dit is 11.4% hoger dan de grafiek van visualisatie 1. Dit betekent dat een betere strategie de winstkans verhoogt. Wel is de kans op verliezen nog steeds hoger dan de kans op winst, dit betekent dat geluk nogsteeds een belangrijke een rol speelt. 17 punten is niet altijd goed genoeg, wel is 17 punten en niet pakken beter dan wel pakken bij 17 punten. Hieruit zouden we dus kunnen afleiden dat het spel niet helemaal geluk is en nadenken over een strategie dus wel nodig is.

In [91]:
win_loss_percentage = df.groupby('ply2cardsum')['winloss'].value_counts(normalize=True).mul(100).rename('percentage').reset_index()

pivot_table = win_loss_percentage.pivot(index='ply2cardsum', columns='winloss', values='percentage')

fig = go.Figure()
fig.add_trace(go.Bar(x=pivot_table.index, y=pivot_table['Win'], name='Win', marker_color='green'))
fig.add_trace(go.Bar(x=pivot_table.index, y=pivot_table['Loss'], name='Loss', marker_color='red'))
fig.add_trace(go.Bar(x=pivot_table.index, y=pivot_table['Push'], name='Push', marker_color='blue'))

fig.update_layout(
    title='Figuur 3: Resultaat per som van de eerste 2 kaarten',
    xaxis_title='Card som',
    yaxis_title='Percentage',
    barmode='stack'
)

fig.show()

In figuur 3 staan de win, loss en push percentages zijn na het totaal van de eerste twee kaarten. Als het totaal van de eerste twee kaarten bijvoorbeeld elf is, is het win percentage 53.8%, het loss percentage ongeveer 40% en het push percentage ongeveer 10%. Eigenlijk kan de speler na de eerste twee kaarten al zien hoe groot zijn of haar winkansen zijn. De twee kaarten worden gegeven aan de speler, hij of zij heeft hier geen invloed op en dus kan er een conclusie worden getrokken dat er sprake is van geluk. De eerste twee kaarten hebben heel veel invloed op het succes van de speler. Er zit veel verschil tussen de win percentages en hier kan de speler zelf niks aan doen. Omdat de speler niks kan doen is er ook geen sprake van een strategie die hij of zij kan toepassen.

In [92]:
bust_probabilities = df.groupby('ply2cardsum')['plybustbeat'].apply(lambda x: (x == 'Bust').mean()).reset_index(name='probability')

fig = go.Figure(data=go.Scatter(x=bust_probabilities['ply2cardsum'], y=bust_probabilities['probability'], mode='lines+markers'))

fig.update_layout(title='Figuur 4:Kans op bust per waarde van de eerste 2 kaarten',
                  xaxis_title='Waarde van eerste 2 kaarten',
                  yaxis_title='Kans op bust (%)')

fig.update_yaxes(tickformat='.0%')

fig.show()

De keuze tussen wel en niet een kaart pakken is erg belangrijk in een potje Blackjack. In figuur 4 zien we wat de kans is dat de speler aan het einde van de hand bust per waarde van de eerste 2 kaarten. We zien terug dat deze waardes tussen 7 en 11 het kleinst zijn en daarvoor en daarna veel hoger, dit komt omdat spelers bij waardes onder de 17 vaak meer pakken omdat de kans dat de dealer meer dan 17 heeft vrij groot is. Vanaf 17 staat dat de kans op bust 0% is, dit is niet waar, maar omdat de spelers niet meer kaarten pakken als ze bij de eerste 2 kaarten 17 hebben komt dit nooit voor en staat er dus 0%. Uit dit figuur kunnen we afleiden dat geluk en strategie allebei een rol spelen. Voor strategie kunnen we zeggen dat het verstandig is om na 16 niet meer te pakken, de kans op busten zou nog groter zijn dan bij 16 en is dus erg slecht voor de speler. Voor geluk kan je zeggen dat als je eerste 2 kaarten slecht zijn, je er zelf niks meer aan kan doen en het dus om geluk gaat.

In [93]:
win_loss_percentage = df.groupby('dealcard1')['winloss'].value_counts(normalize=True).mul(100).rename('percentage').reset_index()

pivot_table = win_loss_percentage.pivot(index='dealcard1', columns='winloss', values='percentage')

fig = go.Figure()
fig.add_trace(go.Bar(x=pivot_table.index, y=pivot_table['Win'], name='Win', marker_color='green'))
fig.add_trace(go.Bar(x=pivot_table.index, y=pivot_table['Loss'], name='Loss', marker_color='red'))
fig.add_trace(go.Bar(x=pivot_table.index, y=pivot_table['Push'], name='Push', marker_color='blue'))

fig.update_layout(
    title='Figuur 5: Kans op resultaat per waarde van de eerste dealer kaart',
    xaxis_title='Card som',
    yaxis_title='Percentage',
    barmode='stack'
    
)

fig.show()

De grafiek gaat over de eerste kaart van de dealer. Deze kaart ligt open, de spelers kunnen de kaart dus zien. Deze grafiek laat dus de winstkansen van de speler aan het begin van het spel zien. Zo is de winstkans van een speler het grootst als de dealer een 6 heeft en het kleinst als de dealer een 11 heeft. Dit komt omdat de kaart die het meest voorkomt een plaatje is, daar zijn er het meeste van. Hierdoor is de kans groot dat als een dealer een aas heeft, ook blackjack heeft.
Wel moet worden meegenomen dat als een dealer als eerste kaart een 6 heeft, dat er een nog relatief grote kans is dat de dealer wint of dat er een push is. Daarnaast speelt geluk ook nog een andere factor. De aas heeft namelijk 2 waarden, een 1 of een 11. De winstkans bij de waarde 1 ligt veel hoger dan bij 11. Alleen kan de speler nooit weten wat de waarde van de aas is. Dit weet alleen de dealer. Hierdoor kan de speler moeilijk een strategie toepassen als er een aas ligt. Wel zou je kunnen zeggen dat als de dealer een goede eerste kaart heeft, het voor speler handig zou kunnen zijn om meer risico te nemen en op een hogere waarde nog een kaart te pakken.

In [94]:
count_1 = df[df['dealcard1'] == 1].shape[0]
count_11 = df[df['dealcard1'] == 11].shape[0]

labels = ['1', '11']
counts = [count_1, count_11]
colors = ['orange', 'orange']

fig = go.Figure(data=[go.Bar(x=labels, y=counts, marker=dict(color=colors))])
fig.update_layout(title='Figuur 6: Aantal keer voorkomen van waarde 1 en 11 in dealcard1',
                  xaxis_title='Waarde', yaxis_title='Aantal')
fig.show()

De eerste kaart van de dealer is dus erg belangrijk zoals we net hebben gezien. De bijzondere kaart die de dealer als eerste kan pakken is de aas, deze kan namelijk 1 of 11 zijn waarbij 1 heel gunstig is voor de speler en 11 helemaal niet. De speler weet echter nog niet welke waarde de aas zal zijn als de dealer deze als eerste pakt. In figuur 6 is de waarde weergegeven van de aas als eerste kaart, er is te zien dat de waarde 11 veel vaker voorkomt en er dus minder sprake is van geluk voor speler, hij kan er het best vanuit gaan dat deze aas een 11 zal zijn en zou dus hier zijn strategie op aan kunnen passen. Dit zou bijvoorbeeld meer risico nemen kunnen zijn omdat je alleen kan winnen van de dealer als jouw kaarten hoger zijn.

In [95]:
count_df = df.groupby(['PlayerNo', 'winloss', 'plybustbeat']).size().reset_index(name='count')

fig = px.treemap(count_df, path=['PlayerNo', 'winloss', 'plybustbeat'], values='count', color='PlayerNo',
                 hover_data={'count': True})

fig.data[0].textinfo = 'label+text'
fig.data[0].text = count_df['count'].astype(str)

fig.update_layout(title='Figuur 7: Treemap het resultaat van de gespeelde handen per speler')

fig.show()

Blackjack word vaak gespeeld aan een tafel met meer mensen in Casino, om te kijken of je positie bij de tafel je kans op winnen beïnvloed hebben we per speler de resultaten neergezet in een Treemap gezet. De resultaten zijn gesorteerd op winnen en verliezen, je kan beide dingen op 2 manieren, de speler kan winnen door hogere kaarten te hebben dan de dealer of doordat de dealer bust, het tegenovergestelde geldt voor de dealer om te winnen. Voor de totale waardes van elk variabel kan je met de muis over de grafiek heen. We kunnen uit de grafiek concluderen dat de positie van waar je zit niets uit maakt, voor elke speler is de waarde voor winnen en verliezen ongeveer gelijk, wel wijken de waardes van hoe de speler dit doet af. Dit heeft echter geen invloed op de totale waardes voor winnen en verliezen per speler, die zijn voor winnen ongeveer 64 duizend en voor verliezen ongeveer 71 duizend voor elke speler. Er is dus geen strategie aanwezig als het gaat om je positie bij de tafel, wel kunnen we zien dat na genoeg spelletjes iedereen ongeveer dezelfde resultaten heeft en dat het dus een goede strategie is om snel te stoppen als je winst hebt gemaakt. 

## Bronnen

- Cai, X. (2022). The House Edge and the Basic Strategy of Blackjack. In SHS Web of Conferences (Vol. 148, p. 03038). EDP Sciences.