## **Rolling a Dice**

### P adalah Probabilitas

Kode di bawah ini mengimplementasikan Quote dari Laplace: *Probability is thus simply a fraction whose numerator is the number of favorable cases and whose denominator is the number of all the cases possible.*

In [None]:
from fractions import Fraction

def P(event, space): 
    "The probability of an event, given a sample space."
    favorable = set.intersection # Outcomes that are in the event and in the sample space
    cases     = len              # The number of cases is the length, or size, of a set
    return Fraction(cases(favorable(event, space)), 
                    cases(space))

### Warm-up Problem: Die Roll

Berapa probabilitas dari dadu 6 sisi untuk keluar angka genap? Untuk melambangkan ruang sampel, biasanya digunakan satu huruf. Disini kita lambangkan dengan `D`:

In [None]:
D     = {1, 2, 3, 4, 5, 6} # a sample space
even  = {   2,    4,    6} # an event

P(even, D)

Fraction(1, 2)

In [None]:
# Untuk mengonfirmasi apa yang sudah kita ketahui, kita akan eksplorasi event lain:

prime = {2, 3, 5, 7, 11, 13}
odd   = {1, 3, 5, 7, 9, 11, 13}

P(odd, D)

Fraction(1, 2)

In [None]:
#### Event gabungan antara bilangan genap dan prima
(even | prime)

{2, 3, 4, 5, 6, 7, 11, 13}

In [None]:
P((even | prime), D) # The probability of an even or prime die roll

Fraction(5, 6)

In [None]:
#### Event irisan antara bilangan ganjil dan prima
(odd & prime)

{3, 5, 7, 11, 13}

In [None]:
P((odd & prime), D) # The probability of an odd prime die roll

Fraction(1, 3)

## **Card_draws**

### Card Problems

Misal, dalam suatu permainan kartu:
* Harus terdapat 5 kartu di tangan. 
* Kartu memiliki rank(tingkatan) and suit(gambar), seperti `'J♥'` untuk Jack of Hearts  
* Sebuah `deck` memiliki 52 kartu:

In [None]:
import itertools
from fractions import Fraction

def P(event, space): 
    "The probability of an event, given a sample space."
    favorable = set.intersection # Outcomes that are in the event and in the sample space
    cases     = len              # The number of cases is the length, or size, of a set
    return Fraction(cases(favorable(event, space)), 
                    cases(space))

In [None]:
suits = u'♥♠♦♣'
ranks = u'AKQJT98765432'
deck  = [r + s for r in ranks for s in suits]
len(deck)

52

In [None]:
deck[:8]

['A♥', 'A♠', 'A♦', 'A♣', 'K♥', 'K♠', 'K♦', 'K♣']

Sekarang kita definisikan `Hands` sebagai ruang sampel dari kombinasi 5-kartu dari `deck`. Untuk membuat kombinasi, akan digunakan fungsi `itertools.combinations` ; lalu kita akan menggabungkan masing-masing kombinasi kedalam string dengan pemisah berupas spasi:

In [None]:
def combos(items, n):
    "All combinations of n items; each combo as a space-separated str."
    return set(map(' '.join, itertools.combinations(items, n)))

Hands = combos(deck, 5)
len(Hands)

2598960

Kombinasinya akan ada sangat banyak, namun kita dapat mengambil sampel:

In [None]:
import random
random.sample(Hands, 7)

['A♥ Q♠ 9♥ 4♣ 2♠',
 'A♦ 7♠ 7♦ 4♠ 2♥',
 'A♥ Q♠ 7♥ 7♣ 2♦',
 'Q♥ T♦ 7♣ 5♣ 2♥',
 'A♥ K♠ Q♠ 6♦ 5♦',
 'Q♣ 8♥ 7♥ 6♣ 3♥',
 'A♦ 9♥ 8♣ 4♥ 2♠']

In [None]:
random.sample(deck, 7)

['A♥', '3♥', 'K♠', 'Q♣', 'J♦', '6♦', '2♠']

Sekarang, kita bisa menjawab permasalahan yang lebih kompleks seperti probabilitas untuk mendapatkan flush (5 kartu dengan simbol sama):

In [None]:
flush = {hand for hand in Hands if any(hand.count(suit) == 5 for suit in suits)}

P(flush, Hands)

Fraction(33, 16660)

In [None]:
len(flush)

5148

In [None]:
random.sample(flush, 3)

['A♣ J♣ T♣ 5♣ 4♣', 'A♣ K♣ J♣ 7♣ 3♣', 'Q♣ T♣ 8♣ 7♣ 3♣']

Atau probabilitas dari four of a kind (4 kartu memiliki rank sama):

In [None]:
four_kind = {hand for hand in Hands if any(hand.count(rank) == 4 for rank in ranks)}

P(four_kind, Hands)

Fraction(1, 4165)

In [None]:
random.sample(four_kind, 3)

['Q♠ 6♥ 6♠ 6♦ 6♣', '5♠ 4♥ 4♠ 4♦ 4♣', '8♥ 8♠ 8♦ 8♣ 3♥']

## **Ball in Bag Problem**

Pada sekitar tahun 1700, Jacob Bernoulli menulis sebuah kasus mengenai pengambilan bola berwarna dari sebuah kantong, dan sejak saat itu, penjelasan mengenai probabilitas sering memakai contoh ini.

Sebagai contoh, berikut adalah permasalahan yang diadaptasi dari [mathforum.org](http://mathforum.org/library/drmath/view/69151.html):

*Dalam sebuah kantong terdapat bola berwarna dengan jumlah 6 biru, 9 merah, dan 8 putih. Dari kantong tersebut diambil 6 bola random. Berapa probabilitas dari masing-masing hasil dibawah ini:*

 - *Semua bola merah*.
 - *3 biru, 1 merah, dan 2 putih*.
 - *4 bola putih*.

Untuk simulasi, kita akan definisikan isi dari kantong. Sebuah `set` tidak dapat memiliki elemen yang sama persis. Sehingga penamaan harus berbeda, misal bola biru diberi kode `'B1'` sampai `'B6'`, bukan 6 elemen yang sama dengan nama `'B'`:

### Previous Defined Functions



In [None]:
import itertools
import random
from fractions import Fraction

def P(event, space): 
    "The probability of an event, given a sample space."
    favorable = set.intersection # Outcomes that are in the event and in the sample space
    cases     = len              # The number of cases is the length, or size, of a set
    return Fraction(cases(favorable(event, space)), 
                    cases(space))

def combos(items, n):
    "All combinations of n items; each combo as a space-separated str."
    return set(map(' '.join, itertools.combinations(items, n)))

### Balls in Bag

In [None]:
def balls(color, n):
    "A set of n numbered balls of the given color."
    return {color + str(i)
            for i in range(1, n + 1)}

In [55]:
urn = balls('B', 6) | balls('R', 9) | balls('W', 8)

Sekarang kita definisikan ruang sampel, `U6`, sebagai set dari kombinasi 6 bola:  

In [None]:
U6 = combos(urn, 6)

random.sample(U6, 5)

['B2 W3 W7 R5 W6 W8',
 'W4 W5 B3 R4 B1 R8',
 'B2 W3 R9 W5 R4 R2',
 'W1 R7 W2 B3 R4 R8',
 'R6 W4 R5 W5 B3 R2']


Definisikan fungsi  `select` sehingga `select('R', 6)` adalah kejadian mengambil 6 bola merah dari kantong:

In [None]:
def select(color, n, space=U6):
    "The subset of the sample space with exactly `n` balls of given `color`."
    return {s for s in space if s.count(color) == n}

Sekarang, kita bisa menjawab 3 pertanyaan tadi:

In [None]:
# Semua bola merah
P(select('R', 6), U6) 

Fraction(4, 4807)

In [None]:
# 3 biru, 1 merah, dan 2 putih
P(select('B', 3)  & select('R', 1) & select('W', 2), U6)

Fraction(240, 4807)

In [None]:
# 4 bola putih
P(select('W', 4), U6)

Fraction(350, 4807)

### Balls in Bag via arithmetic

Kita dapat memverifikasi perhitungan diatas dengan menggunakan aritmatik. Pertama, berapa cara kita bisa memilih 6 dari 9 bola merah? Untuk bola pertama, kita dapat memilih bola merah mana saja dari 9 yang ada, lalu pilih satu lagi dari 8 sisanya, dan seterusnya sampai terpilih 6 bola. Namun, dalam kasus ini urutan dari bola tidak diperhatikan, Sehingga dalam kasus ini dapat digunakan **kombinasi**. Secara umum, jumlah cara untuk mengambil *c* dari *n* item adalah: 

(*n* choose *c*) = *n*! / ((*n* - *c*)! &times; c!).

Kita dapat menerjemahkan menjadi sebuah kode:

In [None]:
from math import factorial

def choose(n, c):
    "Number of ways to choose c items from a list of n items."
    return factorial(n) // (factorial(n - c) * factorial(c))

choose(9, 6)

84


Sekarang, kita dapat memverifikasi hasil perhitungan sebelumnya. (Karena `P` adalah rasio sedangkan `choose` merupakan jumlah asli,
maka nilai `P` harus dikalikan dengan `N`, besar dari ruang sampel, agar kedua sisi berada pada skala yang sama.)

In [None]:
# Semua bola merah*.
N = len(U6)
N * P(select('R', 6), U6) == choose(9, 6)

True

In [None]:
# 3 biru, 1 merah, dan 2 putih
N * P(select('B', 3) & select('W', 2) & select('R', 1), U6) == choose(6, 3) * choose(8, 2) * choose(9, 1)

True

In [None]:
# 4 bola putih
N * P(select('W', 4), U6) == choose(8, 4) * choose(6 + 9, 2)  # (6 + 9 non-white balls)

True

## **Non-Equiprobable Outcomes**

Sejauh ini, kita memiliki asumsi bahwa segala sesuatu ideal. Misal sebuah koin akan selalu memiliki probabilitas 50:50, dadu 6 sisi memiliki probabilitas sama untuk tiap sisinya, dll. Namun, pada kenyataannya segala sesuatu tidak selalu ideal, misal ada dadu atau yang berat sebelah karena ada error di proses manufaktur.

Dalam sesi ini, juga akan diperkenalkan beberapa istilah baru:

* [Frekuensi](https://en.wikipedia.org/wiki/Frequency_%28statistics%29): Bilangan non-negatif yang mendeskripsikan seberapa sering sebuah kejadian terjadi. Bisa dalam bentuk bilangan seperti "5", atau sebuah rasio seperti "1/6".

* [Distribusi](http://mathworld.wolfram.com/StatisticalDistribution.html): Sebuah pemetaan dari outcome/hasil ke frekuensi dari *outcome*. Kita memperbolehkan ruang sampel sebagai distribusi. 

* [Probability Distribution](https://en.wikipedia.org/wiki/Probability_distribution): *Probability distribution* adalah distribusi yang frekuensinya jika dijumlahkan bernilai 1. 

In [56]:
from collections import Counter
        
class Dist(Counter): 
    "A Distribution of {outcome: frequency} pairs."

Karena `Dist` adalah sebuah `Counter`, Kita dapat menginisiasi seperti berikut:

In [57]:
# A set of equiprobable outcomes:
Dist({1, 2, 3, 4, 5, 6})

Dist({1: 1, 2: 1, 3: 1, 4: 1, 5: 1, 6: 1})

In [58]:
# A collection of outcomes, with repetition indicating frequency:
Dist('THHHTTHHT')

Dist({'T': 4, 'H': 5})

In [59]:
# A mapping of {outcome: frequency} pairs:
Dist({'H': 5, 'T': 4})

Dist({'H': 5, 'T': 4})

In [60]:
# Keyword arguments:
Dist(H=5, T=4) == Dist({'H': 5}, T=4) == Dist('TTTT', H=5)

True

Sekarang, kita akan modifikasi kode yang sudah ada untuk kasus distribusi.

- Sample spaces dan events dapat berupa `set` atau `Dist`.
- Ruang sample bisa dalam bentuk non-probability distribution seperti `Dist(H=50, T=50)`; hasilnya akan sama
dengan ruang sampel jika didefinisikan dengan probability distribution seperti `Dist(H=1/2, T=1/2)`.
- Fungsi `cases` sekarang akan menjumlahkan frekuensi di dalam distribusi (sebelumnya hanya menghitung length dari sebuah set).
- Fungsi `favorable` sekarang menghasilkan `Dist` dari *favorable outcomes* dan frekuensinya (bukan `set`).
- Fungsi `Fraction` di definisikan ulang sebagai `"/"`, bukan `fractions.Fraction`, karena frekuensi mungkin saja berbentuk desimal.
- `P` tidak berubah.

In [61]:
import itertools
import random
from fractions import Fraction

def cases(outcomes): 
    "The total frequency of all the outcomes."
    return sum(Dist(outcomes).values())

def favorable(event, space):
    "A distribution of outcomes from the sample space that are in the event."
    space = Dist(space)
    return Dist({x: space[x] 
                 for x in space if x in event})

def Fraction(n, d): return n / d

def P(event, space): 
    "The probability of an event, given a sample space."
    return Fraction(cases(favorable(event, space)), 
                    cases(space))

Sebagai contoh, berikut adalah probabilitas dari sebuah dadu yang jelek dengan harapan keluar angka genap. Dadu terlihat memiliki preferensi untuk keluar angka 6 :

In [62]:
Crooked = Dist({1: 0.1, 2: 0.1, 3: 0.1, 4: 0.1, 5: 0.1, 6: 0.5})
even = {2,4,6}

P(even, Crooked)

0.7

Contoh lain, sebuah [artikel](http://people.kzoo.edu/barth/math105/moreboys.pdf) memiliki data untuk keluarga dengan 2 anak di Denmark, dimana `GB` berarti anak pertama adalah perempuan "Girl" dan anak kedua "Boy".

    GG: 121801    GB: 126840
    BG: 127123    BB: 135138

In [77]:
DK = Dist(GG=121801, GB=126840,
          BG=127123, BB=135138)

In [78]:
first_girl  = {'GG', 'GB'}
P(first_girl, DK)

0.48667063350701306

In [79]:
second_girl = {'GG', 'BG'}
P(second_girl, DK)

0.4872245557856497

Yang berarti kemungkinan untuk lahir anak perempuan berada di antara 48% and 49%. Kemungkinan untuk perempuan sedikit lebih tinggi untuk anak kedua. 

Jika sudah memiliki anak pertama, apakah anda lebih mungkin untuk mendapatkan anak kedua dengan gender yang sama?

In [65]:
same = {'GG', 'BB'}
P(same, DK)

0.5029124959385557

Ya, tapi hanya 0.3%. lebih tinggi

## **Predicates as Event**

In [66]:
# Fungsi-fungsi sebelumnya

import itertools
import random
from fractions import Fraction
from collections import Counter
        
class Dist(Counter): 
    "A Distribution of {outcome: frequency} pairs."

def cases(outcomes): 
    "The total frequency of all the outcomes."
    return sum(Dist(outcomes).values())

def favorable(event, space):
    "A distribution of outcomes from the sample space that are in the event."
    space = Dist(space)
    return Dist({x: space[x] 
                 for x in space if x in event})

def Fraction(n, d): return n / d

def P(event, space): 
    "The probability of an event, given a sample space."
    return Fraction(cases(favorable(event, space)), 
                    cases(space))

Untuk menghitung probabilitas dari dadu genap, sebelumnya digunakan cara:

    even = {2, 4, 6}
    
Tapi cara tersebut tidak elegan &mdash;kita perlu menuliskan semua angka genap antara 1 sampai 6. Jika jumlah sisi dari dadu berubah, kita perlu kembali untuk mendefinisikan `even`.  Cara yang lebih elegan adalah dengan menggunakan fungsi:

In [67]:
def even(n): return n % 2 == 0

Untuk membuat `P(even, D)` bekerja, kita akan memperbolehkan `Event` sebagai sebuah `set` atau `callable` (yaitu, fungsi yang menghasilkan `true` jika _outcomes_ adalah bagian dari _event_). Kita tidak perlu memodifikasi `P`, namun  `favorable` perlu untuk mengonversi `event` dalam bentuk fungsi ke bentuk `set`:

In [70]:
def favorable(event, space):
    "A distribution of outcomes from the sample space that are in the event."
    if callable(event):
        event = {x for x in space if event(x)}
    space = Dist(space)
    return Dist({x: space[x] 
                 for x in space if x in event})

D     = {1, 2, 3, 4, 5, 6}
favorable(even, D)

P(even, D)

0.5

Kita akan definisikan `die` untuk membuat sample space untuk dadu dengan *n*-sisi:

In [71]:
def die(n): return set(range(1, n + 1))

favorable(even, die(12))

Dist({2: 1, 4: 1, 6: 1, 8: 1, 10: 1, 12: 1})

In [72]:
P(even, die(12))

0.5

In [73]:
P(even, die(2000))

0.5

In [74]:
P(even, die(2001))

0.49975012493753124

Kita dapat mendefinisikan event-event yang lebih rumit dengan menggunakan predikat; misal kita bisa mencari probabilitas dari penjumlahan *d* dadu 6 sisi adalah bilangan prima:

In [75]:
def sum_dice(d): return Dist(sum(dice) for dice in itertools.product(D, repeat=d))

def is_prime(n): return (n > 1 and not any(n % i == 0 for i in range(2, n)))

for d in range(1, 9):
    p = P(is_prime, sum_dice(d))
    print("P(is_prime, sum_dice({})) = {}".format(d, round(p, 3)))

P(is_prime, sum_dice(1)) = 0.5
P(is_prime, sum_dice(2)) = 0.417
P(is_prime, sum_dice(3)) = 0.338
P(is_prime, sum_dice(4)) = 0.333
P(is_prime, sum_dice(5)) = 0.317
P(is_prime, sum_dice(6)) = 0.272
P(is_prime, sum_dice(7)) = 0.242
P(is_prime, sum_dice(8)) = 0.236


Note: is_prime yang prima, sum_dice (2) banyaknya pelemparan dua kali

Dalam kasus ini, bilangan prima utk dadu 6 sisi di lempar 1-9 kali


In [76]:
sum_dice(2)

Dist({2: 1, 3: 2, 4: 3, 5: 4, 6: 5, 7: 6, 8: 5, 9: 4, 10: 3, 11: 2, 12: 1})

Note: hasilnya paling ujung 12:1, ini berarti 6 dan 6
