# Non-Equiprobable Outcomes

Sejauh ini, kita memiliki asumsi bahwa segala sesuatu ideal. Misal sebuah koin akan selalu memiliki probabilitas 50:50, dadu 6 sisi memiliki probabilitas sama untuk tiap sisinya, dll. Namun, pada kenyataannya segala sesuatu tidak selalu ideal, misal ada dadu atau yang berat sebelah karena ada error di proses manufaktur.

Dalam sesi ini, juga akan diperkenalkan beberapa istilah baru:

* [Frekuensi](https://en.wikipedia.org/wiki/Frequency_%28statistics%29): Bilangan non-negatif yang mendeskripsikan seberapa sering sebuah kejadian terjadi. Bisa dalam bentuk bilangan seperti "5", atau sebuah rasio seperti "1/6".

* [Distribusi](http://mathworld.wolfram.com/StatisticalDistribution.html): Sebuah pemetaan dari outcome/hasil ke frekuensi dari *outcome*. Kita memperbolehkan ruang sampel sebagai distribusi. 

* [Probability Distribution](https://en.wikipedia.org/wiki/Probability_distribution): *Probability distribution* adalah distribusi yang frekuensinya jika dijumlahkan bernilai 1. 


In [None]:
from collections import Counter
        
class Dist(Counter): 
    "A Distribution of {outcome: frequency} pairs."

Karena `Dist` adalah sebuah `Counter`, Kita dapat menginisiasi seperti berikut:

In [None]:
# A set of equiprobable outcomes:
Dist({1, 2, 3, 4, 5, 6})

In [None]:
# A collection of outcomes, with repetition indicating frequency:
Dist('THHHTTHHT')

In [None]:
# A mapping of {outcome: frequency} pairs:
Dist({'H': 5, 'T': 4})

In [None]:
# Keyword arguments:
Dist(H=5, T=4) == Dist({'H': 5}, T=4) == Dist('TTTT', H=5)

Sekarang, kita akan modifikasi kode yang sudah ada untuk kasus distribusi.

- Sample spaces dan events dapat berupa `set` atau `Dist`.
- Ruang sample bisa dalam bentuk non-probability distribution seperti `Dist(H=50, T=50)`; hasilnya akan sama
dengan ruang sampel jika didefinisikan dengan probability distribution seperti `Dist(H=1/2, T=1/2)`.
- Fungsi `cases` sekarang akan menjumlahkan frekuensi di dalam distribusi (sebelumnya hanya menghitung length dari sebuah set).
- Fungsi `favorable` sekarang menghasilkan `Dist` dari *favorable outcomes* dan frekuensinya (bukan `set`).
- Fungsi `Fraction` di definisikan ulang sebagai `"/"`, bukan `fractions.Fraction`, karena frekuensi mungkin saja berbentuk desimal.
- `P` tidak berubah.


In [None]:
import itertools
import random
from fractions import Fraction

def cases(outcomes): 
    "The total frequency of all the outcomes."
    return sum(Dist(outcomes).values())

def favorable(event, space):
    "A distribution of outcomes from the sample space that are in the event."
    space = Dist(space)
    return Dist({x: space[x] 
                 for x in space if x in event})

def Fraction(n, d): return n / d

def P(event, space): 
    "The probability of an event, given a sample space."
    return Fraction(cases(favorable(event, space)), 
                    cases(space))

Sebagai contoh, berikut adalah probabilitas dari sebuah dadu yang jelek dengan harapan keluar angka genap. Dadu terlihat memiliki preferensi untuk keluar angka 6 :

In [None]:
Crooked = Dist({1: 0.1, 2: 0.1, 3: 0.1, 4: 0.1, 5: 0.1, 6: 0.5})
even = {2,4,6}

P(even, Crooked)

Contoh lain, sebuah [artikel](http://people.kzoo.edu/barth/math105/moreboys.pdf) memiliki data untuk keluarga dengan 2 anak di Denmark, dimana `GB` berarti anak pertama adalah perempuan "Girl" dan anak kedua "Boy".

    GG: 121801    GB: 126840
    BG: 127123    BB: 135138

In [None]:
DK = Dist(GG=121801, GB=126840,
          BG=127123, BB=135138)

In [None]:
first_girl  = {'GG', 'GB'}
P(first_girl, DK)

In [None]:
second_girl = {'GG', 'BG'}
P(second_girl, DK)

Yang berarti kemungkinan untuk lahir anak perempuan berada di antara 48% and 49%. Kemungkinan untuk perempuan sedikit lebih tinggi untuk anak kedua. 

Jika sudah memiliki anak pertama, apakah anda lebih mungkin untuk mendapatkan anak kedua dengan gender yang sama?

In [None]:
same = {'GG', 'BB'}
P(same, DK)

Ya, tapi hanya 0.3%. lebih tinggi