# Kostky

* seznámení s knihovnou [empiricaldist](https://github.com/AllenDowney/empiricaldist)
* viz knihu: [A.B.Downey: Think Bayes](http://allendowney.github.io/ThinkBayes2)

## Knihovna empiricaldist

**`class Distribution(pandas.Series)`**

* abstraktní třída rozdělení odvozená od pandas.Series

* `.qs`, `.ps` — np.array, definiční obor (index), obor hodnot

* `__init__(ps, qs)` — konstruktor konzistentní s `pandas.Series(data, index)`

* `transform()` — override metoda modifikuje index (.qs) nikoli hodnoty (.ps)

**`class Pmf(Distribution)`**

* pravděpodobnostní funkce, aka hustota pro diskrétní jevy (Probability mass function)

* `.from_seq(seq: np.array, normalize=True, sort=True)` — vytvoří rozdělení hodnot z dat
* `.normalize()` — normalizuje na součet pravděpodobností 1
* `.plot() .bar()` — nakreslí plt.plot resp. plt.barplot
* `.mean(), .var(), .sum(), .std(), .mode(), .median(), .max_prob()` — statistiky rozdělení
* `.quantile(ps), .credible_interval(p)` — kvantily a bayesovský interval spolehlivosti (centrální pstní masa míry p)
* `.choice(size=1) .sample(n=10)` — náhodný výběr z rozdělení
* `.add_dist(pfm), .sub_dist(), .mul_dist(), .div_dist()` 
  * rozdělení součtu, rozdílu, součinu, podílu rozdělení
* `.lt_dist(pmf), .le_dist, .gt_dist, .ge_dist, eq_dist(), ne_dist()`  
  * porovnání pravděpodobností, že z jednoho rozdělení vyjde nižší/vyšší, stejná nebo různá hodnota než ze druhého
* `.make_joint(pmf)` — sdružené rozdělení (2D) za předpokladu nezávislosti
* `.conditional(i,val), marginal(i)` — podmíněné / marginální rozdělení (i-tá dimenze)
* `.update(likelihood, data)` — bayesovský update 
  * `likelihood(data, hypo)` — funkce, co vrací věrohodnost data pro všechny hypo z qs 
* `.make_cdf()` — převod hustoty na distribuční funkci

**`class Cdf(Distribution)`**

* distribuční funkce (Cumulative distribution function)

* `.from_seq(seq: np.array, normalize=True, sort=True)` — vytvoří distr. funkci ze sekvence hodnot
* `.normalize()` — normalizuje na kumulativní součet pravděpodobností 1
* `.plot(), .step()` — nakreslí plt.plot 
* `.forward(), .inverse()` — vyhodnocení Cdf jako interpolace funkce qs → ps a naopak




In [None]:
%matplotlib inline
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from empiricaldist import Pmf

def decor(title):
    plt.xlabel('x')
    plt.ylabel('PMF')
    plt.title(title)

#### 1k6 — šestistěnná kostka

* hod běžnou kostkou na člověče zezlob se

In [None]:
p1k6 = Pmf.from_seq(np.arange(1,7))
p1k6
p1k6.bar();
#p1k6.plot();
decor('1k6')

In [None]:
print(p1k6.mean())
print(p1k6.std())

#### 2k6 — dvě šestistěnné kostky

* součet dvou hodů šestistěnnou kostkou (osadníci v katanu)

In [None]:
p2k6 = # vytvořte rozdělení součtu hodů dvěma kostkami
p2k6.plot();
decor('2k6')

### 10k6 vs. 6k10

* Hrajete kostky. Před vámi leží dvě hromádky kostek 10k6 a 6k10.
* Volíte hromádku, soupeř dostane druhou, hodíte, vyhrává hráč s vyšším součtem.
* Kterou hromádku zvolíte?

#### 10k6 — deset šestistěnných kostek

* Vytvořte rozdělení součtu hodu deseti šestistěnnými kostkami.
  * Jaké je maximum, jaká je střední hodnota?

In [None]:
def n_dices(dice, N):
    # implementujte funkci na součet hodů n kostkami

p10k6 = n_dices(p1k6, 10)

p10k6.plot();    
decor('10k6')
print(f'Max: {p10k6.qs.max()}')
print(f'Mean: {p10k6.mean():.2f}')

#### 6k10 — šest desetistěnných kostek
* Vytvořte rozdělení součtu hodu deseti šestistěnnými kostkami.
  * Jaké je maximum, jaká je střední hodnota?

In [None]:
p1k10 = 
p6k10 = 

p6k10.plot();    
decor('6k10')
print(f'Max: {p6k10.qs.max()}')
print(f'Mean: {p6k10.mean():.2f}')

#### Rozdíl mezi 10k6 a 6k10

* Jaké je rozdělení rozdílu mezi 10k6 a 6k10
  * Jaká je střední hodnota rozdílu
* Jaká je pravděpodobnost, že 10k6 bude vyšší než 6k10?


In [None]:
p_diff = 
p_diff.plot();
decor('10k6 – 6k10')

In [None]:
p_diff.mean()

In [None]:
p_diff[p_diff.qs > 0].sum()

In [None]:
p10k6.gt_dist(p6k10)

### 1k6+

* Jaké je rozdělení hodu 1k6+, tedy hodu, kdy po šestce házím znovu?

* Jaká je střední hodnota?

* Která z kostek 1kN pro N v [2,10] má nejvyšší střední hodnotu?

In [None]:
vals = (p1k6.qs, p1k6.ps)
bonus = (p1k6.qs, p1k6.ps)

def generate_1kNp(N = 6, deep = 10):
    

p1k6p = generate_1kNp(6)

p1k6p.plot();
decor('1k6+')

In [None]:
p1k6p.mean()

In [None]:
sm = pd.Series(0, index = np.arange(2,11))

for N in sm.index:
    sm.loc[N]=
    
print(sm)
plt.plot(sm);

### 10k6+ vs 6k10+

* Stejná otázka jen s opakováním hodu po šestce


In [None]:


p10k6p.plot();
p6k10p.plot();
decor('10k6+ vs 6k10+')
plt.legend(['10k6+','6k10+']);

In [None]:
p10k6p.mean()

In [None]:
p6k10p.mean()