## Prawdopodobieństwo klasyczne

### Kombinatoryka

Kombinatoryka jest działem matematyki zajmującym się sposobem liczenia struktur przeliczalnych (takich, których elementy można ustawić w ciąg, tzn. "wypisać po kolei"). Kombinatoryka zawdzięcza swój rozwój teorii prawdopodobieństwa, z którą jest silnie związana. Z naszego puntku widzenia kombinatoryka pozwoli nam określać **na ile sposobów da się utworzyć dany wzorzec wybierając elementy ze skończonego zbioru**. Dla przykładu wybierzmy zbiór 20 osób. Z tych 20 osób możemy tworzyć różne "wzorce". Możemy na przykład zapytać ile różnych grup trzyosobowych możemy wybrać albo na ile sposobów da się ustawić wszystkie osoby w kolejkę, tak aby za każdym razem ich kolejność była inna. Pomimo tego, że kombinatoryka jest znacznie szerszym działem matematyki, w naszych zastowaniach będziemy wykorzystywać głównie pytania tego rodzaju. 

#### **1. Permutacja**
Zastanówmy się na ile spsosobów może się zakończyć wyścig 4 zawodników, pod warunkiem, że nie będzie remisów.

In [1]:
from itertools import permutations

for i, p in enumerate(permutations('ABCD', 4)):
    print(f'Option {i+1}:'.ljust(12), '1.{} 2.{} 3.{} 4.{}'.format(*p))

Option 1:    1.A 2.B 3.C 4.D
Option 2:    1.A 2.B 3.D 4.C
Option 3:    1.A 2.C 3.B 4.D
Option 4:    1.A 2.C 3.D 4.B
Option 5:    1.A 2.D 3.B 4.C
Option 6:    1.A 2.D 3.C 4.B
Option 7:    1.B 2.A 3.C 4.D
Option 8:    1.B 2.A 3.D 4.C
Option 9:    1.B 2.C 3.A 4.D
Option 10:   1.B 2.C 3.D 4.A
Option 11:   1.B 2.D 3.A 4.C
Option 12:   1.B 2.D 3.C 4.A
Option 13:   1.C 2.A 3.B 4.D
Option 14:   1.C 2.A 3.D 4.B
Option 15:   1.C 2.B 3.A 4.D
Option 16:   1.C 2.B 3.D 4.A
Option 17:   1.C 2.D 3.A 4.B
Option 18:   1.C 2.D 3.B 4.A
Option 19:   1.D 2.A 3.B 4.C
Option 20:   1.D 2.A 3.C 4.B
Option 21:   1.D 2.B 3.A 4.C
Option 22:   1.D 2.B 3.C 4.A
Option 23:   1.D 2.C 3.A 4.B
Option 24:   1.D 2.C 3.B 4.A


Po wypisaniu wszystkich możliwości, widzimy, że wyścig może zakończyć się na 24 różne sposoby. Inaczej mówiąc, zbiór 4-elementowy ma 24 permutacje. Możemy to zapisać jako $P_4=24$. Liczba wszystkich permutacji to liczba różnych sposobów ustawienia elementów zbioru w kolejności. Spróbujmy otrzymać ogolną postać wyrażenia $P_n$ czyli liczby permumtacji zbioru n-elementowego. 

*Rozumowanie*

Weźmy skończony zbiór składający się z n-elementów ($a_1$, $a_2$, ..., $a_n$). Wyobraźmy sobie, że będziemy tworzyć ciągi z tych elementów. Możemy pomyśleć, że przed stworzeniem ciągu dysponujemy ponumerowanymi pustymi miejscami, w które będziemy wstawiać wyrazy ciągu:
$$\_ \quad \_ \quad \_ \quad \_ \quad \dots \quad \_$$ 
$$1 \quad 2 \quad 3 \quad 4 \quad \dots \quad n$$ 
Na pierwszym miejscu może się znaleźć dowolny z n wyrazów ciągu.
$$a_1 \quad \_ \quad \_ \quad \_ \quad \dots \quad \_$$ 
$$a_2 \quad \_ \quad \_ \quad \_ \quad \dots \quad \_$$ 
$$\dots$$ 
$$a_n \quad \_ \quad \_ \quad \_ \quad \dots \quad \_$$ 

Daje nam to n możliwości. Rozważmy pierwszą z nich. W tej możliwości mamy już zajęte miejsce numer 1 (przez element $a_1$, pozostaje więc n-1 miejsc do obsadzenia. Mamy do do dyspozycji n-1 elementów (wszystkie za wyjątkiem $a_1$), więc tworzy to dodatkowe n-1 możliwości:
$$a_1 \quad a_2 \quad \_ \quad \_ \quad \dots \quad \_$$ 
$$a_1 \quad a_3 \quad \_ \quad \_ \quad \dots \quad \_$$ 
$$\dots$$ 
$$a_1 \quad a_n \quad \_ \quad \_ \quad \dots \quad \_$$ 

Dokladnie tyle samo możliwości daje nam sytuacja, w której element $a_2$ (lub dowolny inny) znajduje się na miejscu numer 1. Zatem chcąc zapełnić dwa pierwsze miejsca mamy $n(n-1)$ różnych możliwości – pierwsze miejsce zapełniamy dowolnym elementem ciągu, drugie zapełniamy dowolnym z n-1 pozostałych elementów. Takie rozumowanie możemy ponowić dla miejsca numer 3, 4, itd.
Ostatecznie widzimy, że liczba różnych permutacji będzie równa:

$$P_n=n(n-1)(n-2)\dots2\cdot1=n!$$


In [2]:
from math import factorial

print('4! = ', factorial(4))

4! =  24


Widzimy, że liczba wszystkich wypisanych permutacji odpowiada wyrażeniu $4!$, czyli jest zgodna z wydedukowanym wzorem ogólnym.

#### **2. Wariacja bez powtórzeń**
Załóżmy, że chcemy stworzyć kod PIN do telefonu wykorzystując jedynie cyfry od 0 do 4. Chcemy, aby w naszym kodzie PIN, żadna cyfra nie powtórzyła się. Ile mamy różnych możliwości do wyboru?

In [3]:
from itertools import permutations

for i, v in enumerate(permutations(''.join(str(d) for d in range(5)), 4)):
    print(f'PIN {i+1}:'.ljust(10), ''.join(v))

PIN 1:     0123
PIN 2:     0124
PIN 3:     0132
PIN 4:     0134
PIN 5:     0142
PIN 6:     0143
PIN 7:     0213
PIN 8:     0214
PIN 9:     0231
PIN 10:    0234
PIN 11:    0241
PIN 12:    0243
PIN 13:    0312
PIN 14:    0314
PIN 15:    0321
PIN 16:    0324
PIN 17:    0341
PIN 18:    0342
PIN 19:    0412
PIN 20:    0413
PIN 21:    0421
PIN 22:    0423
PIN 23:    0431
PIN 24:    0432
PIN 25:    1023
PIN 26:    1024
PIN 27:    1032
PIN 28:    1034
PIN 29:    1042
PIN 30:    1043
PIN 31:    1203
PIN 32:    1204
PIN 33:    1230
PIN 34:    1234
PIN 35:    1240
PIN 36:    1243
PIN 37:    1302
PIN 38:    1304
PIN 39:    1320
PIN 40:    1324
PIN 41:    1340
PIN 42:    1342
PIN 43:    1402
PIN 44:    1403
PIN 45:    1420
PIN 46:    1423
PIN 47:    1430
PIN 48:    1432
PIN 49:    2013
PIN 50:    2014
PIN 51:    2031
PIN 52:    2034
PIN 53:    2041
PIN 54:    2043
PIN 55:    2103
PIN 56:    2104
PIN 57:    2130
PIN 58:    2134
PIN 59:    2140
PIN 60:    2143
PIN 61:    2301
PIN 62:    2304
PIN 63: 

Wypisaliśmy wszystkie 120 sposóbów utworzenia 4 cyfrowego PINU z 5 cyfr, przy założeniu, że żadna cyfra nie może się powtórzyć. Możemy to zapisać jako $V^4_5$. Unikatowe ciągi k-elementowe stworzone ze zbioru n elementów nazywamy **wariacjami bez powtórzeń** i oznaczamy symbolem $V^k_n$. Widzimy, że dla k=n, liczba wariacji bez powtórzeń jest równa liczbie permutacji zbioru n-elementowgo. Spróbujmy otrzymać ogólny wzór na $V^k_n$, posługując się rozumowaniem podobnym do tego, które wykorzystaliśmy przy analizie permutacji.  

*Rozumowanie*

Weźmy zbiór n-elementów. Podobnie jak w przypadku permutacji, będziemy z niego tworzyć ciągi, lecz tym razem o długości k. Przed stworzeniem ciągu mamy zatem k miejsc do obsadzenia.
$$\_ \quad \_ \quad \_ \quad \_ \quad \dots \quad \_$$ 
$$1 \quad 2 \quad 3 \quad 4 \quad \dots \quad k$$ 
Na pierwszym miejscu (dokładnie tak samo jak w permutacji) może się znaleźć dowolny spośród n elementów, na drugim dowolny spośród n-1 elementów i tak dalej. Na ostatnim k-tym miejscu może znaleźć się dowolny spośród pozostałych n-k+1 elementów. Dla każdego miejsca liczba możliwości wygląda następująco
$$n \quad n-1 \quad n-2 \quad n-3 \quad \dots \quad n-k+1$$ 
Możemy zatem utworzyć $n(n-1)(n-2)\dots(n-k+1)$ unikatowych ciągów k elementowych spośród n elementów:

$$V^k_n=n(n-1)(n-2)\dots(n-k+1)=\frac{n(n-1)(n-2)\dots2\cdot1}{(n-k)(n-k-1)\dots2\cdot1}=\frac{n!}{(n-k)!}$$

Dla k=n $V^k_n=\frac{n!}{0!}=\frac{n!}{1}=n!=P_k$, czyli zgodnie ze wcześniejszą obserwacją, dla k=n liczba wariacji bez powtórzeń jest równa liczbie permutacji zbioru n-elementowo.

In [4]:
from math import factorial

print('5! / (5-4)! = ', factorial(5) // factorial(1))

5! / (5-4)! =  120


Widzimy, że liczba wszystkich wypisanych kodów PIN $\frac{5!}{(5-4)!}$ wynosi 120, czyli jest zgodna z wydedukowanym wzorem ogólnym.

#### **3. Kombinacja**
Wybierzmy grupę 6 osób. Każda z osób wita się z pozostałymi osobami poprzez zetknięcie łokci. Zastanówmy się ile zetknięć łokci potrzeba, aby wszyscy przywitali się ze wszystkimi.

In [5]:
from itertools import combinations

for i, c in enumerate(combinations(''.join(str(d) for d in range(1,7)), 2)):
    print(f'Option {i+1}:'.ljust(12), 'p{} >< p{}'.format(*c))

Option 1:    p1 >< p2
Option 2:    p1 >< p3
Option 3:    p1 >< p4
Option 4:    p1 >< p5
Option 5:    p1 >< p6
Option 6:    p2 >< p3
Option 7:    p2 >< p4
Option 8:    p2 >< p5
Option 9:    p2 >< p6
Option 10:   p3 >< p4
Option 11:   p3 >< p5
Option 12:   p3 >< p6
Option 13:   p4 >< p5
Option 14:   p4 >< p6
Option 15:   p5 >< p6


Po wypisaniu wszystkich sposobów, widzimy, że potrzeba było 15 zetknięć. Inaczej mówiąc, mamy 15 kombinacji 2-elementowych ze zbioru 6-elementowego. Możemy to zapisać jako $C^2_6=15$. Kombinacja k-elementowa ze zbioru n-elementowego to unikatowy sposób wyboru k elementów spośród n elementów. W kombinacjach nie interesuje nas kolejność elementów (nie ma znaczenia czy osoba numer 1 wita się z osobą numer 2 czy na odwrót – ważna jest sama "przynależność dwóch osób do danego powitania"). Spróbujmy otrzymać wzór ogólny na $C^k_n$.

*Rozumowanie*

Z poprzednich rozważań wiemy, że spośród n-elementów możemy wybrać $V^k_n$ unikatowych ciągów k-elementowych. Spróbujmy wykorzystać tą wiedzę do otrzymania wzoru na liczbę kombinacji. W liczeniu kombinacji nie interesuje nas jednak kolejność, a jedynie fakt przynaleźności do wybranego podzbioru. Z tego względu oczekujemy, że liczba kombinacji $C^k_n$ powinna być mniejsza od liczby wariacji bez powtórzeń $V^k_n$. 

Aby zbadać relację $V^k_n$ i $C^k_n$ posłużmy się konkretnym przykładem. Weźmy n=6 i k=3. Liczba wariacji bez powtórzeń dla tych wartości wynosi $V^3_6=\frac{6!}{(6-3)!}=\frac{6!}{3!}=120$. Oznacza to, że mamy 120 **unikatowych ciągów** 3-elementowych spośród 6 elementów. Chcemy teraz dowiedzieć się ile mamy **unikatowych podzbiorów** 3-elementowych ze zbioru 6 elementów. Dla każdego 3-elementowego podzbioru, czyli każdej trójki, możemy stworzyć $P_3=6$ unikatowych ciągów. W związku tym mamy następującą relację: $C^3_6 \cdot P_3 = V^3_6$. Widzimy, że aby otrzymać liczbę kombinacji wykrzystując wariacje bez powtórzeń musimy uwzględnić fakt, że każdy podzbiór "występuje" wielokrotnie jako ciąg o tych samych elementach, lecz ustawiony w różnej kolejności. Przykładowo, mając zbiór 6 liter $\{a, b, c, d, e, f\}$, na jeden podzbiór 3 liter, np. $\{a,e,f\}$, przypada dokładnie 6 różnych wariacji bez powtórzeń: $(a, e, f)$, $(a, f, e)$, $(e, a, f)$, $(e, f, a)$, $(f, a, e)$ oraz $(f, e, a)$. W ogólności na każdy podzbiór k-elementowy przypada dokładnie $P_k$ odpowiadających wariacji bez powtórzeń. Wykorzystajmy tę obserwację aby otrzymać wyrażenie ogólne na $C^k_n$:

$$C^k_n=\frac{V^k_n}{P_k}=\frac{\frac{n!}{(n-k)!}}{k!}=\frac{n!}{(n-k)!k!}=\binom{n}{k}$$

Wyrażenie $\binom{n}{k}$ nazywane jest [symbolem Newtona](https://pl.wikipedia.org/wiki/Symbol_Newtona).

In [6]:
from math import factorial

factorial(6) // (factorial(2) * factorial(4))

15

Widzimy, że liczba wszystkich kombinacji równa $\binom{6}{2}=15$ jest zgodna ze wzorem ogólnym.

#### **4. Wariacja z powtórzeniami**
Załóżmy że dysponujemy 5 symbolami (mamy alfabet składający się z 5 znaków). Ile różnych słów, składających się z 3 znaków możemy utworzyć w takiej sytuacji?

In [7]:
from itertools import product

for i, c in enumerate(product('abcde', repeat=3)):
    print(f'Word {i+1}:'.ljust(10), ''.join(c))

Word 1:    aaa
Word 2:    aab
Word 3:    aac
Word 4:    aad
Word 5:    aae
Word 6:    aba
Word 7:    abb
Word 8:    abc
Word 9:    abd
Word 10:   abe
Word 11:   aca
Word 12:   acb
Word 13:   acc
Word 14:   acd
Word 15:   ace
Word 16:   ada
Word 17:   adb
Word 18:   adc
Word 19:   add
Word 20:   ade
Word 21:   aea
Word 22:   aeb
Word 23:   aec
Word 24:   aed
Word 25:   aee
Word 26:   baa
Word 27:   bab
Word 28:   bac
Word 29:   bad
Word 30:   bae
Word 31:   bba
Word 32:   bbb
Word 33:   bbc
Word 34:   bbd
Word 35:   bbe
Word 36:   bca
Word 37:   bcb
Word 38:   bcc
Word 39:   bcd
Word 40:   bce
Word 41:   bda
Word 42:   bdb
Word 43:   bdc
Word 44:   bdd
Word 45:   bde
Word 46:   bea
Word 47:   beb
Word 48:   bec
Word 49:   bed
Word 50:   bee
Word 51:   caa
Word 52:   cab
Word 53:   cac
Word 54:   cad
Word 55:   cae
Word 56:   cba
Word 57:   cbb
Word 58:   cbc
Word 59:   cbd
Word 60:   cbe
Word 61:   cca
Word 62:   ccb
Word 63:   ccc
Word 64:   ccd
Word 65:   cce
Word 66:   cda
Word 67:  

Po wypisaniu wszystkich sposobów, widzimy, że przy użyciu 5 liter oraz długości słowa równej 3 można utworzyć 125 unikatowych słów. W wariacji z powtórzeniami, podobnie jak w wariacji bez powtórzeń, tworzymy ciągi k-elemntowe wybierając spośród n-elementów, lecz umożliwiamy powtarzanie się elementu w ramach ciągu. Wariację z powtórzeniami zapisujemy wykorzystując symbol $W^k_n$, więc w naszym przykładzie $W^3_5=125$. Otrzymanie wyrażenia ogólnego na $W^k_n$ jest bardzo łatwe.

*Rozumowanie*

Skoro nie musimy unikać powtórzeń, na każde z k wolnych miejsc możemy wstawić dowolny spośród n symboli. Równocześnie każde miejsce możemy obsadzić niezależnie od innego, nie musząc przejmować się, że stworzyliśmy "nadmiarową" ilość ciągów. W związku z tym całkowita ilość ciągów wynosi:

$$W^k_n = n\cdot n\cdot \dots \cdot n = n^k$$

In [8]:
print(5 ** 3)

125
