(combinatorics-notebook)=
# Calcolo combinatorio

Il calcolo combinatorio si pone il problema di determinare il numero dei
modi mediante i quali possono essere associati, secondo prefissate regole,
gli elementi di uno stesso insieme o di più insiemi. Alcuni dei problemi del calcolo delle probabilità per essere risolti richiedono l'utilizzo dei metodi del calcolo combinatorio. 

In questo capitolo verranno discussi alcuni concetti del calcolo combinatorio. In particolare, verranno introdotti il principio del prodotto, il principio della somma e il modello dell'urna. Verranno inoltre descritte le nozioni di permutazione semplice, disposizione semplice e di combinazione semplice.

In [19]:
import numpy as np
import pandas as pd
import itertools as it
import math
import matplotlib.pyplot as plt
import seaborn as sns
from scipy.constants import golden

In [2]:
%matplotlib inline
sns.set_theme(
    context="paper",
    style="darkgrid",
    palette="colorblind",
    rc={'figure.figsize': (5.0, 5.0/golden)},
)
SEED = 123456
rng = np.random.default_rng(SEED)

## Principio del prodotto
I metodi di base del calcolo combinatorio applicano due principi: la regola del prodotto e la regola della somma. Consideriamo il principio del prodotto.

In generale, una scelta può essere fatta in più passi, poniamo $k$. Supponiamo che per ogni $i = 1, \dots, k$ la scelta da compiere all'$i$-mo passo possa essere fatta in $n_i$ modi. Il principio del prodotto dice che allora il numero totale di possibili scelte è il prodotto

$$
n_{\text{tot}} = n_1 \cdot  n_2 \cdots n_{k-1} \cdot n_k.
$$

**Esempio 1.** In Minnesota le targhe delle automobili sono costituite da tre lettere (da A a Z) seguite da tre numeri (da 0 a 9). Qual è la proporzione di targhe che iniziano con GZN?

La soluzione è data dal numero di targhe che iniziano con GZN diviso per il numero totale di targhe possibili. 

Il numero totale di targe è $26 \cdot 26 \cdot 26 \cdot 10 \cdot 10 \cdot 10 = 17,576,000$. Per calcolare il numero di targhe che iniziano con GZN, consideriamo le targhe che hanno la forma GZN \_ \_ \_. Per i tre simboli mancanti ci sono $10 \cdot 10 \cdot 10$ possibilità. Dunque la proporzione cercata è 

$$
10^3/(26^3 \cdot 10^3) = 1/26^3 = 0.0000569.
$$

In [51]:
10**3 / (26**3 * 10**3)

5.689576695493855e-05

## Principio della somma
Se un evento può accadere in $\vert S_1\vert$ modi, un secondo evento può accadere in $\vert S_2\vert$ modi, $\dots$, un ultimo evento può accadere in  $\vert S_k\vert$ modi,  vi sono $\vert S_1\vert + \vert S_2\vert + \dots + \vert S_{k-1}\vert + \vert S_k\vert$ modi in cui uno dei $k$ eventi può accadere. In altri termini, se i sottoinsiemi $S_1, \dots, S_k$, costituiscono una partizione di $S$, allora

$$
\vert S_1 \cup S_2 \cup \dots \cup S_{k-1} \cup S_k \vert = \vert S_1\vert + \vert S_2\vert + \dots + \vert S_{k-1}\vert + \vert S_k\vert.
$$

**Esempio 2.** L'urna $A$ contiene $5$ palline numerate da $1$ a $5$, l'urna $B$ contiene $6$ palline numerate da $6$ a $11$, l'urna $C$ contiene $3$ palline numerate da $12$ a $14$ e l'urna $D$ contiene $2$ palline numerate $15$ e $16$. Quanti insiemi composti da due palline, ciascuna estratta da un'urna differente, si possono formare?

Per la regola del prodotto, si possono formare: $30$ insiemi di tipo $AB$ (una pallina estratta dall'urna $A$ e una estratta dall'urna $B$), $15$ di tipo $AC$, $10$ di tipo $AD$, $18$ di tipo $BC$, $12$ di tipo $BD$ e $6$ di tipo $CD$. Per la regola della somma, il numero di insiemi distinti che si possono formare con due palline provenienti dalle quattro urne è $30 + 15 + 10 + 18 + 12 + 6 = 91$.

## Il modello dell'urna
I problemi del calcolo combinatorio sono spesso assimilabili ad estrazioni di palline da urne che diventano così schemi o modelli delle corrispondenti situazioni considerate. Si definisce *modello dell'urna* la  procedura per cui, da un'urna contenente $n$ palline, si estraggono a caso $k$ palline. Le palline possono essere tutte diverse, oppure alcune palline possono essere tra loro indistinguibili. Fra le possibili modalità di estrazione hanno speciale interesse

- l'*estrazione Bernoulliana* di $k$ palline ottenuta estraendo, una dopo l'altra, $k$ palline e rimettendo ogni volta nell'urna la pallina estratta;
- l'*estrazione senza ripetizione* di $k$ palline ottenuta estraendo, una dopo l'altra, $k$ palline senza rimetterle nell'urna;
- l'*estrazione in blocco* di $k$ palline ottenuta estraendo $k$ palline simultaneamente.

Per esempio, nel caso di campioni di ampiezza 2 estratti da un'urna con tre elementi $\{1, 2, 3\}$, abbiamo i seguenti quattro casi:

- campionamento con reimmissione tenendo conto dell'ordine di estrazione: $\{1,  1\}, \{2,  1\}, \{3,  1\}, \{1,  2\}, \{2,  2\}, \{3,  2\}, \{1,  3\}, \{2,  3\}, \{3,  3\}$;
- campionamento con reimmissione senza tenere conto dell'ordine di estrazione: $\{1,  1\}, \{1,  2\}, \{1,  3\}, \{2,  2\}, \{2,  3\}, \{3,  3\}$;
- campionamento senza reimmissione tenendo conto dell'ordine di estrazione:
$\{1,  2\}, \{2,  1\}, \{1,  3\}, \{3,  1\}, \{2,  3\}, \{3,  2\}$;
- campionamento senza reimmissione e senza tenere conto dell'ordine di estrazione: $\{1 , 2\}, \{1,  3\}, \{2, 3\}$.


## Permutazioni semplici
Una *permutazione semplice* di elementi diversi tra loro è il risultato di uno scambio dell'ordine degli elementi di un insieme. Le permutazioni semplici si indicano con il simbolo $P_{n}$. Il modello dell'urna è quello di $n$ estrazioni senza rimessa da un'urna che contiene $n$ palline diverse. Il numero delle permutazioni semplici di $n$ elementi distinti è uguale a

$$
P_n = n!
$$ (eq-permsem)

dove il simbolo $n!$ si legge $n$ fattoriale ed è uguale al prodotto di $n$ numeri interi decrescenti a partire da $n$. Per definizione $0! = 1$.

**Esempio 3.** Consideriamo l'insieme: $A = \{a, b, c\}$. Calcoliamo il numero di permutazioni semplici.

Le permutazioni semplici di $A$ sono: $\{a, b, c\}$, $\{a, c, b\}$, $\{b, c, a\}$, $\{b, a, c\}$, $\{c, a, b\}$, $\{c, b, a\}$, ovvero 6. Applichiamo l'eq. {ref}`eq-permsem`:

$$
P_n = P_3 = 3! = 3 \cdot 2 \cdot 1 = 6.
$$

Lo strumento principale che usiamo in Python per trovare le permutazioni di un insieme è una libreria specificamente progettata per iterare sugli oggetti in modi diversi, ovvero `itertools`. Importiamo le librerie necessarie.

Con `itertools.permutations()` generiamo le permutazioni. Per visualizzare il risultato dobbiamo trasformarlo in una tupla:

In [3]:
A = {'A','B','C'}
print(A)

{'A', 'B', 'C'}


In [4]:
permutations = it.permutations(A)
tuple(permutations)

(('A', 'B', 'C'),
 ('A', 'C', 'B'),
 ('B', 'A', 'C'),
 ('B', 'C', 'A'),
 ('C', 'A', 'B'),
 ('C', 'B', 'A'))

Lo stesso risultato si ottiene con

In [5]:
permutations = it.permutations("ABC")
permutations = tuple(permutations)
permutations

(('A', 'B', 'C'),
 ('A', 'C', 'B'),
 ('B', 'A', 'C'),
 ('B', 'C', 'A'),
 ('C', 'A', 'B'),
 ('C', 'B', 'A'))

Possiamo ora contare quanti elementi ci sono nella tupla usando la funzione `len()`: 

In [6]:
len(permutations)

6

Oppure, possiamo appliare la formula {eq}`eq-permsem` mediante la funzione `factorial()` contenuta nella libreria `math` di Numpy:

In [7]:
np.math.factorial(3)

6

**Esempio 4.** Gli anagrammi  sono  le permutazioni che si ottengono da una parola variando l'ordine delle lettere. Le permutazioni semplici si applicano al caso di parole costituite da lettere tutte diverse tra loro. Ad esempio, con la parola  NUMERO si ottengono $P_6 = 6! = 6\cdot5\cdot4\cdot3\cdot2\cdot1 = 720$ anagrammi. 

In [8]:
permutations = it.permutations("NUMERO")
permutations = tuple(permutations)
permutations[1:10]

(('N', 'U', 'M', 'E', 'R', 'O'),
 ('N', 'U', 'M', 'E', 'O', 'R'),
 ('N', 'U', 'M', 'R', 'E', 'O'),
 ('N', 'U', 'M', 'R', 'O', 'E'),
 ('N', 'U', 'M', 'O', 'E', 'R'),
 ('N', 'U', 'M', 'O', 'R', 'E'),
 ('N', 'U', 'E', 'M', 'R', 'O'),
 ('N', 'U', 'E', 'M', 'O', 'R'),
 ('N', 'U', 'E', 'R', 'M', 'O'),
 ('N', 'U', 'E', 'R', 'O', 'M'),
 ('N', 'U', 'E', 'O', 'M', 'R'),
 ('N', 'U', 'E', 'O', 'R', 'M'),
 ('N', 'U', 'R', 'M', 'E', 'O'),
 ('N', 'U', 'R', 'M', 'O', 'E'),
 ('N', 'U', 'R', 'E', 'M', 'O'),
 ('N', 'U', 'R', 'E', 'O', 'M'),
 ('N', 'U', 'R', 'O', 'M', 'E'),
 ('N', 'U', 'R', 'O', 'E', 'M'),
 ('N', 'U', 'O', 'M', 'E', 'R'),
 ('N', 'U', 'O', 'M', 'R', 'E'),
 ('N', 'U', 'O', 'E', 'M', 'R'),
 ('N', 'U', 'O', 'E', 'R', 'M'),
 ('N', 'U', 'O', 'R', 'M', 'E'),
 ('N', 'U', 'O', 'R', 'E', 'M'),
 ('N', 'M', 'U', 'E', 'R', 'O'),
 ('N', 'M', 'U', 'E', 'O', 'R'),
 ('N', 'M', 'U', 'R', 'E', 'O'),
 ('N', 'M', 'U', 'R', 'O', 'E'),
 ('N', 'M', 'U', 'O', 'E', 'R'),
 ('N', 'M', 'U', 'O', 'R', 'E'),
 ('N', 'M'

In [9]:
len(permutations)

720

In [10]:
np.math.factorial(6)

720

**Esempio 5.** Un altro esempio riguarda i giochi di carte. Ci sono 52! $\approx 8 \times 10^{67}$ modi di ordinare un mazzo di carte da poker; questo numero è "quasi" grande come il numero di atomi dell'universo che si stima essere uguale a circa $10^{80}$.

In [11]:
np.math.factorial(52)

80658175170943878571660636856403766975289505440883277824000000000000

## Disposizioni semplici

Le *disposizioni semplici* sono tutti i sottoinsiemi ordinati di $k$ elementi distinti selezioni tra $n$ elementi distinti, con $k \leq n$. Le disposizioni semplici della classe $k$ si indicano con  $D_{n,k}$. Il modello dell'urna è quello dell'estrazione senza rimessa di $k < n$ palline da un'urna che contiene $n$ palline diverse. 

Il numero delle disposizioni semplici di $n$ elementi distinti della classe $k$ è uguale a

$$
D_{n,k} = \frac{n!}{(n-k)!}.
$$ (eq_disp_simple)

**Esempio 6.** Consideriamo l'insieme: $A = \{a, b, c\}$. Qual è il numero di disposizioni semplici di classe 2?

Le disposizioni semplici di classe 2 sono:

$\{a, b\}$, $\{b, a\}$, $\{a, c\}$, $\{c, a\}$, $\{b, c\}$, $\{c, b\}$, ovvero 6. 

Ovvero

$$
D_{n,k} = \frac{n!}{(n-k)!} = 3 \cdot 2 = 6.
$$ (eq_combinations)

Possiamo trovare il risultato con la seguente istruzione:

In [12]:
tuple(it.permutations("ABC", 2))

(('A', 'B'), ('A', 'C'), ('B', 'A'), ('B', 'C'), ('C', 'A'), ('C', 'B'))

In [13]:
res = tuple(it.permutations("ABC", 2))
len(res)

6

Oppure possiamo implementare l'eq. {eq}`eq_disp_simple`:

In [14]:
def simple_disp(n, k):
    return np.math.factorial(n) / np.math.factorial(n - k)


simple_disp(3, 2)

6.0

(combinazione-semplice-section)=
## Combinazioni semplici

Le *combinazioni semplici* sono tutti i sottoinsiemi di $k$ elementi distinti selezioni tra $n$ elementi distinti, con $k \leq n$ e nell'ipotesi che l'ordine con cui gli elementi si susseguono sia irrilevante. Le combinazioni semplici della classe $k$ si indicano con il simbolo $C_{n,k}$. Il modello dell'urna è quello dell'estrazione senza reimmissione di $k$ palline da un'urna che contiene $n$ palline distinte tra loro: non c'è la ripetizione di elementi né un ordine di estrazione.

Le combinazioni semplici differiscono dalle disposizioni semplici per il fatto che le disposizioni semplici tengono conto dell'ordine di estrazione mentre nelle combinazioni semplici si considerano distinti solo i raggruppamenti che differiscono almeno per un elemento. Gli elementi di ciascuna combinazione di $k$ oggetti possono essere ordinati tra loro in $k!$ modi diversi, per cui il numero delle combinazioni semplici è dato dal numero di disposizioni semplici $D_{n,k}$ diviso per il numero di permutazioni semplici $P_k$ dei $k$ elementi, come indicato nell'eq. {eq}`eq_combsemp`. Il numero delle combinazioni semplici di $n$ elementi distinti della classe $k$ è uguale a

$$
C_{n,k} = \frac{D_{n,k}}{P_k} = \frac{n!}{k!(n-k)!}.
$$ (eq_combsemp)

Il numero delle combinazioni semplici $C_{n,k}$ è spesso indicato con il simbolo $\binom{n}{k}$ che si legge ``$n$ su $k$'' e viene detto *coefficiente binomiale*. 

**Esempio 7.** Per l'insieme $A = \{a, b, c\}$ si trovino le combinazioni semplici di classe 2.

Le combinazioni semplici dell'insieme $A$ sono 
$\{a, b\}$, $\{a, c\}$, $\{b, c\}$, ovvero 3. Applichiamo l'eq. {eq}`eq_combsemp`:

$$
C_{n,k} = \binom{n}{k} = \binom{3}{2} = 3.
$$


Usiamo `itertools`:

In [15]:
c_nk = tuple(it.combinations("ABC", 2))
c_nk

(('A', 'B'), ('A', 'C'), ('B', 'C'))

In [16]:
len(c_nk)

3

La soluzione si trova anche usando la funzione `comb()` della libreria `math`.

In [18]:
math.comb(3, 2)

NameError: name 'math' is not defined

Oppure usando la funzione `comb()` della libreria `scipy.special`.

In [8]:
import scipy.special as sp

sp.comb(5, 2)

10.0

**Esempio 8.** Quanti gruppi di 2 si possono formare con 5 individui? 

In [4]:
c_nk = tuple(it.combinations(range(5), 2))
c_nk

((0, 1),
 (0, 2),
 (0, 3),
 (0, 4),
 (1, 2),
 (1, 3),
 (1, 4),
 (2, 3),
 (2, 4),
 (3, 4))

In [5]:
len(c_nk)

10

ovvero

In [7]:
math.comb(5, 2)

10

## Watermark

In [None]:
%load_ext watermark
%watermark -n -u -v -iv -w