<a href="https://colab.research.google.com/github/QwertyJacob/colab_handouts_PSI/blob/main/2.1_disposizioni_combinazioni.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Apri su Colab"/></a>


### 2.3.3 Disposizioni, Permutazioni e Combinazioni  
___________

Adattamento da: 
- Probability and Statistics for Computer Scientists, M. Baron, CRC Press, 2014
- Probability for Computer Scientists (CS109 Course Reader), C. Piech, Standford, 2024



Anche se potresti pensare di avere avuto una buona padronanza del concetto di conteggio all'età di tre anni, scopri ora che dovevi aspettare questo momento per imparare davvero a contare. Non sei contento di aver seguito questo corso adesso?! Ma seriamente, il conteggio è come la fondazione di una casa (dove la casa rappresenta tutte le cose straordinarie che faremo più avanti in questo libro, come il machine learning). Le case sono fantastiche. Le fondazioni, d'altra parte, sono sostanzialmente del cemento in una buca. Ma non costruire mai una casa senza fondamenta. Altrimenti, il risultato non sarà dei migliori.

##### Principio di enumerazione

> **Definizione**: Principio di enumerazione (versione semplificata)

Se un esperimento ha due parti, dove la prima parte può produrre uno tra $ m $ esiti e la seconda parte può produrre uno tra $ n $ esiti indipendentemente dall'esito della prima parte, allora il numero totale di esiti possibili per l'esperimento è $ m \cdot n $.

Riformulata usando la notazione insiemistica, la *regola del prodotto* afferma che se un esperimento composto da due parti produce un esito appartenente all'insieme $ A $ nella prima parte, dove $ |A| = m $, e un esito appartenente all'insieme $ B $ nella seconda parte (*dove il numero di esiti in $ B $ è lo stesso indipendentemente dall'esito della prima parte*), e dove $ |B| = n $, allora il numero totale di esiti dell'esperimento è $ |A| \cdot |B| = m \cdot n $.

Ti rendi conto che stiamo parlando di due esperimenti diversi, ciascuno con il proprio spazio campione, che poi vengono uniti e considerati comme un unico esperimento con un nuovo spazio campione? La dimensione dello spazio campione complessivo è il prodotto delle dimensionalità degli spazi campioni intermedi.

**Esempio Bonus:** È stato ideato un progetto artistico per mostrare ogni immagine possibile. Certamente ciò richiederebbe molto tempo, poiché devono esistere moltissimi esiti possibili. Ma quanti esattamente? Assumeremo il modello colore noto come [True Color](https://en.wikipedia.org/wiki/Color_depth#True_color_(24-bit)), in cui ogni pixel può avere uno tra $ 2^{24} $ ≈ 17 milioni di colori distinti.



Quanti esiti distinti possono essere generati da (a) una fotocamera dello smartphone con 12 milioni di pixel, (b) una griglia con 300 pixel e (c) una griglia con soli 12 pixel?



![image.png](attachment:image.png)

Risposta: Possiamo utilizzare la regola del prodotto per il calcolo dei possibili esiti. Un'immagine può essere creata un pixel alla volta, passo dopo passo. Ogni volta che scegliamo un pixel, possiamo selezionarne il colore tra 17 milioni di opzioni. Una griglia di $ n $ pixel produce $ (17\ \text{milioni})^n $ immagini diverse.

Poiché $ 17\ \text{milioni} = 2^{24} $, allora:

- Per (c) una griglia di 12 pixel: il numero di esiti è $ (2^{24})^{12} = 2^{288} $.  
  Questo valore è approssimativamente $ 5 \times 10^{86} $, che è circa un milione di volte il numero stimato di atomi nell'universo!

- Per (b) una griglia di 300 pixel: il numero di esiti è $ (2^{24})^{300} = 2^{7200} $, ovvero circa $ 10^{2168} $ immagini.  
  Il numero di atomi nell'universo è trascurabile rispetto a questo numero.

- Per (a) una fotocamera da 12 milioni di pixel: il numero di esiti è $ (2^{24})^{12 \times 10^6} = 2^{288 \times 10^6} $, un numero straordinariamente grande, pari a $ 10^{86\,600\,000} $ circa.

Pertanto, lo spazio campione di tutte le immagini possibili è di dimensioni inimmaginabilmente vaste, anche per griglie di dimensioni ridotte.

Il principio di enumerazione si può estendere per esperimenti che hanno più di due parti. Vale sempre che la dimensione resultante dello spazio campione sarà uguale al prodotto delle dimensioni degli spazi campioni intermedi. 

##### Principio di enumerazione: considerazioni più approfondite.

L'enunciato generale del **principio fondamentale del conteggio**, anche noto come **principio di enumerazione** o **product rule**, è anche il seguente:

Siano $E_1, E_2, \dots, E_k$ esperimenti successivi, e per ciascuno di essi sia definito un insieme di esiti possibili:

$$
\Omega_1, \, \Omega_2(e^1), \, \Omega_3(e^1, e^2), \, \dots, \, \Omega_k(e^1, \, \dots, \, e^{k-1}),
$$

dove $\Omega_i(e^1, \dots, e^{i-1})$ rappresenta l’insieme degli esiti possibili del $i$-esimo esperimento, eventualmente dipendente dai risultati precedenti $e^1, \dots, e^{i-1}$.

L’insieme campione, degli **esiti complessivi** dell’esperimento composto è:

$$
\Omega = \{ (e^1, e^2, \dots, e^k) \mid e^1 \in \Omega_1,  e^2 \in \Omega_2(e^1),, \dots,, e^k \in \Omega_k(e^1, \dots, e^{k-1}) \}.
$$

Quindi la **cardinalità totale** dello spazio campione, cioè il numero totale di esiti possibili dell’esperimento composto, è data da:

$$
|\Omega| = |\Omega_1| \cdot |\Omega_2(e^1)| \cdot |\Omega_3(e^1, e^2)| \cdots |\Omega_k(e^1, \dots, e^{k-1})|.
$$

E, nel caso in cui ciascun esperimento abbia un numero costante di esiti possibili, cioè $|\Omega_i(e^1, \dots, e^{i-1})| = n_i$ per ogni scelta precedente, la formula si riduce alla forma più nota:

$$
|\Omega| = n_1 \times n_2 \times \dots \times n_k.
$$


> **Attenzione**: Il principio di enumerazione è **valido se e solo se** le seguenti condizioni sono soddisfatte:

1. **Esperimenti ordinati e distinguibili**
   Gli esperimenti $E_1, E_2, \dots, E_k$ devono essere **sequenziali** o **posizionalmente distinti**.
   Deve essere possibile rappresentare ogni esito complessivo di $\Omega$ come una **sequenza ordinata**:

   $$
   (e^1, e^2, \dots, e^k)
   $$

   dove $e^i \in \Omega_i$.
   Se l’ordine non ha significato (ad esempio, si considerano insiemi o combinazioni non ordinate di esiti), il principio **non è applicabile**.
   Questa osservazione di sintassi può essere espressa più in termini semantici: ogni sequenza ordinata $(e^1, \dots, e^k)$ deve corrispondere ad
   **un solo esito distinto** dell’esperimento composto.
   Cioè la funzione

   $$
   f: \Omega_1 \times \Omega_2 \times \dots \times \Omega_k \to \Omega
   $$

   deve essere **iniettiva**.
   Se esistono due sequenze diverse che producono lo stesso esito finale (come nel caso di sequenze non ordinate), la formula del prodotto sovrastima $|\Omega|$!

2. **Definizione completa delle possibilità successive**
   Per ogni combinazione di risultati precedenti $(e^1, \dots, e^{i-1})$, l’insieme $\Omega_i(e^1, \dots, e^{i-1})$ deve essere **ben definito** e avere cardinalità finita (o comunque definita).

Detto ciò, vedremo adesso come il principio di enumerazione **non può essere applicato** senza considerazioni aggiuntive quando gli esperimenti $E_1, E_2, \dots, E_k$  **non sono distinguibili come posizioni** (ci sono cioè degli esperimenti che inducono scelte simmetriche). In termini di semantica, stiamo dicento che gli esiti dell’esperimento composto **non dipendono dall’ordine** (ad esempio, estrazioni senza reinserimento in cui conta solo l’insieme delle palline estratte).

Neanche si può usare il principio di enumerazione se due sequenze di esiti diversi rappresentano **lo stesso risultato finale**. Ma questo è ovvio.

##### Usiamo il principio di enumerazione!

Forti da questa considerazione, siamo pronti ad affrontare di nuovo il discorso del passaggio da un vocabolario ad uno spazio campione. Lo affronteremo come fosse il processo di estrazione di sequenze di simboli da un vocabolario. 

Ricordiamo che questo processo di estrazione può essere di 4 tipi, a seconda delle condizioni che lo caratterizzano:

1. **(O R)** : Nell'estrazione di simboli, **l'ordine conta** e **c'è il reinserimento**. Diciamo anche che gli esiti corrispondono a **_"disposizioni con reinserimento"_** di simboli del vocabolario.
2. **(O ~R)**: Nell'estrazione, **l'ordine conta** ma **non c'è reinserimento**. Gli esiti corrispondono a **_"disposizioni senza reinserimento"_** oppure **_"disposizioni semplici"_** di simboli del vocabolario.
3. **(~O ~R)**: Nella nostra estrazione di simboli, **l'ordine non conta** e **non c'è reinserimento**.Gli esiti corrispondono a **_"combinazioni semplici"_** di simboli del vocabolario.
4. **(~O R)**: Facciamo un'estrazione in cui, **l'ordine non conta** e **c'è reinserimento**. Gli esiti corrispondono a **_"combinazioni con reinserimento"_** di simboli del vocabolario.



#### 2.3.3.1 **(O R)**: **_"disposizioni con reinserimento"_**

Quando si estrae i simboli con ripetizione, ogni volta ci sono $ n $ scelte possibili, e il numero totale di *disposizioni* è

$$
D_r(n,k) \coloneqq \underbrace{n \cdot n \cdot \ldots \cdot n}_{k\ \text{termini}} = n^k \tag{2.6}
$$

**Esempio 2.27 (Cracking delle password)**. A partire da un alfabeto composto da 10 cifre, 26 lettere minuscole e 26 lettere maiuscole, si possono creare $  62^8 = 218\,340\,105\,584\,896 $ (oltre 218 trilioni) password diverse di 8 caratteri.

A una velocità di 1 milione di password al secondo, un programma spia impiegherebbe quasi 7 anni per provarle tutte. Pertanto, in media, ci vorranno circa 3,5 anni per indovinare la vostra password.



A questa velocità, il programma spia può testare $ 604\,800\,000\,000 $ password nell'arco di 1 settimana. La probabilità che indovini la vostra password in 1 settimana è

$$
\frac{N_F}{N_T} = \frac{\text{numero di esiti favorevoli}}{\text{numero totale di esiti}} = \frac{604\,800\,000\,000}{218\,340\,105\,584\,896} = 0.00277.
$$

Tuttavia, se non si utilizzano lettere maiuscole, il numero di password possibili si riduce a $ Pr(36, 8) = 36^8 = 2\,821\,109\,907\,456 $. In questo caso, in media, al programma spia occorrono soltanto 16 giorni per indovinare una password! La probabilità che ciò accada entro 1 settimana sale a $ 0.214 $.

Ora appare perfettamente chiaro un consiglio saggio: includere tutti e tre i tipi di caratteri (cifre, lettere minuscole e maiuscole) nelle nostre password e cambiarle una volta all'anno.


#### 2.3.3.2 **(O ~R)**: **_"disposizioni semplici"_**

Nel campionamento senza ripetizione, il numero di scelte possibili diminuisce di 1 ogni volta che un oggetto viene selezionato. Pertanto, il numero di disposizioni semplici di $k$ elementi estratti da un vocabolario di $n$ oggetti è

$$
D(n,k) \coloneqq \underbrace{n(n - 1)(n - 2) \cdot \ldots \cdot (n - k + 1)}_{k\ \text{termini}} = \frac{n!}{(n - k)!} \tag{2.7}
$$

dove $ n! = 1 \cdot 2 \cdot \ldots \cdot n $ (fattoriale di $ n $) denota il prodotto di tutti gli interi da 1 a $ n $.

Il numero di disposizioni senza ripetizione corrisponde anche al numero di possibili assegnazioni di $ k $ oggetti distinguibili in $ n $ posti disponibili.

> **Esempio 2.28**. In quanti modi possono essere fatti sedere 10 studenti in un'aula con 15 sedie tenendo in conto l'identità degli studenti? Tenere in conto l'identità degli studenti vuol dire che non è lo stesso esito quello in cui diversi studenti occupano le stesse sedie. Quindi i fattori di importanza sono le sedie occupate e anche chi le occupa. 

Possiamo visualizzare gli esiti come sequenze ordinate di 10 numeri che vanno dal 1 al 15. L'ordine ci aiuta a tenere conto dell'identità degli studenti, il primo numero sarà sempre quello di Giovanni, il secondo, quello di Sara, e così via...

Dunque, il numero di assegnazioni possibili è pari al numero di disposizioni di $k=10$ elementi, senza ripetizione, da un insieme di $n=15$ simboli del vocabolario: $ D(15,10) = 15 \cdot 14 \cdot \ldots \cdot 6 = 1.09 \times 10^{10} $. Si osservi che se gli studenti entrano in aula uno alla volta, il primo ha 15 scelte possibili, poi un posto viene occupato; il secondo studente ha quindi 14 scelte, e così via, fino all’ultimo studente che troverà solo 6 posti liberi.
♦



> Faciamo attenzione al fatto che, la formula $(2.6)$ vale solo quando ciascuno degli $n$ elementi del vocabolario sono *diversi*". Per ora non facciamo nessun controesempio né diciamo perché è importante questa clausola, ma più avanti verrà fuori tutto questo. Per ora ci basti dare importanza al fatto che queste formule valgono quando gli $n$ oggetti sono, infatti, diversi.


#### Un caso speciale di disposizioni semplici: le Permutazioni

> **Permutazioni**: Quando abbiamo un vocabolarion di $n$ elementi distinti e vogliamo contare quante _disposizioni semplici_ **di lunghezza $k=n$ (cioè quando dobbiamo disporre TUTTI gli elementi del vocabolario**  ci sono, stiamo calcolando le **permutazioni di $n$ elementi**. Si noti che il risultato, applicando la formula (2.6), è proprio $n!$ (perché $0!=1$)

> Numero di permutazioni di n elementi (da un insieme di n elementi): 
$$
D(n,n) = n!
$$

> **Ricorda**: Di solito, quando vogliamo calcolare il numero di ordinamenti possibili di **tutti** gli $n$ elementi di un insieme, parliamo di **permutazioni**. Invece, quando volgiamo calcolare il numero di ordinamenti di un **sottoinsieme** di elementi, come nell'esercizio precedente, parliamo di **disposizioni**.

Non ci confondiamo con le diciture. Parliamo di numero di *disposizioni* perché l'ordine conta. Teniamo in conto che, presi i $k$ elementi, ne rimangono $n-K$. Questo vuol dire che **non stiamo reinserendo gli elementi che prendiamo.** In letteratura, questo modo di contare -cioè senza reinserimento- viene chiamato *semplice*, per questo si parla di numero di *disposizioni semplici*.

> **Ricorda**: Quado parliamo di **disposizioni** di elementi **senza reinserimento **nell'insieme di partenza, parliamo di **disposizioni semplici**.


> **Ricorda**: se devi contare il numero di ordinamenti, cioè se "**l'ordine conta**" allora parliamo di **disposizioni**!!!

#### 2.3.3.3 **(~O ~R)**: **_"combinazioni semplici"_**

Il numero di *combinazioni* invece è diverso dal numero di ordinamenti. Contare il numero di combinazioni equivale a contare il numero di  sottoinsiemi di una certa dimensione che possono essere formati da un insieme più grande, **senza considerare l'ordine degli elementi all'interno di ciascun sottoinsieme.**
Per essere più precisi:

> **Definizione di combinazione:** Una combinazione è una *selezione* di $k$ elementi da un insieme di $n$ elementi, dove l'ordine non importa. Cioè, due combinazioni vengono considerate diverse solo se differiscono per almeno un elemento. Se due combinazioni hanno gli stessi elementi in ordine diverso, vengono comunque considerate la stessa combinazione.

> Si indica comunemente il numero di combinazioni di classe $k$ prese da un insieme di $n$ elementi diversi con:

$  \binom{n}{k} $.

Dove $ n \choose k$ è il "*coefficiente binomiale* $n$ $k$". Più specificamente abbiamo:

> Formula per le combinazioni: Il numero di combinazioni di classe $k$ prese da un insieme di $n$ elementi è dato da:

$$ C(n,k) \coloneqq \frac{n!}{k! \cdot (n-k)!} \tag{2.8} $$

Da dove è uscita questa formula?

Prendiamo tutte le _disposizioni_ (cioè sequenze ordinate) di lunghezza $k$ presi da un insieme di $n$ elementi, che sappiamo essere $D(n,k)=\frac{n!}{(n-k)!}$. Notiamo che ogni _combinazione_ (cioè sequenza non ordinate) di lunghezza $k$ presa da un insieme di $n$ elementi corrisponderà a $k!$ disposizioni diverse delle $D(n,k)$ totali. Ecco perché otteniamo $C(n,k)$ dividendo $D(n,k)$ per $k!$:

$$
C(n,k) \coloneqq \frac{D(n,k)}{k!} = \binom{n}{k} = \frac{n!}{k! \cdot (n-k)!} 
$$ 


Ancora una volta, ripetiamo:

- Differenza tra combinazioni e disposizioni o permutazioni:

Le permutazioni considerano l'ordine (ABC è diverso da CBA). Le combinazioni non considerano l'ordine (ABC è lo stesso di CBA).

- Interpretazione:

Contare le combinazioni equivale a contare in quanti modi possiamo selezionare $k$ oggetti da un gruppo di $n$ oggetti, dove non ci interessa l'ordine in cui vengono selezionati. È come rispondere alla domanda: "In quanti modi diversi posso formare un comitato di $k$ persone da un gruppo di n persone?"


- Connessione con i sottoinsiemi: Ogni combinazione rappresenta un sottoinsieme di $k$ elementi dell'insieme originale di $n$ elementi. Infatti, il numero totale di sottoinsiemi di un insieme di $n$ elementi (inclusi l'insieme vuoto e l'insieme completo) è $2^n$, che è la somma di tutte le possibili combinazioni: $C_{n,0} + C_{n,1} + ... + C_{n,n}$. Puoi dimostrarlo?


> In sintesi, mentre le _permutazioni_ o _disposizioni_ contano tutti i possibili *ordinamenti*, le combinazioni contano i sottoinsiemi senza considerare l'ordine interno. Questo concetto è fondamentale in molte applicazioni, dalla teoria delle probabilità alla statistica, dalla teoria dei giochi alla crittografia.

> **Esempio 2.29**:  Un software antivirus segnala che **3** cartelle su **10** sono infette. Quante possibilità ci sono?

Le cartelle **A**, **B**, **C** e le cartelle **C**, **B**, **A** rappresentano lo stesso **esito**, quindi l’ordine non è importante.  
Il software ha rilevato chiaramente **3** cartelle diverse, perciò si tratta di un **campionamento senza reinserimento**.  

Il numero di possibilità è  

$$
\frac{ \; 10! \; }{ \; 3! \, 7! \; } \;=\; \frac{ \; 10 \cdot 9 \cdot 8 \; }{ \; 3 \cdot 2 \cdot 1 \; } \;=\; 120 .
$$  

In altre parole, nello **spazio campione** ci sono **120** possibili **esiti**.♦

#### Per calcolare più velocemente...

Invece di calcolare direttamente il numero di combinazioni con la formula, possiamo semplificare la frazione.  
Almeno il numeratore e il denominatore possono essere entrambi divisi per \( k! \) oppure per \( (n-k)! \) (scegli il più grande fra i due per una riduzione maggiore).  
Di conseguenza  

$$
\frac{ n! }{ k! \, (n-k)! } \; = \; 
\frac{ n \cdot (n-1) \cdot \dots \cdot (n-k+1) }{ k \cdot (k-1) \cdot \dots \cdot 1 } ,
$$  

dove la parte superiore e quella inferiore di questa frazione sono prodotti di \( k \) termini.  

$$
C(n,k) = C(n,n-k) 
$$  

per qualsiasi \( k \) e \( n \).  

Nota anche che:

$$
C(n,1) = \frac{ n! }{ 1! \, (n-1)! } = n
$$  

$$
C(n,0) = \frac{ n! }{ 0! \, (n)! } = 1
$$  
---

> **Esempio 2.30**: In un negozio ci sono 20 computer. Tra questi, 15 sono nuovi di zecca e 5 sono ricondizionati. Si acquistano 6 computer per un laboratorio studentesco. A prima vista, i computer sono indistinguibili, quindi i sei vengono scelti casualmente. Calcolare la probabilità che, tra i computer scelti, due siano ricondizionati.

Calcoliamo il numero totale di **esiti** e il numero degli **esiti** favorevoli.  

Il numero totale di modi in cui si selezionano 6 computer su 20 è  

$$
C(20,6) = 
\frac{ 20! }{ 6! \, 14! } = 
\frac{ 20 \cdot 19 \cdot 18 \cdot 17 \cdot 16 \cdot 15 }{ 6 \cdot 5 \cdot 4 \cdot 3 \cdot 2 \cdot 1 } .
$$  

Abbiamo applicato la scorciatoia computazionale indicata sopra.  

Per il numero di **esiti** favorevoli, i 2 computer ricondizionati vengono scelti da un totale di 5, e i rimanenti 4 nuovi da un totale di 15. Abbiamo quindi  

$$
\text{NF} = 
C(5,2) \times C(15,4) =
\frac{ 5 \cdot 4 }{ 2 \cdot 1 } \times 
\frac{ 15 \cdot 14 \cdot 13 \cdot 12 }{ 4 \cdot 3 \cdot 2 \cdot 1 } .
$$  

Riducendo ulteriormente le frazioni, la probabilità risulta  

$$
P\{ \text{due computer ricondizionati} \} = 
\frac{ \text{NF} }{ \text{NT} } =
\frac{ 5 \cdot 4 \cdot 15 \cdot 14 \cdot 13 \cdot 12 }{ 
\; 20 \cdot 19 \cdot 18 \cdot 17 \cdot 16 \cdot 15 \;}
= 0.3522 .
$$  

Qui  

- **NT** è il numero totale di **esiti** (cioè \( C(20,6) \)).  
- **NF** è il numero di **esiti** favorevoli.  

Nel **spazio campione** ci sono quindi \( \text{NT}=38760 \) possibili **esiti**, dei quali \( \text{NF}=13608 \) soddisfano la condizione richiesta, dando la probabilità indicata.
♦

#### 2.3.3.4 **(~O R)**: **_"combinazioni con reinserimento"_** di simboli del vocabolario.
__________

Come negli altri casi, per passare da un vocabolario ad uno spazio campione, dobbiamo costruire gli esiti come sequenze di simboli presi da un vocabolario. Ora le condizioni sono:

- La dimensione del vocabolario è $n$.

- Le sequenze devono avere lunghezza \( k \).

- Le sequenze possono avere un simbolo più volte. (reinserimento)

- Sequenze con gli stessi elementi ma ordine diverso sono considerate lo stesso esito. (combinazioni) 

Quindi è come se dovessimo contare quante volte c'è ognuno degli $n$ simboli in una lunghezza di sequenza $k$. Ovviamente un determinato simbolo può comparire 0 volte nella sequenza. (Se $n > k$ allora per forza in ogni sequenza ci saranno dei simboli che compaiono 0 volte!). In ogni caso, a livello concettuale, per ogni simbolo, ci sarà un numero di volte che esso compare nella sequenza. 

Questa mappatura "simbolo -> numero di volte nella sequenza" è quella che costituisce un esito. Se due esiti hanno un numero diverso per almeno un simbolo, allora parliamo di un esito diverso. Ma se ci sono gli stessi conteggi per tutti i simboli, non importa l'ordine in cui i simboli appaiono nella sequenza, l'esito è lo stesso. 

Quante possibili sequenze possiamo fare? Quanti possibili esiti? Quale sarà la dimensione dello spazio campione in questo caso?

Si noti che in questo caso, è come se ci chiedessimo quante possibili soluzioni ha questa equazione:

$$
c_1 + c_2 + \dots + c_n = k
$$

dove $$ c_i \in \mathbb{N}_0 $$

Per capire la risposta, facciamo un disegno.

Supponiamo che abbiamo un vocabolario di $n=10$ simboli e vogliamo sapere quante sequenze di lunghezza $k=9$ si possono formare quando le sequenze ammettono ripetizioni di simboli e quando sequenze con gli stessi simboli ma con ordine diverso sono considerate la stessa sequenza.

Per far ciò creiamo una strategia: nella Figura 2.5 disegniamo tante palline quante sono le occorrenze del primo simbolo, poi tracciamo una barra di separazione, poi ci saranno tante palline quante sono le occorrenze del secondo simbolo nella sequenza, e così via. Due barre consecutive indicano che il simbolo corrispondente non è mai stato estratto per formare l'esito:


![image.png](attachment:image.png)


Nella figura, ci sono 9 palline, cioè la sequenza di simboli con ripetizione deve avere lunghezza $k=9$. 
Il primo simbolo compare 2 volte, il secondo, 1 volta, il terzo, 0 volte, il quarto, 3 volte, il quinto e il sesto, 0 volte, il settimo, 2 volte, l'ottavo, 1 vota, e il nono e il decimo 0 volte. Questo è un'esito specifico.


Più in generale, se le sequenze che vogliamo formare devono essere di lunghezza $k$, allora l’immagine risultante deve contenere \( k \) palline e \( n-1 \) barre che separano i conteggi di ciascuno *degli* \( n \) oggetti del vocabolario.

Ogni immagine che soddisfa queste condizioni rappresenta un **esito**.

Ora chiediamoci, quanti **esiti** esistono? Quante immagini diverse si possono fare seguendo queste indicazioni? _Cioè che l’immagine deve essere una sequenza ordinata di \( k \) palline e \( n-1 \) barre_.

Ricapitoliamo:

- In totale, le immagini saranno fatte di $ k + n -1 $ elementi. ($k$ palline e $n-1$ barre). 

- Le immagini differiscono per l'ordine in cui appaiono gli elementi, ma nelle immagini, le palline e le barre sono identiche, quindi non possiamo usare la formula delle permutazioni di $ k + n -1 $ elementi. Cioè la risposta non è $ (k + n -1 )!$.

Forse il modo più semplice di risolvere questo problema è il seguente:

Immaginiamo di costruire le immagini così: 

a) Abbiamo a disposizione $ k + n -1 $ slot, e scegliamo in quali di questi slot collocheremo le $n -1$ barre. Fine.

Per capire in quanti modi possiamo scegliere le posizioni delle $n-1$ barre, usiamo la formula delle combinazioni semplici, perché le posizioni non si possono ripetete, ovviamente, e perché le palline tra due barre sono indistinguibili (i.e., l'ordine non conta), conta solo il risultato finale. 


Oppure:

b) Abbiamo a disposizione $ k + n -1 $ slot, e scegliamo in quali di questi slot collocheremo le $k$ palline. Fine.

Anche qui, per capire in quanti modi possiamo scegliere le posizioni delle $k$ barre, usiamo la formula delle combinazioni semplici, per le stesse ragioni di prima. 

Le due soluzioni devono essere corrette: una volta scelte le posizioni delle barre, le posizioni delle palline sono anch'esse determinate e, viceversa, se scegliamo le posizioni delle palline, abbiamo automaticamente scelto la posizione delle barre.

La soluzione quindi è 

$$ C_{k+n-1,k} = \binom{\,k+n-1\,}{\,k\,} = \frac{(k+n-1)!}{k!\,(n-1)!}
      \;. \text{Che sappiamo essere uguale a } C_{k+n-1,n-1}=\; \binom{\,k+n-1\,}{\,n-1\,}=\frac{(k+n-1)!}{(n-1)!\,k!}$$

$$
\text{Numero di esiti} \;=\; \binom{\,k+n-1\,}{\,k\,}
      \;=\; \binom{\,k+n-1\,}{\,n-1\,} 
$$


Abbiamo quindi scoperto che il conteggio delle **combinazioni** di $k$ oggetti presi **con reinserimento** da un insieme di $n$ simboli è dato dal coefficiente binomiale $ \binom{k+n-1}{k}$, che conta le possibili disposizioni di palline e barre che costituiscono lo **spazio campione** **dove le palline e le barre sono _indistinguibili_**.


$$ C_r(n,k) \coloneqq \frac{(n+k-1)!}{k! \, (n-1)!} \tag{2.9} $$

_____________

#### Un'osservazione: permutazioni con ripetizioni.

Un altro caso di campionamento di elementi è quello delle permutazioni con ripetizioni, anche dette permutazioni di un multinsieme.

In particolare, si parla di "_permutazioni di un multinsieme di cardinalità $n$ con $j$ tipi di elementi_", o di "_permutazioni di $n$ elementi con $j$ tipi di elementi indistinguibili all’interno di ciascun tipo_" quando si campiona da un insieme di $n$ elementi in cui sono $j$ _tipi_ di elementi, e quando si considera che elementi di uno stesso tipo sono indistinguibili tra di loro (cioè non ci interessa l'ordine relativo tra gli elementi di uno stesso tipo).

Prima infatti si è fatta una considerazione riguardo la (2.6), che era una formula per contare il numero di _disposizioni_ e, potenzialmente, _permutazioni_, dicendo che essa vale solo quando gli elementi del vocabolario sono tutti diversi... 

Alla luce del ragionamento precedente, fatto attraverso un disegno con palline e barre, possiamo pensare ad una generalizzazione della formula delle _combinazioni con reinserimento_ (2.9).

Abbiamo codificato la soluzione alla domanda sulle _combinazioni_ in termini di di sequenze ordinate o _disposizioni_ di un numero di palline tra loro indistinguibili e un numero di barre tra loro indistinguibili! E come se avessimo un vocabolario dove ci sono dei simboli ripetuti o, in altre parole, simboli ragruppati in "tipi" o "classi"!

Si noti che abbiamo dimostrato che il numero di permutazioni di $n+k-1$ elementi dove ci sono 2 tipi di elementi indistinguibili (palline e barre), $k$ di un tipo e $n-1$ di un altro tipo, è pari a $\frac{(n+k-1)!}{k! \, (n-1)!}$.

Si dimostra anche che il numero di permutazioni di $n$ elementi, quando tra questi ci sono $j$ tipi diversi di elementi indistinguibili, ciasuno fatto da $k_j$ elementi, è pari a:

$$ 
\frac{n!}{\underbrace{k_1!\, k_2!\, ...\, k_j!}_{j \text{  tipi diversi}}} \tag{2.9}
$$

Vediamo come.

Immaginiamo una sequenza ipotetica di $n$ elementi dove ciascun elemento è di un tipo specifico (palline, barre, triangoli, ecc.). Per disporre gli elementi in sequenza, inizialmente avremo $n$ posti liberi, e vogliamo assegnare un posto a tutti e ciascuno degli $n$ elementi, sapendo che abbiamo una certa quantità di elementi di ciascun tipo  ($k_1,\dots,k_j$).

Un algoritmo potrebbe essere il seguente:

1. **Scegli le posizioni degli oggetti di tipo 1.**
   E notiamo che ci sono $\binom{n}{k_1}$ modi di scegliere quali $k_1$ dei $n$ posti saranno occupati da oggetti di tipo 1.

2. **Scegli le posizioni degli oggetti di tipo 2** fra i rimanenti $n-k_1$ posti.
   Ci rimarranno solo $n-k_1$ posti liberi, quindi avremo $\binom{n-k_1}{k_2}$ modi per farlo.

3. Continua così per ogni tipo: per il tipo $i$ ci sono $\binom{n-\sum_{r< i}k_r}{k_i}$ modi per assegnare i posti agli elementi di ciascun tipo in sequenza.

Moltiplicando tutte queste scelte otteniamo il numero totale di disposizioni:

$$
\binom{n}{k_1}\binom{n-k_1}{k_2}\binom{n-k_1-k_2}{k_3}\cdots\binom{k_j}{k_j}.
$$

Semplificando il prodotto di binomiali (sviluppandoli in fattoriali) si ricava:

$$
\frac{n!}{k_1!(n-k_1)!}\cdot\frac{(n-k_1)!}{k_2!(n-k_1-k_2)!}\cdots\frac{k_j!}{k_j!}
=\frac{n!}{k_1!k_2!\cdots k_j!}.
$$


Che coincide con la (2.9).

In altre parole, se  considerassimo gli $n$ oggetti **distinguibili** (etichettati), il numero di permutazioni sarebbe $n!$. Ma se per ogni tipo $i$ gli $k_i$ oggetti sono indistinguibili, allora ogni "permutazione non-etichettata" o permutazioni in cui gli elementi di uno stesso tipo sono considerati indistinguibili, corrisponderebbe a $k_1!k_2!\cdots k_j!$ permutazioni etichettate diverse. Quindi per sapere quale è il numero di permutazioni non-etichettate, bisogna dividere $n!$ per questo fattore di sovraconti:

$$
\text{permutazioni distinte con elementi indistinguibili} =\frac{n!}{k_1!k_2!\cdots k_j!}.
$$


> Nota: per delle spiegazioni più "passo passo", visita, per esempio, [questa blog entry di YouMath](https://www.youmath.it/lezioni/probabilita/calcolo-combinatorio.html)

> Esempio Bonus 1: Si estrae una mano di sette carte da un mazzo di carte standard correttamente mescolato (cioè ogni carta ha la stessa probabilità di essere scelta). Con quale probabilità vengono estratte le carte 2,3,4,...,8 di cuori (in quell'ordine)?

*Soluzione* Useremo le permutazioni per risolvere questo esericizio! 

Esistono $52!$ ordinamenti diversi di un mazzo di carte opportunamente mescolato. Noi ne dobbiamo estrarre solo 7 carte, ma se supponessimo di dover estrarle tutte, questo sarebbe il numero totale degli esiti possibili (cioè la cardinalità dello spazio campione di questo nuovo esperimento ipotetico).

Ora, in questo esperimento ipotetico peculiare, il numero di esiti che appartengono all'evento in questione ("_vengono estratte le carte 2,3,4,...,8 di cuori in quell'ordine_") si ottiene contando tutte le sequenze di carte che iniziano con la sequenza 2,3,4,...,7,8 di cuori e in quell'ordine.

Ci sono quindi $45!$ esiti nell'evento, perché è possibile estrarre le 45 carte rimanenti in modo arbitrario. Ciò significa che la
probabilità è:

$$ \frac{45!}{52!}$$

Nell'esempio precedente, reinserire le carte ogni volta e miscolare il mazzo di carte porterebbe ad un altra probabilità. Cioè se facciamo sette estrazioni con reinserimento, ad ogni estrazione abbiamo sempre 52 esiti diversi, il che vuol dire che gli esiti possibili per la sequenza di 7 estazioni con reinserimento è $52^7$. Di queste, quante corrispondono alla sequenza 2,3,4,5,6,7,8 di cuori in quell'ordine? Una. Quindi la probabilità è $\frac{1}{52^7}$. Si poteva arrivare a questa risposta anche sapendo che la probabiiltà di estrarre una certa carta dal mazzo è sempre $\frac{1}{52}$ quando c'è reinserimento, per qualsiasi carta, e sapendo che ogni estrazione è un evento indipendente dalle altre estrazioni, ma ne parleremo più avanti nel corso... 

______________________________

> A volte, manipolando un po' lo spazio dei risultati, è possibile calcolare facilmente ciò che si desidera:

> **Esempio Bonus 2**: Una coppia decide di avere figli. Decidono di avere figli finché non nasce la prima bambina, o finché non nascono tre figli, e poi di fermarsi. Supponiamo che ogni nascita dia luogo a un solo bimbo e che i maschi e le femmine abbiano la stessa probabilità di nascere. Sia $\mathcal{B}_i$ l'evento in cui ci sono $i$ maschi e $\mathcal{C}$ l'evento in cui ci sono più femmine che maschi. Calcolare $P(\mathcal{B}_1)$ e $P(\mathcal{C})$


*Soluzione*.  In questo caso, potremmo scrivere gli esiti possibili come $\Omega = \{G; BG; BBG\}$, ma se li consideriamo in questo modo, non abbiamo un modo semplice per calcolare la loro probabilità!

Potremmo invece utilizzare lo spazio campionario della risposta precedente (e cioè quello fatto da 8 possibili combinazioni), ma ipotizzare *che alcune delle nascite successive siano fittizie.* In questo modo si ottiene un insieme naturale di eventi per i quali è facile calcolare le probabilità. (Ogni una delle 8 combinazioni ha la stessa probabilità).

Avere una bambina corrisponderebbe all'evento $\{Gbb; Gbg; Ggb; Ggg\}$, dove abbiamo usato lettere minuscole per scrivere le nascite successive fittizie. Dato che sono 4 possibili combinazioni su 8 che generano questa casistica, la probabilità è $\frac12$. Avere un maschio e poi una femmina corrisponderebbe all'evento $\{BGb; BGgg\}$ (e quindi ha probabilità $\frac14$). Avere due maschi e poi una femmina corrisponderebbe all'evento $\{BBG\}$ (e quindi ha probabilità $\frac18$).
Infine, avere tre maschi corrisponde all'evento $\{BBB\}$ (e quindi ha probabilità $\frac18$). Ciò significa che $P(\mathcal{B}_1) = \frac14$ e $P(\mathcal{C})=\frac12$.

-------------------------------------
> **Esempio bonus 3:** Una coppia decide di avere dei figli. Decidono semplicemente di avere tre figli. Si supponga che si verifichino tre nascite, che da ogni nascita nasca un bambino unicamente, e che i maschi e le femmine abbiano la stessa probabilità ad ogni nascita. Sia $\mathcal{B}_i$ è l'evento in cui ci sono $i$ bambini e $\mathcal{C}$ è l'evento in cui ci sono più bambine che bambini. Calcolare $P(\mathcal{B}_1)$ e $P(\mathcal{C})$.

*Soluzione*

Ci sono otto esiti. Ognuno di essi ha la stessa probabilità. Tre di essi hanno un solo ragazzo, quindi $P(\mathcal{B}_1)=\frac38$, mentre quattro di questi esiti hanno più ragazze che ragazzi, quindi $P(\mathcal{C})=\frac12$.

Vedremo più avanti nel corso che esiste un _Procedimento matematico_ per calcolare queste probabilità.

Impareremo a modellare questi fenomeni tramite _variabili aleatorie_, che non sono altro che degli oggetti che rappresentano gli esiti di un esperimento, ma che tornano molto utili quando gli esiti non sono equiprobabili.

Una variabile aleatoria definisce quindi una _distribuzione di probabilità_ particolare sugli esiti dello spazio campione, essendo questa distribuzione comunemente formalizzata dentro una famiglia di funzioni. Capiremo tutto questo in dettaglio più avanti, per ora ci basti sapere che questo esercizio, per esempio, si poteva risolvere con una _distribuzione Binomiale_, che si usa per assegnare delle probabilità agli esiti di una successione di esperimenti che prevedono due soli esiti ad ogni iterazioni, chiamati _successo_ e _insuccesso_ in letteratura, quando le probabilità di questi eventi sono fisse nel tempo. (Questo tipo di successioni di esperimenti si chiama processo di Bernoulli, lo vedremo più avanti.)

Con questa breve introduzione, possiamo leggere, se siamo curiosi e impazienti, come si sarebbe potuto risolvere l'esercizio usando la v.a. Binomiale.

Possiamo procedere tramite *processo di Bernoulli*. Andiamo a considerare la probabilità di successo $p$ e la probabilità di fallimento $1-p$. Andiamo a considerare come fallimento $1-p$, la nascita di un maschio $M$, e come successo $p$, la nascita di una femmina $F$. Essendo il numero massimo di nascite 3, $F$ $\ge$ $M$ solo se $F$ = 2 oppure 3 (solo femmine).
A questo punto, è facile andare a calcolare la probabilità di avere più femmine che maschi.

$$
p(F) = p(F=2) + p(F=3) = \binom{3}{2} \cdot \Big(\frac{1}{2}\Big)^2 \cdot \Big(1-\frac{1}{2}\Big)^{3-2} + \binom{3}{2} \cdot \Big(\frac{1}{2}\Big)^3 \cdot \Big(1-\frac{1}{2}\Big)^{3-3} = 3 \cdot \frac{1}{8} + 1 \cdot \frac{1}{8} = \frac{1}{2}
$$

La formula matematica di base che abbiamo usato è la seguente, e corrisponde alla distribuzione Binomiale:

$$
P(F=k) = \binom{n}{k} \cdot p^k \cdot (1-p)^{n-k}
$$

Dove $p$ è la probabilità dell'evento. Nel nostro caso, $\frac{1}{2}$ in quanto abbiamo 0.5 probabilità di ottenere maschio o femmina. $k$ indica l'esito desiderato, nel nostro caso ($k$ = 2, 2 femmine). E $n$ corrisponde al numero totale di iterazioni effettuate, nel nostro caso 3 (il numero di figli che la coppia decide di avere).

Seguendo lo stesso ragionamento, possiamo calcolare la probabilità di ottenere un solo figlio maschio:

$$
p(M) = \binom{3}{1} \cdot \Big(\frac{1}{2}\Big)^1 \cdot \Big(1-\frac{1}{2}\Big)^2 = 3 \cdot \frac{1}{8} = \frac{3}{8}
$$
---------------------------