In [1]:
# RUN THIS CELL: it loads some style files
from IPython.core.display import HTML, display, Math
with open( './style/custom.css', 'r' ) as f: html_style = f.read()
HTML( html_style )

# Modello di Hardy-Weinberg

Assumiamo 

*   specie dipoide
*   accoppiamento casuale (random mating) nessuna selezione
*   le generazioni non si sovrapongono (esempio: piante annuali)

In un locus possono occorrere due alleli $a$, $b$. 

Alla generazione $0$-esima la popolazione è composta da individui con genotipo $aa$, $bb$ e $ab$ nelle proporzioni 

$\quad p_{aa}$ 

$\quad p_{bb}$

$\quad p_{ab}=1-p_{aa}-p_{bb}\quad $ (perché la somma deve dare $1$)

**Problema.** Quali saranno le proporzioni alla prima generazione?

Le probabilità alla generazione $1$ le denotialmo con $q_{aa}$, $q_{bb}$, e $q_{ab}$.


Per cominciare, calcoliamo $q_{aa}$. 

Denotiamo con $aa$ l'evento: *alla prima generazione il genotipo è $aa$*. Analgamente per gli altri genotipi. Denotiamo con $aa.ab$ l'evento: *i genitori hanno genotipo $aa$ e $ab$*. Analgamente per le altre coppe di genotipi. Osserviamo che 

$\quad \Pr\,(\,aa\, |\, aa.bb\,)\ =\ 0$

$\quad \Pr\,(\,aa\, |\, ab.bb\,)\ =\ 0$

$\quad \Pr\,(\,aa\, |\, bb.bb\,)\ =\ 0$

Usiamo il Teorema delle Probabilità Totali per calcolare  $q_{aa}$. 

Omettendo i temini nulli otteniamo

$\begin{array}{lclclcl}
q_{aa}&=&p_{aa}^2\, \Pr(aa | aa.aa) &+& 2\,p_{aa}p_{ab}\, \Pr(aa | aa.ab) &+& p^2_{ab}\, \Pr(aa | ab.ab)\\[1ex]
      &=&p_{aa}^2\, \cdot 1 &+& 2\,p_{aa}p_{ab}\, \cdot \dfrac12 &+& p^2_{ab}\, \cdot\dfrac14\\[1ex]
      &=&p_{aa}^2 &+& p_{aa}p_{ab} &+& \dfrac{p^2_{ab}}4\\
\end{array}$

per simmetria tra $a$ e $b$ otteniamo anche


$\begin{array}{lclclcl}
q_{bb}&=&p_{bb}^2 &+& p_{bb}p_{ab} &+& \dfrac{p^2_{ab}}4\\
\end{array}$


# Esempio numerico 1

In [2]:
p_aa = 0.2
p_ab = 0.3
p_bb = 0.5
q_aa = p_aa**2 + p_aa*p_ab + (p_ab**2)/4
q_bb = p_bb**2 + p_bb*p_ab + (p_ab**2)/4
display(Math(r'q_{{aa}}={}\\ q_{{bb}}={}'.format(round(q_aa,4),round(q_bb,4))))

<IPython.core.display.Math object>

# Esempio numerico 2

In [3]:
p_aa = 0.3
p_ab = 0.1
p_bb = 0.6
q_aa = p_aa**2 + p_aa*p_ab + (p_ab**2)/4
q_bb = p_bb**2 + p_bb*p_ab + (p_ab**2)/4
display(Math(r'q_{{aa}}={}\\ q_{{bb}}={}'.format(round(q_aa,4),round(q_bb,4))))

<IPython.core.display.Math object>

N.B. Questi esempi numerici partono da dati diversi ma ottengono lo stesso risultato!

#  Equilibrio di Hardy-Weinberg 

Mostriamo ora che $q_{aa}$, $q_{bb}$, e $q_{ab}$ dipendono solo dalla frequenza degli alleli $a$ e $b$ nella popolazione. Se $n$ è il numero di individui, $2n$ è il numero totale di loci. Definiamo

$p_a\quad=\quad\dfrac{{\rm Occorrenze\ di\ }a{\rm\ nella\ popolazione\ alla\ generazione\ }0}{2n}$

Possiamo calcolare $p_a$:

$p_a\quad=\quad\dfrac{ n\cdot \big(p_{aa}\cdot 2 + p_{ab}\cdot 1 + p_{bb}\cdot 0\big)}{2n}$


$p_a\quad=\quad p_{aa}+\dfrac{p_{ab}}{2}$

La frazione $p_b$ è definita in modo simile. Per simmetria dalla formula precedente otteniamo

$p_b=p_{bb}+\dfrac{p_{ab}}{2}$

Possiamo verificare che $p_a+p_b=1$ (come dev'essere).

Una semplice sostituzione permette di verificare che

$q_{aa}=p_a^2$ 

$q_{bb}= p_b^2$

$q_{ab} = 2p_ap_b$.

Quindi la prima conclusione è:

<div class="warn">Le frazioni dei genotipi alla generazione $1$ dipende solamente dalla frazioni dei due alleli $p_a$ e $p_b$ alla generazione $0$-esima (non dalla frazione dei genotipi $p_{aa}$, $p_{bb}$, e $p_{ab}$).</div>

Una seconda osservazione è che se calcoliamo 

$q_a\quad=\quad\dfrac{{\rm Occorrenze\ di\ }a{\rm\ nella\ popolazione\ alla\ generazione\ }1}{2n}$

usando lo stesso procedimento usato sopra otteniamo

$q_a\quad=\quad q_{aa}+\dfrac{q_{ab}}{2}\quad=\quad p_a^2+\dfrac{2\,p_ap_b}{2}\quad=\quad p_a^2+ p_a(1-p_a) \quad=\quad p_a$


Quindi la seconda conclusione è:

<div class="warn">La frequenza relativa dei due alleli rimane costante di generazione in generazione.</div>



# Problema

Supponiamo che gli individui con genotipo $aa$ siano sterili (se uno dei due genitori è di tipo $aa$, la coppia non ha figli). 

1.   Date le distribuzioni alla generazione $0$-esima $p_{aa}$, $p_{bb}$, e $p_{ab}=1-p_{aa}-p_{bb}$, come si calcolano le distribuzioni dei genotipi alla prima generazione  $q_{aa}$, $q_{bb}$, e $q_{ab}$?

2.   La risposta in 1 dipende solo dalla frequenza relativa dei due alleli $a$ e $b$?

3.   La frequenza relativa dei due alleli $a$ e $b$ rimane costante di generazione in generazione?