# T1.1 Raonament probabilístic: representació i inferència


# Índex

1. El problema de la qualificació
2. Representació probabilística
3. Inferència probabilística
4. Independència
5. Teorema de Bayes

# 1 El problema de la qualificació

**Problema de la qualificació:** $\;$ impossibilitat pràctica de conèixer i comprovar totes les **qualificacions** (condicions) que caldria garantir per tal d'assegurar el compliment d'una acció
* Exemple: $\;$ eixir a l'aeroport 90 minuts abans del vol em permet arribar a temps SI no hi ha embossos I no hi ha punxades I ...
* Exemple: $\;$ un bot ens permet creuar un riu SI és un bot de rem I té rems i escàlems I no estan trencats I encaixen I ...

**Incertesa:** $\;$ els sistemes intel·ligents actuals inclouen la **incertesa** com a part del coneixement i la representen mitjançant **probabilitats** associades als successos (proposicions) d'interés

# 2 Representació probabilística

<div><table border-collapse: collapse><tr>
<td style="border: none; text-align:left; vertical-align:top; padding:0; margin:0;" width=500>

**Distribució de probabilitat conjunta:** $\;$ de les variables aleatòries d'interès per tal de representar el coneixement probabilístic

**Exemple del dentista:** $\;$ coneixement per a diagnosticar càries 

*Variables aleatòries d'interès:*

\begin{align*}
&\text{Dolor:} & D&\in\{0,1\}\\
&\text{Càries:}& C&\in\{0,1\}\\
&\text{Buit:}  & B&\in\{0,1\}  
\end{align*}

*Representació:* $\;$ taula a la dreta amb
$$P(D=d, C=c, B=b)\quad\text{per a tot}\;d, c, b\in\{0,1\}$$

</td><td style="border: none; text-align:center; vertical-align:top; padding:0; margin:0;" width=400>

<center>

|$d$|$c$|$b$|$P$|
|:-:|:-:|:-:|:-:|
|$0$|$0$|$0$|$0.576$|
|$0$|$0$|$1$|$0.008$|
|$0$|$1$|$0$|$0.144$|
|$0$|$1$|$1$|$0.072$|
|$1$|$0$|$0$|$0.064$|
|$1$|$0$|$1$|$0.012$|
|$1$|$1$|$0$|$0.016$|
|$1$|$1$|$1$|$0.108$|
||||$1.000$|

</center>

</td></tr></table></div>






In [1]:
import numpy as np
T = np.array([[0,0,0,.576], [0,0,1,.008], [0,1,0,.144], [0,1,1,.072], 
              [1,0,0,.064], [1,0,1,.012], [1,1,0,.016], [1,1,1,.108]])
T

array([[0.   , 0.   , 0.   , 0.576],
       [0.   , 0.   , 1.   , 0.008],
       [0.   , 1.   , 0.   , 0.144],
       [0.   , 1.   , 1.   , 0.072],
       [1.   , 0.   , 0.   , 0.064],
       [1.   , 0.   , 1.   , 0.012],
       [1.   , 1.   , 0.   , 0.016],
       [1.   , 1.   , 1.   , 0.108]])

# 3 Inferència probabilística

**Regles suma i producte:** $\;$ regles bàsiques per a calcular la probabilitat de qualsevol **succés** (**proposició**) 
d'interés a partir de la distribució conjunta 
$$P(x) = \sum_y P(x,y)\qquad\text{i}\qquad P(x,y) = P(x)\,P(y\mid x)$$

**Observació important:** $\;$ en general no és necessari conèixer la taula completa de probabilitats conjuntes per a calcular la probabilitat d'un succés donat mitjançant les regles suma i producte

**Exemple del dentista:** $\;$ càlcul de la probabilitat d'observar...
* Càries i buit (alhora): $\displaystyle\;P(c=1,b=1) = \sum_{d=0,1} P(d,c=1,b=1) = 0.180$
* Buit: $\displaystyle\;P(b=1) = \sum_{d=0,1} \sum_{c=0,1} P(d,c,b=1) = 0.200$
* Càries després d'observar buit: $\displaystyle\;P(c=1\mid b=1) = \frac{P(c=1,b=1)}{P(b=1)} = \frac{0.180}{0.200} = 0.900$

In [2]:
Pc1b1 = np.sum(T[(T[:,1]==1) & (T[:,2]==1),-1])
Pb1 = np.sum(T[T[:,2]==1,-1])
Pc1Db1 = Pc1b1/Pb1
print(f"Pc1b1 = {Pc1b1:.3f}  Pb1 = {Pb1:.3f}  Pc1Db1 = {Pc1Db1:.3f}")

Pc1b1 = 0.180  Pb1 = 0.200  Pc1Db1 = 0.900


# 4 Independència

**Variables independents:** $\;$ dues variables $\,x\,$ i $\,y\,$ són **independents** si
$$P(x,y) = P(x)\,P(y) \quad\text{o}\quad P(x\mid y) = P(x) \quad\text{o}\quad P(y\mid x) = P(y)$$

**Coneixement expert:** $\;$ la independència pot establir-se per coneixement expert i conveniència

**Exemple del dentista:**
* Considerem una nova variable amb el temps que fa quan el pacient visita el dentista
$$T\in\{\text{sol}, \text{núvols}, \text{pluja}, \text{neu}\}$$
* Assumim que les tres variables que ja teníem són independents del temps que fa
$$P(d,c,b,t)=P(t)\,P(d,c,b\mid t)=P(t)\,P(d,c,b)$$
* Així reduïm el nombre de probabilitats a emmagatzemar: $\;32\,$ vs $\,4+8$

# 5 Teorema de Bayes

**Teorema de Bayes:** $\;$ permet actualitzar el nostre coneixement sobre una hipòtesi $y$ després d'observar una nova evidència $x$
$$P(y\mid x) ~=~ \frac{P(x,y)}{P(x)} ~=~ P(y)\,\frac{P(x\mid y)}{P(x)}$$
* D'altra manera: $P(y\mid x)$ és la probabilitat de que es produïsca l'efecte $y$ després d'observar que s'ha produït la causa $x$

**Exemple del dentista:** $\;$
* Sabem que la probabilitat de càries és: $\,P(c=1)=0.34$
* Sabem que la probabilitat de dolor és: $\,P(d=1)=0.20$
* Sabem que la probabilitat de dolor després d'observar càries és: $\,P(d=1\mid c=1)=0.36$
* Quina és la probabilitat de càries després d'observar dolor, $\,P(c=1\mid d=1)$?
$$P(c=1\mid d=1) = P(c=1)\,\frac{P(d=1\mid c=1)}{P(d=1)} = 0.34\,\frac{0.36}{0.20} = 0.61$$

In [3]:
Pc1 = 0.34; Pd1 = 0.20; Pd1c1 = 0.36; Pc1Dd1 = Pc1 * Pd1c1 / Pb1; print(f"Pc1Dd1 = {Pc1Dd1:.2f}")

Pc1Dd1 = 0.61
