# T1.1 Razonamiento probabilístico: representación e inferencia


# Índice

1. El problema de la calificación
2. Representación probabilística
3. Inferencia probabilística
4. Independencia
5. Teorema de Bayes

# 1 El problema de la calificación

**Problema de la calificación:** $\;$ imposibilidad práctica de conocer y comprobar todas las **calificaciones** (condiciones) que habría que garantizar para asegurar el cumplimiento de una acción
* Ejemplo: $\;$ salir al aeropuerto 90 minutos antes del vuelo me permite llegar a tiempo SI no hay atascos Y no hay pinchazos Y ...
* Ejemplo: $\;$ un bote nos permite cruzar un río SI es un bote de remo Y tiene remos y escálamos Y no están rotos Y encajan Y ...

**Incertidumbre:** $\;$ los sistemas inteligentes actuales incluyen la **incertidumbre** como parte del conocimiento y la representan mediante **probabilidades** asociadas a los sucesos (proposiciones) de interés

# 2 Representación probabilística

<div><table border-collapse: collapse><tr>
<td style="border: none; text-align:left; vertical-align:top; padding:0; margin:0;" width=500>

**Distribución de probabilidad conjunta:** $\;$ de las variables aleatorias de interés para representar el conocimiento probabilístico

**Ejemplo del dentista:** $\;$ conocimiento para diagnosticar caries

*Variables aleatorias de interés:*

\begin{align*}
&\text{Dolor:} & D&\in\{0,1\}\\
&\text{Caries:}& C&\in\{0,1\}\\
&\text{Hueco:} & H&\in\{0,1\}
\end{align*}

*Representación:* $\;$ tabla a la derecha con
$$P(D=d, C=c, H=h)\quad\text{para todo}\;d, c, h\in\{0,1\}$$

</td><td style="border: none; text-align:center; vertical-align:top; padding:0; margin:0;" width=400>

<center>

|$d$|$c$|$b$|$P$|
|:-:|:-:|:-:|:-:|
|$0$|$0$|$0$|$0.576$|
|$0$|$0$|$1$|$0.008$|
|$0$|$1$|$0$|$0.144$|
|$0$|$1$|$1$|$0.072$|
|$1$|$0$|$0$|$0.064$|
|$1$|$0$|$1$|$0.012$|
|$1$|$1$|$0$|$0.016$|
|$1$|$1$|$1$|$0.108$|
||||$1.000$|

</center>

</td></tr></table></div>






In [1]:
import numpy as np
T = np.array([[0,0,0,.576], [0,0,1,.008], [0,1,0,.144], [0,1,1,.072], 
              [1,0,0,.064], [1,0,1,.012], [1,1,0,.016], [1,1,1,.108]])
T

array([[0.   , 0.   , 0.   , 0.576],
       [0.   , 0.   , 1.   , 0.008],
       [0.   , 1.   , 0.   , 0.144],
       [0.   , 1.   , 1.   , 0.072],
       [1.   , 0.   , 0.   , 0.064],
       [1.   , 0.   , 1.   , 0.012],
       [1.   , 1.   , 0.   , 0.016],
       [1.   , 1.   , 1.   , 0.108]])

# 3 Inferencia probabilística

**Reglas suma y producto:** $\;$ reglas básicas para calcular la probabilidad de cualquier **suceso** (**proposición**)
de interés a partir de la distribución conjunta
$$P(x) = \sum_y P(x,y)\qquad\text{y}\qquad P(x,y) = P(x)\,P(y\mid x)$$

**Observación importante:** $\;$ en general no es necesario conocer la tabla completa de probabilidades conjuntas para calcular la probabilidad de un suceso dado mediante las reglas suma y producto

**Ejemplo del dentista:** $\;$ cálculo de la probabilidad de observar...
* Caries y hueco (a la vez): $\displaystyle\;P(c=1,h=1) = \sum_{d=0,1} P(d,c=1,h=1) = 0.180$
* Hueco: $\displaystyle\;P(h=1) = \sum_{d=0,1} \sum_{c=0,1} P(d,c,h=1) = 0.200$
* Caries después de observar hueco: $\displaystyle\;P(c=1\mid h=1) = \frac{P(c=1,h=1)}{P(h=1)} = \frac{0.180}{0.200} = 0.900$

In [2]:
Pc1b1 = np.sum(T[(T[:,1]==1) & (T[:,2]==1),-1])
Pb1 = np.sum(T[T[:,2]==1,-1])
Pc1Db1 = Pc1b1/Pb1
print(f"Pc1b1 = {Pc1b1:.3f}  Pb1 = {Pb1:.3f}  Pc1Db1 = {Pc1Db1:.3f}")

Pc1b1 = 0.180  Pb1 = 0.200  Pc1Db1 = 0.900


# 4 Independencia

**Variables independientes:** $\;$ dos variables $\,x\,$ y $\,y\,$ son **independientes** si
$$P(x,y) = P(x)\,P(y) \quad\text{o}\quad P(x\mid y) = P(x) \quad\text{o}\quad P(y\mid x) = P(y)$$

**Conocimiento experto:** $\;$ la independencia puede establecerse por conocimiento experto y conveniencia

**Ejemplo del dentista:**
* Consideramos una nueva variable con el tiempo que hace cuando el paciente visita el dentista
$$T\in\{\text{sol}, \text{nubes}, \text{lluvia}, \text{nieve}\}$$
* Asumimos que las tres variables que ya teníamos son independientes del tiempo que hace
$$P(d,c,h,t)=P(t)\,P(d,c,h\mid t)=P(t)\,P(d,c,h)$$
* Así reducimos el número de probabilidades a almacenar: $\;32\,$ vs $\,4+8$

# 5 Teorema de Bayes

**Teorema de Bayes:** $\;$ permite actualizar nuestro conocimiento sobre una hipótesis $y$ después de observar una nueva evidencia $x$
$$P(y\mid x) ~=~ \frac{P(x,y)}{P(x)} ~=~ P(y)\,\frac{P(x\mid y)}{P(x)}$$
* De otra manera: $P(y\mid x)$ es la probabilidad de que se produzca el efecto $y$ después de observar que se ha producido la causa $x$

**Ejemplo del dentista:** $\;$
* Sabemos que la probabilidad de caries es: $\,P(c=1)=0.34$
* Sabemos que la probabilidad de dolor es: $\,P(d=1)=0.20$
* Sabemos que la probabilidad de dolor después de observar caries es: $\,P(d=1\mid c=1)=0.36$
* ¿Cúal es la probabilidad de caries después de observar dolor, $\,P(c=1\mid d=1)$?
$$P(c=1\mid d=1) = P(c=1)\,\frac{P(d=1\mid c=1)}{P(d=1)} = 0.34\,\frac{0.36}{0.20} = 0.61$$

In [3]:
Pc1 = 0.34; Pd1 = 0.20; Pd1c1 = 0.36; Pc1Dd1 = Pc1 * Pd1c1 / Pb1; print(f"Pc1Dd1 = {Pc1Dd1:.2f}")

Pc1Dd1 = 0.61
