# Introduzione

La _prevalenza_ di una malattia infettiva corrisponde alla percentuale di popolazione affetta ovvero alla probabilità che un individuo di tale popolazione scelto a caso sia affetto dalla malattia <cite data-cite="porta2014dictionary"></cite>.

Dal punto di vista bayesiano la prevalenza corrisponde alla probabilità **a priori** $P(M)$ di essere malato. La probabilità dunque **a priori** di non essere affetto dalla malattia $P(\overline{M})$ sarà pari a $1 - P(M)$.

Durante un'epidemia la prevalenza, per ovvi motivi, si modifica: una percentuale nettamente superiore di popolazione è affetta dalla malattia ovvero la probabilità di essere malati aumenta.

Un test diagnostico qualitativo (come il tampone naso-faringeo) ha due possibilità di esito: positivo $\oplus$ oppure negativo $\ominus$.

La probabilità di ottenere un test positivo per un individuo malato rappresenta la _sensibilità_ del test <cite data-cite="porta2014dictionary"></cite>

\begin{equation}\label{eq:sens}
P(\oplus | M) = \textrm{sensibilità}
\end{equation}

la situazione ideale sarebbe quindi $P(\oplus|M)=1$ ovvero ottenere 100% di test positivi su tutti i malati.

La probabilità di ottenere un test negativo per un individuo sano (non affetto dalla malattia in questione) rappresenta invece la _specificità_ del test <cite data-cite="porta2014dictionary"></cite>

\begin{equation}\label{eq:spec}
P(\ominus | \overline{M}) = \textrm{specificità}
\end{equation}

la situazione ideale sarebbe quindi $P(\ominus|\overline{M})=1$ ovvero ottenere 100% di test negativi su tutti i sani.

Prevalenza, sensibilità e specificità influiscono sulla probabilità **a posteriori** di essere malato o sano in seguito a risultato positivo o negativo del test.

# Test e Teorema di Bayes

Il teorema di Bayes $\eqref{eq:bayes}$ ci spiega il motivo e ci indica come calcolare queste probabilità.

\begin{equation}\label{eq:bayes}
P(A|B) = \frac{P(B|A)P(A)}{P(B)}
\end{equation}

dove $P(B)$ può essere calcolato come

\begin{equation}\label{eq:denom}
P(B) = P(B|A)P(A) + P(B|\overline{A})P(\overline{A})
\end{equation}

Applichiamo il teorema di Bayes per calcolare la probabilità di essere malato in seguito a risultato positivo di un test diagnostico:

\begin{equation}\label{eq:Pmp}
P(M|\oplus) = \frac{P(\oplus|M)P(M)}{P(\oplus)}
\end{equation}

Al numeratore conosciamo tutti i termini: il primo è la sensibilità $\eqref{eq:sens}$ e il secondo, se dell'individuo non si sa nulla ed è scelto a caso, è la prevalenza (anche nel corso di un'epidemia). Al denominatore invece troviamo la probabilità a priori di avere un test positivo, che non conosciamo direttamente, ma possiamo calcolare grazie alla $\eqref{eq:denom}$.

\begin{equation}\label{eq:Pp}
P(\oplus) = P(\oplus|M)P(M) + P(\oplus|\overline{M})P(\overline{M})
\end{equation}

dove $P(\oplus|\overline{M})$ ovvero la probabilità di avere un test positivo su individuo sano è $P(\oplus|\overline{M}) = 1 - P(\ominus|\overline{M})$ e, come già sappiamo, $P(\overline{M}) = 1 - P(M)$. Dunque la $\eqref{eq:Pmp}$ diventa:

\begin{equation}\label{eq:Pmp2}
P(M|\oplus) = \frac{P(\oplus|M)P(M)}{P(\oplus|M)P(M) + (1 - P(\ominus|\overline{M}))(1 - P(M))}
\end{equation}

ovvero

\begin{equation}\label{eq:Pmp3}
P(M|\oplus) = \frac{
\textrm{sensibilità} \cdot \textrm{prevalenza} }{
\textrm{sensibilità} \cdot \textrm{prevalenza} + (1 - \textrm{specificità}) \cdot (1 - \textrm{prevalenza})
}
\end{equation}

Applicando invece il teorema di Bayes per calcolare la probabilità di non essere malato in seguito ad un test negativo otteniamo

\begin{equation}\label{eq:Psn}
P(\overline{M}|\ominus) = \frac{P(\ominus|\overline{M})P(\overline{M})}{P(\ominus)}
\end{equation}

anche in questo caso conosciamo il numeratore (specificità e 1 - prevalenza). Il denominatore può essere espresso come

\begin{equation}\label{eq:Pn}
P(\ominus) = P(\ominus|\overline{M})P(\overline{M}) + P(\ominus|M)P(M)
\end{equation}

dove $P(\ominus|M) = 1 - P(\oplus|M)$. Sostituendo nella $\eqref{eq:Psn}$ otteniamo quindi

\begin{equation}\label{eq:Psn2}
P(\overline{M}|\ominus) = \frac{
P(\ominus|\overline{M})(1 - P(M))
}{
P(\ominus|\overline{M})(1 - P(M)) + (1 - P(\oplus|M))P(M)
}
\end{equation}

ovvero

\begin{equation}\label{eq:Psn3}
P(\overline{M}|\ominus) = \frac{
\textrm{specificità} \cdot (1 - \textrm{prevalenza})
}{
\textrm{specificità} \cdot (1 - \textrm{prevalenza}) + 
(1 - \textrm{sensibilità}) \cdot \textrm{prevalenza}
}
\end{equation}

Abbiamo dunque ora tutti gli strumenti necessari per calcolare la probabilità a posteriori di essere malati (o sani) in seguito ad esito del test diagnostico.

# Test quasi ideale

Prendiamo a titolo d'esempio un buon test ("quasi" ideale) con specificità e sensibilità al 99.5%, supponendo un prevalenza del 10%:

\begin{equation}\label{eq:ex995}
P(M) = .1 \; \; ,\; \; P(\oplus|M) = .995 \; \; ,\; \; P(\ominus|\overline{M}) = .995
\end{equation}

alle ascisse metteremo la probabilità a priori di essere malato da 0 a 1 e alle ordinate la probabilità a posteriori di essere malato dato il risultato del test (figura $\ref{fig:ideale}$). La linea blu rappresenta la probabilità a posteriori di essere malato in seguito a test positivo $P(M|\oplus)$ mentre la linea rossa la probabilità a posteriori di essere malato in seguito a test negativo $1 - P(\overline{M}|\ominus)$. La linea tratteggiata verticale indica la prevalenza $P(M)$.

Poniamo $p_{\ominus}=.05$ come limite diagnostico per un individuo sano, ovvero una probabilità di essere malato $P(M|\ominus)<.05$ (5%) è sufficiente a dichiarare sano un individuo in seguito a test negativo.

In [1]:
import numpy as np
import pandas as pd
import scipy.optimize as spo
import matplotlib.pyplot as plt

from IPython.display import display, Markdown, Latex

In [2]:
def latexplot(plt, figlabel, figcaption, showme=False, single=False):

    figname = figlabel + '.png'
    plt.savefig(figname, bbox_inches='tight')

    if showme:
        plt.show()
        return
    plt.close()

    if single:
        strLatex=fr"""
        \begin{{figure}}
        \centering
            \includegraphics[width=0.5\textwidth,height=0.5\textheight,keepaspectratio]{{{figname}}}
            \caption{{{figcaption}}}
            \label{{fig:{figlabel}}}
        \end{{figure}}"""        
    else:
        strLatex=fr"""
        \begin{{figure}}
        \centering
            \includegraphics{{{figname}}}
            \caption{{{figcaption}}}
            \label{{fig:{figlabel}}}
        \end{{figure}}"""
    
    return display(Latex(strLatex)) 

In [3]:
MAL = np.linspace(0, 1, 101)
p = .05

def P_M_p(pm, spec=.5, sens=.5):
    return (sens * pm) / (sens * pm + (1 - spec) * (1 - pm))

def P_S_n(pm, spec=.5, sens=.5):
    return (spec * (1 - pm)) / (spec * (1 - pm) + (1 - sens) * pm)

def after(pm, spec=.5, sens=.5, p=.05):
    return 1 - P_S_n(pm=pm, spec=spec, sens=sens) - p

In [4]:
# Reliable test
sens = .995
spec = .995
inc = .1

fig, ax = plt.subplots(figsize=(7, 7))
plt.plot(
    MAL,
    P_M_p(MAL, spec, sens),
    lw=3, label="TEST positivo", c="b"
)
plt.plot(
    MAL,
    1 - P_S_n(MAL, spec, sens),
    lw=3, label="TEST negativo", c="r"
)
plt.scatter(
    inc,
    P_M_p(inc, spec, sens),
    c="k", s=50, zorder=5,
)
plt.scatter(
    P_M_p(inc, spec, sens),
    1 - P_S_n(P_M_p(inc, spec, sens), spec, sens),
    c="k", s=100, zorder=5, marker="$1$"
)
plt.scatter(
    1 - P_S_n(P_M_p(inc, spec, sens), spec, sens),
    1 - P_S_n(1 - P_S_n(P_M_p(inc, spec, sens), spec, sens), spec, sens) + .02,
    c="k", s=100, zorder=5, marker="$2$"
)
plt.plot([0,1], [0,1], c="g")
plt.ylabel("Probabilità di Malattia a $\mathbf{Posteriori}$", fontsize="xx-large")
plt.xlabel("Probabilità di Malattia a $\mathbf{Priori}$", fontsize="xx-large")
plt.legend(loc="best")

plt.axvline(inc, ls=":", c="k")
plt.axhline(p, c="k", alpha=.5)
plt.table(
    cellText=[
        [
            f"{inc:.4f} = {inc:.2%}", 
            f'{P_M_p(inc, spec, sens):.4f} = {P_M_p(inc, spec, sens):.2%}', 
            f'{(1 - P_S_n(inc, spec, sens)):.4f} = {(1 - P_S_n(inc, spec, sens)):.2%}'
        ],
    ],
    colLabels=["Probabilità a Priori", "Test Positivo", "Test Negativo"],
    loc="top"
)
plt.title(
    f'Sensibilità {sens:.1%}  &  Specificità {spec:.1%}', 
    pad=45, fontsize=15)
plt.xlim(0, 1); plt.ylim(0, 1)

plt.arrow(.13, .92, .8, -.8, length_includes_head=True, head_width=.025, lw=1, color="y")

latexplot(
    plt, "ideale",
    "Esempio di test \"quasi\" ideale.", single=True
)

<IPython.core.display.Latex object>

In [5]:
display(Markdown(fr"""
$$ P(M|\ominus) = {1 - P_S_n(.1, .995, .995):.4f} $$
"""))


$$ P(M|\ominus) = 0.0006 $$


Notiamo come $P(M|\ominus)$, ovvero la probabilità a posteriori di essere malato dopo un test negativo, sia nettamente inferiore a $p_{\ominus}$. Dunque è sufficiente un solo test negativo per ritenere sano un individuo di cui non si abbiano precedenti informazioni (la sua probabilità a priori era solo la prevalenza).

$P(M|\oplus)$, ovvero la probabilità a posteriori di essere malato dopo un test positivo per un individuo nelle stesse condizioni, risulta superiore al 95% e diventa la nuova _probabilità a priori_ per quel soggetto in caso di un test successivo (punto 1 sulla curva rossa). Si può calcolare che $P(M|\ominus)$ laddove la probabilità a priori del soggetto non sia la prevalenza ma $P(M)=P(M|\oplus)=95.67\%$ è superiore al 5% infatti

In [6]:
display(Markdown(fr"""
$$
P(M|\ominus) = 1 - \frac{{
P(\ominus|\overline{{M}})(1 - P(M|\oplus))
}}{{
P(\ominus|\overline{{M}})(1 - P(M|\oplus)) + (1 - P(\oplus|M))P(M|\oplus)
}} = {1 - P_S_n(P_M_p(inc, spec, sens), spec, sens):.4f}
$$
"""))


$$
P(M|\ominus) = 1 - \frac{
P(\ominus|\overline{M})(1 - P(M|\oplus))
}{
P(\ominus|\overline{M})(1 - P(M|\oplus)) + (1 - P(\oplus|M))P(M|\oplus)
} = 0.1000
$$


da cui ricaviamo che un test negativo in un individuo che abbia precedentemente ricevuto un test positivo, non è sufficiente a ritenerlo sano ma ne sarà necessario un altro. Si può calcolare che la probabilità massima a priori per la quale sia sufficiente un solo test negativo per ritenere sano l'individuo (alla condizioni poste) è pari alla risoluzione per $P(M)$ di

\begin{equation}\label{eq:massima1}
p_{\ominus} = 1 - P(\overline{M}|\ominus)
\end{equation}

ovvero

\begin{equation}\label{eq:massima2}
p_{\ominus} = 1 - \frac{
P(\ominus|\overline{M})(1 - P(M))
}{
P(\ominus|\overline{M})(1 - P(M)) + (1 - P(\oplus|M))P(M)
}
\end{equation}


In [7]:
display(Markdown(fr"""
da cui si ricava facilmente che $P(M)_{{max}} = {spo.fsolve(after, x0=.9, args=(.995, .995))[0]:.4f}$.
"""))


da cui si ricava facilmente che $P(M)_{max} = 0.9128$.


Al di sotto di questa probabilità a priori, con questi valori di sensibilità e specificità, servirà un solo test negativo per escludere, stabilito $p_{\ominus}<.05$, che l'individuo sia malato.

Notiamo anche come, a parità di sensibilità e specificità, la prevalenza (ovvero la probabilità di malattia a priori) influisca sulla probabilità di malattia a posteriori. Ad esempio per una malattia rara come la Sindrome di Cushing endogena con prevalenza in Europa di un 1 caso du 26'000 <cite data-cite="cushing"></cite> ovvero 

In [8]:
cushing_prior = 1/26000
display(Markdown(fr"""
$P(M)={cushing_prior:.6f}={cushing_prior:.4%}$%, la probabilità di malattia a posteriori in seguito a test positivo (con sensibilità e specificità di $.995$) sia
"""))


$P(M)=0.000038=0.0038%$%, la probabilità di malattia a posteriori in seguito a test positivo (con sensibilità e specificità di $.995$) sia


In [9]:
cushing_posterior = P_M_p(cushing_prior, .995, .995)
display(Markdown(fr"""
$P(M|\oplus)={cushing_posterior:.4f}={cushing_posterior:.2%}$% 
dunque molto bassa anche se notevolmente superiore rispetto alla probabilità a priori.
"""))


$P(M|\oplus)=0.0076=0.76%$% 
dunque molto bassa anche se notevolmente superiore rispetto alla probabilità a priori.


In questo caso, a parità di sensibilità, servirebbe un test altamente specifico, ad esempio con $P(\ominus|\overline{M})=.9999$ col quale si otterrebbe una probabilità a posteriori per test positivo pari a 

In [10]:
cushing_posterior = P_M_p(cushing_prior, spec=.9999, sens=.995)
display(Markdown(fr"""
$P(M|\oplus)={cushing_posterior:.4f}={cushing_posterior:.2%}$% 
"""))


$P(M|\oplus)=0.2768=27.68%$% 


# Sensibilità e Specificità

Mantenendo fissa la sensibilità a $.995$, variamo la specificità e viceversa

In [11]:
colors = ["b", "r", "m", "y"]
inc = .1

fig, ax = plt.subplots(1, 2, figsize=(15, 7))

# var spec
sens = .995
specs = [.995, .8, .5, .25]
for color, spec in zip(colors, specs):
    ax[0].plot(
        MAL,
        P_M_p(MAL, spec, sens),
        lw=3, label=fr"spec={spec}", c=color
    )
    ax[0].plot(
        MAL,
        1 - P_S_n(MAL, spec, sens),
        lw=3, c=color, ls="--"
    )

ax[0].plot([0,1], [0,1], c="g")
ax[0].set_ylabel("Probabilità di Malattia a $\mathbf{Posteriori}$", fontsize="xx-large")
ax[0].set_xlabel("Probabilità di Malattia a $\mathbf{Priori}$", fontsize="xx-large")
ax[0].legend(loc="best")

ax[0].axvline(inc, ls=":", c="k")
ax[0].axhline(p, c="k", alpha=.5)
ax[0].table(
    cellText=[
        [
            f"{spec:.3f} = {spec:.2%}", 
            f"{inc:.2f} = {inc:.2%}", 
            f'{P_M_p(inc, spec, sens):.4f} = {P_M_p(inc, spec, sens):.2%}', 
            f'{(1 - P_S_n(inc, spec, sens)):.4f} = {(1 - P_S_n(inc, spec, sens)):.2%}'
        ] for spec in specs
    ],
    colLabels=["Specificità", "Probabilità a Priori", "Test Positivo", "Test Negativo"],
    loc="top"
)
ax[0].set_title(
    f'Sensibilità {sens:.1%}', 
    pad=65, fontsize="xx-large")
ax[0].set_xlim(0, 1); ax[0].set_ylim(0, 1)

# var sens
senss = [.995, .8, .5, .25]
spec = .995
for color, sens in zip(colors, senss):
    ax[1].plot(
        MAL,
        P_M_p(MAL, spec, sens),
        lw=3, label=fr"sens={sens}", c=color
    )
    ax[1].plot(
        MAL,
        1 - P_S_n(MAL, spec, sens),
        lw=3, c=color, ls="--"
    )

ax[1].plot([0,1], [0,1], c="g")
ax[1].set_ylabel("Probabilità di Malattia a $\mathbf{Posteriori}$", fontsize="xx-large")
ax[1].set_xlabel("Probabilità di Malattia a $\mathbf{Priori}$", fontsize="xx-large")
ax[1].legend(loc="best")

ax[1].axvline(inc, ls=":", c="k")
ax[1].axhline(p, c="k", alpha=.5)
ax[1].table(
    cellText=[
        [
            f"{sens:.3f} = {sens:.2%}", 
            f"{inc:.2f} = {inc:.2%}", 
            f'{P_M_p(inc, spec, sens):.4f} = {P_M_p(inc, spec, sens):.2%}', 
            f'{(1 - P_S_n(inc, spec, sens)):.4f} = {(1 - P_S_n(inc, spec, sens)):.2%}'
        ] for sens in senss
    ],
    colLabels=["Sensibilità", "Probabilità a Priori", "Test Positivo", "Test Negativo"],
    loc="top"
)
ax[1].set_title(
    f'Specificità {spec:.1%}', 
    pad=65, fontsize="xx-large")
ax[1].set_xlim(0, 1); ax[1].set_ylim(0, 1)

latexplot(
    plt, "sens-spec",
    "Rapporto tra specificità e sensibilità. Le linee piene indicano $P(M|\oplus)$, le linee tratteggiate $P(M|\ominus).$"
)

<IPython.core.display.Latex object>

Notiamo come valori differenti di specificità a parità di sensibilità (o viceversa) abbiano effetti sia sulla probabibilità a posteriori per test positivo che per test negativo sebbene

- variazioni nella specificità $P(\ominus|\overline{M})$ abbiano maggior effetto su $P(M|\oplus)$
- variazioni nella sensibilità $P(\oplus|M)$ abbiano maggior effetto su $P(\overline{M}|\ominus)$

In [12]:
colors = ["b", "r", "m", "y", "g"]
inc = .1
tickL = [i/10 for i in range(11)]

fig, ax = plt.subplots(1, 2, figsize=(15, 7))

# var spec
sens = [.001, .1, .5, .9, .999]
spec = np.linspace(.001, .999, 701)
for col, sen in zip(colors, sens):
    ax[0].plot(
        spec,
        P_M_p(inc, spec, sen),
        lw=3, label=fr"sens={sen:.3f}", c=col
    )
    ax[0].plot(
        spec,
        1 - P_S_n(inc, spec, sen), ls="--",
        lw=3, c=col
    )
ax[0].set_ylabel("Probabilità di Malattia a $\mathbf{Posteriori}$", fontsize="xx-large")
ax[0].set_xlabel("Specificità", fontsize="xx-large")
ax[0].legend(loc="best")
ax[0].axhline(inc, ls=":", c="k")
ax[0].set_title(f'Probabilità a priori {inc:.1%}', fontsize="xx-large")
#ax[0].set_xlim(0, 1); ax[0].set_ylim(0, 1)
ax[0].set_xticks(tickL)
ax[0].set_yticks(tickL)
ax[0].grid()

# var sens
sens = np.linspace(.001, .999, 701)
spec = [.001, .1, .5, .9, .999]
for col, spe in zip(colors, spec):
    ax[1].plot(
        sens,
        P_M_p(inc, spe, sens),
        lw=3, label=fr"spec={spe:.3f}", c=col
    )
    ax[1].plot(
        sens,
        1 - P_S_n(inc, spe, sens), ls="--",
        lw=3, c=col
    )
ax[1].set_ylabel("Probabilità di Malattia a $\mathbf{Posteriori}$", fontsize="xx-large")
ax[1].set_xlabel("Sensibilità", fontsize="xx-large")
ax[1].legend(loc="upper center")
ax[1].axhline(inc, ls=":", c="k")
ax[1].axhline(p, ls="--", c="g")
ax[1].set_title(f'Probabilità a priori {inc:.1%}', fontsize="xx-large")
#ax[1].set_xlim(0, 1); ax[1].set_ylim(0, 1)
ax[1].set_xticks(tickL)
ax[1].set_yticks(tickL)
ax[1].grid()

latexplot(
    plt, "sens-spec-2",
    "Rapporto tra specificità e sensibilità. Le linee piene indicano $P(M|\oplus)$, le linee tratteggiate $P(M|\ominus).$ " +
    "Si nota come sia necessario che i test abbiano determinate caratteristiche per poter essere utili."
)

<IPython.core.display.Latex object>

Si nota come sensibilità e specificità siano strettamente interconnesse. In particolare, data una probabilità di malattia a priori $P(M)$, si vuole che un test abbia

- una probabilità di malattia a posteriori dato test positivo almeno $P(M|\oplus)>P(M)$
- una probabilità di malattia a posteriori dato test negativo almeno $P(M|\ominus)<P(M)$

Per trovare i minimi requisiti di un test diagnostico dunque, data la probabilità di malattia a priori, si può risolvere il sistema a due equazioni

$$
\left\{\begin{matrix}
P(M|\oplus) > P(M) \\
P(M|\ominus) < P(M)
\end{matrix}\right.
$$

ma avendo stabilito $p_{\ominus}<.05$ per $P(M|\ominus)$ si può anche assumere $p_{\oplus}>.5$ per $P(M|\oplus)$ ovvero che la probabilità di malattia a posteriori dato test positivo sia almeno superiore al 50%

$$
\left\{\begin{matrix}
P(M|\oplus) > p_{\oplus} \\
P(M|\ominus) < p_{\ominus}
\end{matrix}\right.
$$

In [13]:
sens = np.linspace(.001, .999, 701)
spec = np.linspace(.001, .999, 701)
inc = .1

ticks = [70*i for i in range(11)]
tickL = [i/10 for i in range(11)]

fig, ax = plt.subplots(1, 2, figsize=(15, 6))
im0 = ax[0].pcolormesh(
    P_M_p(inc, spec, sens[:, None]), cmap="nipy_spectral",  # cmap="tab20",
    vmin=0, vmax=1
)
ax[0].plot([701, np.where(P_M_p(.1, spec, 1) >= .5)[0][0]],[0, 701], c="k", zorder=1)
ax[0].set_xticks(ticks)
ax[0].set_xticklabels(tickL)
ax[0].set_yticks(ticks)
ax[0].set_yticklabels(tickL)
ax[0].set_xlabel("Specificità")
ax[0].set_ylabel("Sensibilità")
ax[0].set_title(fr"$P(M|\oplus)$,   $P(M)={inc}$,   $p_{{\oplus}}>.5$", fontsize=15)
plt.colorbar(im0, ax=ax[0], ticks=tickL)
#ax[0].grid()

im1 = ax[1].pcolormesh(
    1-P_S_n(inc, spec, sens[:, None]), cmap="nipy_spectral",  # cmap="tab20",
    vmin=0, vmax=1
)
ax[1].plot([0, 701], [701, np.where(1-P_S_n(.1, 1, sens) <= .05)[0][0]], c="w", zorder=1)
ax[1].set_xticks(ticks)
ax[1].set_xticklabels(tickL)
ax[1].set_yticks(ticks)
ax[1].set_yticklabels(tickL)
ax[1].set_xlabel("Specificità")
ax[1].set_ylabel("Sensibilità")
ax[1].set_title(fr"$P(M|\ominus)$,   $P(M)={inc}$,   $p_{{\ominus}}<.05$", fontsize=15)
plt.colorbar(im1, ax=ax[1], ticks=tickL)
#ax[1].grid()

latexplot(
    plt, "requisitimatrice10",
    "Requisiti per $P(M)=.1$. L'area a destra della linea nera nell'immagine di sinistra è il requisito minimo per $P(M|\oplus)>.5$. " +
    "L'area a destra della linea bianca nell'immagine di destra è il requisito minimo per $P(M|\ominus)<.05$."
)

<IPython.core.display.Latex object>

In [14]:
sens = np.linspace(.001, .999, 701)
spec = np.linspace(.001, .999, 701)
inc = .1

ticks = [70*i for i in range(11)]
tickL = [i/10 for i in range(11)]

fig, ax = plt.subplots(1, 1, figsize=(6, 6))
im0 = ax.pcolormesh(
    np.logical_and(
        P_M_p(inc, spec, sens[:, None]) >= .5,
        1-P_S_n(inc, spec, sens[:, None]) <= .05
    ), cmap="gray_r",  # cmap="tab20",
    vmin=0, vmax=1
)
ax.set_xticks(ticks)
ax.set_xticklabels(tickL)
ax.set_yticks(ticks)
ax.set_yticklabels(tickL)
ax.set_xlabel("Specificità $P(\ominus|\overline{M})$", fontsize=20)
ax.set_ylabel("Sensibilità $P(\oplus|M)$", fontsize=20)
ax.set_title(fr"Requisiti test per $P(M)={inc}$", fontsize=20)
ax.grid()

latexplot(
    plt, "requisiti10",
    "L'area nera indica i requisiti necessari $P(M|\oplus)>.5$ e $P(M|\ominus)<.05$ per un test con $P(M)=.1$.",
    single=True
)

<IPython.core.display.Latex object>

# COVID-19 e tamponi naso-faringei

Studi recenti suggeriscono che i tamponi naso-faringei usati per la diagnosi di COVID-19 (RT-PCR SARS-CoV-2 RNA test) abbiano sensibilità $P(\oplus|M)=0.777$ e specificità di $P(\ominus|\overline{M})=0.988$ <cite data-cite="padhye2020reconstructed"></cite> e che la prevalenza di COVID-19 in Italia (in fase pandemica) sia circa pari a $P(M)=0.13$ <cite data-cite="ceylan2020estimation"></cite> <cite data-cite="vollmer2020sub"></cite> <cite data-cite="flaxman2020report"></cite>.

Verifichiamo che il test abbia i requisiti richiesti (figura $\ref{fig:requisiti13}$): il punto giallo indica i parametri di sensibilità e specificità dei test in esame per $P(M)=.13$, i test hanno quindi caratteristiche accettabili.

In [15]:
sens = np.linspace(.001, .999, 701)
spec = np.linspace(.001, .999, 701)
inc = .13

ticks = [70*i for i in range(11)]
tickL = [i/10 for i in range(11)]

fig, ax = plt.subplots(1, 1, figsize=(6, 6))
im0 = ax.pcolormesh(
    np.logical_and(
        P_M_p(inc, spec, sens[:, None]) >= .5,
        1-P_S_n(inc, spec, sens[:, None]) <= .05
    ), cmap="gray_r",  # cmap="tab20",
    vmin=0, vmax=1
)
ax.scatter(.988*701, .777*701, c="yellow", marker="s")
ax.set_xticks(ticks)
ax.set_xticklabels(tickL)
ax.set_yticks(ticks)
ax.set_yticklabels(tickL)
ax.set_xlabel("Specificità $P(\ominus|\overline{M})$", fontsize=20)
ax.set_ylabel("Sensibilità $P(\oplus|M)$", fontsize=20)
ax.set_title(fr"Requisiti test per $P(M)={inc}$", fontsize=20)
ax.grid()

latexplot(
    plt, "requisiti13",
    "L'area nera indica i requisiti necessari $P(M|\oplus)>.5$ e $P(M|\ominus)<.05$ per un test con $P(M)=.13$. Il punto giallo indica i parametri di sensibilità e specificità dei test RT-PCR SARS-CoV-2 RNA test per COVID-19: sensibilità $P(\oplus|M)=0.777$ e specificità di $P(\ominus|\overline{M})=0.988$",
    single=True
)

<IPython.core.display.Latex object>

Vediamo come si modificano le curve delle probabilità a posteriori impostando questi tre parametri (figura $\ref{fig:covid}$).

In [16]:
# Unreliable test
sens = .777
spec = .988

fig, ax = plt.subplots(figsize=(7, 7))
plt.plot(
    MAL,
    P_M_p(MAL, spec, sens),
    lw=3, label="TEST positivo", c="b"
)
plt.plot(
    MAL,
    1 - P_S_n(MAL, spec, sens),
    lw=3, label="TEST negativo", c="r"
)
plt.scatter(
    inc,
    P_M_p(inc, spec, sens),
    c="k", s=50, zorder=5,
)
x = P_M_p(inc, spec, sens)
for i in range(4):
    y = 1 - P_S_n(x, spec, sens)
    plt.scatter(x, y,
        c="k", s=100, marker=f"${i+1}$", zorder=10
    )
    x = y
plt.plot([0,1], [0,1], c="g")
plt.ylabel("Probabilità di Malattia a $\mathbf{Posteriori}$", fontsize="xx-large")
plt.xlabel("Probabilità di Malattia a $\mathbf{Priori}$", fontsize="xx-large")
plt.legend(loc="best")

plt.axvline(inc, ls=":", c="k")
plt.axhline(p, c="k", alpha=.5)
plt.table(
    cellText=[
        [
            f"{inc:.4f} = {inc:.2%}", 
            f'{P_M_p(inc, spec, sens):.4f} = {P_M_p(inc, spec, sens):.2%}', 
            f'{(1 - P_S_n(inc, spec, sens)):.4f} = {(1 - P_S_n(inc, spec, sens)):.2%}'
        ],
    ],
    colLabels=["Probabilità a Priori", "Test Positivo", "Test Negativo"],
    loc="top"
)
plt.title(
    f'Sensibilità {sens:.1%}  &  Specificità {spec:.1%}', 
    pad=45)
plt.xlim(0, 1); plt.ylim(0, 1)

plt.arrow(.15, .9, .7, -.2, length_includes_head=True, head_width=.025, lw=1, color="y")

latexplot(
    plt, "covid",
    "Probabilità di malattia COVID-19 a posteriori per test RT-PCR SARS-CoV-2 RNA.",
    single=True
)

<IPython.core.display.Latex object>

Anche in questo caso dunque è sufficiente un test negativo per ritenere sano un soggetto su cui non si abbiano precedenti informazioni.

In [17]:
display(Markdown(fr"""
$$
P(M|\ominus) = {1-P_S_n(inc, spec, sens):.4f} < p_{{\ominus}} = {p}
$$
"""))


$$
P(M|\ominus) = 0.0326 < p_{\ominus} = 0.05
$$


Se invece un soggetto risultasse positivo (punto nero in figura $\ref{fig:covid}$), la sua probabilità di essere malato passerebbe da $0.13$ (prevalenza stimata di COVID-19 in Italia in fase pandemica) a

In [18]:
display(Markdown(fr"""
$$
P(M|\oplus) = {P_M_p(inc, spec, sens):.4f} > p_{{\oplus}} = .5
$$
"""))


$$
P(M|\oplus) = 0.9063 > p_{\oplus} = .5
$$


Vediamo quindi la probabilità a posteriori per test negativo $P(M|\ominus)$ con la probabilità a priori di un soggetto precedentemente risultato positivo (punto 1 in figura $\ref{fig:covid}$)

In [19]:
prior = P_M_p(inc, spec, sens)
new_posterior = 1 - P_S_n(prior, spec, sens)
display(Markdown(fr"""
$$
P(M|\ominus)_1 = 1 - \frac{{
P(\ominus|\overline{{M}})(1 - {prior:.4f})
}}{{
P(\ominus|\overline{{M}})(1 - {prior:.4f}) + (1 - P(\oplus|M)){prior:.4f}
}} = {new_posterior:.4f}
$$
"""))
new_prior = new_posterior


$$
P(M|\ominus)_1 = 1 - \frac{
P(\ominus|\overline{M})(1 - 0.9063)
}{
P(\ominus|\overline{M})(1 - 0.9063) + (1 - P(\oplus|M))0.9063
} = 0.6859
$$


Dunque un tampone negativo non è sufficiente, il soggetto ha ancora un'elevata probabilità di essere infetto, supponiamo che ne venga fatto un secondo (punto 2 in figura $\ref{fig:covid}$)

In [20]:
new_posterior = 1 - P_S_n(new_prior, spec, sens)
display(Markdown(fr"""
$$
P(M|\ominus)_1 = 1 - \frac{{
P(\ominus|\overline{{M}})(1 - {new_prior:.4f})
}}{{
P(\ominus|\overline{{M}})(1 - {new_prior:.4f}) + (1 - P(\oplus|M)){new_prior:.4f}
}} = {new_posterior:.4f}
$$

Ancora superiore, ${new_posterior:.2%}$% di probabilità di essere infetto non è accettabile per ritenere guarito il paziente.
Effettuiamo un terzo test (punto 3 in figura $\ref{{fig:covid}}$)
"""))
new_prior = new_posterior


$$
P(M|\ominus)_1 = 1 - \frac{
P(\ominus|\overline{M})(1 - 0.6859)
}{
P(\ominus|\overline{M})(1 - 0.6859) + (1 - P(\oplus|M))0.6859
} = 0.3302
$$

Ancora superiore, $33.02%$% di probabilità di essere infetto non è accettabile per ritenere guarito il paziente.
Effettuiamo un terzo test (punto 3 in figura $\ref{fig:covid}$)


In [21]:
new_posterior = 1 - P_S_n(new_prior, spec, sens)
display(Markdown(fr"""
$$
P(M|\ominus)_1 = 1 - \frac{{
P(\ominus|\overline{{M}})(1 - {new_prior:.4f})
}}{{
P(\ominus|\overline{{M}})(1 - {new_prior:.4f}) + (1 - P(\oplus|M)){new_prior:.4f}
}} = {new_posterior:.4f}
$$

${new_posterior:.2%}$% nuovamente superiore a $p_{{\ominus}}$, dunque effettuiamo un quarto test (punto 4 in figura $\ref{{fig:covid}}$)
"""))
new_prior = new_posterior


$$
P(M|\ominus)_1 = 1 - \frac{
P(\ominus|\overline{M})(1 - 0.3302)
}{
P(\ominus|\overline{M})(1 - 0.3302) + (1 - P(\oplus|M))0.3302
} = 0.1001
$$

$10.01%$% nuovamente superiore a $p_{\ominus}$, dunque effettuiamo un quarto test (punto 4 in figura $\ref{fig:covid}$)


In [22]:
new_posterior = 1 - P_S_n(new_prior, spec, sens)
display(Markdown(fr"""
$$
P(M|\ominus)_1 = 1 - \frac{{
P(\ominus|\overline{{M}})(1 - {new_prior:.4f})
}}{{
P(\ominus|\overline{{M}})(1 - {new_prior:.4f}) + (1 - P(\oplus|M)){new_prior:.4f}
}} = {new_posterior:.4f}
$$

${new_posterior:.2%}$% di probabilità di essere infetto è un valore che possiamo ritenere accettabile per considerarlo sano. 
Servirebbero quindi quattro tamponi nasofaringei negativi per escludere la possibilità che un soggetto precedentemente risultato positivo per COVID-19 sia considerabile attualmente guarito $P(M|\ominus)<.05$.
"""))


$$
P(M|\ominus)_1 = 1 - \frac{
P(\ominus|\overline{M})(1 - 0.1001)
}{
P(\ominus|\overline{M})(1 - 0.1001) + (1 - P(\oplus|M))0.1001
} = 0.0245
$$

$2.45%$% di probabilità di essere infetto è un valore che possiamo ritenere accettabile per considerarlo sano. 
Servirebbero quindi quattro tamponi nasofaringei negativi per escludere la possibilità che un soggetto precedentemente risultato positivo per COVID-19 sia considerabile attualmente guarito $P(M|\ominus)<.05$.


Calcolando in questo caso la massima probabilità a priori $P(M)_{max}$ data la quale sia sufficiente un solo tampone negativo per considerare sano il soggetto, otteniamo

In [23]:
max13 = spo.fsolve(after, x0=.9, args=(.988, .777))[0]
display(Markdown(fr"""
$$P(M)_{{max}} = {max13:.4f}$$

ovvero per probabilità a priori $P(M^*)>{max13:.2%}$% servirà sicuramente più di un tampone.
"""))


$$P(M)_{max} = 0.1891$$

ovvero per probabilità a priori $P(M^*)>18.91%$% servirà sicuramente più di un tampone.
