# Introduzione

Si presenta una breve analisi, che non pretende di essere né esaustiva né professionale, degli strumenti matematici di base utilizzati per la definizione delle probabilità di malattia a priori e a posteriori dati i risultati di test diagnostici qualitativi ripetuti.

La _prevalenza_ di una malattia infettiva corrisponde alla percentuale di popolazione affetta ovvero alla probabilità che un individuo di tale popolazione scelto a caso sia affetto dalla malattia <cite data-cite="porta2014dictionary"></cite>.

Dal punto di vista bayesiano la prevalenza corrisponde alla probabilità **a priori** $P(M)$ di essere malato. La probabilità dunque **a priori** di non essere affetto dalla malattia $P(\overline{M})$ sarà pari a $1 - P(M)$ <cite data-cite="kruschke2014doing"></cite>.

Durante un'epidemia la prevalenza, per ovvi motivi, si modifica: una percentuale nettamente superiore di popolazione è affetta dalla malattia ovvero la probabilità di essere malati aumenta.

Un test diagnostico qualitativo (come il tampone naso-faringeo) ha due possibilità di esito: positivo $\oplus$ oppure negativo $\ominus$.

La probabilità di ottenere un test positivo per un individuo malato rappresenta la _sensibilità_ del test <cite data-cite="porta2014dictionary"></cite>

\begin{equation}\label{eq:sens}
P(\oplus | M) = \textrm{sensibilità}
\end{equation}

la situazione ideale sarebbe quindi $P(\oplus|M)=1$ ovvero ottenere 100% di test positivi su tutti i malati che equivale ad avere 0% di _falsi negativi_ 

\begin{equation}\label{eq:falsineg}
P(\ominus|M)=\overline{P(\oplus|M)}=1-P(\oplus|M)=0
\end{equation}

ovvero nessun malato otterrà un test falsamente negativo.

La probabilità di ottenere un test negativo per un individuo sano (non affetto dalla malattia in questione) rappresenta invece la _specificità_ del test <cite data-cite="porta2014dictionary"></cite>

\begin{equation}\label{eq:spec}
P(\ominus | \overline{M}) = \textrm{specificità}
\end{equation}

la situazione ideale sarebbe quindi $P(\ominus|\overline{M})=1$ ovvero ottenere 100% di test negativi su tutti i sani che equivale ad avere 0% di _falsi positivi_ 

\begin{equation}\label{eq:falsipos}
P(\oplus|\overline{M}) = \overline{P(\ominus|\overline{M})} = 1-P(\ominus|\overline{M}) =0
\end{equation}

ovvero nessun sano otterrà un test falsamente positivo.

Prevalenza, sensibilità e specificità influiscono sulla probabilità **a posteriori** di essere malato o sano in seguito a risultato positivo o negativo del test.

# Test e Teorema di Bayes

Il teorema di Bayes $\eqref{eq:bayes}$ ci spiega il motivo e ci indica come calcolare queste probabilità.

\begin{equation}\label{eq:bayes}
P(A|B) = \frac{P(B|A)P(A)}{P(B)}
\end{equation}

dove $P(B)$ può essere calcolato come

\begin{equation}\label{eq:denom}
P(B) = P(B|A)P(A) + P(B|\overline{A})P(\overline{A})
\end{equation}

Applichiamo il teorema di Bayes per calcolare la probabilità di essere malato in seguito a risultato positivo di un test diagnostico:

\begin{equation}\label{eq:Pmp}
P(M|\oplus) = \frac{P(\oplus|M)P(M)}{P(\oplus)}
\end{equation}

Al numeratore conosciamo tutti i termini: il primo è la sensibilità $\eqref{eq:sens}$ e il secondo, se dell'individuo non si sa nulla ed è scelto a caso, è la prevalenza (anche nel corso di un'epidemia). Al denominatore invece troviamo la probabilità a priori di avere un test positivo, che non conosciamo direttamente, ma possiamo calcolare grazie alla $\eqref{eq:denom}$.

\begin{equation}\label{eq:Pp}
P(\oplus) = P(\oplus|M)P(M) + P(\oplus|\overline{M})P(\overline{M})
\end{equation}

dove $P(\oplus|\overline{M})$ ovvero la probabilità di avere un test positivo su individuo sano è $P(\oplus|\overline{M}) = 1 - P(\ominus|\overline{M})$ e, come già sappiamo, $P(\overline{M}) = 1 - P(M)$. Dunque la $\eqref{eq:Pmp}$ diventa:

\begin{equation}\label{eq:Pmp2}
P(M|\oplus) = \frac{P(\oplus|M)P(M)}{P(\oplus|M)P(M) + (1 - P(\ominus|\overline{M}))(1 - P(M))}
\end{equation}

ovvero

\begin{equation}\label{eq:Pmp3}
P(M|\oplus) = \frac{
\textrm{sensibilità} \cdot \textrm{prevalenza} }{
\textrm{sensibilità} \cdot \textrm{prevalenza} + (1 - \textrm{specificità}) \cdot (1 - \textrm{prevalenza})
}
\end{equation}

Applicando invece il teorema di Bayes per calcolare la probabilità di non essere malato in seguito ad un test negativo otteniamo

\begin{equation}\label{eq:Psn}
P(\overline{M}|\ominus) = \frac{P(\ominus|\overline{M})P(\overline{M})}{P(\ominus)}
\end{equation}

anche in questo caso conosciamo il numeratore (specificità e 1 - prevalenza). Il denominatore può essere espresso come

\begin{equation}\label{eq:Pn}
P(\ominus) = P(\ominus|\overline{M})P(\overline{M}) + P(\ominus|M)P(M)
\end{equation}

dove $P(\ominus|M) = 1 - P(\oplus|M)$. Sostituendo nella $\eqref{eq:Psn}$ otteniamo quindi

\begin{equation}\label{eq:Psn2}
P(\overline{M}|\ominus) = \frac{
P(\ominus|\overline{M})(1 - P(M))
}{
P(\ominus|\overline{M})(1 - P(M)) + (1 - P(\oplus|M))P(M)
}
\end{equation}

ovvero

\begin{equation}\label{eq:Psn3}
P(\overline{M}|\ominus) = \frac{
\textrm{specificità} \cdot (1 - \textrm{prevalenza})
}{
\textrm{specificità} \cdot (1 - \textrm{prevalenza}) + 
(1 - \textrm{sensibilità}) \cdot \textrm{prevalenza}
}
\end{equation}

Abbiamo dunque ora tutti gli strumenti necessari per calcolare la probabilità a posteriori di essere malati (o sani) in seguito ad esito del test diagnostico.

# Test quasi ideale

Prendiamo a titolo d'esempio un buon test ("quasi" ideale) con specificità e sensibilità al 99.5%, supponendo un prevalenza del 10%:

\begin{equation}\label{eq:ex995}
P(M) = .1 \; \; ,\; \; P(\oplus|M) = .995 \; \; ,\; \; P(\ominus|\overline{M}) = .995
\end{equation}

alle ascisse metteremo la probabilità a priori di essere malato da 0 a 1 e alle ordinate la probabilità a posteriori di essere malato dato il risultato del test (figura $\ref{fig:ideale}$). La linea blu rappresenta la probabilità a posteriori di essere malato in seguito a test positivo $P(M|\oplus)$ mentre la linea rossa la probabilità a posteriori di essere malato in seguito a test negativo $1 - P(\overline{M}|\ominus)$. La linea tratteggiata verticale indica la prevalenza $P(M)$.

Poniamo a solo titolo esemplificativo $p_{\ominus}=.05$ come limite diagnostico per un individuo sano, ovvero una probabilità del 5% di essere malato $P(M|\ominus)<.05$ è sufficiente a dichiarare sano un individuo in seguito a test negativo. Questo limite in realtà è deciso in base a precise e complesse linee guida per ogni malattia in base alla valutazione dei rischi tra cui: la gravità della condizione patologica e la sua possibile evoluzione, effetti collaterali dei trattamenti, rischio per malattia non trattata ecc...

In [1]:
import numpy as np
import pandas as pd
import scipy.optimize as spo
import scipy.stats as sps
import matplotlib.pyplot as plt
import matplotlib.patches as patches

from IPython.display import display, Markdown, Latex

In [2]:
def latexplot(plt, figlabel, figcaption, showme=False, single=False):

    figname = figlabel + '.png'
    plt.savefig(figname, bbox_inches='tight')

    if showme:
        plt.show()
        return
    plt.close()

    if single:
        strLatex=fr"""
        \begin{{figure}}
        \centering
            \includegraphics[width=0.5\textwidth,height=0.5\textheight,keepaspectratio]{{{figname}}}
            \caption{{{figcaption}}}
            \label{{fig:{figlabel}}}
        \end{{figure}}"""        
    else:
        strLatex=fr"""
        \begin{{figure}}
        \centering
            \includegraphics{{{figname}}}
            \caption{{{figcaption}}}
            \label{{fig:{figlabel}}}
        \end{{figure}}"""
    
    return display(Latex(strLatex)) 

In [3]:
MAL = np.linspace(0, 1, 101)
p = .05

def P_M_p(pm, spec=.5, sens=.5):
    return (sens * pm) / (sens * pm + (1 - spec) * (1 - pm))

def P_S_n(pm, spec=.5, sens=.5):
    return (spec * (1 - pm)) / (spec * (1 - pm) + (1 - sens) * pm)

def after(pm, spec=.5, sens=.5, p=.05):
    return 1 - P_S_n(pm=pm, spec=spec, sens=sens) - p

In [4]:
# Reliable test
sens = .995
spec = .995
inc = .1

fig, ax = plt.subplots(figsize=(7, 7))
plt.plot(
    MAL,
    P_M_p(MAL, spec, sens),
    lw=3, label="TEST positivo", c="b"
)
plt.plot(
    MAL,
    1 - P_S_n(MAL, spec, sens),
    lw=3, label="TEST negativo", c="r"
)
plt.scatter(
    inc,
    P_M_p(inc, spec, sens),
    c="k", s=50, zorder=5,
)
plt.scatter(
    P_M_p(inc, spec, sens),
    1 - P_S_n(P_M_p(inc, spec, sens), spec, sens),
    c="k", s=100, zorder=5, marker="$1$"
)
plt.scatter(
    1 - P_S_n(P_M_p(inc, spec, sens), spec, sens),
    1 - P_S_n(1 - P_S_n(P_M_p(inc, spec, sens), spec, sens), spec, sens) + .02,
    c="k", s=100, zorder=5, marker="$2$"
)
plt.plot([0,1], [0,1], c="g")
plt.ylabel("Probabilità di Malattia a $\mathbf{Posteriori}$", fontsize="xx-large")
plt.xlabel("Probabilità di Malattia a $\mathbf{Priori}$", fontsize="xx-large")
plt.legend(loc="best")

plt.axvline(inc, ls=":", c="k")
plt.axhline(p, c="k", alpha=.5)
plt.table(
    cellText=[
        [
            f"{inc:.4f} = {inc:.2%}", 
            f'{P_M_p(inc, spec, sens):.4f} = {P_M_p(inc, spec, sens):.2%}', 
            f'{(1 - P_S_n(inc, spec, sens)):.4f} = {(1 - P_S_n(inc, spec, sens)):.2%}'
        ],
    ],
    colLabels=["Probabilità a Priori", "Test Positivo", "Test Negativo"],
    loc="top"
)
plt.title(
    f'Sensibilità {sens:.1%}  &  Specificità {spec:.1%}', 
    pad=45, fontsize=15)
plt.xlim(0, 1); plt.ylim(0, 1)

plt.arrow(.13, .92, .8, -.8, length_includes_head=True, head_width=.025, lw=1, color="y")

latexplot(
    plt, "ideale",
    "Esempio di test \"quasi\" ideale.", single=True,
    showme=False
)

<IPython.core.display.Latex object>

In [5]:
display(Markdown(fr"""
$$ P(M|\ominus) = {1 - P_S_n(.1, .995, .995):.4f} $$
"""))


$$ P(M|\ominus) = 0.0006 $$


Notiamo come $P(M|\ominus)$, ovvero la probabilità a posteriori di essere malato dopo un test negativo, sia nettamente inferiore a $p_{\ominus}$. Dunque è sufficiente un solo test negativo per ritenere sano un individuo di cui non si abbiano precedenti informazioni (la sua probabilità a priori era solo la prevalenza).

$P(M|\oplus)$, ovvero la probabilità a posteriori di essere malato dopo un test positivo per un individuo nelle stesse condizioni, risulta superiore al 95% e diventa la nuova _probabilità a priori_ per quel soggetto in caso di un test successivo (punto 1 sulla curva rossa). Si può calcolare che $P(M|\ominus)$ laddove la probabilità a priori del soggetto non sia la prevalenza ma $P(M)=P(M|\oplus)=95.67\%$ è superiore al 5% infatti

In [6]:
display(Markdown(fr"""
$$
P(M|\ominus) = 1 - \frac{{
P(\ominus|\overline{{M}})(1 - P(M|\oplus))
}}{{
P(\ominus|\overline{{M}})(1 - P(M|\oplus)) + (1 - P(\oplus|M))P(M|\oplus)
}} = {1 - P_S_n(P_M_p(inc, spec, sens), spec, sens):.4f}
$$
"""))


$$
P(M|\ominus) = 1 - \frac{
P(\ominus|\overline{M})(1 - P(M|\oplus))
}{
P(\ominus|\overline{M})(1 - P(M|\oplus)) + (1 - P(\oplus|M))P(M|\oplus)
} = 0.1000
$$


da cui ricaviamo che un test negativo in un individuo che abbia precedentemente ricevuto un test positivo, non è sufficiente a ritenerlo sano ma ne sarà necessario un altro. Si può calcolare che la probabilità massima a priori per la quale sia sufficiente un solo test negativo per ritenere sano l'individuo (alla condizioni poste) è pari alla risoluzione per $P(M)$ di

\begin{equation}\label{eq:massima1}
p_{\ominus} = 1 - P(\overline{M}|\ominus)
\end{equation}

ovvero

\begin{equation}\label{eq:massima2}
p_{\ominus} = 1 - \frac{
P(\ominus|\overline{M})(1 - P(M))
}{
P(\ominus|\overline{M})(1 - P(M)) + (1 - P(\oplus|M))P(M)
}
\end{equation}


In [7]:
display(Markdown(fr"""
da cui si ricava facilmente che $P(M)_{{max}} = {spo.fsolve(after, x0=.9, args=(.995, .995))[0]:.4f}$.
"""))


da cui si ricava facilmente che $P(M)_{max} = 0.9128$.


Al di sotto di questa probabilità a priori, con questi valori di sensibilità e specificità, servirà un solo test negativo per escludere, stabilito $p_{\ominus}<.05$, che l'individuo sia malato.

Si suppone qui che i test siano indipendenti rispetto alla diagnosi (vedi [Test ripetuti](#Test-ripetuti)) e senza considerare la possibilità che $P(M)$ si modifichi nel tempo ovvero che condizioni cliniche, anamnesi, risultati di altri test ecc portino il medico a riconsiderare la condizione dell'esaminato. In caso invece di test effettuati contemporaneamente o in successione a relativamente breve distanza di tempo, laddove diagnosi e esclusione di malattia dipendano dal risultato combinato dei test effettuati, specificità e sensibilità si modificano di conseguenza a seconda della strategia utilizzata (vedi [Test ripetuti](#Test-ripetuti)).

Notiamo anche come, a parità di sensibilità e specificità, la prevalenza (ovvero la probabilità di malattia a priori) influisca sulla probabilità di malattia a posteriori. Ad esempio per una malattia rara come la Sindrome di Cushing endogena con prevalenza in Europa di un 1 caso su 26'000 <cite data-cite="cushing"></cite> ovvero 

In [8]:
cushing_prior = 1/26000
display(Markdown(fr"""
$P(M)={cushing_prior:.6f}={cushing_prior:.4%}$%, la probabilità di malattia a posteriori in seguito a test positivo (con sensibilità e specificità di $.995$) sia
"""))


$P(M)=0.000038=0.0038%$%, la probabilità di malattia a posteriori in seguito a test positivo (con sensibilità e specificità di $.995$) sia


In [9]:
cushing_posterior = P_M_p(cushing_prior, .995, .995)
display(Markdown(fr"""
$P(M|\oplus)={cushing_posterior:.4f}={cushing_posterior:.2%}$% 
dunque molto bassa anche se notevolmente superiore rispetto alla probabilità a priori.
"""))


$P(M|\oplus)=0.0076=0.76%$% 
dunque molto bassa anche se notevolmente superiore rispetto alla probabilità a priori.


In questo caso, a parità di sensibilità, servirebbe un test altamente specifico, ad esempio con $P(\ominus|\overline{M})=.9999$ col quale si otterrebbe una probabilità a posteriori per test positivo pari a 

In [10]:
cushing_posterior = P_M_p(cushing_prior, spec=.9999, sens=.995)
display(Markdown(fr"""
$P(M|\oplus)={cushing_posterior:.4f}={cushing_posterior:.2%}$% 
"""))


$P(M|\oplus)=0.2768=27.68%$% 


# Test ripetuti

La situazione discussa nella precedente [sezione](#Test-quasi-ideale) e in figura $\ref{fig:ideale}$ è valida però, come si diceva, solo se la diagnosi sia indipendente dal risultato combinato dei test ripetuti. 
Non considereremo qui la possibilità che $P(M)$ del paziente si modifichi nel tempo: segni, sintomi, anamnesi, ecc che possono portare il medico a rivalutare la condizione del soggetto e dunque la sua probabilità di malattia.

In caso invece di test effettuati contemporaneamente o in successione (stabilita l'indipendenza condizionale dei risultati) se la diagnosi dipende dal risultato ottenuto da tutti i test, specificità e sensibilità si modificano ad ogni ripetizione <cite data-cite="weinstein2005clinical"></cite>.

## Test in parallelo

I test in parallelo vengono effettuati contemporaneamente e la diagnosi viene effettuata in base all'insieme dei risultati ottenuti. Supponiamo inizialmente che vengano effettuati due test ed estendiamo di volta alla possibilità di $n$ test effettuati.

### Regola T (tutti necessari)

Entrambi i test negativi o entrambi positivi sono necessari rispettivamente a escludere o diagnosticare la malattia. La indicheremo come regola $\mathbf{T}_{\oplus\ominus}$.

$$
\oplus_1 \wedge \oplus_2 \Rightarrow \textbf{individuo malato}
$$

$$
\ominus_1 \wedge \ominus_2 \Rightarrow \textbf{individuo sano}
$$

$$
\oplus_1 \wedge \ominus_2 \bigvee \ominus_1 \wedge \oplus_2 \Rightarrow \textrm{nessuna informazione!}
$$

Non è una "vera" regola utilizzata nella pratica clinica perché nel caso in cui entrambi non siano positivi o negativi i test effettuati (magari anche invasivi o che presentano dei rischi o effetti indesiderati per la tecnica utilizzata) non sono in grado di fornire alcuna informazione e il problema diagnostico rimane aperto. È usata qui solamente a scopo esemplificativo.

In questo caso, per la regola della probabilità totale, specificità $\mathbf{SP}$ e sensibilità $\mathbf{SE}$ finali sono pari alle produttorie per $i=1 \cdots n$; non variando $\mathbf{SP}$ e $\mathbf{SE}$ da test a test, il risultato finale sarà dunque $\mathbf{SE}^n$ e $\mathbf{SP}^n$ riducendo così progressivamente entrambe ad ogni ripetizione. Non è dunque una strategia vantaggiosa (oltre alla perdita di informazione in caso di risultati discordanti):

$$
\mathbf{SE}_{tot} = P(\oplus|M)_{tot} = \bigcap_{i=1}^{n} P(\oplus|M)_i = \prod_{i=1}^{n} \mathbf{SE} = \mathbf{SE}^n
$$

$$
\mathbf{SP}_{tot} = P(\ominus|\overline{M})_{tot} = \bigcap_{i=1}^{n} P(\ominus|\overline{M})_i = \prod_{i=1}^{n} \mathbf{SP} = \mathbf{SP}^n
$$

### Regola O (the OR rule)

Solo se entrambi i test sono negativi la diagnosi è esclusa, ne è sufficiente uno solo per diagnosticare la malattia. La indicheremo come Regola $\mathbf{O}_{\ominus}$:

$$
\ominus_1 \wedge \ominus_2 \Rightarrow \textrm{individuo sano}
$$

$$
\oplus_1 \wedge \ominus_2 \bigvee \ominus_1 \wedge \oplus_2 \Rightarrow \textbf{individuo malato}
$$

Dato che entrambi i test negativi sono necessari per escludere la diagnosi $\overline{M}$ ed essendo $\mathbf{SP}$ la probabilità a posteriori di avere un test negativo se l'individuo è sano $P(\ominus|\overline{M})$, la specificità totale sarà pari al prodotto delle specificità $\mathbf{SP}_1 \cdot \mathbf{SP}_2$ che essendo uguali diventa $\mathbf{SP}^2$. Per $n$ test ripetuti la specificità totale sarà pari alla produttoria degli $n$ test

$$
\mathbf{SP}_{tot} = P(\ominus|\overline{M})_{tot} = \bigcap_{i=1}^{n} P(\ominus|\overline{M}) = \prod_{i=1}^{n} \mathbf{SP}
= \mathbf{SP}^n
$$

Visto che invece un solo test positivo è sufficiente a diagnosticare la malattia $M$ ed essendo $\mathbf{SE}$ la probabilità a posteriori di avere un test positivo in caso di malattia $P(\oplus|M)$, la sensibilità totale sarà pari alla somma delle sensibilità dei due test meno il loro prodotto perché la concomitanza dei due test positivi non è contemplata come risultato utile alla diagnosi

$$
\mathbf{SE}_{tot} = P(\oplus|M)_1 + P(\oplus|M)_2 - \Big( P(\oplus|M)_1 \cdot P(\oplus|M)_2 \Big) = 
\mathbf{SE}_1 + \mathbf{SE}_2 - (\mathbf{SE}_1 \cdot \mathbf{SE}_2)
$$

che essendo i due test uguali si riduce (in questo caso specifico) a 

$$
\mathbf{SE}_{tot} = 2 \cdot P(\oplus|M) - P(\oplus|M)^2 = 2 \mathbf{SE} - \mathbf{SE}^2
$$

Per $n$ test, dato che $P(\ominus|M)$ corrisponde al falso negativo ed è necessario che tutti i test siano negativi per escludere la malattia possiamo dire che i falsi negativi totali sono 

$$
P(\ominus|M)_{tot} = \bigcap_{i=1}^{n} P(\ominus|M)_i = \prod_{i=1}^{n} P(\ominus|M)_i
$$ 

ma visto che il falso negativo è complementare alla sensibilità 

$$
P(\ominus|M)=\overline{P(\oplus|M)}=1-P(\oplus|M)=1-\mathbf{SE}
$$ 

si può dire che 

$$
P(\ominus|M)_{tot}=\prod_{i=1}^{n} (1-\mathbf{SE})_i
$$ 

e sapendo che allo stesso modo la sensibilità è il complemento del falso negativo 

$$
\mathbf{SE}=P(\oplus|M)=1-P(\ominus|M)
$$ 

si può concludere che 

$$
\mathbf{SE}_{tot} = 1 - P(\ominus|M)_{tot} = 1 - \prod_{i=1}^{n} (1 - \mathbf{SE} )_i
$$

Essendo in questo caso i test uguali otteniamo:

$$
\mathbf{SE}_{tot} = 1 - (1 - \mathbf{SE} )^n
$$

### Regola E (the AND rule)

Solo se entrambi i test sono positivi è diagnosticata la malattia, ne è sufficiente uno negativo per escludere la condizione patologica. La indicheremo come Regola $\mathbf{E}_{\oplus}$:

$$
\oplus_1 \wedge \oplus_2 \Rightarrow \textbf{individuo malato}
$$

$$
\oplus_1 \wedge \ominus_2 \bigvee \ominus_1 \wedge \oplus_2 \Rightarrow \textrm{individuo sano}
$$

Dato che entrambi i test positivi sono necessari per confermare la diagnosi $M$ ed essendo $\mathbf{SE}$ la probabilità a posteriori di avere un test positivo se l'individuo è malato $P(\oplus|M)$, la sensibilità totale sarà pari al prodotto delle sensibilità $\mathbf{SE}_1 \cdot \mathbf{SE}_2$ che essendo uguali diventa $\mathbf{SE}^2$. Per $n$ test ripetuti la sensibilità totale sarà pari alla produttoria degli $n$ test

$$
\mathbf{SE}_{tot} = P(\oplus|M)_n = \bigcap_{i=1}^{n} P(\oplus|M) = \prod_{i=1}^{n} \mathbf{SE}
= \mathbf{SE}^n
$$

Visto che invece un solo test negativo è sufficiente a escludere la malattia $\overline{M}$ ed essendo $\mathbf{SP}$ la probabilità a posteriori di avere un test negativo in caso di salute $P(\ominus|\overline{M})$, la specificità totale sarà pari alla somma delle specificità dei due test meno il loro prodotto perché la concomitanza dei due test negativi non è contemplata come risultato utile alla diagnosi

$$
\mathbf{SP}_{tot} = P(\ominus|\overline{M})_1 + P(\ominus|\overline{M})_2 - \Big( P(\ominus|\overline{M})_1 \cdot P(\ominus|\overline{M})_2 \Big) = 
\mathbf{SP}_1 + \mathbf{SP}_2 - (\mathbf{SP}_1 \cdot \mathbf{SP}_2)
$$

che essendo i due test uguali si riduce a 

$$
\mathbf{SP}_{tot} = 2 \cdot P(\ominus|\overline{M}) - P(\ominus|\overline{M})^2 = 2 \mathbf{SP} - \mathbf{SP}^2
$$

Per $n$ test, dato che $P(\oplus|\overline{M})$ corrisponde al falso positivo ed è necessario che tutti i test siano positivi per diagnosticare la malattia possiamo dire che i falsi positivi totali sono 

$$
P(\oplus|\overline{M})_{tot} = \bigcap_{i=1}^{n} P(\oplus|\overline{M})_i = 
\prod_{i=1}^{n} P(\oplus|\overline{M})_i = P(\oplus|\overline{M})^n
$$ 

ma visto che il falso positivo è complementare alla specificità 

$$
P(\oplus|\overline{M})=\overline{P(\ominus|\overline{M})}=1-P(\ominus|\overline{M})=1-\mathbf{SP}
$$ 

si può dire che 

$$
P(\oplus|\overline{M})_{tot}= \prod_{i=1}^{n}(1-\mathbf{SP})_i
$$ 

e sapendo che allo stesso modo la specificità è il complemento del falso positivo

$$
\mathbf{SP}=P(\ominus|\overline{M})=1-P(\oplus|\overline{M})
$$ 

si può concludere che 

$$
\mathbf{SP}_{tot} = 1 - P(\oplus|\overline{M})_{tot} = 1 - \prod_{i=1}^{n}( 1 - \mathbf{SP} )_i
$$

Essendo i test uguali in questo si riduce a

$$
\mathbf{SP}_{tot} = 1 - ( 1 - \mathbf{SP} )^n
$$

## Test in serie

I test in serie vengono effettuati a breve distanza di tempo e ripetuti solo se il risultato precedente è positivo o negativo, in base alla strategia utilizzata.

### Regola T (tutti ripetuti)

Il test viene ripetuto $n$ volte sia che il precedente fosse positivo sia negativo. La indicheremo come regola $\mathbf{T}_{\oplus\ominus}$ come per la regola similare dei test in parallelo.

$$
\oplus_1 \wedge \oplus_2 \Rightarrow \textbf{individuo malato}
$$

$$
\ominus_1 \wedge \ominus_2 \Rightarrow \textbf{individuo sano}
$$

$$
\oplus_1 \wedge \ominus_2 \bigvee \ominus_1 \wedge \oplus_2 \Rightarrow \textrm{nessuna informazione!}
$$

Come il suo omonimo in parallelo, non è una "vera" regola utilizzata nella pratica clinica perché nel caso in cui entrambi non siano positivi o negativi i test effettuati non sono in grado di fornire alcuna informazione e il problema diagnostico rimane aperto. È anch'essa usata qui solamente a scopo esemplificativo.

In questo caso, per la regola della probabilità totale, specificità $\mathbf{SP}$ e sensibilità $\mathbf{SE}$ finali sono pari alle produttorie per $i=1 \cdots n$; non variando $\mathbf{SP}$ e $\mathbf{SE}$ da test a test, il risultato finale sarà dunque $\mathbf{SE}^n$ e $\mathbf{SP}^n$ riducendo così progressivamente entrambe ad ogni ripetizione. Non è dunque una strategia vantaggiosa (oltre alla perdita di informazione)

$$
\mathbf{SE}_n = P(\oplus|M)_{tot} = \bigcap_{i=1}^{n} P(\oplus|M)_i = \prod_{i=1}^{n} \mathbf{SE} = \mathbf{SE}^n
$$

$$
\mathbf{SP}_n = P(\ominus|\overline{M})_{tot} = \bigcap_{i=1}^{n} P(\ominus|\overline{M})_i = \prod_{i=1}^{n} \mathbf{SP} = \mathbf{SP}^n
$$

### Regola O (the OR rule)

Il test viene ripetuto solo se precedentemente negativo, è sufficiente che il primo o il secondo test siano positivi per diagnosticare la malattia e solo se entrambi sono negativi è eclusa la patologia. La indicheremo come Regola $\mathbf{O}_{\ominus}$ (come la similare in parallelo):

$$
\ominus_1 \wedge \ominus_2 \Rightarrow \textrm{individuo sano}
$$

$$
\oplus_1 \bigvee \ominus_1 \wedge \oplus_2 \Rightarrow \textbf{individuo malato}
$$

In questo caso, dato che se negativo il test viene sicuramente ripetuto ed essendo $\mathbf{SP}$ la probabilità a posteriori di avere un test negativo se l'individuo è sano $P(\ominus|\overline{M})$, la specificità totale sarà uguale al prodotto delle specificità dei due test che essendo uguali sarà dunque $\mathbf{SP}^2$. Per test ripetuti $n$ volte sarà dunque pari a 
  
$$
\mathbf{SP}_n = P(\ominus|\overline{M})_n = \bigcap_{i=1}^{n} P(\ominus|\overline{M}) = \prod_{i=1}^{n} \mathbf{SP}
= \mathbf{SP}^n
$$

Dato che invece il test viene ripetuto solo se precedentemente non positivo e che $\mathbf{SE}$ è la probabilità a posteriori di avere un test positivo se l'individuo è malato $P(\oplus|M)$, la sensibilità totale sarà pari alla sensibilità del primo test più la sensibilità del secondo a condizione che il primo non fosse positivo ovvero $\mathbf{SE}_1 + \mathbf{SE}_2 \cdot (1 - \mathbf{SE}_1)$ che essendo le sensibilità uguali per i due test si riduce a $2\mathbf{SE} - \mathbf{SE}^2$. 

Per $n$ test, dato che $P(\ominus|M)$ corrisponde al falso negativo ed è necessario che tutti i test siano negativi per essere ripetuti $n$ volte possiamo dire che i falsi negativi totali sono 

$$
P(\ominus|M)_{tot} = \bigcap_{i=1}^{n} P(\ominus|M)_i = \prod_{i=1}^{n} P(\ominus|M)_i = P(\ominus|M)^n
$$ 

ma visto che il falso negativo è complementare alla sensibilità 

$$
P(\ominus|M)=\overline{P(\oplus|M)}=1-P(\oplus|M)=1-\mathbf{SE}
$$ 

si può dire che 

$$
P(\ominus|M)_{tot}= \prod_{i=1}^{n}(1-\mathbf{SE})_i
$$ 

e sapendo che allo stesso modo la sensibilità è il complemento del falso negativo 

$$
\mathbf{SE}=P(\oplus|M)=1-P(\ominus|M)
$$ 

si può concludere che 

$$
\mathbf{SE}_{tot} = 1 - P(\ominus|M)_{tot} = 1 - \prod_{i=1}^{n}( 1 - \mathbf{SE} )_i
$$

Essendo i test uguali, come nei precedenti casi si ottiene

$$
\mathbf{SE}_{tot} = 1 - ( 1 - \mathbf{SE} )^n
$$

### Regola E (the AND rule)

Il test viene ripetuto solo se precedentemente positivo, è sufficiente che il primo o il secondo test siano negativi per escludere la malattia e solo se entrambi sono positivi è diagnosticata la patologia. La indicheremo come Regola $\mathbf{E}_{\oplus}$ (come la similare in parallelo)

$$
\oplus_1 \wedge \oplus_2 \Rightarrow \textbf{individuo malato}
$$

$$
\ominus_1 \bigvee \oplus_1 \wedge \ominus_2 \Rightarrow \textrm{individuo sano}
$$

In questo caso, dato che se positivo il test viene sicuramente ripetuto ed essendo $\mathbf{SE}$ la probabilità a posteriori di avere un test positivo se l'individuo è malato $P(\oplus|M)$, la sensibilità totale sarà uguale al prodotto delle sensibilità dei due test che essendo uguali sarà dunque $\mathbf{SE}^2$. Per test ripetuti $n$ volte sarà dunque pari a 

$$
\mathbf{SE}_n = P(\oplus|M)_n = \bigcap_{i=1}^{n} P(\oplus|M) = \prod_{i=1}^{n} \mathbf{SE}
= \mathbf{SE}^n
$$

Dato che invece il test viene ripetuto solo se precedentemente non negativo e che $\mathbf{SP}$ è la probabilità a posteriori di avere un test negativo se l'individuo è sano $P(\ominus|\overline{M})$, la specificità totale sarà pari alla specificità del primo test più la specificità del secondo a condizione che il primo non fosse negativo ovvero $\mathbf{SP}_1 + \mathbf{SP}_2 \cdot (1 - \mathbf{SP}_1)$ che, essendo le specificità uguali, si riduce a $2\mathbf{SP} - \mathbf{SP}^2$. 

Per $n$ test, dato che $P(\oplus|\overline{M})$ corrisponde al falso positivo ed è necessario che tutti i test siano positivi per essere ripetuti $n$ volte, possiamo dire che i falsi positivi totali sono 

$$
P(\oplus|\overline{M})_{tot} = \bigcap_{i=1}^{n} P(\oplus|\overline{M})_i = 
\prod_{i=1}^{n} P(\oplus|\overline{M})_i = P(\oplus|\overline{M})^n
$$ 

ma visto che il falso positivo è complementare alla specificità 

$$
P(\oplus|\overline{M})=\overline{P(\ominus|\overline{M})}=1-P(\ominus|\overline{M})=1-\mathbf{SP}
$$ 

si può dire che 

$$
P(\oplus|\overline{M})_{tot}= \prod_{i=1}^{n} (1-\mathbf{SP})_i
$$ 

e sapendo che allo stesso modo la specificità è il complemento del falso positivo

$$
\mathbf{SP}=P(\ominus|\overline{M})=1-P(\oplus|\overline{M})
$$ 

si può concludere che 

$$
\mathbf{SP}_{tot} = 1 - P(\oplus|\overline{M})_{tot} = 1 - \prod_{i=1}^{n}( 1 - \mathbf{SP} )_i
$$

Anche in questo caso dato i test sono uguali si ottiene quindi

$$
\mathbf{SP}_{tot} = 1 - ( 1 - \mathbf{SP} )^n
$$

## Falsi positivi e falsi negativi

Dunque nel caso di ripetizioni del medesimo test (dove si intende lo stesso tipo di test sul medesimo soggetto ma su prelievi o reperti differenti) specificità e sensibilità totali sono le stesse sia in caso la ripetizione fosse in parallelo o in serie (vedi tabella $\ref{tab:regole}$).

Notiamo come (vedi figura $\ref{fig:ripetizione}$), nel caso della regola $\mathbf{T}_{\oplus\ominus}$ (tutti i test necessari se in parallello o tutti i test ripetuti se in serie), sia sensibilità che specificità "degradino" rapidamente portando ben presto a percentuali inaccettabili di falsi positivi ($P(f_+)$) e falsi negativi ($P(f_-)$) loro complementari.

Ripetendo invece solo nel caso di test negativo (regola $\mathbf{O}_{\ominus}$) o di test positivo (regola $\mathbf{E}_{\oplus}$) rispettivamente sensibilità e specificità tendono presto a 1 portando rispettivamente $P(f_-)$ ed $P(f_+)$ (loro complementari) quasi a 0 ma al contempo i parametri rispettivamente di specificità e sensibilità degradano rapidamente, soprattutto se già inizialmente non sufficientemente elevati.

Quindi si può utilizzare 

- la regola $\mathbf{O}_{\ominus}$ per migliorare una bassa sensibilità, a patto di avere una buona specificità, riducendo i falsi negativi
- la regola $\mathbf{E}_{\oplus}$ per migliorare una bassa specificità, a patto di avere una buona sensibilità, riducendo i falsi positivi

In [11]:
display(
    Latex(
        r"""
\begin{table}
  \begin{center}
    \caption{Specificità, sensibilità e falsi per $n$ test ripetuti}
    \label{tab:regole}
    \begin{tabular}{c|c|c|c|c|}
        Regola & $\mathbf{SE}_{tot}$ & $P(f_-)$ & $\mathbf{SP}_{tot}$ & $P(f_+)$ \\
        \toprule
        \midrule
        $\mathbf{T}_{\oplus\ominus}$ & $\mathbf{SE}^n$ & $1-\mathbf{SE}^n$ & $\mathbf{SP}^n$ & $1-\mathbf{SP}^n$ \\
        \midrule
        $\mathbf{O}_{\ominus}$ & $1-(1-\mathbf{SE})^n$ & $(1-\mathbf{SE})^n$ & $\mathbf{SP}^n$ & $1-\mathbf{SP}^n$ \\
        \midrule
        $\mathbf{E}_{\oplus}$ & $\mathbf{SE}^n$ & $1-\mathbf{SE}^n$ & $1-(1-\mathbf{SP})^n$ & $(1-\mathbf{SP})^n$ \\
        \midrule
    \end{tabular}
  \end{center}
\end{table}
        """
    )
)

<IPython.core.display.Latex object>

In [12]:
SE = .95
SP = .82
n = 10

fig, ax = plt.subplots(1, 3, figsize=(15, 4), dpi=150)

fig.suptitle(f"Ripetizione di 10 test, $\mathbf{{SE}}={SE}$  $\mathbf{{SP}}={SP}$", fontsize=20, y=1.5)

ax[0].set_title("Ripetizione per tutti i test", y=1.6, fontsize=15)
ax[0].set_xlabel("Sensibilità", fontsize=15)
ax[0].set_ylabel("Specificità", fontsize=15)
ax[0].grid()
cellText = [[1, f"{SP:.2%}", f"{1-SP:.2%}", f"{SE:.2%}", f"{1-SE:.2%}"]]
ax[0].scatter(SE, SP, marker="$1$", s=100)
for i in range(n-1):
    SEn = SE ** (i+2)
    SPn = SP ** (i+2)
    ax[0].scatter(SEn, SPn, marker=f"${i+2}$", s=100)
    cellText.append([i+2, f"{SPn:.2%}", f"{1-SPn:.2%}", f"{SEn:.2%}", f"{1-SEn:.2%}"])
ax[0].table(cellText=cellText, colLabels=["TEST", "SP", "$f+$", "SE", "$f-$"], loc="top", fontsize=20,
            colColours=[(0,0,0,.05), (0,0,0,.25), (0,0,0,.1), (0,0,0,.25), (0,0,0,.1)])
    
ax[1].set_title("Regola O, ripetizione se $\ominus$", y=1.6, fontsize=15)
ax[1].set_xlabel("Sensibilità", fontsize=15)
ax[1].grid()
cellText = [[1, f"{SP:.2%}", f"{1-SP:.2%}", f"{SE:.2%}", f"{1-SE:.2%}"]]
ax[1].scatter(SE, SP, marker="$1$", s=100)
for i in range(n-1):
    SEn = 1 - (1 - SE) ** (i + 2)
    SPn = SP ** (i+2)
    ax[1].scatter(SEn, SPn, marker=f"${i+2}$", s=100)
    cellText.append([i+2, f"{SPn:.2%}", f"{1-SPn:.2%}", f"{SEn:.2%}", f"{1-SEn:.2%}"])
ax[1].table(cellText=cellText, colLabels=["TEST", "SP", "$f+$", "SE", "$f-$"], loc="top", fontsize=20,
           colColours=[(0,0,0,.05), (0,0,0,.25), (0,0,0,.1), (0,0,0,.25), (0,0,0,.1)])
    
ax[2].set_xlabel("Sensibilità", fontsize=15)
ax[2].grid()
cellText = [[1, f"{SP:.2%}", f"{1-SP:.2%}", f"{SE:.2%}", f"{1-SE:.2%}"]]
ax[2].scatter(SE, SP, marker="$1$", s=100)
for i in range(n-1):
    SPn = 1 - (1 - SP) ** (i + 2)
    SEn = SE ** (i+2)
    ax[2].scatter(SEn, SPn, marker=f"${i+2}$", s=100)
    cellText.append([i+2, f"{SPn:.2%}", f"{1-SPn:.2%}", f"{SEn:.2%}", f"{1-SEn:.2%}"])
ax[2].table(cellText=cellText, colLabels=["TEST", "SP", "$f+$", "SE", "$f-$"], loc="top", fontsize=20,
           colColours=[(0,0,0,.05), (0,0,0,.25), (0,0,0,.1), (0,0,0,.25), (0,0,0,.1)])
ax[2].set_title("Regola E, ripetizione se $\oplus$", y=1.6, fontsize=15)

latexplot(plt, "ripetizione",
         "Esempio di ripetizione di 10 test ed effetto delle regole su sensibilità e specificità.")

<IPython.core.display.Latex object>

# Sensibilità e Specificità

Mantenendo fissa la sensibilità a $.995$, variamo la specificità e viceversa

In [13]:
colors = ["b", "r", "m", "y"]
inc = .1

fig, ax = plt.subplots(1, 2, figsize=(15, 7))

# var spec
sens = .995
specs = [.995, .8, .5, .25]
for color, spec in zip(colors, specs):
    ax[0].plot(
        MAL,
        P_M_p(MAL, spec, sens),
        lw=3, label=fr"spec={spec}", c=color
    )
    ax[0].plot(
        MAL,
        1 - P_S_n(MAL, spec, sens),
        lw=3, c=color, ls="--"
    )

ax[0].plot([0,1], [0,1], c="g")
ax[0].set_ylabel("Probabilità di Malattia a $\mathbf{Posteriori}$", fontsize="xx-large")
ax[0].set_xlabel("Probabilità di Malattia a $\mathbf{Priori}$", fontsize="xx-large")
ax[0].legend(loc="best")

ax[0].axvline(inc, ls=":", c="k")
ax[0].axhline(p, c="k", alpha=.5)
ax[0].table(
    cellText=[
        [
            f"{spec:.3f} = {spec:.2%}", 
            f"{inc:.2f} = {inc:.2%}", 
            f'{P_M_p(inc, spec, sens):.4f} = {P_M_p(inc, spec, sens):.2%}', 
            f'{(1 - P_S_n(inc, spec, sens)):.4f} = {(1 - P_S_n(inc, spec, sens)):.2%}'
        ] for spec in specs
    ],
    colLabels=["Specificità", "Probabilità a Priori", "Test Positivo", "Test Negativo"],
    loc="top"
)
ax[0].set_title(
    f'Sensibilità {sens:.1%}', 
    pad=65, fontsize="xx-large")
ax[0].set_xlim(0, 1); ax[0].set_ylim(0, 1)

# var sens
senss = [.995, .8, .5, .25]
spec = .995
for color, sens in zip(colors, senss):
    ax[1].plot(
        MAL,
        P_M_p(MAL, spec, sens),
        lw=3, label=fr"sens={sens}", c=color
    )
    ax[1].plot(
        MAL,
        1 - P_S_n(MAL, spec, sens),
        lw=3, c=color, ls="--"
    )

ax[1].plot([0,1], [0,1], c="g")
ax[1].set_ylabel("Probabilità di Malattia a $\mathbf{Posteriori}$", fontsize="xx-large")
ax[1].set_xlabel("Probabilità di Malattia a $\mathbf{Priori}$", fontsize="xx-large")
ax[1].legend(loc="best")

ax[1].axvline(inc, ls=":", c="k")
ax[1].axhline(p, c="k", alpha=.5)
ax[1].table(
    cellText=[
        [
            f"{sens:.3f} = {sens:.2%}", 
            f"{inc:.2f} = {inc:.2%}", 
            f'{P_M_p(inc, spec, sens):.4f} = {P_M_p(inc, spec, sens):.2%}', 
            f'{(1 - P_S_n(inc, spec, sens)):.4f} = {(1 - P_S_n(inc, spec, sens)):.2%}'
        ] for sens in senss
    ],
    colLabels=["Sensibilità", "Probabilità a Priori", "Test Positivo", "Test Negativo"],
    loc="top"
)
ax[1].set_title(
    f'Specificità {spec:.1%}', 
    pad=65, fontsize="xx-large")
ax[1].set_xlim(0, 1); ax[1].set_ylim(0, 1)

latexplot(
    plt, "sens-spec",
    "Rapporto tra specificità e sensibilità. Le linee piene indicano $P(M|\oplus)$, le linee tratteggiate $P(M|\ominus).$"
)

<IPython.core.display.Latex object>

Notiamo come valori differenti di specificità a parità di sensibilità (o viceversa) abbiano effetti sia sulla probabilità a posteriori per test positivo che per test negativo sebbene

- variazioni nella specificità $P(\ominus|\overline{M})$ abbiano maggior effetto su $P(M|\oplus)$
- variazioni nella sensibilità $P(\oplus|M)$ abbiano maggior effetto su $P(\overline{M}|\ominus)$

In [14]:
colors = ["b", "r", "m", "y", "g"]
inc = .1
tickL = [i/10 for i in range(11)]

fig, ax = plt.subplots(1, 2, figsize=(15, 7))

# var spec
sens = [.001, .1, .5, .9, .999]
spec = np.linspace(.001, .999, 701)
for col, sen in zip(colors, sens):
    ax[0].plot(
        spec,
        P_M_p(inc, spec, sen),
        lw=3, label=fr"sens={sen:.3f}", c=col
    )
    ax[0].plot(
        spec,
        1 - P_S_n(inc, spec, sen), ls="--",
        lw=3, c=col
    )
ax[0].set_ylabel("Probabilità di Malattia a $\mathbf{Posteriori}$", fontsize="xx-large")
ax[0].set_xlabel("Specificità", fontsize="xx-large")
ax[0].legend(loc="best")
ax[0].axhline(inc, ls=":", c="k")
ax[0].set_title(f'Probabilità a priori {inc:.1%}', fontsize="xx-large")
#ax[0].set_xlim(0, 1); ax[0].set_ylim(0, 1)
ax[0].set_xticks(tickL)
ax[0].set_yticks(tickL)
ax[0].grid()

# var sens
sens = np.linspace(.001, .999, 701)
spec = [.001, .1, .5, .9, .999]
for col, spe in zip(colors, spec):
    ax[1].plot(
        sens,
        P_M_p(inc, spe, sens),
        lw=3, label=fr"spec={spe:.3f}", c=col
    )
    ax[1].plot(
        sens,
        1 - P_S_n(inc, spe, sens), ls="--",
        lw=3, c=col
    )
ax[1].set_ylabel("Probabilità di Malattia a $\mathbf{Posteriori}$", fontsize="xx-large")
ax[1].set_xlabel("Sensibilità", fontsize="xx-large")
ax[1].legend(loc="upper center")
ax[1].axhline(inc, ls=":", c="k")
ax[1].axhline(p, ls="--", c="g")
ax[1].set_title(f'Probabilità a priori {inc:.1%}', fontsize="xx-large")
#ax[1].set_xlim(0, 1); ax[1].set_ylim(0, 1)
ax[1].set_xticks(tickL)
ax[1].set_yticks(tickL)
ax[1].grid()

latexplot(
    plt, "sens-spec-2",
    "Rapporto tra specificità e sensibilità. Le linee piene indicano $P(M|\oplus)$, le linee tratteggiate $P(M|\ominus).$ " +
    "Si nota come sia necessario che i test abbiano determinate caratteristiche per poter essere utili."
)

<IPython.core.display.Latex object>

Si nota come sensibilità e specificità siano strettamente interconnesse. In particolare, data una probabilità di malattia a priori $P(M)$, si vuole che un test abbia

- una probabilità di malattia a posteriori dato test positivo almeno $P(M|\oplus)>P(M)$
- una probabilità di malattia a posteriori dato test negativo almeno $P(M|\ominus)<P(M)$

Per trovare i minimi requisiti di un test diagnostico dunque, data la probabilità di malattia a priori, si può risolvere il sistema a due equazioni

$$
\left\{\begin{matrix}
P(M|\oplus) > P(M) \\
P(M|\ominus) < P(M)
\end{matrix}\right.
$$

ma avendo stabilito $p_{\ominus}<.05$ per $P(M|\ominus)$ si può anche assumere $p_{\oplus}>.5$ per $P(M|\oplus)$ ovvero che la probabilità di malattia a posteriori dato test positivo sia almeno superiore al 50% come requisito minimo e $p_{\oplus}>.9$ (ovvero superiore al 90%) come requisito ottimale.

$$
\left\{\begin{matrix}
P(M|\oplus) > p_{\oplus} \\
P(M|\ominus) < p_{\ominus}
\end{matrix}\right.
$$

Nella realtà della pratica clinica, i valori limite $p_{\ominus}$ e $p_{\oplus}$ sono stabiliti secondo linee guida per ogni malattia dato il rischio per malattia non trattata, il rischio dovuto ai trattamenti (effetti collaterali e/o indesiderati), ulteriori fattori di rischio derivanti da storia clinica e anamnesi ecc.

In [15]:
p_plus_min = .5
p_plus_opt = .9

In [16]:
sens = np.linspace(.001, .999, 701)
spec = np.linspace(.001, .999, 701)
inc = .1

ticks = [70*i for i in range(11)]
tickL = [i/10 for i in range(11)]

fig, ax = plt.subplots(1, 2, figsize=(15, 6))
im0 = ax[0].pcolormesh(
    P_M_p(inc, spec, sens[:, None]), cmap="nipy_spectral",  # cmap="tab20",
    vmin=0, vmax=1
)
ax[0].plot([701, np.where(P_M_p(.1, spec, 1) >= p_plus_min)[0][0]],[0, 701], c="k", zorder=1)
ax[0].plot([701, np.where(P_M_p(.1, spec, 1) >= p_plus_opt)[0][0]],[0, 701], c="w", zorder=1)
ax[0].set_xticks(ticks)
ax[0].set_xticklabels(tickL)
ax[0].set_yticks(ticks)
ax[0].set_yticklabels(tickL)
ax[0].set_xlabel("Specificità")
ax[0].set_ylabel("Sensibilità")
ax[0].set_title(fr"$P(M|\oplus)$,   $P(M)={inc}$,   $p_{{\oplus}}>.5, .9$", fontsize=15)
plt.colorbar(im0, ax=ax[0], ticks=tickL)
#ax[0].grid()

im1 = ax[1].pcolormesh(
    1-P_S_n(inc, spec, sens[:, None]), cmap="nipy_spectral",  # cmap="tab20",
    vmin=0, vmax=1
)
ax[1].plot([0, 701], [701, np.where(1-P_S_n(.1, 1, sens) <= .05)[0][0]], c="w", zorder=1)
ax[1].set_xticks(ticks)
ax[1].set_xticklabels(tickL)
ax[1].set_yticks(ticks)
ax[1].set_yticklabels(tickL)
ax[1].set_xlabel("Specificità")
ax[1].set_ylabel("Sensibilità")
ax[1].set_title(fr"$P(M|\ominus)$,   $P(M)={inc}$,   $p_{{\ominus}}<.05$", fontsize=15)
plt.colorbar(im1, ax=ax[1], ticks=tickL)
#ax[1].grid()

latexplot(
    plt, "requisitimatrice10",
    "Requisiti per $P(M)=.1$. "+
    "L'area a destra della linea nera nell'immagine di sinistra è il requisito minimo per $P(M|\oplus)>.5$ "+
    " e a destra della linea bianca i requisito ideale per $p(M|\oplus)>.9$. " +
    "L'area a destra della linea bianca nell'immagine di destra è il requisito minimo per $P(M|\ominus)<.05$.",
    showme=False
)

<IPython.core.display.Latex object>

In [17]:
from matplotlib.colors import ListedColormap

sens = np.linspace(.001, .999, 701)
spec = np.linspace(.001, .999, 701)
inc = .1
cmp = ListedColormap([[0, 0, 0, 0], [.1, .5, .9, 1]])

ticks = [70*i for i in range(11)]
tickL = [i/10 for i in range(11)]

fig, ax = plt.subplots(1, 1, figsize=(6, 6))
im0 = ax.pcolormesh(
    np.logical_and(
        P_M_p(inc, spec, sens[:, None]) >= p_plus_min,
        1-P_S_n(inc, spec, sens[:, None]) <= .05
    ), cmap="gray_r",  # cmap="tab20",
    vmin=0, vmax=1
)
im1 = ax.pcolormesh(
    np.logical_and(
        P_M_p(inc, spec, sens[:, None]) >= p_plus_opt,
        1-P_S_n(inc, spec, sens[:, None]) <= .05
    ), cmap=cmp,  # cmap="tab20",
    vmin=0, vmax=1
)
ax.set_xticks(ticks)
ax.set_xticklabels(tickL)
ax.set_yticks(ticks)
ax.set_yticklabels(tickL)
ax.set_xlabel("Specificità $P(\ominus|\overline{M})$", fontsize=20)
ax.set_ylabel("Sensibilità $P(\oplus|M)$", fontsize=20)
ax.set_title(fr"Requisiti test per $P(M)={inc}$", fontsize=20)
ax.grid()

latexplot(
    plt, "requisiti10",
    "L'area nera indica i requisiti minimi necessari $P(M|\oplus)>.5$ e $P(M|\ominus)<.05$ per un test con $P(M)=.1$. "+
    "L'area azzurra i requisiti ottimali per $P(M|\oplus)>.9$.",
    single=True, showme=False
)

<IPython.core.display.Latex object>

# COVID-19 e tamponi naso-faringei

Studi recenti suggeriscono che i tamponi naso-faringei usati per la diagnosi di COVID-19 (RT-PCR SARS-CoV-2 RNA test) abbiano sensibilità $\mathbf{SE}=P(\oplus|M)=0.777$ e specificità di $\mathbf{SP}=P(\ominus|\overline{M})=0.988$ <cite data-cite="padhye2020reconstructed"></cite> e che la prevalenza di COVID-19 in Italia (in fase pandemica) sia circa pari a $P(M)=0.13$ <cite data-cite="ceylan2020estimation"></cite> <cite data-cite="vollmer2020sub"></cite> <cite data-cite="flaxman2020report"></cite>.

Verifichiamo che il test abbia i requisiti richiesti (figura $\ref{fig:requisiti13}$): il punto giallo indica i parametri di sensibilità e specificità dei test in esame per $P(M)=.13$, i test hanno quindi caratteristiche ottimali.

Si sottolinea che la presente è una semplice analisi matematica delle probabilità a posteriori in seguito ai risultati dei test. La valutazione dei risultati e delle conseguenti azioni (osservazione o isolamento domiciliare, trattamento farmacologico, ospedalizzazione, dimissione ecc) è presa in sede clinica in base anche ad anamnesi, tracciamento dei contatti, rischi terapeutici, rischi per malattia non trattata e rischi per poteziali infetti non isolati in base alle più recenti indicazioni pubblicate <cite data-cite="centers2020interim"></cite> <cite data-cite="bai2020presumed"></cite> <cite data-cite="national2020coronavirus"></cite>.

In [18]:
sens = np.linspace(.001, .999, 701)
spec = np.linspace(.001, .999, 701)
inc = .13

ticks = [70*i for i in range(11)]
tickL = [i/10 for i in range(11)]

fig, ax = plt.subplots(1, 1, figsize=(6, 6))
im0 = ax.pcolormesh(
    np.logical_and(
        P_M_p(inc, spec, sens[:, None]) >= p_plus_min,
        1-P_S_n(inc, spec, sens[:, None]) <= .05
    ), cmap="gray_r",  # cmap="tab20",
    vmin=0, vmax=1
)
im1 = ax.pcolormesh(
    np.logical_and(
        P_M_p(inc, spec, sens[:, None]) >= p_plus_opt,
        1-P_S_n(inc, spec, sens[:, None]) <= .05
    ), cmap=cmp,  # cmap="tab20",
    vmin=0, vmax=1
)
ax.scatter(.988*701, .777*701, c="yellow", s=40, ec="r")
ax.set_xticks(ticks)
ax.set_xticklabels(tickL)
ax.set_yticks(ticks)
ax.set_yticklabels(tickL)
ax.set_xlabel("Specificità $P(\ominus|\overline{M})$", fontsize=20)
ax.set_ylabel("Sensibilità $P(\oplus|M)$", fontsize=20)
ax.set_title(fr"Requisiti test per $P(M)={inc}$", fontsize=20)
ax.set_xlim(.8*701,1*701)
ax.set_ylim(.6*701,1*701)
ax.grid()

latexplot(
    plt, "requisiti13",
    "L'area nera indica i requisiti necessari $P(M|\oplus)>.5$ e $P(M|\ominus)<.05$ per un test con $P(M)=.13$ (azzurra ottimali per $P(M|\oplus)>.9$). Il punto giallo indica i parametri di sensibilità e specificità dei test RT-PCR SARS-CoV-2 RNA test per COVID-19: sensibilità $P(\oplus|M)=0.777$ e specificità di $P(\ominus|\overline{M})=0.988$",
    single=True, showme=False
)

<IPython.core.display.Latex object>

Vediamo come si modificano le curve delle probabilità a posteriori impostando questi tre parametri (figura $\ref{fig:covid}$).

In [19]:
sens = .777
spec = .988

Anche in questo caso dunque è sufficiente un test negativo per ritenere sano un soggetto su cui non si abbiano precedenti informazioni.

In [20]:
display(Markdown(fr"""
$$
P(M|\ominus) = {1-P_S_n(inc, spec, sens):.4f} < p_{{\ominus}} = {p}
$$
"""))


$$
P(M|\ominus) = 0.0326 < p_{\ominus} = 0.05
$$


Se invece un soggetto risultasse positivo (punto nero in figura $\ref{fig:covid}$), la sua probabilità di essere malato passerebbe da $0.13$ (prevalenza stimata di COVID-19 in Italia in fase pandemica) a

In [21]:
display(Markdown(fr"""
$$
P(M|\oplus) = {P_M_p(inc, spec, sens):.4f} > p_{{\oplus}} = .9
$$
"""))


$$
P(M|\oplus) = 0.9063 > p_{\oplus} = .9
$$


Recentemente per pazienti dimessi affetti da COVID-19, si effettuano 3 test (tampone naso-faringeo RT-PCR RNA) di controllo: uno alla dimissione (se negativo), uno dopo una settimana circa e il terzo dopo un'altra settimana circa. Se i test sono negativi vengono ripetuti, se tutti i tre test risultano negativi è esclusa definitavamente la malattia e il paziente è ritenuto guarito.

Quindi si tratta di una ripetizione seriale di tre test con regola $\mathbf{O}_{\ominus}$: un solo test positivo è sufficiente a ritenere il paziente ancora malato e tutti i tre test negativi sono necessari a ritenerlo sano.

In [22]:
display(Markdown(fr"""
La condizione di partenza è pertanto di falsi positivi

$$
P(f_+) = P(\oplus|\overline{{M}}) = 1 - \mathbf{{SP}} = {1-spec:.6f} \simeq {(1-.988)*100:.2f}\%
$$

e falsi negativi

$$
P(f_-) = P(\ominus|M) = 1 - \mathbf{{SE}} = {1-sens:.6f} \simeq {(1-.777)*100:.2f}\%
$$
"""))


La condizione di partenza è pertanto di falsi positivi

$$
P(f_+) = P(\oplus|\overline{M}) = 1 - \mathbf{SP} = 0.012000 \simeq 1.20\%
$$

e falsi negativi

$$
P(f_-) = P(\ominus|M) = 1 - \mathbf{SE} = 0.223000 \simeq 22.30\%
$$


In [23]:
display(Markdown(fr"""
Applicando il test ripetuto con regola $\mathbf{{O}}_{{\ominus}}$ e le formule derivate sopra abbiamo quindi:

$$
\mathbf{{SE}}_{{tot}} = 1 - (1 - \mathbf{{SE}})^3 = 1 - (1 - \mathbf{{.777}})^3 = {1-(1-sens)**3:.6f}
$$

$$
\mathbf{{SP}}_{{tot}} = \mathbf{{SP}}^3 = \mathbf{{.988}}^3 = {spec**3:.6f}
$$

aumentando dunque la sensibilità inizialmente bassa e non degradando eccessivamente la specificità, 
infatti otteniamo una percentuale di falsi positivi lievemente aumentata

$$
P(f_+) = P(\oplus|\overline{{M}}) = 1 - \mathbf{{SP}} = {1-spec**3:.6f} \simeq {(1-spec**3)*100:.2f}\%
$$

e una percentuale di falsi negativi notevolmente ridotta

$$
P(f_-) = P(\ominus|M) = 1 - \mathbf{{SE}} = {1-(1-(1-sens)**3):.6f} \simeq {(1-sens)**3*100:.2f}\%
$$

Vedi riquadro e corrispondente tabella in figura $\ref{{fig:ripetizione-covid}}$.
"""))


Applicando il test ripetuto con regola $\mathbf{O}_{\ominus}$ e le formule derivate sopra abbiamo quindi:

$$
\mathbf{SE}_{tot} = 1 - (1 - \mathbf{SE})^3 = 1 - (1 - \mathbf{.777})^3 = 0.988910
$$

$$
\mathbf{SP}_{tot} = \mathbf{SP}^3 = \mathbf{.988}^3 = 0.964430
$$

aumentando dunque la sensibilità inizialmente bassa e non degradando eccessivamente la specificità, 
infatti otteniamo una percentuale di falsi positivi lievemente aumentata

$$
P(f_+) = P(\oplus|\overline{M}) = 1 - \mathbf{SP} = 0.035570 \simeq 3.56\%
$$

e una percentuale di falsi negativi notevolmente ridotta

$$
P(f_-) = P(\ominus|M) = 1 - \mathbf{SE} = 0.011090 \simeq 1.11\%
$$

Vedi riquadro e corrispondente tabella in figura $\ref{fig:ripetizione-covid}$.


In [24]:
SE = sens
SP = spec
n = 10

COVID_SE = [SE]
COVID_SP = [SP]

fig, ax = plt.subplots(1, 3, figsize=(15, 4), dpi=150)

fig.suptitle(f"Ripetizione di 10 test, $\mathbf{{SE}}={SE}$  $\mathbf{{SP}}={SP}$", fontsize=20, y=1.5)

ax[0].set_title("Ripetizione per tutti i test", y=1.6, fontsize=15)
ax[0].set_xlabel("Sensibilità", fontsize=15)
ax[0].set_ylabel("Specificità", fontsize=15)
ax[0].grid()
cellText = [[1, f"{SP:.2%}", f"{1-SP:.2%}", f"{SE:.2%}", f"{1-SE:.2%}"]]
ax[0].scatter(SE, SP, marker="$1$", s=100)
for i in range(n-1):
    SEn = SE ** (i+2)
    SPn = SP ** (i+2)
    ax[0].scatter(SEn, SPn, marker=f"${i+2}$", s=100)
    cellText.append([i+2, f"{SPn:.2%}", f"{1-SPn:.2%}", f"{SEn:.2%}", f"{1-SEn:.2%}"])
ax[0].table(cellText=cellText, colLabels=["TEST", "SP", "f $+$", "SE", "f $-$"], loc="top", fontsize=20,
            colColours=[(0,0,0,.05), (0,0,0,.25), (0,0,0,.1), (0,0,0,.25), (0,0,0,.1)])
    
ax[1].set_title("Regola O, ripetizione se $\ominus$", y=1.6, fontsize=15)
ax[1].set_xlabel("Sensibilità", fontsize=15)
ax[1].grid()
cellText = [[1, f"{SP:.2%}", f"{1-SP:.2%}", f"{SE:.2%}", f"{1-SE:.2%}"]]
ax[1].scatter(SE, SP, marker="$1$", s=100)
for i in range(n-1):
    SEn = 1 - (1 - SE) ** (i + 2)
    SPn = SP ** (i+2)
    COVID_SE.append(SEn)
    COVID_SP.append(SPn)
    ax[1].scatter(SEn, SPn, marker=f"${i+2}$", s=100)
    cellText.append([i+2, f"{SPn:.2%}", f"{1-SPn:.2%}", f"{SEn:.2%}", f"{1-SEn:.2%}"])
ax[1].table(
    cellText=cellText, 
    colLabels=["TEST", "SP", "f $+$", "SE", "f $-$"], 
    loc="top", fontsize=20,
    colColours=[(0,0,0,.05), (0,0,0,.25), (0,0,0,.1), (0,0,0,.25), (0,0,0,.1)],
    cellColours=[
        [(1,1,0,.5) for _ in range(5)], [(1,1,0,.5) for _ in range(5)], [(1,1,0,.5) for _ in range(5)],
        [(1,1,1,1) for _ in range(5)],[(1,1,1,1) for _ in range(5)],[(1,1,1,1) for _ in range(5)],
        [(1,1,1,1) for _ in range(5)],[(1,1,1,1) for _ in range(5)],[(1,1,1,1) for _ in range(5)],
        [(1,1,1,1) for _ in range(5)],
    ]
)
    
ax[2].set_xlabel("Sensibilità", fontsize=15)
ax[2].grid()
cellText = [[1, f"{SP:.2%}", f"{1-SP:.2%}", f"{SE:.2%}", f"{1-SE:.2%}"]]
ax[2].scatter(SE, SP, marker="$1$", s=100)
for i in range(n-1):
    SPn = 1 - (1 - SP) ** (i + 2)
    SEn = SE ** (i+2)
    ax[2].scatter(SEn, SPn, marker=f"${i+2}$", s=100)
    cellText.append([i+2, f"{SPn:.2%}", f"{1-SPn:.2%}", f"{SEn:.2%}", f"{1-SEn:.2%}"])
ax[2].table(cellText=cellText, colLabels=["TEST", "SP", "f $+$", "SE", "f $-$"], loc="top", fontsize=20,
           colColours=[(0,0,0,.05), (0,0,0,.25), (0,0,0,.1), (0,0,0,.25), (0,0,0,.1)])
ax[2].set_title("Regola E, ripetizione se $\oplus$", y=1.6, fontsize=15)

rect = patches.Rectangle((.77,.992),.235,-.035,linewidth=1,edgecolor='r',facecolor='none')
ax[1].add_patch(rect)

latexplot(plt, "ripetizione-covid",
         "Effetto delle regole di ripetizione sui test RT-PCR per COVID-19")

<IPython.core.display.Latex object>

In [25]:
# COVID-TEST

fig, ax = plt.subplots(figsize=(7, 7))
plt.plot(
    MAL,
    P_M_p(MAL, spec, sens),
    lw=4, label="TEST positivo", c="b"
)
plt.plot(
    MAL,
    1 - P_S_n(MAL, spec, sens),
    lw=4, label="TEST negativo", c="r"
)
for z in range(3):
    plt.plot(
        MAL,
        P_M_p(MAL, COVID_SP[z+1], COVID_SE[z+1]),
        lw=3-z, c="b", ls=":"
    )
    plt.plot(
        MAL,
        1 - P_S_n(MAL, COVID_SP[z+1], COVID_SE[z+1]),
        lw=3-z, c="r", ls=":"
    )
plt.scatter(
    inc,
    P_M_p(inc, spec, sens),
    c="k", s=50, zorder=5,
)
x = P_M_p(inc, spec, sens)
for i in range(4):
    y = 1 - P_S_n(x, COVID_SP[i], COVID_SE[i])
    plt.scatter(x, y,
        c="k", s=100, marker=f"${i+1}$", zorder=10
    )
    x = y
plt.plot([0,1], [0,1], c="g")
plt.ylabel("Probabilità di Malattia a $\mathbf{Posteriori}$", fontsize="xx-large")
plt.xlabel("Probabilità di Malattia a $\mathbf{Priori}$", fontsize="xx-large")
plt.legend(loc="best")

plt.axvline(inc, ls=":", c="k")
plt.axhline(p, c="k", alpha=.5)
plt.axhline(p_plus_min, ls="--", c="k", alpha=.5)
plt.axhline(p_plus_opt, c="k", alpha=.5)
plt.table(
    cellText=[
        [
            f"{inc:.4f} = {inc:.2%}", 
            f'{P_M_p(inc, spec, sens):.4f} = {P_M_p(inc, spec, sens):.2%}', 
            f'{(1 - P_S_n(inc, spec, sens)):.4f} = {(1 - P_S_n(inc, spec, sens)):.2%}'
        ],
    ],
    colLabels=["Probabilità a Priori", "Test Positivo", "Test Negativo"],
    loc="top"
)
plt.title(
    f'Sensibilità {sens:.1%}  &  Specificità {spec:.1%}', 
    pad=45, fontsize=15)
plt.xlim(0, 1); plt.ylim(0, 1)

plt.arrow(.15, .9, .7, -.2, length_includes_head=True, head_width=.025, lw=1, color="y")

latexplot(
    plt, "covid",
    "Probabilità di malattia COVID-19 a posteriori per test RT-PCR SARS-CoV-2 RNA.",
    single=True, showme=False
)

<IPython.core.display.Latex object>

Vediamo quindi la probabilità a posteriori per test negativo $P(M|\ominus)$ con la probabilità a priori di un soggetto precedentemente risultato positivo (punto 1 in figura $\ref{fig:covid}$)

In [26]:
prior = P_M_p(inc, COVID_SP[0], COVID_SE[0])
new_posterior = 1 - P_S_n(prior, COVID_SP[0], COVID_SE[0])
display(Markdown(fr"""
$$
P(M|\ominus)_1 = 1 - \frac{{
\mathbf{{SP}}(1 - P(M))
}}{{
\mathbf{{SP}}(1 - P(M)) + (1 - \mathbf{{SE}})P(M)
}} = 
1 - \frac{{
{COVID_SP[0]:.3f}(1 - {prior:.3f})
}}{{
{COVID_SP[0]:.3f}(1 - {prior:.3f}) + (1 - {COVID_SE[0]:.3f}){prior:.3f}
}} =
{new_posterior:.4f}
$$
"""))
new_prior = new_posterior


$$
P(M|\ominus)_1 = 1 - \frac{
\mathbf{SP}(1 - P(M))
}{
\mathbf{SP}(1 - P(M)) + (1 - \mathbf{SE})P(M)
} = 
1 - \frac{
0.988(1 - 0.906)
}{
0.988(1 - 0.906) + (1 - 0.777)0.906
} =
0.6859
$$


Dunque un tampone negativo non è sufficiente, il soggetto ha ancora un'elevata probabilità di essere infetto, supponiamo che ne venga fatto un secondo tenendo conto delle modifiche subite da sensibilità e specificità con regola $\mathbf{O}_{\ominus}$ (punto 2 in figura $\ref{fig:covid}$)

In [27]:
new_posterior = 1 - P_S_n(new_prior, COVID_SP[1], COVID_SE[1])
display(Markdown(fr"""
$$
P(M|\ominus)_2 = 1 - \frac{{
\mathbf{{SP}}(1 - P(M))
}}{{
\mathbf{{SP}}(1 - P(M)) + (1 - \mathbf{{SE}})P(M)
}} = 
1 - \frac{{
{COVID_SP[1]:.3f}(1 - {new_prior:.3f})
}}{{
{COVID_SP[1]:.3f}(1 - {new_prior:.3f}) + (1 - {COVID_SE[1]:.3f}){new_prior:.3f}
}} =
{new_posterior:.4f}
$$

Ancora superiore, ${new_posterior:.2%}$% di probabilità di essere infetto non è accettabile per ritenere guarito il paziente.
Effettuiamo un terzo test ricordando che sensibilità e specificità si modificano di conseguenza per la regola 
$\mathbf{{O}}_{{\ominus}}$
(punto 3 in figura $\ref{{fig:covid}}$)
"""))
new_prior = new_posterior


$$
P(M|\ominus)_2 = 1 - \frac{
\mathbf{SP}(1 - P(M))
}{
\mathbf{SP}(1 - P(M)) + (1 - \mathbf{SE})P(M)
} = 
1 - \frac{
0.976(1 - 0.686)
}{
0.976(1 - 0.686) + (1 - 0.950)0.686
} =
0.1001
$$

Ancora superiore, $10.01%$% di probabilità di essere infetto non è accettabile per ritenere guarito il paziente.
Effettuiamo un terzo test ricordando che sensibilità e specificità si modificano di conseguenza per la regola 
$\mathbf{O}_{\ominus}$
(punto 3 in figura $\ref{fig:covid}$)


In [28]:
new_posterior = 1 - P_S_n(new_prior, COVID_SP[2], COVID_SE[2])
display(Markdown(fr"""
$$
P(M|\ominus)_3 = 1 - \frac{{
\mathbf{{SP}}(1 - P(M))
}}{{
\mathbf{{SP}}(1 - P(M)) + (1 - \mathbf{{SE}})P(M)
}} = 
1 - \frac{{
{COVID_SP[2]:.3f}(1 - {new_prior:.3f})
}}{{
{COVID_SP[2]:.3f}(1 - {new_prior:.3f}) + (1 - {COVID_SE[2]:.3f}){new_prior:.3f}
}} =
{new_posterior:.4f}
$$

${new_posterior:.2%}$% è inferiore a $p_{{\ominus}}$ stabilito in precedenza, 
dunque effettuare un quarto test non è necessario e, così facendo, 
aumenteremmo a livelli non più accettabili i falsi negativi, per la degradazione della specificità data 
dalla regola $\mathbf{{O}}_{{\ominus}}$ utilizzata.
"""))
new_prior = new_posterior


$$
P(M|\ominus)_3 = 1 - \frac{
\mathbf{SP}(1 - P(M))
}{
\mathbf{SP}(1 - P(M)) + (1 - \mathbf{SE})P(M)
} = 
1 - \frac{
0.964(1 - 0.100)
}{
0.964(1 - 0.100) + (1 - 0.989)0.100
} =
0.0013
$$

$0.13%$% è inferiore a $p_{\ominus}$ stabilito in precedenza, 
dunque effettuare un quarto test non è necessario e, così facendo, 
aumenteremmo a livelli non più accettabili i falsi negativi, per la degradazione della specificità data 
dalla regola $\mathbf{O}_{\ominus}$ utilizzata.


In [29]:
new_posterior = 1 - P_S_n(new_prior, COVID_SP[3], COVID_SE[3])
display(Markdown(fr"""
Se infatti effettuassimo un quarto test

$$
P(M|\ominus)_4 = 1 - \frac{{
\mathbf{{SP}}(1 - P(M))
}}{{
\mathbf{{SP}}(1 - P(M)) + (1 - \mathbf{{SE}})P(M)
}} = 
1 - \frac{{
{COVID_SP[3]:.3f}(1 - {new_prior:.3f})
}}{{
{COVID_SP[3]:.3f}(1 - {new_prior:.3f}) + (1 - {COVID_SE[3]:.3f}){new_prior:.3f}
}} \simeq
{new_posterior:.4f}
$$

otterremmo quasi ${new_posterior:.2%}$% di probabilità di essere infetto ma 
avremmo aumentato il rischio di falsi negativi

$$
P(f_-) = {(1 - COVID_SP[3])*100:.2f}\%
$$
"""))


Se infatti effettuassimo un quarto test

$$
P(M|\ominus)_4 = 1 - \frac{
\mathbf{SP}(1 - P(M))
}{
\mathbf{SP}(1 - P(M)) + (1 - \mathbf{SE})P(M)
} = 
1 - \frac{
0.953(1 - 0.001)
}{
0.953(1 - 0.001) + (1 - 0.998)0.001
} \simeq
0.0000
$$

otterremmo quasi $0.00%$% di probabilità di essere infetto ma 
avremmo aumentato il rischio di falsi negativi

$$
P(f_-) = 4.71\%
$$


# COVID-19 e test sierologici rapidi

Nella cosiddetta "fase-2" verranno probabilmente utilizzati test sierologici rapidi (**RDT**) <cite data-cite="rdtdiagram"></cite>.

I test RDT evidenziano la presenza di immunoglobuline (anticorpi) di tipo IgM (risposta primaria) e IgG (risposta secondaria) nel siero. Le concentrazioni di IgM e IgG variano a seconda del periodo trascorso dall'infezione e sono differenti in caso di prima o seconda esposizione. Attualmente non ci sono sufficienti informazioni su SARS-nCoV-2 per determinare con certezza la cinetica della risposta immunitaria ma alcuni studi hanno suggerito delle ipotesi plausibili, in base ai dati di altri coronavirus noti e a recenti studi su piccoli gruppi di pazienti affetti da COVID-19 <cite data-cite="thevarajan2020breadth"></cite> <cite data-cite="liu2020viral"></cite> <cite data-cite="lauer2020incubation"></cite> <cite data-cite="margiottirapid"></cite> <cite data-cite="wan2003ifa"></cite> <cite data-cite="racine2009igm"></cite>. 

La figura $\ref{fig:ig}$ mostra un sunto delle attuali ipotesi: alla prima esposizione concentrazioni di IgM sono misurabili dopo 10 giorni circa dall'infezione e 3 dalla comparsa dei sintomi con un massimo 12-13 giorni dopo l'infezione; livelli di IgG sono misurabili 11-12 giorni dopo l'infezione con un massimo a 20 giorni. Dopo circa 30 giorni i livelli di IgM e IgG non sono più misurabili. Dalla seconda esposizione in poi basse concentrazioni di IgM e IgG sono misurabili 4-5 giorni dopo l'infezione; dopo circa 10 giorni i livelli di IgM sono più misurabili mentre si riscontrano alte concentrazioni di IgG con un massimo a 15 giorni per poi calare molto lentamente. Il periodo di maggior rischio di contagio alla prima esposizione coincide grosso modo con l'espressione di IgM, ovvero tra i 9-10 e i 15-16 giorni dall'infezione ed è medio per tutto il resto del periodo sintomatico ovvero tra i 6-7 e i 25-26 giorni dall'infezione. Alla seconda esposizione un basso rischio di contagio è probabile solamente durante l'espressione di IgM tra i 4-5 e 9-10 giorni dall'esposizione. Non si hanno sufficienti informazioni rispetto ai portatori sani e al primo periodo asintomatico fino a 5-6 giorni dalla prima esposizione.

Dunque il riscontro di IgM indica sicuramente un'esposizione al virus 4-16 giorni prima e livelli di IgG un'esposizione tra 11-30+ giorni prima ed avvenuta immunizzazione (le IgG sono prodotte dai linfociti B della memoria e rispondono ad alte concentrazione soprattutto nelle eposizioni successive). Il mancato riscontro però di immunoglobuline nel siero non assicura che il soggetto non sia venuto a contatto con il virus e/o che non abbia guadagnato immunità perché potrebbe trovarsi nel periodo tra la prima e, l'eventuale, seconda esposizione.

Specificità e sensibilità dichiarate sono piuttosto variabili nei test RDT <cite data-cite="rdt"></cite>, vedi tabella $\ref{tab:rdtall}$ e $\ref{tab:rdtstats}$. I valori dovranno essere validati con test e pratica clinica, per ora saranno utilizzati i dati pubblicati dalle case produttrici.

In [30]:
def gaussian(x, a, b, c):
    d = - ((x - b) ** 2)
    return a * np.exp( d / (c ** 2) )

def line(x, x1, x2, y1, y2):
    return (x - x1) * ( (y2 - y1) / (x2 - x1) ) + y1

desease_a = 7
desease_z = desease_a + 19
igM_m_day = (12+15)/2
igM_m_lev = 50
igM2_m_day = (12+15)/4
igM2_m_lev = 30/1.5
igG_m_day = 20
igG_m_lev = 60
igG2_m_day = 15
igG2_m_lev = 60*1.5

x = np.linspace(0, 42, 200)
IgM = gaussian(x, igM_m_lev, igM_m_day, 1.75)
IgG = gaussian(x, igG_m_lev, igG_m_day, 4)
IgM2 = gaussian(x, igM2_m_lev, igM2_m_day, 1.75)
IgG2a = gaussian(x[np.where(x<igG2_m_day)], igG2_m_lev, igG2_m_day, 5)
IgG2b = line(x[np.where(x>=igG2_m_day)], igG2_m_day, x[-1], IgG2a[-1], IgG2a[-1]/1.25)
IgG2 = np.concatenate((IgG2a, IgG2b))


ylim = 100
prop_cycle = plt.rcParams['axes.prop_cycle']
colors = prop_cycle.by_key()['color']

fig, ax = plt.subplots(1, 2, figsize=(15, 5))

# prima
ax[0].fill_betweenx([0,ylim], 0, desease_a, color="k", alpha=.1, label="Periodo asintomatico")
ax[0].fill_betweenx([0,ylim], desease_a, desease_z, color="g", alpha=.1, label="Periodo sintomatico")
#ax[0].axvline(igM_m_day, ls=":", c=colors[0])
ax[0].plot(x, IgM, lw=8, c=colors[0], zorder=3, label="IgM")
#ax[0].axvline(igG_m_day, ls=":", c=colors[1])
ax[0].plot(x, IgG, c=colors[1], lw=8, label="IgG")
ax[0].set_ylim(-10, ylim)
ax[0].set_yticks([])
ax[0].set_ylabel("Concentrazione anticorpi nel siero")
ax[0].set_xlim(0, 32)
ax[0].set_xlabel("Giorni dall'infezione e rischio di contagio")
rect1 = patches.Rectangle((0,-5),5,3,linewidth=1,edgecolor='g',facecolor='g',alpha=.5)
ax[0].add_patch(rect1)
rect2 = patches.Rectangle((5,-5),4,3,linewidth=1,edgecolor='y',facecolor='y',alpha=.5)
ax[0].add_patch(rect2)
rect3 = patches.Rectangle((9,-5),6,3,linewidth=1,edgecolor='r',facecolor='r',alpha=.5)
ax[0].add_patch(rect3)
rect4 = patches.Rectangle((15,-5),11,3,linewidth=1,edgecolor='y',facecolor='y',alpha=.5)
ax[0].add_patch(rect4)
rect5 = patches.Rectangle((26,-5),10,3,linewidth=1,edgecolor='g',facecolor='g',alpha=.5)
ax[0].add_patch(rect5)
ax[0].legend(loc="upper left")
ax[0].set_title("Prima esposizione", fontsize=20)
ax[0].text(2.5, -9, r"Nessuno", ha="center")
ax[0].text(7, -9, r"Medio", ha="center")
ax[0].text(12, -9, r"Alto", ha="center")
ax[0].text(20, -9, r"Medio", ha="center")
ax[0].text(29, -9, r"Nessuno", ha="center")

# seconda
#ax[1].axvline(igM2_m_day, ls=":", c=colors[0])
ax[1].plot(x, IgM2, lw=8, c=colors[0], zorder=3, label="IgM")
#ax[1].axvline(igG2_m_day, ls=":", c=colors[1])
ax[1].plot(x, IgG2, c=colors[1], lw=8, label="IgG")
ax[1].set_ylim(-10, ylim)
ax[1].set_yticks([])
ax[1].set_ylabel("Concentrazione anticorpi nel siero")
ax[1].set_xlim(0, 32)
ax[1].set_xlabel("Giorni dall'infezione e rischio di contagio")
ax[1].legend(loc="upper left")
ax[1].set_title("Seconda esposizione", fontsize=20)
rect1 = patches.Rectangle((0,-5),4,3,linewidth=1,edgecolor='g',facecolor='g',alpha=.5)
ax[1].add_patch(rect1)
rect2 = patches.Rectangle((4,-5),5,3,linewidth=1,edgecolor='y',facecolor='y',alpha=.25)
ax[1].add_patch(rect2)
rect3 = patches.Rectangle((9,-5),30,3,linewidth=1,edgecolor='g',facecolor='g',alpha=.5)
ax[1].add_patch(rect3)
ax[1].text(2, -9, r"Nessuno", ha="center")
ax[1].text(6.5, -9, r"Basso", ha="center")
ax[1].text(15, -9, r"Nessuno", ha="center")

latexplot(plt, "ig",
          "Ipotesi di cinetica della risposta immunitaria per COVID-19. "+
          "Le concentrazione anticorpali sono solo livelli indicativi, non effettivi.")

<IPython.core.display.Latex object>

In [31]:
RDTsenss = np.array([.938, .9735, .9255, .82, 1, .969, .886, .841, .87, .91, .82, .95, .931, .931, .934, .9585])

RDTspecs = np.array([.956, .99, 1, .97, .987, .994, .9063, .923, .955, .967, .96, 1, 1, .991, .977, .9935])

In [32]:
t = r"\\ \midrule ".join([f"{i+1} & {se} & {(1-se)*100:.2f}\% & {sp} & {(1-sp)*100:.2f}\%" for i, (sp, se) in enumerate(zip(RDTspecs, RDTsenss))])

In [33]:
display(
    Latex(
        fr"""
\begin{{table}}
  \begin{{center}}
    \caption{{Specificità e sensibilità di alcuni test rapidi RDT}}
    \label{{tab:rdtall}}
    \begin{{tabular}}{{c|c|c|c|c|}}
        & $\mathbf{{SE}}$ & $P(f_-)$ & $\mathbf{{SP}}$ & $P(f_+)$ \\
        \toprule
        \midrule
        {t}
    \end{{tabular}}
  \end{{center}}
\end{{table}}
        """
    )
)

<IPython.core.display.Latex object>

In [34]:
sens = np.linspace(.001, .999, 701)
spec = np.linspace(.001, .999, 701)
inc = .13

ticks = [70*i for i in range(11)]
tickL = [i/10 for i in range(11)]

fig, ax = plt.subplots(1, 2, figsize=(12, 6))

ax[0].scatter(RDTspecs, RDTsenss, zorder=5, c="r", s=50, ec="k")
ax[0].set_xlim(.8, 1.01)
ax[0].set_ylim(.8, 1.01)
ax[0].axvline(1, c="k")
ax[0].axhline(1, c="k")
ax[0].set_title("Parametri test RDT", fontsize=20)
ax[0].set_xlabel("Specificità $P(\ominus|\overline{M})$", fontsize=15)
ax[0].set_ylabel("Sensibilità $P(\oplus|M)$", fontsize=15)
ax[0].grid()

im0 = ax[1].pcolormesh(
    np.logical_and(
        P_M_p(inc, spec, sens[:, None]) >= p_plus_min,
        1-P_S_n(inc, spec, sens[:, None]) <= .05
    ), cmap="gray_r",  # cmap="tab20",
    vmin=0, vmax=1
)
im0 = ax[1].pcolormesh(
    np.logical_and(
        P_M_p(inc, spec, sens[:, None]) >= p_plus_opt,
        1-P_S_n(inc, spec, sens[:, None]) <= .05
    ), cmap=cmp,  # cmap="tab20",
    vmin=0, vmax=1
)
ax[1].scatter(RDTspecs*701, RDTsenss*701, c="yellow", s=40, ec="r")
ax[1].set_xticks(ticks)
ax[1].set_xticklabels(tickL)
ax[1].set_yticks(ticks)
ax[1].set_yticklabels(tickL)
ax[1].set_xlabel("Specificità $P(\ominus|\overline{M})$", fontsize=15)
ax[1].set_ylabel("Sensibilità $P(\oplus|M)$", fontsize=15)
ax[1].set_title(fr"Requisiti test per $P(M)={inc}$", fontsize=20)
ax[1].set_xlim(.8*701, 1.01*701)
ax[1].set_ylim(.6*701, 1.01*701)
ax[1].grid()

latexplot(
    plt, "requisitiRDT",
    "L'area nera indica i requisiti necessari $P(M|\oplus)>.5$ e $P(M|\ominus)<.05$ per un test con $P(M)=.13$. Il punti gialli indicano i parametri di sensibilità e specificità dei test RDT per COVID-19.",
    showme=False
)

<IPython.core.display.Latex object>

I parametri di specificità e sensibilità sono nell'area dei parametri minimi accettabili stabiliti in precedenza, figura $\ref{fig:requisitiRDT}$ e per metà dei test i parametri risultano ottimali.

Verifichiamo le probabilità a posteriori per i test con minor sensibilità o specificità (figura $\ref{fig:covidrdtpeggio}$) e con maggior sensibilità o specificità (figura $\ref{fig:covidrdtmeglio}$).

In [35]:
RDTsenss_df = pd.DataFrame(RDTsenss)
RDTsenss_desc = RDTsenss_df.describe()

In [36]:
RDTspecs_df = pd.DataFrame(RDTspecs)
RDTspecs_desc = RDTspecs_df.describe()

In [37]:
display(
    Latex(
        fr"""
\begin{{table}}
  \begin{{center}}
    \caption{{Specificità e sensibilità dei test rapidi RDT}}
    \label{{tab:rdtstats}}
    \begin{{tabular}}{{c|c|c|c|c|c|}}
        & n & mean & std & min & max \\
        \toprule
        Sensibilità & {RDTsenss_desc[0]["count"]:.0f} & {RDTsenss_desc[0]["mean"]:.3f} & {RDTsenss_desc[0]["std"]:.3f}
        & {RDTsenss_desc[0]["min"]:.3f} & {RDTsenss_desc[0]["max"]:.3f} \\
        \midrule
        Specificità & {RDTspecs_desc[0]["count"]:.0f} & {RDTspecs_desc[0]["mean"]:.3f} & {RDTspecs_desc[0]["std"]:.3f}
        & {RDTspecs_desc[0]["min"]:.3f} & {RDTspecs_desc[0]["max"]:.3f} \\
    \end{{tabular}}
  \end{{center}}
\end{{table}}
        """
    )
)

<IPython.core.display.Latex object>

In [38]:
rdt_df = pd.DataFrame([RDTspecs, RDTsenss], index=["spec", "sens"])

fig, ax = plt.subplots(1, 2, figsize=(15, 7))

for i, P in enumerate(["spec", "sens"]):
    spec, sens = rdt_df[rdt_df.loc[P].idxmin()]
    ax[i].plot(
        MAL,
        P_M_p(MAL, spec, sens),
        lw=2, label="TEST positivo",
    )
    ax[i].plot(
        MAL,
        1 - P_S_n(MAL, spec, sens),
        lw=2, label="TEST negativo"
    )
    ax[i].scatter(
        inc,
        P_M_p(inc, spec, sens),
        c="k", s=40, zorder=5,
    )
    x = P_M_p(inc, spec, sens)
    for j in range(1):
        y = 1 - P_S_n(x, spec, sens)
        ax[i].scatter(x, y,
            c="k", s=100, marker=f"${j+1}$", zorder=10
        )
        if y < .05:
            break
        x = y
    ax[i].plot([0,1], [0,1], c="g")
    ax[i].set_ylabel("Probabilità di Malattia a $\mathbf{Posteriori}$", fontsize="xx-large")
    ax[i].set_xlabel("Probabilità di Malattia a $\mathbf{Priori}$", fontsize="xx-large")
    ax[i].legend(loc="lower right")

    ax[i].axvline(inc, ls=":", c="k")
    ax[i].axhline(.05, c="k", alpha=.5)
    ax[i].axhline(p_plus_min, ls="--", c="k", alpha=.5)
    ax[i].axhline(p_plus_opt, c="k", alpha=.5)
    ax[i].table(
        cellText=[
            [
                f"{inc:.4f} = {inc:.2%}", 
                f'{P_M_p(inc, spec, sens):.4f} = {P_M_p(inc, spec, sens):.2%}', 
                f'{(1 - P_S_n(inc, spec, sens)):.4f} = {(1 - P_S_n(inc, spec, sens)):.2%}'
            ],
        ],
        colLabels=["Probabilità a Priori", "Test Positivo", "Test Negativo"],
        loc="top"
    )
    x1 = inc
    y1 = P_M_p(inc, spec, sens)
    x2 = y1
    y2 = 1-P_S_n(y1, spec, sens)
    ax[i].arrow(x1+.02, y1-.02, x2-x1-.04, y2-y1+.04, 
        length_includes_head=True, head_width=.025, lw=1, color="y")
    ax[i].set_title(
        f'Sensibilità {sens:.1%}  &  Specificità {spec:.1%}', 
        pad=30, fontsize=15)
    ax[i].set_xlim(0, 1); ax[i].set_ylim(0, 1)


latexplot(
    plt, "covidrdtpeggio",
    "Probabilità di malattia COVID-19 a posteriori per test RDT per le peggiori sensibilità o specificità.",
    showme=False
)

<IPython.core.display.Latex object>

In [39]:
fig, ax = plt.subplots(1, 2, figsize=(15, 7))

for i, P in enumerate(["spec", "sens"]):
    spec, sens = rdt_df[rdt_df.loc[P].idxmax()]
    if spec == 1:
        spec = .9999
    if sens == 1:
        sens = .9999
    ax[i].plot(
        MAL,
        P_M_p(MAL, spec, sens),
        lw=2, label="TEST positivo",
    )
    ax[i].plot(
        MAL,
        1 - P_S_n(MAL, spec, sens),
        lw=2, label="TEST negativo"
    )
    ax[i].scatter(
        inc,
        P_M_p(inc, spec, sens),
        c="k", s=40, zorder=5,
    )
    x = P_M_p(inc, spec, sens)
    for j in range(1):
        y = 1 - P_S_n(x, spec, sens)
        ax[i].scatter(x, y,
            c="k", s=100, marker=f"${j+1}$", zorder=10
        )
        if y < .05:
            break
        x = y
    ax[i].plot([0,1], [0,1], c="g")
    ax[i].set_ylabel("Probabilità di Malattia a $\mathbf{Posteriori}$", fontsize="xx-large")
    ax[i].set_xlabel("Probabilità di Malattia a $\mathbf{Priori}$", fontsize="xx-large")
    ax[i].legend(loc="center")

    ax[i].axvline(inc, ls=":", c="k")
    ax[i].axhline(.05, c="k", alpha=.5)
    ax[i].axhline(p_plus_min, ls="--", c="k", alpha=.5)
    ax[i].axhline(p_plus_opt, c="k", alpha=.5)
    ax[i].table(
        cellText=[
            [
                f"{inc:.4f} = {inc:.2%}", 
                f'{P_M_p(inc, spec, sens):.4f} = {P_M_p(inc, spec, sens):.2%}', 
                f'{(1 - P_S_n(inc, spec, sens)):.4f} = {(1 - P_S_n(inc, spec, sens)):.2%}'
            ],
        ],
        colLabels=["Probabilità a Priori", "Test Positivo", "Test Negativo"],
        loc="top"
    )
    x1 = inc
    y1 = P_M_p(inc, spec, sens)
    x2 = y1
    y2 = 1-P_S_n(y1, spec, sens)
    dy = y2-y1+.04
    ax[i].arrow(x1+.02, y1-.02, x2-x1-.04, dy if dy < 0 else 0, 
        length_includes_head=True, head_width=.025, lw=1, color="y")
    ax[i].set_title(
        f'Sensibilità {sens:.1%}  &  Specificità {spec:.1%}', 
        pad=30, fontsize=15)
    ax[i].set_xlim(0, 1); ax[i].set_ylim(0, 1)


latexplot(
    plt, "covidrdtmeglio",
    "Probabilità di malattia COVID-19 a posteriori per test RDT con miglior specificità o sensibilità.",
    showme=False
)

<IPython.core.display.Latex object>

In [40]:
PMP = P_M_p(inc, RDTspecs, RDTsenss)
PMN = 1 - P_S_n(inc, RDTspecs, RDTsenss)

tickL = [f"$\mathbf{{SPEC}}$:{sp:.2%} $\mathbf{{SENS}}$:{se:.2%}" for sp, se in zip(RDTspecs, RDTsenss)]

fig, ax = plt.subplots(figsize=(10, 10))
ax.scatter(np.arange(len(PMP)), PMP, marker="$\oplus$", s=150)
ax.scatter(np.arange(len(PMN)), PMN, marker="$\ominus$", s=150)
for i in range(len(PMP)):
    ax.plot([i, i], [PMP[i], PMN[i]], lw=1, ls=":", c="k")
for i, (spec, sens) in enumerate(zip(RDTspecs, RDTsenss)):
    if spec == 1:
        spec = .9999
    if sens == 1:
        sens = .9999
    x = P_M_p(inc, spec, sens)
    for j in range(1):
        y = 1 - P_S_n(x, spec, sens)
        ax.scatter(i+.3, y,
            c="k", s=50, marker=f"${j+1}$", zorder=1
        )
        if y < .05:
            break
        x = y

# Create a Rectangle patch
rect = patches.Rectangle((3.5,-.05),1,1,linewidth=1,edgecolor='r',facecolor='none')
# Add the patch to the Axes
ax.add_patch(rect)

ax.axhline(0, c="k", alpha=.25)
ax.axhline(.05, c="k", alpha=.25)
ax.axhline(.5, c="k", alpha=.25)
ax.axhline(.9, c="k", alpha=.25)
ax.axhline(1, c="k", alpha=.25)
ax.set_xticks(np.arange(len(PMP)))
ax.set_xticklabels(tickL, rotation=90)
ax.set_ylabel("Probabilità di Malattia a $\mathbf{Posteriori}$", fontsize="xx-large")
latexplot(plt, "allrdt", 
         "Probabilità di malattia a posteriori per i test RDT.", single=True, showme=False)

<IPython.core.display.Latex object>

Tutti i test RDT sono dunque utili per escludere la probabilità a posteriori di malattia in caso di test negativi $P(M|\ominus)$ su individui di cui non si abbiano precedenti informazioni, figura $\ref{fig:allrdt}$, ma molti test presentano probabilità a posteriori in caso di test positivi $P(M|\oplus)$ molto al di sotto dei parametri ottimali $p_{\oplus}=.90$ e nella maggior parte il primo test di controllo con in pazienti precedentemente risultati positivi non è sufficiente a escludere la patologia.

Tra i test con $P(M|\oplus)>.90$ è probabilmente preferibile il quinto da sinistra in figura $\ref{fig:allrdt}$ (e grafico a destra in figura $\ref{fig:covidrdtmeglio}$) con specificità 98.7% e sensibilità 100% dato che è sufficiente un solo test in tutti i casi, anche per escludere la probabilità a posteriori di malattia in un soggetto precedentemente risultato positivo e dunque non è necessario effettuare test multipli con regola $\mathbf{E}_{\oplus}$ degradando l'ottima sensibilità e aumentando il rischio di falsi negativi. Infatti abbiamo

In [41]:
display(Markdown(fr"""
$$
P(f_-) = 1 - \mathbf{{SE}} = 1 - 1.000 = {1 - 1:.3f} = {(1 - 1)*100:.2f}\%
$$

$$
P(f_+) = 1 - \mathbf{{SP}} = 1 - 0.987 = {1 - .987:.3f} = {(1 - .987)*100:.2f}\%
$$
"""))


$$
P(f_-) = 1 - \mathbf{SE} = 1 - 1.000 = 0.000 = 0.00\%
$$

$$
P(f_+) = 1 - \mathbf{SP} = 1 - 0.987 = 0.013 = 1.30\%
$$


Per tutti gli altri test è necessario stabilire delle regole di ripetizione per migliorare sensibilità o specificità senza degradare eccessivamente il parametro opposto.

# Conclusioni

Data la prevalenza di COVID-19 in fase pandemica, sensibilità e specificità dei test attualmente effettuati (tamponi naso-faringeri RT-PCR RNA), un solo tampone positivo o negativo è sufficiente per diagnosticare o escludere la patologia in soggetti di cui non si abbiano precedenti informazioni (utile, ad esempio, per screening).

La necessità di ripetizione di 3 tamponi naso-faringei se negativi per escludere la patologia in pazienti precedentemente affetti da COVID-19 è giustificata dalla non ottimale sensibilità dei tamponi e dalla buona specificità, ottenendo probabilità di malattia o salute molto elevate e percentuali accettabili di falsi negativi e positivi.

L'estrema variabilità di sensibilità e specificità dei test diagnostici rapidi (RDT per IgM e IgG) rende necessario lo studio _ad hoc_ di standard di utilizzo e strategie di ripetizione per ridurre falsi positivi e negativi, a meno di avere a disposizione test con accertate sensibilità e specificità prossime al 100%.