Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Definizione esaustiva di Casi Testati + Introduzione di un nuovo dato sui tamponi per calcolare correttamente la percentuale di positività al tampone #864

Open
Rabelaiss opened this issue Oct 5, 2020 · 56 comments

Comments

@Rabelaiss
Copy link

Rabelaiss commented Oct 5, 2020

Richiesta di informazione

La definizione di Casi Testati nella wiki è

Totale dei soggetti sottoposti al test

da cui sembra abbastanza chiaro che il numero dei casi testati contenga il primo tampone fatto ad una certa persona ma non i successivi, ossia ci dice quante persone diverse sono state sottoposte a tampone.
È corretto, dunque, dire che l'incremento odierno dei casi testati rappresenta i tamponi fatti a chi prima di oggi non aveva mai fatto il tampone?
@umbros potreste confermare/smentire l'affermazione e la successiva domanda? Vi ringrazio

Problema della determinazione della % di positività al tampone

Assumendo vero quanto appena detto, la percentuale ottenuta dividendo nuovi_positivi per l'incremento dei casi_testati potrebbe non indicare con esattezza la percentuale di positività al tampone perché nei casi testati mancherebbero i tamponi successivi al primo fatti ad una persona non positiva, tra i quali rientrano quelli fatti periodicamente ai lavoratori a rischio (personale sanitario, forze dell'ordine, ecc).

Facciamo un esempio, oggi sono stati analizzati 10 tamponi fatti ad altrettanti positivi in attesa di guarigione, 10 tamponi fatti ad altrettante persone risultate negative al precedente tampone e 10 tamponi fatti ad altrettante persone che non erano mai state testate in precedenza. Dal secondo gruppo di tamponi 6 sono risultati positivi mentre dal terzo gruppo 0 sono risultati positivi.

In questo scenario i dati forniti dal Ministero sarebbero nuovi_positivi = 6, incremento tamponi = 30, incremento casi testati = 10 e quindi tutto quello che potremmo dire sarebbe che la positività è almeno del 6/30 = 20% e al massimo del 6/10 = 60%.
Con tutti i dati a disposizione sappiamo che in realtà la positività è del 6/20 = 30%` (dove 20 è la somma tra i tamponi del gruppo 2 e i tamponi del gruppo 3), valore ben diverso dagli altri due.

Richiesta di dati

Come abbiamo visto, possiamo distinguere 3 diversi gruppi di tamponi (ce ne sono altri?)

  1. tamponi di controllo fatti a positivi in attesa di guarigione
  2. tamponi fatti a persone il cui precedente tampone era risultato negativo, tra cui rientrano i tamponi di routine fatti ai lavoratori a rischio
  3. tamponi fatti a chi non rientra in nessuna delle categorie precedenti, ossia tamponi fatti a chi non aveva mai fatto un tampone in precedenza.

Il ministero fornisce il numero totale dei tamponi, ossia il dato tamponi, e il numero dei tamponi del terzo gruppo, ossia il dato casi_testati, ma questi dati non sono sufficienti per determinare i tamponi degli altri due gruppi, e quindi non possiamo determinare correttamente la % di positività al tampone.

È quindi necessaria l'introduzione di un nuovo dato che rappresenti i tamponi del gruppo 1 o del gruppo 2, per trovare i tamponi del gruppo restante bastarebbe poi sottrarre i due gruppi conosciuti al totale dei tamponi.
Suggerimenti per il nome del nuovo dato potrebbero essere tamponi_di_controllo per i tamponi del gruppo 1, e tamponi_post_negativo per i tamponi del gruppo 2.

Interesse pubblico

Date per vere le considerazioni fatte nella prima sezione, con i dati attualmente disponibili non si può calcolare con precisione la percentuale di positività al tampone, ma solo una sottostima (casi / tamponi) e una sovrastima (casi / casi testati).
L'introduzione del nuovo dato permetterebbe a tutti coloro che analizzano i dati di poter calcolare la percentuale corretta di positività al tampone.

@alessandroNa
Copy link

Seguo con molto interesse..

@alessandroNa
Copy link

@Rabelaiss ho provato a graficare i dati che abbiamo ad oggi a disposizione e cioè:

  1. Delta(casi totali)/Delta(nr tamponi) (linea rossa)
  2. Delta(casi totali)/Delta(casi testati) (linea blu)

Schermata 2020-10-09 alle 14 41 41

Alla fine, come hai simulato tu con il caso di esempio, la "verità sta nel mezzo"...però sarebbe interessante approfondire ulteriormente..

@umbros
Copy link
Contributor

umbros commented Oct 16, 2020

Ciao a tutti,
i casi testati sono i singoli casi testati che possono aver fatto 1 o più tamponi. Il numero dei tamponi, invece, rappresenta il totale dei tamponi effettuati che può esser fatto anche più di una volta su una persona.

@Rabelaiss
Copy link
Author

Grazie @umbros
Ritieni sia fattibile l'introduzione nel dataset dei tamponi del gruppo 1 o del gruppo 2? Dove con gruppo 1 e 2 intendo i gruppi descritti nella sezione "Richiesta di dati"?

@mmariotti
Copy link

Ciao a tutti,
Anche io seguo con interesse, e sarebbe molto gradito, se fosse possibile, l'avere il dato dei tamponi partizionato (ossia la somma dei tre deve dare il totale dei tamponi effettuati) secondo i gruppi descritti da @Rabelaiss.

@Abalieno
Copy link

Per pignoleria, la domanda dell'utente sopra a #876, e' stata rediretta qui in attesa di una risposta piu' precisa, sottilmente elusa, oppure la risposta e' che, si', le regioni tengono un database complessivo e anche a distanza di mesi se la stessa persona viene testata una seconda volta il suo caso NON entra nel campo dei casi testati?

@Rabelaiss
Copy link
Author

@Abalieno leggi il commento di umbros poco sopra, quindi la risposta alla tua domanda è sì

@Abalieno
Copy link

...No. La risposta e' ambigua e generica. Il diavolo sta nei dettagli, e come scritto per pignoleria e' ragionevole chiedere una risposta netta e specifica. Anzi, se devo interpretare quello che ha scritto, io penso: abbiamo un criterio generale, e nessuno e' veramente in grado di garantire se e come venga concretamente rispettato (inserire discrezionalita' regionale). Un conto e' la regola, un conto l'applicazione. E forse il problema e' proprio che nessuno e' in grado di rispondere con certezza. Non mi meraviglio.

La cosa assurda e' ovviamente che siamo a Ottobre e ancora non e' stato possibile mettere i tamponi di controllo in un campo a parte. Di questo ci si lamentava gia' ad Aprile quando i tamponi di controllo sono diventati piu' numerosi.

@Paulsword
Copy link

D'altronde il dato del rapporto positivi/tamponi o positivi/persone testate è ora ulteriormente disturbato dall'uso dei test rapidi, non conteggiati ma condizionanti un aumento del numeratore (per via del tampone di controllo dei test positivi) e non del denominatore.

@Doc73
Copy link

Doc73 commented Oct 20, 2020

@Paulsword
Scusi, ma necessito di un chiarimento.
Se io faccio il test rapido e risulto positivo, anche se il test rapido in sé non è conteggiato, dovrebbe scattare il tampone di controllo e quindi aumentare pure il numero dei tamponi e delle persone testate, che stanno al denominatore.

Forse si riferisce al caso dei test rapidi negativi, che, non essendo seguiti da tamponi, non sono conteggiati a denominatore?

Altra domanda: i test rapidi sono fatti ovunque in Italia? Dalle mie parti, in Toscana, non mi risulta che li facciano.

@Paulsword
Copy link

@Doc73 sta proprio lì il problema: chi e quanti ne fanno non è dato saperlo. E certo, il tema è che si ritestano i positivi, non i negativi, quindi il rapporto positivi/casi testati aumenta (aumenta parecchio già di suo, figurati adesso).

@Rabelaiss
Copy link
Author

@Paulsword non penso di aver capito.
Ipotizziamo che una persona oggi faccia un test rapido, e che prima d'ora non abbia mai fatto tamponi o altri test.
Indipendentemente dall'esito del test, i tre numeri tamponi, casi_testati e totale_casi non subiscono variazioni.
Se il test ha esito positivo, solo un successivo tampone può certificare o smentire la positività.
Se anche il tampone ha esito positivo, tutti e tre i numeri precedenti vengono incrementati di una unità, se invece il tampone è negativo solo tamponi viene incrementato di 1.
Corretto?

@Paulsword
Copy link

Il test rapido ha sensibilità inferiore al molecolare, quindi è molto probabile che il tampone di controllo risulti positivo. Fanno sostanzialmente un primo filtro passa-positivi, che quindi impatta sul rapporto positivi/tamponi.

@davpirelli
Copy link

davpirelli commented Oct 22, 2020

Buongiorno a tutti,
in ottica di integrare il rapporto sul nostro portale www.covidanalysis.it, possiamo dare quindi per certo che la formula corretta è casi_testati_oggi / nuovi_positivi_oggi?

Ad esempio, con il numero di ieri (21.10.2020) il risultato sarebbe di 1 positivo su 7?
Nuovi positivi: 15199
Casi testati: 106488
Rapporto positivi: 106488/15199 = 7 -> quindi 1 su 7 è positivo?

@Rabelaiss
Copy link
Author

@davpirelli non è corretto, leggi l'esempio nella sezione "Problema della determinazione della % di positività al tampone"

@edomt
Copy link

edomt commented Oct 22, 2020

Hi @umbros
We're trying to clarify for our testing data on Our World in Data which is the best time series to use for Italy. Could you please officially confirm that people who are tested several times over the course of the pandemic are only counted once in the "people tested" figures, but are counted each time in the "samples tested" figures? We recently identified this issue in a few other countries (see this thread on Twitter), but didn't identify Italy as one of those countries. Your reply above seems to indicate that this is indeed the case for Italy too, but the wording is still a bit ambiguous, so we would appreciate a confirmation!
Thank you very much,
Edouard


Ciao @umbros
Stiamo cercando di chiarire per i nostri dati di test su Our World in Data quale è la migliore serie temporale da utilizzare per l'Italia. Potrebbe confermare ufficialmente che le persone che sono state testate più volte nel corso della pandemia vengono conteggiate solo una volta nelle cifre "persone testate", ma sono contate ogni volta nelle cifre "campioni testati"? Abbiamo recentemente identificato questo problema in alcuni altri paesi (vedi questo thread su Twitter), ma non abbiamo identificato l'Italia come uno di quei paesi. La tua risposta sopra sembra indicare che questo è effettivamente il caso anche per l'Italia, ma la formulazione è ancora un po' ambiguo, quindi gradiremmo una conferma!
Grazie mille,
Edouard

edomt added a commit to owid/covid-19-data that referenced this issue Oct 23, 2020
A conversation on the GitHub repository (pcm-dpc/COVID-19#864) of the Department of Civil Protection leads us to strongly suspect that people undergoing multiple rounds of testing over the course of the pandemic are not repeatedly counted in these figures. For this reason, since 23 October 2020 we use the "tests performed" series as our series of reference for Italy's testing data.
@LucaZeta
Copy link

LucaZeta commented Oct 24, 2020

@Rabelaiss ho provato a graficare i dati che abbiamo ad oggi a disposizione

Noto che il tuo grafico genera un caso negartivo (minore di zero), la qual cosa rappresenta un'anomalia.
L'anomalia dipende dal fatto che, come tu stesso descrivi, calcoli il Delta(casi_totali) invece di usare direttamente 'nuovi_positivi'.
Il fatto è che Protezione Civile apprica le sue correzioni (in + e in -) ai 'casi_totali' mentre lascia inalterati i 'nuovi_positivi'.
Sarebbe ragionevole ritenere che la somma cumulata dei nuovi positivi restituisse fedelmente il valore dei 'casi_totali'.
Così invece non è per il motivo sopra descritto.

Ti suggerisco di far riferimento sempre a 'nuovi_positivi' ogniqualvolta hai bisogno di Delta(casi_totali).
Puoi far riferimento a questa tabella (https://covid19.zappi.me/table/) dove la colonna 'correzione totale casi' riporta proprio il valore di queste correzioni. Noterai che il 19 Giugno è stata apportata una modifica rilevante, poi corretta dopo qualche gg., che ha portato il valore di delta(casi_totali) sottozero.

@Rabelaiss
Copy link
Author

Il fatto è che Protezione Civile apprica le sue correzioni (in + e in -) ai 'casi_totali' mentre lascia inalterati i 'nuovi_positivi'.

Occhio perché detto così sembra che i vecchi valori nella serie totale_casi vengano modificati quando avviene un riconteggio.
Per calcolare il totale dei casi a partire dai nuovi_positivi basta sommare tutti i valori e sottrarre la somma di tutti i riconteggi: 504590-81=504509.

@LucaZeta
Copy link

LucaZeta commented Oct 25, 2020

Occhio perché detto così sembra che i vecchi valori nella serie totale_casi vengano modificati quando avviene un riconteggio.

Esatto, i vecchi valori restano immutati, se vogliamo è proprio quello il problema, ma considerata l'entità degli interventi non starei a fasciarmi la testa.
Grazie comunque per aver sottolineato questo aspetto.

Ah, scusa: ho quotato te, ma vrei dovuto quotare 'DataEnthusiast84'.

@robertoprato
Copy link

robertoprato commented Oct 26, 2020 via email

@magaspari
Copy link

@Rabelaiss ho provato a graficare i dati che abbiamo ad oggi a disposizione e cioè:

1. Delta(casi totali)/Delta(nr tamponi) (linea rossa)

2. Delta(casi totali)/Delta(casi testati) (linea blu)

Schermata 2020-10-09 alle 14 41 41

Alla fine, come hai simulato tu con il caso di esempio, la "verità sta nel mezzo"...però sarebbe interessante approfondire ulteriormente..

Per ottenere una migliore approssimazione ho utilizzato fino ad ora:
Delta(casi totali)/Delta(nr Tamponi) - Delta(Guariti)
assumendo almeno un tampone negativo dedicato ai guariti nello stesso giorno.
Cosa ne pensate?
Mauro

@LucaZeta
Copy link

LucaZeta commented Nov 1, 2020

Cosa ne pensate?

La differenza è davvero irrisoria e l'approccio senza razionale:
https://covid19.zappi.me/test/

@magaspari
Copy link

Mi sembra un po' ingenuo e superficiale il tuo commento riportando tra l'altro come risposta un grafico che sembra a livello Nazionale:
La differenza e' chiaramente irrisoria a livello nazionale, ma regione per regione - provincia per provincia può diventare sempre più significativa, in quanto il numero di tamponi fatti in proporzione alla popolazione varia.
Oltre a questo riguardo alla mancanza di razionalità, sarebbe importante esprimerla con motivazioni sensate, infatti nell'ipotesi in cui la corretta approssimazione sta tra i due approcci, un approccio che va a migliorare il limite inferiore con un assunzione ragionevole, non può che essere efficace, a meno che non si dimostra che e' palesemente scorretto.

Ad esempio sottraendo il doppio del delta dei guariti in alcuni casi (regioni con pochi casi) il numero di tamponi andava sottozero, oltre a questo manca regione per regione la tempistica dei due tamponi per decretare la guarigione. Quindi un assunzione come lo scalare due tamponi per i guariti in un giorno, che e' sicuramente efficace se si considera a livello di percentuale complessiva fino ad una certa data, vista giornalmente risulta più difficile da gestire. Questo non significa razionalmente sbagliato, in quanto quei tamponi positivi sono stati fatti, non e' facile definire in che giorno ma si possono trovare tecniche per approssimare.

@LucaZeta
Copy link

LucaZeta commented Nov 2, 2020

Ho risposto ad un tuo post che riporta un grafico a livello nazionale, ho verificato la formula che hai proposto e ne ho tratto delle conclusioni. Ti ho fornito il feedback che hai richiesto.

Visto come l'hai presa non aspettartene altri.
Buona prosecuzione.

@magaspari
Copy link

Ho risposto ad un tuo post che riporta un grafico a livello nazionale, ho verificato la formula che hai proposto e ne ho tratto delle conclusioni. Ti ho fornito il feedback che hai richiesto.

Visto come l'hai presa non aspettartene altri.
Buona prosecuzione.

Ben venga la discussione invece, se reputi che qualcosa sia senza "razionale" e' opportuno sempre spiegare il perché, e nessuno se la prende. Il tema e' delicato e merita precisione: questa e' l'essenza del mio commento..
Ho utilizzato questo approccio in un lavoro scientifico che mi ha permesso di stimare a fine giugno il numero di casi totali in Italia in linea con i dati dell'ISTAT usciti ad inizio Agosto.
Ho sperimentato in queste settimane l'approccio basato sui casi testati e non mi ha convinto fino in fondo causa alcuni risultati che mi sembravano strani, ovvero troppo alti: alcune considerazioni che ho trovato in questo thread hanno confermato i miei dubbi. Tecnicamente non ritengo opportuno utilizzare per le mie stime un dato che e' noto come limite superiore, perché da questo potrebbe scaturire un eccessivo grado di compromissione nelle stime. Credo che l'approccio corretto sia utilizzare i limiti inferiori o in alternativa considerarli entrambi.
Mauro

@KrammerITA
Copy link

Buonasera,
una domanda: può essere che il dato ufficiale dei casi_testati non sia in realtà così affidabile e veritiero, qualsiasi sia il motivo?
11 milioni di singole persone testate (ad oggi) mi sembra un numero molto alto, significa che più di un 1 italiano su 6 ha fatto almeno un test.
La percezione che ho nel piccolo del mio ambiente (familiari, amici e colleghi di lavoro) è che la percentuale sia decisamente più bassa: tra un centinaio di contatti solo 2 figli di amici e 3 amici che lavorano nella sanità hanno fatto il test almeno una volta.
Forse faccio parte di una realtà che si discosta dalla media nazionale, chissà. Abito in veneto centrale.

Fino ad oggi pensavo che il dato dei casi_testati fosse uguale ai tamponi meno i tamponi_di_controllo, e che invece tamponi_post_negativo incidessero nel conteggio. Il che mi sembrava sensato anche per motivi di privacy e trattamento dati.
Solo leggendo questo post scopro che non è così.

Grazie mille,
saluti cordiali

@LucaZeta
Copy link

Comunque a logica i casi testati non sono tutti i T0 perché nei T0 ci sono anche i tamponi negativi dopo il primo negativo

Al netto di ogni imperfezione i casi_testati sono definiti come "Totale dei soggetti sottoposti al test" e come tale non prende in considerazione i tamponi o il loro esito, solo il nominativo della persona. L'indice conta il numero di nominativi univoci registrati dall'inizio dell'epidemia.

@gian28dot
Copy link

Perdonami non mi è comunque chiaro. Nel senso, sono dati giornalieri e le due percentuali danno lo stesso identico valore assoluto in due insiemi diversi con campioni diversi. Mi puoi spiegare sta cosa? Quindi mi confermi la definizione di casi testati?

casi_testati e tamponi non sono indici giornalieri, ma di giorno in giorno riportano il valore cumulato di tutta l'epidemia.

dai casi_testati e dai tamponi è possibile, per differenza, calcolare D_casi_testati e D_tamponi che diventano valori giornalieri.

Questi due ultimi indicatori, in rapporto con i nuovi_positivi, da le percentuali delle quali stiamo discorrendo.

In riferimento al 12 Nov "D % positivi per casi testati" vale 28,5% e "D % positivi per tamponi" vale 16,2%, non direi che hanno lo stesso valore assoluto, a meno che abbia mal interpretato quello che vuoi dire. In tal caso scusami.

La definizione uffciale di casi_testati è "Totale dei soggetti sottoposti al test", la puoi trovare tenendo fermo per 2 secondi il puntatore del mouse sulla testata della tabella indicata in precedenza oppure su questo stesso sito a questo indirizzo

Grazie sei stato molto chiaro. Non mi sono spiegato bene io probabilmente . Facendo riferimento alle variazioni giornaliere , ad esempio quelle di ieri , vediamo 234000 tamponi circa e 133478 casi testati. Mi riferivo al valore assoluto di 16.14% rispetto a 234.000 e 28.5% rispetto a 133478.
Allora il mio ragionamento, probabile errato, diceva : se nei 37800 casi di ieri equivale a dire TAMPONI POSITIVI quindi anche quelli da controllo, il 28.5% dei casi testati che quindi tolgono dal conteggio per definizione quelli da controllo, non può darmi in valore assoluto lo stesso numero ma quindi un numero per forza minore. A quanto pare ho fatto un ragionamento stupido perché avevo delle definizioni sbagliate. Giusto? Grazie ancora per il tempo dedicato

@LucaZeta
Copy link

LucaZeta commented Nov 13, 2020

se nei 37.978 casi di ieri (nuovi_positivi) equivale a dire TAMPONI POSITIVI quindi anche quelli da controllo, il 28.5% dei casi testati che quindi tolgono dal conteggio per definizione quelli da controllo, non può darmi in valore assoluto lo stesso numero ma quindi un numero per forza minore.

Il tuo ragionamento è corretto, infatti:

  1. 37.978 nuovi_positivi di ieri diviso 234.672 tamponi analizzati ieri da 16,2%.
  2. 37.978 nuovi_positivi di ieri diviso 133.478 casi_testati analizzati ieri da 28,5%.

Ora, dato che la formula utilizzata per ottenere le percentuali è rispettivamente nuovi_positivi/D_tamponi e nuovi_positivi/D_casi_testati non deve sorprenderti che se moltiplichi le percentuali rispettivamente per D_tamponi e D_casi_testati ottieni lo stesso numero che identifica i nuovi_positivi.

Credo che siamo riusciti a risolvere il mistero, forse.

@gian28dot
Copy link

Ovvio certo a livello matematico si che è corretto . Mi chiedevo allora, i quasi 38000 nuovi postivi, sono tamponi positivi non i nuovi veri positivi. Sono i tamponi positivi usciti dai 234000 tamponi . Corretto? Se questo fosse corretto, fra questo 38000, saranno compresi anche tampone positivi T1 ad esempio. Qui viene il lui dubbio ovvero che senso ha relazionare questo numero con i casi testati che per definizione sono tutte quelle persone che lo fanno per la prima volta in quel giorno X? Il 28,5% esprime una relazione fra 37900 e 133478. Ma 133478 esclude tutti i tamponi di controllo mentre il numero 37900 ne tiene conto. Questo mi chiedevo . Se questo è corretto la percentuale sovrastima e da come un limite max di casi, non effettivamente quanto e la positività vera sui casi testati. Grazie mille

@magaspari
Copy link

Ovvio certo a livello matematico si che è corretto . Mi chiedevo allora, i quasi 38000 nuovi postivi, sono tamponi positivi non i nuovi veri positivi. Sono i tamponi positivi usciti dai 234000 tamponi . Corretto?

Non e' corretto sono i nuovi positivi, ovvero nuovi individui che rientrano nel conto dei positivi.
Per il resto, i dati nel sito sono (mi sembrano) quelli corretti ma soggetti a diversi bias ovvero a volte incompleti o "sporcati" da alcune anomalie che li rende più difficili da utilizzare per analisi complesse/supporto alle decisioni, aldilà della mera visualizzazione.
Nello specifico la percentuale dei positivi sui casi testati e' una sovrastima del livello di contagio nel territorio, che deriva da mancanza di informazioni sul dettaglio dei tamponi.
Ovvero, ci vorrebbero più informazioni per calcolare il delta_casi_testati giornaliero includendo individui già considerati non ancora classificati come positivi.
Quello che accade e' che i casi testati non si incrementano a seguito di nuovi positivi già testati in precedenza perché l'individuo e' già stato considerato. Ad esempio, tutte le regioni che effettuano molti controlli e politiche di screening a rotazione su categorie risultano sovrastimate.

@LucaZeta
Copy link

LucaZeta commented Nov 13, 2020

Mi chiedevo allora, i quasi 38000 nuovi postivi, sono tamponi positivi non i nuovi veri positivi.

Molto bene, ecco la domanda che mi aspettavo.
E' previsto che l'indice nuovi_positivi conti solo le nuove positività. Più difficile dire su cosa si basi per individuare, tra le positività riscontrate, quali devono essere considerate nuove. Ci sono due possibilità: si considera il livello T del referto oppure si considerano le generalità anagrafiche della persona analizzata. Non credo esista una risposta ufficiale, neanche fornita a Vespa, per quanto ne sappia, che ha ufficializzato di fronte al grande pubblico, l'incomprensione di questo dettaglio, intervistando il coordinatore del comitato tecnico scientifico. Spero di esserti stato d'aiuto.

@magaspari
Copy link

PS, per non essere frainteso ci tenevo a dire che nonostante il limiti che delineo sopra, si tratta comunque di informazioni preziose, che si possono utilizzare per le analisi con la dovuta attenzione.
Non posso che ringraziare chi ha contribuito a questo sito e gli spunti che spesso arrivano preziosi.

@gian28dot
Copy link

Quindi bisogna convenire con un dato di fatto. C'è grande confusione fra valori assoluti/relativi e sulla mancanza di suddivisone interna per insiemi di tamponi , con qualsiasi criterio possibile . A parer mio il nostro paese sta facendo affidamento su alcuni dati assolutamente non veritieri , alcuni, non tutti ovviamente. Grazie ad ognuno di voi, sono appena entrato qui e già ho avuto modo di discutere intelligentemente più che negli ultimi 3 mesi al di fuori di qui.

@magaspari
Copy link

Molto bene, ecco la domanda che mi aspettavo.
E' previsto che l'indice nuovi_positivi conti solo le nuove positività. Più difficile dire su cosa si basi per individuare, tra le positività riscontrate, quali devono essere considerate nuove. Ci sono due possibilità: si considera il livello T del referto oppure si considerano le generalità anagrafiche della persona analizzata. Non credo esista una risposta ufficiale, neanche fornita a Vespa, per quanto ne sappia, che ha ufficializzato di fronte al grande pubblico, l'incomprensione di questo dettaglio, intervistando il coordinatore del comitato tecnico scientifico. Spero di esserti stato d'aiuto.

Non ho seguito Vespa, non mi e' chiaro cosa intendi? se si intende con questo la possibilità di riammalarsi, dopo guarigione sarebbe effettivamente un dato importantissimo.

Non credo invece all'incertezza dei dati in questo sito riguardo al numero dei nuovi positivi, risulta si evidente qualche bias qui e la, ma una interpretazione errata rilevante di questo dato andrebbe a minare tutto il modello, e risulterebbe immediatamente incrociando i dati sui nuovi positivi con altri: infetti, guariti e deceduti.

@gian28dot
Copy link

Anche perché ragazzi, come viene detto sopra , se si considera il fattore T come classificazione di suddivisione dei nuovi positivi , per forza di cose si avrà una sovrastima giornaliera della percentuale di postivi sui casi testati .

@LucaZeta
Copy link

Non ho seguito Vespa, non mi e' chiaro cosa intendi? se si intende con questo la possibilità di riammalarsi

No, non intendevo dire quello. Il livello 'T' mezionato è l'identificativo generico del tipo di tampone analizzato: T0 il primo, T1 il primo di controllo e via così. Non so figurarmi cosa ti sia immaginato.

@Rabelaiss
Copy link
Author

Non ho seguito Vespa, non mi e' chiaro cosa intendi? se si intende con questo la possibilità di riammalarsi

No, non intendevo dire quello. Il livello 'T' mezionato è l'identificativo generico del tipo di tampone analizzato: T0 il primo, T1 il primo di controllo e via così. Non so figurarmi cosa ti sia immaginato.

@LucaZeta non corretto guarda qua a pag 5

@magaspari
Copy link

Il soggetto era il dato "nuovi_positivi", non capisco che problemi ci possono essere su questo dato, essendo concettualmente la somma dei nuovi positivi nelle diverse regioni, che sono presi in carico dalle varie ASL, potrà esserci sicuramente qualche errore di trasmissione, ma alla fine il dato è quello.
In linea con l'intervento che trovo alla fine di questo issue: #894

@LucaZeta
Copy link

@LucaZeta non corretto guarda qua a pag 5

Grazie, interessante, ma non ho trovato incongruenze, non volevo essere esaustivo, solo dare un'idea.
Comunque l'ho scorso con interesse.

@Rabelaiss
Copy link
Author

@LucaZeta sisi ma infatti era giusto per chiarire che nei T0 ci sono anche i pazienti che hanno effettuato già tamponi ma con esiti negativi ;)

@valpan76
Copy link

Scusate se mi inserisco, molto interessante il codice T0 mi da la speranza che il dato dei "casi testati mai positivi prima" possa essere recuperato, ma sapete se è una modalità utilizzata da tutte le regioni o solo dalla Toscana? Dalla risposta di @umbros "Ciao a tutti,
i casi testati sono i singoli casi testati che possono aver fatto 1 o più tamponi. ..." il 16 ottobre a me sembra di capire che nei "casi testati" ogni soggetto ci sia una sola volta, quindi tornando alle domande iniziali, se ho già fatto il molecolare e sono risultati negativa , e lo faccio nuovamente oggi e risulto positiva, rientrerò nella definizione di T0 ma non contribuisco a crescere la voce dei casi testati (e quindi quando andiamo a calcolare i casi testati di oggi come differenza avremo un numero più basso dei reali "soggettia rischio nuova positività")

@LucaZeta
Copy link

se ho già fatto il molecolare e sono risultati negativa , e lo faccio nuovamente oggi e risulto positiva, rientrerò nella definizione di T0 ma non contribuisco a crescere la voce dei casi testati (e quindi quando andiamo a calcolare i casi testati di oggi come differenza avremo un numero più basso dei reali "soggettia rischio nuova positività")

L'indice casi_testati non ha nessuna relazione con l'esito dell'analisi del tampone: è un indice che conta il numero di persone che per qualche motivo si è sottoposto ad analisi del tampone. Nel caso dell'esempio che riporti, a fronte de seconto test tampone-molecolare: non incrementerà il l'indice casi_testati, incrementerà l'indice tamponi (indipendentemente dall'esito dell'esame), incrementerà l'indice nuovi_positivi a seconda dell'esito dell'esame.

@valpan76
Copy link

se ho già fatto il molecolare e sono risultati negativa , e lo faccio nuovamente oggi e risulto positiva, rientrerò nella definizione di T0 ma non contribuisco a crescere la voce dei casi testati (e quindi quando andiamo a calcolare i casi testati di oggi come differenza avremo un numero più basso dei reali "soggettia rischio nuova positività")

L'indice casi_testati non ha nessuna relazione con l'esito dell'analisi del tampone: è un indice che conta il numero di persone che per qualche motivo si è sottoposto ad analisi del tampone. Nel caso dell'esempio che riporti, a fronte de seconto test tampone-molecolare: non incrementerà il l'indice casi_testati, incrementerà l'indice tamponi (indipendentemente dall'esito dell'esame), incrementerà l'indice nuovi_positivi a seconda dell'esito dell'esame.

Grazie, quindi per tornare all argomento di questa discussione "..calcolare correttamente la percentuale di positività al tampone " calcolare positivi su casi testati giornalieri o settimanali che sia, rischia di sovrastimare il rapporto, perché più andiamo avanti meno casi testati "nuovi" ci saranno. Mentre se avessimo il valore di T0 indicato nel documento della Toscana, potremmo calcolare il rapporto corretto.

@LucaZeta
Copy link

Mentre se avessimo il valore di T0 indicato nel documento della Toscana, potremmo calcolare il rapporto corretto.

Rifletti sul fatto che al netto di errori e imperfezioni: si passa a T1 e successivi solo a fronte di un T0 positivo, se può esserti utile.

@piersantesestini
Copy link

Dai primi giorni di aprile il numero di nuovi "casi testati" riportati quotidianamente dalla Regione Sicilia è praticamente identico a quello dei nuovi tamponi molecolari.
Ha un senso?
(spero che i grafici siano visibili)
sicilia
sicilia2

@magaspari
Copy link

Secondo me non ha senso, vedi le definizioni di casi testati date in questo thread.
Ovvero, applicando correttamente la definizione, si dovrebbe scostare di più dal cumulativo dei tamponi.

Oltre a questo il dato casi testati per come e' concepito qui (cumulativo di casi testati la prima volta) non e' utilizzabile per stimare un tasso di positività veritiero.

Per essere efficace il dato casi testati dovrebbe contenere i test diagnostici fatti in un certo giorno finalizzati alla diagnosi di nuovi casi, non dovrebbe essere cumulativo, in quanto non ha senso sommarli, ma giornaliero.

@magaspari
Copy link

Questo e' il mio sito aggiornato con il calcolo del tasso di positività per tutte le regioni d'Italia e le previsioni sull'andamento dei ricoverati.
https://www.cs.unibo.it/~gaspari/www/italy.html

@piersantesestini
Copy link

@magaspari, quindi sarebbe un altro "magheggio" della Regione Sicilia? Pensavo fosse solo broccionaggine.
In entrambi i casi, come si fa a fidarsi di dati registrati in questo modo?

@magaspari
Copy link

Credo che alla base ci sia un interpretazione diversa di ciò che si dovrebbe inviare (senza verifica a monte). Si spera che almeno il dato tamponi sia corretto, osservando il confronto con l'incidenza (che segue i tamponi) nel mio sito non si notano stranezze evidenti.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests