Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

negative values for newCases and newDeaths in cases-brazil-cities-time.csv #43

Closed
marcuswac opened this issue May 23, 2020 · 2 comments
Closed

Comments

@marcuswac
Copy link

There are 1670 negative entries for newCases and 165 negative entries for newDeaths in cases-brazil-cities-time.csv file. I noticed that because I'm using the EpiForecasts packages and noticed negative cases in "Santa Catarina" cases plots in their posts: https://epiforecasts.io/covid/posts/national/brazil/

They are using your data to generate the Brazilian analysis.

How to reproduce:

library(dplyr)
read.csv("https://raw.githubusercontent.com/wcota/covid19br/master/cases-brazil-cities-time.csv") %>%
    filter(newCases < 0)

Output (first 5 lines):

 date country state                             city  ibgeID newDeaths deaths newCases totalCases
1  2020-03-12  Brazil    RJ CASO SEM LOCALIZAÇÃO DEFINIDA/RJ      33         0      0       -9          1
2  2020-03-18  Brazil    PE       Jaboatão dos Guararapes/PE 2607901         0      0       -1          1
3  2020-03-19  Brazil    SP                   Santo André/SP 3547809         0      0       -4          2
4  2020-03-19  Brazil    SP            São Caetano do Sul/SP 3548807         0      0       -5          1
5  2020-03-20  Brazil    MG                    Uberlândia/MG 3170206         0      0       -1          1
...
@marcuswac marcuswac changed the title negativa values for newCases in cases-brazil-cities-time.csv negative values for newCases in cases-brazil-cities-time.csv May 23, 2020
@marcuswac marcuswac changed the title negative values for newCases in cases-brazil-cities-time.csv negative values for newCases and newDeaths in cases-brazil-cities-time.csv May 23, 2020
@wcota
Copy link
Owner

wcota commented May 23, 2020

Olá! Esses casos negativos aparecem devido à correção nos boletins das secretarias de saúde, quando corrigem a localização de cada caso, ou um caso é, digamos, "desconfirmado" (testes refeitos, erro de informação, etc). Isso acontece com certa frequência, como pode ser visto nessa sua análise. Os casos aqui descritos são tais como reportados pelos boletins das secretarias. Já em "CASO SEM LOCALIZAÇÃO DEFINIDA/UF" praticamente sempre aparecem newCases < 0 pois no boletim seguinte identificaram a localização desses casos.

Quanto ao de Santa Catarina, a explicação está aqui: #31 e documentado nesse arquivo: https://github.com/wcota/covid19br/blob/master/_fixes_meta.csv

De qualquer forma vou deixar essas informações mais explícitas na próxima versão da documentação disponível em https://preprints.scielo.org/index.php/scielo/preprint/view/362/version/371

Obrigado!

@marcuswac
Copy link
Author

obrigado pela informação. minha preocupação maior é que estão usando os dados como estão para fazer projeções, como o https://epiforecasts.io/covid/posts/national/brazil/

seria interessante entrar com contato com eles para corrigirem essas inconsistências nos dados geradas por inconsistências dos boletins. mas entendo que o problema é na divulgação dos dados nos boletins das secretarias de saúde

@wcota wcota closed this as completed Jul 31, 2020
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants