Integração e processamento de dados para estudo de gravidade. 
Autoras: Maria Gabriela Valeriano e Ana Carolina Lorena
Dados disponíveis em: https://repositoriodatasharingfapesp.uspdigital.usp.br/

Os arquivo contendo os exames passou por um processamento anterior (notebook: sl_nomesexames)

In [1]:
#carrega o pacote tidyverse
library(tidyverse)

── [1mAttaching packages[22m ─────────────────────────────────────── tidyverse 1.3.1 ──

[32m✔[39m [34mggplot2[39m 3.3.4     [32m✔[39m [34mpurrr  [39m 0.3.4
[32m✔[39m [34mtibble [39m 3.1.2     [32m✔[39m [34mdplyr  [39m 1.0.6
[32m✔[39m [34mtidyr  [39m 1.1.3     [32m✔[39m [34mstringr[39m 1.4.0
[32m✔[39m [34mreadr  [39m 1.4.0     [32m✔[39m [34mforcats[39m 0.5.1

── [1mConflicts[22m ────────────────────────────────────────── tidyverse_conflicts() ──
[31m✖[39m [34mdplyr[39m::[32mfilter()[39m masks [34mstats[39m::filter()
[31m✖[39m [34mdplyr[39m::[32mlag()[39m    masks [34mstats[39m::lag()



In [2]:
#lê o arquivo pacientes do Sírio
pacientes <- read.csv("HSL_Pacientes_4.csv", sep = "|")

#dimensões 
pacientes %>% dim

#verifica se tem linhas repetidas
pacientes %>% unique %>% dim

In [3]:
#renomeia as colunas
names(pacientes) <- c('id', 'sexo', 'nascimento.ano', 'país', 'estado', 'cidade', 'CEP')

#número de pacientes
pacientes %>% select(id) %>% unique %>% nrow

In [4]:
#le o arquivo bp exames - com nomes processados
exames <- read.csv("HSL_Exames_4_nomesproc.csv")

#dimensões
exames %>% dim

#verifica se tem linhas repetidas
exames %>% unique %>% dim

#remove as linhas repetidas
exames %>% unique -> exames

#número de pacientes (ids) nesse arquivo
exames %>% select(id) %>% unique %>% dim

In [2]:
#lê o arquivo desfecho do Sírio
desfecho <- read.csv("HSL_Desfechos_4.csv", sep = "|") 

#dimensões
desfecho %>% dim

#verifica se tem linhas repetidas
desfecho %>% unique %>% dim


In [3]:
#renomeia as colunas
names(desfecho) <- c('id', 'id.atendimento', 'data.atendimento', 'tipo.atendimento', 'id.clinica', 'descrição', 'data.desfecho','desfecho.paciente')

#número de pacientes (ids) nesse arquivo
desfecho %>% select(id) %>% unique %>% dim

In [10]:
#passa as coluna data.desfecho e data.atendimento para o formato data
desfecho$data.desfecho <- as.Date(desfecho$data.desfecho, format="%d/%m/%Y")
desfecho$data.atendimento<- as.Date(desfecho$data.atendimento, format="%d/%m/%Y")

#adiciona uma coluna com o número de dias entre entrada e a data do desfecho
desfecho %>% mutate(dias.desfecho = (difftime(desfecho$data.desfecho, desfecho$data.atendimento, unit = "days"))) -> desfecho
desfecho$dias.desfecho <- as.integer(desfecho$dias.desfecho)


In [15]:
#faz join dos três arquivos
exames %>% left_join(pacientes) -> dados1
dados1 %>% left_join(desfecho) -> dados

#verifica quantos pacientes (ids) estão presentes
dados %>% select(id) %>% unique %>% dim

#dimensões do arquivo (uma linha por exame)
dados %>% dim

Joining, by = "id"

Joining, by = c("id", "id.atendimento")

“Column `id` joining factors with different levels, coercing to character vector”
“Column `id.atendimento` joining factors with different levels, coercing to character vector”


In [16]:
#passa as colunas data.exame e data.atendimento para o formato data
dados$data.exame <- as.Date(dados$data.exame, format="%d/%m/%Y")
dados$data.atendimento<- as.Date(dados$data.atendimento, format="%d/%m/%Y")

#acrescenta a coluna dias exame (depois de quantos dias após a entrada fez o exame)
dados %>% mutate(dias.exame = (difftime( dados$data.exame, dados$data.atendimento,  unit = "days"))) -> dados
dados$dias.exame <- as.integer(dados$dias.exame)

#resultado 
dados %>% dim
dados -> exames

In [18]:
#filtra PCR na coluna exame
exames %>% filter (str_detect(exame, "pcr")) %>% count(exame)

exame,n
<fct>,<int>
adenovírus pcr quantitativo,10
bcrabl tipo p210 quant pcr tempo real vários mat monitoramento deo lmc,13
chlamydia pesqdna reação por pcr,69
citomegalovírus cmv pcr quantidade viral,622
citomegalovírus detecção qualitativa por pcr,32
clostridium difficile pesquisa do dna fezes pcr em tempo real,539
covid19pcr para sarscov2 fleury,16194
detecção de coronavírus ncov2019 por pcr anatomia patológica,10612
detecção de vírus respiratório por pcr,2203
dna fetal detecção por pcr,2


In [19]:
#filtra PCR na coluna exame
exames %>% filter (str_detect(exame, "pcr")) -> exame_pcr

#verifica quais os analitos estão presentes nesses exames
exame_pcr %>% count(analito)

analito,n
<fct>,<int>
adenovirus determinação quantitativa dna,10
baar após homog nalcnaoh pesquisa,1
baar exame direto pesquisa,1
baar material,1
bcrabl quantific,2
bcrabl1p210 resposta molecular,2
bcrabl1p210 transcritos controle endógeno,7
clam trachomatis pcr,69
clostridium difficile deleção no gene tcdc,52
clostridium difficile toxigênico dna,487


In [20]:
#filtra os analitos referentes ao covid
exame_pcr %>% filter (str_detect(analito, "coronavírus"))  %>% count(analito)

analito,n
<fct>,<int>
coronavírus 2019ncov,8200
detecção de coronavírus ncov2019 por pcr anatomia patológica,10612
virusmol coronavírus 229e,91
virusmol coronavírus hku1,91
virusmol coronavírus nl63,91
virusmol coronavírus oc43,91


In [21]:
#filtra os analitos referentes ao covid e salva
exame_pcr %>% filter (str_detect(analito, "coronavírus"))  -> exames_pcr_covid

#filtra os analitos referentes ao covid
exames_pcr_covid %>% filter (!(str_detect(analito, "rusmol"))) %>% count(analito)

analito,n
<fct>,<int>
coronavírus 2019ncov,8200
detecção de coronavírus ncov2019 por pcr anatomia patológica,10612


In [22]:
#filtra os analitos referentes ao covid - e salva
exames_pcr_covid %>% filter (!(str_detect(analito, "rusmol"))) -> exames_pcr_covid 

#quais os resultados desses analitos
exames_pcr_covid %>% count(resultado)

#filtra apenas os resultados positivos
exames_pcr_covid %>% filter (str_detect(resultado, "DETECTADO")) %>% 
filter (resultado != "NÃO DETECTADO" ) %>% 
filter(resultado != "NÃO DETECTADO (NEGATIVO)") %>% count(resultado)

resultado,n
<fct>,<int>
DETECTADO,12141
DETECTADO (POSITIVO),3764


In [23]:
#filtra apenas os resultados positivos - e salva
exames_pcr_covid %>% filter (str_detect(resultado, "DETECTADO")) %>% 
filter (resultado != "NÃO DETECTADO" ) %>% 
filter(resultado != "NÃO DETECTADO (NEGATIVO)") -> exames_pcr_covid_positivo

In [24]:
#filtra os pacientes que testaram positivo em no máximo 15 dias

#transforma a coluna dias.exame em numérica
exames_pcr_covid_positivo$dias.exame <- as.numeric(exames_pcr_covid_positivo$dias.exame)

#filtra os exames feitos em no máximo 15 dias
exames_pcr_covid_positivo %>% filter(dias.exame <16) -> exames_pcr_covid_positivo

#verifica se o filtro funcionou como esperado
exames_pcr_covid_positivo %>%count(dias.exame)


#seleciona os ids.atendimento dos pacientes que testaram positivo em no máximo 15 dias
exames_pcr_covid_positivo %>% select(id.atendimento) %>% unique -> id_positivo

#número de ids.atendimento que testaram positivo em no máximo 15 dias
id_positivo %>% tally


dias.exame,n
<dbl>,<int>
-3,1
-1,5
0,14694
1,301
2,61
3,47
4,37
5,40
6,32
7,26


n
<int>
15262


In [25]:
#uso os ids para filtrar as linhas correspondes nos exames
exames %>% filter (id.atendimento %in% id_positivo$id.atendimento) -> exames

#dimensão após filtro
exames %>% dim


In [26]:
#verifica quantos pacientes (ids) e em quantos atendimentos (id.atendimento) 
exames %>% select(id) %>% unique %>% dim
exames %>% select(id.atendimento) %>% unique %>% dim

In [27]:
#filtra os exames feitos até o quarto dia após atendimento
exames %>% filter(dias.exame == "0" | dias.exame == "1" | dias.exame == "2" | dias.exame == "3" | dias.exame == "4") -> exames

#cria mais uma coluna unindo exameEanalito
exames %>% mutate(exameEanalito = (str_c(exame, "/", analito))) -> exames

#verifica quantos pacientes (ids) e em quantos atendimentos (id.atendimento) 
exames$id.atendimento %>% unique() %>% length()
exames$id %>% unique() %>% length()

#dimensão dos dados após o filtro
exames %>% dim

#verifica se o filtro funcionou como esperado
exames %>% count(dias.exame)

dias.exame,n
<int>,<int>
0,240954
1,75056
2,54299
3,52519


In [None]:
#alguns exames foram feitos mais de uma vez dentro do mesmo id de atendimento, remove ficando com o primeiro resultado
exames %>% group_by(id.atendimento,  exameEanalito) %>% arrange((dias.exame)) %>% slice(1) %>% ungroup -> exames

#dimensão dos dados após o filtro
exames %>% dim

In [None]:
#nomes das colunas
exames %>% colnames

#tipos de desfecho
exames %>% count(desfecho.paciente)

#quantos pacientes foram internados mais de 9 dias
exames %>% filter (tipo.atendimento == 'Internado') %>% filter(dias.desfecho > 9) %>% dim

In [None]:
#cria essas variáveis para verificar se a gravidade foi atribuida corretamente
obito_1 <- 0
obito_2 <- 0
obito_3 <- 0
obito_4 <- 0
internado <- 0

#adiciona uma coluna com a gravidade = não
exames %>% mutate(gravidade = 0) -> exames


#condições de gravidade
for (i in (1:nrow(exames))){ #percorre todo o arquivo
  dias <- exames$dias.desfecho[i]
  desfpac <- exames$desfecho.paciente[i]

  #se paciente internado e mais de 9 dias entre a entrada e o desfecho
  if (!(is.na(dias)) && exames$tipo.atendimento[i] == "Internado" && dias > 9){ 
   exames$gravidade[i] <- 1
   internado = internado+1
   }

  
  se óbito
  if (!(is.na(desfpac)) & desfpac == "Óbito após 48hs de internação com necrópsia")
  {   exames$gravidade[i] <- 1 
      obito_1 = obito_1+1}

  if (!(is.na(desfpac)) & desfpac == "Óbito após 48hs de internação sem necrópsia")
  {   exames$gravidade[i] <- 1  
      obito_2 = obito_2+1}
    
  if (!(is.na(desfpac)) & desfpac == "Óbito nas primeiras 48hs de internação sem necrópsia agônico")
  {   exames$gravidade[i] <- 1 
      obito_3 = obito_3+1}
    
  if (!(is.na(desfpac)) & desfpac == "Óbito nas primeiras 48hs de internação sem necrópsia não agônico")
  {   exames$gravidade[i] <- 1 
      obito_4 = obito_4+1}

}

#verifica se gravidade foi atribuída corretamente
exames %>% count(gravidade)
obito_1
obito_2
obito_3
obito_4
internado

In [None]:
#dimensão dos dados 
exames %>% dim


#acrescenta a coluna idade
exames %>% mutate(idade = (as.numeric(format(as.Date(exames$data.atendimento), '%Y')) -  
                as.numeric(exames$nascimento.ano))) -> exames

exames %>% count(idade)

#substitui vírculo por pontos
exames <- data.frame(lapply(exames, function(x) {gsub(",", ".", x)}))

#transforma sexo em númerico
as.character(exames$sexo) -> exames$sexo
exames$sexo[exames$sexo == "F"] <- 1
exames$sexo[exames$sexo == "M"] <- 0
as.numeric(exames$sexo) -> exames$sexo
exames %>% count(sexo)

In [None]:
exames %>% colnames
exames %>% dim

In [None]:
#pivota transformando cada paciente em uma linha
exames %>%   select(c(1,2,5,10,11,17,26,25)) %>% #seleciona as colunas id, exame+analito e resultado, idade, sexo, gravidade, gravidade2
  group_by('id.atendimento') %>% #agrupa por id
  pivot_wider(names_from = exameEanalito, values_from = resultado) %>%  #pivota transformando exame+analito em várias colunas
  ungroup -> pivotado 

#quantos atendimentos são graves
pivotado %>% count(gravidade)

#nova dimensão dos dados
pivotado %>% dim


In [None]:
#remove os pacientes que não fizeram hemograma - verificado pelo analito neutrófilos
pivotado = pivotado[!is.na(pivotado$'hemograma/neutrófilos'),  ]

#dimensão dos dados após o filtro
pivotado %>% dim

#quantos são graves
pivotado %>% count(gravidade)

#quantos pacientes há na base
pivotado %>% select(id) %>% unique %>% dim

In [None]:
#filtra apenas um id.atendimento por paciente
pivotado %>% group_by(id) %>% arrange(desc(data.atendimento)) %>% slice(1) %>% ungroup -> pivotado

#dimensão dos dados após o filtro
pivotado %>% dim

#quantos são graves
pivotado %>% count(gravidade)

pivotado -> exames

In [None]:
#quais datas foram incluidas nesse grupo
pivotado %>% count (data.atendimento)

In [None]:
#algumas colunas ficam identificadas como string por causa de alguns resultados
exames <- data.frame(lapply(exames, function(x) {gsub("superior a", "", x)}))
exames <- data.frame(lapply(exames, function(x) {gsub( "inferior a", "", x)}))
exames <- data.frame(lapply(exames, function(x) {gsub( "1.000.000.", "1000000", x)}))
exames <- data.frame(lapply(exames, function(x) {gsub( "g/L", "", x)}))
exames <- data.frame(lapply(exames, function(x) {gsub( "1.000.000", "1000000", x)}))
exames <- data.frame(lapply(exames, function(x) {gsub( "negativa", "0", x)}))
exames <- data.frame(lapply(exames, function(x) {gsub( "Parcial Positivo", "1", x)}))
exames <- data.frame(lapply(exames, function(x) {gsub( "Parcial Nositivo", "0", x)}))
exames <- data.frame(lapply(exames, function(x) {gsub( "POSITIVO", "1", x)}))
exames <- data.frame(lapply(exames, function(x) {gsub( "NEGATIVO", "0", x)}))
exames <- data.frame(lapply(exames, function(x) {gsub( "NÃO REAGENTE", "0", x)}))
exames <- data.frame(lapply(exames, function(x) {gsub( "REAGENTE", "1", x)}))
exames <- data.frame(lapply(exames, function(x) {gsub( "Indeterminado", "NA", x)}))
exames <- data.frame(lapply(exames, function(x) {gsub( "não reagente", "0", x)}))
exames <- data.frame(lapply(exames, function(x) {gsub( "REAGENTE. maior ou igual a 1000", "1000", x)}))
exames <- data.frame(lapply(exames, function(x) {gsub( "Parcial Negativo", "0", x)}))



In [None]:
#transforma o formato das colunas
dados <- as.numeric(exames)


In [None]:
#quantas e quais são as colunas não numéricas
dados %>% dplyr::select(where(is.character)) %>% ncol

dados %>% dplyr::select(where(is.character)) %>% colnames


In [None]:
#filtra apenas as colunas numéricas
dados %>% dplyr::select(where(is.double)) -> dados

#remove a coluna data.atendimento
dados %>% select(-data.atendimento) -> dados

#resultado
dados %>% dim
dados %>% count(gravidade)

#idade
dados %>% count(idade)

In [None]:
#filtra apenas os pacientes graves
dados %>% filter(gravidade == 1) -> graves

#filtra os exames que ao menos 50% de valores não ausentes nesta classe

colunas = c()
#para cada coluna 
for (i in 1:ncol(dados)) { 
  #conta os valores diferentes de NA
  temp = sum(!is.na(graves[,i]))
  #se os valores diferentes de NA forem mais da metade do total de graves seleciona essa coluna
  if (temp >= (nrow(graves)/2)) {colunas <- append(colunas, i)}
}

#filtra as colunas selecionadas
dados %>% select(all_of(colunas)) -> dados

#número de colunas
dados %>% ncol

In [None]:
#filtra apenas os pacientes não graves
dados %>% filter(gravidade == 0) -> ngraves

#filtra os exames que ao menos 50% de valores não ausentes nesta classe

colunas = c()
#para cada coluna 
for (i in 1:ncol(dados)) { 
    #conta os valores diferentes de NA
    temp = sum(!is.na(ngraves[,i]))
    #se os valores diferentes de NA forem mais da metade do total de ngraves seleciona essa coluna
    if (temp >= (nrow(ngraves)/2)) {colunas <- append(colunas, i)}
}

#filtra as colunas selecionadas
dados %>% select(all_of(colunas)) -> dados

#número de colunas
dados %>% ncol

In [None]:
#conjunto de funções para remover valores extremos, foram removidos 4 valores extremos por variável
#a decisão por remover valores extremos à direita, à esquerda ou de ambas foi feita a partir de análise visual dos histogramas


#biblioteca usada para transformar os valores em na
library(naniar)

#função para transformar em NA os valores extremos da direita

re_extremos_dir <- function(column) {

  #a função map passa as colunas como listas
  #transforma em tibble e acrescenta um "nome"
  column %>% as.tibble -> column
  colnames(column)[1] <- "label" 

  #define os 4 valores extremos à direita
  column %>% na.omit %>% count(label) %>% slice(tail(row_number(), 4)) %>% select(1) %>% as.list -> limite
  limite[[1]] ->> limite

  #transforma esses valores em NA
  column %>% replace_with_na_all(condition = ~.x %in% limite) -> column
  
} 

#função para transformar em NA os valores extremos da esquerda
re_extremos_esq <- function(column) {

  #a função map passa as colunas como listas
  #transforma em tibble e acrescenta um "nome"
  column %>% as.tibble -> column
  colnames(column)[1] <- "label" 

  #define os 4 valores extremos à esquerda
  column %>% count(label) %>% slice(1:4) %>% select(1) %>% as.list -> limite
  c(limite[[1]]) ->> limite

  #transforma esses valores em NA
  column %>% replace_with_na_all(condition = ~.x %in% limite) -> column

  
}


#função para transformar em NA os valores extremos da esquerda e da direita
re_extremos_dir_esq <- function(column) {

  #a função map passa as colunas como listas
  #transforma em tibble e acrescenta um "nome"
  column %>% as.tibble -> column
  colnames(column)[1] <- "label" 

  #define os 2 valores extremos à esquerda
  column %>% count(label) %>% slice(1:2) %>% select(1) %>% as.list -> limite
  c(limite[[1]]) ->> limite

  #define os 2 valores extremos à direita
  column %>% na.omit %>% count(label) %>% slice(tail(row_number(), 2)) %>% select(1) %>% as.list -> limite2
  c(limite2[[1]]) ->> limite2

  #transforma esses valores em NA
  column %>% replace_with_na_all(condition = ~.x %in% limite2) -> column
  column %>% replace_with_na_all(condition = ~.x %in% limite) -> column

}


In [None]:
#filtra apenas os pacientes ngraves
dados %>% filter(gravidade == 0) -> ngraves

#filtra os exames que ao menos x% de valores não ausentes nesta classe
colunas = c()
for (i in 1:ncol(dados)) { 
  temp = sum(!is.na(ngraves[,i]))
  if (temp >= (nrow(ngraves)/2)) {colunas <- append(colunas, i)}
}

dados %>% select(all_of(colunas)) -> dados
dados %>% ncol
dados %>% colnames


In [None]:
library(ggplot2)

for (i in (1:ncol(dados))){

  label <- (dados[i] %>% colnames)
  #label <- label %>% str_replace(".", "")
  exame <- dados %>% select(i) %>% as.list
  exame[[1]] -> exame
  #b <-(max(exame)-min(exame))/50
  His <- ggplot(data=dados, 
  aes(x=exame))+
  geom_histogram(bins = 50, color="black", aes(fill=factor(gravidade))) +  
  xlab(label) +   ylab("Frequencia") +      
  theme(legend.position="none")+  ggtitle(paste("Histograma", label))+      
  geom_vline(data=dados, aes(xintercept = median(exame)),linetype="dashed",color="grey")
  show(His)
}


In [None]:
#variáveis com histograma dislocado à esquerda, remover valores extremos da direita
dados %>% select('creatinina.creatinina',
                 'd.dimerosdimeros.de.fibrina.dimeros.d.quant',
                 'hemograma.basófilos',
                 'hemograma.basófilos.percentual',
                 'hemograma.eosinófilos',
                 'hemograma.eosinófilos.percentual',
                 'hemograma.leucócitos',
                 'hemograma.linfócitos',
                 'hemograma.linfócitos.percentual',
                 'hemograma.monócitos',
                 'hemograma.monócitos.percentual',
                 'hemograma.neutrófilos',
                 'hemograma.rdw',
                 'hemograma.volume.plaquetário.médio',
                 'potássio.potássio',
                 'proteína.c.reativa.proteína.creativa',
                 'sódio.sódio',
                 'tgo.ast.tgo',
                 'tgp.alt.tgp',
                 'uréia.uréia') -> dados_dir

#aplica a função a cada coluna
dados_dir %>% map(~ re_extremos_dir(.)) %>% as.data.frame -> dados_dir

#renomeia
names(dados_dir) <-c('creatinina.creatinina',
                 'd.dimerosdimeros.de.fibrina.dimeros.d.quant',
                 'hemograma.basófilos',
                 'hemograma.basófilos.percentual',
                 'hemograma.eosinófilos',
                 'hemograma.eosinófilos.percentual',
                 'hemograma.leucócitos',
                 'hemograma.linfócitos',
                 'hemograma.linfócitos.percentual',
                 'hemograma.monócitos',
                 'hemograma.monócitos.percentual',
                 'hemograma.neutrófilos',
                 'hemograma.rdw',
                 'hemograma.volume.plaquetário.médio',
                 'potássio.potássio',
                 'proteína.c.reativa.proteína.creativa',
                 'sódio.sódio',
                 'tgo.ast.tgo',
                 'tgp.alt.tgp',
                 'uréia.uréia')


In [None]:
#variáveis com histograma dislocado à direita, remover valores extremos da esquerda
dados %>% select('hemograma.neutrófilos.percentual','hemograma.chcm' ) -> dados_esq

#aplica a função a cada coluna
dados_esq %>% map(~ re_extremos_esq(.)) %>% as.data.frame -> dados_esq

#renomeia
names(dados_esq) <- c('hemograma.neutrófilos.percentual','hemograma.chcm' )

In [None]:
#variáveis com histograma centralizado, remover extremos da direita e da esquerda
dados %>% select('hemograma.eritrócitos',
                 'hemograma.hcm',
                 'hemograma.vcm',
                 'hemograma.hemograma') -> dados_dir_esq

#aplica a função a cada coluna
dados_dir_esq %>% map(~ re_extremos_dir_esq(.)) %>% as.data.frame -> dados_dir_esq

#renomeia
names(dados_dir_esq) <- c('hemograma.eritrócitos',
                 'hemograma.hcm',
                 'hemograma.vcm',
                 'hemograma.hemograma')

In [None]:
#variáveis que não tiveram remoção de extremos
dados %>% select("sexo", "idade", "gravidade") -> dados_2

#une as variáveis novamente
dados_2 %>% cbind(dados_dir) %>% cbind(dados_esq) %>% cbind(dados_dir_esq) -> dados
dados %>% dim
dados %>% count(gravidade)

In [None]:
#nomes das variáveis
dados %>% colnames

#visualiza dos dados
dados %>% head

#coloca gravidade como última coluna
dados %>% select(gravidade) -> gravidade
dados %>% select(-gravidade) -> dado
cbind(dado,gravidade) -> dados


In [None]:
names(dados) <- c('Sex','Age','Creatinine','D-dimers',
                 'Basophils','Basophils(%)','Eosinophils',
                 'Eosinophils(%)','Leukocytes','Lymphocytes',
                 'Lymphocytes(%)','Monocytes','Monocytes(%)',
                 'Neutrophils','RDW','MPV','Potassium',
                  'C-reative protein','Sodium','GOT',
                 'GPT','Urea','Neutrophils(%)',
                 'MCHC','Erythrocytes','MCH',
                 'MCV','Hemoglobin', 'Severity')

In [None]:
dados %>% write_csv("sl.csv")