In [None]:
library(readxl)             # Load the package into your R session
library(writexl)
library(dplyr)
#Importeer excel file van export gemstracker WAISIV
# Replace "data.xlsx" with the actual file name and path if it's located in a different directory
WAISIV_gemstracker <- read.csv("../../secret_data/WAISIV_BRICK_T0dd08042024.csv", sep=";")


#head(WAISIV_gemstracker)

names(WAISIV_gemstracker)[names(WAISIV_gemstracker) == "gr2o_patient_nr"] <- "Participant Id"
names(WAISIV_gemstracker)[names(WAISIV_gemstracker) == "DatumWAISIV"] <- "Datum_WAIS_IV"
names(WAISIV_gemstracker)[names(WAISIV_gemstracker) == "StartWAISIV"] <- "Start_WAIS_IV"
names(WAISIV_gemstracker)[names(WAISIV_gemstracker) == "StopWAISIV"] <- "Stop_WAIS_IV"
names(WAISIV_gemstracker)[names(WAISIV_gemstracker) == "WAISIVVolt"] <- "WAIS_IV_voltooid"
names(WAISIV_gemstracker)[names(WAISIV_gemstracker) == "VolgordeWAISIV"] <- "Volgorde_NPO_5"
names(WAISIV_gemstracker)[names(WAISIV_gemstracker) == "AfnemerWAISIV"] <- "Afnemer_WAIS_IV"
names(WAISIV_gemstracker)[names(WAISIV_gemstracker) == "WAISIVOpm"] <- "Opmerkingen_WAIS_IV"
names(WAISIV_gemstracker)[names(WAISIV_gemstracker) == "WAISIVOpmUit"] <- "Uitleg_Opmerkingen_WAIS_IV"


WAISIV_gemstracker$BRICK_of_uitgebreid_2 <- 1

#De volgende kolommen die wel in de Castor-export van de WICV staan, voegen we niet toe: Participant status, site abbreviation en participation creation date. 
#Dit zal niet zorgen voor problemen, zolang de participanten al vóór de Gemstracker-import zijn aangemaakt in Castor. We gaan niet via deze weg nieuwe patienten importeren. Dit kan wel, maar dan heb je wel deze kolommen nodig.

#Waarden in de kolommen aanpassen op Castor Format

#1.Te beginnen met de datum:

# Convert the column "Datum_WAIS_IV" to Date format
WAISIV_gemstracker$Datum_WAIS_IV <- as.Date(WAISIV_gemstracker$Datum_WAIS_IV, format = "%Y-%m-%d")

# Change the date format to "02-08-2023" in the same column
WAISIV_gemstracker$Datum_WAIS_IV <- format(WAISIV_gemstracker$Datum_WAIS_IV, "%d-%m-%Y")

# Convert "AfnemerWAISIV_SQ000" to "AfnemerWAISIV_SQ006" columns to numeric values
# Convert "AfnemerWAISIV_SQ000" to "AfnemerWAISIV_SQ006" columns to numeric values
for (i in 0:6) {
  column_name <- paste("AfnemerWAISIV_SQ00", i, sep = "")
  WAISIV_gemstracker$Afnemer_WAIS_IV[WAISIV_gemstracker[column_name] == "Y"] <- i
}

#3. Hier veranderen we de waarden in de volgorde_NPO kolom voor in Castor

# Convert "VolgordeWISC_SQ001" to "VolgordeWISC_SQ004" columns to numeric values
for (i in 1:4) {
  col_name <- paste("VolgordeWAISIV_SQ00", i, sep = "")
  WAISIV_gemstracker$Volgorde_NPO_5[WAISIV_gemstracker[[col_name]] == "Y"] <- i
}

#4. Alle waarden onder kolom: Opmerkingen_WAIS_IV en WAIS_IV_voltooid gaan van Y naar 1 en van N naar 0

# Convert "Y" to 1 and "N" to 0 in the "Opmerkingen_WAIS_IV" column
WAISIV_gemstracker$Opmerkingen_WAIS_IV[WAISIV_gemstracker$Opmerkingen_WAIS_IV == "Y"] <- 1
WAISIV_gemstracker$Opmerkingen_WAIS_IV[WAISIV_gemstracker$Opmerkingen_WAIS_IV == "N"] <- 0

WAISIV_gemstracker$WAIS_IV_voltooid[WAISIV_gemstracker$WAIS_IV_voltooid == "Y"] <- 1
WAISIV_gemstracker$WAIS_IV_voltooid[WAISIV_gemstracker$WAIS_IV_voltooid == "N"] <- 0

##Haal het uur en de minuten uit twee afzonderlijke kolommen en zet ze samen in de start kolom.
# Convert numeric columns to characters
WAISIV_gemstracker$StartWAISIV_SQ001 <- as.character(WAISIV_gemstracker$StartWAISIV_SQ001)
WAISIV_gemstracker$StartWAISIV_SQ002 <- as.character(WAISIV_gemstracker$StartWAISIV_SQ002)

# Create Start_WAIS_IV column
WAISIV_gemstracker$Start_WAIS_IV <- paste(WAISIV_gemstracker$StartWAISIV_SQ001, WAISIV_gemstracker$StartWAISIV_SQ002, sep = ":")

# Repeat the same process for Stop columns
WAISIV_gemstracker$StopWAISIV_SQ001 <- as.character(WAISIV_gemstracker$StopWAISIV_SQ001)
WAISIV_gemstracker$StopWAISIV_SQ002 <- as.character(WAISIV_gemstracker$StopWAISIV_SQ002)

# Create Stop_WAIS_IV column
WAISIV_gemstracker$Stop_WAIS_IV <- paste(WAISIV_gemstracker$StopWAISIV_SQ001, WAISIV_gemstracker$StopWAISIV_SQ002, sep = ":")


#Volgorde kolommen aanpassen
WAISIV_gemstracker <- WAISIV_gemstracker %>%
  select("Participant Id", "BRICK_of_uitgebreid_2", "Datum_WAIS_IV", "Start_WAIS_IV", 
         "Stop_WAIS_IV", "Volgorde_NPO_5", "WAIS_IV_voltooid", 
         "Opmerkingen_WAIS_IV", "Uitleg_Opmerkingen_WAIS_IV", everything())

#print(names(WAISIV_gemstracker))

#Elke field name is uniek. In de baseline meting, hebben bijn alle velden in Castor een _1. In FU1 en FU2 zal dit zeker _2 en _3 worden
#behalve participant id en "Volgorde_5", moeten alle kolommen eraan geloven.



#Delete de kolommen uit de gemstracker export die je niet nodig hebt (dplyr)

# List of columns to be removed
columns_to_remove <- c("respondentid", "organizationid", "gto_id_relation", "forgroup",
                       "consentcode", "resptrackid", "gto_round_order", "gto_round_description", 
                       "gtr_track_name", "gr2t_track_info", "gto_completion_time", "gto_start_time", 
                       "gto_valid_from", "gto_valid_until", "startlanguage", "lastpage", 
                       "gto_id_token", "surveyversion", "AfnemerWAISIV_SQ000", "AfnemerWAISIV_SQ001", 
                       "AfnemerWAISIV_SQ002", "AfnemerWAISIV_SQ003", "AfnemerWAISIV_SQ004", 
                       "AfnemerWAISIV_SQ005", "AfnemerWAISIV_SQ006", 
                        "StartWAISIV_SQ001", "StartWAISIV_SQ002", 
                       "StopWAISIV_SQ001", "StopWAISIV_SQ002", 
                       "VolgordeWAISIV_SQ001", "VolgordeWAISIV_SQ002",
                       "VolgordeWAISIV_SQ003", "VolgordeWAISIV_SQ004", "surveyVersie",
                       "scriptVersie", "stamtabelVersie")

# Remove the specified columns
WAISIV_gemstracker <- WAISIV_gemstracker %>%
  select(-one_of(columns_to_remove))

#print(names(WAISIV_gemstracker))
# Create a list to hold the new column names
new_column_names <- vector("character", length(names(WAISIV_gemstracker)))

# Iterate through each column name
for (i in seq_along(names(WAISIV_gemstracker))) {
  col_name <- names(WAISIV_gemstracker)[i]
  
  if (col_name != "Participant Id" && col_name != "Volgorde_NPO_5" && col_name != "BRICK_of_uitgebreid_2") {
    new_column_names[i] <- paste(col_name, "_1", sep = "")
  } else {
    new_column_names[i] <- col_name
  }
}

#length(colnames(WAISIV_gemstracker))

#length(new_column_names)

colnames(WAISIV_gemstracker) <- new_column_names

# Print the updated column names
print(names(WAISIV_gemstracker))

#exporteer nieuwe df naar excel file
write_xlsx(WAISIV_gemstracker, path = "WAISIV_gemstracker_poging_makeda.xlsx")

# Export to CSV
write.csv(WAISIV_gemstracker, file = "WAISIV_gemstracker_poging_makeda.csv", row.names = FALSE)

In [29]:
head(WAISIV_gemstracker)

Unnamed: 0_level_0,Participant Id,BRICK_of_uitgebreid_2,Datum_WAIS_IV_1,Start_WAIS_IV_1,Stop_WAIS_IV_1,Volgorde_NPO_5,WAIS_IV_voltooid_1,Opmerkingen_WAIS_IV_1,Uitleg_Opmerkingen_WAIS_IV_1,Afnemer_WAIS_IV_1,...,ScoreDRETot_1,ScoreSigRETot_1,ScoreDSZTot_1,ScoreSigSZTot_1,ScoreDFSTot_1,ScoreSigFSTot_1,ScoreDINTot_1,ScoreSigINTot_1,ScoreDSSCTot_1,ScoreSigSSCTot_1
Unnamed: 0_level_1,<chr>,<dbl>,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>,...,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>
1,BRICK-057,1,20-09-0007,9:30,NA:NA,Niet aangevinkt,Ja,Nee,,Niet aangevinkt,...,0,Nee,'-4,Ja,3,Ja,2,Nee,'-5,Ja
2,BRICK_020,1,20-07-0018,NA:NA,NA:NA,Niet aangevinkt,Ja,Nee,,Niet aangevinkt,...,'-1.5,Nee,'-1.5,Nee,4.5,Ja,1.5,Nee,'-1.5,Nee
3,BRICK_019,1,20-09-0008,NA:NA,NA:NA,Niet aangevinkt,Ja,Ja,"Nederlands niet eerste taal, gaf aan dit lastig te vinden.",Niet aangevinkt,...,'-2.6,Nee,3.4,Nee,0.4,Nee,'-0.6,Nee,1.4,Nee
4,BRICK_031,1,20-01-0005,NA:NA,NA:NA,Niet aangevinkt,Ja,Nee,,Niet aangevinkt,...,'-1.5,Nee,'-1.5,Nee,'-1.5,Nee,1.5,Nee,1.5,Nee
5,BRICK_053,1,20-06-0001,NA:NA,NA:NA,Niet aangevinkt,Ja,Nee,,Niet aangevinkt,...,'-0.8,Nee,'-1.8,Nee,2.2,Nee,1.2,Nee,'-2.8,Nee
6,BRICK_050,1,20-04-0005,NA:NA,NA:NA,Niet aangevinkt,Ja,Nee,,Niet aangevinkt,...,0.1,Nee,'-0.9,Nee,0.1,Nee,6.1,Ja,'-2.9,Nee
