# Create Documentation .rst-Files from Data Description Table

<h1>Table of Contents<span class="tocSkip"></span></h1>
<div class="toc"><ul class="toc-item"><li><span><a href="#Read-in-Codebook-&amp;-Set-Variable-Names" data-toc-modified-id="Read-in-Codebook-&amp;-Set-Variable-Names-1"><span class="toc-item-num">1&nbsp;&nbsp;</span>Read in Codebook &amp; Set Variable Names</a></span></li><li><span><a href="#Create-Documentation" data-toc-modified-id="Create-Documentation-2"><span class="toc-item-num">2&nbsp;&nbsp;</span>Create Documentation</a></span><ul class="toc-item"><li><span><a href="#Create-documentation-files" data-toc-modified-id="Create-documentation-files-2.1"><span class="toc-item-num">2.1&nbsp;&nbsp;</span>Create documentation files</a></span></li></ul></li></ul></div>

In [15]:
%load_ext autoreload
%autoreload 2

import os
import pandas as pd
import numpy as np
from functions import *

The autoreload extension is already loaded. To reload it, use:
  %reload_ext autoreload


## Read in Codebook & Set Variable Names

Specifiy column names that should be used to create the files:

* **q_groups**: Variable groups, groups will be used as sections in the topic files.
* **q_label**: Should contain the question.
* **q_type**: Should contain the question type. The following types are currently accepted: [Categorical,bool, int, float, str]
* **q_topics**: Topic groups, each topic will get its own .rst-file.
* **gesis_indicator**: Indicator for whether the question is also in the GESIS questionnaire.

In [16]:
#q_topics = "topic_english"
q_groups = "group_english"
q_label = "label_dutch"
q_type = "type"
q_categories = "category_dutch"
q_varname = "new_name"
q_ids = "qid"
sqid="id"
q_layout="layout"
q_filter="filter"
q_text ="question_dutch"
q_sub_text="subquestion_dutch"
q_numbers="page"

In [17]:
target_dir = "wave-2/dutch/rst-files-pages/"
image_path = "../_screenshots/"

Load codebook/description table:

In [18]:
codebook = pd.read_csv("wave-2/dutch/codebook-dutch.csv", sep = ";")
codebook.tail(50)

Unnamed: 0,new_name,page,qid,id,layout,filter,group_english,question_dutch,subquestion_dutch,category_dutch,ordered,type,nice_name_english
109,,34.8,q17,,multi,q14header,Reasons for Working Not Or Less Among the Self...,Waarom werkte u minder of helemaal niet in de ...,"Anders, namelijk:",,,bool,
110,,35.0,cruciaal,,cat,q14header,Crucial Profession Among Employed,Valt uw beroep onder de cruciale beroepsgroep?,,"Ja, Nee",True,Categorical,
111,,36.0,cruciaal_notempl,,cat,q14header,Crucial Former Profession Among Unemployed,Valt het beroep dat u hebt uitgeoefend onder d...,,"Ja, Nee, Weet ik niet/Niet van toepassing",True,Categorical,
112,,37.0,income,inc_jan,grid,-,Income Last Three Months,Wat was in de afgelopen drie maanden het gezam...,inkomen in januari:,,,int,
113,,37.0,income,inc_feb,grid,-,Income Last Three Months,Wat was in de afgelopen drie maanden het gezam...,inkomen in februari:,,,int,
114,,37.0,income,inc_mrt,grid,-,Income Last Three Months,Wat was in de afgelopen drie maanden het gezam...,inkomen in maart:,,,int,
115,,38.0,expectedincome,expinc2020,grid,-,Expected Income Next Years,We willen graag weten wat u verwacht dat het g...,Voor dit jaar (dus ook voor de maanden januari...,Vóórdat er sprake was van de\nuitbraak van het...,,int,
116,,38.0,expectedincome,expinc2021,grid,-,Expected Income Next Years,We willen graag weten wat u verwacht dat het g...,Voor het jaar 2021,Vóórdat er sprake was van de\nuitbraak van het...,,int,
117,,38.0,expectedincome,expinc2022,grid,-,Expected Income Next Years,We willen graag weten wat u verwacht dat het g...,Voor het jaar 2022,Vóórdat er sprake was van de\nuitbraak van het...,,int,
118,,39.0,ExpUnempl_before,ExpUnempl_before2020,table,-,Expected Unemployment Before,We willen graag weten wat u verwachtte dat het...,2020,"minder dan 3.0%, 3.0% tot 6.0%, 6.0% tot 9.0%,...",True,Categorical,


In [19]:
# Removed undesired groups.
codebook = codebook[codebook[q_groups].notna()]
codebook = codebook[codebook[q_ids].notna()]

#for val in ['Skip','questionnaire','background']:
#    codebook = codebook[codebook[q_groups] != val]

In [20]:
codebook = codebook.sort_values(by=q_numbers)

In [21]:
codebook

Unnamed: 0,new_name,page,qid,id,layout,filter,group_english,question_dutch,subquestion_dutch,category_dutch,ordered,type,nice_name_english
0,,1.0,intro,,open,-,Intro,Deze maand krijgt u opnieuw een vragenlijst ov...,,,,none,
1,,2.0,InfectionDiagnosed,,cat,-,InfectionDiagnosed,Heeft een huisarts of een ander medisch deskun...,,"Ja die diagnose is bij mij gesteld, Nee, Het i...",1,Categorical,
2,,3.0,SelfPerceivedInfection,,cat,-,SelfPerceivedInfection,Denkt u zelf dat u besmet bent met het coronav...,,"Ja, Nee, Ik weet het niet",1,Categorical,
3,,4.1,q1header,q1a,grid,-,Subjective Risks,Hoe groot denkt u dat de kans is dat de volgen...,u wordt besmet,,,float,
4,,4.2,q1header,q1b,grid,-,Subjective Risks,Hoe groot denkt u dat de kans is dat de volgen...,"iemand in uw directe omgeving (familie, vriend...",,,float,
...,...,...,...,...,...,...,...,...,...,...,...,...,...
154,,51.2,eva2h,eva2t2,table,-,Liked Questionnaire,NB: Maakt u alstublieft de vragenlijst af totd...,Vond u de vragen duidelijk?,"1 = beslist niet, 2, 3, 4, 5 = beslist wel\n\n",TRUE,Categorical,
155,,51.3,eva2h,eva2t3,table,-,Liked Questionnaire,"1 = beslist niet, 2, 3, 4, 5 = beslist wel\n\n",Heeft de vragenlijst u aan het denken gezet?,"1 = beslist niet, 2, 3, 4, 5 = beslist wel\n\n",TRUE,Categorical,
156,,51.4,eva2h,eva2t4,table,-,Liked Questionnaire,NB: Maakt u alstublieft de vragenlijst af totd...,Vond u het onderwerp interessant?,"1 = beslist niet, 2, 3, 4, 5 = beslist wel\n\n",TRUE,Categorical,
157,,51.5,eva2h,eva2t5,table,-,Liked Questionnaire,NB: Maakt u alstublieft de vragenlijst af totd...,Vond u het plezierig om de vragen in te vullen?,"1 = beslist niet, 2, 3, 4, 5 = beslist wel\n\n",TRUE,Categorical,


In [22]:
codebook["new_name"]="" 

In [23]:
codebook

Unnamed: 0,new_name,page,qid,id,layout,filter,group_english,question_dutch,subquestion_dutch,category_dutch,ordered,type,nice_name_english
0,,1.0,intro,,open,-,Intro,Deze maand krijgt u opnieuw een vragenlijst ov...,,,,none,
1,,2.0,InfectionDiagnosed,,cat,-,InfectionDiagnosed,Heeft een huisarts of een ander medisch deskun...,,"Ja die diagnose is bij mij gesteld, Nee, Het i...",1,Categorical,
2,,3.0,SelfPerceivedInfection,,cat,-,SelfPerceivedInfection,Denkt u zelf dat u besmet bent met het coronav...,,"Ja, Nee, Ik weet het niet",1,Categorical,
3,,4.1,q1header,q1a,grid,-,Subjective Risks,Hoe groot denkt u dat de kans is dat de volgen...,u wordt besmet,,,float,
4,,4.2,q1header,q1b,grid,-,Subjective Risks,Hoe groot denkt u dat de kans is dat de volgen...,"iemand in uw directe omgeving (familie, vriend...",,,float,
...,...,...,...,...,...,...,...,...,...,...,...,...,...
154,,51.2,eva2h,eva2t2,table,-,Liked Questionnaire,NB: Maakt u alstublieft de vragenlijst af totd...,Vond u de vragen duidelijk?,"1 = beslist niet, 2, 3, 4, 5 = beslist wel\n\n",TRUE,Categorical,
155,,51.3,eva2h,eva2t3,table,-,Liked Questionnaire,"1 = beslist niet, 2, 3, 4, 5 = beslist wel\n\n",Heeft de vragenlijst u aan het denken gezet?,"1 = beslist niet, 2, 3, 4, 5 = beslist wel\n\n",TRUE,Categorical,
156,,51.4,eva2h,eva2t4,table,-,Liked Questionnaire,NB: Maakt u alstublieft de vragenlijst af totd...,Vond u het onderwerp interessant?,"1 = beslist niet, 2, 3, 4, 5 = beslist wel\n\n",TRUE,Categorical,
157,,51.5,eva2h,eva2t5,table,-,Liked Questionnaire,NB: Maakt u alstublieft de vragenlijst af totd...,Vond u het plezierig om de vragen in te vullen?,"1 = beslist niet, 2, 3, 4, 5 = beslist wel\n\n",TRUE,Categorical,


## Create Documentation

In [24]:
create_pages(codebook, q_ids, q_filter, q_groups, q_layout, q_text, q_sub_text, q_categories, q_varname, target_dir, image_path)

### Create documentation files

In [25]:
variables = codebook[["new_name","qid","id","filter","group_english","type"]]
variables.to_csv("wave-2/dutch/variable_overview.csv")

In [26]:
#create_topic_folders(codebook, q_topics, target_dir)

In [27]:
#create_group_file(codebook, q_topics, q_groups, q_type, q_label, q_categories, q_varname, target_dir,True)

In [28]:
#topics = get_rst_names(list(codebook[q_topics].unique()))
#topics