In [1]:
import pandas as pd 
import numpy as np
from helpers import *
#import coach_dicts
import os

import seaborn as sns
import matplotlib.pyplot as plt

from sklearn import preprocessing
from sklearn.preprocessing import MinMaxScaler
from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier

# Validation libraries
from sklearn import metrics
from sklearn.metrics import accuracy_score, recall_score, balanced_accuracy_score, precision_score, precision_recall_curve
from sklearn.metrics import confusion_matrix, plot_confusion_matrix
from sklearn.metrics import classification_report
from sklearn.model_selection import train_test_split
from sklearn.model_selection import KFold, cross_val_score

# Display plots inside the notebook
%matplotlib inline

# Ignore warning related to pandas_profiling
import warnings
warnings.filterwarnings('ignore') 

from pathlib import Path

# Display all dataframe columns in outputs (it has 63 columns, which is wider than the notebook)
# This sets it up to display with a horizontal scroll instead of hiding the middle columns
pd.set_option('display.max_columns', 800) 
pd.set_option('display.max_colwidth', -1)
pd.set_option('display.max_rows', 1800)

In [2]:
path = os.environ.get("DATA_PATH")

In [3]:
data = "tkdc_leona_2021-03-01.csv"

In [4]:
df = pd.read_csv(path + data, sep= ",", low_memory = False)

In [5]:
df_letter1 = df[["id", "letter_M1"]]

In [6]:
df_letter2 = df[["id", "letter_M2"]]

In [7]:
df_letter1.set_index("id", inplace=True)

In [8]:
df_letter2.set_index("id", inplace=True)

### Import dictionaries

In [9]:
wortdict_1 = pd.read_csv("Words_SentiArt.csv", sep=";")

In [10]:
wortdict_2 = pd.read_csv("LIWC.csv", sep=";")
wortdict_2

Unnamed: 0,(:,Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7,Unnamed: 8,Unnamed: 9,Unnamed: 10,Unnamed: 11,Unnamed: 12
0,(;,,,,,,,,,,,,
1,):,,,,,,,,,,,,
2,/:,,,,,,,,,,,,
3,4ev*,,,,,,,,,,,,
4,:(,,,,,,,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...
18705,übriges,,,,,,,,,,,,
18706,übst,,,,,,,,,,,,
18707,übte,,,,,,,,,,,,
18708,übung*,,,,,,,,,,,,


In [11]:
wortdict_2 = wortdict_2.iloc[:,0]

In [12]:
import re
wordlist_2 = []
for word in wortdict_2:
    word = str(word)
    if "*" in word:
        wordlist_2.append(word[:-1])
    else:
        wordlist_2.append(word)

In [13]:
import re
from happierfuntokenizing import emoticon_string, regex_strings
from unicode_codes import EMOTICON_REGEXES, EMOJI_UNICODE, EMOJI_ALIAS_UNICODE, UNICODE_EMOJI

In [14]:
emoticon_regexes = {k.lower(): re.compile(v) for k, v in EMOTICON_REGEXES.items()}


def removeNumeric(token):
    # remove phone numbers
    token = re.sub(r'((1-\d{3}-\d{3}-\d{4})|(1 \d{3} \d{3} \d{4})|(\d{3} \d{3} \d{4})|(\(\d{3}\) \d{3}-\d{4})|(\d{3}-\d{3}-\d{4}))$', '', token)
    # remove all numeric words
    token = '' if token.isdigit() else token
    # remove words with 2 successive digits
    token = '' if re.search(r'\d{2}', token) else token
    return token

def isEmojiOrEmoticon(token):
    if any([v.match(token) for k,v in emoticon_regexes.items()]) or token in UNICODE_EMOJI:
        return True
    else:
        return False

In [15]:
word_re = re.compile(r"""(%s)""" % "|".join(regex_strings), re.VERBOSE | re.I | re.UNICODE)

In [16]:
emoticon_re = re.compile(regex_strings[1], re.VERBOSE | re.I | re.UNICODE)

In [17]:
class Tokenizer:
    def __init__(self, preserve_case=False, use_unicode=True):
        self.preserve_case = preserve_case
        self.use_unicode = use_unicode

    def tokenize(self, s):
        """
        Argument: s -- any string or unicode object
        Value: a tokenize list of strings; conatenating this list returns the original string if preserve_case=False
        """        
        # Try to ensure unicode:
        if self.use_unicode:
            try:
                s = str(s)
            except UnicodeDecodeError:
                s = str(s).encode('string_escape')
                s = str(s)
        # Fix HTML character entitites:
        #s = self.__html2unicode(s)
        #s = self.__removeHex(s)
        # Tokenize:
        words = word_re.findall(s)
        #print words #debug
        # Possible alter the case, but avoid changing emoticons like :D into :d:
        if not self.preserve_case:            
            words = list(map((lambda x : x if emoticon_re.search(x) else x.lower()), words))
        
        return words

In [18]:
tokenizer = Tokenizer(preserve_case=False)

In [19]:
multSpace = re.compile(r'\s\s+')
startSpace = re.compile(r'^\s+')
endSpace = re.compile(r'\s+$')
multDots = re.compile(r'\.\.\.\.\.+') #more than four periods
newlines = re.compile(r'\s*\n\s*')

def shrinkSpace(s):
    """turns multiple spaces into 1"""
    s = multSpace.sub(' ',s)
    s = multDots.sub('....',s)
    s = endSpace.sub('',s)
    s = startSpace.sub('',s)
    s = newlines.sub(' <NEWLINE> ',s)
    return s

In [20]:
for letter in df_letter1.columns[0]:
    letter = re.split(" ", letter)

In [21]:
df_letter1 = df_letter1.applymap(lambda s:s.lower() if type(s) == str else s)

In [22]:
cleaned_list_1 = []
for letter in df_letter1["letter_M1"]:
    cleaned_words = []
    if isinstance(letter, str):
        cleaned_token = shrinkSpace(letter.strip())
        words = tokenizer.tokenize(cleaned_token)

        for w in words:
            if removeNumeric(w) and (isEmojiOrEmoticon(w)or w.lower() in wordlist_2):
                cleaned_words.append(w)

    cleaned_list_1.append(cleaned_words)        

In [23]:
df_letter1["letter_M1"] = cleaned_list_1

In [24]:
df_letter2 = df_letter2.applymap(lambda s:s.lower() if type(s) == str else s)

In [25]:
for letter in df_letter2.columns[0]:
    letter = re.split(" ", letter)

In [26]:
cleaned_list_2 = []
for letter in df_letter2["letter_M2"]:
    cleaned_words = []
    if isinstance(letter, str):
        cleaned_token = shrinkSpace(letter.strip())
        words = tokenizer.tokenize(cleaned_token)

        for w in words:
            if removeNumeric(w) and (isEmojiOrEmoticon(w)or w.lower() in wordlist_2):
                cleaned_words.append(w)

    cleaned_list_2.append(cleaned_words)  

In [27]:
df_letter2["letter_M2"] = cleaned_list_2

In [28]:
#filename = path + "letter1_cleaned.csv"
#df_letter1.to_csv(filename, encoding="utf-8", index=True)

In [29]:
#filename = path + "letter2_cleaned.csv"
#df_letter2.to_csv(filename, encoding="utf-8", index=True)

In [30]:
df["letter_M1"] = cleaned_list_1

In [31]:
df["letter_M2"] = cleaned_list_2

In [32]:
df.head()

Unnamed: 0,accessCodeId,id,deletion_date,letter_M1,letter_M2,TI_score,TI_bip1,TI_bip2,TI_HYP_vr,TI_MDE,TI_dyst,TI_MDE_vr,TI_MDE_tr,TI_F20.8,TI_F25,TI_F22,TI_F23,TI_F29,TI_MAN_vr,TI_medik,TI_rekrut,PRE_bdi1,PRE_bdi2,PRE_bdi3,PRE_bdi4,PRE_bdi5,PRE_bdi6,PRE_bdi7,PRE_bdi8,PRE_bdi9,PRE_bdi10,PRE_bdi11,PRE_bdi12,PRE_bdi13,PRE_bdi14,PRE_bdi15,PRE_bdi16,PRE_bdi17,PRE_bdi18,PRE_bdi19,PRE_bdi20,PRE_bdi21,POST_bdi1,POST_bdi2,POST_bdi3,POST_bdi4,POST_bdi5,POST_bdi6,POST_bdi7,POST_bdi8,POST_bdi9,POST_bdi10,POST_bdi11,POST_bdi12,POST_bdi13,POST_bdi14,POST_bdi15,POST_bdi16,POST_bdi17,POST_bdi18,POST_bdi19,POST_bdi20,POST_bdi21,PRE_phqD1,PRE_phqD2,PRE_phqD3,PRE_phqD4,PRE_phqD5,PRE_phqD6,PRE_phqD7,PRE_phqD8,PRE_phqD9,POST_phqD1,POST_phqD2,POST_phqD3,POST_phqD4,POST_phqD5,POST_phqD6,POST_phqD7,POST_phqD8,POST_phqD9,M1_phqD1,M1_phqD2,M1_phqD3,M1_phqD4,M1_phqD5,M1_phqD6,M1_phqD7,M1_phqD8,M1_phqD9,M3_phqD1,M3_phqD2,M3_phqD3,M3_phqD4,M3_phqD5,M3_phqD6,M3_phqD7,M3_phqD8,M3_phqD9,PRE_imet1,PRE_imet2,PRE_imet3,PRE_imet4,PRE_imet5,PRE_imet6,PRE_imet7,PRE_imet8,PRE_imet9,PRE_imet10,POST_imet1,POST_imet2,POST_imet3,POST_imet4,POST_imet5,POST_imet6,POST_imet7,POST_imet8,POST_imet9,POST_imet10,PRE_eurohis1,PRE_eurohis2,PRE_eurohis3,PRE_eurohis4,PRE_eurohis5,PRE_eurohis6,PRE_eurohis7,PRE_eurohis8,PRE_phqS1,PRE_phqS2,PRE_phqS3,PRE_phqS4,PRE_phqS5,PRE_phqS6,PRE_phqS7,PRE_phqS8,PRE_phqS9,PRE_phqS10,PRE_gad1,PRE_gad2,PRE_gad3,PRE_gad4,PRE_gad5,PRE_gad6,PRE_gad7,PRE_costa1,PRE_costa2,PRE_costa3,PRE_costa4,PRE_costa5,PRE_costa6,PRE_costa7,PRE_costa8,PRE_costa9,PRE_costa10,PRE_costa11,PRE_costa12,PRE_costa13,PRE_costa14,PRE_costa15,PRE_costa16,PRE_costa17,PRE_costa18,PRE_costa19,PRE_costa20,PRE_costa21,M3_costa1,M3_costa2,M3_costa3,M3_costa4,M3_costa5,M3_costa6,M3_costa7,M3_costa8,M3_costa9,M3_costa10,M3_costa11,M3_costa12,M3_costa13,M3_costa14,M3_costa15,M3_costa16,M3_costa17,M3_costa18,M3_costa19,M3_costa20,M3_costa21,M3_sewip1,M3_sewip2,M3_sewip3,M3_sewip4,M3_sewip5,M3_sewip6,M3_sewip7,M3_sewip8,M3_sewip9,M3_sewip10,M3_sewip11,M3_sewip12,M3_sewip13,M3_sewip14,M3_sewip15,M3_sewip16,M3_sewip17,M3_sewip18,M3_sewip19,M3_sewip20,M3_sewip21,PRE_gpse1,PRE_gpse2,PRE_gpse3,PRE_gpse4,PRE_gpse5,PRE_gpse6,PRE_gpse7,PRE_gpse8,PRE_gpse9,PRE_gpse10,PRE_bsss1,PRE_bsss2,PRE_bsss3,PRE_bsss4,PRE_bsss5,PRE_bsss6,PRE_bsss7,PRE_bsss8,PRE_bsss9,PRE_bsss10,PRE_bsss11,PRE_bsss12,PRE_bsss13,PRE_pathev1,PRE_pathev2,PRE_pathev3,PRE_pathev4,PRE_pathev5,PRE_pathev6,PRE_pathev7,PRE_pathev8,PRE_pathev9,PRE_pathev10,PRE_euheals1,PRE_euheals2,PRE_euheals3,PRE_ipqr1,PRE_ipqr2,PRE_ipqr3,PRE_ipqr4,PRE_ipqr5,PRE_ipqr6,PRE_ipqr7,PRE_ipqr8,PRE_ipqr9,PRE_ipqr10,PRE_ipqr11,PRE_ipqr12,PRE_ipqr13,PRE_ipqr14,PRE_ipqr15,PRE_ipqr16,PRE_ipqr17,PRE_ipqr18,PRE_pvq1,PRE_pvq2,PRE_pvq3,PRE_pvq4,PRE_pvq5,PRE_pvq6,PRE_pvq7,PRE_pvq8,PRE_pvq9,PRE_pvq10,PRE_pvq11,PRE_pvq12,PRE_pvq13,PRE_pvq14,PRE_pvq15,PRE_pvq16,PRE_pvq17,PRE_pvq18,PRE_pvq19,PRE_pvq20,PRE_pvq21,registration,coach,problem,dropout,studyVariant,2_letter,2_letter.size,2_fb.size,2_reminder,2_module,1_letter,1_letter.size,PRE_birth,PRE_sex,PRE_education,PRE_work,PRE_household,PRE_relation,PRE_residence,PRE_internet,PRE_height,PRE_weight,PRE_treatment,PRE_support,PRE_kPT,PRE_ill,PRE_sickleave,PRE_doc,PRE_neurol,PRE_selfhelp,PRE_counsel,PRE_therapy,PRE_med,PRE_hospital,PRE_hos.other
0,7266,2899,2021-05-01,"[liebe, frau, das, erste, mal, dass, ich, mich, an, einer, depressiven, verstimmung, erinnern, kann, war, in, der, ich, hatte, oft, in, der, schule, und, habe, mich, immer, selber, sehr, stark, unter, druck, gesetzt, wenn, die, aufgaben, zu, viel, wurden, habe, ich, mich, manchmal, krank, gemeldet, aus, furcht, dass, ich, wegen, oder, auch, wegen, verständnis, besonders, negativ, bei, den, auffallen, könnte, mein, vater, war, durch, mein, verhalten, besonders, da, er, nicht, verstehen, konnte, weshalb, ich, manchmal, einfach, nicht, zur, schule, ging, er, fand, mein, verhalten, faul, und, konnte, nicht, nachvollziehen, dass, ich, angst, hatte, dadurch, habe, ich, mich, umso, mehr, für, ...]","[liebe, frau, vielen, dank, für, ihre, antwort, ich, mich, leider, wieder, in, einer, phase, in, der, es, mir, an, manchen, tagen, nicht, so, gut, geht, ich, habe, vor, ein, paar, monaten, einen, job, in, verlassen, und, bin, nach, einigen, jahren, endlich, mit, meinem, freund, zusammengezogen, ich, lebe, nun, in, einer, schönen, wohnung, auf, dem, land, und, bin, in, meiner, beziehung, und, in, meinem, eigentlich, sehr, glücklich, allerdings, habe, ich, im, november, auch, einen, neuen, job, angefangen, der, mich, stark, ich, merke, an, vielen, tagen, dass, die, aufgaben, mir, über, den, kopf, wachsen, ich, mich, dadurch, nicht, richtig, kann, so, dass, ...]",9,0,0,0,0,0,1,0,0,0,0,0,0,0,0,3,1,0,1,1,1,0,1,1,0,0,0,1,0,1,1,1,2,1,1,1,1,0,0,1,1,1,0,0,1,0,1,1,0,1,1,0,1,1,1,1,1,2,1,1,1,2,1,1,1,0,0,1,1,2,1,1,1,0,0,0,1,2,1,1,2,2,2,0,0,1.0,1.0,1.0,1.0,1.0,1.0,0.0,0.0,0.0,1,3.0,1.0,7.0,3.0,5.0,3.0,6.0,7.0,7.0,2,3,3,6,4,2,4,8,6,6,3,3,4,3,4,5,3,4,1,0,1,0,0,2,1,0.0,0.0,0.0,2,2,1,1,0,1,1,2,1,3,2,2,3,2,4,3,1,3,4.0,1,4,4,4,2,2,1,1,2.0,3.0,3.0,2.0,2.0,2.0,3.0,2.0,2.0,3.0,1.0,3.0,5.0,1.0,5.0,4.0,3.0,1.0,2.0,2.0,1.0,1.0,5.0,5.0,4.0,4.0,5.0,3.0,4.0,5.0,4.0,4.0,4.0,5.0,4.0,4.0,4.0,4.0,4.0,4.0,5.0,4.0,4.0,3.0,3.0,2.0,2.0,3.0,2.0,3.0,3.0,3.0,2.0,4.0,3,3,3,3,3,2,3,3.0,1,1,2,2,2,4.0,2,4.0,1,5.0,1.0,4.0,2,1.0,9.0,5,9.0,2,2,1.0,4,2,4,1,4,1,4,2.0,3,5,2.0,4,4,4,4,3,4,2,3,2,3,4,4,4,2,2,3,3,3,3,3,2.0,3,1,5,3,03.01.2020,helenn,0,,KUF,2.0,5385.0,2242.0,0.0,2.0,1.0,2246.0,1988,1,5,2,1,0,4,120,174,64,1,0,0,1,1,1,0,0,0,0,0,0,0
1,7756,1645,2021-10-01,"[sehr, herr, nun, nachdem, ich, mir, viel, zeit, gelassen, habe, mein, brief, im, juli, august, sich, viele, die, in, mir, arbeiteten, die, mir, eine, mir, bis, dahin, nicht, bekannte, unruhe, und, am, letzten, tag, meines, trennte, sich, meine, freundin, von, mir, wir, waren, knapp, zwei, jahre, zusammen, und, ich, hatte, zuvor, noch, nie, mit, einem, menschen, intellektuell, und, so, viel, geteilt, unsere, beziehung, sich, beim, abitur, auf, ich, hatte, mich, nach, einer, nicht, sehr, schönen, ausbildung, in, einem, entschlossen, mein, abitur, an, einer, diese, zeit, war, einer, der, meines, lebens, der, fiel, mir, einfach, zu, die, lehrer, waren, motiviert, und, ...]","[sehr, herr, ich, möchte, nun, endlich, über, die, schreiben, die, mich, im, moment, bewegen, und, einflüsse, die, mich, ich, verstehe, mich, mit, meiner, nicht, mehr, es, ist, mehr, ein, als, ein, wir, reden, nur, noch, über, das, nötigste, miteinander, ein, gespräch, endet, häufig, im, streit, ich, habe, kein, bedürfnis, nach, nähe, zu, ihr, ich, habe, das, gefühl, nichts, mehr, über, sie, zu, wissen, es, ist, keine, herzlichkeit, im, umgang, mehr, da, und, ich, finde, dass, ich, freundlichkeit, immer, nur, als, zugeteilt, bekomme, wenn, ich, etwas, gemacht, habe, dass, die, belohnung, in, ihren, augen, rechtfertigt, sind, wir, mama, und, papa, und, ...]",16,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,1,2,1,1,0,0,1,1,0,1,1,1,3,2,2,1,1,2,2,2,1,0,0,0,1,0,0,0,0,0,0,1,0,0,0,0,1,1,0,1,1,0,2,1,2,2,2,1,2,1,0,2,1,2,2,1,0,1,0,0,1,1,2,2,2,0,1,1,0,2.0,1.0,2.0,2.0,1.0,1.0,1.0,1.0,0.0,2,5.0,2.0,6.0,5.0,5.0,7.0,8.0,6.0,5.0,0,0,0,0,3,3,5,8,0,4,4,4,3,3,2,4,3,5,1,2,1,2,2,1,1,2.0,2.0,0.0,2,1,1,3,1,3,0,2,0,2,0,3,2,3,2,1,3,2,2.0,4,4,2,2,2,3,1,3,1.0,2.0,2.0,3.0,3.0,2.0,2.0,2.0,2.0,2.0,3.0,2.0,4.0,3.0,4.0,2.0,3.0,1.0,2.0,1.0,2.0,1.0,5.0,4.0,4.0,3.0,4.0,4.0,3.0,4.0,2.0,2.0,4.0,4.0,3.0,2.0,5.0,5.0,4.0,4.0,3.0,2.0,2.0,2.0,2.0,2.0,2.0,2.0,2.0,4.0,3.0,2.0,3.0,4.0,4,3,2,4,2,3,3,4.0,2,3,3,4,1,1.0,1,5.0,1,5.0,1.0,5.0,1,1.0,9.0,5,9.0,4,4,2.0,3,2,4,1,5,1,4,4.0,4,4,3.0,4,4,2,2,2,3,1,2,2,4,1,1,4,2,3,2,4,5,6,5,5.0,2,2,3,3,24.07.2018,mweiler,0,771.0,PAF,15.0,17216.0,1444.0,1.0,9.0,8.0,6335.0,1973,0,4,2,2,0,2,600,186,105,0,0,1,0,0,0,0,0,0,0,0,0,0
2,9005,2712,2021-04-01,"[liebe, frau, so, wie, ich, es, sehe, gibt, es, nicht, die, sondern, ich, bin, so, langsam, über, die, zeit, in, die, depression, soweit, ich, kann, fühlte, ich, mich, eher, etwas, unsicher, und, schüchtern, es, war, mir, immer, wichtig, anerkannt, zu, werden, und, nach, außen, gut, ich, will, es, einfach, recht, machen, erklären, kann, ich, mir, das, durch, die, situation, meines, meine, eltern, waren, bei, meiner, geburt, schon, mutter, bzw, vater, jahre, alt, meine, eltern, waren, einfache, ohne, ausbildung, und, haben, sich, oft, bzw, sehr, oft, und, auch, laut, und, heftig, gestritten, habe, ich, bis, zu, meiner, zu, hause, bei, meinen, ...]","[liebe, frau, meine, situation, ist, wegen, den, wieder, mal, gerade, sehr, dabei, treten, andere, themen, wie, mit, der, arbeit, in, den, hintergrund, bzw, bringen, natürlich, trotzdem, eine, mit, sich, bei, dem, die, die, sind, in, der, zeit, nach, dem, ersten, brief, gab, es, eine, bzw, zwei, situationen, oder, themen, die, mich, fast, zur, gebracht, haben, es, sind, immer, wieder, die, selben, die, aus, meiner, sicht, von, meiner, frau, nicht, genügend, und, gemacht, werden, dass, diese, zwischen, uns, schon, zu, geführt, haben, und, auch, als, persönlich, ziele, im, rahmen, unserer, besprochen, und, vereinbart, worden, sind, macht, mich, hilflos, und, wütend, meine, ...]",13,0,0,0,0,0,1,0,0,0,0,0,0,0,0,5,1,1,0,1,0,0,0,1,0,0,1,2,2,0,1,3,2,1,1,1,0,1,0,0,1,0,0,0,0,0,0,0,1,1,0,1,0,1,1,1,1,0,2,2,2,2,3,0,1,1,0,1,1,0,1,2,0,0,0,0,2,1,2,2,3,0,1,0,0,1.0,1.0,1.0,1.0,2.0,0.0,0.0,0.0,0.0,0,5.0,3.0,4.0,5.0,6.0,6.0,4.0,4.0,7.0,0,2,2,2,2,3,3,2,2,5,3,3,2,3,2,4,2,4,1,1,1,2,1,1,1,0.0,1.0,0.0,1,1,1,2,1,2,0,1,4,3,2,4,0,3,1,2,0,1,4.0,0,4,3,4,3,0,3,3,1.0,1.0,2.0,0.0,0.0,1.0,1.0,1.0,1.0,0.0,0.0,1.0,3.0,1.0,3.0,1.0,3.0,2.0,1.0,1.0,1.0,1.0,5.0,5.0,4.0,3.0,5.0,5.0,3.0,5.0,5.0,5.0,4.0,5.0,5.0,3.0,5.0,5.0,5.0,4.0,5.0,5.0,3.0,3.0,2.0,2.0,2.0,2.0,2.0,2.0,2.0,2.0,3.0,3.0,3,3,3,3,3,3,3,2.0,1,2,2,2,1,3.0,1,4.0,2,4.0,1.0,3.0,1,1.0,9.0,5,5.0,5,3,3.0,4,2,4,1,4,2,2,1.0,1,4,2.0,3,2,2,2,4,5,1,1,2,5,3,4,2,3,3,2,2,3,6,2,2.0,2,2,3,5,24.10.2019,remmers,0,,KUF,15.0,5608.0,1976.0,0.0,9.0,7.0,9692.0,1961,0,2,2,2,1,4,45,187,110,1,1,1,1,0,1,0,0,0,1,1,0,0
3,9145,3208,2021-11-01,"[guten, tag, frau, ich, freue, mich, sehr, endlich, mein, leiden, zu, können, und, das, allein, macht, mir, schon, etwas, hoffnung, grundsätzlich, bin, ich, jemand, der, sehr, viel, über, seine, gefühle, redet, reden, kann, dies, ist, aber, meist, sehr, und, dies, wird, sich, wahrscheinlich, auch, in, diesem, brief, zeigen, da, ich, davon, ausgehe, dass, dies, alles, der, werde, ich, auch, namen, nennen, da, dies, für, mich, die, einfacher, macht, geschichte, und, meine, gefühle, im, september, trennte, sich, meine, ex-freundin, nach, einer, beziehung, von, mir, da, ich, über, die, gesamte, zeit, der, beziehung, nie, eifersüchtig, war, oder, hatte, kam, dies, für, mich, ...]","[guten, abend, frau, ich, freue, mich, dass, ihre, zum, letzten, brief, so, schnell, kam, und, sie, verständnis, für, meine, lage, mitbringen, die, drei, tage, hatte, ich, viel, zu, tun, und, mir, ging, es, gut, daher, muss, ich, mich, gerade, etwas, dazu, zwingen, diesen, brief, zu, schreiben, da, er, mich, kraft, und, energie, kostet, noch, ein, zu, meinen, insgesamt, ich, hörte, vor, einigen, wochen, den, begriff, bipolar, im, zusammenhang, mit, zum, ersten, mal, und, konnte, mich, direkt, damit, in, meinem, leben, gab, es, häufig, sehr, hohe, und, tiefe, dies, fällt, mir, und, meinem, umfeld, besonders, stark, auf, da, mein, bruder, das, ...]",11,0,0,0,0,0,0,0,0,0,0,0,0,0,0,5,1,1,1,0,1,1,1,1,0,1,0,0,1,0,1,1,1,1,1,1,0,1,1,1,1,2,1,1,1,0,1,1,1,0,1,0,1,1,0,0,0,0,1,1,1,1,0,1,1,0,0,1,1,1,0,1,2,0,0,0,1,2,1,2,0,2,1,0,0,0.0,1.0,2.0,1.0,0.0,1.0,2.0,0.0,0.0,1,1.0,0.0,2.0,0.0,0.0,1.0,0.0,2.0,0.0,0,0,0,1,5,4,8,2,2,1,3,4,3,2,3,4,3,4,0,0,0,0,0,1,0,1.0,0.0,0.0,0,1,1,0,0,1,0,1,0,1,0,2,3,1,3,3,0,1,3.0,1,3,3,2,1,1,2,3,2.0,0.0,2.0,3.0,0.0,4.0,0.0,3.0,3.0,2.0,0.0,2.0,3.0,0.0,1.0,4.0,2.0,2.0,2.0,3.0,4.0,1.0,4.0,4.0,2.0,1.0,2.0,4.0,2.0,4.0,3.0,2.0,2.0,3.0,3.0,3.0,5.0,4.0,2.0,2.0,3.0,4.0,3.0,2.0,3.0,2.0,3.0,3.0,2.0,3.0,3.0,3.0,3.0,4.0,3,3,3,4,3,3,3,3.0,3,3,2,3,2,2.0,3,4.0,2,4.0,2.0,4.0,1,2.0,9.0,9,9.0,3,3,2.0,3,3,2,1,5,1,2,2.0,1,4,1.0,4,3,3,2,2,5,3,2,3,2,3,4,5,2,4,4,3,3,2,3,3.0,2,2,4,2,02.04.2020,remmers,0,164.0,PAF,7.0,10728.0,1824.0,1.0,4.0,1.0,8167.0,1995,0,3,3,4,0,4,360,193,79,0,0,0,0,0,0,0,0,0,0,0,0,0
4,9446,3033,2021-08-01,"[hallo, die, frage, wie, alles, anfing, oder, auch, wann, alles, anfing, finde, ich, schwer, zu, weil, es, sich, eher, um, ein, prozess, handelte, auch, würde, ich, das, gefühl, nicht, als, bezeichnen, auch, wenn, vielleicht, dieses, gefühl, hinter, den, lag, daher, fange, ich, einfach, an, mit, der, :), als, mein, sohn, damals, äußerte, konnte, ich, die, schwer, wandte, mich, aber, aufgrund, des, der, im, mai, an, eine, seitdem, waren, wir, mein, sohn, aber, ich, bin, bei, den, fast, immer, dabei, dort, in, behandlung, mit, der, einer, depression, wie, groß, die, wirklich, war, war, unklar, wirklich, geredet, hat, mein, sohn, nämlich, nicht, ...]","[hallo, seit, meinem, letzten, brief, ist, zeit, vergangen, warum, ich, glaube, ich, war, mir, bewusst, dass, ich, den, nächsten, brief, auch, nicht, so, nebenbei, mal, schreiben, würde, und, daher, habe, ich, nach, einer, gelegenheit, gesucht, wo, ich, mir, auch, wirklich, zeit, dafür, nehmen, kann, für, das, schreiben, sowie, auch, für, danach, und, wahrscheinlich, habe, ich, es, auch, ein, wenig, vor, mir, ehrlich, gesagt, auch, wenn, ich, eigentlich, mich, unbedingt, damit, möchte, ist, es, noch, einfacher, zu, ignorieren, :-), fakt, ist, ich, brauche, wirklich, genug, zeit, um, zu, schreiben, und, energie, da, ich, jetzt, drei, wochen, gearbeitet, habe, hatte, ich, diese, ...]",14,0,0,0,0,0,0,0,0,0,0,0,0,0,0,3,1,1,0,1,1,3,1,1,0,1,1,1,2,0,1,1,2,1,1,1,2,0,0,1,1,1,0,1,1,0,0,1,1,1,0,1,1,1,0,1,1,1,1,1,2,1,1,2,0,1,0,2,1,1,2,0,1,1,1,0,1,1,1,1,0,1,2,1,0,1.0,2.0,1.0,1.0,0.0,2.0,1.0,0.0,0.0,1,2.0,2.0,7.0,2.0,2.0,2.0,7.0,7.0,7.0,0,2,2,2,3,3,5,5,7,7,3,3,2,2,2,5,4,5,2,1,1,2,2,2,0,1.0,0.0,0.0,1,2,2,1,0,1,0,3,2,3,2,2,3,2,2,1,1,3,2.0,1,1,1,1,1,1,2,1,2.0,2.0,1.0,3.0,2.0,2.0,2.0,2.0,3.0,2.0,3.0,3.0,3.0,3.0,2.0,2.0,2.0,2.0,2.0,2.0,2.0,3.0,4.0,4.0,3.0,3.0,4.0,3.0,3.0,4.0,4.0,4.0,4.0,3.0,4.0,3.0,5.0,4.0,4.0,3.0,3.0,4.0,3.0,2.0,2.0,1.0,2.0,2.0,2.0,2.0,2.0,3.0,2.0,4.0,4,4,3,3,3,4,2,3.0,3,2,3,2,2,1.0,4,2.0,3,4.0,4.0,4.0,4,2.0,5.0,5,5.0,2,3,1.0,4,2,4,2,4,2,2,2.0,2,1,4.0,3,4,4,4,2,5,2,3,3,2,5,2,2,3,2,2,3,4,4,3,3.0,2,2,4,3,12.02.2020,carmen,0,147.0,KUF,53.0,10306.0,2643.0,8.0,11.0,9.0,28843.0,1969,1,4,2,2,1,1,180,174,79,0,0,1,1,1,1,0,0,1,0,0,0,0


In [33]:
column_zwei = ['registration','studyVariant','coach','PRE_bdi1','PRE_bdi2',
               'PRE_bdi3','PRE_bdi4','PRE_bdi5','PRE_bdi6','PRE_bdi7','PRE_bdi8','PRE_bdi9','PRE_bdi10',
               'PRE_bdi11','PRE_bdi12','PRE_bdi13','PRE_bdi14','PRE_bdi15','PRE_bdi16','PRE_bdi17','PRE_bdi18',
               'PRE_bdi19','PRE_bdi20','PRE_bdi21','POST_phqD1','POST_phqD2','POST_phqD3','POST_phqD4','POST_phqD5',
               'POST_phqD6','POST_phqD7','POST_phqD8','POST_phqD9',
               'PRE_phqS1','PRE_phqS2','PRE_phqS3','PRE_phqS4','PRE_phqS5','PRE_phqS6','PRE_phqS7',
               'PRE_phqS8','PRE_phqS9','PRE_phqS10','PRE_phqD1','PRE_phqD2','PRE_phqD3','PRE_phqD4','PRE_phqD5',
               'PRE_phqD6','PRE_phqD7','PRE_phqD8','PRE_phqD9', 'PRE_birth','PRE_sex','PRE_education',
               'PRE_work','PRE_household','PRE_relation','PRE_residence','PRE_internet','PRE_height','PRE_weight',
               'PRE_treatment','PRE_support','PRE_kPT','PRE_ill','PRE_sickleave','PRE_doc',
               'PRE_neurol','PRE_selfhelp','PRE_counsel','PRE_therapy','PRE_med','PRE_hospital',
            'PRE_eurohis1','PRE_eurohis2','PRE_eurohis3','PRE_eurohis4','PRE_eurohis5',
               'PRE_eurohis6','PRE_eurohis7','PRE_eurohis8', 'TI_score','TI_bip1',
               'TI_bip2','TI_MDE','TI_dyst','TI_F25','TI_F22','TI_F23',
               'TI_F29','TI_MDE_vr','TI_MDE_tr','TI_HYP_vr','TI_MAN_vr','TI_medik','TI_rekrut','PRE_gad1',
               'PRE_gad2','PRE_gad3','PRE_gad4','PRE_gad5','PRE_gad6','PRE_gad7', 'PRE_costa1', 'PRE_costa2', 'PRE_costa3',
              'PRE_costa4', 'PRE_costa5', 'PRE_costa6', 'PRE_costa7', 'PRE_costa8', 'PRE_costa9', 'PRE_costa10', 'PRE_costa11',
              'PRE_costa12', 'PRE_costa13', 'PRE_costa14', 'PRE_costa15', 'PRE_costa16', 'PRE_costa17', 'PRE_costa18',
              'PRE_costa19', 'PRE_costa20', 'PRE_costa21', 'PRE_pathev1', 'PRE_pathev2', 'PRE_pathev3', 'PRE_pathev4',
              'PRE_pathev5', 'PRE_pathev6', 'PRE_pathev7', 'PRE_pathev8', 'PRE_pathev9', 'PRE_pathev10', 
              'PRE_euheals1','PRE_euheals2','PRE_euheals3','PRE_ipqr1','PRE_ipqr2','PRE_ipqr3','PRE_ipqr4','PRE_ipqr5',
               'PRE_ipqr6','PRE_ipqr7','PRE_ipqr8','PRE_ipqr9','PRE_ipqr10','PRE_ipqr11','PRE_ipqr12','PRE_ipqr13',
               'PRE_ipqr14','PRE_ipqr15','PRE_ipqr16','PRE_ipqr17','PRE_ipqr18', 'PRE_bsss1','PRE_bsss2','PRE_bsss3',
               'PRE_bsss4','PRE_bsss5','PRE_bsss6','PRE_bsss7','PRE_bsss8','PRE_bsss9','PRE_bsss10','PRE_bsss11',
               'PRE_bsss12','PRE_bsss13','PRE_gpse1','PRE_gpse2','PRE_gpse3','PRE_gpse4','PRE_gpse5','PRE_gpse6',
               'PRE_gpse7','PRE_gpse8','PRE_gpse9','PRE_gpse10','PRE_pvq1','PRE_pvq2','PRE_pvq3','PRE_pvq4','PRE_pvq5',
               'PRE_pvq6','PRE_pvq7','PRE_pvq8','PRE_pvq9','PRE_pvq10','PRE_pvq11','PRE_pvq12','PRE_pvq13','PRE_pvq14',
               'PRE_pvq15','PRE_pvq16','PRE_pvq17','PRE_pvq18','PRE_pvq19','PRE_pvq20','PRE_pvq21', 'PRE_imet1','PRE_imet2','PRE_imet3','PRE_imet4','PRE_imet5','PRE_imet6','PRE_imet7',
                'PRE_imet8','PRE_imet9','PRE_imet10', 'M1_phqD1','M1_phqD2','M1_phqD3','M1_phqD4','M1_phqD5','M1_phqD6',
               'M1_phqD7','M1_phqD8','M1_phqD9', 'letter_M1', 'letter_M2']

In [34]:
df_short = df[column_zwei]

In [35]:
df_short.head()

Unnamed: 0,registration,studyVariant,coach,PRE_bdi1,PRE_bdi2,PRE_bdi3,PRE_bdi4,PRE_bdi5,PRE_bdi6,PRE_bdi7,PRE_bdi8,PRE_bdi9,PRE_bdi10,PRE_bdi11,PRE_bdi12,PRE_bdi13,PRE_bdi14,PRE_bdi15,PRE_bdi16,PRE_bdi17,PRE_bdi18,PRE_bdi19,PRE_bdi20,PRE_bdi21,POST_phqD1,POST_phqD2,POST_phqD3,POST_phqD4,POST_phqD5,POST_phqD6,POST_phqD7,POST_phqD8,POST_phqD9,PRE_phqS1,PRE_phqS2,PRE_phqS3,PRE_phqS4,PRE_phqS5,PRE_phqS6,PRE_phqS7,PRE_phqS8,PRE_phqS9,PRE_phqS10,PRE_phqD1,PRE_phqD2,PRE_phqD3,PRE_phqD4,PRE_phqD5,PRE_phqD6,PRE_phqD7,PRE_phqD8,PRE_phqD9,PRE_birth,PRE_sex,PRE_education,PRE_work,PRE_household,PRE_relation,PRE_residence,PRE_internet,PRE_height,PRE_weight,PRE_treatment,PRE_support,PRE_kPT,PRE_ill,PRE_sickleave,PRE_doc,PRE_neurol,PRE_selfhelp,PRE_counsel,PRE_therapy,PRE_med,PRE_hospital,PRE_eurohis1,PRE_eurohis2,PRE_eurohis3,PRE_eurohis4,PRE_eurohis5,PRE_eurohis6,PRE_eurohis7,PRE_eurohis8,TI_score,TI_bip1,TI_bip2,TI_MDE,TI_dyst,TI_F25,TI_F22,TI_F23,TI_F29,TI_MDE_vr,TI_MDE_tr,TI_HYP_vr,TI_MAN_vr,TI_medik,TI_rekrut,PRE_gad1,PRE_gad2,PRE_gad3,PRE_gad4,PRE_gad5,PRE_gad6,PRE_gad7,PRE_costa1,PRE_costa2,PRE_costa3,PRE_costa4,PRE_costa5,PRE_costa6,PRE_costa7,PRE_costa8,PRE_costa9,PRE_costa10,PRE_costa11,PRE_costa12,PRE_costa13,PRE_costa14,PRE_costa15,PRE_costa16,PRE_costa17,PRE_costa18,PRE_costa19,PRE_costa20,PRE_costa21,PRE_pathev1,PRE_pathev2,PRE_pathev3,PRE_pathev4,PRE_pathev5,PRE_pathev6,PRE_pathev7,PRE_pathev8,PRE_pathev9,PRE_pathev10,PRE_euheals1,PRE_euheals2,PRE_euheals3,PRE_ipqr1,PRE_ipqr2,PRE_ipqr3,PRE_ipqr4,PRE_ipqr5,PRE_ipqr6,PRE_ipqr7,PRE_ipqr8,PRE_ipqr9,PRE_ipqr10,PRE_ipqr11,PRE_ipqr12,PRE_ipqr13,PRE_ipqr14,PRE_ipqr15,PRE_ipqr16,PRE_ipqr17,PRE_ipqr18,PRE_bsss1,PRE_bsss2,PRE_bsss3,PRE_bsss4,PRE_bsss5,PRE_bsss6,PRE_bsss7,PRE_bsss8,PRE_bsss9,PRE_bsss10,PRE_bsss11,PRE_bsss12,PRE_bsss13,PRE_gpse1,PRE_gpse2,PRE_gpse3,PRE_gpse4,PRE_gpse5,PRE_gpse6,PRE_gpse7,PRE_gpse8,PRE_gpse9,PRE_gpse10,PRE_pvq1,PRE_pvq2,PRE_pvq3,PRE_pvq4,PRE_pvq5,PRE_pvq6,PRE_pvq7,PRE_pvq8,PRE_pvq9,PRE_pvq10,PRE_pvq11,PRE_pvq12,PRE_pvq13,PRE_pvq14,PRE_pvq15,PRE_pvq16,PRE_pvq17,PRE_pvq18,PRE_pvq19,PRE_pvq20,PRE_pvq21,PRE_imet1,PRE_imet2,PRE_imet3,PRE_imet4,PRE_imet5,PRE_imet6,PRE_imet7,PRE_imet8,PRE_imet9,PRE_imet10,M1_phqD1,M1_phqD2,M1_phqD3,M1_phqD4,M1_phqD5,M1_phqD6,M1_phqD7,M1_phqD8,M1_phqD9,letter_M1,letter_M2
0,03.01.2020,KUF,helenn,1,0,1,1,1,0,1,1,0,0,0,1,0,1,1,1,2,1,1,1,1,1,1,2,1,1,1,0,0,0,1,0,1,0,0,2,1,0.0,0.0,0.0,1,1,1,2,1,1,1,0,0,1988,1,5,2,1,0,4,120,174,64,1,0,0,1,1,1,0,0,0,0,0,0,3,3,4,3,4,5,3,4,9,0,0,0,0,0,0,0,0,1,0,0,0,0,3,2,2,1,1,0,1,1,2,1,3,2,2,3,2,4,3,1,3,4.0,1,4,4,4,2,2,1,1,2.0,2,4.0,2,4.0,1,5.0,1.0,4.0,2,1.0,9.0,5,9.0,2,2,1.0,4,2,4,1,4,1,4,2.0,3,5,2.0,4,4,4,4,4.0,3,3,3,3,3,2,3,3.0,1,1,2,2,3.0,3.0,2.0,2.0,3.0,2.0,3.0,3.0,3.0,2.0,3,4,2,3,2,3,4,4,4,2,2,3,3,3,3,3,2.0,3,1,5,3,1,3.0,1.0,7.0,3.0,5.0,3.0,6.0,7.0,7.0,1,2,1,1,2,2,2,0,0,"[liebe, frau, das, erste, mal, dass, ich, mich, an, einer, depressiven, verstimmung, erinnern, kann, war, in, der, ich, hatte, oft, in, der, schule, und, habe, mich, immer, selber, sehr, stark, unter, druck, gesetzt, wenn, die, aufgaben, zu, viel, wurden, habe, ich, mich, manchmal, krank, gemeldet, aus, furcht, dass, ich, wegen, oder, auch, wegen, verständnis, besonders, negativ, bei, den, auffallen, könnte, mein, vater, war, durch, mein, verhalten, besonders, da, er, nicht, verstehen, konnte, weshalb, ich, manchmal, einfach, nicht, zur, schule, ging, er, fand, mein, verhalten, faul, und, konnte, nicht, nachvollziehen, dass, ich, angst, hatte, dadurch, habe, ich, mich, umso, mehr, für, ...]","[liebe, frau, vielen, dank, für, ihre, antwort, ich, mich, leider, wieder, in, einer, phase, in, der, es, mir, an, manchen, tagen, nicht, so, gut, geht, ich, habe, vor, ein, paar, monaten, einen, job, in, verlassen, und, bin, nach, einigen, jahren, endlich, mit, meinem, freund, zusammengezogen, ich, lebe, nun, in, einer, schönen, wohnung, auf, dem, land, und, bin, in, meiner, beziehung, und, in, meinem, eigentlich, sehr, glücklich, allerdings, habe, ich, im, november, auch, einen, neuen, job, angefangen, der, mich, stark, ich, merke, an, vielen, tagen, dass, die, aufgaben, mir, über, den, kopf, wachsen, ich, mich, dadurch, nicht, richtig, kann, so, dass, ...]"
1,24.07.2018,PAF,mweiler,1,2,1,1,0,0,1,1,0,1,1,1,3,2,2,1,1,2,2,2,1,2,1,2,2,1,0,1,0,0,1,2,1,2,2,1,1,2.0,2.0,0.0,2,1,2,2,2,1,2,1,0,1973,0,4,2,2,0,2,600,186,105,0,0,1,0,0,0,0,0,0,0,0,0,4,4,3,3,2,4,3,5,16,0,0,0,0,0,0,0,0,0,0,0,0,0,1,2,1,1,3,1,3,0,2,0,2,0,3,2,3,2,1,3,2,2.0,4,4,2,2,2,3,1,3,1.0,1,1.0,1,5.0,1,5.0,1.0,5.0,1,1.0,9.0,5,9.0,4,4,2.0,3,2,4,1,5,1,4,4.0,4,4,3.0,4,4,2,2,4.0,4,3,2,4,2,3,3,4.0,2,3,3,4,2.0,2.0,2.0,2.0,2.0,2.0,4.0,3.0,2.0,3.0,2,3,1,2,2,4,1,1,4,2,3,2,4,5,6,5,5.0,2,2,3,3,2,5.0,2.0,6.0,5.0,5.0,7.0,8.0,6.0,5.0,1,1,2,2,2,0,1,1,0,"[sehr, herr, nun, nachdem, ich, mir, viel, zeit, gelassen, habe, mein, brief, im, juli, august, sich, viele, die, in, mir, arbeiteten, die, mir, eine, mir, bis, dahin, nicht, bekannte, unruhe, und, am, letzten, tag, meines, trennte, sich, meine, freundin, von, mir, wir, waren, knapp, zwei, jahre, zusammen, und, ich, hatte, zuvor, noch, nie, mit, einem, menschen, intellektuell, und, so, viel, geteilt, unsere, beziehung, sich, beim, abitur, auf, ich, hatte, mich, nach, einer, nicht, sehr, schönen, ausbildung, in, einem, entschlossen, mein, abitur, an, einer, diese, zeit, war, einer, der, meines, lebens, der, fiel, mir, einfach, zu, die, lehrer, waren, motiviert, und, ...]","[sehr, herr, ich, möchte, nun, endlich, über, die, schreiben, die, mich, im, moment, bewegen, und, einflüsse, die, mich, ich, verstehe, mich, mit, meiner, nicht, mehr, es, ist, mehr, ein, als, ein, wir, reden, nur, noch, über, das, nötigste, miteinander, ein, gespräch, endet, häufig, im, streit, ich, habe, kein, bedürfnis, nach, nähe, zu, ihr, ich, habe, das, gefühl, nichts, mehr, über, sie, zu, wissen, es, ist, keine, herzlichkeit, im, umgang, mehr, da, und, ich, finde, dass, ich, freundlichkeit, immer, nur, als, zugeteilt, bekomme, wenn, ich, etwas, gemacht, habe, dass, die, belohnung, in, ihren, augen, rechtfertigt, sind, wir, mama, und, papa, und, ...]"
2,24.10.2019,KUF,remmers,1,1,0,1,0,0,0,1,0,0,1,2,2,0,1,3,2,1,1,1,0,1,1,0,1,2,0,0,0,0,1,1,1,2,1,1,1,0.0,1.0,0.0,2,2,2,2,3,0,1,1,0,1961,0,2,2,2,1,4,45,187,110,1,1,1,1,0,1,0,0,0,1,1,0,3,3,2,3,2,4,2,4,13,0,0,0,0,0,0,0,0,1,0,0,0,0,5,1,1,1,2,1,2,0,1,4,3,2,4,0,3,1,2,0,1,4.0,0,4,3,4,3,0,3,3,1.0,1,3.0,1,4.0,2,4.0,1.0,3.0,1,1.0,9.0,5,5.0,5,3,3.0,4,2,4,1,4,2,2,1.0,1,4,2.0,3,2,2,2,3.0,3,3,3,3,3,3,3,2.0,1,2,2,2,3.0,2.0,2.0,2.0,2.0,2.0,2.0,2.0,2.0,3.0,4,5,1,1,2,5,3,4,2,3,3,2,2,3,6,2,2.0,2,2,3,5,0,5.0,3.0,4.0,5.0,6.0,6.0,4.0,4.0,7.0,2,1,2,2,3,0,1,0,0,"[liebe, frau, so, wie, ich, es, sehe, gibt, es, nicht, die, sondern, ich, bin, so, langsam, über, die, zeit, in, die, depression, soweit, ich, kann, fühlte, ich, mich, eher, etwas, unsicher, und, schüchtern, es, war, mir, immer, wichtig, anerkannt, zu, werden, und, nach, außen, gut, ich, will, es, einfach, recht, machen, erklären, kann, ich, mir, das, durch, die, situation, meines, meine, eltern, waren, bei, meiner, geburt, schon, mutter, bzw, vater, jahre, alt, meine, eltern, waren, einfache, ohne, ausbildung, und, haben, sich, oft, bzw, sehr, oft, und, auch, laut, und, heftig, gestritten, habe, ich, bis, zu, meiner, zu, hause, bei, meinen, ...]","[liebe, frau, meine, situation, ist, wegen, den, wieder, mal, gerade, sehr, dabei, treten, andere, themen, wie, mit, der, arbeit, in, den, hintergrund, bzw, bringen, natürlich, trotzdem, eine, mit, sich, bei, dem, die, die, sind, in, der, zeit, nach, dem, ersten, brief, gab, es, eine, bzw, zwei, situationen, oder, themen, die, mich, fast, zur, gebracht, haben, es, sind, immer, wieder, die, selben, die, aus, meiner, sicht, von, meiner, frau, nicht, genügend, und, gemacht, werden, dass, diese, zwischen, uns, schon, zu, geführt, haben, und, auch, als, persönlich, ziele, im, rahmen, unserer, besprochen, und, vereinbart, worden, sind, macht, mich, hilflos, und, wütend, meine, ...]"
3,02.04.2020,PAF,remmers,1,1,1,0,1,1,1,1,0,1,0,0,1,0,1,1,1,1,1,1,0,1,1,1,0,1,2,0,0,0,0,0,0,0,0,1,0,1.0,0.0,0.0,1,1,1,1,0,1,1,0,0,1995,0,3,3,4,0,4,360,193,79,0,0,0,0,0,0,0,0,0,0,0,0,3,4,3,2,3,4,3,4,11,0,0,0,0,0,0,0,0,0,0,0,0,0,5,0,1,1,0,0,1,0,1,0,1,0,2,3,1,3,3,0,1,3.0,1,3,3,2,1,1,2,3,2.0,2,2.0,3,4.0,2,4.0,2.0,4.0,1,2.0,9.0,9,9.0,3,3,2.0,3,3,2,1,5,1,2,2.0,1,4,1.0,4,3,3,2,4.0,3,3,3,4,3,3,3,3.0,3,3,2,3,2.0,3.0,2.0,3.0,3.0,2.0,3.0,3.0,3.0,3.0,2,5,3,2,3,2,3,4,5,2,4,4,3,3,2,3,3.0,2,2,4,2,1,1.0,0.0,2.0,0.0,0.0,1.0,0.0,2.0,0.0,1,2,1,2,0,2,1,0,0,"[guten, tag, frau, ich, freue, mich, sehr, endlich, mein, leiden, zu, können, und, das, allein, macht, mir, schon, etwas, hoffnung, grundsätzlich, bin, ich, jemand, der, sehr, viel, über, seine, gefühle, redet, reden, kann, dies, ist, aber, meist, sehr, und, dies, wird, sich, wahrscheinlich, auch, in, diesem, brief, zeigen, da, ich, davon, ausgehe, dass, dies, alles, der, werde, ich, auch, namen, nennen, da, dies, für, mich, die, einfacher, macht, geschichte, und, meine, gefühle, im, september, trennte, sich, meine, ex-freundin, nach, einer, beziehung, von, mir, da, ich, über, die, gesamte, zeit, der, beziehung, nie, eifersüchtig, war, oder, hatte, kam, dies, für, mich, ...]","[guten, abend, frau, ich, freue, mich, dass, ihre, zum, letzten, brief, so, schnell, kam, und, sie, verständnis, für, meine, lage, mitbringen, die, drei, tage, hatte, ich, viel, zu, tun, und, mir, ging, es, gut, daher, muss, ich, mich, gerade, etwas, dazu, zwingen, diesen, brief, zu, schreiben, da, er, mich, kraft, und, energie, kostet, noch, ein, zu, meinen, insgesamt, ich, hörte, vor, einigen, wochen, den, begriff, bipolar, im, zusammenhang, mit, zum, ersten, mal, und, konnte, mich, direkt, damit, in, meinem, leben, gab, es, häufig, sehr, hohe, und, tiefe, dies, fällt, mir, und, meinem, umfeld, besonders, stark, auf, da, mein, bruder, das, ...]"
4,12.02.2020,KUF,carmen,1,1,0,1,1,3,1,1,0,1,1,1,2,0,1,1,2,1,1,1,2,2,1,1,2,0,1,1,1,0,2,1,1,2,2,2,0,1.0,0.0,0.0,1,1,2,1,1,2,0,1,0,1969,1,4,2,2,1,1,180,174,79,0,0,1,1,1,1,0,0,1,0,0,0,3,3,2,2,2,5,4,5,14,0,0,0,0,0,0,0,0,0,0,0,0,0,3,1,2,2,1,0,1,0,3,2,3,2,2,3,2,2,1,1,3,2.0,1,1,1,1,1,1,2,1,2.0,2,1.0,4,2.0,3,4.0,4.0,4.0,4,2.0,5.0,5,5.0,2,3,1.0,4,2,4,2,4,2,2,2.0,2,1,4.0,3,4,4,4,4.0,4,4,3,3,3,4,2,3.0,3,2,3,2,2.0,2.0,1.0,2.0,2.0,2.0,2.0,2.0,3.0,2.0,2,5,2,3,3,2,5,2,2,3,2,2,3,4,4,3,3.0,2,2,4,3,1,2.0,2.0,7.0,2.0,2.0,2.0,7.0,7.0,7.0,1,1,1,1,0,1,2,1,0,"[hallo, die, frage, wie, alles, anfing, oder, auch, wann, alles, anfing, finde, ich, schwer, zu, weil, es, sich, eher, um, ein, prozess, handelte, auch, würde, ich, das, gefühl, nicht, als, bezeichnen, auch, wenn, vielleicht, dieses, gefühl, hinter, den, lag, daher, fange, ich, einfach, an, mit, der, :), als, mein, sohn, damals, äußerte, konnte, ich, die, schwer, wandte, mich, aber, aufgrund, des, der, im, mai, an, eine, seitdem, waren, wir, mein, sohn, aber, ich, bin, bei, den, fast, immer, dabei, dort, in, behandlung, mit, der, einer, depression, wie, groß, die, wirklich, war, war, unklar, wirklich, geredet, hat, mein, sohn, nämlich, nicht, ...]","[hallo, seit, meinem, letzten, brief, ist, zeit, vergangen, warum, ich, glaube, ich, war, mir, bewusst, dass, ich, den, nächsten, brief, auch, nicht, so, nebenbei, mal, schreiben, würde, und, daher, habe, ich, nach, einer, gelegenheit, gesucht, wo, ich, mir, auch, wirklich, zeit, dafür, nehmen, kann, für, das, schreiben, sowie, auch, für, danach, und, wahrscheinlich, habe, ich, es, auch, ein, wenig, vor, mir, ehrlich, gesagt, auch, wenn, ich, eigentlich, mich, unbedingt, damit, möchte, ist, es, noch, einfacher, zu, ignorieren, :-), fakt, ist, ich, brauche, wirklich, genug, zeit, um, zu, schreiben, und, energie, da, ich, jetzt, drei, wochen, gearbeitet, habe, hatte, ich, diese, ...]"


In [36]:
df_short["letter_M1"] = df_short["letter_M1"].apply(lambda x:np.nan if len(x) ==0 else x)

In [37]:
exclusion_cols = ["TI_F29", "TI_F23", "TI_F22", "TI_F25"]
df_short.drop(exclusion_cols, axis=1, inplace=True)

In [38]:
df_short["letter_M2"] = df_short["letter_M2"].apply(lambda x:np.nan if len(x) ==0 else x)

In [40]:
df_short = df_short[df_short[["letter_M1", "letter_M2"]].notnull().all(axis=1)]

In [41]:
df_short.shape

(512, 217)

In [42]:
df.shape

(523, 317)