In [1]:
# Import libraries
from deidentify.base import Document
from deidentify.taggers import CRFTagger, DeduceTagger, FlairTagger
from deidentify.tokenizer import TokenizerFactory
import pandas as pd

  from .autonotebook import tqdm as notebook_tqdm


### Example Usage

In [None]:
# Create some text
text = (
    "Dit is stukje tekst met daarin de naam Jan Jansen. De patient J. Jansen (e: "
    "j.jnsen@email.com, t: 06-12345678) is 64 jaar oud en woonachtig in Utrecht. Hij werd op 10 "
    "oktober door arts Peter de Visser ontslagen van de kliniek van het UMCU."
)

# Wrap text in document
documents = [
    Document(name='doc_01', text=text)
]

# Select downloaded model
model = 'model_bilstmcrf_ons_fast-v0.2.0'

# Instantiate tokenizer
tokenizer = TokenizerFactory().tokenizer(corpus='ons', disable=("tagger", "ner"))

# Load tagger with a downloaded model file and tokenizer
tagger = FlairTagger(model=model, tokenizer=tokenizer, verbose=False)

# Annotate your documents
annotated_docs = tagger.annotate(documents)

In [None]:
# Annotation results
from pprint import pprint

first_doc = annotated_docs[0]
pprint(first_doc.annotations)

In [None]:
# Mask annotations
from deidentify.util import mask_annotations

masked_doc = mask_annotations(first_doc)
print(masked_doc.text)

## Dummy Test

In [2]:
# Import data
df = pd.read_csv("..\data\Dummy_TEST_123Consultatievragen.csv",sep=';')
df

# Convert the Series to strings
df_string = ';'.join(df.Consultatievraag.astype(str))
df_string

'Dag. Graag vraag ik advies inzake het wel of niet starten met medicatie? Aidan vertelt : gaat niet lekker, bekend met bipolaire stoornis, vorig jaar periode wat hypomaan in augustus, toen tijdelijk rivotril gebruikt, nu juist angstig, emotioneel en somberder, trigger is wss Lars die naar verzorginshuis is, (Aidan en heeft er moeite mee dat de cultuur in Nederland anders is tav opvang van ouderen) speelt nu op sinds 1,5 mnd en wordt langzaam erger, soms ook boos, intensere emoties, post-partum begeleiding gehad, maar wilde toen niet met lithium beginnen en is zonder medicatie goed gegaan. Tevens hypothyreoidie waarvoor medicatie. Alvast bedankt voor het meedenken. ;betreft Bart van 18 jaar die depressief is en gedachten heeft op het spoor te gaan staan.volgens de huisarts geen crisis. Bart is afgewezen bij Centiv. Sandra wil graag overleg.;Inmiddels 3x meneer gezien. Meneer Altijd voornamelijk bezig geweest met werk, nu meer zoekende naar momenten die rust en ontspanning geven.Relatiep

### FlairTagger

In [3]:
# Wrap text in document
documents_dummy = [
    Document(name='doc_01', text=df_string)
]

# Select downloaded model
model = 'model_bilstmcrf_ons_fast-v0.2.0'

# Instantiate tokenizer
tokenizer = TokenizerFactory().tokenizer(corpus='ons', disable=("tagger", "ner"))

# Load tagger with a downloaded model file and tokenizer
tagger = FlairTagger(model=model, tokenizer=tokenizer, verbose=False)

# Annotate your documents
annotated_docs_flair = tagger.annotate(documents_dummy)

[32m2023-12-21 14:32:23.134[0m | [1mINFO    [0m | [36mdeidentify.tokenizer.base[0m:[36mtokenizer[0m:[36m36[0m - [1mTokenizer for corpus: ons[0m
[32m2023-12-21 14:32:25.906[0m | [1mINFO    [0m | [36mdeidentify.taggers.flair_tagger[0m:[36m__init__[0m:[36m20[0m - [1mLoad flair model from C:\Users\DonnaHsia\.deidentify\model_bilstmcrf_ons_fast-v0.2.0\final-model.pt[0m


2023-12-21 14:32:25,906 loading file C:\Users\DonnaHsia\.deidentify\model_bilstmcrf_ons_fast-v0.2.0\final-model.pt


[32m2023-12-21 14:32:29.672[0m | [1mINFO    [0m | [36mdeidentify.taggers.flair_tagger[0m:[36m__init__[0m:[36m22[0m - [1mFinish loading flair model.[0m


In [4]:
# Annotation results of FlairTagger
from pprint import pprint

first_doc_flair = annotated_docs_flair[0]
pprint(first_doc_flair.annotations)

[Annotation(text='Aidan', start=73, end=78, tag='Name', doc_id='', ann_id='T0'),
 Annotation(text='augustus', start=173, end=181, tag='Date', doc_id='', ann_id='T1'),
 Annotation(text='Lars', start=275, end=279, tag='Name', doc_id='', ann_id='T2'),
 Annotation(text='Aidan', start=309, end=314, tag='Name', doc_id='', ann_id='T3'),
 Annotation(text='Nederland', start=356, end=365, tag='Address', doc_id='', ann_id='T4'),
 Annotation(text='Bart', start=681, end=685, tag='Name', doc_id='', ann_id='T5'),
 Annotation(text='18 jaar', start=690, end=697, tag='Age', doc_id='', ann_id='T6'),
 Annotation(text='Bart', start=795, end=799, tag='Name', doc_id='', ann_id='T7'),
 Annotation(text='Centiv', start=817, end=823, tag='Care_Institute', doc_id='', ann_id='T8'),
 Annotation(text='Sandra', start=825, end=831, tag='Name', doc_id='', ann_id='T9'),
 Annotation(text='Anita', start=2058, end=2063, tag='Name', doc_id='', ann_id='T10'),
 Annotation(text='Jan', start=2684, end=2687, tag='Name', doc_id='

In [5]:
# Mask annotations of FlairTagger
from deidentify.util import mask_annotations

masked_doc_flair = mask_annotations(first_doc_flair)
print(masked_doc_flair.text)

Dag. Graag vraag ik advies inzake het wel of niet starten met medicatie? [NAME] vertelt : gaat niet lekker, bekend met bipolaire stoornis, vorig jaar periode wat hypomaan in [DATE], toen tijdelijk rivotril gebruikt, nu juist angstig, emotioneel en somberder, trigger is wss [NAME] die naar verzorginshuis is, ([NAME] en heeft er moeite mee dat de cultuur in [ADDRESS] anders is tav opvang van ouderen) speelt nu op sinds 1,5 mnd en wordt langzaam erger, soms ook boos, intensere emoties, post-partum begeleiding gehad, maar wilde toen niet met lithium beginnen en is zonder medicatie goed gegaan. Tevens hypothyreoidie waarvoor medicatie. Alvast bedankt voor het meedenken. ;betreft [NAME] van [AGE] die depressief is en gedachten heeft op het spoor te gaan staan.volgens de huisarts geen crisis. [NAME] is afgewezen bij [CARE_INSTITUTE]. [NAME] wil graag overleg.;Inmiddels 3x meneer gezien. Meneer Altijd voornamelijk bezig geweest met werk, nu meer zoekende naar momenten die rust en ontspanning g

In [6]:
# Split the input string into a list using semicolons as the delimiter
values = masked_doc_flair.text.split(";")

# Create a DataFrame with a single column named 'Values'
flair_final = pd.DataFrame({'Values': values})

# Print the DataFrame
print(flair_final)

                                               Values
0   Dag. Graag vraag ik advies inzake het wel of n...
1   betreft [NAME] van [AGE] die depressief is en ...
2   Inmiddels 3x meneer gezien. Meneer Altijd voor...
3   Ik zie een mevrouw ([NAME]) die in verleden ve...
4   Goedemiddag, ik heb een patiënt, [NAME] genaam...
..                                                ...
85  Een van mijn patiënten, [NAME], heeft langduri...
86  Ik zie een vrouw, [NAME], die heeft deelgenome...
87  Mijn cliënt, [NAME], heeft cognitieve gedragst...
88  Een van mijn patiënten, [NAME], heeft behandel...
89  Ik behandel een jonge man, [NAME], met een obs...

[90 rows x 1 columns]


### CRFTagger

In [7]:
# Wrap text in document
documents_dummy = [
    Document(name='doc_01', text=df_string)
]

# Select downloaded model
model = 'model_crf_ons_tuned-v0.2.0'

# Instantiate tokenizer
tokenizer = TokenizerFactory().tokenizer(corpus='ons', disable=("tagger", "ner"))

# Load tagger with a downloaded model file and tokenizer
tagger = CRFTagger(model=model, tokenizer=tokenizer, verbose=False)

# Annotate your documents
annotated_docs_crf = tagger.annotate(documents_dummy)

[32m2023-12-21 14:32:50.939[0m | [1mINFO    [0m | [36mdeidentify.tokenizer.base[0m:[36mtokenizer[0m:[36m36[0m - [1mTokenizer for corpus: ons[0m
[32m2023-12-21 14:32:50.943[0m | [1mINFO    [0m | [36mdeidentify.taggers.crf_tagger[0m:[36m__init__[0m:[36m21[0m - [1mLoad sklearn-crfsuite model from C:\Users\DonnaHsia\.deidentify\model_crf_ons_tuned-v0.2.0\model.pickle[0m
[32m2023-12-21 14:32:50.972[0m | [1mINFO    [0m | [36mdeidentify.taggers.crf_tagger[0m:[36m__init__[0m:[36m24[0m - [1mFinish loading crf model.[0m


In [8]:
# Annotation results of CRFTagger
from pprint import pprint

first_doc_crf = annotated_docs_crf[0]
pprint(first_doc_crf.annotations)

[Annotation(text='Aidan', start=73, end=78, tag='Name', doc_id='', ann_id='T0'),
 Annotation(text='Aidan', start=309, end=314, tag='Name', doc_id='', ann_id='T1'),
 Annotation(text='18 jaar', start=690, end=697, tag='Age', doc_id='', ann_id='T2'),
 Annotation(text='Sandra', start=825, end=831, tag='Name', doc_id='', ann_id='T3'),
 Annotation(text='Anita', start=2058, end=2063, tag='Name', doc_id='', ann_id='T4'),
 Annotation(text='Jan', start=2684, end=2687, tag='Name', doc_id='', ann_id='T5'),
 Annotation(text='Jan', start=2981, end=2984, tag='Name', doc_id='', ann_id='T6'),
 Annotation(text='Emma', start=3015, end=3019, tag='Name', doc_id='', ann_id='T7'),
 Annotation(text='25-jarige', start=3025, end=3034, tag='Age', doc_id='', ann_id='T8'),
 Annotation(text='Lisa', start=3691, end=3695, tag='Name', doc_id='', ann_id='T9'),
 Annotation(text='Lisa', start=3859, end=3863, tag='Name', doc_id='', ann_id='T10'),
 Annotation(text='Lisa', start=3903, end=3907, tag='Name', doc_id='', ann_id

In [9]:
# Mask annotations of CRFTagger
from deidentify.util import mask_annotations

masked_doc_crf = mask_annotations(first_doc_crf)
print(masked_doc_crf.text)

Dag. Graag vraag ik advies inzake het wel of niet starten met medicatie? [NAME] vertelt : gaat niet lekker, bekend met bipolaire stoornis, vorig jaar periode wat hypomaan in augustus, toen tijdelijk rivotril gebruikt, nu juist angstig, emotioneel en somberder, trigger is wss Lars die naar verzorginshuis is, ([NAME] en heeft er moeite mee dat de cultuur in Nederland anders is tav opvang van ouderen) speelt nu op sinds 1,5 mnd en wordt langzaam erger, soms ook boos, intensere emoties, post-partum begeleiding gehad, maar wilde toen niet met lithium beginnen en is zonder medicatie goed gegaan. Tevens hypothyreoidie waarvoor medicatie. Alvast bedankt voor het meedenken. ;betreft Bart van [AGE] die depressief is en gedachten heeft op het spoor te gaan staan.volgens de huisarts geen crisis. Bart is afgewezen bij Centiv. [NAME] wil graag overleg.;Inmiddels 3x meneer gezien. Meneer Altijd voornamelijk bezig geweest met werk, nu meer zoekende naar momenten die rust en ontspanning geven.Relatiepr

In [10]:
# Split the input string into a list using semicolons as the delimiter
values = masked_doc_crf.text.split(";")

# Create a DataFrame with a single column named 'Values'
crf_final = pd.DataFrame({'Values': values})

# Print the DataFrame
print(crf_final)

                                               Values
0   Dag. Graag vraag ik advies inzake het wel of n...
1   betreft Bart van [AGE] die depressief is en ge...
2   Inmiddels 3x meneer gezien. Meneer Altijd voor...
3   Ik zie een mevrouw ([NAME]) die in verleden ve...
4   Goedemiddag, ik heb een patiënt, [NAME] genaam...
..                                                ...
85  Een van mijn patiënten, [NAME], heeft langduri...
86  Ik zie een vrouw, [NAME], die heeft deelgenome...
87  Mijn cliënt, [NAME], heeft cognitieve gedragst...
88  Een van mijn patiënten, [NAME], heeft behandel...
89  Ik behandel een jonge man, [NAME], met een obs...

[90 rows x 1 columns]


### DeduceTagger

In [11]:
# Wrap text in document
documents_dummy = [
    Document(name='doc_01', text=df_string)
]

# Load tagger with a downloaded model file and tokenizer
tagger = DeduceTagger(verbose=False)

# Annotate your documents
annotated_docs_deduce = tagger.annotate(documents_dummy)

In [12]:
# Annotation results of DeduceTagger
from pprint import pprint

first_doc_deduce = annotated_docs_deduce[0]
pprint(first_doc_deduce.annotations)

[Annotation(text='Dag', start=0, end=3, tag='Name', doc_id='', ann_id='T0'),
 Annotation(text='Aidan', start=73, end=78, tag='Name', doc_id='', ann_id='T1'),
 Annotation(text='Lars', start=275, end=279, tag='Name', doc_id='', ann_id='T2'),
 Annotation(text='Aidan', start=309, end=314, tag='Name', doc_id='', ann_id='T3'),
 Annotation(text='Nederland', start=356, end=365, tag='Address', doc_id='', ann_id='T4'),
 Annotation(text='Bart', start=681, end=685, tag='Name', doc_id='', ann_id='T5'),
 Annotation(text='18', start=690, end=692, tag='Age', doc_id='', ann_id='T6'),
 Annotation(text='Bart', start=795, end=799, tag='Name', doc_id='', ann_id='T7'),
 Annotation(text='Sandra', start=825, end=831, tag='Name', doc_id='', ann_id='T8'),
 Annotation(text='ouw (Anita', start=2053, end=2063, tag='Name', doc_id='', ann_id='T9'),
 Annotation(text='Jan', start=2684, end=2687, tag='Name', doc_id='', ann_id='T10'),
 Annotation(text='Jan', start=2981, end=2984, tag='Name', doc_id='', ann_id='T11'),
 A

In [13]:
# Mask annotations of DeduceTagger
from deidentify.util import mask_annotations

masked_doc_deduce = mask_annotations(first_doc_deduce)
print(masked_doc_deduce.text)

[NAME]. Graag vraag ik advies inzake het wel of niet starten met medicatie? [NAME] vertelt : gaat niet lekker, bekend met bipolaire stoornis, vorig jaar periode wat hypomaan in augustus, toen tijdelijk rivotril gebruikt, nu juist angstig, emotioneel en somberder, trigger is wss [NAME] die naar verzorginshuis is, ([NAME] en heeft er moeite mee dat de cultuur in [ADDRESS] anders is tav opvang van ouderen) speelt nu op sinds 1,5 mnd en wordt langzaam erger, soms ook boos, intensere emoties, post-partum begeleiding gehad, maar wilde toen niet met lithium beginnen en is zonder medicatie goed gegaan. Tevens hypothyreoidie waarvoor medicatie. Alvast bedankt voor het meedenken. ;betreft [NAME] van [AGE] jaar die depressief is en gedachten heeft op het spoor te gaan staan.volgens de huisarts geen crisis. [NAME] is afgewezen bij Centiv. [NAME] wil graag overleg.;Inmiddels 3x meneer gezien. Meneer Altijd voornamelijk bezig geweest met werk, nu meer zoekende naar momenten die rust en ontspanning g

In [14]:
# Split the input string into a list using semicolons as the delimiter
values = masked_doc_deduce.text.split(";")

# Create a DataFrame with a single column named 'Values'
deduce_final = pd.DataFrame({'Values': values})

# Print the DataFrame
print(deduce_final)

                                               Values
0   [NAME]. Graag vraag ik advies inzake het wel o...
1   betreft [NAME] van [AGE] jaar die depressief i...
2   Inmiddels 3x meneer gezien. Meneer Altijd voor...
3   Ik zie een mevr[NAME]) die in verleden verslav...
4   Goedemiddag, ik heb een patiënt, [NAME] genaam...
..                                                ...
85  Een van mijn patiënten, [NAME], heeft langduri...
86  Ik zie een vrouw, [NAME], die heeft deelgenome...
87  Mijn cliënt, [NAME], heeft cognitieve gedragst...
88  Een van mijn patiënten, [NAME], heeft behandel...
89  Ik behandel een jonge man, [NAME], met een obs...

[90 rows x 1 columns]


## Real Text Test (4 entries)

### FlairTagger

In [15]:
# Create some text
text1 = (
    "betreft Maria van Oosterhout van 75 jaar die depressief is en gedachten heeft op het spoor te gaan staan."
    "volgens de huisarts geen crisis. Maria is afgewezen bij Centiv. Maria wil graag overleg.;"
)

text2 =(
    "Dag. Graag vraag ik advies inzake het wel of niet starten met medicatie?"
    "Joris vertelt : gaat niet lekker, bekend met bipolaire stoornis, vorig jaar periode wat hypomaan in augustus, toen tijdelijk rivotril gebruikt, nu juist angstig, emotioneel en somberder, trigger is wss zijn moeder die naar verzorginshuis is,"
    "(65 jaar en heeft er moeite mee dat de cultuur in Nederland anders is tav opvang van ouderen)"
    "speelt nu op sinds 1,5 mnd en wordt langzaam erger, soms ook boos, intensere emoties, post-partum begeleiding gehad, maar wilde toen niet met lithium beginnen en is zonder medicatie goed gegaan."
    "Tevens hypothyreoidie waarvoor medicatie. Alvast bedankt voor het meedenken. Irene;"
)

text3 = (
    "Inmiddels 3x gezien. Meneer Schoenmakers is altijd voornamelijk bezig geweest met werk, nu meer zoekende naar momenten die rust en ontspanning geven."
    "Relatieproblematiek mede door problemen in emotieregulatie bij hem van seksualiteit en intiem contact is belemmerend voor hem geen effect."
    "Beschrijft hem als iemand die lomp is en zegt waar het op staat. Loopt met name in relatie en in contact met werknemer tegen problemen aan."
    "Vrienden en kennissen nemen hem zoals hij is. Inmiddels 3 consulten gevoerd. Hij is steeds meer open. Emoties tonen gaat moeizaam, vecht ertegen."
    "Wil aan de slag met emotieregulatie, daarnaast weer rust in hoofd ervaren. Nooit eerder in contact geweest binnen GGZ."
    "Verwachting mogelijk problematiek in persoonlijkheid, is ook beeld vanuit betrokken huisarts. Hij omschrijft mogelijk hechtingsproblematiek."
    "Hij laat in consulten weinig los over kind- en jeugdjaren. Vraagt om rustgevende medicatie. Begrijpt noodzaak om eerst meer context te kunnen schetsen."
    "Verzoek om deze patiënt, evt. in samenwerking, te zien om verder beleid passend te kunnen vaststellen. Beoordelen of het past binnen SGGZ of juist beter voorliggend opgepakt kan worden.;"
)

text4 = (
    "Ik zie een meneer die in het verleden verslaving heeft gehad aan GHB en alcohol. Is ook bij jullie in behandeling geweest hiervoor."
    "Van GHB-gebruik is geen sprake meer, wel nog van alcoholgebruik. Hij drinkt in het weekend met uitgaan. Stoppen hiermee is geen optie."
    "Merkt dat hij door de week toch zucht krijgt. Onlangs een life event meegemaakt (overlijden vader). Zijn vraag is of er anti-zucht medicatie is die hem kan helpen stoppen en dan toch kan drinken in het weekend."
    "Hij zou hier graag over willen spreken met een verslavingsarts. Is het mogelijk om hiervoor bij u een eenmalig consult aan te vragen?"
)

list = [text1, text2, text3, text4]
text = ' '.join(list)

In [16]:
# Wrap text in document
documents_real = [
    Document(name='doc_01', text=text)
]

# Select downloaded model
model = 'model_bilstmcrf_ons_fast-v0.2.0'

# Instantiate tokenizer
tokenizer = TokenizerFactory().tokenizer(corpus='ons', disable=("tagger", "ner"))

# Load tagger with a downloaded model file and tokenizer
tagger = FlairTagger(model=model, tokenizer=tokenizer, verbose=False)

# Annotate your documents
annotated_docs_flair_r = tagger.annotate(documents_real)

[32m2023-12-21 14:37:34.566[0m | [1mINFO    [0m | [36mdeidentify.tokenizer.base[0m:[36mtokenizer[0m:[36m36[0m - [1mTokenizer for corpus: ons[0m
[32m2023-12-21 14:37:34.582[0m | [1mINFO    [0m | [36mdeidentify.taggers.flair_tagger[0m:[36m__init__[0m:[36m20[0m - [1mLoad flair model from C:\Users\DonnaHsia\.deidentify\model_bilstmcrf_ons_fast-v0.2.0\final-model.pt[0m


2023-12-21 14:37:34,582 loading file C:\Users\DonnaHsia\.deidentify\model_bilstmcrf_ons_fast-v0.2.0\final-model.pt


[32m2023-12-21 14:37:38.437[0m | [1mINFO    [0m | [36mdeidentify.taggers.flair_tagger[0m:[36m__init__[0m:[36m22[0m - [1mFinish loading flair model.[0m


In [18]:
# Annotation results of FlairTagger
from pprint import pprint

first_doc_flair_r = annotated_docs_flair_r[0]
pprint(first_doc_flair_r.annotations)

[Annotation(text='Maria van Oosterhout', start=8, end=28, tag='Name', doc_id='', ann_id='T0'),
 Annotation(text='75 jaar', start=33, end=40, tag='Age', doc_id='', ann_id='T1'),
 Annotation(text='Maria', start=138, end=143, tag='Name', doc_id='', ann_id='T2'),
 Annotation(text='Centiv', start=161, end=167, tag='Care_Institute', doc_id='', ann_id='T3'),
 Annotation(text='Maria', start=169, end=174, tag='Name', doc_id='', ann_id='T4'),
 Annotation(text='Joris', start=267, end=272, tag='Name', doc_id='', ann_id='T5'),
 Annotation(text='augustus', start=367, end=375, tag='Date', doc_id='', ann_id='T6'),
 Annotation(text='65 jaar', start=509, end=516, tag='Age', doc_id='', ann_id='T7'),
 Annotation(text='Nederland', start=558, end=567, tag='Address', doc_id='', ann_id='T8'),
 Annotation(text='Irene', start=872, end=877, tag='Name', doc_id='', ann_id='T9'),
 Annotation(text='GGZ.Verwachting', start=1564, end=1579, tag='Care_Institute', doc_id='', ann_id='T10'),
 Annotation(text='GHB-gebruik',

In [20]:
# Mask annotations of FlairTagger
from deidentify.util import mask_annotations

masked_doc_flair_r = mask_annotations(first_doc_flair_r)
print(masked_doc_flair_r.text)

betreft [NAME] van [AGE] die depressief is en gedachten heeft op het spoor te gaan staan.volgens de huisarts geen crisis. [NAME] is afgewezen bij [CARE_INSTITUTE]. [NAME] wil graag overleg.; Dag. Graag vraag ik advies inzake het wel of niet starten met medicatie?[NAME] vertelt : gaat niet lekker, bekend met bipolaire stoornis, vorig jaar periode wat hypomaan in [DATE], toen tijdelijk rivotril gebruikt, nu juist angstig, emotioneel en somberder, trigger is wss zijn moeder die naar verzorginshuis is,([AGE] en heeft er moeite mee dat de cultuur in [ADDRESS] anders is tav opvang van ouderen)speelt nu op sinds 1,5 mnd en wordt langzaam erger, soms ook boos, intensere emoties, post-partum begeleiding gehad, maar wilde toen niet met lithium beginnen en is zonder medicatie goed gegaan.Tevens hypothyreoidie waarvoor medicatie. Alvast bedankt voor het meedenken. [NAME]; Inmiddels 3x gezien. Meneer Schoenmakers is altijd voornamelijk bezig geweest met werk, nu meer zoekende naar momenten die rust

In [21]:
# Split the input string into a list using semicolons as the delimiter
values = masked_doc_flair_r.text.split(";")

# Create a DataFrame with a single column named 'Values'
flair_final_r = pd.DataFrame({'Values': values})

# Print the DataFrame
def align_left(s):
    return 'text-align: left'
flair_final_r = flair_final_r.style.applymap(align_left)

pd.set_option('display.max_colwidth', None)
flair_final_r

  flair_final_r = flair_final_r.style.applymap(align_left)


Unnamed: 0,Values
0,betreft [NAME] van [AGE] die depressief is en gedachten heeft op het spoor te gaan staan.volgens de huisarts geen crisis. [NAME] is afgewezen bij [CARE_INSTITUTE]. [NAME] wil graag overleg.
1,"Dag. Graag vraag ik advies inzake het wel of niet starten met medicatie?[NAME] vertelt : gaat niet lekker, bekend met bipolaire stoornis, vorig jaar periode wat hypomaan in [DATE], toen tijdelijk rivotril gebruikt, nu juist angstig, emotioneel en somberder, trigger is wss zijn moeder die naar verzorginshuis is,([AGE] en heeft er moeite mee dat de cultuur in [ADDRESS] anders is tav opvang van ouderen)speelt nu op sinds 1,5 mnd en wordt langzaam erger, soms ook boos, intensere emoties, post-partum begeleiding gehad, maar wilde toen niet met lithium beginnen en is zonder medicatie goed gegaan.Tevens hypothyreoidie waarvoor medicatie. Alvast bedankt voor het meedenken. [NAME]"
2,"Inmiddels 3x gezien. Meneer Schoenmakers is altijd voornamelijk bezig geweest met werk, nu meer zoekende naar momenten die rust en ontspanning geven.Relatieproblematiek mede door problemen in emotieregulatie bij hem van seksualiteit en intiem contact is belemmerend voor hem geen effect.Beschrijft hem als iemand die lomp is en zegt waar het op staat. Loopt met name in relatie en in contact met werknemer tegen problemen aan.Vrienden en kennissen nemen hem zoals hij is. Inmiddels 3 consulten gevoerd. Hij is steeds meer open. Emoties tonen gaat moeizaam, vecht ertegen.Wil aan de slag met emotieregulatie, daarnaast weer rust in hoofd ervaren. Nooit eerder in contact geweest binnen [CARE_INSTITUTE] mogelijk problematiek in persoonlijkheid, is ook beeld vanuit betrokken huisarts. Hij omschrijft mogelijk hechtingsproblematiek.Hij laat in consulten weinig los over kind- en jeugdjaren. Vraagt om rustgevende medicatie. Begrijpt noodzaak om eerst meer context te kunnen schetsen.Verzoek om deze patiënt, evt. in samenwerking, te zien om verder beleid passend te kunnen vaststellen. Beoordelen of het past binnen SGGZ of juist beter voorliggend opgepakt kan worden."
3,"Ik zie een meneer die in het verleden verslaving heeft gehad aan GHB en alcohol. Is ook bij jullie in behandeling geweest hiervoor.Van [ORGANIZATION_COMPANY] is geen sprake meer, wel nog van alcoholgebruik. Hij drinkt in het weekend met uitgaan. Stoppen hiermee is geen optie.Merkt dat hij door de week toch zucht krijgt. Onlangs een life event meegemaakt (overlijden vader). Zijn vraag is of er anti-zucht medicatie is die hem kan helpen stoppen en dan toch kan drinken in het weekend.Hij zou hier graag over willen spreken met een verslavingsarts. Is het mogelijk om hiervoor bij u een eenmalig consult aan te vragen?"


### CRFTagger

In [22]:
# Wrap text in document
documents_real = [
    Document(name='doc_01', text=text)
]

# Select downloaded model
model = 'model_crf_ons_tuned-v0.2.0'

# Instantiate tokenizer
tokenizer = TokenizerFactory().tokenizer(corpus='ons', disable=("tagger", "ner"))

# Load tagger with a downloaded model file and tokenizer
tagger = CRFTagger(model=model, tokenizer=tokenizer, verbose=False)

# Annotate your documents
annotated_docs_crf_r = tagger.annotate(documents_real)

[32m2023-12-21 14:38:09.562[0m | [1mINFO    [0m | [36mdeidentify.tokenizer.base[0m:[36mtokenizer[0m:[36m36[0m - [1mTokenizer for corpus: ons[0m
[32m2023-12-21 14:38:09.562[0m | [1mINFO    [0m | [36mdeidentify.taggers.crf_tagger[0m:[36m__init__[0m:[36m21[0m - [1mLoad sklearn-crfsuite model from C:\Users\DonnaHsia\.deidentify\model_crf_ons_tuned-v0.2.0\model.pickle[0m
[32m2023-12-21 14:38:09.603[0m | [1mINFO    [0m | [36mdeidentify.taggers.crf_tagger[0m:[36m__init__[0m:[36m24[0m - [1mFinish loading crf model.[0m


In [23]:
# Annotation results of CRFTagger
from pprint import pprint

first_doc_crf_r = annotated_docs_crf_r[0]
pprint(first_doc_crf_r.annotations)

[Annotation(text='Maria van Oosterhout', start=8, end=28, tag='Name', doc_id='', ann_id='T0'),
 Annotation(text='Maria', start=138, end=143, tag='Name', doc_id='', ann_id='T1'),
 Annotation(text='Maria', start=169, end=174, tag='Name', doc_id='', ann_id='T2'),
 Annotation(text='Joris', start=267, end=272, tag='Name', doc_id='', ann_id='T3'),
 Annotation(text='Irene', start=872, end=877, tag='Name', doc_id='', ann_id='T4')]


In [24]:
# Mask annotations of CRFTagger
from deidentify.util import mask_annotations

masked_doc_crf_r = mask_annotations(first_doc_crf_r)
print(masked_doc_crf_r.text)

betreft [NAME] van 75 jaar die depressief is en gedachten heeft op het spoor te gaan staan.volgens de huisarts geen crisis. [NAME] is afgewezen bij Centiv. [NAME] wil graag overleg.; Dag. Graag vraag ik advies inzake het wel of niet starten met medicatie?[NAME] vertelt : gaat niet lekker, bekend met bipolaire stoornis, vorig jaar periode wat hypomaan in augustus, toen tijdelijk rivotril gebruikt, nu juist angstig, emotioneel en somberder, trigger is wss zijn moeder die naar verzorginshuis is,(65 jaar en heeft er moeite mee dat de cultuur in Nederland anders is tav opvang van ouderen)speelt nu op sinds 1,5 mnd en wordt langzaam erger, soms ook boos, intensere emoties, post-partum begeleiding gehad, maar wilde toen niet met lithium beginnen en is zonder medicatie goed gegaan.Tevens hypothyreoidie waarvoor medicatie. Alvast bedankt voor het meedenken. [NAME]; Inmiddels 3x gezien. Meneer Schoenmakers is altijd voornamelijk bezig geweest met werk, nu meer zoekende naar momenten die rust en 

In [25]:
# Split the input string into a list using semicolons as the delimiter
values = masked_doc_crf_r.text.split(";")

# Create a DataFrame with a single column named 'Values'
crf_final_r = pd.DataFrame({'Values': values})

# Print the DataFrame
def align_left(s):
    return 'text-align: left'
crf_final_r = crf_final_r.style.applymap(align_left)

pd.set_option('display.max_colwidth', None)
crf_final_r

  crf_final_r = crf_final_r.style.applymap(align_left)


Unnamed: 0,Values
0,betreft [NAME] van 75 jaar die depressief is en gedachten heeft op het spoor te gaan staan.volgens de huisarts geen crisis. [NAME] is afgewezen bij Centiv. [NAME] wil graag overleg.
1,"Dag. Graag vraag ik advies inzake het wel of niet starten met medicatie?[NAME] vertelt : gaat niet lekker, bekend met bipolaire stoornis, vorig jaar periode wat hypomaan in augustus, toen tijdelijk rivotril gebruikt, nu juist angstig, emotioneel en somberder, trigger is wss zijn moeder die naar verzorginshuis is,(65 jaar en heeft er moeite mee dat de cultuur in Nederland anders is tav opvang van ouderen)speelt nu op sinds 1,5 mnd en wordt langzaam erger, soms ook boos, intensere emoties, post-partum begeleiding gehad, maar wilde toen niet met lithium beginnen en is zonder medicatie goed gegaan.Tevens hypothyreoidie waarvoor medicatie. Alvast bedankt voor het meedenken. [NAME]"
2,"Inmiddels 3x gezien. Meneer Schoenmakers is altijd voornamelijk bezig geweest met werk, nu meer zoekende naar momenten die rust en ontspanning geven.Relatieproblematiek mede door problemen in emotieregulatie bij hem van seksualiteit en intiem contact is belemmerend voor hem geen effect.Beschrijft hem als iemand die lomp is en zegt waar het op staat. Loopt met name in relatie en in contact met werknemer tegen problemen aan.Vrienden en kennissen nemen hem zoals hij is. Inmiddels 3 consulten gevoerd. Hij is steeds meer open. Emoties tonen gaat moeizaam, vecht ertegen.Wil aan de slag met emotieregulatie, daarnaast weer rust in hoofd ervaren. Nooit eerder in contact geweest binnen GGZ.Verwachting mogelijk problematiek in persoonlijkheid, is ook beeld vanuit betrokken huisarts. Hij omschrijft mogelijk hechtingsproblematiek.Hij laat in consulten weinig los over kind- en jeugdjaren. Vraagt om rustgevende medicatie. Begrijpt noodzaak om eerst meer context te kunnen schetsen.Verzoek om deze patiënt, evt. in samenwerking, te zien om verder beleid passend te kunnen vaststellen. Beoordelen of het past binnen SGGZ of juist beter voorliggend opgepakt kan worden."
3,"Ik zie een meneer die in het verleden verslaving heeft gehad aan GHB en alcohol. Is ook bij jullie in behandeling geweest hiervoor.Van GHB-gebruik is geen sprake meer, wel nog van alcoholgebruik. Hij drinkt in het weekend met uitgaan. Stoppen hiermee is geen optie.Merkt dat hij door de week toch zucht krijgt. Onlangs een life event meegemaakt (overlijden vader). Zijn vraag is of er anti-zucht medicatie is die hem kan helpen stoppen en dan toch kan drinken in het weekend.Hij zou hier graag over willen spreken met een verslavingsarts. Is het mogelijk om hiervoor bij u een eenmalig consult aan te vragen?"


### DeduceTagger

In [26]:
# Wrap text in document
documents_real = [
    Document(name='doc_01', text=text)
]

# Load tagger with a downloaded model file and tokenizer
tagger = DeduceTagger(verbose=False)

# Annotate your documents
annotated_docs_deduce_r = tagger.annotate(documents_real)

In [27]:
# Annotation results of DeduceTagger
from pprint import pprint

first_doc_deduce_r = annotated_docs_deduce_r[0]
pprint(first_doc_deduce_r.annotations)

[Annotation(text='Maria van Oosterhout', start=8, end=28, tag='Name', doc_id='', ann_id='T0'),
 Annotation(text='75', start=33, end=35, tag='Age', doc_id='', ann_id='T1'),
 Annotation(text='Maria', start=138, end=143, tag='Name', doc_id='', ann_id='T2'),
 Annotation(text='Maria', start=169, end=174, tag='Name', doc_id='', ann_id='T3'),
 Annotation(text='Dag', start=195, end=198, tag='Name', doc_id='', ann_id='T4'),
 Annotation(text='Joris', start=267, end=272, tag='Name', doc_id='', ann_id='T5'),
 Annotation(text='65', start=509, end=511, tag='Age', doc_id='', ann_id='T6'),
 Annotation(text='Nederland', start=558, end=567, tag='Address', doc_id='', ann_id='T7'),
 Annotation(text='ene; Inmiddels', start=874, end=888, tag='Name', doc_id='', ann_id='T8'),
 Annotation(text='Schoenmakers', start=907, end=919, tag='Name', doc_id='', ann_id='T9')]


In [28]:
# Mask annotations of DeduceTagger
from deidentify.util import mask_annotations

masked_doc_deduce_r = mask_annotations(first_doc_deduce_r)
print(masked_doc_deduce_r.text)

betreft [NAME] van [AGE] jaar die depressief is en gedachten heeft op het spoor te gaan staan.volgens de huisarts geen crisis. [NAME] is afgewezen bij Centiv. [NAME] wil graag overleg.; [NAME]. Graag vraag ik advies inzake het wel of niet starten met medicatie?[NAME] vertelt : gaat niet lekker, bekend met bipolaire stoornis, vorig jaar periode wat hypomaan in augustus, toen tijdelijk rivotril gebruikt, nu juist angstig, emotioneel en somberder, trigger is wss zijn moeder die naar verzorginshuis is,([AGE] jaar en heeft er moeite mee dat de cultuur in [ADDRESS] anders is tav opvang van ouderen)speelt nu op sinds 1,5 mnd en wordt langzaam erger, soms ook boos, intensere emoties, post-partum begeleiding gehad, maar wilde toen niet met lithium beginnen en is zonder medicatie goed gegaan.Tevens hypothyreoidie waarvoor medicatie. Alvast bedankt voor het meedenken. Ir[NAME] 3x gezien. Meneer [NAME] is altijd voornamelijk bezig geweest met werk, nu meer zoekende naar momenten die rust en ontspa

In [29]:
# Split the input string into a list using semicolons as the delimiter
values = masked_doc_deduce_r.text.split(";")

# Create a DataFrame with a single column named 'Values'
deduce_final_r = pd.DataFrame({'Values': values})

# Print the DataFrame
def align_left(s):
    return 'text-align: left'
deduce_final_r = deduce_final_r.style.applymap(align_left)

pd.set_option('display.max_colwidth', None)
deduce_final_r

  deduce_final_r = deduce_final_r.style.applymap(align_left)


Unnamed: 0,Values
0,betreft [NAME] van [AGE] jaar die depressief is en gedachten heeft op het spoor te gaan staan.volgens de huisarts geen crisis. [NAME] is afgewezen bij Centiv. [NAME] wil graag overleg.
1,"[NAME]. Graag vraag ik advies inzake het wel of niet starten met medicatie?[NAME] vertelt : gaat niet lekker, bekend met bipolaire stoornis, vorig jaar periode wat hypomaan in augustus, toen tijdelijk rivotril gebruikt, nu juist angstig, emotioneel en somberder, trigger is wss zijn moeder die naar verzorginshuis is,([AGE] jaar en heeft er moeite mee dat de cultuur in [ADDRESS] anders is tav opvang van ouderen)speelt nu op sinds 1,5 mnd en wordt langzaam erger, soms ook boos, intensere emoties, post-partum begeleiding gehad, maar wilde toen niet met lithium beginnen en is zonder medicatie goed gegaan.Tevens hypothyreoidie waarvoor medicatie. Alvast bedankt voor het meedenken. Ir[NAME] 3x gezien. Meneer [NAME] is altijd voornamelijk bezig geweest met werk, nu meer zoekende naar momenten die rust en ontspanning geven.Relatieproblematiek mede door problemen in emotieregulatie bij hem van seksualiteit en intiem contact is belemmerend voor hem geen effect.Beschrijft hem als iemand die lomp is en zegt waar het op staat. Loopt met name in relatie en in contact met werknemer tegen problemen aan.Vrienden en kennissen nemen hem zoals hij is. Inmiddels 3 consulten gevoerd. Hij is steeds meer open. Emoties tonen gaat moeizaam, vecht ertegen.Wil aan de slag met emotieregulatie, daarnaast weer rust in hoofd ervaren. Nooit eerder in contact geweest binnen GGZ.Verwachting mogelijk problematiek in persoonlijkheid, is ook beeld vanuit betrokken huisarts. Hij omschrijft mogelijk hechtingsproblematiek.Hij laat in consulten weinig los over kind- en jeugdjaren. Vraagt om rustgevende medicatie. Begrijpt noodzaak om eerst meer context te kunnen schetsen.Verzoek om deze patiënt, evt. in samenwerking, te zien om verder beleid passend te kunnen vaststellen. Beoordelen of het past binnen SGGZ of juist beter voorliggend opgepakt kan worden."
2,"Ik zie een meneer die in het verleden verslaving heeft gehad aan GHB en alcohol. Is ook bij jullie in behandeling geweest hiervoor.Van GHB-gebruik is geen sprake meer, wel nog van alcoholgebruik. Hij drinkt in het weekend met uitgaan. Stoppen hiermee is geen optie.Merkt dat hij door de week toch zucht krijgt. Onlangs een life event meegemaakt (overlijden vader). Zijn vraag is of er anti-zucht medicatie is die hem kan helpen stoppen en dan toch kan drinken in het weekend.Hij zou hier graag over willen spreken met een verslavingsarts. Is het mogelijk om hiervoor bij u een eenmalig consult aan te vragen?"
