In [1]:
import sys
sys.path.append('../scripts')

In [2]:
import os
# Disable weights and biases (if installed)
os.environ["TOKENIZERS_PARALLELISM"] = "false"
os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID"
os.environ["CUDA_VISIBLE_DEVICES"] = "5"
os.environ["WANDB_DISABLED"] = "true"

In [25]:
from pathlib import Path

from dataset import load_data, get_dataloader
from evaluation import get_scores
from transformers_util import get_training_args, get_trainer, get_tokenizer

# Load Data & Seq2Seq Model

In [4]:
import hydra
from hydra import compose, initialize

hydra.core.global_hydra.GlobalHydra.instance().clear()
initialize(config_path=Path('..'), job_name='foo', version_base='1.1')
config = compose(config_name='experiment.yaml')

In [5]:
MODEL_PATH = "../data/ellipses/model/"
BATCH_SIZE = 32

In [6]:
tokenizer = get_tokenizer(config)



In [7]:
base_path = Path('..')
train_df, val_df, test_df = load_data(base_path / config.data.cnf_tsv_path, base_path / config.data.controls_tsv_path)

# Error Analysis

In [8]:
from transformers import Text2TextGenerationPipeline, AutoModelForSeq2SeqLM
from notebook_util import calculate_errors

In [9]:
model = AutoModelForSeq2SeqLM.from_pretrained(MODEL_PATH)

In [10]:
pipeline = Text2TextGenerationPipeline(model, tokenizer=tokenizer, max_length=config.generation_max_length, device=0, batch_size=BATCH_SIZE)

In [11]:
from notebook_util import show_errors

In [12]:
%%time
out_valid = pipeline(list(val_df.raw_sentence))

CPU times: user 54.8 s, sys: 469 ms, total: 55.2 s
Wall time: 55.2 s


In [13]:
errors_valid = calculate_errors(out_valid, val_df, tokenizer)
errors_valid.error_type.value_counts() / len(errors_valid)

tn         0.495420
tp         0.416320
replace    0.016653
delete     0.016653
fn         0.016653
insert     0.014988
fp         0.013322
complex    0.009992
Name: error_type, dtype: float64

In [27]:
%%time
scores = get_scores(errors_valid, "eval")
scores

CPU times: user 1min 20s, sys: 72.1 ms, total: 1min 20s
Wall time: 1min 21s


{'eval/exact_match': 0.9117402164862615,
 'eval/gleu': 0.9868297119100977,
 'eval/edit_distance_rel': 0.9539251318409139}

In [15]:
%%time
out_test = pipeline(list(test_df.raw_sentence))

CPU times: user 53.3 s, sys: 349 ms, total: 53.7 s
Wall time: 53.7 s


In [16]:
errors_test = calculate_errors(out_test, test_df, tokenizer)
errors_test.error_type.value_counts()

tn         601
tp         448
delete      25
insert      25
fn          18
replace     16
fp          15
complex     11
Name: error_type, dtype: int64

In [17]:
errors_test

Unnamed: 0,pred,ground_truth,original,error_type,index,file,sentence_id
0,Hauptrisikofaktoren für das Auftreten eines Mu...,Hauptrisikofaktoren für das Auftreten eines Mu...,Hauptrisikofaktoren für das Auftreten eines Mu...,tp,0,00_mundhoehlenkarzinom_0002.tsv,1
1,Bei chronischem Tabakabusus oder Alkoholabusus...,Bei chronischem Tabakabusus oder Alkoholabusus...,Bei chronischem Tabak- oder Alkoholabusus ist ...,tp,1,00_mundhoehlenkarzinom_0002.tsv,2
2,Als kurativ intendierte therapeutische Optione...,Als kurativ intendierte therapeutische Optione...,Als kurativ intendierte therapeutische Optione...,tp,40,00_mundhoehlenkarzinom_0098.tsv,2
3,"Patienten mit einem unheilbaren Tumorleiden, j...","Patienten mit einem unheilbaren Tumorleiden, j...","Patienten mit einem unheilbaren Tumorleiden, j...",tp,44,00_mundhoehlenkarzinom_0103.tsv,1
4,"Patienten mit einem unheilbaren Tumorleiden, j...","Patienten mit einem unheilbaren Tumorleiden, j...","Patienten mit einem unheilbaren Tumorleiden, j...",tp,47,00_mundhoehlenkarzinom_0115.tsv,4
...,...,...,...,...,...,...,...
1154,Dabei war der Anteil älterer Patient * innen u...,Dabei war der Anteil älterer Patient * innen u...,Dabei war der Anteil älterer Patient * innen u...,tn,3835,24_analkarzinom_0178.tsv,44
1155,"Ein neuer RCT (Update-Recherche 2017), dessen ...","Ein neuer RCT (Update-Recherche 2017), dessen ...","Ein neuer RCT (Update-Recherche 2017), dessen ...",tn,3840,22_prostatakarzinom_0199.tsv,46
1156,"- Clindamycin führt, völlig unabhängig von ein...","- Clindamycin führt, völlig unabhängig von ein...","- Clindamycin führt, völlig unabhängig von ein...",tn,3843,23_peniskarzinom_0158.tsv,10
1157,"Für HIV-positive Patienten hat sich gezeigt, d...","Für HIV-positive Patienten hat sich gezeigt, d...","Für HIV-positive Patienten hat sich gezeigt, d...",tn,3844,24_analkarzinom_0163.tsv,10


In [26]:
%%time
scores = get_scores(errors_test, "test")
scores

CPU times: user 1min 25s, sys: 32.1 ms, total: 1min 25s
Wall time: 1min 26s


{'test/exact_match': 0.905090595340811,
 'test/gleu': 0.9778028196418292,
 'test/edit_distance_rel': 0.950224476907634}

In [19]:
from notebook_util import show_errors

In [20]:
show_errors(errors_test[errors_test.error_type == 'insert'])

0;02_kolorektales-karzinom_0330.tsv;17

__Input:__

In die NSABP-Studie C-07 wurden 2407 Patienten im Stadium II (28,6%) oder im Stadium III eingeschlossen und erhielten entweder das Roswell-Park-Schema mit wöchentlicher 5-FU/FS Bolusgabe (3 Zyklen à jeweils 8 Wochen) oder das gleiche 5-FU/FS-Schema mit Oxaliplatin 85 mg/m2 in Woche 1, 3 und 5 im achtwöchentlichen Rhythmus (FLOX-Schema).

__Error type:__ insert

1;03_lungenkarzinom_0420.tsv;46

__Input:__

In zwei japanischen Studien wurden Patienten aufgrund nachgewiesener aktivierender EGFR Exon 19 und 21 Mutationen (PNA-LNA PCR clamp Methode) eingeschlossen:

__Error type:__ insert

2;03_lungenkarzinom_0420.tsv;168

__Input:__

Diese Gruppe wies unter Afatinib ORR (77,1%) -, PFS (10,7 Monate)- und OS (19,4 Monate)-Daten ähnlich wie bei „common mutations“ auf.

__Error type:__ insert

3;05_zervixkarzinom_0370.tsv;9

__Input:__

Im späteren Verlauf kann es zu Belastungen durch Stomaprolaps, Stomaretraktion, -stenose und parastomale Hernien kommen.

__Error type:__ insert

4;07_malignes-melanom_0185.tsv;12

__Input:__

Neuere Studien zeigen eine Überlegenheit hinsichtlich des Ansprechens, des progressionsfreien und Gesamtüberlebens von BRAF- und MEK-Inhibitoren gegenüber einer Therapie mit DTIC bei Patienten mit BRAFV600E/K Mutation [REF], [REF], [REF].

__Error type:__ insert

5;07_malignes-melanom_0185.tsv;13

__Input:__

Zudem konnten neuere Studiendaten belegen, dass PD1-Antikörper bei Patienten mit BRAF-Wildtype ebenfalls zu einer Verbesserung des progressionsfreien und Gesamtüberlebens führen [REF].

__Error type:__ insert

6;08_aktinische-keratose-und-plattenepithelkarzinom-der-haut_0016.tsv;7

__Input:__

Im Grunde genommen handelt es sich um eine zwar gängige, aber im Kern unpräzise Begriffsbezeichnung, da Veränderungen, die mit dieser Diagnose bezeichnet werden, weder obligat eine aktinische (solare, durch Sonnenlicht induzierte) Genese haben müssen (z.B. Arsen- oder PUVA-Keratosen) noch obligat mit einer klinisch oder histologisch manifesten Keratose (klinisch keratotische Schuppe, histomorphologisch Ortho- und / oder Hyperparakeratose) einhergehen muss.

__Error type:__ insert

7;09_mammakarzinom_0048.tsv;5

__Input:__

Obwohl sich seit etwa 20 Jahren weltweit verschiedene Arbeitsgruppen mit der Frage beschäftigen, wie Informationen zu Gesundheits- und Krankheitsthemen so präsentiert werden können, dass sie als Grundlage für informierte Entscheidungen dienen können [REF], gelingt die Umsetzung in die Praxis und in die konkreten Gesundheitsinformationen derzeit kaum [REF].

__Error type:__ insert

8;12_nierenzellkarzinom_0181.tsv;10

__Input:__

Dies war auf die höhere Rate von Lebertoxizität (Erhöhung der Transaminasenspiegel Grad 3 oder 4; 6 vs. 1%) zurückzuführen.

__Error type:__ insert

9;12_nierenzellkarzinom_0220.tsv;15

__Input:__

Während R0-resezierte Patienten ein 5-Jahres-OS von 41-45 % aufweisen, ist bei R1-oder R2-resezierten Patienten das 5-Jahres-OS 0-22 %.

__Error type:__ insert

10;15_endometriumkarzinom_0234.tsv;2

__Input:__

Anlageträger dieser ETS haben auch ein erhöhtes Risiko für andere syndromspezifische intestinale und extraintestinale, gut- und bösartige Tumoren.

__Error type:__ insert

11;16_maligne-ovarialtumoren_0031.tsv;5

__Input:__

Der Einfluss modifizierender Gene auf die Penetranz bei BRCA-Mutationsträgerinnen wurde durch mehrere Publikationen des internationalen CIMBA-Konsortiums (Consortium of Investigators on Modifiers of BRCA1/2) mittlerweile bestätigt [REF],, [REF].

__Error type:__ insert

12;17_chronisch-lymphatische-leukaemie-cll_0047.tsv;14

__Input:__

Bei HIV-/HCV-Positivität sollte das weitere diagnostische und therapeutische Management an einem spezialisierten Zentrum in interdisziplinärer Zusammenarbeit mit Infektio- und/oder Gastroenterologen erfolgen.

__Error type:__ insert

13;17_chronisch-lymphatische-leukaemie-cll_0055.tsv;1

__Input:__

Insbesondere bei Verdacht auf klinisch relevante CLL-Manifestationen, die aufgrund ihrer Lokalisation oder der Konstitution des Patienten der klinischen Untersuchung nicht zugänglich sind (z. B. eine mediastinale oder abdominelle Lymphadenopathie), kann eine ergänzende bildgebende Diagnostik mittels Röntgen-Thorax oder einer computer- oder magnetresonanztomographischen Bildgebung erfolgen.

__Error type:__ insert

14;17_chronisch-lymphatische-leukaemie-cll_0159.tsv;12

__Input:__

d) Sowohl bei soliden als auch hämatologischen Malignomen liefert das GA prognostische bzw. prädiktive Information zu verschiedenen klinischen Endpunkten mit potentieller Relevanz für Therapieentscheidungen; insbesondere wird die Bezifferung des Mortalitäts- und Toxizitätsrisikos sowie des Risikos von vorzeitigen Therapieabbrüchen erleichtert [REF], [REF], [REF], [REF], [REF], [REF], [REF].

__Error type:__ insert

15;18_hodgkin-lymphom_0148.tsv;50

__Input:__

Brentuximab Vedotin ist seit August 2011 (FDA) und seit Oktober 2012 in Europa für Patienten mit rezidiviertem oder refraktärem HL nach einer autologen Stammzelltransplantation zugelassen, ebenso für HL Patienten die sich nicht für eine Poly- oder Hochdosischemotherapie qualifizieren und mindestens zwei vorherige Therapie erhalten haben.

__Error type:__ insert

16;19_follikulaeres-lymphom_0288.tsv;3

__Input:__

Geriatrische Syndrome (z.B. Delir, Demenz, Depression, Inappetenz, Sarkopenie, Frailty, Stürze, Immobilität) können dabei unabhängig von der Lymphomerkrankung bestehen oder durch die Lymphomerkrankung und -therapie induziert bzw. aggraviert werden.

__Error type:__ insert

17;20_harnblasenkarzinom_0086.tsv;43

__Input:__

Die Evidenz besteht überwiegend aus LoE 3 und 4 Berichten.

__Error type:__ insert

18;21_hodentumoren_0113.tsv;6

__Input:__

Patienten mit nichtseminomatösem KZT und einem histologisch und/oder über eine Serumtumormarkererhöhung gesicherten Stadium IIA/B fallen vorwiegend in die gute Prognosegruppe und werden mit drei Zyklen PEB behandelt [REF] [REF] [REF].

__Error type:__ insert

19;21_hodentumoren_0268.tsv;1

__Input:__

Die MRT Abdomen/Becken sollte die CT Abdomen/Becken im Rahmen der Nachsorge von Patienten mit KZT ersetzen, wenn diese an Zentren mit ausgewiesener Erfahrung durchgeführt wird.

__Error type:__ insert

20;23_peniskarzinom_0101.tsv;1

__Input:__

Weder bildgebende Verfahren wie Sonografie, Computer- oder Magnetresonanztomografie noch die Positronenemissionstomografie oder deren Kombination können bislang zuverlässig klinisch okkulte Metastasen in Peniskarzinom- Patienten mit klinisch unauffälligen/nicht palpablen Leistenlymphknoten ausschließen [REF]; [REF]; [REF].

__Error type:__ insert

21;26_palliativmedizin_0097.tsv;38

__Input:__

Dennoch führte die Intervention zu einer geringeren Anzahl an Hausarzt- und Notfall-Konsultationen (p =.03 bzw. p =.04).

__Error type:__ insert

22;26_palliativmedizin_0607.tsv;5

__Input:__

Im Verlauf seiner Erkrankung kann der Patient den Todeswunsch mit unterschiedlicher Intensität oder Ausprägung erleben – je nach Handlungsdruck als flüchtige oder sich aufdrängende Gedanken, Suizidabsicht, -planung bis hin zur Durchführung einer suizidalen Handlung.

__Error type:__ insert

23;26_palliativmedizin_0664.tsv;33

__Input:__

Als nicht-pharmakologische Maßnahmen werden mit unklarer Evidenz Seiten- oder Oberkörperhochlagerung empfohlen.

__Error type:__ insert

24;28_komplementaermedizin_0287.tsv;1

__Input:__

Tumoransprechen, - progression und -rezidive

__Error type:__ insert

# Some examples

In [21]:
def run_pipeline(examples):
    for e, p in zip(examples, pipeline(examples)):
        print(e, '-->', p['generated_text'])

In [22]:
# Forward ellipses
run_pipeline(['Krebs-Vorsorge / -Früherkennung', 'HPV31, 33, 45 und 51', 'Vitamin C, E und A1'])

Krebs-Vorsorge / -Früherkennung --> Krebs-Vorsorge / Krebs-Früherkennung
HPV31, 33, 45 und 51 --> HPV31, HPV33 und HPV51
Vitamin C, E und A1 --> Vitamin C, Vitamin E und Vitamin A1


In [23]:
# Backward ellipses
run_pipeline(['Chemo- und Strahlentherapie', 'BRAF- und MEK-Inhibitor', 'zielgerichtete und Immuntherapien'])

Chemo- und Strahlentherapie --> Chemotherapie und Strahlentherapie
BRAF- und MEK-Inhibitor --> BRAF-Inhibitor und MEK-Inhibitor
zielgerichtete und Immuntherapien --> zielgerichtete Therapien und Immuntherapien


In [24]:
# Complex ellipses
run_pipeline(['HPV-16- und/oder -18-Positivität', 'BRCA1/2-Mutation', 'Zweitlinien- oder Drittliniensystem- bzw. -chemotherapie'])

HPV-16- und/oder -18-Positivität --> HPV-16-Positivität und/oder HPV-18-Positivität
BRCA1/2-Mutation --> BRCA1-Mutation/BRCA2-Mutation
Zweitlinien- oder Drittliniensystem- bzw. -chemotherapie --> Zweitliniensystemtherapie oder Drittliniensystemtherapie bzw. Drittlinienchemotherapie
