
# Configuration

In [1]:
from definitions import poem_1, poem_2
import os
from utils import settings, gemini, ollama3, gpt4, opus, init_gemini

%load_ext jupyter_ai_magics

No OpenAI key found
No Google key found
No Anthropic key found.


In [None]:
#settings
temperature = 0.8
system_prompt = "You are an expert in German literature and you are addressing other experts in German literature. You answer the questions truthfully and short."

settings(system_prompt, temperature)


In [None]:
#defining aliases
init_gemini()

model =  ollama3()
%ai register llama3big model

model =  gpt4()
%ai register gpt4o model

model = opus()
%ai register opus model 

## Unsere Toten

Experiment: Context windows

The context window determines the number of tokens the model can incorporate to predict the subsequent token. 

Munkhdalai et al. (2024): "An effective memory system is crucial not just for comprehending long contexts with LLMs, but also for reasoning, planning, continual adaptation for fresh knowledge, and even for learning how to learn."

Challenges:  “needle-in-a-haystack” (Ivgi et al. 2023)

Context windows for our models: 
Llama3:70b = 8.2k
Gemini: 2M, 3000pages
Opus Claud: 200k
GPT4o: 128k

(Kosten! evtl. nur Llama 3:70b und GPt4o)

Could we force the LLM to say "this is the wrong context information"? Experiments with an unknown poem "Unsere Toten". 

Of particual interests: 
- studying how large and small context windows change the output
- studying how LLM deal with wrong context information
- determining the correct context information

Prompt design: 
- context files: large Wikipedia entries World War I (64 Seiten), World War II (83 Seiten, 26.300 Wörter)

In [3]:
## Wrong contexts ("Horizontverschmelzung"), Beispiel "Unsere Toten"

prompt = f"""1. Read the following context information https://de.wikipedia.org/wiki/Erster_Weltkrieg and https://de.wikipedia.org/wiki/Zweiter_Weltkrieg, 2. Extract three key words, 3. Classify which context is more likely a) world war I, b) world war II. 'Von Westen und Osten, von Nord und Süd schleppen sich nächtens viele Füße müd, Füße, vom Wandern 
wund und zerfetzt, langsam bedächtig zur Erde gesetzt, müh'n sich im zitternden Mondenschein rastlos 
tief nach Deutschland hinein. Und wer mit lauschendem Ohr noch wacht hört sie in jedweder werdenden 
Nacht, hört dies Schlurfen so müde und schwer, hört eine Klage voll wilder Begehr, eine Klage 
schmerzzerfressen: nur nicht vergessen! Uns nicht vergessen!' Does this poem belong this context at all?"""
print (prompt)

1. Read the following context information , 2. Extract three key words, 3. Determine which contextual information is most likely for the interpretation of the poem features then interpret the following poem: 'Von Westen und Osten, von Nord und Süd schleppen sich nächtens viele Füße müd, Füße, vom Wandern 
wund und zerfetzt, langsam bedächtig zur Erde gesetzt, müh'n sich im zitternden Mondenschein rastlos 
tief nach Deutschland hinein. Und wer mit lauschendem Ohr noch wacht hört sie in jedweder werdenden 
Nacht, hört dies Schlurfen so müde und schwer, hört eine Klage voll wilder Begehr, eine Klage 
schmerzzerfressen: nur nicht vergessen! Uns nicht vergessen!' Does this poem belong this context at all?


### GPT4o

In [None]:
%%ai gpt4o
{prompt}

### Opus

In [None]:
%%ai opus
{prompt}

### Gemini 1.5

In [None]:
gemini(prompt)

### Llama3:70b

In [None]:
%%ai llama3big
{prompt}

## Literary theories

Experiment: Representation of Literary and Cultural Theories in LLMs

In literary studies, 'interpretation' is understood as the analysis of a literary text, particularly with regard to the (figurative) meaning of the text as a whole. The determination and identification of this overall meaning is guided by text-centred, author-centred, reader-centred and context-centred theories of literature and interpretation.

Question: To what extend or which literary theory approach (if any) do language models reflect?

Vergleichende Forschungsansätze: Ziems et al. 2024, Santurkar et al.  2023

Of particular interest: 
- Representativeness: How aligned are the LLM interpretation with general literary approaches (hermeneutic, poststructuralism, feminst)?
- Steerability: Can an LM emulate the interpretive hypothesis of a literary approach when appropriately prompted? For which approaches does this work particularly well?
- Consistency: Are the interpretation expressed by LLMs consistent across topics?

Hilfsmittel: Dictionaries von drei theoretischen Einführungswerken (Selden, Widdowson, und Brooker 2006; Rivkin und Ryan 2007; Castle 2008)von den literatur- und kulturwissenschaftlichen Theorien (Kleymann et al. 2022)

In [None]:
prompt = ""Given the poem:
'Von Westen und Osten, von Nord und Süd schleppen sich nächtens viele Füße müd, Füße, vom Wandern wund und zerfetzt, langsam bedächtig zur Erde gesetzt, \
müh'n sich im zitternden Mondenschein rastlos tief nach Deutschland hinein. Und wer mit lauschendem Ohr noch wacht hört sie in jedweder werdenden Nacht,\
hört dies Schlurfen so müde und schwer, hört eine Klage voll wilder Begehr, eine Klage schmerzzerfressen: nur nicht vergessen! Uns nicht vergessen!'
1. Provide an interpretation and interpretation hypotheses of the poem (150-200 words) from three distinct literary theoretical perspectives: Hermeneutic, Poststructuralist, \
and Feminist. 2. After generating the two interpretations, rank them by their plausibility in effectively representing each theoretical framework. Discuss which theory is better emulated by the LLM and explain the reasons for this ranking, considering key theoretical assumptions and the specific aspects of the poem that support each interpretation."

In [None]:
%%ai opus
{prompt}

In [None]:
gemini(prompt)

In [None]:
%%ai llama3big
{prompt}

In [None]:
%%ai gpt4o
{prompt}