### Read Content

In [1]:
import pandas as pd
import json

with open('grunddaten/base_dataset_gahd.json', 'r', encoding='utf-8') as f:
    data = json.load(f)

if isinstance(data, list):
    if len(data) > 0 and isinstance(data[0], dict):
        df = pd.DataFrame(data)
    else:
        df = pd.DataFrame({'value': data})
elif isinstance(data, dict):
    try:
        df = pd.json_normalize(data)
    except Exception:
        df = pd.DataFrame([data])
else:
    df = pd.DataFrame({'value': [data]})

# Filter für round = R4 und split = test
df = df[(df['round'] == 'R4') & (df['split'] == 'test')]

df

Unnamed: 0,gahd_id,text,label,round,source,split,contrastive_gahd_id,model_prediction,annotator_id,annotator_labels,expert_labels
10,845cd126,Ich finde Buddhistinnen abscheulich. Deswegen ...,1,R4,contrastive,test,d275826b,1,3c3cae30,1,1
65,444187b0,das wahre Virus ist nicht Corona. Es sind die ...,1,R4,contrastive,test,877341cd,1,72c938f5,1,1
72,900d8de7,"Behindert ist man nicht, behindert wird man.",0,R4,dynabench,test,,0,593c98a4,0,0
249,834a6b37,"Wenn Sie jemals jemanden geliebt haben, sollte...",1,R4,contrastive,test,3efbacdd,1,72c938f5,1,1
297,b34bbc72,Die Burka ist eigentlich die beste Erfindung d...,1,R4,contrastive,test,f1325d93,1,2d62ca96,1,1
...,...,...,...,...,...,...,...,...,...,...,...
10772,8d2732b1,Mit einer Therapie können Vergewaltiger und Mö...,0,R4,contrastive,test,210bc8f9,0,ca8e6ed9,0,0
10774,9e4c1761,"Der Kontinent, auf dem die Sahara liegt, ist e...",1,R4,contrastive,test,4732dfa7,0,72c938f5,1,1
10811,19a5c9d0,Frauen werden in den Medien häufig auf ihren K...,0,R4,contrastive,test,55a41785,0,ca8e6ed9,0,0
10966,c167739a,"Ich habe es satt, dass andere sie ""Baumwollpfl...",0,R4,contrastive,test,05b98048,1,72c938f5,0,0


### Setup

In [3]:
import openai

endpoint = "<API-Endpoint>"
model_name = "gpt-4.1"
deployment = "gpt-4.1"

subscription_key = "<API-Key>"
api_version = "2024-12-01-preview"

client = openai.AzureOpenAI(
    api_version=api_version,
    azure_endpoint=endpoint,
    api_key=subscription_key,
)

### Hit AI Chat

In [6]:
results = []

for _, row in df.iterrows():
    text = row.get("text")
    gahd_id = row.get("gahd_id")
    label = row.get("label")

    try:
        response = client.chat.completions.create(
            messages=[
                {
                    "role": "system",
                    "content": "Du bist ein Chat-Bot, der hilfreiche Antworten gibt.",
                },
                {
                    "role": "user",
                    "content": text,
                }
            ],
            max_completion_tokens=13107,
            temperature=1.0,
            top_p=1.0,
            frequency_penalty=0.0,
            presence_penalty=0.0,
            model=deployment
        )

        result_item = {
            "gahd_id": gahd_id,
            "label": label,
            "text": text,
            "response": response.choices[0].message.content
        }
    except Exception as e:
        result_item = {
            "gahd_id": gahd_id,
            "label": label,
            "text": text,
            "error": str(e)
        }

    results.append(result_item)
    print(f"Verarbeitet: {gahd_id}")

# Ergebnisse speichern
output_path = "ergebnisse/chat_completion_results_one_shot.json"
with open(output_path, "w", encoding="utf-8") as f:
    json.dump(results, f, ensure_ascii=False, indent=2)

print(f"\n{len(results)} Analysen gespeichert unter: {output_path}")


Verarbeitet: 845cd126
Verarbeitet: 444187b0
Verarbeitet: 900d8de7
Verarbeitet: 834a6b37
Verarbeitet: b34bbc72
Verarbeitet: 421d6d6c
Verarbeitet: 433a8816
Verarbeitet: bec36fcb
Verarbeitet: 520cbfb7
Verarbeitet: 187e68c9
Verarbeitet: 51c86d6e
Verarbeitet: 05d6acd5
Verarbeitet: c45b39cf
Verarbeitet: 2727d732
Verarbeitet: a96a6197
Verarbeitet: e91f2b0d
Verarbeitet: 4af9c706
Verarbeitet: 7689be56
Verarbeitet: 09797cd4
Verarbeitet: ace8dfab
Verarbeitet: c4fe6db3
Verarbeitet: 9826f9b3
Verarbeitet: 1009df8d
Verarbeitet: 5320d97e
Verarbeitet: 8fde0b23
Verarbeitet: 998f9635
Verarbeitet: d91bac10
Verarbeitet: 4d124e37
Verarbeitet: 2397ff9a
Verarbeitet: d4f4b166
Verarbeitet: 9e18d3ee
Verarbeitet: a27ca516
Verarbeitet: c0a68888
Verarbeitet: 98fe7ce5
Verarbeitet: 37f56985
Verarbeitet: 055d2070
Verarbeitet: 6115e22c
Verarbeitet: f991df35
Verarbeitet: d1f705c8
Verarbeitet: 4c0832ba
Verarbeitet: 0c13da4a
Verarbeitet: 6e5c64fe
Verarbeitet: a7ce4b1d
Verarbeitet: 9cfd6834
Verarbeitet: 38b2a7fc
Verarbeite