In [1]:
prompt = """
  Je bent een expert in het analyseren van politieke teksten. Analyseer de onderstaande tekst op genetische misvattingen.

  ZEER BELANGRIJK - OUTPUT REGELS:
  - Geef PRECIES ÉÉN JSON object terug
  - GEEN extra tekst voor of na de JSON
  - GEEN code markers (```)
  - GEEN herhalingen van dezelfde analyse
  - GEEN uitleg buiten de JSON

  
  INHOUDELIJKE REGELS:
  - Rapporteer ALLEEN de meest duidelijke gevallen (confidence ≥ 0.7)
  - Rapporteer GEEN zwakke of twijfelachtige gevallen
  - Focus op UNIEKE gevallen (niet dezelfde uitspraak meerdere keren)
  - Maximaal 5 gevallen per analyse

  Definities van genetische misvattingen:
  De genetische misvatting is een drogreden van irrelevantie waarbij argumenten of informatie worden afgewezen of gevalideerd op basis van hun bron van herkomst in plaats van hun inhoud. Met andere woorden, een bewering wordt genegeerd of geloofwaardig gemaakt op basis van de bron in plaats van de bewering zelf.

  Vorbeelden van genetische misvatting: 
  - "MISSING"    
  - "MISSING"   

  Wat is GEEN genetische misvatting:
  - Insert name for common type of misclassifed fallacy
    Vorbeeld: "MISSING"    
  - Insert name for common type of misclassifed fallacy
    Vorbeeld: "MISSING"   

  Confidence score richtlijnen:
  - 0.9-1.0: Onmiskenbare delegitimatie met duidelijk bewijs
  - 0.7-0.9: Duidelijke delegitimatie met goede context
  - <0.7: NIET RAPPORTEREN

  Retourneer het volgende JSON-formaat:
  {{
    "gevonden_misvatting": [
      {{
        "citaat": "string (exact citaat)",
        "toelichting": "string (korte uitleg)",
        "confidence": "float (alleen ≥ 0.7)",
        "context": "string (relevante context)"
      }}
    ],
    "samenvatting": {{
      "aantal_gevallen": "integer",
      "gemiddelde_confidence": "float",
      "hoogste_confidence": "float",
      "laagste_confidence": "float"
    }}
  }}

  Als er geen misvatting met hoge confidence wordt gevonden:
  {{
    "gevonden_misvatting": [],
    "samenvatting": {{
      "aantal_gevallen": 0,
      "gemiddelde_confidence": 0.0,
      "hoogste_confidence": 0.0,
      "laagste_confidence": 0.0
    }}
  }}

  Te analyseren tekst:
  {text} """

In [3]:
import pandas as pd
from ollama import chat
import yaml
from IPython.display import display, JSON
import json
import os
import time


# Read the CSV file and create sample
df = pd.read_csv('speeches_new.csv')
sample_df = df.sample(n=5, random_state=42)
sample_df["result"] = ""

# Process each row
model = "deepseek-r1:8b"
for i in range(len(sample_df)):
    text = sample_df["text"].iloc[i]
    print("Input Text:")
    print("-" * 80)
    print(text)
    print("-" * 80)
    
    formatted_prompt = prompt.format(text=text)
    messages = [
        {
            "role": "user",
            "content": formatted_prompt
        }
    ]

    response = chat(model, messages=messages)['message']['content']
    
    # Parse and display JSON in a pretty format
    try:
        json_response = json.loads(response)
        print("\nAnalysis Results:")
        print("-" * 80)
        display(JSON(json_response))
    except json.JSONDecodeError:
        print("\nRaw Response:")
        print("-" * 80)
        print(response)
        
    sample_df["result"].iloc[i] = response
    time.sleep(1)
    print("\n" + "="*80 + "\n")  # Separator between iterations

# Display final results in a cleaner format
for i in range(len(sample_df)):
    print(f"\nAnalysis {i+1}:")
    print("-" * 80)
    print(f"Text: {sample_df['text'].iloc[i][:400]}...")  # Show first 400 chars
    print("\nResults:")
    try:
        result = json.loads(sample_df['result'].iloc[i])
        display(JSON(result))
    except:
        print(sample_df['result'].iloc[i])
    print("=" * 80)

Input Text:
--------------------------------------------------------------------------------
Even checken. Ik had ook een vraag gesteld over de fraude. Maar het ging er zojuist al over en ik heb de minister die niet horen beantwoorden. Zij zei wel: ik kom in de tweede termijn terug op de vraag over de NVWA. Ik vroeg me dus af of mijn vraag nog moeten komen. Want voor de Partij voor de Dieren is een belangrijke component van de impact van dit wetsvoorstel wel dat we de fraude zien aankomen.
--------------------------------------------------------------------------------

Raw Response:
--------------------------------------------------------------------------------
<think>
Alright, I need to analyze the provided text for genetic fallacies. Let me start by understanding what a genetic fallacy is. From the definition given, it's when an argument or information is dismissed or validated based on its source rather than its content. 

Looking at the text, I see the speaker mentions checking s

You are setting values through chained assignment. Currently this works in certain cases, but when using Copy-on-Write (which will become the default behaviour in pandas 3.0) this will never work to update the original DataFrame or Series, because the intermediate object on which we are setting values will behave as a copy.
A typical example is when you are setting values in a column of a DataFrame, like:

df["col"][row_indexer] = value

Use `df.loc[row_indexer, "col"] = values` instead, to perform the assignment in a single step and ensure this keeps updating the original `df`.

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy

  sample_df["result"].iloc[i] = response




Input Text:
--------------------------------------------------------------------------------
Twee zinnen nog, voorzitter. Evalueer ook of de effecten van het beleid goed geweest zijn in de voorgaande staat van de demografie. Of kunnen we daar wat van leren? Zou deze regering het maken van zo'n eerste staat van de demografie ter hand willen nemen?  Dank u wel, voorzitter.
--------------------------------------------------------------------------------

Raw Response:
--------------------------------------------------------------------------------
<think>
Alright, I need to analyze the given text for genetic fallacies. First, I'll read through the text carefully.

The text is: "Twee zinnen nog, voorzitter. Evalueer ook of de effecten van het beleid goed geweest zijn in de voorgaande staat van de demografie. Of kunnen we daar wat van leren? Zou deze regering het maken van zo'n eerste staat van de demografie ter hand willen nemen? Dank u wel, voorzitter."

Breaking it down, the first sent

You are setting values through chained assignment. Currently this works in certain cases, but when using Copy-on-Write (which will become the default behaviour in pandas 3.0) this will never work to update the original DataFrame or Series, because the intermediate object on which we are setting values will behave as a copy.
A typical example is when you are setting values in a column of a DataFrame, like:

df["col"][row_indexer] = value

Use `df.loc[row_indexer, "col"] = values` instead, to perform the assignment in a single step and ensure this keeps updating the original `df`.

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy

  sample_df["result"].iloc[i] = response




Input Text:
--------------------------------------------------------------------------------
Keer op keer een restaurant dat, of een winkel die aangevallen is. Als er ergens media-aandacht naartoe gaat, is dat helaas naar die ... Ik zal zijn naam niet uitspreken; naar Pegida. Keer op keer weet hij de media te bereiken en het enorm op te blazen. Keer op keer hebben we hier daarover het debat gevoerd. Keer op keer is de voeding islamhaat, moslimhaat. Ik noem video's die hij uitzendt, korans die hij verbrandt.
--------------------------------------------------------------------------------

Raw Response:
--------------------------------------------------------------------------------
<think>
Alright, I need to analyze the given text for genetic fallacies. Let me start by understanding what a genetic fallacy is. From the definition provided, it's when an argument or information is dismissed based on its source rather than its content. Examples include "MISLEADING" and "MISSING." 

Lookin

You are setting values through chained assignment. Currently this works in certain cases, but when using Copy-on-Write (which will become the default behaviour in pandas 3.0) this will never work to update the original DataFrame or Series, because the intermediate object on which we are setting values will behave as a copy.
A typical example is when you are setting values in a column of a DataFrame, like:

df["col"][row_indexer] = value

Use `df.loc[row_indexer, "col"] = values` instead, to perform the assignment in a single step and ensure this keeps updating the original `df`.

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy

  sample_df["result"].iloc[i] = response




Input Text:
--------------------------------------------------------------------------------
We hebben hier twee mensen van dezelfde partij gezien.
--------------------------------------------------------------------------------

Raw Response:
--------------------------------------------------------------------------------
<think>
Alright, I need to analyze the given political text for genetic fallacies. The text is: "We have seen two people from the same party." 

First, I'll break down what this sentence means. It seems like they're pointing out that both individuals belong to the same political group. Now, looking at the definition of a genetic fallacy, it's about using the source of information rather than its content. So, if someone dismisses an argument because the person making it is from a specific group, that's a genetic fallacy.

In this context, does the statement use the party affiliation as a reason to disregard the observation? It doesn't explicitly say to dismiss the o

You are setting values through chained assignment. Currently this works in certain cases, but when using Copy-on-Write (which will become the default behaviour in pandas 3.0) this will never work to update the original DataFrame or Series, because the intermediate object on which we are setting values will behave as a copy.
A typical example is when you are setting values in a column of a DataFrame, like:

df["col"][row_indexer] = value

Use `df.loc[row_indexer, "col"] = values` instead, to perform the assignment in a single step and ensure this keeps updating the original `df`.

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy

  sample_df["result"].iloc[i] = response




Input Text:
--------------------------------------------------------------------------------
Dat was een mooi bruggetje. Ik vraag me namelijk het volgende af. Ik hoor de VVD zeggen dat ze natuur belangrijk vindt en dat ze eindelijk na al die jaren dat ze in de regering heeft gezeten toch de natuurdoelen wil gaan halen. Dan vraag ik me af hoe serieus de heer Van Campen dat meent. In het coalitieakkoord is namelijk afgesproken dat er weer 130 kilometer per uur mag worden gereden, terwijl zijn eigen demissionaire minister zegt dat daar helemaal geen ruimte voor is als het gaat om de natuur.
--------------------------------------------------------------------------------

Raw Response:
--------------------------------------------------------------------------------
<think>
Alright, I need to analyze the given text for genetic fallacies. Let me first understand what a genetic fallacy is. From the definition, it's when an argument is dismissed or validated based on its source rather than i

You are setting values through chained assignment. Currently this works in certain cases, but when using Copy-on-Write (which will become the default behaviour in pandas 3.0) this will never work to update the original DataFrame or Series, because the intermediate object on which we are setting values will behave as a copy.
A typical example is when you are setting values in a column of a DataFrame, like:

df["col"][row_indexer] = value

Use `df.loc[row_indexer, "col"] = values` instead, to perform the assignment in a single step and ensure this keeps updating the original `df`.

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy

  sample_df["result"].iloc[i] = response





Analysis 1:
--------------------------------------------------------------------------------
Text: Even checken. Ik had ook een vraag gesteld over de fraude. Maar het ging er zojuist al over en ik heb de minister die niet horen beantwoorden. Zij zei wel: ik kom in de tweede termijn terug op de vraag over de NVWA. Ik vroeg me dus af of mijn vraag nog moeten komen. Want voor de Partij voor de Dieren is een belangrijke component van de impact van dit wetsvoorstel wel dat we de fraude zien aankomen...

Results:
<think>
Alright, I need to analyze the provided text for genetic fallacies. Let me start by understanding what a genetic fallacy is. From the definition given, it's when an argument or information is dismissed or validated based on its source rather than its content. 

Looking at the text, I see the speaker mentions checking something and asks about fraud related to the NVWA. The key part is where they reference their party's (Partij voor de Dieren) view that the impact of the bi