# Sentiment-Analyse auf TAZ Scraped Data

Dieses Notebook demonstriert, wie man mithilfe des vortrainierten multilingualen Sentiment-Analyse-Modells `tabularisai/multilingual-sentiment-analysis` von Hugging Face Artikel- und Kommentartexte aus einer zuvor gescrapten JSON-Datei analysiert.

**Wichtig:** Dieses Notebook dient zu Demonstrationszwecken. Im Rahmen des Kurses werden auch die Limitationen dieser Technik erläutert.

## 1. JSON-Datei Upload

Stelle sicher, dass du die Datei `taz_scraped_data_demo_2025-04-14.json` in das Arbeitsverzeichnis hochgeladen hast.

In [None]:
# Importiere benötigte Bibliotheken
import json
from transformers import pipeline
import pprint

print('Bibliotheken importiert.')

In [None]:
# Lade die JSON-Daten aus der Datei
json_filename = 'taz_scraped_data_demo_2025-04-14.json'
with open(json_filename, 'r', encoding='utf-8') as f:
    data = json.load(f)

print(f'JSON-Datei "{json_filename}" erfolgreich geladen.')
print(f'Anzahl der Artikel: {len(data)}')

In [None]:
# Initialisiere die Sentiment-Analyse Pipeline
sentiment_pipe = pipeline(
    'text-classification', 
    model='tabularisai/multilingual-sentiment-analysis'
)

print('Sentiment-Analyse Pipeline initialisiert.')

In [None]:
def analyze_text(text):
    """Analysiere den Sentiment eines Textes mithilfe der Pipeline."""
    try:
        result = sentiment_pipe(text)[0]
    except Exception as e:
        result = {'label': 'Error', 'score': None}
    return result

def print_sentiment(title, sentiment_result):
    # Gibt den Titel und das Ergebnis formatiert aus
    print(f"{title}: {sentiment_result['label']} (Score: {sentiment_result['score']:.2f})")

# Hinweis: Kürzere Texte können in der Analyse oft genauer sein.

In [None]:
# Iteriere über alle Artikel und führe die Sentiment-Analyse für Artikeltext sowie Kommentare aus
for idx, article in enumerate(data):
    print(f"\n--- Artikel {idx+1} ---")
    
    # Sentiment-Analyse des Artikeltextes
    article_text = article.get('Article Text', '')
    if article_text:
        article_sentiment = analyze_text(article_text)
        print(f"Artikel-Sentiment: {article_sentiment['label']} (Score: {article_sentiment['score']:.2f})")
    else:
        print('Kein Artikeltext vorhanden.')
    
    # Sentiment-Analyse der Kommentare, falls vorhanden
    comments = article.get('Comments', [])
    if comments:
        print('Kommentare:')
        for com_idx, comment in enumerate(comments):
            comment_text = comment.get('Comment text', '')
            if comment_text:
                comment_sentiment = analyze_text(comment_text)
                print(f"  Kommentar {com_idx+1}: {comment_sentiment['label']} (Score: {comment_sentiment['score']:.2f})")
            else:
                print(f"  Kommentar {com_idx+1}: Kein Text vorhanden.")
    else:
        print('Keine Kommentare vorhanden.')

print('\nSentiment-Analyse abgeschlossen.')

## Fazit

In diesem Notebook haben wir gezeigt, wie man:

- Eine JSON-Datei, die Artikel und ihre Kommentare enthält, einliest,
- und wie man mithilfe eines vortrainierten, multilingualen Sentiment-Analysemodells von Hugging Face die Stimmung der Texte klassifiziert.

**Hinweis:** Dies ist ein einfacher Demonstrationscode, der die grundlegende Technik vorführt. In einem echten Einsatzszenario sind weitere Vorverarbeitungsschritte und Fehlerbehandlungen ratsam.