# PyDipAPI - Content Parser Tutorial

Dieses Notebook demonstriert die Content-Parser Features von PyDipAPI.

## Was Sie lernen werden:
1. **ProtocolParser** - Plenarprotokolle analysieren
2. **DocumentParser** - Drucksachen verarbeiten
3. **PersonParser** - Abgeordneten-Daten extrahieren
4. **ActivityParser** - Aktivit√§ten analysieren
5. **Batch-Parsing** - Performance-Optimierung

In [None]:
import sys
import os
sys.path.insert(0, os.path.abspath('..'))

from pydipapi import DipAnfrage
from pydipapi.parsers import ProtocolParser, DocumentParser, PersonParser, ActivityParser

# API-Schl√ºssel konfigurieren
API_KEY = "HIER_IHREN_API_SCHLUESSEL_EINFUEGEN"
dip = DipAnfrage(api_key=API_KEY)

print("‚úÖ Content Parser Tutorial bereit!")

## ProtocolParser - Plenarprotokolle analysieren

In [None]:
# Plenarprotokoll laden und parsen
print("üìã Teste ProtocolParser...")
try:
    protocols = dip.get_plenarprotokoll(anzahl=1)
    if protocols:
        parser = ProtocolParser()
        parsed = parser.parse(protocols[0])
        print(f"‚úÖ Protokoll geparst: {len(parsed)} Felder")
        print(f"Verf√ºgbare Felder: {list(parsed.keys())}")
    else:
        print("‚ùå Keine Protokolle gefunden")
except Exception as e:
    print(f"‚ùå Fehler: {e}")

## DocumentParser - Drucksachen analysieren

In [None]:
# Drucksachen laden und parsen
print("üìÑ Teste DocumentParser...")
try:
    documents = dip.get_drucksache(anzahl=3)
    if documents:
        parser = DocumentParser()
        
        # Einzelnes Dokument parsen
        parsed_doc = parser.parse(documents[0])
        print(f"‚úÖ Dokument geparst: {len(parsed_doc)} Felder")
        
        # Batch-Parsing
        batch_results = parser.parse_batch(documents)
        print(f"‚úÖ Batch-Parsing: {len(batch_results)} Dokumente")
    else:
        print("‚ùå Keine Dokumente gefunden")
except Exception as e:
    print(f"‚ùå Fehler: {e}")

## PersonParser - Abgeordnete analysieren

In [None]:
# Personen laden und parsen
print("üë• Teste PersonParser...")
try:
    persons = dip.get_person(anzahl=5)
    if persons:
        parser = PersonParser()
        batch_persons = parser.parse_batch(persons)
        
        print(f"‚úÖ {len(batch_persons)} Personen geparst")
        
        # Beispiel-Person anzeigen
        if batch_persons:
            person = batch_persons[0]
            print(f"Beispiel: {person.get('name', 'Unbekannt')}")
            print(f"Fraktion: {person.get('fraktion', 'Unbekannt')}")
    else:
        print("‚ùå Keine Personen gefunden")
except Exception as e:
    print(f"‚ùå Fehler: {e}")

## ActivityParser - Aktivit√§ten analysieren

In [None]:
# Aktivit√§ten laden und parsen
print("üéØ Teste ActivityParser...")
try:
    activities = dip.get_aktivitaet(anzahl=3)
    if activities:
        parser = ActivityParser()
        batch_activities = parser.parse_batch(activities)
        
        print(f"‚úÖ {len(batch_activities)} Aktivit√§ten geparst")
        
        # Aktivit√§ts-Typen analysieren
        from collections import Counter
        types = [a.get('aktivitaetstyp', 'Unbekannt') for a in batch_activities]
        type_counts = Counter(types)
        
        print("üìä Aktivit√§ts-Typen:")
        for activity_type, count in type_counts.most_common():
            print(f"  - {activity_type}: {count}")
    else:
        print("‚ùå Keine Aktivit√§ten gefunden")
except Exception as e:
    print(f"‚ùå Fehler: {e}")

## Zusammenfassung

**Content-Parser erfolgreich getestet!**

### Verf√ºgbare Parser:
- **ProtocolParser**: Plenarprotokolle strukturiert analysieren
- **DocumentParser**: Drucksachen und Dokumente verarbeiten
- **PersonParser**: Abgeordneten-Daten extrahieren
- **ActivityParser**: Aktivit√§ten und Abstimmungen analysieren

**Weiter mit Notebook 5: Async API!**