# PyDipAPI - Grundlagen und erste Schritte

Dieses Notebook zeigt Ihnen die Grundlagen der Verwendung von PyDipAPI, dem Python-Client für die Bundestag API.

## Was Sie lernen werden:
1. API-Schlüssel einrichten
2. Client initialisieren
3. Erste einfache Abfragen durchführen
4. Ergebnisse verstehen und verarbeiten

## Voraussetzungen
- Ein gültiger API-Schlüssel für die Bundestag API
- PyDipAPI installiert (pip install -e . im Projektverzeichnis)

## Schritt 1: Bibliotheken importieren

Zuerst importieren wir die benötigten Bibliotheken:

In [1]:
import sys
import os

# Füge das Projektverzeichnis zum Python-Pfad hinzu
sys.path.insert(0, os.path.abspath('..'))

from pydipapi import DipAnfrage
import json
from datetime import datetime

In [2]:
## Schritt 3: Client initialisieren

# Jetzt initialisieren wir den API-Client mit unserem API-Schlüssel:

In [2]:
# Ihren API-Schlüssel hier einfügen
API_KEY = "HIER_IHREN_API_SCHLUESSEL_EINFUEGEN"

# Überprüfen, ob ein gültiger API-Schlüssel eingegeben wurde
if API_KEY == "HIER_IHREN_API_SCHLUESSEL_EINFUEGEN":
    print("⚠️  BITTE ERSETZEN SIE DEN PLATZHALTER MIT IHREM ECHTEN API-SCHLÜSSEL!")
    print("Den API-Schlüssel erhalten Sie unter: https://dip.bundestag.de/api/")
else:
    print("✅ API-Schlüssel wurde konfiguriert")

✅ API-Schlüssel wurde konfiguriert


In [3]:
# API-Client initialisieren
try:
    dip = DipAnfrage(api_key=API_KEY)
    print("✅ API-Client erfolgreich initialisiert")
    print(f"📍 Basis-URL: {dip.base_url}")
    print(f"⏱️  Rate Limit Delay: {dip.rate_limit_delay}s")
    print(f"💾 Caching aktiviert: {dip.enable_cache}")
except Exception as e:
    print(f"❌ Fehler bei der Initialisierung: {e}")
    print("Bitte stellen Sie sicher, dass Sie einen gültigen API-Schlüssel eingegeben haben.")


✅ API-Client erfolgreich initialisiert
📍 Basis-URL: https://search.dip.bundestag.de/api/v1
⏱️  Rate Limit Delay: 0.1s
💾 Caching aktiviert: True


## Schritt 2: API-Schlüssel konfigurieren

**WICHTIG:** Ersetzen Sie HIER_IHREN_API_SCHLUESSEL_EINFUEGEN mit Ihrem echten API-Schlüssel!

In [7]:
## Schritt 4: Erste API-Abfragen

# Jetzt werden wir verschiedene API-Funktionen testen. Wir beginnen mit einfachen Abfragen:

### 4.1 Personen aus dem Bundestag abrufen


SyntaxError: invalid syntax (1490420396.py, line 3)

In [5]:
# Personen aus dem Bundestag abrufen
print("🏛️ Lade Personen aus dem Bundestag...")

try:
    # Erste 5 Personen abrufen
    persons = dip.get_person(anzahl=5)
    
    print(f"✅ {len(persons)} Personen erfolgreich abgerufen\n")
    
    # Details der ersten 3 Personen anzeigen
    for i, person in enumerate(persons, 1):
        print(f"👤 Person {i}:")
        print(f"   Name: {person.get('nachname', 'N/A')}, {person.get('vorname', 'N/A')}")
        print(f"   ID: {person.get('id', 'N/A')}")
        print(f"   Akademischer Titel: {person.get('akad_titel', 'N/A')}")
        print(f"   Datum: {person.get('datum', 'N/A')}")
        print("")
        
except Exception as e:
    print(f"❌ Fehler beim Abrufen der Personen: {e}")
    print("Mögliche Ursachen:")
    print("- Ungültiger API-Schlüssel")
    print("- Keine Internetverbindung")
    print("- API-Server nicht erreichbar")


🏛️ Lade Personen aus dem Bundestag...
✅ 5 Personen erfolgreich abgerufen

👤 Person 1:
   Name: Rietenberg, Sylvia
   ID: 8088
   Akademischer Titel: N/A
   Datum: 2025-07-10

👤 Person 2:
   Name: Broßart, Victoria
   ID: 7995
   Akademischer Titel: N/A
   Datum: 2025-07-10

👤 Person 3:
   Name: Joswig, Julian
   ID: 7950
   Akademischer Titel: N/A
   Datum: 2025-07-10

👤 Person 4:
   Name: Stein, Sandra
   ID: 7933
   Akademischer Titel: N/A
   Datum: 2025-07-10

👤 Person 5:
   Name: Schönberger, Marlene
   ID: 7408
   Akademischer Titel: N/A
   Datum: 2025-07-10



In [9]:
### 4.2 Aktuelle Aktivitäten abrufen

Als nächstes schauen wir uns die aktuellen Aktivitäten im Bundestag an:


SyntaxError: invalid syntax (3378958267.py, line 3)

In [6]:
# Aktuelle Aktivitäten abrufen
print("📊 Lade aktuelle Aktivitäten...")

try:
    # Erste 3 Aktivitäten abrufen
    activities = dip.get_aktivitaet(anzahl=3)
    
    print(f"✅ {len(activities)} Aktivitäten erfolgreich abgerufen\n")
    
    # Details der Aktivitäten anzeigen
    for i, activity in enumerate(activities, 1):
        print(f"📋 Aktivität {i}:")
        print(f"   Titel: {activity.get('titel', 'N/A')}")
        print(f"   ID: {activity.get('id', 'N/A')}")
        print(f"   Typ: {activity.get('aktivitaetsart', 'N/A')}")
        print(f"   Datum: {activity.get('datum', 'N/A')}")
        print(f"   Aktualisiert: {activity.get('aktualisiert', 'N/A')}")
        print("")
        
except Exception as e:
    print(f"❌ Fehler beim Abrufen der Aktivitäten: {e}")


📊 Lade aktuelle Aktivitäten...
✅ 3 Aktivitäten erfolgreich abgerufen

📋 Aktivität 1:
   Titel: Filiz Polat, MdB, BÜNDNIS 90/DIE GRÜNEN
   ID: 1722230
   Typ: Kleine Anfrage
   Datum: 2025-07-10
   Aktualisiert: 2025-07-10T11:10:15+02:00

📋 Aktivität 2:
   Titel: Lamya Kaddor, MdB, BÜNDNIS 90/DIE GRÜNEN
   ID: 1722229
   Typ: Kleine Anfrage
   Datum: 2025-07-10
   Aktualisiert: 2025-07-10T11:10:15+02:00

📋 Aktivität 3:
   Titel: Marlene Schönberger, MdB, BÜNDNIS 90/DIE GRÜNEN
   ID: 1722228
   Typ: Kleine Anfrage
   Datum: 2025-07-10
   Aktualisiert: 2025-07-10T11:10:15+02:00



In [None]:
### 4.3 Dokumente und Drucksachen

Jetzt schauen wir uns Dokumente und Drucksachen an. Wir können zwischen Metadaten und Volltext wählen:


In [7]:
# Dokumente abrufen (nur Metadaten für bessere Performance)
print("📄 Lade Dokumente (Metadaten)...")

try:
    # Erste 3 Dokumente ohne Volltext abrufen
    documents = dip.get_drucksache(anzahl=3, text=False)
    
    print(f"✅ {len(documents)} Dokumente erfolgreich abgerufen\n")
    
    # Details der Dokumente anzeigen
    for i, doc in enumerate(documents, 1):
        print(f"📝 Dokument {i}:")
        print(f"   Titel: {doc.get('titel', 'N/A')}")
        print(f"   ID: {doc.get('id', 'N/A')}")
        print(f"   Typ: {doc.get('dokumentart', 'N/A')}")
        print(f"   Drucksachennummer: {doc.get('drucksachetyp', 'N/A')}")
        print(f"   Datum: {doc.get('datum', 'N/A')}")
        print(f"   Wahlperiode: {doc.get('wahlperiode', 'N/A')}")
        print("")
        
except Exception as e:
    print(f"❌ Fehler beim Abrufen der Dokumente: {e}")


📄 Lade Dokumente (Metadaten)...
✅ 3 Dokumente erfolgreich abgerufen

📝 Dokument 1:
   Titel: Benennung eines Mitglieds des Kuratoriums des Deutschen Instituts für Menschenrechte
   ID: 280364
   Typ: Drucksache
   Drucksachennummer: Vorschlag
   Datum: 2025-07-10
   Wahlperiode: 21

📝 Dokument 2:
   Titel: auf die Kleine Anfrage
- Drucksache 21/659 -
Rüstungsexporte nach Israel
   ID: 280362
   Typ: Drucksache
   Drucksachennummer: Antwort
   Datum: 2025-07-10
   Wahlperiode: 21

📝 Dokument 3:
   Titel: auf die Kleine Anfrage
- Drucksache 21/704 -
Einschränkungen für kinderreiche Familien bei der Personenbeförderung mit PKW - Möglicher Regelungsbedarf beim Führerscheinrecht
   ID: 280361
   Typ: Drucksache
   Drucksachennummer: Antwort
   Datum: 2025-07-10
   Wahlperiode: 21



In [None]:
## Schritt 5: Erweiterte Funktionen

PyDipAPI bietet viele praktische Convenience-Methoden für häufige Anwendungsfälle:

### 5.1 Dokumentensuche


In [8]:
# Dokumente zu einem bestimmten Thema suchen
print("🔍 Suche nach Dokumenten zum Thema 'Klima'...")

try:
    # Suche nach Dokumenten mit dem Begriff "Klima"
    search_results = dip.search_documents("Klima", anzahl=3)
    
    print(f"✅ {len(search_results)} Dokumente zum Thema 'Klima' gefunden\n")
    
    # Ergebnisse anzeigen
    for i, doc in enumerate(search_results, 1):
        print(f"🔍 Suchergebnis {i}:")
        print(f"   Titel: {doc.get('titel', 'N/A')[:100]}...")
        print(f"   ID: {doc.get('id', 'N/A')}")
        print(f"   Typ: {doc.get('dokumentart', 'N/A')}")
        print(f"   Datum: {doc.get('datum', 'N/A')}")
        print("")
        
except Exception as e:
    print(f"❌ Fehler bei der Suche: {e}")


🔍 Suche nach Dokumenten zum Thema 'Klima'...
✅ 100 Dokumente zum Thema 'Klima' gefunden

🔍 Suchergebnis 1:
   Titel: Benennung eines Mitglieds des Kuratoriums des Deutschen Instituts für Menschenrechte...
   ID: 280364
   Typ: Drucksache
   Datum: 2025-07-10

🔍 Suchergebnis 2:
   Titel: auf die Kleine Anfrage
- Drucksache 21/659 -
Rüstungsexporte nach Israel...
   ID: 280362
   Typ: Drucksache
   Datum: 2025-07-10

🔍 Suchergebnis 3:
   Titel: auf die Kleine Anfrage
- Drucksache 21/704 -
Einschränkungen für kinderreiche Familien bei der Per...
   ID: 280361
   Typ: Drucksache
   Datum: 2025-07-10

🔍 Suchergebnis 4:
   Titel: auf die Kleine Anfrage
- Drucksache 21/540 -
Ausgaben für den Posten der Präsidentin der UN-Genera...
   ID: 280360
   Typ: Drucksache
   Datum: 2025-07-10

🔍 Suchergebnis 5:
   Titel: Arbeitskräftezuwanderung über die sogenannte Westbalkanregelung...
   ID: 280356
   Typ: Drucksache
   Datum: 2025-07-10

🔍 Suchergebnis 6:
   Titel: auf die Kleine Anfrage
- Drucksac

In [None]:
### 5.2 Personensuche

Sie können auch gezielt nach Personen suchen:


In [9]:
# Nach einer bestimmten Person suchen
print("👤 Suche nach Personen mit 'Schmidt' im Namen...")

try:
    # Suche nach Personen mit "Schmidt" im Namen
    persons_search = dip.get_person_by_name("Schmidt", anzahl=3)
    
    print(f"✅ {len(persons_search)} Personen mit 'Schmidt' gefunden\n")
    
    # Ergebnisse anzeigen
    for i, person in enumerate(persons_search, 1):
        print(f"👤 Person {i}:")
        print(f"   Name: {person.get('nachname', 'N/A')}, {person.get('vorname', 'N/A')}")
        print(f"   ID: {person.get('id', 'N/A')}")
        print(f"   Titel: {person.get('akad_titel', 'N/A')}")
        print(f"   Datum: {person.get('datum', 'N/A')}")
        print("")
        
except Exception as e:
    print(f"❌ Fehler bei der Personensuche: {e}")


👤 Suche nach Personen mit 'Schmidt' im Namen...
✅ 3 Personen mit 'Schmidt' gefunden

👤 Person 1:
   Name: Schmidt, Stefan
   ID: 2114
   Titel: N/A
   Datum: 2025-07-10

👤 Person 2:
   Name: Schmidt, Paul
   ID: 8101
   Titel: N/A
   Datum: 2025-07-09

👤 Person 3:
   Name: Schmidt, Jan Wenzel
   ID: 7406
   Titel: N/A
   Datum: 2025-07-09



In [None]:
### 5.3 Aktuelle Aktivitäten (letzte 7 Tage)

Eine sehr nützliche Funktion ist das Abrufen aktueller Aktivitäten:


In [15]:
# Aktuelle Aktivitäten der letzten 7 Tage
print("📅 Lade aktuelle Aktivitäten der letzten 7 Tage...")

try:
    # Aktivitäten der letzten 7 Tage abrufen
    recent_activities = dip.get_recent_activities(days=2, anzahl=500)
    
    print(f"✅ {len(recent_activities)} aktuelle Aktivitäten gefunden\n")
    
    # Ergebnisse anzeigen
    for i, activity in enumerate(recent_activities, 1):
        print(f"📅 Aktuelle Aktivität {i}:")
        print(f"   Titel: {activity.get('titel', 'N/A')}")
        print(f"   ID: {activity.get('id', 'N/A')}")
        print(f"   Typ: {activity.get('aktivitaetsart', 'N/A')}")
        print(f"   Datum: {activity.get('datum', 'N/A')}")
        print("")
        
except Exception as e:
    print(f"❌ Fehler beim Abrufen aktueller Aktivitäten: {e}")


📅 Lade aktuelle Aktivitäten der letzten 7 Tage...
✅ 500 aktuelle Aktivitäten gefunden

📅 Aktuelle Aktivität 1:
   Titel: Filiz Polat, MdB, BÜNDNIS 90/DIE GRÜNEN
   ID: 1722230
   Typ: Kleine Anfrage
   Datum: 2025-07-10

📅 Aktuelle Aktivität 2:
   Titel: Lamya Kaddor, MdB, BÜNDNIS 90/DIE GRÜNEN
   ID: 1722229
   Typ: Kleine Anfrage
   Datum: 2025-07-10

📅 Aktuelle Aktivität 3:
   Titel: Marlene Schönberger, MdB, BÜNDNIS 90/DIE GRÜNEN
   ID: 1722228
   Typ: Kleine Anfrage
   Datum: 2025-07-10

📅 Aktuelle Aktivität 4:
   Titel: Lukas Benner, MdB, BÜNDNIS 90/DIE GRÜNEN
   ID: 1722227
   Typ: Kleine Anfrage
   Datum: 2025-07-10

📅 Aktuelle Aktivität 5:
   Titel: Schahina Gambir, MdB, BÜNDNIS 90/DIE GRÜNEN
   ID: 1722226
   Typ: Kleine Anfrage
   Datum: 2025-07-10

📅 Aktuelle Aktivität 6:
   Titel: Victoria Broßart, MdB, BÜNDNIS 90/DIE GRÜNEN
   ID: 1722225
   Typ: Kleine Anfrage
   Datum: 2025-07-10

📅 Aktuelle Aktivität 7:
   Titel: Sylvia Rietenberg, MdB, BÜNDNIS 90/DIE GRÜNEN
   ID: 172

In [None]:
## Schritt 6: Filter und erweiterte Abfragen

Die API unterstützt verschiedene Filter für präzisere Abfragen:

### 6.1 Personen einer bestimmten Wahlperiode


In [16]:
# Personen aus der 20. Wahlperiode abrufen
print("🗳️ Lade Personen aus der 20. Wahlperiode...")

try:
    # Personen mit Filter für Wahlperiode 20
    persons_wp20 = dip.get_person(anzahl=3, wahlperiode=20)
    
    print(f"✅ {len(persons_wp20)} Personen aus Wahlperiode 20 gefunden\n")
    
    # Ergebnisse anzeigen
    for i, person in enumerate(persons_wp20, 1):
        print(f"🗳️ Person {i} (WP 20):")
        print(f"   Name: {person.get('nachname', 'N/A')}, {person.get('vorname', 'N/A')}")
        print(f"   ID: {person.get('id', 'N/A')}")
        print(f"   Wahlperiode: {person.get('wahlperiode', 'N/A')}")
        print("")
        
except Exception as e:
    print(f"❌ Fehler bei der Filterabfrage: {e}")


🗳️ Lade Personen aus der 20. Wahlperiode...
✅ 3 Personen aus Wahlperiode 20 gefunden

🗳️ Person 1 (WP 20):
   Name: Schönberger, Marlene
   ID: 7408
   Wahlperiode: [20, 21]

🗳️ Person 2 (WP 20):
   Name: Kaddor, Lamya
   ID: 7316
   Wahlperiode: [20, 21]

🗳️ Person 3 (WP 20):
   Name: Gambir, Schahina
   ID: 7279
   Wahlperiode: [20, 21]



In [None]:
### 6.2 Arbeiten mit JSON-Daten

Alle API-Antworten sind strukturierte JSON-Daten, die einfach verarbeitet werden können:


In [17]:
# Struktur der API-Antworten verstehen
print("🔍 Analysiere Datenstruktur...")

try:
    # Eine Person abrufen für Datenanalyse
    sample_persons = dip.get_person(anzahl=1)
    
    if sample_persons:
        person = sample_persons[0]
        
        print("📋 Verfügbare Felder einer Person:")
        print("=" * 40)
        
        # Alle verfügbaren Felder anzeigen
        for key, value in person.items():
            value_str = str(value)[:50] + "..." if len(str(value)) > 50 else str(value)
            print(f"   {key}: {value_str}")
        
        print(f"\n✅ Insgesamt {len(person)} Felder verfügbar")
        
        # JSON-Export Beispiel
        person_json = json.dumps(person, indent=2, ensure_ascii=False)
        print(f"\n📄 JSON-Export der ersten 300 Zeichen:")
        print("-" * 50)
        print(person_json[:300] + "...")
        
    else:
        print("❌ Keine Personen für Analyse verfügbar")
        
except Exception as e:
    print(f"❌ Fehler bei der Datenanalyse: {e}")


🔍 Analysiere Datenstruktur...
📋 Verfügbare Felder einer Person:
   id: 8088
   funktion: ['MdB']
   fraktion: ['BÜNDNIS 90/DIE GRÜNEN']
   nachname: Rietenberg
   vorname: Sylvia
   typ: Person
   wahlperiode: [21]
   aktualisiert: 2025-03-11T16:38:10+01:00
   titel: Sylvia Rietenberg, MdB, BÜNDNIS 90/DIE GRÜNEN
   datum: 2025-07-10
   basisdatum: 2025-05-20

✅ Insgesamt 11 Felder verfügbar

📄 JSON-Export der ersten 300 Zeichen:
--------------------------------------------------
{
  "id": "8088",
  "funktion": [
    "MdB"
  ],
  "fraktion": [
    "BÜNDNIS 90/DIE GRÜNEN"
  ],
  "nachname": "Rietenberg",
  "vorname": "Sylvia",
  "typ": "Person",
  "wahlperiode": [
    21
  ],
  "aktualisiert": "2025-03-11T16:38:10+01:00",
  "titel": "Sylvia Rietenberg, MdB, BÜNDNIS 90/DIE GRÜ...


In [None]:
## Schritt 7: Zusammenfassung und nächste Schritte

🎉 **Herzlichen Glückwunsch!** Sie haben erfolgreich die Grundlagen von PyDipAPI gelernt.

### Was Sie gelernt haben:
1. ✅ API-Client initialisieren
2. ✅ Personen, Aktivitäten und Dokumente abrufen
3. ✅ Suchfunktionen verwenden
4. ✅ Filter anwenden
5. ✅ JSON-Daten verarbeiten

### Nächste Schritte:
- 📚 **Erweiterte Tutorials**: Schauen Sie sich die anderen Notebooks an
- 🚀 **Async Support**: Nutzen Sie `AsyncDipAnfrage` für bessere Performance
- 🔍 **Content Parser**: Verwenden Sie die Parser für strukturierte Datenextraktion
- 📊 **Batch-Operationen**: Arbeiten Sie mit mehreren IDs gleichzeitig

### Weitere Ressourcen:
- 📖 [Vollständige Dokumentation](https://lichtbaer.github.io/pydipapi/)
- 💻 [GitHub Repository](https://github.com/lichtbaer/pydipapi)
- 🐛 [Issues & Support](https://github.com/lichtbaer/pydipapi/issues)


In [18]:
# Abschließendes praktisches Beispiel: Kleine Datenauswertung
print("📊 Erstelle eine kleine Zusammenfassung der abgerufenen Daten...\n")

# Sammle Statistiken
stats = {
    "total_requests": 0,
    "total_items": 0,
    "categories": {}
}

try:
    # Verschiedene Datentypen abrufen und zählen
    data_types = [
        ("Personen", lambda: dip.get_person(anzahl=5)),
        ("Aktivitäten", lambda: dip.get_aktivitaet(anzahl=5)),
        ("Dokumente", lambda: dip.get_drucksache(anzahl=5, text=False))
    ]
    
    for category, fetch_func in data_types:
        try:
            items = fetch_func()
            count = len(items)
            stats["total_requests"] += 1
            stats["total_items"] += count
            stats["categories"][category] = count
            print(f"✅ {category}: {count} Einträge")
        except Exception as e:
            print(f"❌ {category}: Fehler - {e}")
    
    print(f"\n📈 Zusammenfassung:")
    print(f"   Insgesamt {stats['total_requests']} API-Aufrufe")
    print(f"   Insgesamt {stats['total_items']} Datensätze abgerufen")
    print(f"   Kategorien: {', '.join(stats['categories'].keys())}")
    
    print(f"\n🎯 Sie sind jetzt bereit, PyDipAPI für Ihre eigenen Projekte zu nutzen!")
    
except Exception as e:
    print(f"❌ Fehler bei der Zusammenfassung: {e}")

print("\n" + "="*60)
print("🎉 TUTORIAL ABGESCHLOSSEN!")
print("="*60)


📊 Erstelle eine kleine Zusammenfassung der abgerufenen Daten...

✅ Personen: 5 Einträge
✅ Aktivitäten: 5 Einträge
✅ Dokumente: 5 Einträge

📈 Zusammenfassung:
   Insgesamt 3 API-Aufrufe
   Insgesamt 15 Datensätze abgerufen
   Kategorien: Personen, Aktivitäten, Dokumente

🎯 Sie sind jetzt bereit, PyDipAPI für Ihre eigenen Projekte zu nutzen!

🎉 TUTORIAL ABGESCHLOSSEN!
