In [25]:
import requests
import json

# Konfiguration
OLLAMA_API_URL = "http://localhost:11434/api/generate"
MODEL_NAME = "llama3"

system_prompt = """Du bist ein Textanalyse-Assistent. Deine Aufgabe ist es, aus dem gegebenen Wikipedia-Text ausschließlich die Sätze zu extrahieren, die sich auf den Bildungsabschluss, die Ausbildung oder das Studium der Person beziehen. Durchsuche den gesamten Inhalt Schritt für Schritt und ignoriere alles was nicht mit der Bildung zu tun hat. Dabei wird es sich um nur einen kleinen und zusammenhängenden Abschnitt handeln. Gib diese Sätze unverändert und vollständig wieder. Verzichte auf alle weiteren Kommentare diesbezüglich"""

def extract_education(system_prompt: str, wikipedia_text: str) -> str:
    """
    Sendet einen Wikipedia-Text an Llama3 und extrahiert Bildungsinformationen.
    Args:
        wikipedia_text: Der Wikipedia-Artikel als String
    Returns:
        Die extrahierten Bildungsinformationen
    """

    prompt = f"{system_prompt}\n\nText:\n{wikipedia_text}\n\nExtrahierte Bildungsinformationen:"

    payload = {
        "model": MODEL_NAME,
        "prompt": prompt,
        "temperature": 0.1,  # Niedrig für präzise Extraktion
        "stream": False
    }

    try:
        response = requests.post(OLLAMA_API_URL, json=payload)
        response.raise_for_status()
        result = response.json()
        return result.get("response", "Keine Antwort erhalten")
    except Exception as e:
        return f"Fehler: {str(e)}"

In [26]:
# Test
    # Beispiel Wikipedia-Text
test_text = """
Leben
Ausbildung
Schröder ist die Tochter des Oberamtsanwalts Helmut Köhler, der als ehemaliger Rallye-Beifahrer, zumeist als Copilot des Rennfahrers Horst Rack, und späterer DMSB-Offizieller in der deutschen Motorsportszene bekannt ist.[1] Ihre Mutter ist Immobilienmaklerin.[2] Schröder absolvierte 1997 an der Diltheyschule in Wiesbaden ihr Abitur und studierte danach an der Johannes Gutenberg-Universität Mainz Soziologie, Mittlere und Neue Geschichte, Philosophie und Politikwissenschaft. 2002 schloss Schröder ihr Studium als Diplom-Soziologin ab. Während ihres Studiums war sie von 1997 bis 2002 als Mitarbeiterin bei der hessischen CDU-Landtagsabgeordneten Birgit Zeimetz-Lorz und von 1998 bis 2002 als studentische Hilfskraft am Institut für Soziologie der Universität Mainz tätig.

Promotion
Parallel zu ihrer Abgeordnetentätigkeit im Bundestag ab 2002 wurde Schröder bis April 2009 bei Jürgen W. Falter am Institut für Politikwissenschaft der Universität Mainz nach der Vorlage einer Studie über Gerechtigkeit als Gleichheit promoviert. Die Studie untersuchte, wie sich die Wertvorstellungen der CDU-Bundestagsabgeordneten von denen der übrigen CDU-Mitglieder unterschieden. Im Januar 2010 wurden Vorwürfe gegen Schröder laut, sie habe Teile ihrer Dissertation durch Hilfskräfte anfertigen lassen. Der Präsident der Universität, Georg Krausch, stellte klar, dass es keinen Hinweis auf ein mögliches wissenschaftliches Fehlverhalten der Kandidatin gebe; Zuarbeiten von Hilfskräften seien „wissenschaftlich legitim und im Rahmen vieler Dissertationen üblich“. Zudem waren der Doktorvater Falter und die Hilfskraft bereit, eidesstattlich zu versichern, dass alles korrekt ablief.[3][4]

Partei
Schröder trat als Schülerin 1991 in die Junge Union (JU) und 1994 auch in die CDU ein. Sie gehört seit 1992 dem JU-Kreisvorstand in Wiesbaden an und war von 1997 bis 2003 JU-Kreisvorsitzende. Schröder gehört seit 1995 dem CDU-Bezirksvorstand Westhessen und seit 2002 dem Landesvorstand der CDU Hessen an. Seit 2013 ist sie Ehrenvorsitzende der Jungen Union Wiesbaden.[5][6]

Abgeordnete
Schröder gehörte von 2000 bis 2001 der Stadtverordnetenversammlung von Wiesbaden an.

Von der Bundestagswahl im Herbst 2002 bis zur Bundestagswahl 2017 war sie Mitglied des Deutschen Bundestages. Dort war sie ordentliches Mitglied im Innenausschuss und Berichterstatterin der CDU/CSU-Bundestagsfraktion für Islam, Integration und Extremismus. Ab November 2008 war sie Obfrau der CDU/CSU-Fraktion in dem 2006 eingesetzten und im Juni 2009 beendeten BND-Untersuchungsausschuss (Kurnaz-Untersuchungsausschuss).

Schröder zog bei der Bundestagswahl 2002 und 2005 über die Landesliste Hessen in den Deutschen Bundestag ein. Bei der Bundestagswahl 2009 gewann sie das Direktmandat im Wahlkreis Wiesbaden mit 40,8 % gegen die damalige Entwicklungshilfeministerin Heidemarie Wieczorek-Zeul (32,6 %). Auch bei der Bundestagswahl 2013 erhielt sie die meisten Wählerstimmen und damit das Mandat. Bei der Bundestagswahl 2017 kandidierte sie nicht mehr für das Parlament.

Familienministerin
Am 30. November 2009, etwa fünf Wochen nach dem Amtsantritt des Kabinetts Merkel II, kam es zu einer Kabinettsumbildung, nachdem Bundesarbeitsminister Franz Josef Jung zurückgetreten war. Schröder wurde infolgedessen Bundesministerin für Familie, Senioren, Frauen und Jugend; die bisherige Ministerin Ursula von der Leyen wurde Arbeitsministerin. Am 2. Dezember 2009 wurde Schröder vor dem Deutschen Bundestag vereidigt.


Kristina Schröder auf dem Maschinenbaugipfel 2012
Im Anschluss an ihren Amtsantritt als Bundesfamilienministerin unterstützte Schröder weitgehend die Familienpolitik ihrer Vorgängerin von der Leyen, forderte aber beim umstrittenen Betreuungsgeld sowohl Barzahlungen wie auch Gutscheine und sprach von einem „schweren Zielkonflikt“.[7] Ebenso kündigte sie an, dass alle familienpolitischen Leistungen des Staates „vom Ehegattensplitting bis zum Kindergeld“ bis 2013 evaluiert werden sollen. Ziel sei „nicht eine Kürzung der Mittel, sondern ihr effizienter Einsatz“.[8]

Im Februar 2010 sprach sie sich in einem Interview mit Spiegel Online für die Einführung eines „Forum Internet“ aus, in dem sie Experten aus diesem Bereich (wie zum Beispiel dem Chaos Computer Club) die Möglichkeit geben wollte, an Gesetzesentwürfen, die das Internet und Dazugehöriges betreffen, in Form einer virtuellen Diskussionsrunde teilzunehmen. Außerdem strebte sie ein Treffen mit der Piratenpartei Deutschland an, um mit ihnen über den umstrittenen Jugendmedienschutz-Staatsvertrag zu diskutieren.[9]

Sie sprach sich 2010 für einen Rechtsanspruch auf eine bis zu zwei Jahre dauernde Familienpflegezeit mit halber Arbeitszeit aus. Der Arbeitnehmer solle dabei während dieser Zeit und für einen ebenso langen darauf folgenden Zeitraum jeweils 75 % des Gehalts beziehen.[10] Betriebe mit weniger als 250 Beschäftigten sollen die Lohnaufstockung während der Pflegezeit als zinslosen Kredit von der KfW Bankengruppe erhalten können.[11]

In einem Interview mit Focus sprach sie sich im Mai 2010 für eine Ausdehnung der zwei nicht übertragbaren Monate (so genannte „Vätermonate“) des Elterngeldes auf vier Monate aus. Sie arbeite auch an einem Teilelterngeld, das jedem Elternteil ermöglichen solle, zwölf Monate lang in Teilzeit zu arbeiten.[12] Zudem kündigte sie an, gemeinsam mit dem Deutschen Industrie- und Handelskammertag (DIHK) eine Kampagne zu starten, die unter dem Motto Vollzeitnahe Teilzeitarbeit Unternehmen dafür gewinnen soll, beiden Elternteilen die Möglichkeit zu geben, für die Erziehung der Kinder eine gewisse Zeit die berufliche Arbeitszeit zu reduzieren. Sie führte als Beispiel eine 30-Stunden-Arbeitswoche für beide Partner an.[12] Die Pläne der Novellierung des Elterngelds sollten durch eine Erweiterung des Elterngeldanspruchs beider Elternteile von 14 auf insgesamt 16 Monate umgesetzt werden; dem widersetzte sich das Finanzministerium.[13] Die Pläne scheiterten ein Jahr später endgültig.[14]

Im Oktober 2010 startete sie mit dem Deutschen Industrie- und Handelskammertag die Initiative für „familienbewusste Arbeitszeiten“. Sie forderte Unternehmen auf, mehr „Teilzeitplus“-Stellen mit einem Arbeitsumfang von 30 bis 35 Stunden anzubieten.[15] Sie betonte, für 90 Prozent der Eltern sei bei der Wahl des Arbeitgebers die Familienfreundlichkeit mindestens ebenso wichtig wie das Gehalt. Die tatsächlichen Arbeitszeiten entsprächen oft nicht den Wünschen der Beschäftigten. Als Beispiele für eine mögliche Ausrichtung betrieblicher Abläufe an Familien nannte sie dabei einen Beginn betrieblicher Besprechungen vor 16 Uhr, einen Vorrang für Eltern beim Urlaub in den Schulferien, die Gleitzeit, Teilzeitmodelle mit 70 bis 80 Prozent der Vollarbeit und Langzeitkonten.[16]

In einem Grundsatzpapier der Hessen-CDU, in dem mehr Möglichkeiten zur Freistellung oder Teilzeitarbeit für Eltern sowie Lebensarbeitszeitkonten gefordert werden, wird Schröders Aussage zitiert, Zeit für die Familie sei die eigentliche „Leitwährung moderner Familienpolitik“.[17]

Im November 2011 warfen ihr die Ersteller der Studie Zwangsverheiratung in Deutschland vor, dass durch ihre Formulierungen in einem FAZ-Gastbeitrag[18] die Gefahr bestünde, dass anti-muslimische Ressentiments Auftrieb erhielten.[19][20] Die Studie war im Auftrag des Familienministeriums erstellt worden. Schröder hatte nach Auffassung der Wissenschaftler die Ergebnisse der Studie „schlichtweg falsch“ wiedergegeben. Unter anderem habe sie „angedrohte Straftaten mit tatsächlich stattgefundenen gleichgesetzt“ und aufgrund nicht belastbar ermittelter Daten die Behauptung aufgestellt, dass 83,4 Prozent der Betroffenen muslimische Eltern hätten. Schröder hielt dem entgegen, dass sie die Aufteilung zwischen Opfern versuchter und vollendeter Straftaten für zynisch halte.[21] Sebastian Edathy (SPD) warf ihr vor, nicht auf Inhalte zu setzen, sondern ideologisch zu handeln. Er legte Bundeskanzlerin Angela Merkel die Entlassung Schröders nahe.[22]

Am Abend der Bundestagswahl 2013 teilte sie mit, dass sie künftig nur noch Bundestagsabgeordnete für ihren Wiesbadener Wahlkreis sein wollte; sie wolle mehr Zeit für ihre Tochter haben.[23][24] Am 7. April 2016 teilte Schröder mit, dass sie zur Bundestagswahl 2017 nicht antreten werde.[25]

Sonstiges Engagement
Schröder war Mitglied der Europa-Union Parlamentariergruppe Deutscher Bundestag und amtierte vom 7. Dezember 2011 bis zum 30. November 2017 als Präsidentin der ZNS – Hannelore Kohl Stiftung. Sie schreibt seit November 2017 als Kolumnistin für die Tageszeitung Die Welt[26] und ist seit Sommer 2020 ehrenamtliche Botschafterin der Initiative Neue Soziale Marktwirtschaft.[27] Im November 2021 gründete sie mit 14 weiteren Personen die von Andreas Rödder geleitete Denkfabrik Republik21, die neue Konzepte bürgerlicher Politik entwickeln soll.[28] Seit 2022 ist sie im Vorstand von Hessischer Kreis e. V.[29] Im August 2022 tat sie sich als Kritikerin der Maßnahmen gegen die COVID-19-Pandemie in Deutschland hervor, für die sie eine gesellschaftliche Aufarbeitung fordert.[30]

Privatleben
Schröder gehört der altkonfessionellen Selbständigen Evangelisch-Lutherischen Kirche an.[31] Seit dem 12. Februar 2010 ist sie mit Ole Schröder verheiratet, einem ehemaligen Parlamentarischen Staatssekretär beim Bundesminister des Innern.[32]

Am 30. Juni 2011 brachte sie ihr erstes Kind zur Welt, ein Mädchen. Sie war damit die erste Bundesministerin, die während ihrer Amtszeit ein Kind bekam.[33] Während der Zeit des Mutterschutzes wurde sie von den Staatssekretären Josef Hecken, Hermann Kues und der damaligen Bundesbildungsministerin Annette Schavan vertreten.[34] Am 16. Juni 2014 brachte sie ihre zweite, im April 2018 ihre dritte Tochter zur Welt.
"""

ergebnis = extract_education(system_prompt, test_text)
print(ergebnis)

Hier sind die Sätze aus dem Text, die sich auf den Bildungsabschluss, die Ausbildung oder das Studium der Person beziehen:

* Schröder absolvierte 1997 an der Diltheyschule in Wiesbaden ihr Abitur und studierte danach an der Johannes Gutenberg-Universität Mainz Soziologie, Mittlere und Neue Geschichte, Philosophie und Politikwissenschaft.
* 2002 schloss Schröder ihr Studium als Diplom-Soziologin ab.
* Parallel zu ihrer Abgeordnetentätigkeit im Bundestag ab 2002 wurde Schröder bis April 2009 bei Jürgen W. Falter am Institut für Politikwissenschaft der Universität Mainz nach der Vorlage einer Studie über Gerechtigkeit als Gleichheit promoviert.
* Sie erwarb den Titel eines Doktormutterschutzes während ihrer Amtszeit.


In [27]:
system_prompt = """
    Du bekommst kurze biographische Texte von Politiker:innen.
    Deine Aufgabe ist es, aus dem Text den höchsten erreichten Bildungsabschluss nach dem Deutschen Qualifikationsrahmen (DQR) zu erkennen und zurückzugeben.
    Die Antwort soll im Format sein: DQR-Niveau; Sehr kurzer Kommentar zum höchsten Bildungsabschluss.
    Beispiel:
    8; Dr. der Wirtschaftspsychologie
    oder
    7; Volljurist mit 2. Staatsexamen
    Nutze nur die offiziellen DQR-Stufen von 1 bis 8. Die Zuordnung der jeweiligen Abschlüsse zu den Niveaus kannst du der folgenden Liste entnehmen. Wenn der gefundene Abschluss nicht darin enthalten ist, dann entscheide welchem dieser Abschlüsse er am nächsten kommt und kategorisiere dementsprechend.

    Niveau 1:
    Berufsausbildungsvorbereitung
      Berufsvorbereitende Bildungsmaßnahmen der Arbeitsagentur (BvB, BvB-Reha)
      Berufsvorbereitungsjahr (BVJ)

    Niveau 2:
    Berufsausbildungsvorbereitung
      Berufsvorbereitende Bildungsmaßnahmen der Arbeitsagentur (BvB, BvB-Reha)
      Berufsvorbereitungsjahr (BVJ)
      Einstiegsqualifizierung (EQ)
    Berufsfachschule (Berufliche Grundbildung)
    Erster Schulabschluss (ESA)/Hauptschulabschluss (HSA)

    Niveau 3:
    Duale Berufsausbildung (2-jährige Ausbildungen)
    Berufsfachschule (Mittlerer Schulabschluss)
    Mittlerer Schulabschluss (MSA)

    Niveau 4:
    Duale Berufsausbildung (3- und 3 ½-jährige Ausbildungen)
    Berufsfachschule (Assistentenberufe)
    Berufsfachschule (vollqualifizierende Berufsausbildung)
    Berufsfachschule (Landesrechtlich geregelte Berufsausbildungen)
    Berufsfachschule (Bundesrechtliche Ausbildungsregelungen für Berufe im Gesundheitswesen und in der Altenpflege)
    Fachhochschulreife (FHR)
    Fachgebundene Hochschulreife (FgbHR)
    Allgemeine Hochschulreife (AHR)
    Berufliche Ausbildung („Kaufmann/Kauffrau“)
    Berufliche Umschulung nach BBiG (Niveau 4)
      Fachkraft Bodenverkehrsdienst im Luftverkehr (Geprüfte)
    Berufliche Ausbildung („Kaufmann/Kauffrau“)
      Fachhochschulreife (FHR), fachgebundene Hochschulreife, allgemeine Hochschulreife (Abitur).


    Niveau 5:
    IT-Spezialist (Zertifizierter)*
    Servicetechniker (Geprüfter)*
    Sonstige berufliche Fortbildungsqualifikationen nach § 53 BBiG bzw. § 42 a HwO (Niveau 5)
    Berufliche Fortbildungsqualifikationen nach § 54 BBiG bzw. § 42 a HwO (Niveau 5)

    Niveau 6:
    Bachelor
    Fachkaufmann (Geprüfter)*
    Fachschule (Staatlich Geprüfter …)
    Fachschule (Landesrechtlich geregelte Weiterbildungen)
    Fachwirt (Geprüfter)*
    Meister (Geprüfter)*
    Operativer Professional (IT) (Geprüfter)*
    Sonstige berufliche Fortbildungsqualifikationen nach § 53 BBiG bzw. § 42 a HwO (Niveau 6)
    Berufliche Fortbildungsqualifikationen nach § 54 BBiG bzw. § 42 a HwO (Niveau 6)
	Erstes Staatsexamen (z. B. Jura, Lehramt): DQR-Niveau 6.
	Diplom (Fachhochschule, z. B. „Diplom-Ingenieur (FH)“) ohne Zusatz „Universität“: DQR-Niveau 6.
	Bakkalaureus/Bachelor jeder Art: DQR-Niveau 6.
	Fachwirt (Geprüfter), Meister, Techniker oder „Geprüfter Fachkaufmann/-frau“: DQR-Niveau 6.

    Niveau 7:
    Master
    Strategischer Professional (IT) (Geprüfter)*
    Zweites Staatsexamen
    Sonstige berufliche Fortbildungsqualifikationen nach § 53 BBiG bzw. § 42 a HwO (Niveau 7)
      Berufspädagoge (Geprüfter)
      Betriebswirt nach dem Berufsbildungsgesetz (Geprüfter)
      Betriebswirt nach der Handwerksordnung (Geprüfter)
      Technischer Betriebswirt (Geprüfter)
    Zweites Staatsexamen („Volljurist“): DQR-Niveau 7.
	Diplom (Universität): Immer wie Master einstufen – DQR-Niveau 7. Z. B. Diplom-Ingenieur (Univ.), Diplom-Kaufmann, Diplom-Volkswirt (Universität).
	Magister Artium (M.A.), Master jeden Typs: DQR-Niveau 7.
	Geprüfter Betriebswirt (nach HwO/BBiG) und gleichgestellte berufliche Fortbildungsabschlüsse auf diesem Niveau: DQR-Niveau 7.


    Niveau 8:
    Promotion
    Doktorant und äquivalente künstlerische Abschlüsse

    Wenn kein Bildungsabschluss erkennbar ist, antworte mit
    0; Keine Angabe zum Bildungsabschluss
    Es könnte nämlich sein, dass bei dem Crawling der Daten versehentlich der falsche Abschnitt aus dem Wikipedia-Artikel herausgezogen wurde.
    Solltest du das Gefühl haben, dass das der Fall ist, kannst du das noch explizit angeben in dem Kommentarfeld.
    Achte darauf, dass deine Antwort 100% exakt den Angaben entspricht, denke Schritt für Schritt und überprüfe nochmal deine Antwort bevor du sie mir gibst.
    Es ist deswegen so wichtig, dass die Daten im exakten Format zurückgegeben werden, weil diese genau so in eine Datenbank geschrieben werden.
    """

bio = extract_education(system_prompt, ergebnis)
print(bio)

7; Diplom-Soziologin und Ph.D.


import requests
import json

# Konfiguration
OLLAMA_API_URL = "http://localhost:11434/api/generate"
MODEL_NAME = "llama3"

system_prompt_local = """Du bist ein Textanalyse-Assistent. Entscheide zwischen mehreren Texten, in welchem Bildungsinformationen enthalten sind. So etwas wie "Ehrendoktorwürde" ist keine Bildungsinformation. Es geht um echte Abschlüsse. Ein Indiz dafür, dass es der richtig Text ist, ist auch häufig, dass von der Familie der Person die Rede ist, zumindest kurz am Anfang, das muss aber nicht sein. Verzichte auf alle weiteren Kommentare diesbezüglich, gib lediglich die Nummer des Textes zurück, der die Bildungsinformation enthält."""

def extract_education(system_prompt: str, wikipedia_text: str) -> str:
    """
    Sendet einen Wikipedia-Text an Llama3 und extrahiert Bildungsinformationen.
    Args:
        wikipedia_text: Der Wikipedia-Artikel als String
    Returns:
        Die extrahierten Bildungsinformationen
    """

    prompt = f"{system_prompt}\n\nText:\n{wikipedia_text}\n\nExtrahierte Bildungsinformationen:"

    payload = {
        "model": MODEL_NAME,
        "prompt": prompt,
        "temperature": 0.1,  # Niedrig für präzise Extraktion
        "stream": False
    }

    try:
        response = requests.post(OLLAMA_API_URL, json=payload)
        response.raise_for_status()
        result = response.json()
        return result.get("response", "Keine Antwort erhalten")
    except Exception as e:
        return f"Fehler: {str(e)}"
    
wikipedia_text = f"1: {df.iloc[0,4]}, 2: {df.iloc[1,4]}, 3: {df.iloc[2,4]}, 4: {df.iloc[3,4]}, 5: {df.iloc[4,4]}"

bio = extract_education(system_prompt_local, wikipedia_text)
print(bio)