Wir haben das Problem, dass wenn man in Wikidata nach den Autorennamen sucht, man mehrere Einträge mit unterschiedlichen QIDs erhält. Wir möchten den eintrag des Autors finden und diesem die GEPRIS Projekte hinzufügen. Wenn man beispielsweise nach dem Namen Konrad Förstner sucht sind die ersten beiden Einträge: Konrad Förstner, QID: Q18744528 und Förstner Research Group, QID: Q123265818. Der erste Eintrag ist unsere gesuchte Person, während der zweite eintrag keine Person darstellt.   
  Daher möchten wir eine Automatisierte abfrage gestallten, welche uns Informationen zu den jeweiligen Entitäten gibt, sodass wir die richte auswählen können um dieser dann die Projekte hinzuzufügen.

## ein Beispiel alle QIDs des Suchbegriffs "Konrad Förstner" ermitteln

In [2]:
import requests

In [3]:
search_term = "Konrad Förstner"
api_url = f"https://www.wikidata.org/w/api.php?action=query&format=json&list=search&srsearch={search_term}"

response = requests.get(api_url)
data = response.json()

qids_list = []  # Liste zur Speicherung der QIDs

if "query" in data and "search" in data["query"]:
    for result in data["query"]["search"]:
        q_id = result["title"]
        qids_list.append(q_id)  # Füge die QID zur Liste hinzu
        print(f"Q-ID for {search_term}: {q_id}")

# Ausgabe der Liste mit QIDs
print("List of QIDs:")
print(qids_list)

Q-ID for Konrad Förstner: Q18744528
Q-ID for Konrad Förstner: Q123265818
Q-ID for Konrad Förstner: Q112148361
Q-ID for Konrad Förstner: Q110684366
Q-ID for Konrad Förstner: Q125548119
Q-ID for Konrad Förstner: Q93222062
Q-ID for Konrad Förstner: Q114381682
Q-ID for Konrad Förstner: Q24490214
Q-ID for Konrad Förstner: Q22951230
Q-ID for Konrad Förstner: Q110962107
List of QIDs:
['Q18744528', 'Q123265818', 'Q112148361', 'Q110684366', 'Q125548119', 'Q93222062', 'Q114381682', 'Q24490214', 'Q22951230', 'Q110962107']


## Ermitteln ob der jeweilige Eintrag einen Menschen Repräsentiert

In [4]:
for qid_to_check in qids_list:
    api_url = f"https://www.wikidata.org/wiki/Special:EntityData/{qid_to_check}.json"

    try:
        # HTTP-Anfrage, um die JSON-Daten des Wikidata-Eintrags abzurufen
        response = requests.get(api_url)
        if response.status_code == 200:
            entity_data = response.json()

            # Überprüfe, ob der Eintrag eine Instanz der Klasse "Mensch" (Q5) ist
            if "entities" in entity_data and qid_to_check in entity_data["entities"]:
                instance_of_claims = entity_data["entities"][qid_to_check]["claims"].get("P31", [])
                is_human = any(claim["mainsnak"]["datavalue"]["value"]["id"] == "Q5" for claim in instance_of_claims)
                
                if is_human:
                    print(f"Der Wikidata-Eintrag {qid_to_check} repräsentiert einen Menschen.")
                else:
                    print(f"Der Wikidata-Eintrag {qid_to_check} repräsentiert keine Person (Mensch).")
            else:
                print(f"Der Wikidata-Eintrag {qid_to_check} wurde nicht gefunden oder enthält keine Daten.")

        else:
            print(f"Fehler bei der HTTP-Anfrage für {qid_to_check}: Statuscode {response.status_code}")

    except requests.exceptions.RequestException as e:
        print(f"Fehler bei der HTTP-Anfrage für {qid_to_check}: {e}")
    except KeyError as e:
        print(f"Unerwarteter JSON-Formatfehler für {qid_to_check}: {e}")
    except Exception as e:
        print(f"Allgemeiner Fehler für {qid_to_check}: {e}")

Der Wikidata-Eintrag Q18744528 repräsentiert einen Menschen.
Der Wikidata-Eintrag Q123265818 repräsentiert keine Person (Mensch).
Der Wikidata-Eintrag Q112148361 repräsentiert keine Person (Mensch).
Der Wikidata-Eintrag Q110684366 repräsentiert keine Person (Mensch).
Der Wikidata-Eintrag Q125548119 repräsentiert keine Person (Mensch).
Der Wikidata-Eintrag Q93222062 repräsentiert keine Person (Mensch).
Der Wikidata-Eintrag Q114381682 repräsentiert keine Person (Mensch).
Der Wikidata-Eintrag Q24490214 repräsentiert keine Person (Mensch).
Der Wikidata-Eintrag Q22951230 repräsentiert keine Person (Mensch).
Der Wikidata-Eintrag Q110962107 repräsentiert keine Person (Mensch).


## Beispiel mit suchbegriff "Anke Becker"

In [5]:
search_term = "Anke Becker"
api_url = f"https://www.wikidata.org/w/api.php?action=query&format=json&list=search&srsearch={search_term}"

response = requests.get(api_url)
data = response.json()

qids_list = []  # Liste zur Speicherung der QIDs

if "query" in data and "search" in data["query"]:
    for result in data["query"]["search"]:
        q_id = result["title"]
        qids_list.append(q_id)  # Füge die QID zur Liste hinzu
        print(f"Q-ID for {search_term}: {q_id}")

# Ausgabe der Liste mit QIDs
print("List of QIDs:")
print(qids_list)

Q-ID for Anke Becker: Q21253882
Q-ID for Anke Becker: Q124022504
Q-ID for Anke Becker: Q124413921
Q-ID for Anke Becker: Q123857269
Q-ID for Anke Becker: Q98704635
Q-ID for Anke Becker: Q59319573
Q-ID for Anke Becker: Q62724364
Q-ID for Anke Becker: Q21093388
Q-ID for Anke Becker: Q64448970
Q-ID for Anke Becker: Q58589847
List of QIDs:
['Q21253882', 'Q124022504', 'Q124413921', 'Q123857269', 'Q98704635', 'Q59319573', 'Q62724364', 'Q21093388', 'Q64448970', 'Q58589847']


In [6]:
for qid_to_check in qids_list:
    api_url = f"https://www.wikidata.org/wiki/Special:EntityData/{qid_to_check}.json"

    try:
        # HTTP-Anfrage, um die JSON-Daten des Wikidata-Eintrags abzurufen
        response = requests.get(api_url)
        if response.status_code == 200:
            entity_data = response.json()

            # Überprüfe, ob der Eintrag eine Instanz der Klasse "Mensch" (Q5) ist
            if "entities" in entity_data and qid_to_check in entity_data["entities"]:
                instance_of_claims = entity_data["entities"][qid_to_check]["claims"].get("P31", [])
                is_human = any(claim["mainsnak"]["datavalue"]["value"]["id"] == "Q5" for claim in instance_of_claims)
                
                if is_human:
                    print(f"Der Wikidata-Eintrag {qid_to_check} repräsentiert einen Menschen.")
                else:
                    print(f"Der Wikidata-Eintrag {qid_to_check} repräsentiert keine Person (Mensch).")
            else:
                print(f"Der Wikidata-Eintrag {qid_to_check} wurde nicht gefunden oder enthält keine Daten.")

        else:
            print(f"Fehler bei der HTTP-Anfrage für {qid_to_check}: Statuscode {response.status_code}")

    except requests.exceptions.RequestException as e:
        print(f"Fehler bei der HTTP-Anfrage für {qid_to_check}: {e}")
    except KeyError as e:
        print(f"Unerwarteter JSON-Formatfehler für {qid_to_check}: {e}")
    except Exception as e:
        print(f"Allgemeiner Fehler für {qid_to_check}: {e}")

Der Wikidata-Eintrag Q21253882 repräsentiert einen Menschen.


KeyboardInterrupt: 

## Auswahl zwischen den einträgen welche Menschen Repsäsentieren und erstellen eines Dictonarys zum gewählen Eintrag (Beispeil Anke Becker)

In [None]:
def choose_entry(entries):
    # Funktion zur Auswahl eines Eintrags aus der Liste anhand der Benutzereingabe
    if not entries:
        return None  # Rückgabe von None, wenn die Liste leer ist
    
    print("Wähle einen Eintrag aus der Liste:")
    for i, entry in enumerate(entries):
        print(f"{i + 1}. {entry['label']} ({entry['description']})")

    choice = input("Gib die Nummer des gewünschten Eintrags ein (oder '0', um abzubrechen): ")
    try:
        index = int(choice) - 1
        if 0 <= index < len(entries):
            return entries[index]
        elif index == -1:
            return None  # Abbruch
        else:
            print("Ungültige Eingabe. Bitte gib eine gültige Nummer ein.")
            return choose_entry(entries)
    except ValueError:
        print("Ungültige Eingabe. Bitte gib eine gültige Nummer ein.")
        return choose_entry(entries)

search_term = "Anke Becker"
api_url = f"https://www.wikidata.org/w/api.php?action=query&format=json&list=search&srsearch={search_term}"

response = requests.get(api_url)
data = response.json()

# Liste zur Speicherung von Informationen zu Menschen mit demselben Label
human_info_list = []

if "query" in data and "search" in data["query"]:
    for result in data["query"]["search"]:
        q_id = result["title"]
        
        # API-Anfrage, um die JSON-Daten des Wikidata-Eintrags abzurufen
        entity_url = f"https://www.wikidata.org/wiki/Special:EntityData/{q_id}.json"
        entity_response = requests.get(entity_url)
        entity_data = entity_response.json()
        
        # Überprüfe, ob der Eintrag eine Instanz der Klasse "Mensch" (Q5) ist
        if "entities" in entity_data and q_id in entity_data["entities"]:
            instance_of_claims = entity_data["entities"][q_id]["claims"].get("P31", [])
            is_human = any(claim["mainsnak"]["datavalue"]["value"]["id"] == "Q5" for claim in instance_of_claims)
            
            if is_human:
                label = entity_data["entities"][q_id]["labels"]["en"]["value"]
                description = entity_data["entities"][q_id]["descriptions"]["en"]["value"]
                
                # Speichere die Informationen in einem Dictionary
                human_info = {
                    'label': label,
                    'description': description,
                    'qid': q_id
                }
                
                # Füge das Dictionary zur Liste hinzu
                human_info_list.append(human_info)

# Auswahl eines Eintrags aus der Liste (interaktiv)
chosen_entry = choose_entry(human_info_list)

# Ausgabe des ausgewählten Eintrags
if chosen_entry:
    print("Gewählter Eintrag:")
    print(chosen_entry)
else:
    print("Kein Eintrag ausgewählt oder Liste ist leer.")

Wähle einen Eintrag aus der Liste:
1. Anke Becker (German university teacher)
2. Anke Becker (German visual artist)
3. Anke Becker (faculty at Harvard Business School)
Gib die Nummer des gewünschten Eintrags ein (oder '0', um abzubrechen): 1
Gewählter Eintrag:
{'label': 'Anke Becker', 'description': 'German university teacher', 'qid': 'Q21253882'}


#### Nun erstellen wir ein Programm, welches nach Personen in Wikidata anhand der angegebenen Suchbegriffe Sucht. Er extrahiert QIDs für die gefundenen Einträge, überprüft, ob die Einträge Personen repräsentieren. Wenn die einträge Personen Repräsentieren können wir per Input Statement angeben welche Person die richtige ist und es werden relevante Informationen über diese Person in einem Dictionary gespeichert. Schließlich gibt er die gesammelten Informationen über die Personen aus.

In [None]:
# Liste von Suchbegriffen, für die die Wikidata-Einträge überprüft werden sollen
search_terms = ["Konrad Förstner", "Anke Becker", "Peer Bork", "Thomas Clavel", "Alexander Goesmann", "Franziska Hufsky", "Thomas Gübitz", "Barbara Götz", "Marius Dieckmann", "Alexander Goesmann"]

# Dictionary zur Speicherung von Informationen zu Menschen
human_info_dict = {}

# Funktion zur Auswahl einer QID bei mehreren Ergebnissen für denselben Suchbegriff
def choose_qid(qid_options, name):
    if len(qid_options) == 1:
        chosen_qid = qid_options[0]
        print(f"Nur ein Eintrag gefunden für '{name}': QID: {chosen_qid}")
        return chosen_qid
    else:
        print(f"Mehrere Einträge gefunden für '{name}'. Bitte wählen Sie eine QID aus:")
        valid_entries = []
        for idx, qid in enumerate(qid_options):
            entity_url = f"https://www.wikidata.org/wiki/Special:EntityData/{qid}.json"
            try:
                response = requests.get(entity_url)
                entity_data = response.json()
                if "entities" in entity_data and qid in entity_data["entities"]:
                    entity_info = entity_data["entities"][qid]
                    label = entity_info.get('labels', {}).get('en', {}).get('value', 'N/A')
                    description = entity_info.get('descriptions', {}).get('en', {}).get('value', 'N/A')
                    instance_of_claims = entity_info["claims"].get("P31", [])
                    is_human = any(claim["mainsnak"]["datavalue"]["value"]["id"] == "Q5" for claim in instance_of_claims)
                    if is_human:
                        valid_entries.append({
                            'qid': qid,
                            'label': label,
                            'description': description
                        })
                        print(f"{idx + 1}: QID: {qid}, Label: {label}, Beschreibung: {description}")
            except requests.exceptions.RequestException as e:
                print(f"Fehler bei der Abfrage für {qid}: {e}")

        while True:
            choice = input("Geben Sie die Nummer der gewünschten QID ein: ")
            try:
                index = int(choice) - 1
                if 0 <= index < len(valid_entries):
                    return valid_entries[index]['qid']
                else:
                    print("Ungültige Eingabe. Bitte wählen Sie eine der angezeigten Optionen.")
            except ValueError:
                print("Ungültige Eingabe. Bitte geben Sie eine Zahl ein.")

# Durchlauf der Suchbegriffe
for search_term in search_terms:
    api_url = f"https://www.wikidata.org/w/api.php?action=query&format=json&list=search&srsearch={search_term}"

    try:
        # HTTP-Anfrage, um die Suchergebnisse von Wikidata abzurufen
        response = requests.get(api_url)
        data = response.json()

        # Überprüfen der Ergebnisse und Extrahieren der QIDs
        if "query" in data and "search" in data["query"]:
            qids_options = []
            for result in data["query"]["search"]:
                q_id = result["title"]
                qids_options.append(q_id)

            # Auswahl einer QID, falls mehrere Optionen vorhanden sind
            if len(qids_options) > 0:
                chosen_qid = choose_qid(qids_options, search_term)

                # API-Anfrage, um die JSON-Daten des Wikidata-Eintrags abzurufen
                entity_url = f"https://www.wikidata.org/wiki/Special:EntityData/{chosen_qid}.json"
                entity_response = requests.get(entity_url)
                entity_data = entity_response.json()

                # Überprüfen, ob der Eintrag eine Instanz der Klasse "Mensch" (Q5) ist
                if "entities" in entity_data and chosen_qid in entity_data["entities"]:
                    entity_info = entity_data["entities"][chosen_qid]

                    # Überprüfen, ob der Eintrag einen Menschen repräsentiert
                    instance_of_claims = entity_info["claims"].get("P31", [])
                    is_human = any(claim["mainsnak"]["datavalue"]["value"]["id"] == "Q5" for claim in instance_of_claims)

                    if is_human:
                        label = entity_info.get('labels', {}).get('en', {}).get('value', 'N/A')
                        description = entity_info.get('descriptions', {}).get('en', {}).get('value', 'N/A')

                        # Speichern der Informationen im Dictionary
                        human_info_dict[label] = {
                            'description': description,
                            'qid': chosen_qid
                        }
                    else:
                        print(f"Der Wikidata-Eintrag {chosen_qid} repräsentiert keine Person (Mensch).")
                else:
                    print(f"Der Wikidata-Eintrag {chosen_qid} wurde nicht gefunden oder enthält keine Daten.")

            else:
                print(f"Keine Ergebnisse gefunden für den Suchbegriff '{search_term}'.")

    except requests.exceptions.RequestException as e:
        print(f"Fehler bei der HTTP-Anfrage für {search_term}: {e}")
    except KeyError as e:
        print(f"Unerwarteter JSON-Formatfehler für {search_term}: {e}")
    except Exception as e:
        print(f"Allgemeiner Fehler für {search_term}: {e}")

# Ausgabe des Dictionarys mit Informationen zu Menschen
print("Dictionary mit Informationen zu Menschen:")
for name, info in human_info_dict.items():
    print(f"Name: {name}, Beschreibung: {info['description']}, QID: {info['qid']}")

NameError: name 'requests' is not defined

In [None]:
print(human_info_dict)

{'Konrad Förstner': {'description': 'bioinformatician', 'qid': 'Q18744528'}, 'Anke Becker': {'description': 'German university teacher', 'qid': 'Q21253882'}, 'Peer Bork': {'description': 'German biologist and bioinformatician', 'qid': 'Q7160367'}, 'Thomas Clavel': {'description': 'researcher', 'qid': 'Q40442760'}, 'Alexander Goesmann': {'description': 'researcher', 'qid': 'Q52422599'}}
