# Imports

In [22]:
# Imports für ersten Teil:
import requests
import pandas as pd
from tqdm import tqdm
import time

# Imports für zweiten Teil:
import requests
import json
import time
from tqdm import tqdm

# Erster Teil:
## Zitationen mithilfe der Metadaten von 'Dataset Builder' aus OpenAlex herausarbeiten

<br>
Ausgabedatei:
<br>
- zitationsdaten_hypatia_openalex_2017-2018.json mit Informationen zu Autoren, Titel und Referenzen (openAlex-URL) aller gefundenen Artikel aus der Zeitschrift Hypatia zwischen 2017 und 2018
<br>
- fehlerhafte_titel.txt: Alle nicht in OpenAlex gefundenen Zeitschriften aus diesem Zeitraum

In [2]:
# CSV mit Metadaten laden
df = pd.read_csv("./hypatia_metadaten_2017-2018.csv")
titel_liste = df['title'].dropna().tolist()

zitationsdaten = []
fehlerhafte_titel = []  # hier werden problematische Titel gespeichert

base_url = "https://api.openalex.org/works"

# Für jeden Titel in der Liste
for titel in tqdm(titel_liste, desc="🔍 Suche Artikel in OpenAlex"):
    try: # Suche Titel in OpenAlex
        params = {
            "filter": f"title.search:{titel}",
            "per-page": 1
        }
        response = requests.get(base_url, params=params) # OpenAlex Anfrage
        if response.status_code == 200: # Wenn Website richtig reagiert
            ergebnis = response.json() # Ergebnisanfrage in json formatieren
            if ergebnis.get("results"): # Wenn in ergebnis etwas ist
                paper = ergebnis["results"][0] # paper ist erstes Ergebnis in OpenAlex
                
                # Informationen für Suchergebnis in eintrag speichern
                eintrag = {
                    "OriginalTitle": titel,
                    "GefundenerTitel": paper.get("title"),
                    "Jahr": paper.get("publication_year"),
                    "Autoren": [a["author"]["display_name"] for a in paper.get("authorships", [])],
                    "Anzahl_Zitationen": paper.get("cited_by_count"),
                    "Anzahl_Referenzen": len(paper.get("referenced_works", [])),
                    "Referenzen": paper.get("referenced_works", []),
                    "DOI": paper.get("doi"),
                    "OpenAlex_ID": paper.get("id")
                }

                zitationsdaten.append(eintrag) # eintrag in zitationsdaten speichern
            else:
                print(f"❌ Kein Treffer für: {titel}")
                fehlerhafte_titel.append(titel)
        else:
            print(f"❌ Fehlerhafte Anfrage: {titel}")
            fehlerhafte_titel.append(titel)
        time.sleep(1)
    except Exception as e:
        print(f"⚠️ Ausnahme bei Titel: {titel}\n{e}")
        fehlerhafte_titel.append(titel)
        time.sleep(2)

# Ergebnis speichern
zitations_df = pd.DataFrame(zitationsdaten)
zitations_df.to_json("zitationsdaten_hypatia_openalex_2017-2018.json", orient="records", indent=2)

# Fehlerhafte Titel speichern
with open("fehlerhafte_titel.txt", "w", encoding="utf-8") as f:
    for t in fehlerhafte_titel:
        f.write(t + "\n")

print(f"\n✅ Fertig! {len(zitationsdaten)} Einträge erfolgreich gespeichert.") # Anzahl an erfolgreich gespeicherten Artikeln
print(f"⚠️ {len(fehlerhafte_titel)} Titel konnten nicht gefunden werden – siehe 'fehlerhafte_titel.txt'") # Anzahl an nicht gefundenen Artikeln



🔍 Suche Artikel in OpenAlex:   1%|▍                                                   | 1/132 [00:01<03:29,  1.60s/it]

❌ Fehlerhafte Anfrage: Philosophy's Folds: Seneca, Cavarero, and the History of Rectitude


🔍 Suche Artikel in OpenAlex:   2%|▊                                                   | 2/132 [00:03<03:26,  1.59s/it]

❌ Fehlerhafte Anfrage: The "Bio" Politics of Matter and Mattering for Feminist Engagements with Biosocial, Biocultural, and Posthuman Embodiment


🔍 Suche Artikel in OpenAlex:   8%|████▎                                              | 11/132 [00:17<03:05,  1.54s/it]

❌ Fehlerhafte Anfrage: Remembering and Loving in Relationships Involving Dying, Death, and Grief


🔍 Suche Artikel in OpenAlex:   9%|████▋                                              | 12/132 [00:18<03:02,  1.52s/it]

❌ Fehlerhafte Anfrage: Why Love Kills: Power, Gender Dichotomy, and Romantic Femicide


🔍 Suche Artikel in OpenAlex:  10%|█████                                              | 13/132 [00:20<03:01,  1.52s/it]

❌ Fehlerhafte Anfrage: Work the Root: Black Feminism, Hoodoo Love Rituals, and Practices of Freedom


🔍 Suche Artikel in OpenAlex:  20%|██████████                                         | 26/132 [00:40<02:45,  1.56s/it]

❌ Fehlerhafte Anfrage: The Secularity of Empire, the Violence of Critique: Muslims, Race, and Sexuality in the Politics of Knowledge-Production


🔍 Suche Artikel in OpenAlex:  32%|████████████████▏                                  | 42/132 [01:05<02:17,  1.53s/it]

❌ Fehlerhafte Anfrage: Gender, Shame, and the Pantsuit


🔍 Suche Artikel in OpenAlex:  34%|█████████████████▍                                 | 45/132 [01:09<02:15,  1.56s/it]

❌ Fehlerhafte Anfrage: Marriage in Kumasi, Ghana: Locally Emergent Practices in the Colonial/Modern Gender System


🔍 Suche Artikel in OpenAlex:  36%|██████████████████▌                                | 48/132 [01:14<02:13,  1.59s/it]

❌ Fehlerhafte Anfrage: Structural Violence, Intersectionality, and "Justpeace": Evaluating Women's Peacebuilding Agency in Manipur, India


🔍 Suche Artikel in OpenAlex:  38%|███████████████████▎                               | 50/132 [01:17<02:07,  1.56s/it]

❌ Fehlerhafte Anfrage: Mother Love, Maternal Ambivalence, and the Possibility of Empowered Mothering


🔍 Suche Artikel in OpenAlex:  39%|████████████████████                               | 52/132 [01:20<02:05,  1.56s/it]

❌ Fehlerhafte Anfrage: Personal Autonomy, Social Identity, and Oppressive Social Contexts


🔍 Suche Artikel in OpenAlex:  41%|████████████████████▊                              | 54/132 [01:23<02:00,  1.55s/it]

❌ Fehlerhafte Anfrage: Eudaimonism, Human Nature, and the Burdened Virtues


🔍 Suche Artikel in OpenAlex:  42%|█████████████████████▎                             | 55/132 [01:25<01:59,  1.56s/it]

❌ Fehlerhafte Anfrage: Corrigendum: A Call for Healing: Transphobia, Homophobia, and Historical Trauma in Filipina/o/x American Activist Organizations


🔍 Suche Artikel in OpenAlex:  55%|████████████████████████████▏                      | 73/132 [01:53<01:33,  1.58s/it]

❌ Fehlerhafte Anfrage: Beauvoir on the Lived Experience of Politics, Time, and Sex


🔍 Suche Artikel in OpenAlex:  56%|████████████████████████████▌                      | 74/132 [01:55<01:32,  1.60s/it]

❌ Fehlerhafte Anfrage: Survivors, Liars, and Unfit Minds: Rhetorical Impossibility and Rape Trauma Disclosure


🔍 Suche Artikel in OpenAlex:  57%|████████████████████████████▉                      | 75/132 [01:56<01:30,  1.59s/it]

❌ Fehlerhafte Anfrage: Feminism, Capitalism, and Ecology


🔍 Suche Artikel in OpenAlex:  59%|██████████████████████████████▏                    | 78/132 [02:01<01:25,  1.58s/it]

❌ Fehlerhafte Anfrage: Revealing Ireland's "Proper" Heart: Apology, Shame, Nation


🔍 Suche Artikel in OpenAlex:  64%|████████████████████████████████▍                  | 84/132 [02:11<01:14,  1.55s/it]

❌ Fehlerhafte Anfrage: Collective Love as Public Freedom: Dancing Resistance. Ehrenreich, Arendt, Kristeva, and "Idle No More"


🔍 Suche Artikel in OpenAlex:  66%|█████████████████████████████████▌                 | 87/132 [02:15<01:08,  1.53s/it]

❌ Fehlerhafte Anfrage: Shatter Not the Branches of the Tree of Anger: Mothering, Affect, and Disability


🔍 Suche Artikel in OpenAlex:  70%|███████████████████████████████████▉               | 93/132 [02:24<01:00,  1.56s/it]

❌ Fehlerhafte Anfrage: Resisting the Logic of Ambivalence: Bad Faith as Subversive, Anticolonial Practice


🔍 Suche Artikel in OpenAlex:  75%|██████████████████████████████████████▎            | 99/132 [02:34<00:54,  1.64s/it]

❌ Fehlerhafte Anfrage: Femininity, Shame, and Redemption


🔍 Suche Artikel in OpenAlex:  78%|███████████████████████████████████████           | 103/132 [02:41<00:46,  1.61s/it]

❌ Fehlerhafte Anfrage: "Four Women of Egypt": Memory, Geopolitics, and the Egyptian Women's Movement during the Nasser and Sadat Eras


🔍 Suche Artikel in OpenAlex:  84%|██████████████████████████████████████████        | 111/132 [02:53<00:32,  1.53s/it]

❌ Fehlerhafte Anfrage: A Call for Healing: Transphobia, Homophobia, and Historical Trauma in Filipina/o/x American Activist Organizations


🔍 Suche Artikel in OpenAlex:  85%|██████████████████████████████████████████▍       | 112/132 [02:54<00:30,  1.54s/it]

❌ Fehlerhafte Anfrage: Woman-Hating: On Misogyny, Sexism, and Hate Speech


🔍 Suche Artikel in OpenAlex:  87%|███████████████████████████████████████████▌      | 115/132 [02:59<00:26,  1.54s/it]

❌ Fehlerhafte Anfrage: Silence, Silencing, and (In)Visibility: The Geopolitics of Tehran's Silent Protests


🔍 Suche Artikel in OpenAlex:  88%|███████████████████████████████████████████▉      | 116/132 [03:01<00:24,  1.55s/it]

❌ Fehlerhafte Anfrage: What an [En]tangled Web We Weave: Emotions, Motivation, and Rethinking Us and the "Other"


🔍 Suche Artikel in OpenAlex:  93%|██████████████████████████████████████████████▌   | 123/132 [03:11<00:13,  1.54s/it]

❌ Fehlerhafte Anfrage: The Hidden Labors of Mary Mottley, Madame de Tocqueville


🔍 Suche Artikel in OpenAlex:  95%|███████████████████████████████████████████████▎  | 125/132 [03:14<00:10,  1.53s/it]

❌ Fehlerhafte Anfrage: "Everything Being Tangled Up in Every Other Thing": Class, Desire, and Shame in Michelle Tea's "The Passionate Mistakes and Intricate Corruption of One Girl in America"


🔍 Suche Artikel in OpenAlex:  99%|█████████████████████████████████████████████████▌| 131/132 [03:24<00:01,  1.53s/it]

❌ Fehlerhafte Anfrage: The Role of Darwin in Elizabeth Grosz's Deleuzian Feminist Theory: Sexual Difference, Ontology, and Intervention


🔍 Suche Artikel in OpenAlex: 100%|██████████████████████████████████████████████████| 132/132 [03:25<00:00,  1.56s/it]


✅ Fertig! 103 Einträge erfolgreich gespeichert.
⚠️ 29 Titel konnten nicht gefunden werden – siehe 'fehlerhafte_titel.txt'





# Zweiter Teil
## Namen der Referenzen herausarbeiten
(Läuft wegen der Menge an Referenzen etwas länger.)

<br>
Ausgabedatei:
- referenz_autoren.json: Alle in Hypatia referenzierten Titel mit Informationen zu OpenAlex-URL, Titel, Jahr und AutorInnen

In [5]:
# Lade die Liste deiner Referenz-URLs oder -IDs
with open("zitationsdaten_hypatia_openalex_2017-2018.json", "r", encoding="utf-8") as f:
    daten = json.load(f)

# Alle eindeutigen Referenz-IDs sammeln
referenz_ids= set()
for eintrag in daten:
    referenz_ids.update(eintrag.get("Referenzen", []))

# Datenstruktur für Ergebnisse
referenz_infos = {}

# Nach drei Versuchen zum nächsten skippen
MAX_RETRIES = 3

# Hauptloop über alle Referenz-IDs
for rid in tqdm(referenz_ids, desc="Hole Referenzdaten von OpenAlex"):
    # Extrahiere die ID z. B. "W1234567890" aus URL
    if rid.startswith("https://openalex.org/"):
        work_id = rid.split("/")[-1]
    else:
        work_id = rid

    # Baue API-URL korrekt
    api_url = f"https://api.openalex.org/works/{work_id}"

    for attempt in range(MAX_RETRIES):
        try:
            response = requests.get(api_url)

            # Erfolgreiche und nicht-leere Antwort
            if response.status_code == 200 and response.content.strip():
                paper = response.json()
                autoren = [a["author"]["display_name"] for a in paper.get("authorships", [])]

                referenz_infos[rid] = {
                    "title": paper.get("title"),
                    "authors": autoren,
                    "year": paper.get("publication_year")
                }
                break  # fertig, weiter zur nächsten ID
            else:
                time.sleep(2)

        except Exception as e:
            if attempt == MAX_RETRIES - 1:
                referenz_infos[rid] = {"error": str(e)}
            time.sleep(2)

# Speichere alle Daten
with open("referenz_autoren.json", "w", encoding="utf-8") as f:
    json.dump(referenz_infos, f, indent=2, ensure_ascii=False)

print("✅ Referenzdaten wurden gespeichert in 'referenz_autoren.json'")


Hole Referenzdaten von OpenAlex: 100%|█████████████████████████████████████████████| 2006/2006 [20:15<00:00,  1.65it/s]

✅ Referenzdaten wurden gespeichert in 'referenz_autoren.json'





### Ergebnisstruktur der Daten in 'referenz-autoren.json': 

"https://openalex.org/W2052757464": {
    "title": "The Moral Sex: Woman's Nature in the French Enlightenment",
    "authors": [
      "Londa Schiebinger",
      "Lieselotte Steinbrügge",
      "Pamela E. Selwyn"
    ],
    "year": 1995
  },