In [None]:
import requests
import csv
import xml.etree.ElementTree as ET
import pandas as pd

base_url = 'https://services.dnb.de/oai2/repository'

# Funktion zum Senden der OAI2-Anfrage und Empfangen der Antwort
def send_oai2_request(url, params):
    response = requests.get(url, params=params)
    return response.text

# Funktion zum Zählen der Anzahl von Datensätzen im gewünschten Set
def count_records():
    # Definieren des gewünschten Set-Spezifikators
    desired_set = 'dnb:digitalisate-oa:projekt29'
    
    # Definieren der Parameter für die OAI2-Anfrage
    params = {
        'verb': 'ListIdentifiers',
        'metadataPrefix': 'oai_dc',
        'set': desired_set
    }
    
    # Senden der OAI2-Anfrage
    response = send_oai2_request(base_url, params)
    
    # Parsen der XML-Antwort und Zählen der Header-Elemente
    root = ET.fromstring(response)
    record_count = len(root.findall('.//{http://www.openarchives.org/OAI/2.0/}header'))
    
    # Rückgabe der Anzahl der Datensätze
    return record_count

# Funktion zum Abrufen der Titel der ersten 5 Datensätze im gewünschten Set
def get_titles():
    # Definieren des gewünschten Set-Spezifikators
    desired_set = 'dnb:digitalisate-oa:projekt29'
    
    # Definieren der Parameter für die OAI2-Anfrage
    params = {
        'verb': 'ListRecords',
        'metadataPrefix': 'oai_dc',
        'set': desired_set
    }
    
    # Senden der OAI2-Anfrage
    response = send_oai2_request(base_url, params)
    
    # Parsen der XML-Antwort
    root = ET.fromstring(response)
    
    # Extrahieren der Titel der ersten 5 Datensätze
    titles = []
    for record in root.findall('.//{http://www.openarchives.org/OAI/2.0/}record')[:5]:
        title_element = record.find('.//{http://purl.org/dc/elements/1.1/}title')
        title = title_element.text.strip() if title_element is not None else None
        titles.append(title)
    
    # Rückgabe der Titel
    return titles

# Abfragen der Anzahl der Datensätze
record_count = count_records()
print(f"Anzahl der Datensätze im Set 'dnb:digitalisate-oa:projekt29': {record_count}")

# Abrufen der Titel der ersten 5 Datensätze
title_list = get_titles()

# Speichern der Anzahl der Datensätze und der Titel in einer CSV-Datei
filename = 'dataset_info.csv'
data = {'Anzahl der Datensätze': [record_count], 'Titel': title_list}
df = pd.DataFrame(data)

df.to_csv(filename, index=False)
print(f"Die Informationen wurden erfolgreich in der Datei '{filename}' gespeichert.")


Anzahl der Datensätze im Set 'dnb:digitalisate-oa:projekt29': 50
