## OAI2-Abfrage mit ChatGPT

In diesem Beispiel zeigen wir, wie man die OAI2-Schnittstelle der DNB automatisiert abfragt und die Metadaten im oai_dc-Format erhält.

### Vorbereitung

Stellen Sie sicher, dass Sie die erforderlichen Bibliotheken installiert haben. Falls nicht, führen Sie die folgenden Befehle im Terminal oder in der Befehlszeile aus:

```bash
pip install requests
pip install xml.etree.ElementTree


In [1]:
import requests
import xml.etree.ElementTree as ET
import csv

# OAI-URL
oai_url = 'https://services.dnb.de/oai2/repository'

# Funktion zur Abfrage der Sets
def get_sets():
    params = {
        'verb': 'ListSets'
    }
    response = requests.get(oai_url, params=params)
    return response.content

# Funktion zur Abfrage von Metadaten
def get_records(set_spec):
    params = {
        'verb': 'ListRecords',
        'set': set_spec,
        'metadataPrefix': 'oai_dc'
    }
    response = requests.get(oai_url, params=params)
    return response.content

# Set-Spezifikator
set_spec = 'dnb:digitalisate-oa:projekt29'

# Anzahl der Titel, die heruntergeladen werden sollen
num_titles = 50

# Sets abfragen
sets_response = get_sets()
sets_xml = ET.fromstring(sets_response)
sets = sets_xml.findall('.//{http://www.openarchives.org/OAI/2.0/}set')
for set_element in sets:
    spec = set_element.find('.//{http://www.openarchives.org/OAI/2.0/}setSpec').text
    name = set_element.find('.//{http://www.openarchives.org/OAI/2.0/}setName').text
    print('Set:', spec, '-', name)

# Metadaten abfragen
records_response = get_records(set_spec)
records_xml = ET.fromstring(records_response)
records = records_xml.findall('.//{http://www.openarchives.org/OAI/2.0/}record')

# CSV-Datei zum Speichern der Titel erstellen
csv_filename = 'dnb_titles.csv'
with open(csv_filename, 'w', newline='', encoding='utf-8') as csvfile:
    writer = csv.writer(csvfile)
    writer.writerow(['Title', 'Creator', 'Date'])

    # Titel in die CSV-Datei schreiben
    count = 0
    for record_element in records:
        if count >= num_titles:
            break
        
        metadata = record_element.find('.//{http://www.openarchives.org/OAI/2.0/}metadata')
        oai_dc = metadata.find('.//{http://www.openarchives.org/OAI/2.0/oai_dc/}dc')

        # Metadaten extrahieren
        title = oai_dc.find('.//{http://purl.org/dc/elements/1.1/}title').text
        creator = oai_dc.find('.//{http://purl.org/dc/elements/1.1/}creator').text
        date = oai_dc.find('.//{http://purl.org/dc/elements/1.1/}date').text

        # Titel in CSV schreiben
        writer.writerow([title, creator, date])

        count += 1

print(f'{count} Titel wurden erfolgreich in der Datei "{csv_filename}" gespeichert.')


Set: dnb:digitalisate-oa - Digitalisate von Druckwerken (Open Access)
Set: dnb:digitalisate-oa:projekt1 - Digitalisate von Druckwerken (Open Access) - Projekt 1
Set: dnb:digitalisate-oa:projekt2 - Digitalisate von Druckwerken (Open Access) - Projekt 2
Set: dnb:digitalisate-oa:projekt3 - Digitalisate von Druckwerken (Open Access) - Projekt 3
Set: dnb:digitalisate-oa:projekt4 - Digitalisate von Druckwerken (Open Access) - Projekt 4
Set: dnb:digitalisate-oa:projekt5 - Digitalisate von Druckwerken (Open Access) - Projekt 5
Set: dnb:digitalisate-oa:projekt6 - Digitalisate von Druckwerken (Open Access) - Projekt 6
Set: dnb:digitalisate-oa:projekt7 - Digitalisate von Druckwerken (Open Access) - Projekt 7
Set: dnb:digitalisate-oa:projekt8 - Digitalisate von Druckwerken (Open Access) - Projekt 8
Set: dnb:digitalisate-oa:projekt9 - Digitalisate von Druckwerken (Open Access) - Projekt 9
Set: dnb:digitalisate-oa:projekt10 - Digitalisate von Druckwerken (Open Access) - Projekt 10
Set: dnb:digitalis

AttributeError: 'NoneType' object has no attribute 'text'