PyLib: Sammlung von Python-Modulen für die Arbeit mit bibliographischen Daten

Das Repositorium enthält Module, die für die Arbeit mit bibliographischen Daten an der Herzog August Bibliothek Wolfenbüttel mit dem Schwerpunkt Alte Drucke entwickelt wurden. Sie sind optimiert für die Arbeit mit dem PICA-Format, den SRU-Schnittstellen des GBV und K10plus, der WinIBW 3 und das Signaturensystem der HAB. Die Module werden laufend erweitert und angepasst, bei der Verwendung von älterem Client Code kann es daher zu Problemen kommen.

Installation

Herunterladen des Repositoriums in ein beliebiges Verzeichnis. Im Wurzelverzeichnis der Anwendung (in der Regel "pylib") können Skripte mit Python 3 (getestet mit Python 3.7.0) ausgeführt werden. Die einzelnen Module liegen im Ordner "lib". Sie können folgendermaßen geladen werden:

from lib import {modul} as {namespace}

{modul} ist dabei der Name einer im Ordner "lib" liegenden Python-Datei ohne Endung. {namespace} ist ein frei wählbares Kürzel, die Verwendung ist optional.

Beschreibung der Module

Unvollständige oder obsolete Module werden ausgelassen. Methoden oder Eigenschaften werden nur angegeben, wenn sie für die Benutzung relevant sind.

Modul aadgenre

Gattungsbegriffe der Arbeitsgemeinschaft Alte Drucke beim GBV und SWB zur Benutzung in Python. Codebeispiel:

from lib import aadgenre
test = "Rezensionszeitschrift"

# URI zu Begriff bekommen 
uri = aadgenre.get_url("Vorlesungsverzeichnis")
if uri != None:
	print(uri)
	
# Testen, ob ein Begriff in den AAD-Gattungsbegriffen vorkommt
if(aadgenre.test_genre(test) == True):
	print(f"{test} ist ein AAD-Gattungsbegriff")

# Alle auflisten
terms = aadgenre.get_list()
print(terms)

# Dictionary mit PPNs und Begriffen ausgeben
aad_dict = aadgenre.Genre.genre_list
print(aad_dict)

Modul bookwheel

Recherche von Erwerbungsdaten anhand von Seitenzahlen im Bücherradkatalogs von August dem Jüngeren (1579–1666). Zugrunde gelegt werden die Angaben bei Maria von Katte, Herzog August und die Kataloge seiner Bibliothek, in: Wolfenbütteler Beiträge 1 (1972), S. 168–199, hier S. 177–182

Klasse Catalogue:

Repräsentation des Bücherradkatalogs. Methoden:

Name	Parameter	Rückgabewert	Effekt
get_section	page	Dictionary (Daten zur Katalogsektion), None bei Misserfolg	-
get_year	page (Seitenzahl als Integer)	Erwerbungsjahr, normalisiert (Integer), None bei Misserfolg	-

Beispiel: Suche nach den Daten zur Katalogseite 2589:

from lib import bookwheel as bw
cat = bw.Catalogue
sec = cat.get_section(2589)
print(sec)

Ausgabe:

{'start': 2511, 'end': 2738, 'group': 'Libri Varii', 'dateBegin': '1634', 'year': 1634, 'writer': 'Herzog August'}

Modul cache

Caching von Daten, die von einer Schnittstelle mit einer ID oder Suchanfrage heruntergeladen werden.

Klasse Cache

Methoden:

Name	Parameter	Rückgabewert	Effekt
__init__	folder (Standardwert cache/default)	-	Anlegen des Ordners, wenn er nicht vorhanden ist.
get_content	url, id	Datei	Wenn die Datei im Ordner unter id abgelegt ist, wird sie von dort geladen, ansonsten wird sie von url geladen und gecacht.

Klasse CacheGND

Methoden:

Name	Parameter	Rückgabewert	Effekt
__init__	folder (Standardwert cache/gnd)	-	Anlegen des Ordners, wenn er nicht vorhanden ist.
get_json	id (=GND-Nummer)	JSON-Datei	Wenn die Datei im Ordner unter id vorhanden ist, wird sie von dort geladen, ansonsten wird sie von http://hub.culturegraph.org/entityfacts/{id} geladen und gecacht.

Klasse CacheLobid

Methoden:

Name	Parameter	Rückgabewert	Effekt
__init__	folder (Standardwert cache/lobid)	-	Anlegen des Ordners, wenn er nicht vorhanden ist.
get_json	query, start, size	JSON-Datei	Wenn die Datei im Ordner unter `query_start-ende` abgelegt ist, wird sie von dort geladen, ansonsten wird sie von https://lobid.org/resources/search geladen und gecacht.

Klasse CacheMarcHBZ

Methoden:

Name	Parameter	Rückgabewert	Effekt
__init__	folder (Standardwert cache/marc-hbz)	-	Anlegen des Ordners, wenn er nicht vorhanden ist.
get_xml	id	XML-Datei	Wenn die Datei im Ordner unter id abgelegt ist, wird sie von dort geladen, ansonsten wird sie von https://alma.lobid.org/marcxml/{id} geladen und gecacht.

Modul csvt

Abspeichern von Daten in einer CSV-Tabelle, Auslesen vorhandener CSV-Tabellen.

Klasse Table:

Abstraktionsschicht für die Arbeit mit einer CSV-Tabelle.

Methoden:

Name	Parameter	Rückgabewert	Effekt
__init__	fields (Liste mit Feldnamen, Standard leer), content (Liste mit Listen, die Werte enthalten, Standard leer)	Objekt der Klasse Table	-
save	path (Pfad zum Speichern ohne Namenserweiterung), encoding (Zeichencodierung, Standard ist "utf-8")	True	Abspeichern einer CSV-Tabelle mit Zeichencodierung utf-8 und Delimiter ";" unter dem angegebenen Namen oder Pfad
to_dict	-	Liste mit allen Zeilen als Dictionary, worin die Spaltennamen die Keys sind	-
add_column	name (Name der neuen Spalte)	True	Hinzufügen einer Spalte zu der Tabelle
add_sortable	name (Name der Spalte, die die Signatur enthält, Standardwert "Signatur")	True	Hinzufügen einer Spalte "Sortierform", die sortierbare Strings zu den Signaturen der HAB enthält
toSQLite	fileName (Standard "exportTable")	True	Export der Tabelle als SQLite-Datenbank mit einer Tabelle namens "main" unter Benutzung des Moduls localsql. Die Datenbank wird als Datei unter dem angegebenen Namen abgelegt.
load	path (Pfad zu der zu ladenden CSV-Datei ohne Namenserweiterung), encoding (Zeichencodierung des Dokuments, Standard ist utf-8)	True bei Erfolg, sonst False	Laden der Feldnamen in Table.fields und der Daten in Table.content

Beispiel:

from lib import csvt
fields = ["VD16-Nummer", "Jahr", "Signatur"]
data = [
	["VD16 D 2342", "1589", "Rd 2 37 (1)"],
	["VD16 D 2633", "1549", "1003.6 Theol. (5)"],	
	["VD16 D 340", "1586", "QuN 741 (1)"]
	]
table = csvt.Table(fields, data)
table.save("VD16")

Über das Objekt kann iteriert werden, zurückgegeben wird jeweils ein Dictionary mit den Spaltennamen als Keys:

for row in table:
	print(row["VD16-Nummer"])

Klasse TableWin: Abgeleitete Klasse mit der Zeichencodierung "cp1252"

Klasse TableGeoBrowser:

Erzeugt eine CSV-Tabelle zum Import in den DARIAH GeoBrowser. Die Felder sind: Name, Address, Description, Longitude, Latitude, TimeStamp, TimeSpan:begin, TimeSpan:end, GettyID, weight.

Methoden:

Name	Parameter	Rückgabewert	Effekt
__init__	content (Liste mit Objekten vom Typ `csvt.GeoDataRow`), optional	-
import_row	row (Objekt vom Typ `csvt.GeoDataRow`)	--	--
fill_geo_data	gdb (Objekt vom Typ `geo.DB`)	True	Ergänzen der Felder `Longitude` und `Latitude`, wo sie leer sind aus einer lokalen Geodatensammlung
save	path (Dateipfad, unter dem abgespeichert werden soll ohne ".csv"	True	Abspeichern der Datei unter dem angegebenen Pfad, mit Ergänzen der Endung

Klasse GeoDataRow: Die Klasse enthält die Daten für eine Zeile in der von TableGeoBrowser verwalteten Tabelle. Methoden:

Name	Parameter	Rückgabewert	Effekt
__init__	name, long, lat, timeStamp, weight (alle optional)	-
to_list	-	Liste mit den für die Aufnahme in `TableGeoBrowser` notwendigen Werten	-

Modul dataset

Speichern und Verarbeiten von einfachen Metadensätzen wie Dublin Core.

Klasse Dataset Container für Einträge, diese werden in der Eigenschaft Dataset.fields gespeichert, standardmäßig ein leeres Dictionary. Daten werden mit dem Feldnamen (z. B. "title") als Index darin gespeichert. Der zugehörige Wert ist eine Liste, die eine beliebige Anzahl an Objekten der Klasse Entry enthält. Die Klasse ist nicht für die direkte Instanziierung vorgesehen, s. stattdessen Dataset DC

Methode	Parameter	Rückgabewert	Effekt
__init__	-	Instanz von Dataset
add_entry	field (Feldname), entry (Instanz von Entry)
get_entries	field (Feldname)	Liste mit den unter dem Feldnamen gespeicherten Entries	-
to_dict	-	Dictionary mit den Feldnamen als Schlüssel und einer Repräsentation der Entries als String, getrennt mit ";"	-
to_list	-	Liste mit Dictionaries, die jeden einzelnen Eintrag als Schlüssel-Wert-Paare repräsentieren	-

Abgeleitete Klasse DatasetDC Dataset mit vordefinierten Feldern für das Datenmodell Dublin Core.

Klasse Entry Ein einzelner Eintrag des Datensatzes. Er beinhaltet neben dem Wert auch optional eine Sprachangabe und eine Normdatenverknüpfung.

Methode	Parameter	Rückgabewert	Effekt
__init__	value, lang (Sprachangabe nach ISO 639-2), auth_sys (System der Normdatenverknüpfung, z. B. "GND"), auth_id (Identifier im Normdatensystem, z. B. GND-Nummer)	Instanz von Entry	-
__str__	-	String-Repräsentation des Eintrags mit angehängter Sprachangabe und Normdatenverknüpfung insoweit vorhanden	-

Beispiel:

import logging
from lib import dataset as ds

example = ds.DatasetDC()
example.add_entry("dc.identifier", ds.Entry("VD16 D 340"))
example.add_entry("dc.title", ds.Entry("Poematum || HENRICI || DECIMATORIS || GIFFHORNENSIS.|| Libri IIII.||", "lat"))
example.add_entry("dc.creator", ds.Entry("Decimator, Heinrich", "", "GND", "124613934"))
example.add_entry("dc.date", ds.Entry("1586"))

print(example.to_dict())

Ausgabe:

{'dc.identifier': 'VD16 D 340', 'dc.identifier.urn': '', 'dc.format': '', 'dc.type': '', 'dc.language': '', 'dc.title': 'Poematum || HENRICI || DECIMATORIS || GIFFHORNENSIS.|| Libri IIII.||@lat', 'dc.subject': '', 'dc.coverage': '', 'dc.description': '', 'dc.creator': 'Decimator, Heinrich#GND_124613934', 'dc.contributor': '', 'dc.publisher': '', 'dc.rights': '', 'dc.rights.uri': '', 'dcterms.rightsHolder': '', 'dc.source': '', 'dc.relation': '', 'dc.date': '1586', 'dc.date.embargo': '', 'dcterms.extent': '', 'dcterms.isPartOf': ''}

Modul duennhaupt

Arbeiten mit den Autor*innen in den Personalbibliographien zu den Drucken des Barock von Gerhard Dünnhaupt (Stuttgart 1990-1993).

Funktionen

get_persons(): Gibt eine Liste mit Person-Objekten aus

get_query_words(): Gibt eine Liste mit den Suchwörtern für alle Personen aus, die z. B. zum Durchsuchen eines Textes genutzt werden können.

Klassen

Klasse PersonList Enthält in der Property content eine Liste mit Personendaten

Klasse Person: Enthält die Daten zu einer einzelnen Person in folgenden Propertys:

name
gnd GND
vol (Band der Druckausgabe)
nameGND (GND-Ansetzungsform)
query (einfaches Suchwort)
regex (regulärer Ausdruck zum Auffinden unterschiedlicher Schreibweisen)
dateBirth
yearBirth
placeBirth
dateDeath
yearDeath
placeDeath
gender ("Mann" oder "Frau")
bio (Biographische Kurzbeschreibung)

Die magische Methode __str__ gibt den Namen mit Geburts- und Sterbejahr sowie GND-Nummer aus.

Modul evallist

Abgleichen von Titelliste mit dem K10plus oder dem OPAC der HAB. Das Modul nutzt die Module pica, sru und xmlreader.

Klasse Evaluation:

Methode	Parameter	Rückgabewert	Effekt
__init__	pers (Personenname, optional), title (Titel, optional), place (Erscheinungsort, optional), year (Erscheinungsjahr, optional)	Instanz von Evaluation	Bilden einer Suchanfrage und Ablage unter Evaluation.query
evaluate	-	Anzahl der Treffer	Ablage der Treffer in Evaluation.numFound (Integer), der PPNs als Array in Evaluation.ppns (Liste), aller Signaturen in Evaluation.shelfmarks (Liste)

Die abgefragte URL kann unter Evaluation.req.url abgerufen werden. Weil für die Ermittlung der PPNs und Signaturen nur die Aufnahmen der Druck-Ausgabe berücksichtigt werden (A-Aufnahmen), kann das Ergebnis abweichen.

Klasse Evaluation_HAB: Dasselbe für den OPAC der HAB Wolfenbüttel.

Codebeispiel:

from lib import evallist as el

testeval = el.Evaluation_HAB(None, "Neujahres Wundsch", None, "1698")
testeval.evaluate()

print(f"{str(testeval.numFound)} Treffer. PPNS: {', '.join(testeval.ppns)}, Signaturen: {'; '.join(testeval.shelfmarks)}")

Modul evalpdf

Durchsuchen von PDF-Dateien nach einer Liste von Suchbegriffen oder mit regulären Ausdrücken. Erfordert Installation des Moduls pdfplumber

Klasse Evaluation:

Methode	Parameter	Rückgabewert	Effekt
__init__	path (Pfad zu einer lokalen PDF-Datei), sww (Liste mit Suchbegriffen in Kleinbuchstaben), rexx (Set mit Tupeln, in denen jeweils ein Indexbegriff einem regulären Ausdruck zugeordnet wird)	Instanz von Evaluation	-
eval	-	True bei Erfolg, None bei Fehler	Durchführen der Suche, Speichern der Treffer enthaltenden Seiten unter Evaluation::index
eval_context	-	True bei Erfolg, None bei Fehler	Durchführen der Suche, Speichern der gefundenen Zeilen unter Evaluation::contexts
__str__	-	Auflistung der Ergebnisse unabhängig von der Art der Suche	-

Abgeleitete Klasse EvaluationSDD: Evaluation mit vordefinierten Suchwörtern für SDD-relevante Titel der HAB und

Beispiel: Auswertung von Auktion 208 bei Reiss & Sohn

ev = ep.EvaluationSDD("Reiss-208.pdf")
ev.eval()
print(ev)

Ausgabe:

SDD-Evaluation für source/kataloge/Reiss-208.pdf
17. Jh.: 5, 6, 13, 19, 20, 21, 22, 30, 34, 52, 54, 70, 76, 77, 78, 79, 80, 81, 82, 86, 87, 88, 97, 98, 99, 100, 115, 116, 118, 119, 129
emblem: 19, 38, 79, 116
lüneburg: 65
alchem: 79

Modul geo

Modul zum Laden, Speichern und Auffinden von Geodaten. Als Datenbank dient die Datei placeData.csv im Wurzelverzeichnis.

Klasse DB:

Datenbank, die die Daten aus der CSV-Tabelle lädt und performant vorhält.

Methoden der Klasse DB:

Name	Parameter	Rückgabewert	Effekt
__init__	path (Dateiname der CSV-Datei ohne Endung, Standardwert ist "placeData")	-	Einlesen der unter path angegebenen CSV-Datei
get_by_name	name (Ortsname)	Liste mit den Ortsdaten, False wenn nicht gefunden	-
add_place	placeName (Ortsname), getty (Getty-ID, optional), gnd (GND-Nummer, optional), long (geographische Länge, optional), lat (geographische Breite, optional), comment (Kommentar zum Ort, optional)	True	Einfügen eines neuen Datensatzes in die Tabelle
get_geodata	-	True	Laden aller fehlenden Geodaten, für die ein Identifier vorliegt, aus dem Getty Thesaurus oder der GND
save	-	-	Abspeichern der aktualisierten CSV-Tabelle

Funktionen des Moduls:

Name	Parameter	Rückgabewert	Effekt
normalize_placename	placeName (Ortsname)	String (normalisierte Form des Ortsnamens, z. B. "Frankfurt am Main" für "Frankfurt/M.")	-
get_geodata_getty	id (des Ortes im Getty Thesaurus)	Liste mit den Werten für Länge und Breite	-
get_geodata_gnd	id (GND-Nummer des Normdatensatzes)	Liste mit den Werten für Länge und Breite	-

Beispiel: Laden der Datenbank, Hinzufügen eines Ortseintrags mit GND-Nummer, Laden der Geodaten, Abspeichern der aktualisierten Tabelle

from lib import geo
db = geo.DB()
db.add_place("Haselünne", "", "4104376-5", "", "", "Landkreis Emsland")
db.get_geodata()
db.save()

Beispiel 2: Laden der Datenbank, Suche nach einem Ortseintrag, Ausgeben des Datensatzes als Liste

from lib import geo
db = geo.DB()
test = db.get_by_name("Neustadt an der Aisch")
print(test)

Ausgabe:

['Neustadt an der Aisch', '1040479', '', '10.6333', '49.5833', '']

Modul gnd

Validieren einer GND-Nummer und Harvesten von Informationen dazu.

Klasse ID

Methode	Parameter	Rückgabewert	Effekt
__init__	gnd (GND-Nummer)	Instanz der Klasse	Validieren der GND-Nummer, Ergebnis unter ID.valid
__str__	-	String-Repräsentation der GND-Nummer. Bei gescheiterter Validierung wird "(ungültig)" mit ausgegeben	-
get_info	-	Dictionary mit Informationen zur beschriebenen Entität (preferredName, dateOfBirth, dateOfDeath, biographicalOrHistoricalInformation, placeOfBirth, placeOfDeath, gender). None bei Misserfolg	-

Beispiel:

from lib import gnd
test = gnd.ID("141678615")
res = test.get_info()
print(res)

Ausgabe:

{'preferredName': 'Antoinette Amalie, Braunschweig-Lüneburg, Herzogin', 'dateOfBirth': '22. April 1696', 'dateOfDeath': '6. März 1762', 'biographicalOrHistoricalInformation': 'Frau von Herzog Ferdinand Albrecht II. von Braunschweig-Bevern (1680-1735); jüngste Tochter von Herzog Ludwig Rudolf von Braunschweig-Lüneburg (1671-1735) und Prinzessin Christine Luise von Oettingen-Oettingen', 'placeOfBirth': 'Wolfenbüttel', 'placeOfDeath': 'Braunschweig', 'gender': 'Frau'}

Modul hbz

Modul html

Beschreibung folgt

Modul incunabula

Beschreibung folgt

Modul isil

Umrechnung der kataloginternen Bibliothekskennung ELN in eine ISIL gemäß der Berliner ISIL- und Sigeldatei. Berücksichtigt werden alle Biblitoheken im VD17. Bereitstellung zusätzlicher Informationen zur Bibliothek und zum Ort.

Funktion	Parameter	Rückgabewert	Effekt
get_isil	ELN (String)	ISIL der Bibliothek, Ausgangswert falls unbekannt	-
get_bib	ELN oder ISIL (String)	Dictionary mit den Feldern "bib" (Bibliotheksname), "place" (Ortsname), "gettyPlace" (ID des Ortes im Getty Thesaurus of Geographic Names), "long" (geographische Länge), "lat" (geographische Breite)	-

Modul language

Sprachcodes nach ISO 639.2 Funktionen

getLang(str code)

Gibt die deutsche Sprachbezeichnung bei Eingabe des Codes aus, bei unbekanntem Code False

getCode(language)

Gibt zur Sprachbezeichnung den Code aus, bei unbekannten Sprachen False.

Modul lido

Beschreibung folgt

Modul lobid

Suche in der lobid-Schnittstelle des HBZ (http://lobid.org/)

Klasse Request_Lobid Allgemeine Suchanfrage

Methode	Parameter	Rückgabewert	Effekt
__init__	base (URL der Schnittstelle, z. B. http://lobid.org/gnd/search)	-	Initiieren der Klasse
prepare	query (in der Form title:diss*)	True bei Erfolg	Speichert die abgefragte URL unter self.url, die geparsten JSON-Daten unter self.data und die Treffermenge unter self.num_found. Die Antwort zu jeder Anfrage wird unter `cache/lobid` gespeichert, dieser Ordner muss ggf. vorher angelegt und bei Änderungen an den Daten geleert werden.

Codebeispiel:

import logging
import re
from  lib import lobid
logging.basicConfig()
logging.getLogger().setLevel(logging.DEBUG)

req = lobid.Request_Lobid("https://lobid.org/resources/search")
req.prepare("title:harmoniumbau")
print(f"Gefundene Treffer: {req.num_found}")
titles = req.data["member"]
for tit in titles:
    print(tit['title'])

Klasse Request_GNDLobid Abgeleitet von Request_GND. Suche nach Normdaten in https://lobid.org/gnd. Für das Harvesten von Informationen zu einzelnen GND-Nummern s. neben der unten stehenden Klasse Request_GNDLobid_ID auch das Modul gnd.

Methode	Parameter	Rückgabewert	Effekt
__init__	size (Standardwert 100)	-	Initiieren der Klasse
prepare	query (in der Form preferredName:Twain)	True bei Erfolg	Speichert die abgefragte URL unter self.url, die geparsten JSON-Daten unter self.data und die Treffermenge unter self.num_found. Die Antwort zu jeder Anfrage wird unter `cache/gnd-lobid` gespeichert, dieser Ordner muss ggf. vorher angelegt und bei Änderungen an den Daten geleert werden.
get_result	-	Dictionary mit Daten zu den gefundenen Entitäten	-

Klasse Request_GNDLobid_ID Abgeleitet von Request_GNDLobid. Suche nach Normdaten, bei der eine GND-Nummer übergeben wird.

Methode	Parameter	Rückgabewert	Effekt
__init__	size (Standardwert 100)	-	Initiieren der Klasse
prepare	query (in der Form preferredName:Twain)	True bei Erfolg	Speichert die abgefragte URL unter self.url, die geparsten JSON-Daten unter self.data und die Treffermenge unter self.num_found. Die Antwort zu jeder Anfrage wird unter `cache/gnd-lobid` gespeichert, dieser Ordner muss ggf. vorher angelegt und bei Änderungen an den Daten geleert werden.
get_result	-	Dictionary mit Daten zu den gefundenen Entitäten	-

Eigens extrahiert werden die Felder preferredName, gnd, variantNames, dateOfBirth, dateOfDeath, placeOfBirth, placeOfDeath, periodOfActivity, biographicalOrHistoricalInformation, gender, wikidata

Codebeispiel

req = lobid.Request_GNDLobid()
req.prepare("119362767")
data = req.get_result()
for key, value in data[0].items():
    print(f"{key}: {value}")

Modul localsql

Modul zur Arbeit mit einer lokalen SQLite-Datenbank, das auf dem Python-Modul sqlite3 basiert.

Klasse Database

Methode	Parameter	Rückgabewert	Effekt
__init__	file_name (optional, Standardwert "mydb")	-	Initiieren der Klasse, kein Abspeichern der Datenbank
insert_content	fields (Liste der Spaltennamen), content (Liste mit Listen, die die zugehörigen Werte enthalten)	True	Anlage einer Datenbank unter dem bei der Initiierung angegebenen Dateinamen plus Endung ".db". Die Datenbank enhält eine Tabelle "main" mit den Feldnamen als Spalten und den in content übergebenen Daten als Inhalt.
fetch_dict	-	Gesamte Tabelle main als Dictionary	-
sql_action	command	True	Ausführen eines SQL-Kommandos
sql_mult_action	commands (Liste)	True	Ausführen mehrerer SQL-Kommandos
sql_request	sql (Anfrage, die "SELECT" enthalten muss.	Ergebnisse eines SQL-Request als Liste, None bei ungültiger Anfrage	Ausführen mehrerer SQL-Befehle
sql_mult_request	commands (Mehrere SQL-Requests als Liste, müssen jeweils "SELECT" enthalten)	Liste mit den Ergebnissen der einzelnen Requests, jeweils als Liste. None bei ungültiger Anfrage.	--
print_description	-	True	Druck der enthaltenen Tabellen und Spalten in der Standardausgabe
erase	-	True/False je nach Erfolg	Löschen der Datei mit der Datenbank

Codebeispiel:

from lib import localsql as ls

db = ls.Database()
columns = ["VDNummer", "Titel", "Jahr"]
content = [
        ["VD17 23:741880L", "Vienna Gloriosa Honoribus Illustrissimorum, Perillustrium, Reverendorum, Prænobilium, Nobilium, Ac Eruditorum Dominorum Neo-Baccalaureorum", "1700"],
        ["VD17 23:716651Z", "Ad Tumulum Viri Plurimum Reverendi, Excellentissimi & Clarissimi Dn. Michaelis Behmii, SS. Theologiae Doctoris, & Professoris in alma Regiomontana quondam Celeberrimi", "1652"],
        ["VD17 23:641886D", "Newe Carmelitische Schatz-Cammer Das ist Kurtzer bericht von dem Reichtumb und geistlichen Schatz der Bruderschafft des wurdigen Scapuliers unser lieben Frawen", "1628"],
        ["VD17 23:757429X", "Geistlich Tagwerck/ aller Christglaubigen/ so zu Gott irem Schöpffer vnd Erlöser/ vnd zum ewigen Leben/ lust vnd lieb haben", "1607"]
    ]
db.insert_content(columns, content)

test = db.sql_request("SELECT * FROM main WHERE Titel LIKE '%Excell%'")
print(test)

Modul maps

Beschreibung folgt

Modul mets

Beschreibung folgt

Modul network

Klassen zur Abbildung eines Netzwerks, das auch Knoten und Relationen besteht. Daten können in Cypher ausgegeben und direkt in eine neo4j-Instanz gespielt werden. Aus der GND können Daten zur Abbildung von Personennetzen importiert werden.

Klasse Graph

Methode	Parameter	Rückgabewert	Effekt
__init__	nodes (Liste mit Objekten vom Typ network.Node, optional), relations (Liste mit Objekten vom Typ network.Relation, optional)	-	Instanziierung des Objekts

Klasse Node

Methode	Parameter	Rückgabewert	Effekt
__init__	id (eindeutiger Identifier für den Knoten), name, type, attributes (Dictionary mit Schlüssel-Wert-Paaren)	-	Instanziierung des Objekts

Klasse Relation

Methode	Parameter	Rückgabewert	Effekt
__init__	origin (ID des Ausgangsknotens), target (ID des Zielknotens), type (Typus der Relation), attributes (Dictionary mit Schlüssel-Wert-Paaren)	--	--

Klasse GraphGND Erstellen eines Netzwerks aus GND-Daten, ausgehend von einer oder mehreren GND-Nummern. Die GND-Datensätze werden unter der Nummer im Ordner cache/gnd abgespeichert, hierzu wird das Modul cache verwendet.

Codebeispiel:

from lib import network as nw

# Anlegen eines GND-basierten Personennetzwerks
graph = GraphGND()

# Importieren der GND-Nummern von Leibniz, Lessing und Goethe
gnds = ["118571249", "118572121", "118540238"]

# Wiederholtes Importieren der mit den vorhandenen relationierten Personen
graph.importGNDs(gnds)
graph.import_related()
graph.import_related()
graph.import_related()

# Ausgabe der Zahl von Knoten und Relationen
print(graph)

# Abspeichern unter mygraph.cypher
graph.save:cypher("mygraph")

# Exportieren nach neo4j
graph.to_neo4j("neo4j://localhost:7687", "{Nutzer}", "{Passwort}", "{Datenbank}")

Modul oai

Beschreibung folgt

Modul opac

Beschreibung folgt

Modul pica

Auslesen von bibliographischen Daten in PICA-XML. Jeder Datensatz wird in eine objektförmige Struktur mit sprechenden Feldnamen und intuitiven hierarchischen Beziehungen umgewandelt. Die Daten können in JSON oder XML abgespeichert werden.

Klasse Record Objekt zur Repräsentation eines bibliographischen Datensatzes. Zur gemeinsamen Benutzung mit xmlreader.DownloadReader

Methoden:

Name	Parameter	Rückgabewert	Effekt
__init__	node (xml.etree.ElementTree.Element)	Instanz von Record	-
__str__	-	Repräsentation des Datensatzes als String (enthält PPN und Jahr)	-

Beispiel:

from lib import xmlreader as xr
from lib import pica

folder = "downloads/helmstedt"
reader = xr.DownloadReader(folder, "record", "info:srw/schema/5/picaXML-v1.0")
for node in reader:
	rec = pica.Record(node)
	print(rec)

Klasse RecordVD16 Abgeleitete Klasse zur Verarbeitung von Daten aus dem VD 16

Klasse RecordVD17 Abgeleitete Klasse zur Verarbeitung von Daten aus dem VD 17

Klasse RecordVD18 Abgeleitete Klasse zur Verarbeitung von Daten aus dem VD 18

Klasse RecordInc Abgeleitete Klasse zur Verarbeitung von Inkunabeln

Felder für bibliographische Einheiten

Feld	Typ	Inhalt
ppn	String	ID in der Datenbank
vdn	String	VD-Nummer
bbg	String	Code für Bibliographische Gattung und Status s. Dokumentation
catRule	String	Bei der Katalogisierung angewandtes Regelwerk, entweder "rak" oder "rda"
date	String	Datierung als Jahreszahl
lang	Liste	Sprachcodes nach ISO 639-2
langOrig	Liste	Sprachcodes der Originalsprache bei Übersetzungen
title	String	Titel einschließlich Untertitel
resp	String	Verantwortlichkeitsangabe
edition	String	Ausgabevermerk
format	String	Bibliographisches Format
pages	String	Kollationsvermerk
normPages	Integer	Normalisierte Seitenangabe. Der Algorithmus berücksichtigt Seiten- und Blattangaben, von-bis-Angaben, Ausdrücke mit "i.e." oder "das heißt" und römische Zahlen. S. die Funktion get_norm_p() unter https://github.com/hbeyer/pylib/blob/main/lib/pica.py
ppn_sup	String	Bei Teilen mehrbändiger Werke: ID der Gesamtaufnahme
title_sup	String	Bei Teilen mehrbändiger Werke: Titel der Gesamtaufnahme
vol	String	Bei Teilen mehrbändiger Werke: Bandangabe
digi	Liste	URLs von Digitalisaten
gatt	Liste	Gattungsbegriffe der AAD
subjects	Liste	Schlagwörter
persons	Liste	Personen, die als VerfasserInnen, BeiträgerInnen oder sonstige Personen erwähnt sind als Person-Objekte
publishers	Liste	DruckerInnen und/oder VerlegerInnen als Person-Objekte
places	Liste	Erscheinungsorte als Place-Objekte
copies	Liste	Exemplare als Copy-Objekte
provenances	Liste	Provenienzinformationen auf dem Shared Level (Feld 9100) in strukturierter Form (s. Modul provenance)

Klasse Person

Feld	Typ	Inhalt
persName	String	Name, in der Form "Vorname, Nachname"
role	String	Beziehungskennzeichnung nach RDA (VerfasserIn etc.) oder DC (creator, contributor, publisher)
gnd	String	GND-Nummer
dateBirth	String	Geburtsdatum
dateDeath	String	Sterbedatum

Klasse Place

Feld	Typ	Inhalt
placeName	String	Ortsname
getty	String	ID im Getty Thesaurus
geoNames	String	ID bei GeoNames
gnd	String	GND-Nummer
rel	String	Beziehungskennzeichnung: "Erscheinungsort", "Herstellungsort", "Enstehungsort" oder "Vertriebsort"

Klasse Copy

Feld	Typ	Inhalt
place	String	Bibliotheksort
bib	String	Bibliothek
isil	String	ISIL der Bibliothek, s. ISIL-Datei
eln	String	ELN (External Library Number) der Bibliothek
iln	String	ILN (Internal Library Number) der Bibliothek
shelfmark	String	Signatur
epn	String	ID des Lokalsatzes
prov_dataset	Liste	Lokale Provenienzinformationen in strukturierter Form (Modul provenance)

Modul portapp

Abstraktionsschicht für die Porträtdatenbank der HAB, veröffentlicht unter http://portraits.hab.de.

Klasse ArtCollection

...

Klasse Serializer

...

Abgeleitete Klasse SerializerXML(Serializer)

...

Abgeleitete Klasse SerializerCSV(Serializer)

...

Abgeleitete Klasse SerializerSel(SerializerCSV)

...

Klasse Artwork

Enthält die zu einem Porträt gehörigen Daten.

Property	Datentyp	Erklärung
id	String	Interne ID
anumber	String	A-Nummer aus Mortzfeld A
url	String	URL des Datensatzes in der Online-Fassung
urlImage	String	URL der Bilddatei auf dem Server der HAB
invNo	String	Inventarnummer
artists	Liste	Enthält Instanzen von Artist
publishers	Liste	Enthält Instanzen von Publisher
sheetsize	String
sheetsizeSep	Dictionary	Indices "height" und "width"
platesize	String
platesizeSep	Dictionary	Indices "height" und "width"
imagesize	String
imagesizeSep	Dictionary	Indices "height" und "width"
technique	String
notes	String
description	String
descriptionClean	String
quotation	String
catalogs	String
condition	String
source	String	String
shelfmarkSource	String
instime	String	Datum der Anlage des Datensatzes als Unix-Timestamp
modtime	String	Datum der letzten Änderung als Unix-Timestamp
yearNormalized	String	Jahr als vierstellige Zahl
sourceYear	Code zur Ermittlung von yearNormalized
keywords_technique	String
transcription	String
portraitType	String
orientation	String
personsRepr	Liste	Instanzen von Person
attributes	Liste	Instanzen von Attribute

Klasse Person

...

Abgeleitete Klasse Artist(Person)

...

Abgeleitete Klasse Publisher(Person)

...

Klasse Attribute

...

Klasse XMLReader

...

Beispiel: Laden von 100 Datensätzen aus der Datenbank in eine Instanz von ArtCollection. Die Iteration über die ArtCollection ergibt Instanzen von Artwork:

import mysql.connector
from lib import portapp as pa

db = mysql.connector.connect(
  host="{server}",
  user="{user}",
  password="{password}",
  database="portraits"
)
col = pa.ArtCollection(db)
col.loadBySQL("SELECT * FROM artwork LIMIT 100 OFFSET 0")
for aw in col:
	print(aw)

Modul provenance

Darstellung, Auswertung und Validierung von Provenienzen im OPAC der HAB, bezogen auf die Provenienzerschließung im PICA-System

Klasse Provenance

Auswertung von lokalen und auf dem Shared Level befindlichen Provenienzinformationen (Feld 680X und 9100)

Klasse ProvenanceBibLevel Abgeleitete Klasse für das Feld 9100.

Klasse NormLinkLocal

Auswertung von lokalen Normdatenverknüpfungen im Feld 688X

Klasse NormLinkLocal

Auswertung von lokalen Normdatenverknüpfungen im Feld 688X

Klasse Dataset

Umfasst alle Provenienzdaten zu einem Exemplar mit der Möglichkeit der Fehlersuche

Modul romnumbers

Parsen und Erzeugen römischer Zahlen. Anders als mit dem Modul roman (https://pypi.org/project/roman/) können auch additive Zahlen (IIII statt IV) gelesen werden. Punkte und Leerzeichen werden automatisch entfernt.

Funktion	Parameter	Rückgabewert	Effekt
to_arabic	lett (String)	Wert der römischen Zahl als Integer, None bei Validierungsfehler	-
to_roman	num (Integer)	Zahl in klein geschriebenen römischen Ziffern, None falls kein Integer übergeben wurde	-

Modul shelfmark

Das Modul bietet einen strukturierten Zugriff auf die Signaturen der Herzog August Bibliothek Wolfenbüttel. Signaturen werden der jeweiligen Sammlung zugeordnet und nach Sachgruppe, Format, Nummer, Bandzählung, Stücktitel etc. analysiert. Es können Sortierformen generiert und Sammelbände anhand der Signaturen zusammengeführt werden.

Klasse Shelfmark

Properties:

collection
root
bareRoot
part

Methoden:

Name	Parameter	Rückgabewert	Effekt
__init__	whole	--	erzeugt das Objekt, errechnet aus der übergebenen ganzen Signatur collection, root (ohne Stücktitelangabe), bareRoot (ohne Bestandskennzeichnung) und part (Stücktitelangabe)
normalize_wdb	-	Normalisierte Signatur nach dem Schema der WDB, z. B. "yx-52-8f-helmst-4s" für "H: Yx 52.8° Helmst. (4)"	-
__str__	-	String-Repräsentation der Signatur	--

Klasse StructuredShelfmark Abgeleitete Klasse von Shelfmark. Bei der Initialisierung erfolgt eine vollständige Analyse der Signatur und Erzeugung einer Sortierform.

Zusätzliche Properties:

group
form
number
format
volume
sortable

Methoden:

Name	Parameter	Rückgabewert	Effekt
__init__	whole	-	Erkennt Bestandteile der Signatur und legt sie in den Propoerties root (s. Shelfmark), bareRoot (s. Shelfmark), collection (s. Shelfmark), part (s. Shelfmark), group (Sachgruppe), form (Angabe über Art der Bindung wie "Mischbd.", sofern vorhanden), number (Zählung wie "678.3"), format (Formatangabe 2°, 4°, 8°, 12° oder FM) und volume (Bandangabe) ab. Die Sortierform wird unter sortable gespeichert.
makeSortable	-	Sortierform. Beispiel: "A: 57.19 Jur. 2° (1)" wird zu "A00.02Jur0.02.0.00057.00019.00000.00000.00000.00000.00000.00000.00000.00000.000100"	-
__str__	-	String-Repräsentation der Signatur	--

Codebeispiel:

# Erzeugung eines Dictionarys aus Sortierformen und Signaturen, die dann nach den Keys (=Sortierform) sortiert wird.
shelfmarks = ['H: T 729a.2° Helmst. ', 'M: Ho 298 (4)', 'Lpr. Stolb. 19280 (2) ', 'Xb 4558', 'Textb. 481', 'M: Gn Kapsel 52 (6)', 'M: Li 4611', 'M: Da 602 (12)', 'Xb 10102', 'GE 58-3855', 'M: QuN 1041 (1)', 'M: Cd 4° 84 (7)', 'M: Jb 93', 'M: Be Kapsel 3 (28)', 'M: Gg 141', 'M: Da 593 (4)', 'Xb 2806 (54)', 'M: Mk 292', 'Xb 12° 388', 'M: Gm 4° 1066 (26)', 'A: 738.14 Theol.', 'H: 521 Helmst. Dr. (79)', 'Schulenb. Gb 10', 'H: P 535.2° Helmst. (1)', 'M: QuN 949 (5)', 'Xb 2806 (17)', 'Xb 2806 (43)', 'M: Ro 2° 2', 'Xb 5128', 'A: 260.16 Quod. (12)', 'M: Rh 4° 35', 'M: Lg 1844', 'Xb 12° 359', 'H: Yv 861.8° Helmst.', 'M: Th 903:2 (2)', 'M: QuN 953 (2)', 'H: B 7.4° Helmst. (8)']

struct_smm = { sm.StructuredShelfmark(shelfmark).sortable : shelfmark for shelfmark in shelfmarks }

index = sorted(struct_smm)

for ind in index:
    print(f"{struct_smm[ind]} - {ind}")

Klasse ShelfmarkList

Fasst mehrere Objekte vom Typ StructuredShelfmark in einer Liste zusammen und erlaubt es, die Sammelbände zu bündeln. Diese werden als Volume-Objekte in der Property volumeList abgelegt.

Methoden:

Name	Parameter	Rückgabewert	Effekt
__init__	content (optional, Liste mit StructuredShelfmark-Objekten)	-	Erzeugt das Objekt, legt die übergebenen Signaturen in der Property content ab.
addSM	Objekt vom Typ StructuredShelfmark	-	Überprüft die Klassenzugehörigkeit des übergebenen Objekts und legt es unter content ab.
makeVolumes	-	-	Erzeugt anhand der unter content vorhandenen Signaturen Volume-Objekte und legt sie unter VolumeList ab
getByRoot	Signatur (str) ohne Stücktitelangabe, z. B. "57.19 Jur. 2°"	Volume-Objekt mit den zugehörigen Signaturen, None falls nicht vorhanden	-

Klasse Volume

Methoden:

Name	Parameter	Rückgabewert	Effekt
__init__	bareRoot (str, Signatur ohne Stücktitelangabe), sortable (str, Sortierform für die Wurzelsignatur), parts (list, Stücktitelangaben der enthaltenen Einzelsignaturen, z. B. ["1", "2", "3"])	-	Erzeugnung des Objekts mit den Properties bareRoot, sortable, parts
makePartStr	-	Sortierte und durch ", " getrennte Liste der Stücktitelangaben	Abspeichern unter partStr, Sortierung von parts
makeCompStr	--	Sortierte, durch Komma getrennte und mit "-" zusammengefasste Liste der Stücktitelangaben	Ablage des Ergebnisses unter self.compStr, Sortierung von parts
__str__	-	String-Repräsentation des Bandes	-

Codebeispiel

shelfmarks = ['M: QuN 1041 (2)', 'M: Ho 298 (5)', 'M: Ho 298 (6)', 'M: Ho 298 (1)', 'M: Ho 298 (2)', 'M: QuN 1041 (3)', 'M: Ho 298 (3)', 'M: Ho 298 (4)', 'M: QuN 1041 (1)']

smlist = sm.ShelfmarkList([sm.StructuredShelfmark(shelfmark) for shelfmark in shelfmarks])

smlist.makeVolumes()

for vol in smlist.volumeList:
    print(vol)

Modul sru

Das Modul ermöglicht den Zugriff auf SRU-Schnittstellen zum Download bibliographischer Daten

Klasse Request_SRU

Methoden:

Name	Parameter	Rückgabewert	Effekt
__init__	base (URL SRU-Schnittstelle), version (optional, Standard ist "2.0")	Instanz von SRU_Request	-
prepare	query_pica (Suchbefehl in PICA-Kommandozeilensprache), format (optional, Standard "picaxml")	Anzahl der gefundenen Treffer	Ermittlung der Treffermenge, Speichern einer initialen Such-URL
download	folder (Pfad zum Downloadordner), fileName (optionaler Dateiname, Standard "downloadSRU")	kein Rückgabewert	Herunterladen der XML-Daten in Paketen zu 500 Treffern in den Download-Ordner
make_url	maxRecords (optional, Standard 1), startRecord (optional, Standard1)	URL für den Download einer einzelnen Datei	-

Eigenschaften:

str filename: Dateiname für den Download
str base: URL der abgefragten SRU-Schnittstelle ohne schließendes "/"
str url: URL für den aktuellen Download
str version: SRU-Version
str query_pica: Suchbefehl in PICA-Kommandozeilensprache. Blanks bleiben erhalten, vor Suchschlüsseln steht jeweils "pica." Die verfügbaren Suchschlüssel sind auf der Startseite der SRU-Schnittstelle aufgeführt, s. z. B. http://sru.k10plus.de/k10plus?version=2.0
str query_pica_enc: Suchbefehl in aufbereiteter Form für die Schnittstelle

Klasse Request_K10plus

Abgeleitete Klasse zur Nutzung der SRU-Schnittstelle des K10plus-Verbundkatalogs. Der Parameter "base" entfällt bei der Initialisierung, Methoden s. o.

Klasse Request_VD17

Abgeleitete Klasse zur Nutzung der SRU-Schnittstelle des VD17, Funktionsweise s. o.

Klasse Request_VD18

Abgeleitete Klasse zur Nutzung der SRU-Schnittstelle des VD18, Funktionsweise s. o.

Klasse Request_HAB

Abgeleitete Klasse zur Nutzung der SRU-Schnittstelle des lokalen OPAC der HAB, Funktionsweise s. o.

Beispiel: Herunterladen aller Katalogaufnahmen mit der Provenienz "Helmstedt" aus dem OPAC der HAB

from lib import sru
folder = "downloads/helmstedt"
req = sru.Request_HAB()
req.prepare("pica.prn=Helmstedt and pica.bbg=A[af]*")
print(f"Datensätze: {req.numFound}")
req.download(folder)

Modul table_winibw

Klasse zur Arbeit mit CSV-Dateien, die mit MS Excel erzeugt wurden (Zeichencodierung "cp1252", Trennzeichen ";"). Insbesondere mit der WinIBW erzeugte CSV-Tabellen (Funktion "Exceltabelle erzeugen") können so leicht verarbeitet werden. Das Modul überschneidet sich mit dem obigen Modul csvt, das ursprünglich zum Serialisieren von Daten mit Python ohne Import aus einer Windows-Anwendung gedacht war. Inzwischen ist der Funktionsumfang von csvt größer.

Klasse Table Repräsentiert eine Tabelle und enthält die Daten in der Property content, die Felder in der Property fields. Ist iterierbar und gibt einzelne Zeilen als OrdererdDict aus.

Methode	Parameter	Rückgabewert	Effekt
__init__	path	-	Lädt die Daten aus der Tabelle in die Property content. Die Feldnamen werden in fields gespeichert
getByField	field	Liste mit allen Werten der entsprechenden Spalte	-
getSelection	fields (Liste mit Feldnamen)	Liste, enthält für jede Zeile eine Liste mit den ausgewählten Feldern	-
addSortable	field (Feld, in dem eine Signatur der HAB steht. Standardwert ist "Signatur")	True bei Erfolg	Hinzufügen einer Spalte mit dem Namen "Sortierform", in dem eine von der Klasse SortableShelfmark im Modul shelfmark erzeugte Sortierform eingefügt wurde. Funktioniert nur für Signaturen der HAB
addNormPages	field (Feld mit der Umfangsangabe, Standardtwert ist "Umfang"), fieldEx (Feld mit dem Identifier des Exemplars, Standardwert ist "Signatur")	True bei Erfolg	Anlegen einer neuen Spalte "Umfang_normiert", in dem die Seitenzahl als Integer ausgegeben wird
addParallels	fieldMan (Feld mit dem Identifier der Manifestation, Standardtwert ist "PPN"), fieldEx (Feld mit dem Identifier des Exemplars, Standardwert ist "Signatur")	True bei Erfolg	Anlegen einer neuen Spalte "Parallelexemplare", in dem die Identifier der Parallelexemplare für diese Ausgabe ausgegeben werden, mehrere getrennt durch ";"
save	fileName (Dateiname ohne Endung, Standardwert ist "myTable")	True bei Erfolg	Abspeichern der Tabelle als CSV-Datei unter dem angegebenen Dateinamen
toSQLite	fileName (Dateiname, Standardwert ist "exportTable")	True bei Erfolg	Gibt die Tabelle als SQLite-Datenbank mit einer einzelnen Tabelle aus, die unter fileName abgespeichert wird.

Beispiel: Laden einer Tabelle mit Datensätzen und Einfügen einer Spalte mit der jeweiligen Sortierform, Abspeichern unter einem neuen Dateinamen.

from lib import table_winibw as tw

tab = tw.table("records.csv")
tab.addSortable()
tab.save("records-sortable")

Modul tpro

Repräsentation des T-PRO Thesaurus der Provenienzbegriffe (Quelle: https://provenienz.gbv.de/T-PRO_Thesaurus_der_Provenienzbegriffe). Die Liste der Deskriptoren ist als Dictionary mit tpro.descriptors abzurufen. Sie folgt dem Schema "Name" : "Typ". Die Deskriptorentypen sind "Exemplartypen", "Rechtlicher Status", "Physische Merkmale", "Zeitangabe". Verweisformen wie "Supralibros", die bei der Provenienzforschung nicht verwendet werden sollen, sind weggelassen.

Methode	Parameter	Rückgabewert	Effekt
get_descriptors	type ("Exemplartypen"\|"Rechtlicher Status"\|"Physische Merkmale"\|"Zeitangabe"\|None)	-	Gibt eine Liste aller Deskriptoren des Typs zurück, bei None alle Deskriptoren
validate	desc (Name Deskriptor)	-	True wenn Deskriptor vorhanden, False wenn nicht
get_type	descr	-	Typ des angegebenen Deskriptors, None falls nicht vorhanden

Modul unapi

Beschreibung folgt

Modul xmlreader

Extraktion wiederkehrender Knoten aus XML-Dokumenten. Die Knoten werden als Instanzen von xml.etree.ElementTree.Element (s. Dokumentation) ausgegeben. Beim Auslesen eines Ordners werden alle darin enthaltenen XML-Dokumente berücksichtigt, beim Auslesen einer URL der darin enthaltene XML-Code.

Klasse DownloadReader

Reader zum Auslesen der XML-Dokumente in einem Ordner.

Methode	Parameter	Rückgabewert	Effekt
__init__	path (Pfad des Ordners), tag (Elementname des auszugebenden Knotens), namespace (Namespace des auszugebenden Knotens)	Instanz von DownloadReader	-

Objekte dieser Klasse sind iterierbar und geben Knoten als Instanzen von xml.etree.ElementTree.Element aus.

Beispiel: Auslesen der XML-Dokumente im Verzeichnis "downloads/helmstedt". Gesucht wird nach Elementen mit dem namen "record" und dem Namespace "info:srw/schema/5/picaXML-v1.0":

from lib import xmlreader as xr
reader = xr.DownloadReader("downloads/helmstedt", "record", "info:srw/schema/5/picaXML-v1.0")
for node in reader:
	print(node)

Klasse WebReader

Reader zum Lesen von XML-Daten aus einer Webquelle. Wird initialisiert wie DownloadReader, statt eines Ordners wird aber eine Webadresse angegeben.

Klasse OAIDownloadReader

Abgeleitete Klasse von DownloadReader, voreingestellt für Downloads von einer OAI 2.0-Schnittstelle

Klasse SRUDownloadReader

Abgeleitete Klasse von DownloadReader, voreingestellt für Downloads von einer SRU-Schnittstelle

Klasse UnAPIReader

Reader zum Auslesen von Downloads aus einer unAPI

Modul xmlserializer

Anlegen und Abspeichern von XML-Dokumenten, basierend auf xml.etree.ElementTree.

Klasse Serializer

Methode	Parameter	Rückgabewert	Effekt
__init__	path (Pfad zum Speichern der XML-Datei, ohne Endung), root (Name des root-Elemensts, Standard "root"	-	Initiieren des Objekts
add_node	node (xml.etree.ElementTree.Element)	True	Anhängen des Elements an das root-Element
add_nested	tag (name des einzufügenden übergeordneten Elements), content (Dictionary mit Tagnames und Inhalten)	True	Anhängen eines Elements mit Unterelementen an das root-Element
save	-	True	Abspeichern des XML-Dokuments unter dem beim Initiieren angegebenen Pfad path plus ".xml"
to_string	-	XML als String	-

Funktion make_node

Parameter	Rückgabewert	Effekt
name, value (Textinhalt, optional), att_name (Attribut, optional), att_value (Wert des Attributs, optional)	xml.etree.ElementTree.Element	-

Funktion add_subnode

Parameter	Rückgabewert	Effekt
node, subnode (beides xml.etree.ElementTree.Element)	node mit angehängtem subnode	-

Codebeispiel:

from lib import xmlserializer as xs
ser = xs.Serializer("test")
content = { 
	"vdn" : "VD17 23:292360E", 
	"title" : "Der Junckfrawen Hundt", 
	"year" : "1620"
	}
ser.add_nested("data", content)
print(ser.to_string())
# Erzeugt die Datei test.xml
ser.save()

Name		Name	Last commit message	Last commit date
Latest commit History 147 Commits
ext		ext
lib		lib
scripts		scripts
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
vorlage-mets.xml		vorlage-mets.xml
vorlagen.py		vorlagen.py

License

hbeyer/pylib

Folders and files

Latest commit

History

Repository files navigation

PyLib: Sammlung von Python-Modulen für die Arbeit mit bibliographischen Daten

Installation

Beschreibung der Module

Modul aadgenre

Modul bookwheel

Modul cache

Modul csvt

Modul dataset

Modul duennhaupt

Funktionen

Klassen

Modul evallist

Modul evalpdf

Modul geo

Modul gnd

Modul hbz

Modul html

Modul incunabula

Modul isil

Modul language

Modul lido

Modul lobid

Modul localsql

Modul maps

Modul mets

Modul network

Modul oai

Modul opac

Modul pica

Felder für bibliographische Einheiten

Klasse Person

Klasse Place

Klasse Copy

Modul portapp

Modul provenance

Modul romnumbers

Modul shelfmark

Modul sru

Modul table_winibw

Modul tpro

Modul unapi

Modul xmlreader

Modul xmlserializer

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages