Skip to content
This repository has been archived by the owner on May 10, 2024. It is now read-only.

Klärung des Umgangs mit Multimedia-Objekten und Strukturdaten #3

Open
felixlohmeier opened this issue Feb 6, 2021 · 3 comments
Open
Labels
question Further information is requested

Comments

@felixlohmeier
Copy link
Member

Das "Münstersche Informations- und Archivsystem multimedialer Inhalte" (miami) beinhaltet wirklich vielfältige Daten. Bislang haben wir vorrangig PDF-Dateien in das Portal noah.nrw eingespielt. Diese werden dort für die Volltextsuche prozessiert und für die Anzeige in Bilder zerlegt. Wenn jetzt andere Formate hinzukommen, stellen sich eventuell auch Usability-Fragen.

Es ist unter anderem zu klären:

  • ob im Portal auch Strukturelemente ohne Direktlinks (Zeitschriftenhefte und übergeordnete Werke) aufgenommen werden sollen.
  • ob im Portal auch Datensätze ohne (mindestens einen) Direktlink auf ein PDF aufgenommen werden sollen.
@felixlohmeier felixlohmeier added the question Further information is requested label Feb 6, 2021
@felixlohmeier
Copy link
Member Author

Entscheidung im Jour Fixe hbz/OCC: Vorerst werden nur Datensätze mit Direktlink auf mindestens ein PDF aufgenommen. Strukturelemente und Datensätze ohne Direktlink auf ein PDF werden ausgefiltert.

@felixlohmeier
Copy link
Member Author

Das Portal ist momentan auf die Darstellung von PDFs optimiert. Nur diese werden für die Bildextraktion und Volltextsuche herangezogen. Datensätze ohne PDF werden als reine Metadaten dargestellt. Vorläufig sollten daher, wie beschlossen, nur Datensätze mit Direktlink auf mindestens ein PDF aufgenommen werden.

Es zeigt sich jetzt, dass auch das problematisch sein kann, weil anhand der Daten der ULB Münster das Hauptdokument nicht eindeutig identifiziert werden kann. Es kann also folgende Fälle geben:

  • Das Hauptdokument ist ein Multimedia-Objekt (z.B. ein Video) und das PDF enthält nur einen nachrangigen Inhalt (wie z.B. eine Literaturliste).
  • Es gibt mehrere PDF-Dateien, z.B. den Haupttext einer Dissertation und Anlagen als separate Datei.

Beide Fälle können zu irreführenden Darstellungen im Portal führen. Vorläufig können daher nur Datensätze eindeutig ausgewertet werden, die ausschließlich einen Link auf ein PDF enthalten.

Leider können wir dadurch Datensätze nicht auswerten, die zusätzlich zum PDF noch Quelldateien beinhalten, wie diese Dissertaton: Frontpage, OAI

@felixlohmeier
Copy link
Member Author

So wirken sich die Fitler aus:

Datensätze Differenz Erläuterung
7943   Harvesting 19.03.2021
7940 -3 Ältere Einträge (nach mets:metsHdr - CREATEDATE) mit gleichem Identifier entfernen
7851 -89 Aggregationen löschen (diese Datensätze werden von untergeordneten Werken über relatedItem referenziert)
7731 -120 Datensätze ohne Direktlink auf ein PDF löschen
7196 -535 Vorläufig Datensätze löschen, die mehr als einen Direktlink beinhalten
6810 -386 Vorläufig Zeitschriftenhefte löschen
6683 -127 Datensätze mit "restriction on access" löschen

@felixlohmeier felixlohmeier transferred this issue from opencultureconsulting/noah Apr 3, 2022
@felixlohmeier felixlohmeier changed the title Münster: Klärung des Umgangs mit Multimedia-Objekten und Strukturdaten Klärung des Umgangs mit Multimedia-Objekten und Strukturdaten Apr 3, 2022
Sign up for free to subscribe to this conversation on GitHub. Already have an account? Sign in.
Labels
question Further information is requested
Development

No branches or pull requests

1 participant