Skip to content

Verwendung von Audio oder Video

Markus Weigelt edited this page Feb 21, 2024 · 29 revisions

Konfiguration der Medienformate

Derzeit werden die Audioformate MP3, WAV oder OGG sowie die Videoformate MP4, WebM und OGG durch die gängigsten Browser und damit auch von Kitodo.Production unterstützt.

In der Konfigurationsdatei kitodo_fileFormats.xml sollte das gewünschte Medienformat als <fileFormat> existieren. Bei einer neu aufgesetzten Kitodo.Production-Instanz sind bereits alle unterstützten Formate in der Konfigurationsdatei enthalten. Falls dies nicht der Fall ist, kann die Konfigurationsdatei um eines oder mehrere der folgenden unterstützten Dateiformate erweitert werden:

    <fileFormat extension="mp4" formatName="mp4" mimeType="video/mp4">
        <label>MP4 (video/mp4, *.mp4)</label>
    </fileFormat>
    <fileFormat extension="ogv" formatName="ogv" mimeType="video/ogg">
        <label>OGG (video/ogg, *.ogv)</label>
    </fileFormat>
    <fileFormat extension="webm" formatName="webm" mimeType="video/webm">
        <label>WEBM (video/webm, *.webm)</label>
    </fileFormat>
    <fileFormat extension="mp3" formatName="mp3" mimeType="audio/mpeg">
        <label>MP3 (audio/mpeg, *.mp3)</label>
    </fileFormat>
    <fileFormat extension="oga" formatName="oga" mimeType="audio/ogg">
        <label>OGG (audio/ogg, *.oga)</label>
    </fileFormat>
    <fileFormat extension="weba" formatName="weba" mimeType="audio/webm">
        <label>WEBM (audio/webm, *.weba)</label>
    </fileFormat>

Konfiguration des Projektes

Innerhalb des Dialogs zum Hinzufügen eines Unterordners in der Bearbeitungsansicht eines Projekts werden alle Dateiformate gemäß der Konfigurationsdatei kitodo_fileFormats.xml sortiert in der Dateityp-Auswahl dargestellt.

image

Wenn ein Unterordner mit Audio- oder Video-Dateitypen hinzugefügt wurde, werden unter dem Abschnitt 'Ordnerverwendung' entsprechend dem jeweiligen Typ neue Konfigurationsfelder angezeigt.

Konfigurationsfelder für den Audio-Dateityp

image

Konfigurationsfelder für den Video-Dateityp

image

Hier können die Unterordner der Dateien zur Vorschau (Listenansicht) und zur Medienansicht konfiguriert werden. Die Auswahl des Unterordners muss nicht zwingend dem Medium selbst entsprechen. Es ist beispielsweise möglich, in der Vorschau ein generiertes Thumbnail des Videos aus einem Bilderunterordner anzuzeigen und in der Detailansicht das eigentliche Video selbst zu präsentieren. Die Zuordnung der Dateien erfolgt dabei über den Namen der Medien. Falls kein Unterordner zur Anzeige ausgewählt wurde, wird ein Icon des Mediums anzeigt.

Nutzung der Medienteile (Media Partials)

Mit diesem Feature können Audio- und Video-Sprungmarken gesetzt werden. Dies ermöglicht beispielsweise das Setzen von Kapiteln für Videos, ähnlich wie es mit YouTube möglich ist oder das Unterteilen von Stücken einer Schallplattenseite in Abschnitte für Audios.

Anpassungen im Regelsatz

Dafür muss im Regelsatz der Division, welche für die Repräsentation der Sprungmarke in der METS verwendet werden soll, ein use Attribut "mediaPartial" in der <declaration> hinzugefügt werden.

<declaration>
   ...
   <division id="section" use="mediaPartial">
      <label>section</label>
   </division>
   ...
</declaration>

Die damit ausgezeichnete Division muss ein "LABEL" Key (mit der Domain "mets:div") und als Kind einer weiteren Division (im Beispiel "volume") untergeordnet werden.

<correlation>
   ...
   <restriction division="volume" unspecified="forbidden">
      <permit division="section"/>
   </restriction>
   <restriction division="section" unspecified="forbidden">
      <permit key="LABEL" maxOccurs="1"/>
   </restriction>
   ...
</correlation>

Verwendung im Metadateneditor

Um die Medienteile im Metadateneditor letztendlich verwenden zu können, müssen in den Strukturdaten die übergeordnete Division (im Beispiel "volume") vorhanden sein und dieser ein Audio- oder Videomedium zugeordnet sein.

image

Danach ändert sich die Medienansicht für das Medium.

image

Unterhalb des Players wird die aktuelle Zeit im Format "HH:mm:ss.SSS" angezeigt. Über die Buttons darunter kann eine Sekunde oder 100, 10, 1 Millisekunde im Player vor- oder zurückgesprungen werden. Das dient zur genauen Positionierung der Marke z.B. bei einzelnen Frames von Videos.

image

Mit dem Klick auf das "Plus" Icon in der rechten unteren Ecke der Medienansicht, öffnet sich das abgebildete Formular und ein Medienteil kann hinzugefügt werden. Zur vereinfachten Erfassung, wird die aktuelle Abspielposition des Players als Startzeitpunkt vorbelegt. Falls im Regelsatz der übergeordnete Division (im Beispiel "volume") mehrere Divisions mit dem use "mediaPartial" zugeordnet wurden, dann erscheint zusätzlich ein Auswahlfeld um den Namen der Division als Typ des Medienteils auszuwählen.

Nach dem Hinzufügen des Medienteils, wird dieser sortiert nach Startzeitpunkt in der Liste angezeigt. Die Laufzeit des Medienteils wird automatisch zum nächsten Medienteil oder zu Länge des Mediums berechnet. Über die Aktionsbuttons auf der rechten Seite eines Medienteils in der Liste kann dieses bearbeitet, gelöscht und für die Länge der Laufzeit abgespielt werden.

image

In den Strukturdaten und den Listenansichten werden die Medienteile mit einer Reißzwecke als Icon versehen.

Export in die METS

Ein Medienteil besteht nach dem Export in die METS aus einer "Logical Division" mit dem Typen der Division aus dem Regelsatz inklusive des Namens als LABEL Attribut und einer "Physical Division" mit Verweis auf die Mediendatei sowie dem Startzeitpunkt und der Länge der Sprungmarke. Das Format für diese zeitlichen Angaben ist auf "HH:mm:ss.SSS" festgelegt und wird entsprechend validiert.

<mets:structMap TYPE="PHYSICAL">
   <mets:div ID="UUID" DMDID="UUID">
      ...
      <mets:div ID="UUID" TYPE="track" ORDER="1" ORDERLABEL=" - ">
         <mets:fptr>
            <mets:area FILEID="UUID" BEGIN="00:00:44.920" BETYPE="TIME" EXTENT="00:03:06.378" EXTTYPE="TIME"/>
         </mets:fptr>
      </mets:div>
      ...
   </mets:div>
</mets:structMap>

Nutzung der Audio-Wellenform

Um beispielsweise Pausen für das Setzen von Medienteilen (Media Partials) besser zu erkennen, besteht in der Medienansicht für Audiodateiformate die Möglichkeit, deren Wellenform anzuzeigen. Dazu muss, wie im Abschnitt Konfigurationsfelder für den Audio-Dateityp gezeigt, die Option für die Wellenform aktiviert werden.

image

Der Browser dekodiert die gesamte Audiodatei, und mithilfe eines JavaScript-Plugins wird anschließend die Wellenform dargestellt. Oberhalb der Wellenform erscheint nun ein Slider, um in die Wellenform zu zoomen, und daneben die Option, um den Cursor beim Abspielen zentriert anzuzeigen.

Bekannte Probleme

Hier finden Sie Informationen zu Problemen die während der Implementierung und Nutzung aufgefallen sind. Weitere Informationen dazu finden Sie beim Hersteller des verwendeten Plugins: https://github.com/katspaugh/wavesurfer.js

Diskrepanz zwischen Audio und der Wellenform

Wenn Sie eine VBR (variable Bitrate) Audiodatei verwenden, könnte es eine Diskrepanz zwischen dem Audio und der Wellenform geben. Dies kann behoben werden, indem die Datei in CBR (konstante Bitrate) konvertiert wird.

Der Browser bleibt hängen, während die Peaks generiert werden

Wenn die Datei zu groß bzw. zu lang ist kann es vorkommen, dass die Dekodierung im Browser nicht mehr stattfinden kann. Die verwendeten Ressourcen des Browser sind abhäng von dem jeweiligen System auf dem der Browser installiert ist. Ein Lösung für dieses Problem gibt es derzeit nicht aber einen möglichen Lösungsvorschlag.

Falls es zu Problemen kommt die Wellenform anzuzeigen, müssten die sogenannten Peaks der Wellenform vorab generiert und als Datei im Unterordner abgelegt werden. Diese Datei könnte dann durch ein noch zu entwickelndes Feature im Kitodo.Production ausgelesen und durch das JavaScript-Plugin verwendet werden.

Clone this wiki locally