# DNBLab Jupyter Notebook Tutorial

## Audioanalyse - SRU-Schnittstellenabfrage, Ausgabe und Visualisierungen

Dieses DNBLab-Tutorial beschreibt eine Beispielabfrage zu einem Audioobjekt über die SRU-Schnittstelle sowie die WAV-Ausgabe und eine Auswahl von Visualisierungen. In der Jupyter Notebook Umgebung kann der dokumentierte Code direkt ausgeführt und angepasst werden. Das Tutorial umfasst die exemplarische Anfrage und Ausgabe der Daten in MARC21-xml zur weiteren Verarbeitung.

Die Daten können über die SRU-Schnittstelle als XML-Antwort in folgenden Formaten ausgeliefert werden: 
* MARC21-xml http://www.loc.gov/standards/marcxml/schema/MARC21slim.xsd
* DNB Casual (oai_dc)	http://www.openarchives.org/OAI/2.0/oai_dc.xsd
* RDF (RDFxml) http://www.w3.org/2000/07/rdf.xsd

Inhaltsverzeichnis:

* [1. Einrichten der Arbeitsumgebung](#Teil1)
* [2. SRU-Abfrage mit Ausgabe in MARC21-xml](#Teil2)
* [3. Durchsuchen eines MARC-Feldes und Datenabfrage](#Teil3)
* [4. Datenanzeige zur weiteren Bearbeitung](#Teil4)
* [5. Download einer WAV-Datei](#Teil5)
* [6. Laden und Abspielen der WAV-Datei](#Teil6)
* [7. Beispielhafte Fragestellungen](#Teil7)

## 1. Einrichten der Arbeitsumgebung <a class="anchor" id="Teil1"></a>

Um die Arbeitsumgebung für die folgenden Schritte passend einzurichten, sollten zunächst die benötigten Python-Bibliotheken importiert werden. Für Anfragen über die SRU-Schnittstelle wird Requests https://docs.python-requests.org/en/latest/ und zur Verarbeitung der XML-Daten etree https://docs.python.org/3/library/xml.etree.elementtree.html verwendet. Mit Pandas https://pandas.pydata.org/ können Elemente aus dem MARC21-Format ausgelesen werden.

In [None]:
import requests
from bs4 import BeautifulSoup as soup
import unicodedata
from lxml import etree
import pandas as pd

## 2. SRU-Abfrage mit Ausgabe in MARC21-xml<a class="anchor" id="Teil2"></a>

Die Funktion dnb_sru nimmt den Paramter "query" der SRU-Abfrage entgegen und liefert alle Ergebnisse als eine Liste von records aus.

In [None]:
def dnb_sru(query):
    
    base_url = "https://services.dnb.de/sru/dnb"
    params = {'recordSchema' : 'MARC21-xml',
          'operation': 'searchRetrieve',
          'version': '1.1',
          'maximumRecords': '100',
          'query': query
         }
    r = requests.get(base_url, params=params)
    xml = soup(r.content)
    records = xml.find_all('record', {'type':'Bibliographic'})
    
    if len(records) < 100:
        
        return records
    
    else:
        
        num_results = 100
        i = 101
        while num_results == 100:
            
            params.update({'startRecord': i})
            r = requests.get(base_url, params=params)
            xml = soup(r.content)
            new_records = xml.find_all('record', {'type':'Bibliographic'})
            records+=new_records
            i+=100
            num_results = len(new_records)
            
        return records

## 3. Durchsuchen eines MARC-Feldes und Datenabfrage<a class="anchor" id="Teil3"></a>

Die Funktion parse_records nimmt als Parameter jeweils ein Record entgegen und sucht über xpath die gewünschte Informationen (in diesem Fall IDN, Titel, Archivlink und Umfang) heraus und liefert diese als dictionary zurück.  

In [None]:
def parse_record(record):
    
    ns = {"marc":"http://www.loc.gov/MARC21/slim"}
    xml = etree.fromstring(unicodedata.normalize("NFC", str(record)))
    
    #idn
    idn = xml.xpath("marc:controlfield[@tag = '001']", namespaces=ns)
    try:
        idn = idn[0].text
    except:
        idn = 'fail'
    
    # titel
    titel = xml.xpath("marc:datafield[@tag = '245']/marc:subfield[@code = 'a']", namespaces=ns)
    
    try:
        titel = titel[0].text
        #umfang = unicodedata.normalize("NFC", titel)
    except:
        titel = "unkown"
        
         # Archivlink
    urn = xml.xpath("marc:datafield[@tag = '856']/marc:subfield[@code = 'u']", namespaces=ns)
    
    try:
        urn = urn[0].text
        #link = unicodedata.normalize("NFC", urn)
    except:
        urn = 'fail'
        
         # umfang
    umfang = xml.xpath("marc:datafield[@tag = '300']/marc:subfield[@code = 'a']", namespaces=ns)
    try:
        umfang = umfang[0].text
        #umfang = unicodedata.normalize("NFC", umfang)
    except:
        umfang = 'fail'
        
    meta_dict = {"idn":idn,
                 "titel":titel,
                 "urn":urn,
                 "umfang":umfang
                               }
    
    return meta_dict

Die verschiedenen Indexbezeichnungen stehen in https://services.dnb.de/sru/dnb?operation=explain&version=1.1 und können mittels CQL z.B. gezielt nach einem Titelstichwort in Kombination mit Standort "online frei verfügbar" abgefragt werden. Auf diese Art kann durch Anpassen des Codes auch nach anderen Begriffen oder Namen in beliebigen MARC-Feldern gesucht werden. 

Neben dem cod=t003 im Abfragebesipiel gibt es weitere Digitalisierungscodes mit freien Audiodateien:

| Code | Beschreibung | Anzeige im Katalog |
| --- | --- | --- |
| cod=m003 | 350 digitalisierte Schellackplatten aus der Spezialsammlung MIZ DDR | <a href="https://portal.dnb.de/opac.htm?method=moveDown&currentResultId=cod%3Dm003%26any&categoryId=onlinefree">Sammlung im Katalog</a>
| cod=m004 | Mehr als 180 digitalisierte Phonographen-Walzen | <a href="https://portal.dnb.de/opac.htm?method=moveDown&currentResultId=cod%3Dm004%26any&categoryId=onlinefree">Sammlung im Katalog</a>
| cod=m005 | 86 digitalisierte Schellackplatten der Kabarett-Kollektion | <a href="https://portal.dnb.de/opac.htm?method=moveDown&currentResultId=cod%3Dm005%26any&categoryId=onlinefree">Sammlung im Katalog</a>. 
| cod=dma002 | 700 digitalisierte Schallplatten (Emil Berliner) | <a href="https://portal.dnb.de/opac.htm?method=moveDown&currentResultId=cod%3dma002%26any&categoryId=onlinefree">Sammlung im Katalog</a>. 

Hierfür kann die Suchabfrage in dnb_sru() beliebig angepasst werden.

In [None]:
records = dnb_sru('tit="Das Fischermädchen -" and location=onlinefree')
print(len(records), 'Ergebnisse')

Mit print() können zur Kontrolle alle MARC-Felder der gefundenen Datensätze unstrukturiert ausgegeben werden.

In [None]:
print(records)

## 4. Datenanzeige zur weiteren Bearbeitung<a class="anchor" id="Teil4"></a>

Mit der "Python Data Analysis Library" Pandas für Python werden die Ergebnisse der Datenabfrage als Dataframe ausgegeben. Die ersten 5 und letzten 5 Zeilen des Dataframes können mit dem Befehl "df = pd.DataFrame() angezeigt werden. Dabei können in ein Set Objekte beliebigen Datentyps gespeichert werden. 

In [None]:
output = [parse_record(record) for record in records]
df = pd.DataFrame(output)
df

## 5. Download einer WAV-Datei<a class="anchor" id="Teil5"></a>

Mit der Funktion wget können die Dateien des aus dem Dataframe kopierten Archivobjekt-Links heruntergeladen und mit unzip im Verzeichnis der aktuellen Jupyter Sitzung gespeichert werden.

In [None]:
!wget https://d-nb.info/1076785042/34

In [None]:
!unzip 34

## 6. Laden und Abspielen der WAV-Datei<a class="anchor" id="Teil6"></a>

Mit der freien python Bibliothek essentia https://essentia.upf.edu/documentation.html kann die entpackte WAV-Datei kopiert, eingefügt, geladen und gestreamed werden.

In [None]:
import essentia

# Submodule:
import essentia.standard
import essentia.streaming

# Ausgabe des enthaltenen Standard-Angebots
# print(dir(essentia.standard))


In [None]:
# Laden der WAV-Datei
loader = essentia.standard.MonoLoader(filename='1111501032304_00020_00020_01_o.wav')
audio = loader()

In [None]:
# Abspielen der WAV-Datei - dauert einen Moment
import IPython
IPython.display.Audio('1111501032304_00020_00010_01_o.wav')

## 7. Beispielhafte Fragestellungen:<a class="anchor" id="Teil7"></a>

### Wie unterscheiden sich die spektralen Eigenschaften und Mel-Band spektralen Energien in verschiedenen Zeitfenstern des Musikstücks?<a class="anchor" id="Teil7"></a>
Mit den Bibliotheken pylab und matplotlib wird Sekunde 1 bis 2 der geladenen WAV-Datei geplottet bzw. eine Visualisierung der Schalldruckamplitude im Zeitbereich für die 2. Sekunde des Musikstücks wird angezeigt. Die Plot Größen können nach dem Auführen des Codes über Formularfelder als Wert 1 und Wert 2 angepasst werden. Sie werden dann beim Ausführen der darauffolgenden Funktion für das Plotten übernommen. 

In [None]:
from IPython.display import display 
import ipywidgets as widgets 
from ipywidgets import interact, Layout 

tb1 = widgets.Text(value = '15', description='Wert 1: ');display(tb1);
tb2 = widgets.Text(value = '6', description='Wert 2: ');display(tb2);

# ein Button zur Übernahme der eingegebenen Werte 
button = widgets.Button(description='Übernehmen!', layout=Layout(width='200px')); 
button.style.button_color = 'lightgreen';display(button); 
def on_button_clicked(sender): 
    a = int(tb1.value); b = int(tb2.value); 
    print('Folgende Werte wurden übernommen:') 
    print('Wert 1: ' + str(tb1.value))  
    print('Wert 2: ' + str(tb2.value)) 
button.on_click(on_button_clicked)




In [None]:
from pylab import plot, show, figure, imshow
%matplotlib inline
import matplotlib.pyplot as plt
plt.rcParams['figure.figsize'] = (str(tb1.value), str(tb1.value)) # Anpassen der Plot Größen > als der Standardwert

plot(audio[1*44100:2*44100])
plt.title("Visualisierung der 2. Sekunde:")
show() 

Laden des Magnitude Spektrum aus essentia.standard in einem Hann Fenster.

In [None]:
from essentia.standard import *
w = Windowing(type = 'hann')
spectrum = Spectrum()  # FFT() would return the complex FFT, here we just want the magnitude spectrum
mfcc = MFCC()

Darstellung von:

- Spektrum eines ausgewählten
- Mel-Band spektralen Energien dieses Zeitfensters 
- die ersten 13 Mel Frequency Cepstral Coefficients (MFCCs) dieses Zeitfensters

In [None]:
frame = audio[6*44100 : 6*44100 + 1024]
spec = spectrum(w(frame))
mfcc_bands, mfcc_coeffs = mfcc(spec)

plot(spec)
plt.title("Das Spektrum eines Frames:")
show()

plot(mfcc_bands)
plt.title("Mel Band Spektral Energien eines Frames:")
show()

plot(mfcc_coeffs)
plt.title("Die ersten 13 MFCCs eines Frames:")
show()

### Wie verändern sich die Mel-Band spektralen Energien und MFCCs über die Zeit im Musikstück?<a class="anchor" id="Teil8"></a>

Bei Mel Band Energien kann mit der Funktion UnaryOperator() eine Log-Normalisierung mit verschiedenen Normierungstypen auf Vektoren angewendet werden.

Darstellung von:
- log-normalisierten Mel-Band spektralen Energien über die Zeit 
- Mel-Band spektralen Energien über die Zeit als Heatmap
- MFCCs über die Zeit in einer Heatmap

In [None]:
logNorm = UnaryOperator(type='log')
plot(logNorm(mfcc_bands))
plt.title("Log-normalisierte Mel Band Spektral Energien in Frames:")
show()

mfccs = []
melbands = []
melbands_log = []

for frame in FrameGenerator(audio, frameSize=1024, hopSize=512, startFromZero=True):
    mfcc_bands, mfcc_coeffs = mfcc(spectrum(w(frame)))
    mfccs.append(mfcc_coeffs)
    melbands.append(mfcc_bands)
    melbands_log.append(logNorm(mfcc_bands))

# transpose to have it in a better shape
# we need to convert the list to an essentia.array first (== numpy.array of floats)
mfccs = essentia.array(mfccs).T
melbands = essentia.array(melbands).T
melbands_log = essentia.array(melbands_log).T

# and plot
imshow(melbands[:,:], aspect = 'auto', origin='lower', interpolation='none')
plt.title("Mel Band Spektral Energien in Frames:")
show()

imshow(melbands_log[:,:], aspect = 'auto', origin='lower', interpolation='none')
plt.title("Log-normalisierte Mel Band Spektral Energien in Frames:")
show()

imshow(mfccs[1:,:], aspect='auto', origin='lower', interpolation='none')
plt.title("MFCCs in Frames:")
show()