# Tutorial Basics Noten Part 2: Statistik - 01

Inhaltsverzeichnis: 

1. Abfrage von einfachen statistischen Angaben
2. Häufigkeiten:
            2.1 Tonhöhen
            2.2 Tonhöhenklassen
            2.3 Intervalle
            2.4 Tondauern
            2.5 Metrisches Profil
3. Zweidimensionale Häufigkeitsverteilungen
4. Aufgaben

Dieses Tutorial führt anhand von Notenbeispielen in die computergestützten Möglichkeiten einfacher statistischer Abfragen auf der Grundlage von CAMAT (Computer-Assisted Music Analysis Tool) ein. 

Das Durcharbeiten und Nachvollziehen des Tutoriums soll es Ihnen ermöglichen, mit den vorgestellten computergestützten Methoden eigene Musikbeispiele (Notendateien) zu untersuchen und Vergleiche zwischen verschiedenen Musikstücken durchzuführen. 

Jeder Start eines Jupyter Notebooks beginnt mit dem Import einer Reihe von Python-Bibliotheken, die für die Analyse erforderlich sind:  

In [1]:
import sys
import os
sys.path.append(os.getcwd().replace(os.path.join('music_xml_parser', 'ipynb'), ''))
import music_xml_parser as mp
from music21 import * 
import csv
from IPython.display import HTML, display
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# Mit diesen Befehlen wird nicht nur der CAMAT music_xml_parser, 
# sondern darüber hinaus die Bibliotheken 'numpy' und 'pandas' für statische Auswertungen, 
# 'music21' sowieund 'matplotlib' für grafische Darstellungen geladen. 

# Mit den folgenden Befehlen wird die Formtierung für die Tabellen festgelegt, 
# die weiter unten dargestellt werden - '9999' ist der Maximalwert: 

pd.set_option('display.max_rows', 9999)
pd.set_option('display.max_columns', 9999)
pd.set_option('display.width', 9999)
    
environment.set('autoDownload', 'allow')
# Hierdurch wird der Download von xml-Dateien aus dem Internet ermöglicht. 

Anschließend müssen Sie die Datei laden, die Sie untersuchen wollen (aus dem Internet oder von Ihrer Festplatte bzw. aus dem Notenordner) und den xml-parser aktivieren. Dabei wird aus der xml-Datei ein neuer dataframe ('m_df') erzeugt, der den folgenden statistischen Abfragen zugrunde liegt. 

Wir wählen für unser Tutorial als Beispiel den ersten Satz aus dem Streichquartett KV. 171 von Wolfgang Amadeus Mozart. 

In [2]:
xml_file = 'https://analyse.hfm-weimar.de/database/03/MoWo_K171_COM_1-4_StringQuar_003_00867.xml'

m_df = mp.parse.with_xml_file(file=xml_file,
                                    save_file_name=None,
                                    do_save=False)

# Mit dem Befehl wird hieraus ein Pandas-Dataframe (mit der Bezeichnung 'm_df') erzeugt.
# Zur Einstellung der Parameter vgl. Sie bitte das Tutorial_Part1_Introduction.

### 1. Abfrage von einfachen statistischen Angaben

Wir beginnen mit einfachen statistischen Abfragen der Anzahl der Stimmen, der Länge in Takten, der Anzahl der Töne (insgesamt und pro Stimmen) und dem Ambitus der einzelnen Stimmen. 

Bitte öffnen Sie die Notendatei parallel in Ihrem Noteneditor (z.B. MuseScore). 

Achtung: Da mit dem ersten Auswertungsbefehl die Daten erstmals eingelesen werden, braucht die Ausführung erfahrungsgemäß relativ lange (abhängig von Ihrem Computer und der Dateigröße bis zu mehreren Minuten). Alle späteren Befehle gehen dann aber sehr rasch!!

In [3]:
v = m_df[['PartID','PartName']].drop_duplicates().to_numpy()
mp.utils.display_table(data=v, 
                       columns=['Part ID', 'Part Name'])

# In der ersten Befehlszeile werden aus der dataframe-Liste des xml-Parser ('m_df')
# die PartIDs und PartNames, # also die IDs und Bezeichnungen der einzelnen Stimmen, abgefragt. 
# Hierfür wird die Variable 'v' vergeben.
# In der zweiten Zeile werden die Spaltenüberschriften der Tabelle festgelegt. 

# ACHTUNG: Ist in einer MusicXML-Datei keine Stimmbezeichnung festgelegt, 
# so kann diese hier natürlich auch nicht dargestellt werden ('None')!

Part ID,Part Name
1,Violino I
2,Violino II
3,Viola
4,Violoncello


In [4]:
m = m_df['Measure'].to_numpy(dtype=int)
max(m)
# Abfrage der Stückänge in Takten.

159

In [5]:
n_notes, c_notes = np.unique(m_df['PartName'], return_counts=True)
data = [[i, c] for i, c in zip(n_notes, c_notes) ]
mp.utils.display_table(data=data, 
                       columns=['Part Name', 'Notenanzahl'])
 
# Abfrage der Anzahl der Töne per Stimme, 
# wobei übergebundene Noten jeweils als eine Note gezählt werden. 
# Falls die Stimmen in der xml-Datei keine Bezeichnungen besitzen, 
# so muss 'PartName' (und 'Part Name') durch 'PartID' ersetzt werden! 

Part Name,Notenanzahl
Viola,382
Violino I,576
Violino II,626
Violoncello,385


In [6]:
ambitus = mp.analyse.ambitus(m_df,
                             output_as_midi=True)

mp.utils.display_table(data=ambitus, 
                       columns=['Part ID', 'PartName', 'min', 'max', 'Ambitus'])

# Der Ambitus per Stimme wird in Halbtonschritten angegeben. 
# Er errechnet sich aus der Differenz zwischen 
# dem niedrigsten (min) und höchsten (max) Ton, 
# hier angegeben in MIDI-Werten 
# mit c' = C4 = 60; c'' = C5 = 72 usw. 

Part ID,PartName,min,max,Ambitus
1,Violino I,57,87,30
2,Violino II,55,82,27
3,Viola,48,75,27
4,Violoncello,39,67,28


In [7]:
# Durch den Zusatz 'output_as_midi=False' werden die Töne mit Tonnamen angegeben. 

ambitus = mp.analyse.ambitus(m_df,
                             output_as_midi=False)

mp.utils.display_table(data=ambitus, 
                       columns=['Part ID', 'PartName', 'min', 'max', 'Semitones Difference'])


Part ID,PartName,min,max,Semitones Difference
1,Violino I,A3,D#6,30
2,Violino II,G3,A#5,27
3,Viola,C3,D#5,27
4,Violoncello,D#2,G4,28
