## CMF 1
Institut für Musikinformatik und Musikwissenschaft – Wintersemester 2025–26
### Woche 05 – Übungen

### Aufgabe 00.

Überlege dir eine Frage zum Inhalt der Vorlesung, z. B. über einen Punkt, der unklar geblieben ist oder über etwas, worüber du gerne mehr wissen möchtest.  

### Aufgabe 01. Vergleich von Melodien mithilfe der Levenshtein-Distanz.

In [8]:
import numpy as np
import music21 as m21

Die Levenshtein-Distanz (siehe Slides zur Woche 05) berechnet die Distanz zwischen 2 Zeichensequenzen anhand der minimalen Anzahl der **ersetzenden**, **einfügenden** und **löschenden** Operationen, die benötigt werden, um Sequenzen ineinander umzuwandeln.\
Wegen ihrer Flexibilität wird sie – in einer leicht abgewandelten Form – u.a. in der Bioinformatik benutzt, um DNA-Stränge miteinander zu vergleichen.


Das Ziel dieser Übungsaufgabe ist es, die Levenshtein-Distanz zu nutzen, um Melodien miteinander zu vergleichen.

1) Der folgende Code-Block enthält eine Implementierung der Levenshtein-Distanz.\
(Siehe dazu z. B. auch den Wikipedia-Eintrag zur Defintion und zur Implementierung Levenshtein-Distanz: https://de.wikipedia.org/wiki/Levenshtein-Distanz).

In [23]:
def levenshtein_distance(string1, string2):
    M = len(string1) + 1
    N = len(string2) + 1

    # Matrix zum Abspeichern der Distanzen zwischen allen möglichen Wort-Präfixen
    D = np.zeros([M, N])

    for i in range(M):
        for j in range(N):

            if i == 0:
                D[i, j] = j

            elif j == 0:
                D[i, j] = i 

            elif string1[i-1] == string2[j-1]:
                D[i, j] = D[i-1, j-1] 

            else:
                min_value = min(D[i-1, j-1], D[i-1, j], D[i, j-1])
                D[i, j] = 1 + min_value    

    return D[i, j]

2. Teste diese Funktion an einigen ausgewählten Wortpaaren und überprüfe das erhaltene Ergebnis.

In [24]:
# test with substitution of characters
string1 = 'test'
string2 = 'rest'
print(levenshtein_distance(string1, string2))

# test with insertion of characters
string1 = 'CMF 1'
string2 = 'CMF1'
print(levenshtein_distance(string1, string2))

# test with deletion of characters
string1 = 'uninformed'
string2 = 'uniformed'
print(levenshtein_distance(string1, string2))

# test with various character edits
string1 = 'kitten'
string2 = 'sitting'
print(levenshtein_distance(string1, string2))

1.0
1.0
1.0
3.0


3) Überlege dir eine oder mehrere Methoden, wie man die Levenshtein nutzen könnte, um verschiedene Melodien miteinander zu vergleichen.\
Melodien könnten dabei z. B., wie im folgenden Code-Block, in Form von Listen von *music21*-Note-Objekten dargestellt sein.

In [25]:
my_melody1 = [m21.note.Note("C4"), m21.note.Note("D4"), m21.note.Note("E4"), m21.note.Note("F4")]
my_melody2 = [m21.note.Note("C4"), m21.note.Note("D4"), m21.note.Note("B3"), m21.note.Note("F4"), m21.note.Note("E4")]

In [13]:
...

Ellipsis

4) Ein Trick, um Melodien in Form von Zeichenketten darzustellen, besteht darin, die Noten der Melodien über ihre entsprechenden MIDI-Nummern in einzelne Zeichen zu übersetzen.\
Dabei können die MIDI-Nummern zum Beispiel als ASCII-Code uminterpretiert werden.

Schreibe eine Funktion, die eine Melodie aus *music21*-Noten über ihre MIDI-Nummern in ASCII-Zeichen übersetzt.\
Teste die Funktion z. B. an den Melodien *my_melody1* und *my_melody2*.

*Hinweis:* Nutze zum Beispiel die Python-Funktion *chr()*.

In [None]:
# Test der Funktion chr():
for i in range(32, 127):
    print(chr(i))

In [19]:
def melody_to_string(melody=[m21.note.Note("C4"), m21.note.Note("E4"), m21.note.Note("G4")]):
    
    melody_MIDI_notes = [note.pitch.midi for note in melody]
    
    melody_ASCII_list = [chr(midiNumber) for midiNumber in melody_MIDI_notes]
    
    melody_string = ''.join(melody_ASCII_list)
    
    return melody_string

In [20]:
my_melody1_string = melody_to_string(my_melody1)
print(my_melody1_string)

<>@A


In [21]:
my_melody2_string = melody_to_string(my_melody2)
print(my_melody2_string)

<>;A@


5) Nutze die Funktion *melody_to_string*, um Melodien mithilfe der Levenshtein-Distanz zu vergleichen. Was stellt der ausgegebene Wert dar?

In [22]:
levenshtein_distance(my_melody1_string, my_melody2_string)

2.0

6) Welche weiteren Methoden und Maße könnte man verwenden, um Melodien miteinander zu vergleichen?

Zum Beispiel:
-  Hamming-Distanz (entspricht für zwei Zeichenfolgen gleicher Länge der Anzahl der Stellen mit unterschiedlichen Symbolen)
-  Longest-Common-Subsequence (entspricht der Länge der längsten gemeinsamen Teilsequenz zwischen zwei Zeichenfolgen)
-  Komplexere Maße könnten sowohl Tonhöhen als auch Rhythmus berücksichtigen, z. B. durch Kombination von 2 separaten Maßen für jeweils Tonhöhen und Rhythmus

### Aufgabe 02. Distanzen und Ähnlichkeiten zwischen Akkorden.

1) Schlage Möglichkeiten vor, um in einem  *12*-stufigen Tonsystem Akkorde darzustellen.

-  Darstellung als Mengen: welche Tonhöhen sind in den Akkorden enthalten, ohne spezifische Anordnung oder Reihenfolge.

-  Darstellung als Zeichenfolge: welche Tonhöhen sind in der Reihenfolge von der tiefsten bis zu höchsten Note im Akkord enthalten.

-  Darstellung als mehrdimensionale Datenpunkte oder Vektoren (mit oder ohne Berücksichtigung der Häufigkeit einzelner Tonhöhen-Klassen):

z. B. für den Akkord {C3, C4, E4, G4, C5}

| C  | C♯ | D  | E♭ | E  | F  | F♯ | G  | G♯ | A  | B♭ | H  |
|----|----|----|----|----|----|----|----|----|----|----|----|
| 1 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 0 |

chord_vector1 = [1, 0 , 0, 0, 1, 0, 0, 1, 0, 0, 0, 0]

oder:

| C  | C♯ | D  | E♭ | E  | F  | F♯ | G  | G♯ | A  | B♭ | H  |
|----|----|----|----|----|----|----|----|----|----|----|----|
| 3 | 0 | 0 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 0 |

chord_vector2 = [3, 0 , 0, 0, 1, 0, 0, 1, 0, 0, 0, 0]


2) Stelle dir ein 2-stufiges Tonsystem vor, in dem es nur die Noten C und G gibt (über alle Oktaven verteilt).\
Schlage Methoden vor, um Akkorde, die in diesem Tonsystem gebildet werden, untereinander vergleichen zu können und vergleiche diese Methoden untereinander.

*Beispiele von Akkorden in diesem 2-stufigen Tonsystem*: {c1, g1}, {c1, g2, c2}, {c1, c2, c3}, ... 

- Bei Darstellung als Menge: z. B. Jaccard-Index
- Bei Darstellung als Zeichenfolge: z. B. Levenshtein-Distanz, Hamming-Distanz oder Longest-Common-Subsequence 
- Bei Darstellung als Punkt/Vektor: z. B. euklidische Distanz oder Cosine-Similarity


3) Schlage eine Implementierung des Jaccard-Indexes (siehe Folie 19 der Woche 05) vor und versuche, diese zu nutzen, um beliebige Akkorde miteinander zu vergleichen.\
Schreibe dazu eine Funktion *jaccard_index*, die den Jaccard-Index zwischen zwei beliebigen Mengen berechnet.

*Hinweis:* Da der Jaccard-Index in Maß ist, um Mengen miteinander zu vergleichen, könnte es in diesem Kontext sinnvoll sein, Akkorde als *set* zu implementieren.

In [28]:
chord1 = {'C4', 'E4', 'G4'}
chord2 = {'C4', 'E4', 'G4', 'B4'}
chord3 = {'D4', 'F#4', 'A4'}

In [29]:
print(type(chord1))

<class 'set'>


In [30]:
chord1b = {'E4', 'G4', 'C4'}
print(chord1 == chord1b)

True


In [31]:
def jaccard_index(set1, set2):
    
    len_intersection = len(set1.intersection(set2))
    len_union = len(set1.union(set2))
    
    jaccard_index = len_intersection / len_union

    return jaccard_index

4) Nutze die Funktion *jaccard_index*, um verschiedene Akkorde miteinander zu vergleichen. Was stellt der ausgegebene Wert dar?

In [32]:
print(jaccard_index(chord1, chord2))
print(jaccard_index(chord1, chord3))
print(jaccard_index(chord2, chord3))

0.75
0.0
0.0
