Aqui, começaremos a atacar o problema de sincronizar nossos arquivos de audio com os acordes escritos. Primeiramente, tentaremos, para uma dada música, determinar os acordes por compasso. Faremos isso tomando como base os arquivos em formato xml.

In [53]:
import pandas as pd
import numpy as np
import os
import xml.etree.ElementTree as ET
song_title = 'Gillette'
tree = ET.parse('corpus/xml/{}.xml'.format(song_title))
root = tree.getroot()

In [54]:
part = root.findall('part')[0]
measures = part.findall('measure')
for measure in measures:
    chords = measure.findall('harmony')
    for chord in chords:
        try:
            note = chord.find('root/root-step').text

        except AttributeError: # se não achar a nota "root" do acorde, não tem acorde
            print('Measure: {}'.format(measure.attrib['number']), ' | ', 'No chords')
            continue
            
        if note:
            # alter é a alteração de um acorde (nem sempre existe): b ou #.
            alter = chord.find('root/root-alter')#.text
            
            # kind é o tipo do acorde (nem sempre existe): pode ser com 7a, 9a, 13a, por aí vai...
            kind = chord.find('kind')#.attrib['text']
            
            # bass é o baixo do acorde, quando diferente da tônica. Também nem sempre existe.
            bass = chord.find('bass/bass-step')#.text
            
            # bass_alter é e alteração do baixo, podendo ser b ou #. Também nem sempre existe.
            bass_alter = chord.find('bass/bass-alter')#.text
            
            attribs_dict = {'alter':alter, 
                            'kind':kind, 
                            'bass':bass, 
                            'bass_alter':bass_alter}

            for key, value in attribs_dict.items():
                if value is None:
                    attribs_dict[key] = ''
                elif key == 'kind':
                    attribs_dict[key] = value.attrib['text']
                else:
                    attribs_dict[key] = value.text
                    
            print('Measure: {}'.format(measure.attrib['number']), '|', 'Chord: ', note, 
                  attribs_dict['alter'], attribs_dict['kind'],'/',attribs_dict['bass'],attribs_dict['bass_alter'])
            

Measure: 1 | Chord:  B -1  /  
Measure: 5 | Chord:  F  7 /  
Measure: 9 | Chord:  B -1  /  
Measure: 11 | Chord:  E -1  /  
Measure: 13 | Chord:  F   /  
Measure: 13 | Chord:  E  dim /  
Measure: 13 | Chord:  C  min6 /  
Measure: 13 | Chord:  D  min7 /  
Measure: 14 | Chord:  A  min /  
Measure: 14 | Chord:  F  7 /  
Measure: 15 | Chord:  B -1 7 /  
Measure: 17 | Chord:  B -1 7 /  


Comparando com a partitura aberta no musescore parece fazer sentido, só preciso conseguir fazer com que mostre também os compassos em que não tem acorde (no caso da música que estamos usando como exemplo, os compassos 1 e 2).

Agora, vamos modificar ligeiramente o código acima para adicionar as informações em um dataframe.

In [55]:
df_teste = pd.DataFrame(columns=[song_title])
df_add = pd.DataFrame(columns=[song_title], 
                      index=[3], 
                      data='E -1 min7')

df_add_2 = pd.DataFrame(columns=[song_title], 
                      index=[3], 
                      data='D -1')

In [56]:
df_teste = df_teste.append(df_add)

In [57]:
df_teste.append(df_add_2)

Unnamed: 0,Gillette
3,E -1 min7
3,D -1


In [58]:
df_harmony = pd.DataFrame(columns=[song_title])

part = root.findall('part')[0]
measures = part.findall('measure')

for measure in measures:
    chords = measure.findall('harmony')
    for chord in chords:
        try:
            note = chord.find('root/root-step').text

        except AttributeError: # se não achar a nota "root" do acorde, não tem acorde
            print('Measure: {}'.format(measure.attrib['number']), ' | ', 'No chords')
            continue
            
        if note:
            # alter é a alteração de um acorde (nem sempre existe): b ou #.
            alter = chord.find('root/root-alter')#.text
            
            # kind é o tipo do acorde (nem sempre existe): pode ser com 7a, 9a, 13a, por aí vai...
            kind = chord.find('kind')#.attrib['text']
            
            # bass é o baixo do acorde, quando diferente da tônica. Também nem sempre existe.
            bass = chord.find('bass/bass-step')#.text
            
            # bass_alter é e alteração do baixo, podendo ser b ou #. Também nem sempre existe.
            bass_alter = chord.find('bass/bass-alter')#.text
            
            attribs_dict = {'alter':alter, 
                            'kind':kind, 
                            'bass':bass, 
                            'bass_alter':bass_alter}

            for key, value in attribs_dict.items():
                if value is None:
                    attribs_dict[key] = ''
                elif key == 'kind':
                    attribs_dict[key] = value.attrib['text']
                else:
                    attribs_dict[key] = value.text
                    
                    
            measure_number = measure.attrib['number']
            chord = note + attribs_dict['alter'] + attribs_dict['kind']
            chord_bass = attribs_dict['bass']+attribs_dict['bass_alter']
            complete_chord = chord + '/' + chord_bass
            
            if complete_chord.endswith('/'):
                complete_chord = complete_chord[:-1]
            
            df_chord = pd.DataFrame(columns=[song_title], index=[measure_number], data=complete_chord)
            df_harmony = df_harmony.append(df_chord)
            
df_harmony.index.names = ['Measure']

In [59]:
df_harmony.index.unique()

Index(['1', '5', '9', '11', '13', '14', '15', '17'], dtype='object', name='Measure')

In [60]:
df_harmony.index.value_counts()

13    4
14    2
11    1
9     1
15    1
1     1
17    1
5     1
Name: Measure, dtype: int64

In [61]:
df_harmony

Unnamed: 0_level_0,Gillette
Measure,Unnamed: 1_level_1
1,B-1
5,F7
9,B-1
11,E-1
13,F
13,Edim
13,Cmin6
13,Dmin7
14,Amin
14,F7


Agora vamos procurar os momentos de mudança de acorde. Vasculhando os arquivos xml que temos em nosso corpus, pudemos ver que as informações sobre andamento (em bpm) e tipo de compasso encontram-se na seção do primeiro compasso. Segue:

#### Tipo de compasso

In [62]:
first_measure = measures[0]
cima = first_measure.find('attributes').find('time/beats').text
baixo = first_measure.find('attributes').find('time/beat-type').text

compasso = cima + '/' + baixo
compasso

'2/2'

#### Andamento

In [63]:
andamento = first_measure.find('sound').attrib['tempo']# + ' bpm'
andamento
# em bpm

'300'

#### Sync: Acorde + minutagem

In [64]:
df_harmony['Time'] = ''
df_harmony

Unnamed: 0_level_0,Gillette,Time
Measure,Unnamed: 1_level_1,Unnamed: 2_level_1
1,B-1,
5,F7,
9,B-1,
11,E-1,
13,F,
13,Edim,
13,Cmin6,
13,Dmin7,
14,Amin,
14,F7,


In [65]:
duracao_seminima = 60/int(andamento) # em segundos

Fazendo caso a caso pra construir a generalização:

In [66]:
# if int(baixo) == 2: # a unidade é a mínima
#     segs_compasso = 2 * int(cima) * duracao_seminima
    
# elif int(baixo) == 4: # a unidade é a seminínima
#     segs_compasso = 1 * int(cima) * duracao_seminima
    
# elif int(baixo) == 8: # a unidade é a colcheia
#     segs_compasso = (1/2) * int(cima) * duracao_seminima
    
# elif int(baixo) == 16: # a unidade é a semicolcheia
#     segs_compasso = (1/4) * int(cima) * duracao_seminima

Checar se a generalização abaixo tá certa:

In [67]:
segs_compasso = (4/int(baixo)) * int(cima) * duracao_seminima

In [68]:
df_harmony.index = df_harmony.index.astype(int)

In [69]:
for compasso in df_harmony.index.unique():
    acordes = df_harmony.loc[[compasso]]
    n_acordes = len(acordes)
    print(compasso, n_acordes)
    inicio_compasso = (int(compasso) - 1) * segs_compasso
    
    if n_acordes == 1:
        tempos = inicio_compasso
    
    else:        
        tempos = np.linspace(inicio_compasso,
                             inicio_compasso + segs_compasso,
                             n_acordes+1)
        tempos = tempos[:-1]
#     df_harmony.loc[compasso]['Time'] = tempos
    
    df_harmony.at[compasso, 'Time'] = tempos

1 1
5 1
9 1
11 1
13 4
14 2
15 1
17 1


In [70]:
df_harmony

Unnamed: 0_level_0,Gillette,Time
Measure,Unnamed: 1_level_1,Unnamed: 2_level_1
1,B-1,0.0
5,F7,3.2
9,B-1,6.4
11,E-1,8.0
13,F,9.6
13,Edim,9.8
13,Cmin6,10.0
13,Dmin7,10.2
14,Amin,10.4
14,F7,10.8


Botei pra tocar e as mudanças de acorde parecem estar fazendo sentido! 
Uma coisa que acabei de pensar é sobre os ritornellos... acho que desta maneira não os reconhecemos. Verificar depois.

## Lidando com ritornellos

In [81]:
song_title

'Gillette'

In [80]:
part = root.find('part')
measures = part.findall('measure')
for measure in measures:
    barras = measure.findall('barline')
    for barra in barras:
        
        ritornellos = barra.findall('repeat')
        for rito in ritornellos:
            print('Ritornello', measure.attrib['number'], rito.attrib['direction'])
#             print(rito)
            
        casas = barra.findall('ending')
        for casa in casas:
            print('Compasso: ',
                    measure.attrib['number'], '|',
                    'Casa nº', casa.attrib['number'], '({})'.format(casa.attrib['type']))

            


Ritornello 1 forward
Compasso:  15 | Casa nº 1 (start)
Ritornello 16 backward
Compasso:  16 | Casa nº 1 (stop)
Compasso:  17 | Casa nº 2 (start)
Compasso:  17 | Casa nº 2 (discontinue)


#### Casas
O que descobri: elas vêm como um "ending" dentro de um "barline". O interessante é que, para construir uma casa, precisamos de duas estruturas desse tipo: uma pra começar a casa e outra pra terminar. Então, por exemplo, se uma casa começa e termina num mesmo compasso, teremos dois "barlines" com "ending" dentro; um com "type" igual a "start" e outro com "type" igual a "stop" ou "descontinue" (o que vi até agora).

In [89]:
part = root.find('part')
measures = part.findall('measure')

# lista que conterá os compassos que têm ritornellos backward
ritos_back = []

# lista que conterá os compassos que têm ritornellos forward
ritos_forw = []
for measure in measures:
    barras = measure.findall('barline')
    for barra in barras:
        
        ritornellos = barra.findall('repeat')
        
        for rito in ritornellos:
            if rito.attrib['direction'] == 'backward':
                ritos_back.append(measure.attrib['number'])
            elif rito.attrib['direction'] == 'forward':
                ritos_forw.append(measure.attrib['number'])
#             print('Ritornello', measure.attrib['number'], rito.attrib['direction'])
#             print(rito)

            
        casas = barra.findall('ending')
        for casa in casas:
            print('Compasso: ',
                    measure.attrib['number'], '|',
                    'Casa nº', casa.attrib['number'], '({})'.format(casa.attrib['type']))

            


Compasso:  15 | Casa nº 1 (start)
Compasso:  16 | Casa nº 1 (stop)
Compasso:  17 | Casa nº 2 (start)
Compasso:  17 | Casa nº 2 (discontinue)


In [90]:
ritos_back

['16']

In [91]:
ritos_forw

['1']

### Numeração das casas
Aqui vamos checar como os números das casas aparecem em nosso corpus. (ex.: pode acontecer de um mesmo compasso representar as casas 1, 2 e 3, como observamos na música It's on.)

In [105]:
songs = os.listdir('corpus/xml')
ending_numbers = []
for song in songs:
#     print(song)
    tree = ET.parse('corpus/xml/{}'.format(song))
    root = tree.getroot()
    part = root.find('part')
    measures = part.findall('measure')
    for measure in measures:
        barras = measure.findall('barline')
        for barra in barras:
            casas = barra.findall('ending')
            for casa in casas:
                ending_numbers.append(casa.attrib['number'])
                if casa.attrib['number'] == '':
                    # printando casas com numeração vazia pra investigar
                    print(song)
#                 print(song)


Cold Duck B with bass.xml
Cold Duck B with bass.xml
Humanism.xml
Humanism.xml
Humanism.xml
Humanism.xml
Humanism.xml
lhcd.xml
lhcd.xml
Dangerous Curves B.xml
Dangerous Curves B.xml
Dangerous Curves B.xml
PCH.xml
Cold duck Lead.xml
Cold duck Lead.xml
ReyJorge.xml
ReyJorge.xml
ReyJorge.xml
ReyJorge.xml
HustlerTheII.xml
HustlerTheII.xml
OneShiningSoul.xml
OneShiningSoul.xml
Dangerous Curves A.xml
Dangerous Curves A.xml
Dangerous Curves A.xml


In [103]:
from collections import Counter

In [104]:
Counter(ending_numbers)

Counter({'1': 444,
         '2': 433,
         '1, 2, 3': 8,
         '4': 13,
         '': 26,
         '1, 2, 3, 4': 6,
         '3': 21,
         '5': 2,
         '1, 2, 3, 4, 5': 6,
         '1, 2': 4,
         '7': 4,
         '1, 3, 5': 2,
         '2, 4, 6': 2,
         '6': 2})

Vemos acima que é utilizado com alguma frequência o recurso de atribuir a uma casa vários números diferentes, i.e., quando uma mesma casa aparece como casas 1 e 2, por exemplo. Isso adiciona alguns desafios à nossa sincronização.

Outro lance interessante que apareceu foram casas com numeração vazia. Preciso investigar isso melhor...

Já entendi tudoooo! Casa com número vazio é quando não tem casa. Rs. Apenas o ritornello. Repete exatamente igual o que passou. Show.