In [2]:
import numpy as np
import mido

In [3]:
mid = mido.MidiFile('1.mid')

In [18]:
# all track transfer into one matrix
def to_piano_roll(midi):
    """
    Convert MIDI file to a 2D NumPy ndarray (notes, timesteps).
    Put all the track into one ndarray
    """
    notes = 127
    tempo = 500000  # Assume same default tempo and 4/4 for all MIDI files.
    seconds_per_beat = tempo / 1000000.0
    seconds_per_tick = seconds_per_beat / midi.ticks_per_beat
    # we use this part to store every notes
    velocities = np.zeros(notes)
    # and this store everything together
    sequence = []
    for m in midi:
        ticks = int(np.round(m.time / seconds_per_tick))
        print(m.time,ticks, seconds_per_tick)
        ls = [velocities.copy()] * ticks
        sequence.extend(ls)
        if m.type == 'note_on':
            # in the note place some thing happen
            velocities[m.note] = m.velocity
        elif m.type == 'note_off':
            velocities[m.note] = 0
        else:
            continue
    piano_roll = np.array(sequence).T
    return piano_roll

In [5]:
def track_to_ndarray(mid, ticks_per_beat):
    notes = 127
    tempo = 500000
    seconds_per_beat = tempo / 1000000.0
    seconds_per_tick = seconds_per_beat / ticks_per_beat
    velocities = np.zeros(notes)
    sequence = []
    for m in mid:
        """
        Some parts of Mido use the attribute for special purposes. In MIDI file tracks, it is used as delta time (in ticks).
        """
        print(m)

In [7]:
for i, track in enumerate(mid.tracks):
    print('Track {}: {}'.format(i, track.name))
    track_to_ndarray(track, ticks_per_beat)

Track 0: 20th Century Fox
<meta message track_name name='20th Century Fox' time=0>
<meta message time_signature numerator=2 denominator=4 clocks_per_click=24 notated_32nd_notes_per_beat=8 time=0>
<meta message set_tempo tempo=480000 time=0>
<meta message time_signature numerator=4 denominator=4 clocks_per_click=24 notated_32nd_notes_per_beat=8 time=1920>
<meta message set_tempo tempo=483870 time=9112>
<meta message set_tempo tempo=487804 time=16>
<meta message set_tempo tempo=495867 time=8>
<meta message set_tempo tempo=504201 time=8>
<meta message set_tempo tempo=508474 time=8>
<meta message set_tempo tempo=512820 time=16>
<meta message set_tempo tempo=550458 time=3784>
<meta message set_tempo tempo=555555 time=8>
<meta message set_tempo tempo=566037 time=8>
<meta message set_tempo tempo=571428 time=16>
<meta message set_tempo tempo=576923 time=16>
<meta message set_tempo tempo=582524 time=8>
<meta message set_tempo tempo=588235 time=16>
<meta message set_tempo tempo=594059 time=32>
<

In [8]:
for m in mid:
    print(m)

<meta message track_name name='20th Century Fox' time=0>
<meta message time_signature numerator=2 denominator=4 clocks_per_click=24 notated_32nd_notes_per_beat=8 time=0>
<meta message set_tempo tempo=480000 time=0>
<meta message track_name name='Trumpet' time=0>
<meta message channel_prefix channel=0 time=0>
<meta message instrument_name name='Trumpet' time=0>
<meta message key_signature key='C' time=0>
<meta message track_name name='Trombone' time=0>
<meta message channel_prefix channel=1 time=0>
<meta message instrument_name name='Trombone' time=0>
<meta message key_signature key='C' time=0>
<meta message track_name name='Tuba' time=0>
<meta message channel_prefix channel=2 time=0>
<meta message instrument_name name='Tuba' time=0>
<meta message key_signature key='C' time=0>
<meta message track_name name='Strings' time=0>
<meta message channel_prefix channel=3 time=0>
<meta message instrument_name name='Strings' time=0>
<meta message key_signature key='C' time=0>
<meta message track_n

In [21]:
# looks like the only differences is almost 1000

for msg in mido.merge_tracks(mid.tracks):
    notes = 127
    tempo = 500000
    seconds_per_beat = tempo / 1000000.0
    seconds_per_tick = seconds_per_beat / 480
    print(msg.time/1000)
    #print(msg.time*seconds_per_tick)

0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.01
0.005
0.005
0.005
0.005
0.005
0.005
0.005
0.005
0.005
0.005
0.005
0.005
0.005
0.005
0.005
0.005
0.005
0.005
0.005
0.005
0.005
0.005
0.005
1.615
0.0
0.056
0.0
0.004
0.0
0.056
0.0
0.004
0.0
0.06
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.196
0.0
0.0
0.0
0.0
0.044
0.0
0.0
0.0
0.0
0.196
0.0
0.0
0.0
0.0
0.344
0.0
0.0
0.004
0.004
0.004
0.004
0.004
0.004
0.004
0.004
0.004
0.008
0.004
0.004
0.004
0.0
0.0
0.004
0.0
0.0
0.004
0.004
0.004
0.004
0.004
0.008
0.004
0.004
0.004
0.004
0.004
0.004
0.004
0.0
0.0
0.004
0.0
0.0
0.004
0.008
0.004
0.004
0.004
0.004
0.004
0.004
0.004
0.004
0.004
0.008
0.0
0.0
0.004
0.0
0.0
0.0
0.0
0.196
0.0
0.0
0.0
0.0
0.044
0.0
0.0
0.0
0.0
0.196
0.0
0.0
0.0
0.0
0.524
0.0
0.0
0.0
0.0
0.0
0.004
0.004
0.008
0.004
0.008
0.004
0.008
0.004
0.008
0.004
0.0
0.0
0.004
0.0
0.004
0.004
0.008


In [10]:
notes = 127
tempo = 500000
seconds_per_beat = tempo / 1000000.0
seconds_per_tick = seconds_per_beat / 480

In [11]:
5745*seconds_per_tick

5.984375

In [19]:
to_piano_roll(mid)

0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.0010416666666666667
0 0 0.001041

array([[ 0.,  0.,  0., ...,  0.,  0.,  0.],
       [ 0.,  0.,  0., ...,  0.,  0.,  0.],
       [ 0.,  0.,  0., ...,  0.,  0.,  0.],
       ..., 
       [ 0.,  0.,  0., ...,  0.,  0.,  0.],
       [ 0.,  0.,  0., ...,  0.,  0.,  0.],
       [ 0.,  0.,  0., ...,  0.,  0.,  0.]])