# Análisis de MIDI en R (Jupyter)

Notebook generado a partir de tu script original, separando cada bloque por celdas.

**Requisitos previos**: tener instalado el kernel de R para Jupyter (IRkernel) y Jupyter Lab/Notebook.


In [None]:
# 1) Crear entorno
# Por compatibilida de paquetes de R se debeusar python 3.11 en jupyter.
#mamba create -n r-jupyter -c conda-forge r-base r-irkernel jupyterlab

# 2) Activar entorno
#mamba activate r-jupyter

# 3) (Opcional pero útil) instalar herramientas nativas que a veces piden paquetes R
#    En Linux/macOS te evita dolor de cabeza con compilaciones.
#mamba install -c conda-forge pkg-config libsndfile fluidsynth

# 4) Lanzar Jupyter
#jupyter lab


In [2]:
# Instalar paquetes requeridos (ejecutar solo la primera vez)
iinstall.packages("IRkernel")
IRkernel::installspec(name = "ir-r-jupyter311", displayname = "R (r-jupyter311)")

install.packages("dplyr")
install.packages("fluidsynth", repos = "https://ropensci.r-universe.dev")
library(dplyr); library(fluidsynth)

ERROR: Error in iinstall.packages("IRkernel"): could not find function "iinstall.packages"


In [None]:
# Cargar librerías
library(fluidsynth)
library(dplyr)


In [None]:
# Leer el archivo MIDI y convertirlo en dataframe
# Ajustá la ruta del archivo según corresponda
midi_df <- midi_read("mz_311_1.mid")
str(midi_df)


In [None]:
# Filtrar el dataframe y quedarse sólo con los eventos de notas
ev_notes <- midi_df %>%
  dplyr::filter(event %in% c("NOTE_ON", "NOTE_OFF")) %>%
  dplyr::mutate(
    is_on  = (event == "NOTE_ON"  & param2 > 0),
    is_off = (event == "NOTE_OFF" | (event == "NOTE_ON" & param2 == 0))
  ) %>%
  dplyr::arrange(channel, param1, tick)   # ordenar por canal, pitch y tiempo

head(ev_notes)


In [None]:
# 3) Reconstruir las notas: para cada ON buscar el primer OFF posterior
notes <- ev_notes %>%
  dplyr::group_by(channel, pitch = param1) %>%
  dplyr::arrange(tick, .by_group = TRUE) %>%
  reframe({
    on_idx  <- which(is_on)   # posiciones de filas donde la nota se prendió
    off_idx <- which(is_off)  # posiciones de filas donde la nota se apagó
    
    if (length(on_idx) == 0) return(NULL)
    
    rows <- lapply(on_idx, function(i){
      # buscar el primer "apagado" después de este "encendido"
      k_rel <- which(off_idx > i)[1]   # índice relativo dentro de off_idx
      if (is.na(k_rel)) return(NULL)   # no hay OFF posterior, se descarta esa nota
      j <- off_idx[k_rel]              # índice absoluto de ese OFF en el dataframe del grupo
      
      tibble(
        tick_on  = tick[i],
        tick_off = tick[j],
        dur_ticks = tick[j] - tick[i],
        velocity  = param2[i]
      )
    })
    bind_rows(rows)
  }) %>%
  dplyr::ungroup()

head(notes)


In [None]:
# Resumir la pieza en una sola fila para entrenar al modelo
features <- notes %>%
  summarise(
    pitch_mean = mean(pitch, na.rm = TRUE),  # promedio de altura
    pitch_sd   = sd(pitch, na.rm = TRUE),    # cuánto varían las alturas
    vel_mean   = mean(velocity, na.rm = TRUE),  # intensidad media
    vel_sd     = sd(velocity, na.rm = TRUE),    # variación de intensidades
    dur_mean   = mean(dur_ticks, na.rm = TRUE), # duración promedio de las notas
    dur_sd     = sd(dur_ticks, na.rm = TRUE),   # variación de duraciones
    n_notes    = dplyr::n()                     # cantidad total de notas reconstruidas
  )

features


### Nota opcional sobre *pitch bend*
Si tu dataframe `midi_df` incluye eventos de **pitch bend** (a veces etiquetados como `PITCH_BEND`, `PITCHWHEEL`, o similares), podés agregarlos en un flujo aparte y fusionarlos luego por canal/tiempo si necesitás capturar desafinaciones microtonales.
