# S09 ‚Äî Timbre, enerx√≠a e ‚Äúpegada sonora‚Äù (features + comparaci√≥n)
**Curso:** Programaci√≥n Musical con Python ‚Äî 2¬∫ Trimestre  
**Duraci√≥n:** 1 sesi√≥n (‚âà 1 hora)

## üéØ Obxectivos
- Entender ‚Äúfeatures‚Äù sinxelas de audio: **enerx√≠a** e **timbre**.
- Calcular e visualizar:
  - RMS (enerx√≠a)
  - Centroide espectral (brillo)
  - Zero Crossing Rate (rugosidade/ru√≠do)
- Constru√≠r unha **pegada sonora** (vector de features) para comparar audios.
- Mini-clasificaci√≥n simple: decidir cal fragmento √© A/B con regras.

> üéõÔ∏è Hoxe facemos MIR suave: datos do son, sen IA complexa.


## 0) Setup (Colab)


In [None]:
!pip -q install librosa soundfile

import numpy as np
import matplotlib.pyplot as plt
import librosa
import librosa.display

from IPython.display import Audio, display

print("‚úÖ librosa listo")


## 1) Cargar audio(s)

Usaremos 2 audios de exemplo de librosa para comparar.
Tam√©n podes usar 1 audio e cortar 2 fragmentos (como no S08).


In [None]:
path1 = librosa.ex("trumpet")
path2 = librosa.ex("choice")

y1, sr1 = librosa.load(path1, sr=None)
y2, sr2 = librosa.load(path2, sr=None)

print("Audio1 sr/dur:", sr1, round(len(y1)/sr1, 2), "s")
print("Audio2 sr/dur:", sr2, round(len(y2)/sr2, 2), "s")

display(Audio(y1, rate=sr1))
display(Audio(y2, rate=sr2))


## 2) Features b√°sicas (a nosa ‚Äúcaixa de ferramentas‚Äù)

### RMS (Root Mean Square) = enerx√≠a
- canto m√°is alto, m√°is ‚Äúforte‚Äù (en media)

### Centroide espectral = brillo
- canto m√°is alto, m√°is ‚Äúbrillante‚Äù / m√°is agudos dominantes

### Zero Crossing Rate (ZCR)
- cantos cruces por cero: m√°is alto ‚Üí m√°is ru√≠do / textura √°spera


In [None]:
def features_basicas(y, sr):
    rms = librosa.feature.rms(y=y)[0]
    centroid = librosa.feature.spectral_centroid(y=y, sr=sr)[0]
    zcr = librosa.feature.zero_crossing_rate(y)[0]
    return rms, centroid, zcr

rms1, cent1, zcr1 = features_basicas(y1, sr1)
rms2, cent2, zcr2 = features_basicas(y2, sr2)

print("Feature lengths:", len(rms1), len(cent1), len(zcr1))


## 3) Visualizar features no tempo

Debuxamos cada feature como unha curva ao longo do tempo.


In [None]:
def plot_feature(feat, sr, hop_length=512, title=""):
    times = librosa.frames_to_time(np.arange(len(feat)), sr=sr, hop_length=hop_length)
    plt.figure()
    plt.plot(times, feat)
    plt.title(title)
    plt.xlabel("Tempo (s)")
    plt.show()

plot_feature(rms1, sr1, title="RMS (enerx√≠a) - audio1")
plot_feature(cent1, sr1, title="Centroide espectral (brillo) - audio1")
plot_feature(zcr1, sr1, title="ZCR - audio1")


In [None]:
plot_feature(rms2, sr2, title="RMS (enerx√≠a) - audio2")
plot_feature(cent2, sr2, title="Centroide espectral (brillo) - audio2")
plot_feature(zcr2, sr2, title="ZCR - audio2")


## 4) ‚ÄúPegada sonora‚Äù (fingerprint) simple

Imos resumir cada audio cun vector de 6 n√∫meros:
- media e desviaci√≥n t√≠pica de RMS
- media e desviaci√≥n t√≠pica de centroide
- media e desviaci√≥n t√≠pica de ZCR

Isto √© unha pegada num√©rica para comparar.


In [None]:
def fingerprint(y, sr):
    rms, cent, zcr = features_basicas(y, sr)
    vec = np.array([
        np.mean(rms),  np.std(rms),
        np.mean(cent), np.std(cent),
        np.mean(zcr),  np.std(zcr)
    ], dtype=float)
    return vec

fp1 = fingerprint(y1, sr1)
fp2 = fingerprint(y2, sr2)

fp1, fp2


### Comparaci√≥n por distancia

Se dous audios te√±en pegadas parecidas, a distancia ser√° pequena.
Usaremos distancia eucl√≠dea (sinxela).


In [None]:
def dist(a, b):
    return float(np.linalg.norm(a - b))

print("Distancia fp1‚Äìfp2:", round(dist(fp1, fp2), 4))


## 5) Mini-clasificador por regras (sen IA)

Exemplo de regra:
- Se o centroide medio √© alto ‚Üí m√°is brillante
- Se o ZCR medio √© alto ‚Üí m√°is ru√≠doso

Imos facer unha funci√≥n que ‚Äúdescribe‚Äù un audio.


In [None]:
def describir(fp):
    rms_m, rms_s, cent_m, cent_s, zcr_m, zcr_s = fp
    desc = []
    desc.append("m√°is forte" if rms_m > 0.05 else "m√°is suave")
    desc.append("m√°is brillante" if cent_m > 2000 else "m√°is escuro")
    desc.append("m√°is ru√≠doso" if zcr_m > 0.08 else "m√°is limpo")
    return ", ".join(desc)

print("Audio1:", describir(fp1))
print("Audio2:", describir(fp2))


## 6) Clasificaci√≥n simple de fragmentos (exercicio)

Imos cortar 2 fragmentos do mesmo audio e ver se podemos diferencialos.


In [None]:
def cortar(y, sr, inicio_s, fin_s):
    i0 = int(inicio_s * sr)
    i1 = int(fin_s * sr)
    return y[i0:i1]

# Cortes do audio2 (r√≠tmico)
fragA = cortar(y2, sr2, 0, 6)
fragB = cortar(y2, sr2, 6, 12)

display(Audio(fragA, rate=sr2))
display(Audio(fragB, rate=sr2))

fpA = fingerprint(fragA, sr2)
fpB = fingerprint(fragB, sr2)

print("FragA:", describir(fpA))
print("FragB:", describir(fpB))
print("Distancia A‚ÄìB:", round(dist(fpA, fpB), 4))


## üß© Mini-proxecto avaliable (entrega)

### Parte A (t√©cnica)
Escolle 2 opci√≥ns:

**Opci√≥n 1 (dous audios distintos)**
- Comparar 2 audios (ex. trompeta vs ritmo)
- Calcular RMS, centroide, ZCR
- Constru√≠r fingerprint e distancia

**Opci√≥n 2 (dous fragmentos do mesmo audio)**
- Cortar 2 fragmentos diferentes
- Calcular features e fingerprint
- Comparar por distancia e por descrici√≥n

### Parte B (reflexi√≥n, 8‚Äì10 li√±as)
- Que feature che axudou m√°is a diferenciar?
- Coincide co que escoitas?
- Que limitaci√≥ns ten esta aproximaci√≥n (sen IA)?


In [None]:
# ‚úÖ Espazo de traballo: escolle a t√∫a opci√≥n aqu√≠

# Opci√≥n 1: carga dous audios teus (subidos) e chama fingerprint()
# ruta1 = "audio1.wav"
# ruta2 = "audio2.wav"

# Opci√≥n 2: usa un audio e corta dous fragmentos diferentes
# y, sr = librosa.load(ruta1, sr=None)
# frag1 = cortar(y, sr, 0, 5)
# frag2 = cortar(y, sr, 5, 10)
# fp1 = fingerprint(frag1, sr)
# fp2 = fingerprint(frag2, sr)
# print(dist(fp1, fp2), describir(fp1), describir(fp2))


## üß† Ler c√≥digo como partitura (checkpoint)
Antes de entregar:
- `# CARGA`
- `# FEATURES`
- `# FINGERPRINT`
- `# COMPARACI√ìN`
- `# INTERPRETACI√ìN`
O notebook debe lerse como un ‚Äúinforme musical‚Äù estruturado.
