In [None]:
import librosa
import librosa.display
import matplotlib.pyplot as plt

# 加载音频文件
audio_path = 'sample_audio.wav'
audio, sr = librosa.load(audio_path)

# 绘制音频波形图
plt.figure(figsize=(10, 6))
librosa.display.waveshow(audio, sr=sr)
plt.title('Waveform')
plt.xlabel('Time (s)')
plt.ylabel('Amplitude')
plt.show()

# 绘制音频频谱图
plt.figure(figsize=(10, 6))
librosa.display.specshow(librosa.amplitude_to_db(librosa.stft(audio), ref=np.max), y_axis='log', x_axis='time')
plt.colorbar(format='%+2.0f dB')
plt.title('Spectrogram')
plt.show()

In [None]:
import librosa.feature

# 提取MFCC特征
mfccs = librosa.feature.mfcc(audio, sr=sr, n_mfcc=13)

# 可视化MFCC特征
plt.figure(figsize=(10, 6))
librosa.display.specshow(mfccs, x_axis='time')
plt.colorbar()
plt.title('MFCC')
plt.xlabel('Time (s)')
plt.ylabel('MFCC Coefficients')
plt.show()

In [None]:
tempo, beat_frames = librosa.beat.beat_track(audio, sr=sr)

# 输出节奏信息
print(f'Tempo: {tempo} BPM')
print(f'Beat frames: {beat_frames}')

# 绘制节奏图
plt.figure(figsize=(10, 6))
librosa.display.waveshow(audio, sr=sr, alpha=0.5)
plt.vlines(librosa.frames_to_time(beat_frames), -1, 1, color='r', alpha=0.7, label='Beats')
plt.title('Beat Tracking')
plt.legend()
plt.show()

实际应用场景
1. 音乐信息检索
场景描述： 正在构建一个音乐信息检索系统，用户可以通过输入歌曲的音频文件或音频特征来搜索相似的音乐。Librosa可用于提取音频特征并计算相似度。

In [None]:
import librosa
import numpy as np

# 加载查询音频和数据库中的音频
query_audio, query_sr = librosa.load('query_audio.wav')
database_audio, database_sr = librosa.load('database_audio.wav')

# 提取MFCC特征
query_mfcc = librosa.feature.mfcc(query_audio, sr=query_sr)
database_mfcc = librosa.feature.mfcc(database_audio, sr=database_sr)

# 计算MFCC特征之间的相似度
similarity = np.dot(query_mfcc.T, database_mfcc)

# 找到最相似的音频
most_similar_index = np.argmax(similarity)

2. 语音识别
场景描述： 正在开发一个语音识别应用程序，用户可以通过麦克风录制音频并将其转换为文本。Librosa可用于音频特征提取，然后与语音识别模型一起使用。

In [None]:
import librosa
import speech_recognition as sr

# 录制音频
r = sr.Recognizer()
with sr.Microphone() as source:
    print("请开始说话...")
    audio = r.listen(source)

# 将音频转换为文本
try:
    text = r.recognize_google(audio)
    print("识别结果：", text)
except sr.UnknownValueError:
    print("无法识别音频")
except sr.RequestError as e:
    print(f"请求出错：{e}")

3. 音频分类
场景描述： 正在构建一个音频分类模型，可以将音频文件分类为不同的音乐风格或情感类别。Librosa可用于提取音频特征，然后与机器学习模型一起使用。

In [None]:
import librosa
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score

# 加载和提取音频特征
data = []  # 存储特征和标签的列表

for file_path in audio_files:
    audio, sr = librosa.load(file_path)
    mfccs = librosa.feature.mfcc(audio, sr=sr)
    label = get_label_from_filename(file_path)
    data.append((mfccs, label))

# 数据准备和划分
X = [item[0] for item in data]
y = [item[1] for item in data]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 训练分类模型
clf = RandomForestClassifier()
clf.fit(X_train, y_train)

# 预测并计算准确率
y_pred = clf.predict(X_test)
accuracy = accuracy_score(y_test, y_pred)
print("准确率：", accuracy)

4. 音频可视化工具
场景描述： 正在构建一个音频编辑或音频处理工具，需要为用户提供音频可视化功能。Librosa可以用于生成音频波形图、频谱图和色度图，以便用户更好地理解音频。

In [None]:
import librosa
import librosa.display
import matplotlib.pyplot as plt

# 加载音频文件
audio, sr = librosa.load('audio_file.wav')

# 绘制音频波形图
plt.figure(figsize=(10, 6))
librosa.display.waveshow(audio, sr=sr)
plt.title('Waveform')
plt.xlabel('Time (s)')
plt.ylabel('Amplitude')
plt.show()

# 绘制音频频谱图
plt.figure(figsize=(10, 6))
librosa.display.specshow(librosa.amplitude_to_db(librosa.stft(audio), ref=np.max), y_axis='log', x_axis='time')
plt.colorbar(format='%+2.0f dB')
plt.title('Spectrogram')
plt.show()

5. 音频处理
场景描述： 需要对音频进行处理，例如去除噪音、改变音调、变速等。Librosa提供了一些音频处理工具，可实现这些任务。

In [None]:
import librosa

# 加载音频文件
audio, sr = librosa.load('audio_file.wav')

# 去除噪音
audio_denoised = librosa.effects.preemphasis(audio)

# 改变音调
pitch_shifted = librosa.effects.pitch_shift(audio, sr=sr, n_steps=2)

# 变速
speed_changed = librosa.effects.time_stretch(audio, 2.0)