In [1]:
import librosa
import librosa.display
import matplotlib.pyplot as plt
import numpy as np

def waveform_to_spectrogram(audio_path, output_image_path):
    # 오디오 파일 로드
    y, sr = librosa.load(audio_path, sr=None)

    # 스펙트로그램 생성
    S = librosa.feature.melspectrogram(y=y, sr=sr, n_mels=128, fmax=8000)
    S_dB = librosa.power_to_db(S, ref=np.max)

    # 스펙트로그램 시각화 및 저장
    plt.figure(figsize=(10, 4))
    librosa.display.specshow(S_dB, sr=sr, x_axis='time', y_axis='mel')
    plt.colorbar(format='%+2.0f dB')
    plt.title('Mel-frequency spectrogram')
    plt.tight_layout()
    plt.savefig(output_image_path)
    plt.close()

# 예제 사용
audio_path = './takk.mp3'  # 여기에 실제 오디오 파일 경로를 입력하세요
output_image_path = 'spectrogram_image.png'
waveform_to_spectrogram(audio_path, output_image_path)