In [1]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [1]:
!pip install openl3 soundfile

Collecting openl3
  Downloading openl3-0.4.2.tar.gz (29 kB)
  Preparing metadata (setup.py) ... [?25l[?25hdone
Collecting kapre>=0.3.5 (from openl3)
  Downloading kapre-0.3.7.tar.gz (26 kB)
  Installing build dependencies ... [?25l[?25hdone
  Getting requirements to build wheel ... [?25l[?25hdone
  Preparing metadata (pyproject.toml) ... [?25l[?25hdone
Collecting resampy<0.3.0,>=0.2.1 (from openl3)
  Downloading resampy-0.2.2.tar.gz (323 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m323.4/323.4 kB[0m [31m7.9 MB/s[0m eta [36m0:00:00[0m
[?25h  Preparing metadata (setup.py) ... [?25l[?25hdone
Building wheels for collected packages: openl3, kapre, resampy
  Building wheel for openl3 (setup.py) ... [?25l[?25hdone
  Created wheel for openl3: filename=openl3-0.4.2-py2.py3-none-any.whl size=249327028 sha256=528b061e3e03121ae701c5ca82addf3d44de2244293f982e24a21c8d7da5cca4
  Stored in directory: /root/.cache/pip/wheels/d0/4d/0a/e57b1dc8ead91b3c5709d9de4f02

In [3]:
!pip install tensorflow==2.10.0

Collecting tensorflow==2.10.0
  Downloading tensorflow-2.10.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (3.1 kB)
Collecting gast<=0.4.0,>=0.2.1 (from tensorflow==2.10.0)
  Downloading gast-0.4.0-py3-none-any.whl.metadata (1.1 kB)
Collecting keras<2.11,>=2.10.0 (from tensorflow==2.10.0)
  Downloading keras-2.10.0-py2.py3-none-any.whl.metadata (1.3 kB)
Collecting keras-preprocessing>=1.1.1 (from tensorflow==2.10.0)
  Downloading Keras_Preprocessing-1.1.2-py2.py3-none-any.whl.metadata (1.9 kB)
Collecting protobuf<3.20,>=3.9.2 (from tensorflow==2.10.0)
  Downloading protobuf-3.19.6-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (787 bytes)
Collecting tensorboard<2.11,>=2.10 (from tensorflow==2.10.0)
  Downloading tensorboard-2.10.1-py3-none-any.whl.metadata (1.9 kB)
Collecting tensorflow-estimator<2.11,>=2.10.0 (from tensorflow==2.10.0)
  Downloading tensorflow_estimator-2.10.0-py2.py3-none-any.whl.metadata (1.3 kB)
Collecting google-auth-oaut

In [1]:
import os
import pandas as pd
import librosa
import openl3
import numpy as np
import soundfile as sf

# 경로 설정
AUDIO_DIR = "/content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen"
METADATA_FILE = "/content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/processed_metadata.csv"
OUTPUT_METADATA_FILE = "/content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/extended_metadata.csv"

# OpenL3 태그 추출
def extract_openl3_embeddings(audio_file):
    """
    OpenL3를 사용하여 오디오 파일에서 임베딩을 추출합니다.
    """
    # 오디오 로드
    audio, sr = sf.read(audio_file)

    # OpenL3 요구사항에 따라 16kHz로 리샘플링
    if sr != 16000:
        audio = librosa.resample(audio, orig_sr=sr, target_sr=16000)
        sr = 16000

    # OpenL3 임베딩 추출
    embeddings, _ = openl3.get_audio_embedding(
        audio, sr, input_repr="mel256", content_type="music", embedding_size=512
    )

    # 임베딩 평균값 사용
    mean_embedding = embeddings.mean(axis=0)
    return mean_embedding

# RMS/BPM 계산
def calculate_audio_features(audio_file):
    """
    오디오 파일에서 RMS(음량)와 BPM(템포)을 계산합니다.
    """
    y, sr = librosa.load(audio_file, sr=None)
    rms = librosa.feature.rms(y=y).mean()
    tempo, _ = librosa.beat.beat_track(y=y, sr=sr)
    return rms, tempo

# 수면음악 조건 분류
def classify_sleep_music(rms, tempo):
    """
    RMS와 템포를 기반으로 수면음악 여부를 분류합니다.
    """
    is_loud = rms > 0.05  # 예: RMS 0.05 이상은 시끄럽다고 판단
    is_fast = tempo > 90  # 예: BPM 90 이상은 빠른 템포로 간주
    if is_loud or is_fast:
        return "수면음악 아님"
    return "수면음악"

# 메타데이터 업데이트 함수
def update_metadata_with_features_and_embeddings(audio_dir, metadata_file, output_metadata_file):
    """
    기존 메타데이터에 OpenL3 임베딩 및 추가 특성을 포함한 정보를 추가합니다.
    """
    # 메타데이터 읽기
    metadata = pd.read_csv(metadata_file)

    # 새 컬럼 추가
    metadata["OpenL3_Embedding"] = ""
    metadata["RMS"] = ""
    metadata["Tempo"] = ""
    metadata["Sleep_Music"] = ""

    # 각 오디오 파일 처리
    for index, row in metadata.iterrows():
        audio_file = os.path.join(audio_dir, row['audio'])  # 'audio'은 메타데이터의 컬럼 이름
        if not os.path.exists(audio_file):
            print(f"파일이 존재하지 않습니다: {audio_file}")
            continue

        try:
            # OpenL3 임베딩 추출
            embedding = extract_openl3_embeddings(audio_file)

            # RMS/BPM 계산
            rms, tempo = calculate_audio_features(audio_file)

            # 수면 음악 분류
            sleep_music_status = classify_sleep_music(rms, tempo)

            # 메타데이터 업데이트
            metadata.at[index, "OpenL3_Embedding"] = np.array2string(embedding, separator=",")
            metadata.at[index, "RMS"] = rms
            metadata.at[index, "Tempo"] = tempo
            metadata.at[index, "Sleep_Music"] = sleep_music_status

            print(f"{audio_file}: 임베딩 및 특성 추출 완료, 수면음악: {sleep_music_status}")
        except Exception as e:
            print(f"처리 실패: {audio_file}, 오류: {e}")

    # 확장된 메타데이터 저장
    metadata.to_csv(output_metadata_file, index=False)
    print(f"확장된 메타데이터가 저장되었습니다: {output_metadata_file}")

# 실행
update_metadata_with_features_and_embeddings(AUDIO_DIR, METADATA_FILE, OUTPUT_METADATA_FILE)

/content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/2018/MIDI-Unprocessed_Chamber3_MID--AUDIO_10_R3_2018_wav--1.wav: 임베딩 및 특성 추출 완료, 수면음악: 수면음악
/content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/2008/MIDI-Unprocessed_03_R2_2008_01-03_ORIG_MID--AUDIO_03_R2_2008_wav--2.wav: 임베딩 및 특성 추출 완료, 수면음악: 수면음악 아님
/content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/2017/MIDI-Unprocessed_066_PIANO066_MID--AUDIO-split_07-07-17_Piano-e_3-02_wav--3.wav: 임베딩 및 특성 추출 완료, 수면음악: 수면음악 아님
/content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/2004/MIDI-Unprocessed_XP_21_R1_2004_01_ORIG_MID--AUDIO_21_R1_2004_01_Track01_wav.wav: 임베딩 및 특성 추출 완료, 수면음악: 수면음악




/content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/2006/MIDI-Unprocessed_17_R1_2006_01-06_ORIG_MID--AUDIO_17_R1_2006_04_Track04_wav.wav: 임베딩 및 특성 추출 완료, 수면음악: 수면음악 아님




/content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/2009/MIDI-Unprocessed_07_R1_2009_04-05_ORIG_MID--AUDIO_07_R1_2009_07_R1_2009_04_WAV.wav: 임베딩 및 특성 추출 완료, 수면음악: 수면음악 아님
/content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/2009/MIDI-Unprocessed_11_R1_2009_06-09_ORIG_MID--AUDIO_11_R1_2009_11_R1_2009_07_WAV.wav: 임베딩 및 특성 추출 완료, 수면음악: 수면음악
/content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/2013/ORIG-MIDI_03_7_8_13_Group__MID--AUDIO_19_R2_2013_wav--3.wav: 임베딩 및 특성 추출 완료, 수면음악: 수면음악 아님
/content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/2009/MIDI-Unprocessed_02_R1_2009_03-06_ORIG_MID--AUDIO_02_R1_2009_02_R1_2009_04_WAV.wav: 임베딩 및 특성 추출 완료, 수면음악: 수면음악 아님
/content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/2009/MIDI-Unprocessed_02_R1_2009_03-06_ORIG_MID--AUDIO_02_R1_2009_02_R1_2009_05_WAV.wav: 임베딩 및 특성 추출 완료, 수면음악: 수면음악 아님
/content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen

KeyboardInterrupt: 

In [7]:
!pip install musicnn --no-deps

Collecting musicnn
  Using cached musicnn-0.1.0-py3-none-any.whl.metadata (3.3 kB)
Downloading musicnn-0.1.0-py3-none-any.whl (29.3 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m29.3/29.3 MB[0m [31m36.9 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: musicnn
Successfully installed musicnn-0.1.0


In [9]:
import os
import pandas as pd
import librosa
from musicnn.extractor import extractor

# 경로 설정
AUDIO_DIR = "/content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen"
METADATA_FILE = "/content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/processed_metadata.csv"
OUTPUT_METADATA_FILE = "/content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/extended_metadata.csv"

# Musicnn을 사용한 태깅
def extract_tags(audio_file):
    """
    음악 파일에서 태그를 예측합니다.
    """
    tags, tag_confidence = extractor(audio_file, model='MTT_musicnn')
    return tags, tag_confidence

# RMS/BPM 계산
def calculate_audio_features(audio_file):
    """
    오디오 파일에서 RMS(음량)와 BPM(템포)을 계산합니다.
    """
    y, sr = librosa.load(audio_file, sr=None)
    rms = librosa.feature.rms(y=y).mean()
    tempo, _ = librosa.beat.beat_track(y=y, sr=sr)
    return rms, tempo

# 수면음악 조건 분류
def classify_sleep_music(rms, tempo):
    """
    RMS와 템포를 기반으로 수면음악 여부를 분류합니다.
    """
    is_loud = rms > 0.05  # 예: RMS 0.05 이상은 시끄럽다고 판단
    is_fast = tempo > 90  # 예: BPM 90 이상은 빠른 템포로 간주
    if is_loud or is_fast:
        return "수면음악 아님"
    return "수면음악"

# 감정 태그 추가
def map_emotion_to_tags(tags):
    """
    Musicnn 태그를 기반으로 감정 태그를 추가합니다.
    """
    calm_tags = {"relaxing", "calm", "peaceful"}
    energetic_tags = {"exciting", "energetic", "intense"}

    emotion = "neutral"
    if calm_tags.intersection(tags):
        emotion = "calm"
    elif energetic_tags.intersection(tags):
        emotion = "energetic"

    return f"감정: {emotion}"

# 메타데이터 업데이트 함수
def update_metadata_with_features_and_tags(audio_dir, metadata_file, output_metadata_file):
    """
    기존 메타데이터에 태그 및 추가 특성을 포함한 정보를 추가합니다.
    """
    # 메타데이터 읽기
    metadata = pd.read_csv(metadata_file)

    # 태그 정보를 저장할 컬럼 추가
    metadata["Tags"] = ""
    metadata["Tag_Confidence"] = ""
    metadata["RMS"] = ""
    metadata["Tempo"] = ""
    metadata["Sleep_Music"] = ""
    metadata["Emotion_Tag"] = ""

    # 각 오디오 파일 처리
    for index, row in metadata.iterrows():
        audio_file = os.path.join(audio_dir, row['audio'])  # 'audio'은 메타데이터의 컬럼 이름
        if not os.path.exists(audio_file):
            print(f"파일이 존재하지 않습니다: {audio_file}")
            continue

        try:
            # 태그 추출
            tags, tag_confidence = extract_tags(audio_file)

            # RMS/BPM 계산
            rms, tempo = calculate_audio_features(audio_file)

            # 수면 음악 분류
            sleep_music_status = classify_sleep_music(rms, tempo)

            # 감정 태그 매핑
            emotion_tag = map_emotion_to_tags(set(tags))

            # 메타데이터 업데이트
            metadata.at[index, "Tags"] = ", ".join(tags)
            metadata.at[index, "Tag_Confidence"] = ", ".join([f"{tag}:{conf:.2f}" for tag, conf in tag_confidence.items()])
            metadata.at[index, "RMS"] = rms
            metadata.at[index, "Tempo"] = tempo
            metadata.at[index, "Sleep_Music"] = sleep_music_status
            metadata.at[index, "Emotion_Tag"] = emotion_tag

            print(f"{audio_file}: 태깅 완료 - {tags}, 수면음악: {sleep_music_status}, 감정: {emotion_tag}")
        except Exception as e:
            print(f"처리 실패: {audio_file}, 오류: {e}")

    # 확장된 메타데이터 저장
    metadata.to_csv(output_metadata_file, index=False)
    print(f"확장된 메타데이터가 저장되었습니다: {output_metadata_file}")

# 실행
update_metadata_with_features_and_tags(AUDIO_DIR, METADATA_FILE, OUTPUT_METADATA_FILE)

처리 실패: /content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/2018/MIDI-Unprocessed_Chamber3_MID--AUDIO_10_R3_2018_wav--1.wav, 오류: `batch_normalization` is not available with Keras 3.
처리 실패: /content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/2008/MIDI-Unprocessed_03_R2_2008_01-03_ORIG_MID--AUDIO_03_R2_2008_wav--2.wav, 오류: `batch_normalization` is not available with Keras 3.
처리 실패: /content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/2017/MIDI-Unprocessed_066_PIANO066_MID--AUDIO-split_07-07-17_Piano-e_3-02_wav--3.wav, 오류: `batch_normalization` is not available with Keras 3.
처리 실패: /content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/2004/MIDI-Unprocessed_XP_21_R1_2004_01_ORIG_MID--AUDIO_21_R1_2004_01_Track01_wav.wav, 오류: `batch_normalization` is not available with Keras 3.
처리 실패: /content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/2006/MIDI-Unprocessed_17_R1_2006_01-06_ORIG_MID--AUDIO_17_R1_2

In [4]:
# 기존 패키지 제거
!pip uninstall -y numpy librosa

# 호환되는 버전 설치
!pip install numpy==1.16.6 librosa==0.8.0 tensorflow==2.5.0

# musicnn 설치
!pip install musicnn==0.0.1

Found existing installation: numpy 1.26.4
Uninstalling numpy-1.26.4:
  Successfully uninstalled numpy-1.26.4
Found existing installation: librosa 0.8.1
Uninstalling librosa-0.8.1:
  Successfully uninstalled librosa-0.8.1
Collecting numpy==1.16.6
  Using cached numpy-1.16.6.zip (5.1 MB)
  Preparing metadata (setup.py) ... [?25l[?25hdone
Collecting librosa==0.8.0
  Using cached librosa-0.8.0.tar.gz (183 kB)
  Preparing metadata (setup.py) ... [?25l[?25hdone
[31mERROR: Could not find a version that satisfies the requirement tensorflow==2.5.0 (from versions: 2.8.0rc0, 2.8.0rc1, 2.8.0, 2.8.1, 2.8.2, 2.8.3, 2.8.4, 2.9.0rc0, 2.9.0rc1, 2.9.0rc2, 2.9.0, 2.9.1, 2.9.2, 2.9.3, 2.10.0rc0, 2.10.0rc1, 2.10.0rc2, 2.10.0rc3, 2.10.0, 2.10.1, 2.11.0rc0, 2.11.0rc1, 2.11.0rc2, 2.11.0, 2.11.1, 2.12.0rc0, 2.12.0rc1, 2.12.0, 2.12.1, 2.13.0rc0, 2.13.0rc1, 2.13.0rc2, 2.13.0, 2.13.1, 2.14.0rc0, 2.14.0rc1, 2.14.0, 2.14.1, 2.15.0rc0, 2.15.0rc1, 2.15.0, 2.15.0.post1, 2.15.1, 2.16.0rc0, 2.16.1, 2.16.2, 2.17.0rc

In [12]:
import os
import pandas as pd
import librosa
from musicnn.extractor import extractor

# 경로 설정
AUDIO_DIR = "/content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen"
METADATA_FILE = "/content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/processed_metadata.csv"
OUTPUT_METADATA_FILE = "/content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/extended_metadata.csv"

# Musicnn을 사용한 태깅
def extract_tags(audio_file):
    """
    음악 파일에서 태그를 예측합니다.
    """
    tags, tag_confidence = extractor(audio_file, model='MTT_musicnn')
    return tags, tag_confidence

# RMS/BPM 계산
def calculate_audio_features(audio_file):
    """
    오디오 파일에서 RMS(음량)와 BPM(템포)을 계산합니다.
    """
    y, sr = librosa.load(audio_file, sr=None)
    rms = librosa.feature.rms(y=y).mean()
    tempo, _ = librosa.beat.beat_track(y=y, sr=sr)
    return rms, tempo

# 수면음악 조건 분류
def classify_sleep_music(rms, tempo):
    """
    RMS와 템포를 기반으로 수면음악 여부를 분류합니다.
    """
    is_loud = rms > 0.05  # 예: RMS 0.05 이상은 시끄럽다고 판단
    is_fast = tempo > 90  # 예: BPM 90 이상은 빠른 템포로 간주
    if is_loud or is_fast:
        return "수면음악 아님"
    return "수면음악"

# 감정 태그 추가
def map_emotion_to_tags(tags):
    """
    Musicnn 태그를 기반으로 감정 태그를 추가합니다.
    """
    calm_tags = {"relaxing", "calm", "peaceful"}
    energetic_tags = {"exciting", "energetic", "intense"}

    emotion = "neutral"
    if calm_tags.intersection(tags):
        emotion = "calm"
    elif energetic_tags.intersection(tags):
        emotion = "energetic"

    return f"감정: {emotion}"

# 메타데이터 업데이트 함수
def update_metadata_with_features_and_tags(audio_dir, metadata_file, output_metadata_file):
    """
    기존 메타데이터에 태그 및 추가 특성을 포함한 정보를 추가합니다.
    """
    # 메타데이터 읽기
    try:
        metadata = pd.read_csv(metadata_file)
        print(f"메타데이터 로드 성공: {metadata_file}")
    except Exception as e:
        print(f"메타데이터 로드 실패: {metadata_file}, 오류: {e}")
        return

    # 태그 정보를 저장할 컬럼 추가
    metadata["Tags"] = ""
    metadata["Tag_Confidence"] = ""
    metadata["RMS"] = ""
    metadata["Tempo"] = ""
    metadata["Sleep_Music"] = ""
    metadata["Emotion_Tag"] = ""

    # 각 오디오 파일 처리
    for index, row in metadata.iterrows():
        try:
            # 오디오 파일 경로 생성
            audio_file = os.path.join(audio_dir, row['audio'])  # 'audio' 컬럼 확인
            print(f"처리 중인 파일 경로: {audio_file}")

            if not os.path.exists(audio_file):
                print(f"파일이 존재하지 않습니다: {audio_file}")
                continue

            # Librosa 파일 로드 테스트
            try:
                y, sr = librosa.load(audio_file, sr=None)
                print(f"Librosa 파일 로드 성공: {audio_file}, 샘플링 레이트: {sr}")
            except Exception as e:
                print(f"Librosa 파일 로드 실패: {audio_file}, 오류: {e}")
                continue

            # Musicnn 태깅 테스트
            try:
                tags, tag_confidence = extract_tags(audio_file)
                print(f"Musicnn 태깅 성공: {tags}")
            except Exception as e:
                print(f"Musicnn 태깅 실패: {audio_file}, 오류: {e}")
                continue

            # RMS/BPM 계산 테스트
            try:
                rms, tempo = calculate_audio_features(audio_file)
                print(f"RMS: {rms}, 템포: {tempo}")
            except Exception as e:
                print(f"RMS/BPM 계산 실패: {audio_file}, 오류: {e}")
                continue

            # 수면 음악 분류
            sleep_music_status = classify_sleep_music(rms, tempo)

            # 감정 태그 매핑
            emotion_tag = map_emotion_to_tags(set(tags))

            # 메타데이터 업데이트
            metadata.at[index, "Tags"] = ", ".join(tags)
            metadata.at[index, "Tag_Confidence"] = ", ".join([f"{tag}:{conf:.2f}" for tag, conf in tag_confidence.items()])
            metadata.at[index, "RMS"] = rms
            metadata.at[index, "Tempo"] = tempo
            metadata.at[index, "Sleep_Music"] = sleep_music_status
            metadata.at[index, "Emotion_Tag"] = emotion_tag

            print(f"{audio_file}: 태깅 완료 - {tags}, 수면음악: {sleep_music_status}, 감정: {emotion_tag}")
        except Exception as e:
            print(f"처리 실패: {audio_file}, 오류: {e}")

    # 확장된 메타데이터 저장
    try:
        metadata.to_csv(output_metadata_file, index=False)
        print(f"확장된 메타데이터가 저장되었습니다: {output_metadata_file}")
    except Exception as e:
        print(f"메타데이터 저장 실패: {output_metadata_file}, 오류: {e}")

# 실행
update_metadata_with_features_and_tags(AUDIO_DIR, METADATA_FILE, OUTPUT_METADATA_FILE)

메타데이터 로드 성공: /content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/processed_metadata.csv
처리 중인 파일 경로: /content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/2018/MIDI-Unprocessed_Chamber3_MID--AUDIO_10_R3_2018_wav--1.wav
Librosa 파일 로드 성공: /content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/2018/MIDI-Unprocessed_Chamber3_MID--AUDIO_10_R3_2018_wav--1.wav, 샘플링 레이트: 16000
Musicnn 태깅 실패: /content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/2018/MIDI-Unprocessed_Chamber3_MID--AUDIO_10_R3_2018_wav--1.wav, 오류: `batch_normalization` is not available with Keras 3.
처리 중인 파일 경로: /content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/2008/MIDI-Unprocessed_03_R2_2008_01-03_ORIG_MID--AUDIO_03_R2_2008_wav--2.wav
Librosa 파일 로드 성공: /content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/2008/MIDI-Unprocessed_03_R2_2008_01-03_ORIG_MID--AUDIO_03_R2_2008_wav--2.wav, 샘플링 레이트: 16000
Musicnn 태깅 실패: /con

KeyboardInterrupt: 

In [2]:
!pip install openl3

Collecting openl3
  Downloading openl3-0.4.2.tar.gz (29 kB)
  Preparing metadata (setup.py) ... [?25l[?25hdone
Collecting kapre>=0.3.5 (from openl3)
  Downloading kapre-0.3.7.tar.gz (26 kB)
  Installing build dependencies ... [?25l[?25hdone
  Getting requirements to build wheel ... [?25l[?25hdone
  Preparing metadata (pyproject.toml) ... [?25l[?25hdone
Collecting resampy<0.3.0,>=0.2.1 (from openl3)
  Using cached resampy-0.2.2.tar.gz (323 kB)
  Preparing metadata (setup.py) ... [?25l[?25hdone
Collecting numpy>=1.13.0 (from openl3)
  Downloading numpy-1.26.4-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (61 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m61.0/61.0 kB[0m [31m4.4 MB/s[0m eta [36m0:00:00[0m
Downloading numpy-1.26.4-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (18.2 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m18.2/18.2 MB[0m [31m41.0 MB/s[0m eta [36m0:00:00[0m
[?25hBuilding wh

In [2]:
!pip uninstall -y numpy pandas librosa openl3
!pip install numpy==1.19.5  # np.complex를 지원하는 마지막 버전
!pip install librosa==0.8.1
!pip install pandas
!pip install openl3


Found existing installation: numpy 1.26.4
Uninstalling numpy-1.26.4:
  Successfully uninstalled numpy-1.26.4
Found existing installation: pandas 2.2.2
Uninstalling pandas-2.2.2:
  Successfully uninstalled pandas-2.2.2
Found existing installation: librosa 0.8.1
Uninstalling librosa-0.8.1:
  Successfully uninstalled librosa-0.8.1
Found existing installation: openl3 0.4.2
Uninstalling openl3-0.4.2:
  Successfully uninstalled openl3-0.4.2
Collecting numpy==1.19.5
  Downloading numpy-1.19.5.zip (7.3 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m7.3/7.3 MB[0m [31m41.4 MB/s[0m eta [36m0:00:00[0m
[?25h  Installing build dependencies ... [?25l[?25hdone
  Getting requirements to build wheel ... [?25l[?25hdone
  Preparing metadata (pyproject.toml) ... [?25l[?25hdone
Building wheels for collected packages: numpy
  [1;31merror[0m: [1msubprocess-exited-with-error[0m
  
  [31m×[0m [32mBuilding wheel for numpy [0m[1;32m([0m[32mpyproject.toml[0m[1;32m)[0m

In [4]:
!pip install --upgrade pip setuptools wheel

Collecting pip
  Downloading pip-24.3.1-py3-none-any.whl.metadata (3.7 kB)
Collecting setuptools
  Using cached setuptools-75.6.0-py3-none-any.whl.metadata (6.7 kB)
Collecting wheel
  Using cached wheel-0.45.1-py3-none-any.whl.metadata (2.3 kB)
Downloading pip-24.3.1-py3-none-any.whl (1.8 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.8/1.8 MB[0m [31m21.0 MB/s[0m eta [36m0:00:00[0m
[?25hUsing cached setuptools-75.6.0-py3-none-any.whl (1.2 MB)
Using cached wheel-0.45.1-py3-none-any.whl (72 kB)
Installing collected packages: wheel, setuptools, pip
  Attempting uninstall: wheel
    Found existing installation: wheel 0.45.0
    Uninstalling wheel-0.45.0:
      Successfully uninstalled wheel-0.45.0
  Attempting uninstall: setuptools
    Found existing installation: setuptools 75.1.0
    Uninstalling setuptools-75.1.0:
      Successfully uninstalled setuptools-75.1.0
  Attempting uninstall: pip
    Found existing installation: pip 24.1.2
    Uninstalling pip-24.1.2

In [1]:
!pip install numpy==1.19.5 --no-deps
!pip install pandas==1.1.5 --no-deps
!pip install librosa==0.8.1 --no-deps
!pip install openl3 --no-deps


Collecting numpy==1.19.5
  Using cached numpy-1.19.5.zip (7.3 MB)
  Installing build dependencies ... [?25l[?25hdone
  Getting requirements to build wheel ... [?25l[?25hdone
  Preparing metadata (pyproject.toml) ... [?25l[?25hdone
Building wheels for collected packages: numpy
  [1;31merror[0m: [1msubprocess-exited-with-error[0m
  
  [31m×[0m [32mBuilding wheel for numpy [0m[1;32m([0m[32mpyproject.toml[0m[1;32m)[0m did not run successfully.
  [31m│[0m exit code: [1;36m1[0m
  [31m╰─>[0m See above for output.
  
  [1;35mnote[0m: This error originates from a subprocess, and is likely not a problem with pip.
  Building wheel for numpy (pyproject.toml) ... [?25l[?25herror
[31m  ERROR: Failed building wheel for numpy[0m[31m
[0mFailed to build numpy
[31mERROR: ERROR: Failed to build installable wheels for some pyproject.toml based projects (numpy)[0m[31m
[0mCollecting pandas==1.1.5
  Using cached pandas-1.1.5.tar.gz (5.2 MB)
  Installing build dependencies

In [2]:
import numpy
import pandas
import librosa
import openl3

print("Numpy 버전:", numpy.__version__)
print("Pandas 버전:", pandas.__version__)
print("Librosa 버전:", librosa.__version__)
print("OpenL3 버전:", openl3.__version__)



AttributeError: module 'numpy' has no attribute 'complex'.
`np.complex` was a deprecated alias for the builtin `complex`. To avoid this error in existing code, use `complex` by itself. Doing this will not modify any behavior and is safe. If you specifically wanted the numpy scalar type, use `np.complex128` here.
The aliases was originally deprecated in NumPy 1.20; for more details and guidance see the original release note at:
    https://numpy.org/devdocs/release/1.20.0-notes.html#deprecations

In [3]:
import os
import pandas as pd
import librosa
import openl3

# 경로 설정
AUDIO_DIR = "/content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen"
METADATA_FILE = "/content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/processed_metadata.csv"
OUTPUT_METADATA_FILE = "/content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/extended_metadata.csv"

# OpenL3를 사용한 특징 추출
def extract_openl3_features(audio_file):
    """
    OpenL3를 사용하여 오디오 파일의 임베딩을 추출합니다.
    """
    try:
        y, sr = librosa.load(audio_file, sr=None, mono=True)  # 단일 채널로 변환
        emb, ts = openl3.get_audio_embedding(y, sr, content_type="music", embedding_size=512)
        return emb.mean(axis=0)  # 평균 임베딩 반환
    except Exception as e:
        print(f"OpenL3 특징 추출 실패: {audio_file}, 오류: {e}")
        return None

# RMS/BPM 계산
def calculate_audio_features(audio_file):
    """
    오디오 파일에서 RMS(음량)와 BPM(템포)을 계산합니다.
    """
    y, sr = librosa.load(audio_file, sr=None)
    rms = librosa.feature.rms(y=y).mean()
    tempo, _ = librosa.beat.beat_track(y=y, sr=sr)
    return rms, tempo

# 수면음악 조건 분류
def classify_sleep_music(rms, tempo):
    """
    RMS와 템포를 기반으로 수면음악 여부를 분류합니다.
    """
    is_loud = rms > 0.05  # 예: RMS 0.05 이상은 시끄럽다고 판단
    is_fast = tempo > 90  # 예: BPM 90 이상은 빠른 템포로 간주
    if is_loud or is_fast:
        return "수면음악 아님"
    return "수면음악"

# 메타데이터 업데이트 함수
def update_metadata_with_features(audio_dir, metadata_file, output_metadata_file):
    """
    기존 메타데이터에 OpenL3 임베딩 및 추가 특성을 포함한 정보를 추가합니다.
    """
    # 메타데이터 읽기
    try:
        metadata = pd.read_csv(metadata_file)
        print(f"메타데이터 로드 성공: {metadata_file}")
    except Exception as e:
        print(f"메타데이터 로드 실패: {metadata_file}, 오류: {e}")
        return

    # 새로운 컬럼 추가
    metadata["OpenL3_Features"] = ""
    metadata["RMS"] = ""
    metadata["Tempo"] = ""
    metadata["Sleep_Music"] = ""

    # 각 오디오 파일 처리
    for index, row in metadata.iterrows():
        try:
            # 오디오 파일 경로 생성
            audio_file = os.path.join(audio_dir, row['audio'])  # 'audio' 컬럼 확인
            print(f"처리 중인 파일 경로: {audio_file}")

            if not os.path.exists(audio_file):
                print(f"파일이 존재하지 않습니다: {audio_file}")
                continue

            # OpenL3 특징 추출
            openl3_features = extract_openl3_features(audio_file)
            if openl3_features is None:
                continue

            # RMS/BPM 계산
            rms, tempo = calculate_audio_features(audio_file)

            # 수면 음악 분류
            sleep_music_status = classify_sleep_music(rms, tempo)

            # 메타데이터 업데이트
            metadata.at[index, "OpenL3_Features"] = ",".join(map(str, openl3_features))
            metadata.at[index, "RMS"] = rms
            metadata.at[index, "Tempo"] = tempo
            metadata.at[index, "Sleep_Music"] = sleep_music_status

            print(f"{audio_file}: OpenL3 특징 추출 완료, 수면음악: {sleep_music_status}")
        except Exception as e:
            print(f"처리 실패: {audio_file}, 오류: {e}")

    # 확장된 메타데이터 저장
    try:
        metadata.to_csv(output_metadata_file, index=False)
        print(f"확장된 메타데이터가 저장되었습니다: {output_metadata_file}")
    except Exception as e:
        print(f"메타데이터 저장 실패: {output_metadata_file}, 오류: {e}")

# 실행
update_metadata_with_features(AUDIO_DIR, METADATA_FILE, OUTPUT_METADATA_FILE)


AttributeError: module 'numpy' has no attribute 'complex'.
`np.complex` was a deprecated alias for the builtin `complex`. To avoid this error in existing code, use `complex` by itself. Doing this will not modify any behavior and is safe. If you specifically wanted the numpy scalar type, use `np.complex128` here.
The aliases was originally deprecated in NumPy 1.20; for more details and guidance see the original release note at:
    https://numpy.org/devdocs/release/1.20.0-notes.html#deprecations

In [11]:
ㅛmetadata = "/content/drive/MyDrive/프로젝트/케어크루즈 인턴/data/maestro_v3/processed_musicgen/processed_metadata.csv"

for index, row in metadata.iterrows():
    audio_file = os.path.join(audio_dir, row['audio'])
    if not os.path.exists(audio_file):
        print(f"파일이 존재하지 않습니다: {audio_file}")
        continue

    try:
        # Librosa 파일 로드 테스트
        y, sr = librosa.load(audio_file, sr=None)
        print(f"Librosa 파일 로드 성공: {audio_file}, 샘플링 레이트: {sr}")

        # Musicnn 태깅 테스트
        tags, tag_confidence = extractor(audio_file, model='MTT_musicnn')
        print(f"Musicnn 태깅 성공: {audio_file}, 태그: {tags}")

    except Exception as e:
        print(f"처리 실패: {audio_file}, 오류: {e}")

AttributeError: 'str' object has no attribute 'iterrows'

In [None]:
from musicnn.extractor import extractor
import librosa

def extract_features(file_path):
    tags, _ = extractor(file_path, model='MSD_musicnn', input_length=3.0)
    y, sr = librosa.load(file_path, sr=None)
    rms = librosa.feature.rms(y=y).mean()
    tempo, _ = librosa.beat.beat_track(y=y, sr=sr)

    loudness_tag = "조용함" if rms < 0.02 else "보통" if rms < 0.1 else "시끄러움"
    return {
        "tags": tags,
        "rms": rms,
        "tempo": tempo,
        "loudness_tag": loudness_tag
    }

def classify_sleep_music(features):
    is_loud = features["rms"] > 0.05
    is_fast = features["tempo"] > 90

    tags = features["tags"]
    tags.append("수면음악 아님" if is_loud or is_fast else "수면음악")
    if is_loud:
        tags.append("시끄러움")
    if is_fast:
        tags.append("빠름")
    return tags

def map_emotion_to_tags(tags):
    calm_tags = {"relaxing", "calm", "peaceful"}
    energetic_tags = {"exciting", "energetic", "intense"}

    emotion = "neutral"
    if calm_tags.intersection(tags):
        emotion = "calm"
    elif energetic_tags.intersection(tags):
        emotion = "energetic"

    tags.append(f"감정: {emotion}")
    return tags

# 전체 파이프라인
file_path = "example_piano.wav"
features = extract_features(file_path)
tags = classify_sleep_music(features)
tags = map_emotion_to_tags(tags)

print(f"최종 태그: {tags}")