MusicData Analysis for Recommendation

음악 데이터 특징 분석으로 유사 음악 찾기를 목표한다.
-- https://0equal2.tistory.com/133?category=478380

음악 데이터 특징값 추출
데이터 시퀀스 유사 비교
유사 곡 추천리스트 반환

MusicData Features

Chromagram
MelSpectrogram
Spectral Centroid
Spectral Rolloff

1-1. Data File Load

Data collect

Import library

#1. 음악 데이터 파일 로드에 필요한 라이브러리 
import IPython.display
import pandas as pd

File Load (filename='music_inform.csv')

#2. 음악 정보 파일 불러오기 : origin_music
# music_inform.csv 
origin_music=pd.read_csv('music_inform.csv')

수집한 데이터에서 곡ID(ID)와 곡의 위치 열만 추출(path)

1-2. Feature Analysis

Chromagram

#크로마그램 추출
chroma_stft=librosa.feature.chroma_stft(y=y,sr=sr)

MelSpectrogram

#melspectrogram 추출
mfcc=librosa.feature.mfcc(y=y,sr=sr)
mel_spectrogram=librosa.feature.melspectrogram(y=y,sr=sr,n_mels=128)

Spectral Centroid

#spectral_centroid 추출
s_c=librosa.feature.spectral_centroid(y,sr=sr)

Spectral Rolloff

#spectral_rolloff_max 추출
r_o_max=librosa.feature.spectral_rolloff(y,sr=sr,roll_percent=0.99)
r_o_min=librosa.feature.spectral_rolloff(y,sr=sr,roll_percent=0.01)

2. Data Sequence Similarity

음악 데이터 특징값 시퀀스 유사도는 보통 동일 곡(표절 곡) 찾기를 목표로하고있다. 이는 음악 데이터 특징상 프레임을 잘게 나누어 계산하기때문에 많은 계산량이 필요하다. 하지만 본 프로젝트의 목표는 유사곡 추천이기 때문에 시퀀스가 완전히 일치하기보다는 멜로디 흐름과 전체적 분위기가 유사함을 구한다. 그러므로 시퀀스 유사도에서 완전한 시간에 대해 일치하는 유클리디안 유사 비교보다는 약간의 시간의 오차를 허용하는 동적시간와핑(DTW)로 유사 비교를 하였다.

프레임의 개수 : F Return of (Spectral Centroid, Spectral Rolloff) : [1:F] Return of Chromagram : [12:F], 12 pitches Return of MelSpectogram : [13,F], 13 melscales

DTW for (Spectral Centroid, Spectral Rolloff), [1:F]

#5. DTW함수
def DTW(a,b,length):
    #5-1. dtw를 구하기 위한 행렬
    dtw=[[0 for i in range(length)] for j in range(length)]
    
    #5-2. dtw 첫행값 구하기
    dtw[0][0]=abs(a[0]-b[0])
    
    for dj in range(1,length):
        dtw[0][dj]=dtw[0][dj-1]+abs(a[0]-b[dj])
    
    #5-3. dtw 첫열값 구하기
    for di in range(1,length):
        dtw[di][0]=dtw[di-1][0]+abs(a[di]-b[0])
        
    #5-4. dtw 채우기
    for di in range(1,length):
        for dj in range(1,length):
            min_dtw=min(min(dtw[di-1][dj-1],dtw[di-1][dj]),dtw[di][dj-1])
            
            dtw[di][dj]=min_dtw+abs(a[di]-b[dj])
            
    #5-5. 최종 dtw 유사거리
    return dtw[length-1][length-1]

DTW for (Chromagram, MelSpectogram), [n:F] 각 프레임별로 mfcc 계수의 유클리디안 거리 계산으로 [n:F]를 [1:F]로 변환

#5-0. mfcc 13계수의 차이값 구하기
def mfcc_difference(mfcc1,mfcc2):
    difference=0
    
    for i in range(13):
        difference+=abs(mfcc1[i]-mfcc2[i])
        
    return difference

#i곡과 j곡의 유사 구하기
for i in range(n):
    for j in range(i,n):
        
        #동일 곡과의 유사도는 구하지 않음 
        if i==j:
            continue 
            
        #5-1. dtw를 구하기 위한 행렬
        dtw=[[0 for i in range(frame_num)] for j in range(frame_num)]
        
        #5-2. dtw 첫행값 구하기
        dtw[0][0]=mfcc_difference(mfcc_info[i][0],mfcc_info[j][0])
        
        for dj in range(1,frame_num):
            dtw[0][dj]=dtw[0][dj-1]+mfcc_difference(mfcc_info[i][0],mfcc_info[j][dj])
        
        #5-3. dtw 첫열값 구하기
        for di in range(1,frame_num):
            dtw[di][0]=dtw[di-1][0]+mfcc_difference(mfcc_info[i][di],mfcc_info[j][0])
            
        #5-4. dtw 채우기
        for di in range(1,frame_num):
            for dj in range(1,frame_num):
                min_dtw=min(min(dtw[di-1][dj-1],dtw[di-1][dj]),dtw[di][dj-1])
                
                dtw[di][dj]=min_dtw+mfcc_difference(mfcc_info[i][di],mfcc_info[j][dj])
                
        #5-5. 최종 dtw 유사거리 저장
        similarity[i][j]=int(dtw[frame_num-1][frame_num-1])
        similarity[j][i]=int(dtw[frame_num-1][frame_num-1])
        
        #현재 진행상황 파악하기 위한 print
        print('[',i,']','[',j,']의 유사도 : ', similarity[i][j])

3. 유사 곡 추천리스트 반환

우선 각 특징에 대해서 시퀀스 흐름 유사비교하여 유사곡 5곡씩을 뽑아보았다. [music_id, recom1, recom2, recom3, recom4, recom5] 기준곡(music_id)에 대해서 추천곡 5개(reocm1~5) 결과를 csv형태의 파일로 저장하였다.

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
.ipynb_checkpoints		.ipynb_checkpoints
Dance_Funky		Dance_Funky
Hiphop_Funky		Hiphop_Funky
RnBSoul_Calm		RnBSoul_Calm
recommend_result		recommend_result
result_image		result_image
MusicData_load.ipynb		MusicData_load.ipynb
MusicFeatuer_MFCC.ipynb		MusicFeatuer_MFCC.ipynb
MusicFeature_Chromagram.ipynb		MusicFeature_Chromagram.ipynb
MusicFeature_SpectralCentroid.ipynb		MusicFeature_SpectralCentroid.ipynb
MusicFeature_SpectralRolloff.ipynb		MusicFeature_SpectralRolloff.ipynb
README.md		README.md
R_C1_volume_test.mp3		R_C1_volume_test.mp3
music_inform.csv		music_inform.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

MusicData Analysis for Recommendation

MusicData Features

1-1. Data File Load

1-2. Feature Analysis

2. Data Sequence Similarity

3. 유사 곡 추천리스트 반환

About

Uh oh!

Releases

Packages

Languages

0equal2/Project___MusicData_Analysis

Folders and files

Latest commit

History

Repository files navigation

MusicData Analysis for Recommendation

MusicData Features

1-1. Data File Load

1-2. Feature Analysis

2. Data Sequence Similarity

3. 유사 곡 추천리스트 반환

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages