In [None]:
import pandas as pd
from sklearn.metrics.pairwise import sigmoid_kernel, cosine_similarity
from sklearn.preprocessing import MinMaxScaler
from sklearn.neighbors import KNeighborsClassifier

In [None]:
df = pd.read_csv("data.csv")
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2017 entries, 0 to 2016
Data columns (total 17 columns):
 #   Column            Non-Null Count  Dtype  
---  ------            --------------  -----  
 0   Unnamed: 0        2017 non-null   int64  
 1   acousticness      2017 non-null   float64
 2   danceability      2017 non-null   float64
 3   duration_ms       2017 non-null   int64  
 4   energy            2017 non-null   float64
 5   instrumentalness  2017 non-null   float64
 6   key               2017 non-null   int64  
 7   liveness          2017 non-null   float64
 8   loudness          2017 non-null   float64
 9   mode              2017 non-null   int64  
 10  speechiness       2017 non-null   float64
 11  tempo             2017 non-null   float64
 12  time_signature    2017 non-null   float64
 13  valence           2017 non-null   float64
 14  target            2017 non-null   int64  
 15  song_title        2017 non-null   object 
 16  artist            2017 non-null   object 


In [None]:
df.head(5)

Unnamed: 0.1,Unnamed: 0,acousticness,danceability,duration_ms,energy,instrumentalness,key,liveness,loudness,mode,speechiness,tempo,time_signature,valence,target,song_title,artist
0,0,0.0102,0.833,204600,0.434,0.0219,2,0.165,-8.795,1,0.431,150.062,4.0,0.286,1,Mask Off,Future
1,1,0.199,0.743,326933,0.359,0.00611,1,0.137,-10.401,1,0.0794,160.083,4.0,0.588,1,Redbone,Childish Gambino
2,2,0.0344,0.838,185707,0.412,0.000234,2,0.159,-7.148,1,0.289,75.044,4.0,0.173,1,Xanny Family,Future
3,3,0.604,0.494,199413,0.338,0.51,5,0.0922,-15.236,1,0.0261,86.468,4.0,0.23,1,Master Of None,Beach House
4,4,0.18,0.678,392893,0.561,0.512,5,0.439,-11.648,0,0.0694,174.004,4.0,0.904,1,Parallel Lines,Junior Boys


In [None]:

feature_cols = ['acousticness', 'danceability', 'duration_ms', 'energy',
                'instrumentalness', 'key', 'liveness', 'loudness', 'mode',
                'speechiness', 'tempo', 'time_signature', 'valence']

Bu kod parçası, bir veri çerçevesinde bulunan belirli özellik sütunlarını temsil eden bir liste oluşturur. Bu sütunlar, müzik özelliklerini temsil eden farklı özelliklere aittir. Özellikle, bir müzik veri setinde her bir şarkının sahip olduğu özellikleri içerir. İlgili sütunların adları şunlardır:

In [None]:
# Normalize the data
scaler = MinMaxScaler()
normalized_df = scaler.fit_transform(df[feature_cols])

Bu kod parçası, bir veri çerçevesinde bulunan belirli özellik sütunlarını normalleştirmek için MinMaxScaler kullanır. Normalleştirme, veri değerlerini belirli bir aralığa ölçeklendirme işlemidir. Bu durumda, MinMaxScaler kullanılarak veriler 0 ile 1 arasında bir aralığa ölçeklendirilir.

In [None]:

indices = pd.Series(df.index, index=df['song_title']).drop_duplicates()

Bu kod parçası, bir Pandas Serisi oluşturarak şarkı başlıklarını indeksler ve indeksleri serinin değerleri olarak kullanır. Bu tür bir yapı, genellikle özellikle öneri sistemleri veya veri setindeki belirli öğelere hızlı erişim sağlamak amacıyla kullanılır

In [None]:

cosine = cosine_similarity(normalized_df)

Bu kod parçası, verilen bir matris üzerinden kosinüs benzerliği matrisini oluşturur. Kosinüs benzerliği, iki vektör arasındaki açıyı ölçen bir benzerlik ölçüsüdür. Genellikle, benzerlik matrisleri, özellikle öneri sistemlerinde veya kümeleme işlemlerinde benzer öğeleri veya örnekleri bulmak için kullanılır.

In [None]:

sig_kernel = sigmoid_kernel(normalized_df)

Bu kod parçası, verilen bir matris üzerinden sigmoid kernel matrisini oluşturur. Sigmoid kernel, iki vektör arasındaki benzerliği ölçen bir kernel fonksiyonudur ve genellikle öğeler arasındaki benzerlik ölçümünde kullanılır.

In [None]:
def generate_recommendation(song_title, model_type=cosine):
    if song_title not in indices:
        print(f"Error: The song '{song_title}' is not in the dataset.")
        return []

    index = indices[song_title]
    score = list(enumerate(model_type[index]))
    similarity_score = sorted(score, key=lambda x: x[1], reverse=True)
    similarity_score = similarity_score[1:11]
    top_songs_index = [i[0] for i in similarity_score]
    top_songs = df['song_title'].iloc[top_songs_index].values
    return top_songs


def print_recommendations(song_title):

    print(f"\nRecommended Songs for '{song_title}' based on Cosine Similarity:")
    recommended_songs_cosine = generate_recommendation(song_title, cosine)
    for i, song in enumerate(recommended_songs_cosine, 1):
        print(f"{i}. {song}")


    print(f"\nRecommended Songs for '{song_title}' based on Sigmoid Kernel:")
    recommended_songs_sigmoid = generate_recommendation(song_title, sig_kernel)
    for i, song in enumerate(recommended_songs_sigmoid, 1):
        print(f"{i}. {song}")


Bu bir Python fonksiyonudur ve bir şarkının başlığına dayanarak öneriler oluşturmayı amaçlar. Bu öneriler, belirli bir benzerlik modeli türüne (varsayılan olarak kosinüs benzerliği) dayanır.

In [None]:

user_input = input("Enter a song title: ")
print_recommendations(user_input)

Enter a song title: Loud Places

Recommended Songs for 'Loud Places' based on Cosine Similarity:
1. Talk About
2. Changes - Dirty South Remix
3. Go
4. Dill the Noise
5. Cocaine Model
6. Too Bad I Have To Destroy You Now
7. I'm in LOVE With GO-GO Dancer (Disco Diva) - Future of TRAP Mix
8. Coucou disco
9. Something About You - ODESZA Remix
10. My Friend

Recommended Songs for 'Loud Places' based on Sigmoid Kernel:
1. Trap Shit V7
2. Higher - Extended
3. Get Up
4. Chunky - Club Mix
5. Piss Test (feat. Juicy J & Dany Brown)
6. Sippin On Some Syrup
7. Lean & Bounce
8. Coucou disco
9. Operator (Ring Ring) ft. Dances With White Girls
10. Bang That
