### Adım Adım PDF'deki Görevlerin Durumu:

- **Veri Yükleme ve Depolama:** ✅ Yaptık, Spotify Tracks Dataset ile veri MongoDB'ye aktarıldı.
- **Dinleme Geçmişi Sorgulama:** ✅ Kullanıcı-şarkı matrisi oluşturarak sorgulama yaptık.
- **Collaborative Filtering:** ✅ Cosine Similarity kullanarak benzerlikleri hesapladık ve şarkı önerileri yapmaya başladık.
- **Tavsiye Sistemi API'si:**  🚧  Henüz tamamlanmadı. Bir sonraki adımda bunu yapacağız.

# Müzik Verisini Yükleme ve Depolama:

* İlk olarak müzik verilerini MongoDB'ye yüklememiz gerekiyordu. Bu adımı Spotify Tracks Dataset'ini kullanarak yerine getirdik. Veriyi MongoDB'ye aktardık.

In [10]:
from pymongo import MongoClient

client = MongoClient('mongodb+srv://admin:admin123@aitask.cacln.mongodb.net/')
db = client['music_db']  # Veritabanı adı
collection = db['music_collection']  # Koleksiyon adı

# Müzik Verilerini Yükleme ve Depolama
Müzik verilerinizi (örneğin, Million Song Dataset'ten) MongoDB'ye yüklemek için veriyi önce Pandas ile yükleyin ve ardından MongoDB'ye aktarın:

In [11]:
import pandas as pd

# Müzik verilerini yükleme
spotify_data = pd.read_csv('dataset.csv')

# ilk birkaç satırı görüntüleme
print(spotify_data.head())

   Unnamed: 0                track_id                 artists  \
0           0  5SuOikwiRyPMVoIQDJUgSV             Gen Hoshino   
1           1  4qPNDBW1i3p13qLCt0Ki3A            Ben Woodward   
2           2  1iJBSr7s7jYXzM8EGcbK5b  Ingrid Michaelson;ZAYN   
3           3  6lfxq3CG4xtTiEg7opyCyx            Kina Grannis   
4           4  5vjLSffimiIP26QG5WcN2K        Chord Overstreet   

                                          album_name  \
0                                             Comedy   
1                                   Ghost (Acoustic)   
2                                     To Begin Again   
3  Crazy Rich Asians (Original Motion Picture Sou...   
4                                            Hold On   

                   track_name  popularity  duration_ms  explicit  \
0                      Comedy          73       230666     False   
1            Ghost - Acoustic          55       149610     False   
2              To Begin Again          57       210826     False   


# MongoDB'ye Bağlantı Kurma

In [12]:
from pymongo import MongoClient

# MongoDB'ye bağlanın (localhost'ta çalışıyorsa)
client = MongoClient('mongodb+srv://admin:admin123@aitask.cacln.mongodb.net/')

# Veritabanı ve koleksiyon oluşturun
db = client['spotify_db']  # Veritabanı adı
collection = db['tracks']  # Koleksiyon adı


#  Veriyi MongoDB'ye Aktarma

In [13]:
# Veriyi sözlük formatına çevirme
spotify_data_dict = spotify_data.to_dict('records')

# Veriyi MongoDB'ye ekleme
collection.insert_many(spotify_data_dict)

print("Veri başarıyla MongoDB'ye yüklendi.")


Veri başarıyla MongoDB'ye yüklendi.


# Veri Kontrolü
* MongoDB'ye veriyi yükledikten sonra, yüklediğimiz veriyi doğrulamak için koleksiyonu kontrol edebiliriz. Örneğin, MongoDB'deki ilk birkaç kaydı çekmek için şu kodu kullanabilirsin:

In [14]:
# MongoDB'den veriyi çekip kontrol etme
for record in collection.find().limit(5):
    print(record)


{'_id': ObjectId('6718d455c2d2b519c67903a7'), 'Unnamed: 0': 0, 'track_id': '5SuOikwiRyPMVoIQDJUgSV', 'artists': 'Gen Hoshino', 'album_name': 'Comedy', 'track_name': 'Comedy', 'popularity': 73, 'duration_ms': 230666, 'explicit': False, 'danceability': 0.676, 'energy': 0.461, 'key': 1, 'loudness': -6.746, 'mode': 0, 'speechiness': 0.143, 'acousticness': 0.0322, 'instrumentalness': 1.01e-06, 'liveness': 0.358, 'valence': 0.715, 'tempo': 87.917, 'time_signature': 4, 'track_genre': 'acoustic'}
{'_id': ObjectId('6718d455c2d2b519c67903a8'), 'Unnamed: 0': 1, 'track_id': '4qPNDBW1i3p13qLCt0Ki3A', 'artists': 'Ben Woodward', 'album_name': 'Ghost (Acoustic)', 'track_name': 'Ghost - Acoustic', 'popularity': 55, 'duration_ms': 149610, 'explicit': False, 'danceability': 0.42, 'energy': 0.166, 'key': 1, 'loudness': -17.235, 'mode': 1, 'speechiness': 0.0763, 'acousticness': 0.924, 'instrumentalness': 5.56e-06, 'liveness': 0.101, 'valence': 0.267, 'tempo': 77.489, 'time_signature': 4, 'track_genre': 'ac

# Kullanıcı Dinleme Geçmişini Sorgulama:

* MongoDB'deki veriyi çekip kullanıcı-şarkı matrisini oluşturduk. Rastgele kullanıcılar ekleyerek her bir kullanıcının dinlediği şarkıları temsil eden bir tablo oluşturduk. Bu adımda Spotify veri setindeki popularity sütununu kullanarak kullanıcıların dinlediği şarkıların popülerliğini baz alarak öneriler yapmaya başladık.

In [15]:
# 1. MongoDB'den Kullanıcı-Şarkı Verilerini Çekme
# Önce MongoDB'den veriyi çekip kullanıcı-şarkı matrisini oluşturalım
import pandas as pd
from pymongo import MongoClient

# MongoDB'ye bağlan
client = MongoClient('mongodb+srv://admin:admin123@aitask.cacln.mongodb.net/')
db = client['spotify_db']
collection = db['tracks']

# MongoDB'den veriyi çekip DataFrame'e aktar
spotify_data = pd.DataFrame(list(collection.find()))

# Kullanıcı-şarkı matrisini oluşturma
user_item_matrix = spotify_data.pivot_table(index='user_id', columns='song_title', values='play_count', fill_value=0)

# Matrisi inceleyelim
print(user_item_matrix.head())


KeyError: 'play_count'

In [16]:
# Veri setindeki sütun isimlerini kontrol et
print(spotify_data.columns)


Index(['_id', 'Unnamed: 0', 'track_id', 'artists', 'album_name', 'track_name',
       'popularity', 'duration_ms', 'explicit', 'danceability', 'energy',
       'key', 'loudness', 'mode', 'speechiness', 'acousticness',
       'instrumentalness', 'liveness', 'valence', 'tempo', 'time_signature',
       'track_genre'],
      dtype='object')


In [17]:
"""Kullanıcı-Şarkı Matrisini popularity ile Oluşturma
Sütun adlarını belirledikten sonra, popularity değerini kullanarak kullanıcı-şarkı matrisini oluşturabiliriz. Ayrıca, track_name sütununu şarkı adı olarak kullanacağız.

Veri setinde her bir kullanıcıya ait dinleme bilgisi olmadığı için, bu öneri sistemini basitleştirip rastgele kullanıcılar oluşturarak ilerleyelim. Her şarkıyı rastgele kullanıcılara atayabiliriz.

1. Kullanıcılar için rastgele veri oluşturma ve kullanıcı-şarkı matrisini oluşturma:"""

import random

# Veri setine rastgele kullanıcılar ekleyelim
spotify_data['user_id'] = [random.randint(1, 20) for _ in range(len(spotify_data))]

# Kullanıcı-şarkı matrisini 'popularity' sütunu ile oluşturma
user_item_matrix = spotify_data.pivot_table(index='user_id', columns='track_name', values='popularity', fill_value=0)

# Matrisi inceleyelim
print(user_item_matrix.head())


track_name  !I'll Be Back!  "A" You're Adorable  "C" IS FOR COOKIE  \
user_id                                                              
1                      0.0                  0.0                0.0   
2                      0.0                  0.0                0.0   
3                      0.0                  0.0                0.0   
4                      0.0                  0.0                0.0   
5                     52.0                  0.0                0.0   

track_name  "C" is for Cookie  "Christe, Redemptor omnium"  \
user_id                                                      
1                         0.0                          0.0   
2                         0.0                          0.0   
3                         8.0                          0.0   
4                         0.0                          0.0   
5                         0.0                          0.0   

track_name  "Contemplate This on the Tree of Woe."  \
user_id             

# Collaborative Filtering (İş Birliğine Dayalı Filtreleme):

* Kullanıcı benzerlik matrisini hesapladık ve cosine similarity kullanarak kullanıcılar arasındaki benzerlikleri bulduk. Bu sayede, kullanıcılara daha önce dinlemedikleri şarkılar için tahminler yapabiliyoruz.
* Tahmin edilen şarkıları daha önce dinlenmeyen şarkılardan filtreleyip en iyi tahmin edilenleri öneriyoruz.
### Cosine Similarity ile Kullanıcı Benzerlik Matrisi Hesaplama
Şimdi user_item_matrix ile kullanıcılar arasındaki benzerlikleri hesaplayabiliriz:

In [18]:
from sklearn.metrics.pairwise import cosine_similarity

# Cosine similarity ile kullanıcı benzerlik matrisini hesapla
user_similarity = cosine_similarity(user_item_matrix)

# Kullanıcı benzerlik matrisini inceleyelim
print(user_similarity)


[[1.         0.14407438 0.15092472 0.14757423 0.14856084 0.14128386
  0.14595513 0.13974623 0.14983275 0.15306314 0.1542815  0.15294191
  0.14359196 0.14419948 0.13981459 0.15233927 0.14904052 0.14171093
  0.15088646 0.15036   ]
 [0.14407438 1.         0.15058426 0.14222647 0.14472597 0.14532535
  0.13809766 0.14019954 0.14488204 0.15218917 0.14590466 0.14127736
  0.14260206 0.14075142 0.14020599 0.14574566 0.14731283 0.14071766
  0.14875552 0.14615553]
 [0.15092472 0.15058426 1.         0.14691534 0.14516634 0.14544287
  0.14550749 0.1459946  0.15836781 0.14231901 0.15014903 0.14298081
  0.14433943 0.14242503 0.14823395 0.14369693 0.14954264 0.14865979
  0.14500091 0.14957501]
 [0.14757423 0.14222647 0.14691534 1.         0.14336766 0.14373736
  0.14277014 0.14391755 0.15025173 0.14415211 0.14445316 0.14277904
  0.14054682 0.14508072 0.13781726 0.14286081 0.14935095 0.14889977
  0.15034556 0.15386389]
 [0.14856084 0.14472597 0.14516634 0.14336766 1.         0.14636802
  0.14350802 0.1

# Kullanıcıya Şarkı Önerme
Kullanıcı benzerlik matrisini kullanarak her kullanıcı için şarkı önerilerinde bulunabiliriz:

In [21]:
import numpy as np
import pandas as pd

def predict_ratings(user_item_matrix, user_similarity):
    # Kullanıcıların ortalama popülarite değeri
    user_mean = user_item_matrix.mean(axis=1)
    
    # Her kullanıcının popülaritesini ortalamaya göre normalize et
    ratings_diff = user_item_matrix.sub(user_mean, axis=0)
    
    # Tahminleri hesapla
    pred_ratings = user_mean.values[:, np.newaxis] + user_similarity.dot(ratings_diff.fillna(0)) / np.array([np.abs(user_similarity).sum(axis=1)]).T
    
    return pred_ratings

pred_ratings = predict_ratings(user_item_matrix, user_similarity)

# Öneri yapma fonksiyonu
def recommend_songs(user_id, user_item_matrix, pred_ratings, N=5):
    # Kullanıcı indexi
    user_idx = user_id - 1  # Pandas'da index 0'dan başlıyor
    user_predictions = pd.Series(pred_ratings[user_idx], index=user_item_matrix.columns)
    
    # Kullanıcının dinlediği şarkıları çıkar
    already_listened = user_item_matrix.loc[user_id][user_item_matrix.loc[user_id] > 0].index.tolist()
    
    # Daha önce dinlenmeyen şarkılar arasından en yüksek tahmin edilenleri öner
    recommendations = user_predictions.drop(already_listened).sort_values(ascending=False).head(N)
    
    return recommendations

# Örnek: Kullanıcı 1 ve random  için öneriler
user_id = 1
recommendations = recommend_songs(user_id, user_item_matrix, pred_ratings, N=5)
print(f"Kullanıcı {user_id} için önerilen şarkılar:\n{recommendations}")



Kullanıcı 1 için önerilen şarkılar:
track_name
September    39.350017
Alone        37.950204
Closer       37.898613
Vienna       33.561789
Criminal     33.375157
dtype: float64


# Tavsiye Sistemi:

* Flask kullanarak basit bir öneri API'si kurarak, kullanıcılara önerilerde bulunmak için bir API oluşturacağız. Bu API, kullanıcı kimliği alacak ve bu kullanıcı için önerilen şarkıları döndürecek.