# Spotify Recommendation System

## Proje Hakkında
Bu proje, Spotify veri setini kullanarak içerik tabanlı (content-based) bir müzik öneri sistemi geliştirmeyi amaçlamaktadır. Kullanıcıların dinlediği şarkıların ses özelliklerine (audio features) dayanarak benzer şarkılar öneren bir sistem tasarlanmıştır.

## Yapılan İyileştirmeler
1.  **Veri Analizi (EDA)**: Veri setini daha iyi anlamak için görselleştirmeler eklendi (Korelasyon matrisi).
2.  **Özellik Mühendisliği & Ön İşleme**: Sayısal veriler normalize edildi.
3.  **Algoritma Güncellemesi**: Daha hızlı ve etkili olan **Cosine Similarity** (Kosinüs Benzerliği) yöntemi kullanıldı.
4.  **Kullanım Kolaylığı**: Şarkı ismine göre öneri yapan fonksiyon daha sağlam hale getirildi.

In [None]:
import warnings
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from tqdm import tqdm
from sklearn.preprocessing import MinMaxScaler
from sklearn.metrics.pairwise import cosine_similarity

warnings.filterwarnings("ignore")
sns.set_style("whitegrid")

# Load Data
data = pd.read_csv("data/spotify.csv")
data.head()

## 1. Veri Keşfi ve Temizleme (EDA)

In [None]:
data.info()

In [None]:
# Eksik veri kontrolü
print("Eksik veriler:\n", data.isnull().sum())

In [None]:
# Gereksiz sütunların çıkarılması (id, release_date vs. analiz için kullanılmayacak)
df_numeric = data.select_dtypes(include=['float64', 'int64'])
df_numeric = df_numeric.drop(columns=['year'], errors='ignore') # year genelde kategorik gibi davranır veya drop edilebilir

# Korelasyon Matrisi
plt.figure(figsize=(12, 10))
sns.heatmap(df_numeric.corr(), annot=True, fmt=".2f", cmap='coolwarm')
plt.title("Audio Features Correlation Matrix")
plt.show()

## 2. Veri Ön İşleme (Preprocessing)
Öneri sistemimizin özelliklere eşit ağırlık verebilmesi için sayısal verileri 0-1 aralığına normalize ediyoruz.

In [None]:
scaler = MinMaxScaler()
normalized_data = scaler.fit_transform(df_numeric)

# Normalize edilmiş veriyi DataFrame'e çevirelim (kolay işlem için)
features_df = pd.DataFrame(normalized_data, columns=df_numeric.columns)
features_df['name'] = data['name']
features_df['artists'] = data['artists']
features_df.head()

## 3. Öneri Sistemi (Cosine Similarity)
Artık şarkılar arasındaki benzerliği hesaplayabiliriz. Vektör uzayında birbirine en yakın şarkıları bulmak için **Cosine Similarity** kullanacağız.

In [None]:
# Sadece sayısal özellikleri al
feature_matrix = features_df.drop(columns=['name', 'artists']).values

# Cosine Similarity Matrisini hesapla (Dikkat: Çok büyük veri setlerinde bu matris çok yer kaplar)
# Örnek olması için ilk 5000 şarkı üzerinde çalışalım veya direkt fonksiyon içinde hesaplayalım.
# Tüm veri seti büyük olduğu için (170k+ satır), on-the-fly (istek anında) hesaplama daha mantıklıdır.

class SpotifyRecommender:
    def __init__(self, data, feature_matrix):
        self.data = data
        self.feature_matrix = feature_matrix
        
    def recommend(self, song_name, amount=10):
        # Şarkıyı bul
        song_idx = self.data[self.data['name'].str.lower() == song_name.lower()].index
        
        if len(song_idx) == 0:
            print(f"Şarkı bulunamadı: {song_name}")
            return None
        
        # İlk eşleşen şarkıyı al (birden fazla versiyon olabilir)
        idx = song_idx[0]
        
        # Hedef şarkının vektörü
        target_song_vector = self.feature_matrix[idx].reshape(1, -1)
        
        # Benzerlikleri hesapla
        # Tüm matrisi hesaplamak yerine sadece bu vektör ile diğerleri arasındakini hesaplıyoruz
        similarities = cosine_similarity(target_song_vector, self.feature_matrix)
        
        # Benzerlik skorlarına göre sırala (en yüksekten en düşüğe)
        # [0] çünkü similarities (1, N) boyutunda döner
        similar_indices = similarities[0].argsort()[::-1]
        
        # Kendisini çıkar (ilk eleman kendisi olacaktır çünkü benzerlik 1.0)
        similar_indices = similar_indices[1:amount+1]
        
        # Önerileri getir
        recommendations = self.data.iloc[similar_indices][['artists', 'name', 'year']]
        return recommendations

# Modeli başlat
recommender = SpotifyRecommender(data, feature_matrix)

## 4. Test Etme

In [None]:
song_name = "Lovers Rock"
print(f"Recommendations for '{song_name}':")
recommender.recommend(song_name, 10)

In [None]:
song_name = "Shape of You"
print(f"Recommendations for '{song_name}':")
recommender.recommend(song_name, 5)

## Sonuç ve Özet
Bu projede yapılan iyileştirmeler:
- **Veri Görselleştirme**: Sütunlar arası ilişkileri görmek için korelasyon matrisi eklendi.
- **Ölçeklendirme**: MinMaxScaler ile veriler 0-1 aralığına çekilerek modelin daha doğru çalışması sağlandı.
- **Cosine Similarity**: Önceki 'mutlak fark' yöntemi yerine, vektör tabanlı benzerlik için daha standart ve güçlü olan Cosine Similarity kullanıldı.
- **Kod Yapısı**: `SpotifyRecommender` sınıfı daha temiz ve modüler hale getirildi.