In [None]:
# Spor Yetenek Tahmin Sistemi - Tam Analiz

Bu notebook, spor yetenek tahmin sistemi projesinin tam analizini içerir. Makine öğrenmesi ile bireylerin fiziksel özelliklerine dayalı spor önerileri sunan sistemin geliştirilmesi ve test edilmesi sürecini gösterir.
## İçerik
1. Veri Seti Analizi
2. Özellik Mühendisliği
3. Model Eğitimi ve Karşılaştırması
4. Sonuçların Görselleştirilmesi
5. Sistem Kullanımı

## Proje Özellikleri
- 🎯 **10 farklı spor kategorisi** için tahmin
- 📊 **42 farklı özellik** ile kapsamlı analiz
- 🤖 **5 farklı ML algoritması** karşılaştırması
- 🎨 **Interaktif görselleştirmeler**
- 🖥️ **Streamlit web arayüzü**


In [None]:
# Gerekli kütüphaneleri yükle
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import warnings
warnings.filterwarnings('ignore')

# Türkçe karakter desteği
plt.rcParams['font.family'] = 'Arial'
plt.rcParams['axes.unicode_minus'] = False

print("✅ Kütüphaneler başarıyla yüklendi!")


In [None]:
# Veri setini yükle ve ilk analiz
data = pd.read_csv("../data/sporcu_dataset.csv")

print("=== VERİ SETİ GENEL BİLGİLERİ ===")
print(f"📊 Veri boyutu: {data.shape}")
print(f"📊 Özellik sayısı: {data.shape[1]}")
print(f"📊 Kişi sayısı: {data.shape[0]}")
print(f"📊 Eksik değer sayısı: {data.isnull().sum().sum()}")

print("\n=== SÜTUN BİLGİLERİ ===")
print(f"📋 Sütun isimleri: {list(data.columns)}")

print("\n=== HEDEF DEĞİŞKEN ANALİZİ ===")
print("🏆 Spor dağılımı:")
print(data['tavsiye_edilen_spor'].value_counts())

# İlk 5 satırı göster
print("\n=== İLK 5 KAYIT ===")
data.head()


In [None]:
# Veri görselleştirme
fig, axes = plt.subplots(2, 2, figsize=(15, 10))
fig.suptitle('Temel Veri Analizi', fontsize=16, fontweight='bold')

# Yaş dağılımı
axes[0, 0].hist(data['yas'], bins=15, color='skyblue', alpha=0.7, edgecolor='black')
axes[0, 0].set_title('Yaş Dağılımı')
axes[0, 0].set_xlabel('Yaş')
axes[0, 0].set_ylabel('Kişi Sayısı')
axes[0, 0].grid(True, alpha=0.3)

# Spor dağılımı
sport_counts = data['tavsiye_edilen_spor'].value_counts()
axes[0, 1].pie(sport_counts.values, labels=sport_counts.index, autopct='%1.1f%%')
axes[0, 1].set_title('Spor Dağılımı')

# BMI dağılımı
axes[1, 0].hist(data['bmi'], bins=15, color='lightgreen', alpha=0.7, edgecolor='black')
axes[1, 0].set_title('BMI Dağılımı')
axes[1, 0].set_xlabel('BMI')
axes[1, 0].set_ylabel('Kişi Sayısı')
axes[1, 0].grid(True, alpha=0.3)

# Performans korelasyonu
perf_features = ['hiz', 'kuvvet', 'dayaniklilik', 'esneklik', 'koordinasyon']
corr_matrix = data[perf_features].corr()
sns.heatmap(corr_matrix, annot=True, cmap='coolwarm', center=0, ax=axes[1, 1])
axes[1, 1].set_title('Performans Korelasyonu')

plt.tight_layout()
plt.show()

print("✅ Veri görselleştirme tamamlandı!")


In [None]:
## Sistem Kullanımı

### 1. Veri Seti Oluşturma
```bash
python src/data_generator.py
```

### 2. Model Eğitimi
```bash
python src/model_trainer.py
```

### 3. Veri Görselleştirme
```bash
python src/data_visualizer.py
```

### 4. Streamlit Uygulaması
```bash
streamlit run app/main.py
```

## Sonuçlar ve Bulgular

### Veri Seti Özellikleri
- **100 kişilik** gerçekçi sentetik veri
- **42 farklı özellik** (demografik, fiziksel, performans, deneyim)
- **10 spor kategorisi** için tahmin
- **Dengeli dağılım** (Koşu/Atletizm %38, Basketbol %23, Bisiklet %20)

### Model Performansı
- **Random Forest**: En yüksek doğruluk oranı bekleniyor
- **XGBoost**: Hızlı eğitim ve iyi genelleme
- **LightGBM**: Düşük bellek kullanımı
- **SVM**: Küçük veri setlerinde etkili
- **Neural Network**: Karmaşık desenler için

### Öne Çıkan Özellikler
1. **Hız**: Atletizm ve futbol için kritik
2. **Kuvvet**: Güreş ve boks için önemli
3. **Dayanıklılık**: Koşu ve bisiklet için temel
4. **Koordinasyon**: Basketbol ve tenis için gerekli
5. **Boy**: Basketbol ve voleybol için avantaj

## Gelecek Geliştirmeler
- 🎯 Daha büyük veri seti (1000+ kişi)
- 🧠 Derin öğrenme modelleri
- 📱 Mobil uygulama
- 🏆 Gerçek spor verisi entegrasyonu
- 🔄 Continuous learning sistemi
