In [1]:
# YAZ KAMPI: VERİ BİLİMİNE GİRİŞ EĞİTİMİ
# Proje 1 – “Kitap Satış Analiz Sistemi”
# İpek Nur Ercan

In [4]:
import statistics, random
from collections import Counter

kitaplar = [
    {"isim": "Veri Bilimi 101",        "yazar": "Ali",   "tur": "Bilim",    "satis": 1200, "yil": 2021},
    {"isim": "Python ile Yapay Zeka",  "yazar": "Ayşe",  "tur": "Bilim",    "satis": 950,  "yil": 2020},
    {"isim": "İstatistik Temelleri",   "yazar": "Ali",   "tur": "Akademik", "satis": 700,  "yil": 2019},
    {"isim": "Makine Öğrenmesi",       "yazar": "Can",   "tur": "Bilim",    "satis": 1800, "yil": 2022},
    {"isim": "Veri Görselleştirme",    "yazar": "Deniz", "tur": "Sanat",    "satis": 400,  "yil": 2018},
    {"isim": "Matematiksel Modelleme", "yazar": "Ali",   "tur": "Akademik", "satis": 1500, "yil": 2021},
    {"isim": "Bilgi Toplumu",          "yazar": "Ayşe",  "tur": "Sosyal",   "satis": 600,  "yil": 2022}
]

# -------------------------------------------------------------------------
# 1) Fonksiyonlar
def en_cok_satan(kitaplar):
    return max(kitaplar, key=lambda x: x["satis"])

def yazar_satislari(kitaplar):
    s = {}
    for k in kitaplar:
        s[k["yazar"]] = s.get(k["yazar"], 0) + k["satis"]
    return s

# Küçük yardımcılar
def tur_sayim(kitaplar):
    return Counter(k["tur"] for k in kitaplar)

def yazar_sayim(kitaplar):
    return Counter(k["yazar"] for k in kitaplar)

def satis_listesi(kitaplar):
    return [k["satis"] for k in kitaplar]

def guvenli_std(x):
    # n<2 iken statistics.stdev hata verir; bu yüzden korumalı fonksiyon
    return statistics.stdev(x) if len(x) >= 2 else 0.0

def ozet_cikar(alt_kume):
    s_list = satis_listesi(alt_kume)
    ort = statistics.mean(s_list) if s_list else 0.0
    std = guvenli_std(s_list)
    en_cok_satan_kitap = max(alt_kume, key=lambda k: k["satis"])["isim"] if alt_kume else None
    tur_pop = tur_sayim(alt_kume).most_common(1)[0][0] if alt_kume else None
    yazar_pop = yazar_sayim(alt_kume).most_common(1)[0][0] if alt_kume else None
    return {
        "ortalama": round(ort, 2),
        "std": round(std, 2),
        "en_cok_satan_kitap": en_cok_satan_kitap,
        "en_populer_tur": tur_pop,
        "en_populer_yazar": yazar_pop,
    }

# -------------------------------------------------------------------------
# 2) Liste / Küme İşlemleri (orijinal gereksinimlerin kapsamı)
turler = {k["tur"] for k in kitaplar}
bin_ustu = [k["isim"] for k in kitaplar if k["satis"] > 1000]

# -------------------------------------------------------------------------
# 3) Lambda / filter / map / sorted
sonrasi_2020 = list(filter(lambda k: k["yil"] > 2020, kitaplar))
artirilmis = list(map(lambda k: k["satis"] * 1.10, kitaplar))
sirali = sorted(kitaplar, key=lambda k: k["satis"], reverse=True)

# -------------------------------------------------------------------------
# 4) Genel istatistiksel analiz
satislar = satis_listesi(kitaplar)
genel_ortalama = round(statistics.mean(satislar), 2)
genel_std = round(guvenli_std(satislar), 2)
en_populer_tur_genel = tur_sayim(kitaplar).most_common(1)[0][0]

# -------------------------------------------------------------------------
# 5) Ekstra – Train/Test (%70 / %30) + Gelişmiş Karşılaştırmalı Analiz
random.seed(42)  # tekrarlanabilirlik
N = len(kitaplar)
train_size = int(N * 0.7)  # 7 için 4 kitap
train = random.sample(kitaplar, train_size)
test = [k for k in kitaplar if k not in train]

# Train ve Test özetleri
train_ozet = ozet_cikar(train)
test_ozet  = ozet_cikar(test)

# Train ortalamasına göre testte üstü kitaplar
test_ustu = [k["isim"] for k in test if k["satis"] > train_ozet["ortalama"]]

# -------------------------------------------------------------------------
# SONUÇLARI YAZDIR
print("=== GENEL BİLGİLER ===")
print("En çok satan kitap:", en_cok_satan(kitaplar)["isim"])
print("Yazar satışları:", yazar_satislari(kitaplar))
print("Türler:", turler)
print("1000’den fazla satan kitaplar:", bin_ustu)
print("2020 sonrası çıkan kitaplar:", [k["isim"] for k in sonrasi_2020])
print("Satış +%10:", [round(x,1) for x in artirilmis])
print("Satışa göre azalan sıralı:", [k["isim"] for k in sirali])
print("Genel ortalama satış:", genel_ortalama)
print("Genel standart sapma:", genel_std)
print("Genelde en popüler tür:", en_populer_tur_genel)

print("\n=== TRAIN/TEST AYRIMI ===")
print("Train seti:", [k["isim"] for k in train])
print("Test seti :", [k["isim"] for k in test])

print("\n--- Train Özeti ---")
for k,v in train_ozet.items():
    print(f"{k}: {v}")

print("\n--- Test Özeti ---")
for k,v in test_ozet.items():
    print(f"{k}: {v}")

print("\n--- Karşılaştırma ve Yorum ---")
print(f"Train ortalama: {train_ozet['ortalama']} | Test ortalama: {test_ozet['ortalama']}")
print(f"Train std     : {train_ozet['std']} | Test std     : {test_ozet['std']}")
print(f"Train popüler tür: {train_ozet['en_populer_tur']} | Test popüler tür: {test_ozet['en_populer_tur']}")
print(f"Train popüler yazar: {train_ozet['en_populer_yazar']} | Test popüler yazar: {test_ozet['en_populer_yazar']}")
print(f"Testte, train ortalamasını geçen kitaplar: {test_ustu}")

# Kısa otomatik yorum
yorum = []
if test_ozet["ortalama"] > train_ozet["ortalama"]:
    yorum.append("Test ortalaması, train ortalamasından yüksek görünüyor.")
elif test_ozet["ortalama"] < train_ozet["ortalama"]:
    yorum.append("Test ortalaması, train ortalamasından düşük görünüyor.")
else:
    yorum.append("Train ve test ortalamaları eşit görünüyor.")

if test_ozet["std"] > train_ozet["std"]:
    yorum.append("Test setindeki satışların saçılımı (std) daha yüksek; dağılım daha heterojen.")
elif test_ozet["std"] < train_ozet["std"]:
    yorum.append("Train setindeki saçılım daha yüksek; test daha homojen.")
else:
    yorum.append("Saçılım düzeyleri benzer.")

yorum.append("Tür ve yazar dağılımları küçük örneklem nedeniyle değişkenlik gösterebilir; sonuçları yorumlarken örneklem büyüklüğünü dikkate alın.")

print("\nYorum:", " ".join(yorum))


=== GENEL BİLGİLER ===
En çok satan kitap: Makine Öğrenmesi
Yazar satışları: {'Ali': 3400, 'Ayşe': 1550, 'Can': 1800, 'Deniz': 400}
Türler: {'Sanat', 'Akademik', 'Sosyal', 'Bilim'}
1000’den fazla satan kitaplar: ['Veri Bilimi 101', 'Makine Öğrenmesi', 'Matematiksel Modelleme']
2020 sonrası çıkan kitaplar: ['Veri Bilimi 101', 'Makine Öğrenmesi', 'Matematiksel Modelleme', 'Bilgi Toplumu']
Satış +%10: [1320.0, 1045.0, 770.0, 1980.0, 440.0, 1650.0, 660.0]
Satışa göre azalan sıralı: ['Makine Öğrenmesi', 'Matematiksel Modelleme', 'Veri Bilimi 101', 'Python ile Yapay Zeka', 'İstatistik Temelleri', 'Bilgi Toplumu', 'Veri Görselleştirme']
Genel ortalama satış: 1021.43
Genel standart sapma: 506.51
Genelde en popüler tür: Bilim

=== TRAIN/TEST AYRIMI ===
Train seti: ['Matematiksel Modelleme', 'Veri Bilimi 101', 'Bilgi Toplumu', 'İstatistik Temelleri']
Test seti : ['Python ile Yapay Zeka', 'Makine Öğrenmesi', 'Veri Görselleştirme']

--- Train Özeti ---
ortalama: 1000
std: 424.26
en_cok_satan_kitap