# 📐 Varyans: Verinin Yayılımının Kareli Hikayesi

## Giriş: Neden Kare Alıyoruz?

Diyelim ki bir sınıftaki öğrencilerin sınav notlarını inceledin. Ortalama 75 çıktı ama bazıları 100 aldı, bazıları ise 40 aldı. Bu durumda veri nasıl yayılmış? Bu sorunun cevabını varyans verir.

## 🔍 Varyans Nedir?

**Varyans**, bir veri kümesindeki tüm değerlerin **ortalamaya göre ne kadar uzakta olduğunu** gösteren istatistiksel bir ölçüdür.

### Anlamı:
- **Küçük varyans →** Değerler ortalamaya yakın → Daha homojen dağılım
- **Büyük varyans →** Değerler ortalamadan uzak → Daha heterojen dağılım

📌 Yani:  
- Eğer veri sıkışık duruyorsa → küçük varyans  
- Eğer veri yayılmışsa → büyük varyans  

## 🧮 Varyans Nasıl Hesaplanır?

### 1. **Ortalamayı Bul**
Tüm sayıların toplamını veri sayısına böl.

### 2. **Her Sayının Ortalamadan Farkını Al**
Sayı - ortalama = sapma

### 3. **Sapmaların Karelerini Al**
Negatifleri pozitif yapmak için karesini alıyoruz.

### 4. **Karelerin Ortalamasını Al**
Kareler toplamını veri sayısının bir eksiğine böl (örneklem için). Ana kütleyse doğrudan veri sayısına böl.

## 💡 Gerçek Hayat Örneğiyle Anlamak

### 🎯 Sınıf Notları:

Notlar: `70, 80, 90, 60, 75`

Adım adım çözüm:

1. **Ortalama:**  
   $$
   \frac{70 + 80 + 90 + 60 + 75}{5} = 75
   $$

2. **Sapmalar:**  
   - 70 - 75 = -5  
   - 80 - 75 = +5  
   - 90 - 75 = +15  
   - 60 - 75 = -15  
   - 75 - 75 = 0

3. **Kareler Toplamı:**  
   - (-5)² = 25  
   - (+5)² = 25  
   - (+15)² = 225  
   - (-15)² = 225  
   - 0² = 0  
   → Toplam = **500**

4. **Varyans (Örneklem için):**  
   $$
   \frac{500}{5 - 1} = \frac{500}{4} = 125
   $$

✅ Bu sınıfın varyansı **125’tir.**  
Bu da bize şu anlama gelir:  
Veri noktaları ortalamaya göre oldukça yayılmış.

## 📊 Varyansın Özellikleri

| Özellik | Açıklama |
|--------|----------|
| ✅ Dağılım ölçüsüdür | Verinin yayılımını gösterir |
| ⚠️ Aykırı değerlere duyarlıdır | Çok yüksek veya düşük değerler varyansı büyütür |
| 🟢 Standart sapmanın temelidir | Standart sapma = √varyans |
| 🔲 Birimi farklıdır | Varyansın birimi orijinal verinin karesidir (örneğin: puan²) |


## 📈 Varyans mı, Standart Sapma mı?

| Özellik | Varyans | Standart Sapma |
|---------|---------|----------------|
| Formülü | Sapmaların karesi ortalaması | Varyansın karekökü |
| Birimi | Kareli (örneğin: puan²) | Aynı birim (örneğin: puan) |
| Yorumlanabilirlik | Zor | Kolay |
| Kullanım Alanı | İstatistik modellerde | Günlük analizlerde |

📌 **Özet:**  
- Varyans teknik olarak önemlidir ama  
- **Standart sapma günlük dilde daha çok kullanılır**, çünkü anlamlıdır.

## 📌 Nerelerde Kullanılır?

| Alan | Kullanım Yeri |
|------|----------------|
| **Finans** | Hisse senedi fiyatlarının dalgalanması |
| **Eğitim** | Öğrenci notlarının dağılımı |
| **Kalite Kontrolü** | Ürün boyutlarındaki sapmalar |
| **Sağlık** | Tıbbi verilerin dağılımı |
| **Veri Bilimi** | Özellik mühendisliği/Feature Engineering ve modelleme |


In [1]:
# Python Uygulaması: Varyans Nasıl Hesaplanır?

import numpy as np

veri = [70, 80, 90, 60, 75]

# Örneklem varyansı (n-1'e göre)
var_orneklem = np.var(veri, ddof=1)
print(f"Örneklem Varyansı: {var_orneklem:.2f}")

# Ana kütle varyansı (n'e göre)
var_kitle = np.var(veri)
print(f"Ana Kütle Varyansı: {var_kitle:.2f}")

Örneklem Varyansı: 125.00
Ana Kütle Varyansı: 100.00


📌 `ddof=1`: örneklem için farkı hesaplamayı sağlar  
📌 `np.std()`: standart sapmayı hesaplamak için kullanılabilir

## 🧠 Varyans ile Karşılaştırma Yapalım

| Sınıf A Notları | Sınıf B Notları |
|------------------|------------------|
| 70, 75, 80      | 40, 75, 110     |
| Ortalama: 75     | Ortalama: 75     |
| Varyans: ~25     | Varyans: ~1225   |

📌 Her iki sınıfın ortalaması aynı ama **sınıf B’nin varyansı çok daha büyük.**  
Demek ki B sınıfında notlar çok daha fazla yayılmış.

## 🧭 Varyans ve Standart Sapma Arasındaki Bağ

Varyans, standart sapmanın **karesidir.**

$$
\text{Standart Sapma} = \sqrt{\text{Varyans}}
$$

Yani yukarıdaki örnekte:
$$
\sigma = \sqrt{125} \approx 11.18
$$

📌 Varyans büyük rakamlar üretir ama anlaması zordur.  
Standart sapma ise aynı birimdedir ve günlük analizlerde tercih edilir.