# Veri Analistinin Bilmesi Gereken Temel İstatistik ve Olasılık Bilgileri

## 1. Tanımlayıcı İstatistikler (Descriptive Statistics)
- Ortalama (Mean)
- Ortanca (Median)
- Mod (Mode)
- Varyans ve Standart Sapma
- Minimum, Maksimum, Aralık

In [None]:
import numpy as np
import pandas as pd

data = [10, 20, 20, 30, 40, 100]
print("Ortalama:", np.mean(data))
print("Ortanca:", np.median(data))
print("Mod:", pd.Series(data).mode()[0])
print("Standart Sapma:", np.std(data, ddof=1))

## 2. Olasılık (Probability)
- Temel kavramlar: deney, olay, örnek uzay
- Koşullu olasılık
- Bayes Teoremi

In [None]:
# Koşullu olasılık: P(A|B) = P(A ve B) / P(B)
p_a_and_b = 0.1
p_b = 0.4
print("P(A|B):", p_a_and_b / p_b)

## 3. Olasılık Dağılımları (Probability Distributions)
- Normal Dağılım
- Binom Dağılımı
- Poisson Dağılımı

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt

sns.histplot(np.random.normal(0, 1, 1000), kde=True)
plt.title("Normal Dağılım")
plt.show()

## 4. Hipotez Testleri (Hypothesis Testing)
- Null ve Alternatif Hipotez
- p-değeri yorumu

In [None]:
from scipy.stats import ttest_ind

gr1 = [100, 102, 98, 101]
gr2 = [110, 112, 115, 108]
stat, p = ttest_ind(gr1, gr2)
print("P-değeri:", p)

## 5. Korelasyon ve Regresyon
- Korelasyon Katsayısı
- Doğrusal Regresyon

In [None]:
import statsmodels.api as sm

X = sm.add_constant(df["x"])
model = sm.OLS(df["y"], X).fit()
print(model.summary())

In [None]:
df = pd.DataFrame({"x": [1, 2, 3, 4, 5], "y": [2, 4, 5, 4, 5]})

## 6. Veri Temizleme (Data Cleaning)
- Eksik veriler
- Aykırı değerler
- Dönüştürme işlemleri

In [None]:
df = pd.DataFrame({"a": [1, None, 3], "b": [4, 5, None]})
df.fillna(df.mean(), inplace=True)
df

## Kaynaklar
1. Bruce, Peter; Bruce, Andrew. *Practical Statistics for Data Scientists*
2. Miller, James D. *Statistics for Data Science*
3. Khan Academy – Statistics and Probability
4. StatQuest – Josh Starmer YouTube