# Olasılık Dağılımları

## Bernoulli Dağılımı

${\displaystyle f(k;p)=p^{k}(1-p)^{1-k}\quad {\text{for }}k\in \{0,1\}}$


${\displaystyle \operatorname {E} \left(X\right)=p}$

$\operatorname {Var} [X]=pq=p(1-p)$

İki sonuçlu olaylar ile ilgilenildiğinde kullanılan kesikli olasılık dağılımıdır.

In [1]:
from scipy.stats import bernoulli

In [2]:
p = 0.6

In [3]:
rv = bernoulli(p)
rv.pmf(k = 0)

0.4

In [4]:
rv.pmf(k=1)

0.6

## Büyük Sayılar Yasası

**Bir rassal değişkenin uzun vadeli kararlılığını tanımlayan olasılık teoremidir.**

In [5]:
import numpy as np
rng = np.random.RandomState(123)
for i in np.arange(1,21):
    deney_sayisi = 2**i
    yazi_turalar = rng.randint(0, 2, size = deney_sayisi)
    yazi_olasiliklari = np.mean(yazi_turalar)
    print("Atış Sayısı:",deney_sayisi,"---",'Yazı Olasılığı: %.2f' % (yazi_olasiliklari * 100))

Atış Sayısı: 2 --- Yazı Olasılığı: 50.00
Atış Sayısı: 4 --- Yazı Olasılığı: 0.00
Atış Sayısı: 8 --- Yazı Olasılığı: 62.50
Atış Sayısı: 16 --- Yazı Olasılığı: 43.75
Atış Sayısı: 32 --- Yazı Olasılığı: 46.88
Atış Sayısı: 64 --- Yazı Olasılığı: 56.25
Atış Sayısı: 128 --- Yazı Olasılığı: 50.78
Atış Sayısı: 256 --- Yazı Olasılığı: 52.73
Atış Sayısı: 512 --- Yazı Olasılığı: 52.93
Atış Sayısı: 1024 --- Yazı Olasılığı: 50.20
Atış Sayısı: 2048 --- Yazı Olasılığı: 48.58
Atış Sayısı: 4096 --- Yazı Olasılığı: 49.49
Atış Sayısı: 8192 --- Yazı Olasılığı: 49.58
Atış Sayısı: 16384 --- Yazı Olasılığı: 49.96
Atış Sayısı: 32768 --- Yazı Olasılığı: 50.00
Atış Sayısı: 65536 --- Yazı Olasılığı: 49.68
Atış Sayısı: 131072 --- Yazı Olasılığı: 49.97
Atış Sayısı: 262144 --- Yazı Olasılığı: 50.13
Atış Sayısı: 524288 --- Yazı Olasılığı: 50.01
Atış Sayısı: 1048576 --- Yazı Olasılığı: 50.09


Deney sayısı arttıkça farklı durumların gerçekleşme olasılığı birbirine yaklaşmaktadır.

## Binom Dağılımı

${\displaystyle f(k;n,p)={n \choose k}p^{k}(1-p)^{n-k}}$, k = 0, 1, 2, ...,n


${\displaystyle \operatorname {E} (X)=np}$


${\displaystyle \operatorname {Var} (X)=np(1-p)}$

Bağımsız n deneme sonucu k başarılı olma olasılığı ile ilgilenildiğinde kullanılır.

In [6]:
from scipy.stats import binom

In [7]:
p = 0.01
n = 100
rv = binom(n, p)
print(rv.pmf(1))
print(rv.pmf(5))
print(rv.pmf(10))

0.36972963764972666
0.002897787123761478
7.006035693977194e-08


Uygulamalar -> Reklam Harcama Optimizasyonu

## Poisson Dağılımı

${\displaystyle f(x,\lambda )={\frac {\lambda ^{x}e^{-\lambda }}{x!}}\,\!}$,  x = 0,1,2,...,n

Binomun özel bir halidir.
Belirli zaman aralığında nadiren rastlanan olayların olasılıklarını hesaplamak için kullanılır.
Gözlem sayısı yüksek, beklenen durumun gerçekleşme sayısı çok küçük. (n>50, n*p<5)
- 2 sonuçlu olmalı
- Aynı koşullar alrtında gerçekleşmeli
- rassal denemeler birbirinden bağımsız olmalı.

In [8]:
from scipy.stats import poisson

In [9]:
lambda_ = 0.1

In [10]:
rv = poisson(mu = lambda_)
print(rv.pmf(k = 0))

0.9048374180359595


In [11]:
print(rv.pmf(k = 3))

0.00015080623633932676


In [12]:
print(rv.pmf(k = 5))

7.54031181696634e-08


Uygulamalar -> İlan Girişi Hata Olasılıklarının Hesaplanması

## Normal Dağılım

${\displaystyle f(x\mid \mu ,\sigma ^{2})={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}e^{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}}$

* $\mu$  ortalama ya da dağılımın beklenen değeri

* ${\displaystyle \sigma }$  standart sapma

* ${\displaystyle \sigma ^{2}}$ varyans

In [13]:
from scipy.stats import norm

In [14]:
#90'dan fazla olması
1-norm.cdf(90, 80, 5)

0.02275013194817921

In [15]:
#70'den fazla olması
1-norm.cdf(70, 80, 5)

0.9772498680518208

In [16]:
#73'den az olması
norm.cdf(73, 80, 5)

0.08075665923377107

In [17]:
#85 ile 90 arasında olması

In [18]:
norm.cdf(90, 80, 5) - norm.cdf(85, 80, 5)

0.13590512198327787