# Olasılık Dağılımları

## Bernoulli Dağılımı

${\displaystyle f(k;p)=p^{k}(1-p)^{1-k}\quad {\text{for }}k\in \{0,1\}}$


${\displaystyle \operatorname {E} \left(X\right)=p}$

$\operatorname {Var} [X]=pq=p(1-p)$

* **scipy**  = Olasılık dağılımları işlemleri için kullanılan kütüphanedir

* **pmf** = Olasılık kütle fonksiyonu

In [1]:
from scipy.stats import bernoulli

In [2]:
p = 0.6

In [3]:
rv = bernoulli(p)
rv.pmf(k = 0)

0.4

## Büyük Sayılar Yasası

**Bir rassal değişkenin uzun vadeli kararlılığını tanımlayan olasılık teoremidir.**

In [5]:
import numpy as np

In [6]:
rng = np.random.RandomState(123)
for i in np.arange(1,21):
    deney_sayisi = 2**i
    yazi_turalar = rng.randint(0, 2, size = deney_sayisi)
    yazi_olasiliklari = np.mean(yazi_turalar)
    print("Atıs Sayısı:",deney_sayisi,"----","Yazı Olasılıgı: %.2f" % (yazi_olasiliklari * 100))

Atıs Sayısı: 2 ---- Yazı Olasılıgı: 50.00
Atıs Sayısı: 4 ---- Yazı Olasılıgı: 0.00
Atıs Sayısı: 8 ---- Yazı Olasılıgı: 62.50
Atıs Sayısı: 16 ---- Yazı Olasılıgı: 43.75
Atıs Sayısı: 32 ---- Yazı Olasılıgı: 46.88
Atıs Sayısı: 64 ---- Yazı Olasılıgı: 56.25
Atıs Sayısı: 128 ---- Yazı Olasılıgı: 50.78
Atıs Sayısı: 256 ---- Yazı Olasılıgı: 52.73
Atıs Sayısı: 512 ---- Yazı Olasılıgı: 52.93
Atıs Sayısı: 1024 ---- Yazı Olasılıgı: 50.20
Atıs Sayısı: 2048 ---- Yazı Olasılıgı: 48.58
Atıs Sayısı: 4096 ---- Yazı Olasılıgı: 49.49
Atıs Sayısı: 8192 ---- Yazı Olasılıgı: 49.58
Atıs Sayısı: 16384 ---- Yazı Olasılıgı: 49.96
Atıs Sayısı: 32768 ---- Yazı Olasılıgı: 50.00
Atıs Sayısı: 65536 ---- Yazı Olasılıgı: 49.68
Atıs Sayısı: 131072 ---- Yazı Olasılıgı: 49.97
Atıs Sayısı: 262144 ---- Yazı Olasılıgı: 50.13
Atıs Sayısı: 524288 ---- Yazı Olasılıgı: 50.01
Atıs Sayısı: 1048576 ---- Yazı Olasılıgı: 50.09


## Binom Dağılımı

${\displaystyle f(k;n,p)={n \choose k}p^{k}(1-p)^{n-k}}$, k = 0, 1, 2, ...,n


${\displaystyle \operatorname {E} (X)=np}$


${\displaystyle \operatorname {Var} (X)=np(1-p)}$

 * İş Uygulaması: Reklam Harcaması Optimizasyonu 
* Problem: Reklamların tıklanma ve geri donusum oranları optımıze edılmeye çalısılıyor. Buna yonelık olarak belirli bir mecrada çeşitli senaryolara gore reklama tıklama olasılıkları hesaplanmak istenıyor.
* Dağılım ve reklama tıklama olasılıgı biliniyor(0.01)
* Soru : Reklamı 100 kişi gordugunde 1,5,10 tıklanması olasılıgı nedır?

In [7]:
from scipy.stats import binom

In [8]:
p = 0.01
n = 100
rv = binom(n, p)
print(rv.pmf(1))
print(rv.pmf(5))
print(rv.pmf(10))

0.36972963764971983
0.0028977871237616114
7.006035693977161e-08


## Poisson Dağılımı

${\displaystyle f(x,\lambda )={\frac {\lambda ^{x}e^{-\lambda }}{x!}}\,\!}$,  x =
0,1,2,...,n

* İş Uygulaması : İlan Girisi Hata Olasılıklarının Hesaplanması

* Problem : Hatalı ilan girişi olasılıkları hesaplanmak isteniyor.
* Detaylar : 
    * Bir yıl sürecinde ölçümler yaplıyor.
    * Poisson dağılımında ve lambda 0.1 
    * Hiç hata olmaması, 3 ve 5 hata olması olasılıkları nedir?

In [9]:
from scipy.stats import poisson

In [10]:
lambda_ = 0.1

In [11]:
rv = poisson(mu = lambda_)
print(rv.pmf(k = 0))

0.9048374180359595


In [12]:
print(rv.pmf(k = 3))

0.00015080623633932676


In [13]:
print(rv.pmf(k = 5))

7.54031181696634e-08


## Normal Dağılım

${\displaystyle f(x\mid \mu ,\sigma ^{2})={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}e^{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}}$

* $\mu$  ortalama ya da dağılımın beklenen değeri

* ${\displaystyle \sigma }$  standart sapma

* ${\displaystyle \sigma ^{2}}$ varyans

* İş Uygulaması : Ürün Satış Olasılıklarının Hesaplanması

* Problem : Bir yatırım/toplantı oncesinde gelecek ay ile ilgili satısların belirli değerlerde gercekleşmesi olasılıgı

* Detaylar:
    * Dağılımın normal oldugu biliniyor
    * Aylık ortalama satış sayısı 80K, standart sapması 5K
    * 90K dan fazla satış yapma olasılıgı nedır?

In [14]:
from scipy.stats import norm

In [15]:
#90'dan fazla olması 
1-norm.cdf(90, 80, 5)

0.02275013194817921

In [16]:
#70'den fazla olması
1-norm.cdf(70, 80, 5)

0.9772498680518208

In [17]:
#73'den az olması
norm.cdf(73, 80, 5)

0.08075665923377107

In [18]:
#85 ile 90 arasında olması
norm.cdf(90, 80, 5) - norm.cdf(85, 80, 5)

0.13590512198327787