# <font color='DE1509'>**การแจกแจงความน่าจะเป็น (Probability Distribution)**</font>

---

In [1]:
import numpy as np
import pandas as pd
import statistics
from scipy import stats
from math import perm, comb

####  
####  5.4 มหาวิทยาลัยแห่งหนึ่งมี server สำหรับการ login ทั้งหมด 3 node เมื่อทำการวิเคราะห์ข้อมูลที่ได้จาก log พบว่า วันจันทร์ในช่วงเวลา 8:00 - 9:30 น. จะมีจำนวน login node ที่ยังสามารถทำการเชื่อมต่อกับ server หลักได้ คือ 0, 1, 2, 3 ด้วยความน่าจะเป็น 0.99, 0.05, 0.03 และ 0.01 ตามลำดับ จงหาจำนวน login node ที่ยังสามารถทำการเชื่อมต่อกับ server หลักได้โดยเฉลี่ย และความแปรปรวนของจำนวน login node ที่ยังสามารถทำการเชื่อมต่อกับ server หลักได้ในช่วงเวลาดังกล่าว

P(X=x) \
จำนวน login node ที่ยังสามารถทำการเชื่อมต่อกับ server หลักได้โดยเฉลี่ย = ค่าความคาดหวัง E(X) **= Sum(X * p(x))**

In [2]:
X = np.array(range(4)) # all possible values of X
PX = np.array([0.99, 0.05, 0.03, 0.01]) # probabilities of X
EX = sum(X*PX)
EX

0.14

\
ความแปรปรวนของจำนวน login node ที่ยังสามารถทำการเชื่อมต่อกับ server หลักได้ \
- ค่าความแปรปรวน V(X) or (mu)^2 **= Sum((X<sup>2</sup> * PX) - Ex<sup>2</sup>)** 'ผลรวมของค่า'

In [3]:
EX2 = sum(X**2*PX)
print(EX2) # E(X^2)
VX = EX2 - EX**2
VX

0.26


0.2404

#### 5.6 สามีภรรยาวางแผนจะมีบุตร 4 คน ถ้าในการมีบุตรแต่ละครั้งจะได้บุตรชายหรือหญิงด้วยความเป็นไปได้เท่าเทียมกัน จงหาความน่าจะเป็นที่จะได้  
-บุตรชาย 1 คน  
-บุตรชาย 1 คนขึ้นไป  

\
บุตรชาย 1 คน:

In [4]:
stats.binom.pmf(p=0.5,
                n=4,
                k=1)

0.24999999999999994

\
บุตรชาย 1 คนขึ้นไป:

In [5]:
sum([stats.binom.pmf(p=0.5, n=4, k=i) for i in range(1, 5)])

0.9375000000000001

หรือ

In [6]:
1-stats.binom.pmf(p=0.5, n=4, k=0)

0.9375

####  
#### 5.7 ในการส่งผลไม้ไปขายยังตลาดต่างประเทศ ผู้ส่งออกใช้การขนส่งทางอากาศเพื่อความรวดเร็วและทำให้ผลไม้ไม่เสียหายหรือสุกงอมก่อนเวลา จากประสบการณ์ในอดีตพบว่าการส่งออกมะม่วงสุกมีโอกาสที่มะม่วงจะเน่าเสีย 5% จากการสุ่มตัวอย่างมะม่วงที่ส่งไปขายที่ประเทศญี่ปุ่นจำนวน 8 กล่อง จงหาความน่าจะเป็นที่ มีมะม่วงเน่าเสียตั้งแต่ 1 ถึง 3 กล่อง

In [7]:
sum([stats.binom.pmf(p=0.05, n=8,k=i) for i in range(1, 4)])

0.33620781734375

## Possion Distribution

####  
#### 5.9 เมื่อทำการเก็บข้อมูลจากไฟล์ log ของ Server เครื่องหนึ่งพบว่าจะทำงานขัดข้องโดยเฉลี่ยเดือนละ 3 ครั้ง ในทุกๆเดือน จงหา  
- ความน่าจะเป็นที่ server จะทำงานขัดข้อง 2 ครั้ง  
- ความน่าจะเป็นที่ server จะทำงานขัดข้องไม่เกิน 2 ครั้ง


ความน่าจะเป็นที่ server จะทำงานขัดข้อง 2 ครั้ง:  

In [8]:
stats.poisson.pmf(k=2, mu=3) #k คือ x ในสูตร, mu คือ λ ในสูตร

0.22404180765538775

\
ความน่าจะเป็นที่ server จะทำงานขัดข้องไม่เกิน 2 ครั้ง:

In [9]:
sum([stats.poisson.pmf(k=i, mu=3) for i in range(3)])

0.42319008112684353

####  
#### 5.10 พนักงานรับโทรศัพท์ ณ สำนักงานแห่งหนึ่งจะรับโทรศัพท์โดยเฉลี่ยวันละ 14 ครั้ง  
- จงหาความน่าจะเป็นที่พนักงานรับโทรศัพท์ไม่น้อยกว่า 10 ครั้งในวันพรุ่งนี้  
- ถ้าในเดือนหน้า บริษัทดังกล่าวทำงาน 20 วันคาดว่าจะมีกี่วันที่พนักงานรับโทรศัพท์ไม่น้อยกว่า 10 ครั้ง  




จงหาความน่าจะเป็นที่พนักงานรับโทรศัพท์ไม่น้อยกว่า 10 ครั้งในวันพรุ่งนี้:

In [10]:
1 - sum([stats.poisson.pmf(k=i, mu=14) for i in range(10)])

0.8906006303572611

\
ถ้าในเดือนหน้า บริษัทดังกล่าวทำงาน 20 วันคาดว่าจะมีกี่วันที่พนักงานรับโทรศัพท์ไม่น้อยกว่า 10 ครั้ง

In [11]:
p_10plus = 1 - sum([stats.poisson.pmf(k=i, mu=14) for i in range(11)])
p_10plus * 20

16.486375742358312

# Continuous Probability Distribution

> - Normal Distribution \
> - Exponential Distribution \
> - t-Distribution \
> - Uniform Distribution

## Normal Distribution

**1. หาค่าตัวแปรสุ่มจากความน่าจะเป็นที่จะเกิดขึ้นได้**\

- ***P(Z = z) : Probability Density Function (PDF)**

> **scipy.pdf(x, loc, scale)**\
>*x* : array_like quantiles\
>*loc* : array_like, optional location parameter (default=0)\
>*scale* : array_like, optional scale parameter (default=1)\

- ***P(Z <= z) : Cumulative Distribution Function (CDF)**
> **scipy.cdf(x, loc, scale)**\
>*x* : array_like quantiles\
>*loc* : array_like, optional location parameter (default=0)\
>*scale* : array_like, optional scale parameter (default=1)\

In [12]:
pdf_vale = stats.norm.pdf(x=0)
cdf_vale = stats.norm.cdf(x=0)

print("-",pdf_vale)
print("-",cdf_vale)

- 0.3989422804014327
- 0.5


**2. หาค่าตัวแปรสุ่มจากความน่าจะเป็นสะสม**
***P(Z = z) : Probability Density Function (PDF)**

**scipy.norm.*ppf(p, loc, scale)***
> *p* : lower tail probability\
> *loc* : array_like, optional location parameter (default=0)\
> *scale* : array_like, optional scale parameter (default=1)



In [13]:
'''
P(Z < a) = 0.9
a = ?
'''
ppf = stats.norm.ppf(q=0.9)
print(ppf)

1.2815515655446004


## t-Distribution

##### 1. การใช้ scipy กับการแจกแจงแบบที

- ***P(T = t) : Probability Density Function (PDF)**

> **scipy.t.pdf(x, loc, scale)**\
>*x* : array_like quantiles\
>*df* : array_like, optional degrees of freedom (default=1)\
>*loc* : array_like, optional location parameter (default=0)\
>*scale* : array_like, optional scale parameter (default=1)\

In [14]:
pdf_t = stats.t.pdf(0, df=10)
pdf_t

0.3891083839660311

- ***P(T < t) : Cumulative Distribution Function (CDF)**
> **scipy.t.cdf(x, loc, scale)**\
>*x* : array_like quantiles\
>*df* : array_like, optional degrees of freedom (default=1)\
>*loc* : array_like, optional location parameter (default=0)\
>*scale* : array_like, optional scale parameter (default=1)\

In [15]:
cdf_t = stats.t.df(0, df=10)
cdf_t

0.5

**2. หาค่าตัวแปรสุ่มจากความน่าจะเป็นสะสม**

**scipy.norm.*ppf(p, df=1, ...)***
> *p* : lower tail probability\
> *df* : array_like, optional degrees of freedom (default=1)\
> *loc* : array_like, optional location parameter (default=0)\
> *scale* : array_like, optional scale parameter (default=1)