### **Solutions for "Bank Transaction" Question**

In [2]:
import numpy as np
import pandas as pd

In [3]:
df_bank = pd.read_csv('bank_transaction_time.csv')
df_bank

Unnamed: 0,transaction_time,customer_count
0,7-11,4
1,12-16,15
2,17-21,6
3,22-26,0
4,26-30,2


**Part 1 : หาค่า Mean**

สูตรหา Mean ของข้อมูลจัดกลุ่ม : $$\bar{x}=\frac{\sum_{i=1}^{g}f_i x_i}{n}$$

In [4]:
boundary = df_bank.transaction_time.str.split('-', expand=True).astype(int)
midpoint = (boundary[0] + boundary[1])/2
mean_bank = sum(df_bank.customer_count*midpoint)/sum(df_bank.customer_count)
print(f'Mean = {mean_bank}')

Mean = 15.407407407407407


**Part 2 : หาค่ามัธยฐาน**

สูตรหา Median ของข้อมูลจัดกลุ่ม : $$M_e=L_e+\frac{\frac{n}{2}-\sum_{b=1}^{e}f_b}{f_e}\cdot I$$

In [5]:
df_bank['cum_customer'] = df_bank.customer_count.cumsum()
n_half = sum(df_bank.customer_count)/2
e = df_bank[df_bank['cum_customer'] >= n_half].index[0]
Le = boundary[0][e] - 0.5
fe = df_bank.customer_count[e]
I = np.ceil(16.5-11.5)
median_bank = Le + ((n_half-df_bank.cum_customer[e-1])/fe)*I
print(f'Median = {median_bank}')

Median = 14.666666666666666


**Part 3 : หาค่าฐานนิยม**

สูตรหา Mode ของข้อมูลจัดกลุ่ม : $$M_o=L_e+\frac{d_{e-1}}{d_{e-1}+d_{e+1}}\cdot I$$

In [6]:
# ในกรณีนี้ e กับ Le เท่ากับของ Med เลยใช้ตัวแปรซ้ำเอา
d_prev = np.abs(df_bank.customer_count[e] - df_bank.customer_count[e-1])
d_next = np.abs(df_bank.customer_count[e] - df_bank.customer_count[e+1])

mode_bank = Le + (d_prev/(d_prev+d_next))*I
print(f'Mode = {mode_bank}')

Mode = 14.25


**Part 4 : หาค่าส่วนเบี่ยงเบนมาตรฐาน**

สูตรหา S.D. ของข้อมูลจัดกลุ่ม (ประชากร) : $$s=\sqrt{\frac{\sum_{i=1}^{n}f_ix^2_i-n\bar{x}^2}{n-1}}$$

In [7]:
sum_fx2 = sum(df_bank.customer_count*midpoint**2)
variance_bank = (sum_fx2-sum(df_bank.customer_count)*mean_bank**2)/(sum(df_bank.customer_count)-1)
sd_bank = np.sqrt(variance_bank)

print(f'S.D. = {sd_bank}')

S.D. = 4.75765989067395


**Part 5 : หาค่า P<sub>80</sub>**

สูตรหาตำแหน่งเปอร์เซนไทล์ของข้อมูลจัดกลุ่ม : $$\mathrm{index\,of\,} P_r=\frac{nr}{100}$$
สูตรหาค่าเปอร์เซนไทล์ของข้อมูลจัดกลุ่ม : $$P_r=L_e+\frac{\frac{nr}{100}-\sum_{b=1}^{e-1}f_b}{f_e}I$$

In [8]:
index_p80 = sum(df_bank.customer_count)*80/100 # index_p80 = 21.6 (e=2)
e_p80 = 2
Le_p80 = boundary[0][e_p80] - 0.5

P80 = Le_p80 + (index_p80-df_bank.cum_customer[e_p80-1])/(df_bank.customer_count[e_p80])*I

print(f'P80 = {P80}')

P80 = 18.666666666666668
