# Golf Ball Test

골프공 제조 회사에서 새로운 코팅법으로 골프공을 제조한다.   
그러나 새롭게 코팅된 골프공이 기존보다 driving 거리가 평균적으로 낮게 측정되었다고 한다.   
이것이 유의미한 변화인지 확인해보자.

In [19]:
import numpy as np
import pandas as pd
import statsmodels.api as sm
import scipy.stats.distributions as dist

In [4]:
df = pd.read_csv('Golf.csv')
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 40 entries, 0 to 39
Data columns (total 2 columns):
 #   Column   Non-Null Count  Dtype
---  ------   --------------  -----
 0   Current  40 non-null     int64
 1   New      40 non-null     int64
dtypes: int64(2)
memory usage: 768.0 bytes


In [5]:
df.head()

Unnamed: 0,Current,New
0,264,277
1,261,269
2,267,263
3,272,266
4,258,262


In [8]:
n1 = df.Current.count()
n2 = df.New.count()
(n1, n2)

(40, 40)

In [15]:
mu1 = df.Current.mean()
mu2 = df.New.mean()
std1 = np.std(df.Current, ddof=1)
std2 = np.std(df.New, ddof=1)

(mu1, mu2, std1, std2)

(270.275, 267.5, 8.752984838884597, 9.896904462947894)

In [16]:
mu_diff = mu1 - mu2
se = np.sqrt((1/n1 + 1/n2)*(((n1-1)*(std1**2))+((n2-1)*(std2**2)))/(n1+n2-2))
(mu_diff, se)

(2.7749999999999773, 2.08903962108466)

In [17]:
t_stat = mu_diff/se
t_stat

1.3283615935245674

In [20]:
p_value = 2 * dist.norm.cdf(-np.abs(t_stat))
p_value

0.18405868087594712

#### statsmodel

In [12]:
sm.stats.ttest_ind(df.Current, df.New)

(1.3283615935245674, 0.18793228491854674, 78.0)

# Interpretation
   
귀무가설 : 두 골프공의 driving 거리 차이가 없다.   
대립가설 : 두 골프공의 driving 거리 차이가 있다.   
   
p_value가 0.05보다 크기 때문에 유의수준 0.05에서 귀무가설을 기각할 수 없다.   
귀무가설에 따라 두 골프공의 driving 거리의 차이는 유의하지 않다.