# 데이터 분석 실무
## 파이썬 라이브러리를 활용해서 통계 기법을 적용한 데이터 분석을 배우는 과정입니다.

#### 가설검정 2-1 : 평균 주문 금액 가설 검정(일표본 T-Test)

* 지금부터 간단한 예시코드를 중심으로 데이터 분석 실습을 진행하겠습니다.

* 평균 주문 금액에 대한 가설 검정을 위한 가상 데이터셋을 만들어보겠습니다.
* A 온라인 쇼핑몰에서는 고객당 평균 주문 금액이 어떻게 되나 궁금합니다. 고객별 주문 금액을 임의로 만들었습니다.

    * order_amounts: 고객별 주문 금액

* 평균 주문금액을 t-test를 활용해서 가설을 검정해보겠습니다.

##### 0. 필요 라이브러리 불러오기

In [1]:
import numpy as np
from scipy.stats import ttest_1samp

##### 1. 데이터 생성

In [2]:
# 주문 금액 데이터 (예시)
order_amounts = [95, 110, 98, 102, 105, 97, 99, 90, 105, 103]

##### 2. 가설설정

In [3]:
# 귀무가설(H0): 평균 주문 금액은 $100이다.
# 대립가설(H1): 평균 주문 금액은 $100이 아니다.
# 유의수준: 0.05 (95% 신뢰수준)

In [4]:
# 주문 금액의 평균은?
np.mean(order_amounts)

100.4

In [5]:
# 귀무가설에 설정한 값
null_value = 100

##### 3. 검정통계량 계산

In [6]:
# 일표본 t-검정 수행
t_statistic, p_value = ttest_1samp(order_amounts, null_value)

##### 4. 결과 출력

In [7]:
# 결과 출력
print("일표본 t-검정 결과:")
print("검정통계량 (t-statistic):", t_statistic)
print("유의확률 (p-value):", p_value)

일표본 t-검정 결과:
검정통계량 (t-statistic): 0.2189431095506511
유의확률 (p-value): 0.8315788730165952


##### 5. 결과 해석

In [8]:
# 유의수준 설정
alpha = 0.05

# 유의확률과 유의수준 비교
if p_value < alpha:
    print("귀무가설을 기각합니다. 평균 주문 금액은 $100이 아닙니다.")
else:
    print("귀무가설을 채택합니다. 평균 주문 금액은 $100입니다.")

귀무가설을 채택합니다. 평균 주문 금액은 $100입니다.


#### 가설검정 2-2 : 약품의 효과 검증(독립표본 T-Test)

* 지금부터 간단한 예시코드를 중심으로 데이터 분석 실습을 진행하겠습니다.

* 약품의 효과 검증을 위한 가상 데이터셋을 만들어보겠습니다.
* A 제약회사에서는 신약의 효과 검증이 궁금합니다. 투약한 그룹과 투약하지 않은 그룹의 수치를 임의로 만들었습니다.

    * group1: 투약한 그룹의 수치
    * group2: 투약하지 않은 그룹의 수치


* 약품의 효과를 t-test를 활용해서 검증해보겠습니다.

##### 0. 필요 라이브러리 불러오기

In [9]:
import numpy as np
from scipy.stats import ttest_ind

##### 1. 데이터 생성

In [10]:
# 두 그룹의 데이터
group1 = [18, 20, 21, 19, 22, 25, 23, 20, 19, 21]
group2 = [16, 18, 19, 17, 20, 21, 19, 17, 18, 20]

##### 2. 가설설정

In [11]:
# 귀무가설(H0): 두 그룹의 평균의 차이가 없을 것이다.
# 대립가설(H1): 두 그룹의 평균의 차이가 있을 것이다.
# 유의수준: 0.05 (95% 신뢰수준)

##### 3. 검정통계량 계산

In [12]:
# 독립표본 t-검정
t_statistic, p_value = ttest_ind(group1, group2)

##### 4. 결과 출력

In [13]:
# 결과 출력
print("독립표본 t-검정 결과:")
print("검정통계량 (t-statistic):", t_statistic)
print("유의확률 (p-value):", p_value)

독립표본 t-검정 결과:
검정통계량 (t-statistic): 2.7688746209726927
유의확률 (p-value): 0.012651999684642933


##### 5. 결과 해석

In [14]:
# 결과 해석
alpha = 0.05
if p_value < alpha:
    print("귀무가설을 기각합니다. 두 그룹의 평균은 차이가 있습니다.")
else:
    print("귀무가설을 채택합니다. 두 그룹의 평균은 차이가 없습니다.")

귀무가설을 기각합니다. 두 그룹의 평균은 차이가 있습니다.


#### 가설검정 2-3 : 약품의 효과 검증(대응표본 T-Test)

* 지금부터 간단한 예시코드를 중심으로 데이터 분석 실습을 진행하겠습니다.

* 약품의 효과 검증을 위한 가상 데이터셋을 만들어보겠습니다.
* A 제약회사에서는 신약의 효과 검증이 궁금합니다. 하나의 그룹에 투약 전과 후로 나누어 수치를 임의로 만들었습니다.

    * before: 투약 전 수치
    * after: 투약 후 수치


* 약품의 효과를 t-test를 활용해서 검증해보겠습니다.

##### 0. 필요 라이브러리 불러오기

In [15]:
import numpy as np
from scipy.stats import ttest_rel

##### 1. 데이터 생성

In [16]:
# 약품 투여 전 데이터
before = [18, 20, 21, 19, 22, 25, 23, 20, 19, 21]

# 약품 투여 후 데이터
after = [16, 17, 18, 16, 19, 20, 18, 16, 17, 19]

##### 2. 가설설정

In [17]:
# 귀무가설(H0): 투약 전/후 평균의 차이가 없을 것이다.
# 대립가설(H1): 투약 전/후 평균의 차이가 있을 것이다.
# 유의수준: 0.05 (95% 신뢰수준)

##### 3. 검정통계량 계산

In [18]:
# 대응표본 t-검정
t_statistic, p_value = ttest_rel(before, after)

##### 4. 결과 출력

In [19]:
# 결과 출력
print("대응표본 t-검정 결과:")
print("검정통계량 (t-statistic):", t_statistic)
print("유의확률 (p-value):", p_value)

대응표본 t-검정 결과:
검정통계량 (t-statistic): 8.91337623249849
유의확률 (p-value): 9.240368318307187e-06


##### 5. 결과 해석

In [20]:
# 결과 해석
alpha = 0.05
if p_value < alpha:
    print("귀무가설을 기각합니다. 약품 투여 전과 후의 평균은 차이가 있습니다.")
else:
    print("귀무가설을 채택합니다. 약품 투여 전과 후의 평균은 차이가 없습니다.")

귀무가설을 기각합니다. 약품 투여 전과 후의 평균은 차이가 있습니다.
