# 데이터 분석 실무
## 파이썬 라이브러리를 활용해서 통계 기법을 적용한 데이터 분석을 배우는 과정입니다.

#### 가설검정 1 : 광고 효과 검정

* 지금부터 간단한 예시코드를 중심으로 데이터 분석 실습을 진행하겠습니다.

* 광고 효과 검정을 위한 가상 데이터셋을 만들어보겠습니다.
* A통신사에서는 A와 B 광고 두 가지를 진행했는데요. 각 광고의 클릭율을 임의로 만들었습니다.

    * clicks_a: A광고의 10일간 클릭률 데이터
    * clicks_b: B광고의 10일간 클릭률 데이터

* 두 개의 집단간 평균 차이로 t-test를 활용해서 가설을 검정해보겠습니다.

##### 0. 필요 라이브러리 불러오기

In [1]:
import numpy as np
import scipy.stats as stats

##### 1. 데이터 생성

In [2]:
# 광고 A와 광고 B의 클릭률 데이터
clicks_a = np.array([100, 120, 90, 110, 130, 140, 95, 105, 115, 125])
clicks_b = np.array([80, 90, 95, 100, 110, 120, 85, 95, 105, 115])

##### 2. 가설설정

In [3]:
# 귀무가설: 광고 A와 광고 B의 클릭률은 같다.
# 대립가설: 광고 A와 광고 B의 클릭률은 다르다.
# 유의수준: 0.05 (95% 신뢰수준)

##### 3. 검정통계량 계산

In [4]:
# 검정통계량 계산 (평균 차이)
mean_a = np.mean(clicks_a)
mean_b = np.mean(clicks_b)
test_statistic = mean_a - mean_b


In [5]:
# p-value 계산 (양측 검정)
t_statistic, p_value = stats.ttest_ind(clicks_a, clicks_b)

##### 4. 결과 출력

In [6]:
# 결과 출력
print("검정통계량: {:.2f}".format(test_statistic))
print("p-value: {:.4f}".format(p_value))

검정통계량: 13.50
p-value: 0.0532


![image.png](attachment:image.png)
* 출처 : 네이버 지식백과(https://terms.naver.com/entry.naver?cid=47324&docId=3338150&categoryId=47324)

##### 5. 결과 해석

In [7]:
# 가설 검정 결과 해석
alpha = 0.05
if p_value < alpha:
    print("p-value가 유의수준보다 작으므로 귀무가설을 기각합니다.")
    print("따라서, 광고 A와 광고 B의 클릭률은 다르다고 할 수 있습니다.")
else:
    print("p-value가 유의수준보다 크거나 같으므로 귀무가설을 채택합니다.")
    print("따라서, 광고 A와 광고 B의 클릭률은 같다고 할 수 있습니다.")

p-value가 유의수준보다 크거나 같으므로 귀무가설을 채택합니다.
따라서, 광고 A와 광고 B의 클릭률은 같다고 할 수 있습니다.
