# Causal Impact

In [None]:
# !pip install pycausalimpact

## 1. 데이터 준비
먼저, 데이터를 로드하고 날짜 형식을 변환합니다.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
from causalimpact import CausalImpact

# 데이터 로드
data = pd.read_csv("time-series.csv")
data['date'] = pd.to_datetime(data['date'])

treatment_date = pd.to_datetime('2023-06-30')

## 2. CausalImpact 분석을 위한 데이터 준비

In [None]:
# Factory A와 B의 데이터 분리
factory_a = data[data['factory'] == 'Factory A'].set_index('date')['productivity']
factory_b = data[data['factory'] == 'Factory B'].set_index('date')['productivity']

# CausalImpact 분석을 위한 데이터 준비
impact_data = pd.concat([factory_a, factory_b], axis=1)
impact_data.columns = ['Factory_A', 'Factory_B']

impact_data.head()

## 3. 분석 기간 설정
분석 기간을 설정합니다. pre_period는 조치 이전의 기간을, post_period는 조치 이후의 기간을 나타냅니다.

In [None]:
# 분석 기간 설정
pre_period = [str(impact_data.index.min().date()), str((impact_data.index[impact_data.index < treatment_date].max().date()))]
post_period = [str(treatment_date.date()), str(impact_data.index.max().date())]

## 4. CausalImpact 분석 실행


`CausalImpact`는 구글에서 개발한 R 패키지로, 특정 시점에 발생한 조치나 이벤트의 영향을 시계열 데이터를 통해 분석하는 도구입니다. 이 패키지는 이후에 Python으로도 이식되어 동일한 기능을 제공합니다. 주요 기능은 다음과 같습니다:

- **전처리 및 후처리 구간의 설정**: 조치 전후의 데이터를 비교하여 효과를 추정합니다.
- **상관 관계를 활용한 조정**: 여러 시계열 데이터를 활용하여 분석의 정확성을 높입니다.
- **베이지안 구조적 시계열 모델**: 베이지안 접근법을 통해 불확실성을 반영한 예측과 추정을 제공합니다.

`CausalImpact`는 두 가지 주요 단계를 통해 조치의 영향을 평가합니다:
1. **사전(Pre) 기간 설정**: 조치가 시행되기 전의 기간을 설정합니다.
2. **사후(Post) 기간 설정**: 조치가 시행된 후의 기간을 설정합니다.

이를 통해 조치 전후의 변화를 분석하여 조치의 효과를 추정할 수 있습니다.

In [None]:
# CausalImpact 분석 실행
ci = CausalImpact(impact_data, pre_period, post_period)

위의 코드에서 `CausalImpact` 객체를 생성할 때, `impact_data`, `pre_period`, `post_period` 세 가지 인수를 전달합니다.
- `impact_data`: 분석할 시계열 데이터입니다. 여기서는 Factory A와 Factory B의 생산성 데이터를 포함합니다.
- `pre_period`: 조치가 시행되기 전의 기간입니다. 이 기간 동안의 데이터를 사용하여 모델을 학습하고, 조치가 없었을 때의 예측값을 생성합니다.
- `post_period`: 조치가 시행된 후의 기간입니다. 이 기간 동안의 실제 데이터를 사용하여 조치의 효과를 평가합니다.

In [None]:
# 결과 출력
print(ci.summary())
print(ci.summary(output='report'))

`CausalImpact` 객체의 `summary` 메소드는 분석 결과의 요약을 출력합니다. `summary(output='report')` 메소드는 더 자세한 보고서를 출력합니다.

- `ci.summary()`: 조치의 전반적인 영향을 요약합니다. 주요 통계치와 추정된 효과가 포함됩니다.
- `ci.summary(output='report')`: 조치의 영향을 보다 자세히 설명하는 보고서를 출력합니다. 이 보고서는 분석 방법, 데이터 설명, 결과 해석 등을 포함합니다.

이 두 개의 출력은 조치의 효과를 이해하는 데 중요한 정보를 제공합니다. 요약 정보는 빠르게 전체적인 결과를 파악하는 데 유용하고, 자세한 보고서는 심층적인 분석과 설명을 제공합니다.

## 5. 결과 시각화
분석 결과를 시각화합니다.

In [None]:
ci.plot()
plt.show()

In [None]:
# 원본 데이터 시각화
plt.figure(figsize=(12, 6))
plt.plot(factory_a.index, factory_a.values, label='Factory A')
plt.plot(factory_b.index, factory_b.values, label='Factory B')
plt.axvline(treatment_date, color='r', linestyle='--', label='Treatment Date')
plt.legend()
plt.title('Factory Productivity Over Time')
plt.xlabel('Date')
plt.ylabel('Productivity')
plt.show()

### 추가 참고 자료

[Causal Impact 좀 더 정확한 효과 측정을 위한 방법론](https://hweejin.tistory.com/entry/Causal-Impact-%EC%A2%80-%EB%8D%94-%EC%A0%95%ED%99%95%ED%95%9C-%ED%9A%A8%EA%B3%BC-%EC%B8%A1%EC%A0%95%EC%9D%84-%EC%9C%84%ED%95%9C-%EB%B0%A9%EB%B2%95%EB%A1%A0)

[CausalImpact로 COVID-19 데이터를 분석해보자](https://playinpap.github.io/causalimpact-covid19/)

[Causal Impact - Getting Started](https://nbviewer.org/github/jamalsenouci/causalimpact/blob/master/GettingStarted.ipynb)


