In [3]:
import pandas as pd
import dowhy
from dowhy import CausalModel
from dowhy.datasets import linear_dataset

# 第1步：创建模拟数据
# 在实际项目中，你会用自己的真实数据
data = linear_dataset(
    beta=10, 
    num_common_causes=2, 
    num_instruments=0, 
    num_effect_modifiers=0, 
    num_treatments=1, 
    num_samples=1000, 
    treatment_is_binary=True
)

df = data["df"]
# 重命名列，让代码更易读
df.rename(columns={
    'v0': 'customer_age',
    'v1': 'customer_location',
    'y': 'customer_spend',
    'W0': 'marketing_campaign'
}, inplace=True)


# 第2步：模型建立 (Model)
# 这一步定义因果问题，并构建因果图
model = CausalModel(
    data=df,
    treatment='marketing_campaign',
    outcome='customer_spend',
    common_causes=['customer_age', 'customer_location']
)


# 第3步：识别因果效应 (Identify)
# 这一步基于因果图，确定可以识别因果效应的变量组合
identified_estimand = model.identify_effect()
print(identified_estimand)


# 第4步：估计因果效应 (Estimate)
# 这一步使用统计方法来估计因果效应
causal_estimate = model.estimate_effect(
    identified_estimand,
    method_name="backdoor.linear_regression"  # <-- 请改回这个
)

print(f"因果效应的估计值为: {causal_estimate.value}")


# 第5步：反驳与验证 (Refute)
# 这一步是验证结果是否稳健
# 我们可以用随机安慰剂变量来测试，看看结果是否一致
refutation = model.refute_estimate(
    identified_estimand, 
    causal_estimate,
    method_name="random_common_cause"
)

print(refutation)

Estimand type: EstimandType.NONPARAMETRIC_ATE

### Estimand : 1
Estimand name: backdoor
No such variable(s) found!

### Estimand : 2
Estimand name: iv
No such variable(s) found!

### Estimand : 3
Estimand name: frontdoor
No such variable(s) found!





IndexError: list index out of range