### 问题
1. 定量分析外国（欧洲、美国）经济政策对中国宠物食品行业发展的影响
2. 基于量化结果，为中国宠物食品行业可持续发展提供策略

### 解决方案
针对法国，美国，德国选择一个贸易转折点事件，来评估事件对中国宠物食品行业发展的影响。

采用DID模型，处理组是美德法，对照组是马来西亚，根据事件发生时间采集量化数据，进而评估政策的影响。

量化评价数据如下：
- 出口量（kg）
- 出口额（美元）

In [24]:
import pandas as pd
import statsmodels.api as sm
import statsmodels.formula.api as smf

# 导入美国和德国的数据
usa = pd.read_excel("./data/q4.xlsx", sheet_name="America")
germany = pd.read_excel("./data/q4.xlsx", sheet_name="German")
france = pd.read_excel("./data/q4.xlsx", sheet_name="France")

In [25]:
# 定义一个函数来处理数据和建立模型
def process_data(df, country_name):
    # 将时间转换为日期格式
    df['time'] = pd.to_datetime(df['time'], format='%Y%m')
    
    # 添加交互项
    df['treated'] = df['group'].apply(lambda x: 1 if x == 'treatment' else 0)
    df['treated_post'] = df['treated'] * df['policy']
    
    # 对出口量建立DID模型
    model_amount = smf.ols('export_amount ~ treated + policy + treated_post', data=df).fit()
    
    # 对出口值建立DID模型
    model_value = smf.ols('export_value ~ treated + policy + treated_post', data=df).fit()
    
    # 输出模型结果
    print(f"Results for {country_name}:")
    print(model_amount.summary())
    print(model_value.summary())
    
    # 导出模型结果为CSV和LaTeX
    # 从summary中提取表格数据
    results_table_amount = model_amount.summary().tables[1]
    results_table_value = model_value.summary().tables[1]
    
    # 转换为DataFrame
    df_results_amount = pd.DataFrame(results_table_amount.data[1:], columns=results_table_amount.data[0])
    df_results_value = pd.DataFrame(results_table_value.data[1:], columns=results_table_value.data[0])
    
    # 将DataFrame写入CSV文件
    df_results_amount.to_csv(f'./results/Q4/{country_name}_regression_results_amount.csv', index=False)
    df_results_value.to_csv(f'./results/Q4/{country_name}_regression_results_value.csv', index=False)
    
    # 将summary写入LaTeX文件
    summary_latex_amount = model_amount.summary().as_latex()
    summary_latex_value = model_value.summary().as_latex()
    
    with open(f'./results/Q4/{country_name}_regression_summary_amount.tex', 'w') as file:
        file.write(summary_latex_amount)
    with open(f'./results/Q4/{country_name}_regression_summary_value.tex', 'w') as file:
        file.write(summary_latex_value)

In [26]:
# 处理美国数据
process_data(usa, "USA")

# 处理德国数据
process_data(germany, "German")

# 处理法国数据
process_data(france, "France")

Results for USA:
                            OLS Regression Results                            
Dep. Variable:          export_amount   R-squared:                       0.828
Model:                            OLS   Adj. R-squared:                  0.816
Method:                 Least Squares   F-statistic:                     70.56
Date:                Sat, 23 Nov 2024   Prob (F-statistic):           7.55e-17
Time:                        22:27:30   Log-Likelihood:                -709.39
No. Observations:                  48   AIC:                             1427.
Df Residuals:                      44   BIC:                             1434.
Df Model:                           3                                         
Covariance Type:            nonrobust                                         
                   coef    std err          t      P>|t|      [0.025      0.975]
--------------------------------------------------------------------------------
Intercept     4.391e+05   1.91e

