# 基础概念

## 事件定义

“事件驱动策略”（Event-Driven Strategy）是在提前挖掘和深入分析可能造成股价异常波动的事件基础上，通过充分把握交易时机获取超额投资回报的投资策略。
“事件驱动策略”的“事件”是指具有较为明确的时间和内容，能够对部分投资者的投资行为产生一定的影响，从而决定股价短期波动的因素。

## 事件分类

证券市场事件按照影响面的大小可分为三类：全市场事件、行业事件和个股事件


## 事件研究方法

**事件研究**: 指运用金融市场的数据资料来测定某一特定经济事件对一公司价值的影响

学术界的事件研究(Event Study)开始很早，最早可以追溯到 Dolly(1933)关于拆股后股价表现的研究(Campbell(1997))。Fama 等人 1969 年的报告奠定了围绕事件日前后个股平均累积异常收益(Abnormal Return)是否显著不为零的事件研究总体框架。

所谓异常收益，即是个股真实收益超出预期收益之外的部分，在事件研究中，也就是事件发生给个股带来的额外收益。要衡量异常收益的大小，必须先计算个股的预期收益。用数学公式表示股票 i 在 t 日的异常收益率为：
$$
AR_{it} = R_{it} - E[R_{it}|X_t]
$$

其中, $R_{it}$ 为股票 i 在 t 日的收益率，$X_t$ 表示 t 时刻知道的所有市场信息。

**研究步骤**

1. 事件定义(Event Definition): 确定并刻画所要研究的事件, 确定事件窗
2. 取样标准(Selection Criteria): 归纳出一些样本特征(如公司市场资本化、行业代表、事件发布的时间分布等)并注明通过选样可能导致的任何偏差。
3. 预期收益率与异常收益率的定义与估计
    * 预期收益率：假定没有该事件发生情况下，公司股价的预期收益率
    * 异常收益率：事件期间内该证券事前或事后实际收益与同期正常收益之差
4. 异常收益率的统计检验
5. 对结果分析

## 预期收益率模型

**收益率的统计假设**

记 $\mathbf{R}_t$ 是 N 只证券在 t 时刻的 $N\times1$ 的收益率向量, $\mathbf{R}_t$ 是独立(关于时间 t)的多维正态分布, 即假设 $\mathbf{R}_t\sim \mathcal{N}(\mathbf{\mu}, \mathbf{\Omega}), \forall t$ 


### 均值常数模型(Constant Mean Return Model)

假定某一证券的平均收益不随时间的改变而改变, 个股的收益率总是围绕一个常数值做上下波动，即选择事件窗之前的某段时间，计算公司在该段时间内的平均收益，作为公司事件窗内的正常收益的预期值。
$$
R_{it} = \mu_i+\varepsilon_{it}\\
\mathbb{E}[\varepsilon_{it}]=0,\ \operatorname{Var}[\varepsilon_{it}]=\sigma^2_{\varepsilon_{i}}
$$
模型虽然简单, 但是却可得到与复杂的模型相近的结果 Brown and Warner(1980, 1985)。模型的选择缺乏敏感性，可能是由于即使采用了更为复杂的模型也未能降低 AR 的方差.

### 市场模型(Market Model)

假定市场收益与证券收益之间存在稳定的线性关系. 通常选择一个宽基指数作为市场组合. 相比于均值常数模型, 市场模型剔除了收益中与市场收益波动相关的部分，从而降低了估计误差. 市场模型的效果依赖于回归的 $R^2$, $R^2$ 越高, 异常收益的方差下降的越多.
$$
R_{it} = \alpha_i+\beta_i R_{mt}+\varepsilon_{it}\\
\mathbb{E}[\varepsilon_{it}]=0,\ \operatorname{Var}[\varepsilon_{it}]=\sigma^2_{\varepsilon_{i}}
$$

### 市场调整模型(Market Adjusted Return Model)

即超额收益法，选定一个基准指数(全市场的宽基指数、风格指数或行业指数)，假设基准指数的收益即是其预期收益, 该模型应用于无法事前估计模型参数的情况. 市场调整模型是市场模型的特例, 即令 $\alpha_i=0, \beta=1$.
$$
R_{it} = R_{mt}+\varepsilon_{it}\\
\mathbb{E}[\varepsilon_{it}]=0,\ \operatorname{Var}[\varepsilon_{it}]=\sigma^2_{\varepsilon_{i}}
$$

### 因子模型(Factor Model)

* 单因子模型(One-Factor Model)，如市场模型。
* 多因子模型(Multi-Factor Model)，如 Fama-French 的三因子模型

Fama-French 三因子模型在市场模型的基础上增加了市值因子收益率(SMB)和 PB 估值因子收益率(HML)作为解释变量,
$$
R_{it} = \alpha_i+\beta_i R_{mt}+\gamma_i SMB_t+\delta_i HML_t+\varepsilon_{it}\\
\mathbb{E}[\varepsilon_{it}]=0,\ \operatorname{Var}[\varepsilon_{it}]=\sigma^2_{\varepsilon_{i}}
$$

### 特征基准模型(Characteristic Based Benchmark Model)

特征基准模型最早由 Daniel et al.(1997)用于公募基金的绩效评价，Ahern(2009)将其用于事件研究中的异常收益计算。它的计算方法如下，假设全市场有 N 只股票，对于 t 日股票 i，按照 t-1 日数据，选取 $n=\frac{N}{10}$ 只总市值和股票 i 最接近的股票构造等权组合作为股票 i 在 t 时刻的特征基准组合，其收益率 $CBB_t$ 作为 t 时刻的预期收益:
$$
R_{it} = CBB_t+\varepsilon_{it}\\
\mathbb{E}[\varepsilon_{it}]=0,\ \operatorname{Var}[\varepsilon_{it}]=\sigma^2_{\varepsilon_{i}}
$$
特征基准模型是用一种非参数化的方法剔除了市场和市值因子的影响，不需要设置参数估计区间，可以部分避免市场模型和 Fama-French 模型低估小市值股票收益率的问题(Banz(1981)).

## 异常收益率的统计检验

假设 0 日为事件日，我们对事件日前后的时间做出如下区间划分

![事件窗口](./images/事件窗口.png)

其中 $(T_0, T_1]$ 为参数估计窗口(Estimation Window)，用于均值常数模型、市场模型和因子模型的参数估计, $L_1=T_1-T_0$ 是参数估计窗口的长度. $(T_1, T_2]$ 为事件窗口(Event Window), 考虑到事件信息有可能会提前泄漏导致股价提前反应，事件窗口应包括公告日前的时间, $L_2=T_2-T_1$ 是事件窗口的长度。参数估计窗口和事件窗口不能重叠，否则估计出来的参数会受到事件效应影响，计算得到的预期收益里面会包含事件效应的异常收益。

通常我们要考察的是事件窗口里某一个时间段$[\tau_1,\tau_2], T_1<\tau_1\leq\tau_2\leq T_2$ 内事件引起的累积异常收益, 事件窗口的设置不受考察区间 $[\tau_1,\tau_2]$ 设置的影响. 一般可以假设事件窗口和考察区间完全相等。

考察区间段为 $[\tau_1, \tau_2]$, $L=\tau_2-\tau_1+1$ 表示考察区间的长度, 样本容量即发生事件的股票数量为 N. 

原假设是事件对收益率无影响.

如果选定的预期收益模型为均值常数模型, 则在原假设下, 事件窗口内的异常收益率为:
$$
AR_{it}=R_{it}-E[R_{it}|X_t]\\
\mathbb{E}[AR_{it}] = 0,\ \operatorname{Var}[AR_{it}] = \sigma^2_{\varepsilon_i}
$$
如果选定的预期收益模型为市场模型, 则在原假设下, 事件窗口内的异常收益率为:






假设选定了一个预期收益模型, 则证券 i 在考察区间内的异常收益和平均异常收益为:
$$
AR_{it}=R_{it}-E[R_{it}|X_t]\\
\overline{AR_{t}}=\frac{1}{N}\sum_\limits{i=1}^{N}AR_{it}
$$
考察区间内的累积异常收益和平均累积异常收益为:
$$
CAR_{i}=\sum_\limits{t=\tau_1}^{\tau_2}AR_{it}\\
\overline{CAR}=\frac{1}{N}\sum_\limits{i=1}^{N}CAR_i
$$
标准化异常收益率为:
$$
SCAR_{i}=\frac{CAR_{i}}{\sigma_{CAR_i}}
$$
其中, $\sigma_{CAR_i}$ 为累积异常收益的标准差. 如果预期收益模型是市场调整模型或特征基准模型, 则 $\sigma_{CAR_i}=\sqrt{L}\cdot\sigma_{AR_i}$, $\sigma_{AR_i}$ 为参数估计区间内异常收益率的样本标准差, 如果是采用均值常数模型、市场模型或因子模型，则还需对回归模型的预测偏差做出调整(Campbell(1997)).

平均标准化异常收益率为:
$$
\overline{SCAR}=\frac{1}{N}\sum_\limits{i=1}^{N}SCAR_{i}
$$

有关事件效应的统计检验方法很多，可以参考 Kothari(2007)、Pynnӧnen(2005)和 Lefebvre(2007).

**传统 t 检验**

t 检验的统计量:
$$
t_{trad}=\frac{\overline{CAR}}{\sigma_{CAR}}\sqrt{N}\\
\sigma^2_{CAR} = \frac{1}{N-1}\sum_\limits{i=1}^{N}\left(CAR_i-\overline{CAR}\right)^2
$$

假设不同股票不同日期的异常收益为正态的独立同分布，则在原假设 $H_0:CAR=0$ 下 ,当 $N\to\infty$ 时，$t_{trad}$ 渐进满足标准正态分布。传统 t 检验中，CAR 的标准差是利用不同股票的数据计算得到，这样计算的前提假设是不同股票 CAR 的标准差相等，但真实股票市场中这个假设很难成立，因此学术研究中用的更多是先把 CAR 标准化再做统计检验的方法。

**BMP-t 检验**

Patell(1976) 和 Boehmer(1991) 是目前最流行的两种统计检验方法，相对传统 t 检验，它们的改进之处在于把累积异常收益率进行了标准化，降低高波动股票数据在最终统计检验中的权重，提升统计检验效能。两者不同之处在于累积异常收益标准差的估算， Patell(1976)是基于参数估计区间异常收益率的标准差估计和回归预测偏差的调整，而 Boehmer(1991)则是基于不同股票在事件作用区间内累积异常收益的样本标准差作估算。实证研究发现后者能更好的应对事件引起的事件作用区间内异常收益率方差变大的情况, 简称为 BMP-t 检验。BMP-t 检验统计量可写为:
$$
t_{BMP}=\frac{\overline{SCAR}}{\sigma_{SCAR}}\sqrt{N}\\
\sigma^2_{SCAR} = \frac{1}{N-1}\sum\limits_{i=1}^{N}\left(SCAR_i-\overline{SCAR}\right)^2
$$
在原假设下, 可以证明 $t_{BMP}\stackrel{d}{\longrightarrow}N(0,1), N\to\infty$

BMP-t 检验的一个不足之处在于未考虑不同股票之间异常收益的相关性，虽然在计算异常收益时我们会采用一些模型去剔除股价的共同驱动因素，但是受主题、行业等因素影响，异常收益之间可能还是会存在一些相关性，特别是当事件日发生的比较集中时，例如业绩超预期事件，主要集中在年报公布期。不考虑相关性会低估累积异常收益的标准差，导致统计量数值偏大，统计检验会过度拒绝原假设，因此 Kolari(2010) 对 BMP-t 检验做出修正得到新的统计量:
$$
t_{adj-BMP}=t_{BMP}\cdot\sqrt{\frac{1-\bar{r}}{1+(N-1)\cdot\bar{r}}}
\bar{r} = \frac{2}{N(N-1)}\sum\limits_{1\leq i<j\leq N}\rho_{ij}\\
$$
其中, $\rho_{ij}$ 为股票 i,j 在参数估计区间内异常收益率的线性相关系数.

**非参秩检验**

非参检验主要有符号检验(Sign Test)和秩检验(Rank Test)两类，它们都不需要关于异常收益的正态假设，相对参数检验有一定优势。两者之中，秩检验在异常收益非对称分布，有一定偏度时相对符号检验具有更高的效能(Corrado(1989))。

秩检验最早是检验事件日当天的异常收益是否会受到事件显著影响。记 $K_{it}$ 为股票 i 在 t 日异常收益在参数估计区间与事件作用区间内所有异常收益中从大到小的排名。在事件效应对事件日当天股票异常收益无影响的原假设下，$K_{it}$ 出现任何序数的可能性相等，统计量:
$$
t_{rank} = \frac{1}{N}\sum\limits_{i=1}{N}\left(K_{iT}-\frac{L+1}{2}\right)/\sigma_K\\
L=L_1+L_2\\
\sigma_K^2=\frac{1}{L}\sum\limits_{t=T_0+1}^{T_2}\left[\frac{1}{N}\sum\limits_{i=1}^{N}\left(K_{it}-\frac{L+1}{2}\right)\right]^2
$$
在 $N\to\infty$ 时, $t_{rank}$ 收敛于标准正态分布.

把单日的秩检验推广到多日的常用方法有两种，一种是 Cowan(1992) 类似参数检验中 CAR 的计算方法，直接把序数相加，或是 Luoma(2010) 先把异常收益标准化，再求序累积。这种方法基本延续了参数检验的思路，如果异常收益在事件作用区间内均匀分布，这种检验会比较有效；但是如果事件作用区间内异常收益分布非常集中，比方说只有一天异常收益非常高，其它时候接近与零，这时这一天高异常收益带来的高序数作用会在统计量计算中很快被其它数据抹平，降低统计检验效能。 另一种是下面将介绍的 Kolari(2010b) 中的方法。

首先将参数估计区间内异常收益进行标准化:
$$
SAR_{it} = \frac{AR_{it}}{\sigma_{AR_i}},\ t\in(T_0, T_1]
$$
再用 BMP-t 检验中用到的方法把事件作用区间内的累积收益进行标准化得到 $SCAR_i$，然后再把 $SCAR_i$ 在不同股票间进行标准化得到
$$
SCAR^*_i = \frac{SCAR_i}{\sigma_{SCAR}}
$$
对于每个股票 i, 可以把 $\{SAR_{it}\}_{t>T_0}^{T_1}$ 和 SCAR_i^* 拼成一个 $L_1+1$ 长度的时间序列:
$$
GSAR_{it}=\left\{
\begin{aligned}
&SAR_{it},\ T_0<t\leq T_1\\
&SCAR^*_i,\ t=T_1+1
\end{aligned}
\right.
$$
这相当于把整个事件作用区间当作事件日，$SCAR^*_i$ 作为该事件日的标准化收益，然后就可以用类似 Corrado(1989) 的方法进行秩检验, 记:
$$
U_{it}=\frac{Rank(GSAR_{it})}{L_1+2}-\frac{1}{2}\\
\bar{U}_t=\frac{1}{N}\sum\limits_{i=1}^{N}U_{it}\\
\sigma^2_{\bar{U}} = \frac{1}{L_1+1}\sum\limits_{t=T_0+1}^{T_1+1}\bar{U}_t^2\\
Z=\frac{\bar{U}_{T_1+1}}{\sigma_{\bar{U}}}
$$
可以证明在原假设下, 统计量
$$
t_{grank}=Z\sqrt{\frac{L_1-1}{L_1-Z^2}}\stackrel{d}{\longrightarrow}t_{L_1-1},\ N\to\infty
$$
如果参数估计区间足够长, $t_{grank}$ 将近似满足标准正态分布.

学术界以一年为限区分短周期效应和长周期效应，以上的检验方法适用的对象都是短周期效应，用在长周期效应上问题较多。如果事件作用区间设置太长,用参数估计区间数据估计出来的模型很难去估算事件作用区间的异常收益，误差较大，累积起来更为明显；长周期的累积异常收益偏度较大，不同股票的时间窗口重叠度增加，股票间异常收益的相关性增强，这都会影响统计检验的效果。虽然学术上有一些技术手段来处理这些问题(参考 Kothari(2007) & Dutta(2015)), 但从经济意义上讲，事件作用区间拉的越长，区间内涵盖的事件外股价影响因素越大，检测到的异常收益越不“纯”。一般事件作用区间最好设置在三个月内，最长不要超过半年。

**事件冲击效应的胜率**

绝对胜率：累积收益率大于 0 的样本占比。
相对胜率：累积超额收益率大于 0 的样本占比。


## 事件效应分析

* 公告日前后 N 日超额收益率图, 累积超额收益率图
* 分年度, 分市值, 表现


## 预期收益模型与统计检验方法的比较

**仿真模拟法**

首先，选定一个预期收益模型和统计检验方法，考察对象为全市场的 N 只股票，选定一个时间段, 比如从 2006-01-04 到 2016-01-31，共 2449 个交易日。

其次，从 N 个股票中随机选择 100 个股票。对每一个被选出的股票，再从 2449 个交易日中随机选取一个日期作为事件日 T，事件作用区间选为事件日前后一个月，即 $[T-20, T+20]$, 参数估计区间设置为[T-80, T-21]。这样可以得到 100 个用于事件效应检验的收益率序列，考察区间 $[T-\tau, T+\tau]$ 的 CAR，在置信度 5% 下进行统计检验。这整个过程叫做一次仿真。

比如做 1000 次仿真，看这 1000 次统计检验中拒绝零假设的比例有多少。由于股票和事件日都是随机选择的，仿真中的事件应该都不存在事件效应，也就是说零假设为真。如果某个模型计算得到的异常收益真实反映了事件效应引起的额外收益的话，那么它拒绝零假设的概率，也就是犯第一类错误的概率应该接近 5% 的置信度。

另一方面，如果我们在每次仿真中给考察区间 $[T-\tau, T+\tau]$ 内每天的异常收益数据人为的加上一个异常收益 $\eta$，此时零假设 CAR = 0 为假，那么此时统计检验犯第二类错误的概率 $\beta$ 越低越好，或等价的说统计检验的效能越高越好，效能 $pow = 1-\beta$。


## 事件效应影响因素

事件属性
公司所属市场
行业差异
市值风格
事前累计涨幅
估值水平


## 事件研究失效的可能原因

1. 证券市场可能是无效率的，非半强式有效市场。
2. 公司的公告信息与公司价值是无关的。
3. 事件信息已经被完全预期。
4. 内幕交易存在(insider trading)，信息只会影响普通投资者而不会影响内部人士。
5. 难于精确识别事件日期



## 事件策略

基于事件效应的投资策略，我们认为其收益率函数可以写为:
$$
R=f(F,BHAR,TC)
$$
其中,F是事件发生的频率、BHAR是事件的超额收益、TC是交易成本.


理论上，发生频率越稳定的事件，其超额收益应该越低

# 指数成份股调整事件

指数基金规模的不断上升导致指数成份股调整时涉及的市值占自由流通市值的占比逐渐升高，指数成份股调整效应可能进一步增强.

事件发生频率固定：半年调整一次

指数成份股调整效应:
* 调入股票在调整实施日之前的超额收益显著
* 调出股票在调整实施日之后的超额收益显著



# 业绩预告事件

业绩预告事件发生频率较为稳定, 事件发生次数逐年递增, 事件发生呈现一定的规律性：主要发生在1月、 4月、 7月、 8月和10月

业绩预告事件效应:
* 总体来看，各类业绩预告均有一定的超额收益
* 年报业绩预告集中在1月和10月，其超额收益最为显著
* 剔除前20个交易日超额收益为正的样本后，业绩预告事件的超额收益和打赢比均上升明显

# 分红送配事件

分红送配事件发生的频率较为稳定：主要发生在4月-7月

分红送配：实施日后超额收益较低

# 高管增持事件

事件频率与市场阶段相关性高
* 市场处于较低位置时，高管增持事件发生频率较高；市场大幅上涨阶段，高管增持事件发生频率较低
* 事件频率：平均每月15次

高管增持股票短期效应:
* 高管增持股票短期超额收益显著
* 增持比例越高，超额收益越高
* 前期跌幅大的股票超额收益更高

# 定向增发预案事件

发布定向增发预案的上市公司数量逐渐增加
* 市场大幅下跌时，预案数量下降
* 月度分布无明显差异

定向增发预案公告日效应:
* 已经实施的定向增发预案公告日之后超额收益最为显著
* 停止实施的定向增发预案公告日后超额收益最低

但预案公告日披露时很难鉴别最终停止还是成功实施

# 首发和增发股票破发事件

首发股票破发:
* 大量破发出现在市场下跌阶段
* 2009年新股发行制度改革后，首发破发发生频率上升

增发股票破发
* 大量破发主要出现在市场下跌阶段
* 采用定向增发作为再融资手段的公司增多，定增破发事件发生的频率逐步增加

首发破发超额收益显著，增发破发股票区分度不明显

# 参考文献

1. 东方证券, 事件效应的准确度量与高效统计检验
2. 兴业证券, 事件驱动策略研究介绍(PPT)
3. 申银万国, 基于事件效应的量化策略研究-2011年冬季量化投资策略研究之三
4. 陈淼鑫, 马喜德, 事件研究(PPT), 2002-9-28