大盘指数（基准）

- 深圳成指 399001.SZ

- 上证指数 000001.SH

In [2]:
import pandas as pd
import numpy as np
pd.set_option("display.max_rows", 10)

# 日线数据
df_daily = pd.read_csv("sample_data/daily/000001.SZ.csv.xz")
df_daily.sort_values(by=["trade_date"], inplace=True)
df_daily.reset_index(drop=True, inplace=True)
# 指数日线数据
df_index_daily = pd.read_csv("sample_data/index_daily/399001.SZ.csv.xz")
df_index_daily.sort_values(by=["trade_date"], inplace=True)
df_index_daily.reset_index(drop=True, inplace=True)
# 每日重要的基本面指标
df_daily_basic = pd.read_csv("sample_data/daily_basic/000001.SZ.csv.xz")
df_daily_basic.sort_values(by=["trade_date"], inplace=True)
df_daily_basic.reset_index(drop=True, inplace=True)
# 资产负债表
df_balancesheet = pd.read_csv("sample_data/balancesheet/000001.SZ.csv.xz")
df_balancesheet.sort_values(by=["ann_date"], inplace=True)
df_balancesheet.reset_index(drop=True, inplace=True)
# 财务利润表
df_income = pd.read_csv("sample_data/income/000001.SZ.csv.xz")
df_income.sort_values(by=["ann_date"], inplace=True)
df_income.reset_index(drop=True, inplace=True)
# 财务指标数据
df_fina_indicator = pd.read_csv("sample_data/fina_indicator/000001.SZ.csv.xz")
df_fina_indicator.sort_values(by=["ann_date"], inplace=True)
df_fina_indicator.reset_index(drop=True, inplace=True)

# 交易摩擦类因子

## 市值(firm size， size)

### 【介绍】

根据 Banz(1981)计算股票市值，即用**每个月月末的(最后一个交易日的)股票收盘价格(不复权价格)乘以每个月月末的 A 股流通股本**，也称其为 A 股流通市值。

在每个月的月末(t)，按照月末 A 股流通市值将所有 A 股股票等分为 10 组。其中，A 股流通市值最小的 10% 的股票在第一组，A 股流通市值最大的 10% 的股票在第十组。然后，计算下一个月(t+1)各组流通市值加权的股票组合的月收益率及第十组与第一组收益率之差(即为因子收益率)。以此类推，在每个月月末计算 A 股流通市值并重新分组、计算组合收益率。

### 【计算方法】

由 **daily_basic** 直接获得【总市值（万元）】

### 【说明】

无

### 【代码示例】

In [3]:
df = pd.DataFrame()

df['trade_date'] = df_daily.trade_date
# 市值
df['total_mv'] = df_daily_basic.total_mv

print('{}: {}'.format(df['trade_date'].iloc[-1], df['total_mv'].iloc[-1]))

20181101: 11847615.8941


## 系统性风险(market beta, beta)

### 【计算方法】

$$
\beta_i=\rho_{i,m} \frac{\sigma_i}{\sigma_m}
$$

$\rho_{i,m}$: 股票 i 的收益率与大盘指数收益率的相关系数

$\sigma_i$: 股票 i 收益率的波动率(即标准差)

$\sigma_m$: 大盘指数收益率的波动率(即标准差)

### 【说明】

#### 基准

大盘指数（基准）

- 深圳成指 399001.SZ

#### 复权

实际计算中需要复权

#### 滚动计算

取过去 12 个月的数据

### 【代码示例】

In [None]:
df = pd.DataFrame()

df['trade_date'] = df_daily.trade_date
df['pct_change'] = df_daily["pct_change"].values
df['pct_change_benchmark'] = df_index_daily["pct_change"]
df.dropna(inplace=True)
cov = np.cov(np.vstack([
            np.array(df["pct_change"].values),
            np.array(df["pct_change_benchmark"].values)
        ]), ddof=1)
print('{}: {}'.format(df['trade_date'].iloc[-1], cov[0][1] / cov[1][1]))

# 动量因子

## 12 个月动量 (12-month momentum, mom12)

### 【TODO】

【未完成原因】balabala