# 一、实战篇：基于LightGBM的量化选股
## 1.1 概述

接下来，我们使用上述学到的知识，借助 LightGBM 机器学习模型，进行量化选股实践操作。首先需要把选股问题转化为监督学习的问题。那么如何转化呢？常规的一些方法是预测股价增长来进行选股，此处，为简单期间，我们将其转化为一个分类问题：考虑短期策略搭建，即持股周期不能多于5天。如果一支股票在 **未来5天里最高增长大于5%，最大损失大于-3%**，我们将其标签标记为 `1`，即选择该股进行投资，其他标签标记为 `0`，即不选择。

解决一个监督学习通常有以下步骤：

1. 收集训练样本并进行特征选择（特征工程）；
2. 选择度量性能的指标
3. 选择模型并优化算法；
4. 评估模型的性能；
5. 样本外预测。

以下我们将用代码实现我们的选股方案。

## 1.2 数据下载

借助 `tushare` 工具，可以轻松地下载股票信息，此处主要用到了两个数据：

- `company_info.csv`：此数据表包含股票的基础信息数据，包含股票代码、名称、上市日期、退市日期等，需要注意的是，`tushare` 账号只有达到 120 个积分才能下载此数据（且一个小时只能引用借口一次），可以通过注册（100积分），然后修改信息（20积分）完成。当然，本代码也会直接提供该信息表。
- `ts_code + _NormalData.csv`：此数据集，包含 `company_info.csv` 中的所有股票交易信息，可以通过下面的代码进行免费爬取。

1. **获取股票基础信息**：以便后续爬取股票的交易信息

In [None]:
mytoken = ' ' # 填入您tushare的token

In [43]:
import tushare as ts
import pandas as pd
import os
import numpy as np
import time
from tqdm import tqdm

"""
获取历史数据
"""

save_path = './stock'
if not os.path.exists(save_path):
    os.mkdir(save_path)
    
# 存储股票交易信息    
stock_inf_path = os.path.join(base_path,  'OldData')
if not os.path.exists(stock_inf_path):
    os.mkdir(stock_inf_path)
    
company_path = os.path.join(save_path, 'company_info.csv')

#设置起始日期
startdate = '20180701'
enddate = '20230630'


#获取基础信息数据，包括股票代码、名称、上市日期、退市日期等    
if os.path.exists(company_path):
    pool = pd.read_csv(company_path, encoding='utf-8', index_col = 0)
else:
    mytoken = mytoken 
    ts.set_token(mytoken)
    pro = ts.pro_api()
    pool = pro.stock_basic(exchange='',
                           list_status='L',
                           adj='qfq',
                           fields='ts_code, symbol,name,area,industry,fullname,list_date, market,exchange,is_hs')

    # 因为穷没开通创业板和科创板权限，这里只考虑主板和中心板
    pool = pool[pool['market'].isin(['主板', '中小板'])].reset_index()
    pool.to_csv(os.path.join(save_path, 'company_info.csv'), index=False, encoding='utf-8')

print('获得上市股票总数：', len(pool)-1)

2. 爬取股票的交易信息

In [57]:
if os.path.exists(path):
    pass

In [58]:
j = 1
for i in pool.ts_code:
    print('正在获取第%d家，股票代码%s.' % (j, i))
    #接口限制访问200次/分钟，加一点微小的延时防止被ban
    path = os.path.join(stock_inf_path, i + '_NormalData.csv')
    j += 1
    
    if os.path.exists(path):
        pass
    else:
        time.sleep(0.301)
        df = ts.pro_bar(ts_code=i, start_date=startdate, end_date=enddate, freq='D')
        try:
            df = df.sort_values('trade_date', ascending=True)
            df.to_csv(path, index=False)
        except:
            print(i)

正在获取第1家，股票代码000001.SZ.
正在获取第2家，股票代码000002.SZ.
正在获取第3家，股票代码000004.SZ.
正在获取第4家，股票代码000005.SZ.
正在获取第5家，股票代码000006.SZ.
正在获取第6家，股票代码000007.SZ.
正在获取第7家，股票代码000008.SZ.
正在获取第8家，股票代码000009.SZ.
正在获取第9家，股票代码000010.SZ.
正在获取第10家，股票代码000011.SZ.
正在获取第11家，股票代码000012.SZ.
正在获取第12家，股票代码000014.SZ.
正在获取第13家，股票代码000016.SZ.
正在获取第14家，股票代码000017.SZ.
正在获取第15家，股票代码000019.SZ.
正在获取第16家，股票代码000020.SZ.
正在获取第17家，股票代码000021.SZ.
正在获取第18家，股票代码000023.SZ.
正在获取第19家，股票代码000025.SZ.
正在获取第20家，股票代码000026.SZ.
正在获取第21家，股票代码000027.SZ.
正在获取第22家，股票代码000028.SZ.
正在获取第23家，股票代码000029.SZ.
正在获取第24家，股票代码000030.SZ.
正在获取第25家，股票代码000031.SZ.
正在获取第26家，股票代码000032.SZ.
正在获取第27家，股票代码000034.SZ.
正在获取第28家，股票代码000035.SZ.
正在获取第29家，股票代码000036.SZ.
正在获取第30家，股票代码000037.SZ.
正在获取第31家，股票代码000039.SZ.
正在获取第32家，股票代码000040.SZ.
正在获取第33家，股票代码000042.SZ.
正在获取第34家，股票代码000045.SZ.
正在获取第35家，股票代码000046.SZ.
正在获取第36家，股票代码000048.SZ.
正在获取第37家，股票代码000049.SZ.
正在获取第38家，股票代码000050.SZ.
正在获取第39家，股票代码000055.SZ.
正在获取第40家，股票代码000056.SZ.
正在获取第41家，股票代码000058.SZ.
正在获取第42家，股票代码000059.SZ.
正

## 1.3 数据预处理

- 变量定义

In [59]:
pool.head()

Unnamed: 0_level_0,ts_code,symbol,name,area,industry,fullname,market,exchange,list_date,is_hs
index,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
0,000001.SZ,1,平安银行,深圳,银行,平安银行股份有限公司,主板,SZSE,19910403,S
1,000002.SZ,2,万科A,深圳,全国地产,万科企业股份有限公司,主板,SZSE,19910129,S
2,000004.SZ,4,国华网安,深圳,软件服务,深圳国华网安科技股份有限公司,主板,SZSE,19910114,N
3,000005.SZ,5,ST星源,深圳,环境保护,深圳世纪星源股份有限公司,主板,SZSE,19901210,N
4,000006.SZ,6,深振业A,深圳,区域地产,深圳市振业(集团)股份有限公司,主板,SZSE,19920427,S


可以发现，股票交易信息中有不少离散变量，因此，需要对这些离散变量进行编码，如下是一些编码变量的设置

In [60]:
# 模型训练
import numpy as np
import pandas as pd
import os
import tqdm

base_path = 'stock'

market_map = {'主板':0, '中小板':1}
exchange_map = {'SZSE':0, 'SSE':1}
is_hs_map = {'S':0, 'N':1, 'H':2}

area_map = {'深圳': 0, '北京': 1, '吉林': 2, '江苏': 3, '辽宁': 4, '广东': 5, '安徽': 6, '四川': 7, '浙江': 8,
            '湖南': 9, '河北': 10, '新疆': 11, '山东': 12, '河南': 13, '山西': 14, '江西': 15, '青海': 16, 
            '湖北': 17, '内蒙': 18, '海南': 19, '重庆': 20, '陕西': 21, '福建': 22, '广西': 23, '天津': 24, 
            '云南': 25, '贵州': 26, '甘肃': 27, '宁夏': 28, '黑龙江': 29, '上海': 30, '西藏': 31}

industry_map = {'银行': 0, '全国地产': 1, '生物制药': 2, '环境保护': 3, '区域地产': 4, '酒店餐饮': 5, '运输设备': 6, 
 '综合类': 7, '建筑工程': 8, '玻璃': 9, '家用电器': 10, '文教休闲': 11, '其他商业': 12, '元器件': 13, 
 'IT设备': 14, '其他建材': 15, '汽车服务': 16, '火力发电': 17, '医药商业': 18, '汽车配件': 19, '广告包装': 20, 
 '轻工机械': 21, '新型电力': 22, '饲料': 23, '电气设备': 24, '房产服务': 25, '石油加工': 26, '铅锌': 27, '农业综合': 28,
 '批发业': 29, '通信设备': 30, '旅游景点': 31, '港口': 32, '机场': 33, '石油贸易': 34, '空运': 35, '医疗保健': 36,
 '商贸代理': 37, '化学制药': 38, '影视音像': 39, '工程机械': 40, '软件服务': 41, '证券': 42, '化纤': 43, '水泥': 44, 
 '专用机械': 45, '供气供热': 46, '农药化肥': 47, '机床制造': 48, '多元金融': 49, '百货': 50, '中成药': 51, '路桥': 52, 
 '造纸': 53, '食品': 54, '黄金': 55, '化工原料': 56, '矿物制品': 57, '水运': 58, '日用化工': 59, '机械基件': 60, 
 '汽车整车': 61, '煤炭开采': 62, '铁路': 63, '染料涂料': 64, '白酒': 65, '林业': 66, '水务': 67, '水力发电': 68, 
 '互联网': 69, '旅游服务': 70, '纺织': 71, '铝': 72, '保险': 73, '园区开发': 74, '小金属': 75, '铜': 76, '普钢': 77, 
 '航空': 78, '特种钢': 79, '种植业': 80, '出版业': 81, '焦炭加工': 82, '啤酒': 83, '公路': 84, '超市连锁': 85, 
 '钢加工': 86, '渔业': 87, '农用机械': 88, '软饮料': 89, '化工机械': 90, '塑料': 91, '红黄酒': 92, '橡胶': 93, '家居用品': 94,
 '摩托车': 95, '电器仪表': 96, '服饰': 97, '仓储物流': 98, '纺织机械': 99, '电器连锁': 100, '装修装饰': 101, '半导体': 102, 
 '电信运营': 103, '石油开采': 104, '乳制品': 105, '商品城': 106, '公共交通': 107, '船舶': 108, '陶瓷': 109}

- 离散变量编码


首先是上市公司数据读取，这里简单对是否是ST公司进行了处理。

In [66]:
def JudgeST(x):
    if 'ST' in x:
        return 1
    else:
        return 0
    
col = ['open', 'high', 'low', 'pre_close',]

company_info = pd.read_csv(os.path.join(base_path, 'company_info.csv'), encoding='utf-8')
company_info['is_ST'] = company_info['name'].apply(JudgeST)

# 丢弃一些多余的信息
company_info.drop(['index', 'symbol', 'fullname'], axis=1, inplace=True)
company_info.dropna(inplace=True)
company_info['market'] = company_info['market'].map(market_map)
company_info['exchange'] = company_info['exchange'].map(exchange_map)
company_info['is_hs'] = company_info['is_hs'].map(is_hs_map)

- 读取股票交易信息

读取股票交易信息，这里去掉一下上市不久的企业

In [79]:
stock_info = pd.DataFrame()
remove_stock = []
tmp_list = []
for ts_code in tqdm.tqdm(company_info['ts_code']):
    tmp_df = pd.read_csv(os.path.join(stock_inf_path, ts_code + '_NormalData.csv'))
    
    # 还需要去除一些停牌时间很久的企业
    if len(tmp_df) < 100:  # 去除一些上市不久的企业
        remove_stock.append(ts_code)
        continue
    tmp_df = tmp_df.sort_values('trade_date', ascending=True).reset_index()
    tmp_list.append(tmp_df)

stock_info = pd.concat(tmp_list)

# 定义交易日期映射
tmp_list = list(stock_info['trade_date'].unique())
date_map = dict(zip(tmp_list, range(len(tmp_list))))

ts_code_map = dict(zip(stock_info['ts_code'].unique(), range(stock_info['ts_code'].nunique())))
stock_info = stock_info.reset_index()
stock_info['ts_code_id'] = stock_info['ts_code'].map(ts_code_map)
stock_info.drop('index', axis=1, inplace=True)
stock_info['trade_date_id'] = stock_info['trade_date'].map(date_map)
stock_info['ts_date_id'] = (10000 + stock_info['ts_code_id']) * 10000 + stock_info['trade_date_id']
stock_info = stock_info.merge(company_info, how='left', on='ts_code')
stock_info_copy = stock_info.copy()

100%|██████████████████████████████████████████████████████████████████████████████████| 3186/3186 [00:04<00:00, 773.88it/s]


In [80]:
stock_info.head()

Unnamed: 0,level_0,ts_code,trade_date,open,high,low,close,pre_close,change,pct_chg,...,trade_date_id,ts_date_id,name,area,industry,market,exchange,list_date,is_hs,is_ST
0,0,000001.SZ,20180702,9.05,9.05,8.55,8.61,9.09,-0.48,-5.28,...,0,100000000,平安银行,深圳,银行,0,0,19910403,0,0
1,1,000001.SZ,20180703,8.69,8.7,8.45,8.67,8.61,0.06,0.7,...,1,100000001,平安银行,深圳,银行,0,0,19910403,0,0
2,2,000001.SZ,20180704,8.63,8.75,8.61,8.61,8.67,-0.06,-0.69,...,2,100000002,平安银行,深圳,银行,0,0,19910403,0,0
3,3,000001.SZ,20180705,8.62,8.73,8.55,8.6,8.61,-0.01,-0.12,...,3,100000003,平安银行,深圳,银行,0,0,19910403,0,0
4,4,000001.SZ,20180706,8.61,8.78,8.45,8.66,8.6,0.06,0.7,...,4,100000004,平安银行,深圳,银行,0,0,19910403,0,0


In [82]:
stock_info.columns

Index(['level_0', 'ts_code', 'trade_date', 'open', 'high', 'low', 'close',
       'pre_close', 'change', 'pct_chg', 'vol', 'amount', 'ts_code_id',
       'trade_date_id', 'ts_date_id', 'name', 'area', 'industry', 'market',
       'exchange', 'list_date', 'is_hs', 'is_ST'],
      dtype='object')

## 1.4 特征工程

接下来是一些简单的特征工程。首先是把收盘价、开盘价、最低价、最高价变换一个尺度（相当于盈亏比），若不转换直接放进模型训练可能会增加训练成本。

In [83]:
stock_info = stock_info_copy.copy()
col = ['close', 'open', 'high', 'low']
feature_col = []
for tmp_col in col:
    stock_info[tmp_col+'_'+'transform'] = (stock_info[tmp_col] - stock_info['pre_close']) / stock_info['pre_close']
    feature_col.append(tmp_col+'_'+'transform')

- 提取前5天收盘价与今天收盘价的盈亏比

In [84]:
for i in range(5):
    tmp_df = stock_info[['ts_date_id', 'close']]
    tmp_df = tmp_df.rename(columns={'close':'close_shift_{}'.format(i+1)})
    feature_col.append('close_shift_{}'.format(i+1))
    tmp_df['ts_date_id'] = tmp_df['ts_date_id'] + i + 1
    stock_info = stock_info.merge(tmp_df, how='left', on='ts_date_id')
stock_info.drop('level_0', axis=1, inplace=True)
# stock_info.dropna(inplace=True)

for i in range(5):
    stock_info['close_shift_{}'.format(i+1)] = (stock_info['close'] - stock_info['close_shift_{}'.format(i+1)]) / stock_info['close_shift_{}'.format(i+1)]

- 定义被预测变量（标签 Labels）

在标签制作时，如果一支股票在未来5天里最高增长大于5%，最大损失大于-3%，我们将其标签标记为1，其他标签标记为0。在制作标签时为了防止股价拉到5%瞬间掉下来，此处加了一点容错（6%）。

In [85]:
use_col = []
for i in range(5):
    tmp_df = stock_info[['ts_date_id', 'high', 'low']]
    tmp_df = tmp_df.rename(columns={'high':'high_shift_{}'.format(i+1), 'low':'low_shift_{}'.format(i+1)})
    use_col.append('high_shift_{}'.format(i+1))
    use_col.append('low_shift_{}'.format(i+1))
    tmp_df['ts_date_id'] = tmp_df['ts_date_id'] - i - 1
    stock_info = stock_info.merge(tmp_df, how='left', on='ts_date_id')

stock_info.dropna(inplace=True)

for i in range(5):
    stock_info['high_shift_{}'.format(i+1)] = (stock_info['high_shift_{}'.format(i+1)] - stock_info['close']) / stock_info['close']
    stock_info['low_shift_{}'.format(i+1)] = (stock_info['low_shift_{}'.format(i+1)] - stock_info['close']) / stock_info['close']

tmp_array = stock_info[use_col].values
max_increse = np.max(tmp_array, axis=1)
min_increse = np.min(tmp_array, axis=1)
stock_info['label_max'] = max_increse
stock_info['label_min'] = min_increse
stock_info['label_final'] = (stock_info['label_max'] > 0.06) & (stock_info['label_min'] > -0.03)
stock_info['label_final'] = stock_info['label_final'].apply(lambda x: int(x))
stock_info = stock_info.reset_index()
stock_info.drop('index', axis=1, inplace=True)

## 1.5 模型训练

模型数据输入准备：这里我们选取了18年7月1日至21年12月31日的数据作为训练集，22年1月1号至22年6月30号的数据作为验证集，22年7月1日至23年6月30日的数据作为回测数据。

In [86]:
trn_col = ['open', 'high', 'low', 'close', 'pre_close', 'change', 'pct_chg', 'vol', 'amount', 'ts_code_id'] + feature_col
label = 'label_final'
trn_date_min = 20180701
trn_date_max = 20211231
val_date_min = 20220101
val_date_max = 20220630
test_date_min = 20220701
test_date_max = 20230630

trn_data_idx = (stock_info['trade_date'] >= trn_date_min) & (stock_info['trade_date'] <= trn_date_max)
val_data_idx = (stock_info['trade_date'] >= val_date_min) & (stock_info['trade_date'] <= val_date_max)
test_data_idx = (stock_info['trade_date'] >= test_date_min) & (stock_info['trade_date'] <= test_date_max)

trn = stock_info[trn_data_idx][trn_col].values
trn_label = stock_info[trn_data_idx][label].values

val = stock_info[val_data_idx][trn_col].values
val_label = stock_info[val_data_idx][label].values 

test = stock_info[test_data_idx][trn_col].values
test_label = stock_info[test_data_idx][label].values

In [87]:
print('rate of 0: %.4f, rate of 1: %.4f' % (np.sum(trn_label==0)/len(trn_label), np.sum(trn_label==1)/len(trn_label)))
print('trn data:%d, val data:%d, test data:%d' % (len(trn), len(val), len(test)))
print('number of features:%d' % len(trn_col))

rate of 0: 0.7954, rate of 1: 0.2046
trn data:2402113, val data:358934, test data:743100
number of features:19


In [108]:
# 模型训练及评价
import lightgbm as lgb
from sklearn import metrics

params = {
        'learning_rate': 1e-3,
        'boosting_type': 'gbdt',
        'objective': 'binary',
        'metric': 'mse',
        'num_leaves':128,
        'feature_fraction': 0.8,
        'bagging_fraction': 0.8,
        'bagging_freq': 5,
        'seed': 1,
        'bagging_seed': 1,
        'lambda_l1': 0.1,
        'feature_fraction_seed': 7,
        'min_data_in_leaf': 20,
        'nthread': -1,
        'verbose': -1
    }

trn_data = lgb.Dataset(trn, trn_label)
val_data = lgb.Dataset(val, val_label)
num_round = 2000
clf = lgb.train(params, trn_data, num_round, valid_sets=[trn_data, val_data])
            
oof_lgb = clf.predict(val, num_iteration=clf.best_iteration)
test_lgb = clf.predict(test, num_iteration=clf.best_iteration)

## 1.6 模型评价

- 验证集

接下来，我们用混淆矩阵和敏感度来评估模型在验证集和测试集中的效果。

In [109]:
oof_lgb_final = np.round(oof_lgb)
print(metrics.accuracy_score(val_label, oof_lgb_final))
print(metrics.confusion_matrix(val_label, oof_lgb_final))
tp = np.sum(((oof_lgb_final == 1) & (val_label == 1)))
pp = np.sum(oof_lgb_final == 1)
print('sensitivity:%.3f'% (tp/(pp)))

0.8009522642045613
[[287418     58]
 [ 71387     71]]
sensitivity:0.550


在验证集中，模型敏感度为0.550，意思就是选了100个股票，55支股票在未来5天涨幅能达到5%。

- 测试集

在测试集中，我们调了阈值，模型敏感度为0.769。

In [110]:
thresh_hold = 0.6
oof_test_final = test_lgb >= thresh_hold
print(metrics.accuracy_score(test_label, oof_test_final))
print(metrics.confusion_matrix(test_label, oof_test_final))
tp = np.sum(((oof_test_final == 1) & (test_label == 1)))
pp = np.sum(oof_test_final == 1)
print('sensitivity:%.3f'% (tp/(pp)))

0.8282653747813215
[[615464      6]
 [127610     20]]
sensitivity:0.769


这里我们假设在每天即将收盘的时候买入股票（在即将收盘的时候可以利用获取的实时行情来选股，获取的各项指标可以近似为当日收盘后的指标）。所以，在测试集中选出来的股票并不一定能买入，因为会有一些涨停股票，这里我们需要筛选掉一些涨停股票。

在筛选的时候我们直接判断当日收盘价是否等于当日最高价。尝试过先判断是否ST，再判断涨幅，但是现在不是ST的之前可能是ST。（这个筛选后期可以改进）

In [117]:
test_postive_idx = np.argwhere(oof_test_final == 1).reshape(-1)
test_all_idx = np.argwhere(test_data_idx).reshape(-1)

# 查看选了哪些股票
tmp_col = ['ts_code', 'name', 'trade_date', 'open', 'high', 'low', 'close', 'pre_close',
       'change', 'pct_chg', 'amount', 'is_ST', 'label_max', 'label_min', 'label_final']
# stock_info.iloc[test_all_idx[test_postive_idx]]

tmp_df = stock_info[tmp_col].iloc[test_all_idx[test_postive_idx]].reset_index()
# idx_tmp = tmp_df['is_ST'] == 0
# tmp_df.loc[idx_tmp, 'is_limit_up'] = (((tmp_df['close'][idx_tmp]-tmp_df['pre_close'][idx_tmp]) / tmp_df['pre_close'][idx_tmp]) > 0.095)
# idx_tmp = tmp_df['is_ST'] == 1
# tmp_df.loc[idx_tmp, 'is_limit_up'] = (((tmp_df['close'][idx_tmp]-tmp_df['pre_close'][idx_tmp]) / tmp_df['pre_close'][idx_tmp]) > 0.047)

tmp_df['is_limit_up'] = tmp_df['close'] == tmp_df['high']

buy_df = tmp_df[(tmp_df['is_limit_up']==False)].reset_index()
buy_df.drop(['index', 'level_0'], axis=1, inplace=True)

统计了一下，一共有8支股票在未来可以选择，3支股票能够有5%以上收益。

In [119]:
print(len(buy_df), sum(buy_df['label_final']))

8 3


In [118]:
buy_df

Unnamed: 0,ts_code,name,trade_date,open,high,low,close,pre_close,change,pct_chg,amount,is_ST,label_max,label_min,label_final,is_limit_up
0,001266.SZ,宏英智能,20220715,28.61,31.77,28.61,30.03,31.79,-1.76,-5.5363,156186.779,0,0.264069,-0.013653,1,False
1,002118.SZ,*ST紫鑫,20230421,1.45,1.57,1.45,1.55,1.61,-0.06,-3.7267,148677.359,1,0.090323,-0.045161,0,False
2,002157.SZ,*ST正邦,20221031,3.29,3.54,3.29,3.5,3.66,-0.16,-4.3716,378127.452,1,0.191429,0.002857,1,False
3,003007.SZ,直真科技,20230426,23.16,24.5,23.16,23.84,25.36,-1.52,-5.9937,120034.276,0,0.057466,-0.004614,0,False
4,600766.SH,*ST园城,20230420,12.52,13.0,12.33,12.99,13.7,-0.71,-5.1825,155419.309,1,0.092379,-0.278676,0,False
5,603025.SH,大豪科技,20230322,15.82,16.89,15.82,16.55,17.24,-0.69,-4.0023,517699.533,0,0.086405,-0.026586,1,False
6,603768.SH,常青股份,20221014,18.11,19.39,18.11,19.02,20.12,-1.1,-5.4672,188629.117,0,-0.023659,-0.101998,0,False
7,605255.SH,天普股份,20221223,14.11,15.0,13.91,14.78,15.46,-0.68,-4.3984,81158.673,0,-0.00406,-0.075101,0,False


# Reference

1. [选股策略搭建（三）（量化模型搭建）](https://mp.weixin.qq.com/s/LLE3Oe8x13BdAqjCs4Geqw)
2. [Tushare 官网](https://tushare.pro/document/2?doc_id=25)