### 参考方正证券研报《“聆听高频世界的声音”系列研究（三）》中的“聪明钱情绪因子Q”，该因子实际上反映了聪明钱参与交易的相对价位。因子Q的值越大，表明聪明钱的交易越倾向于出现在价格较高处，这是逢高出贷的表现，反应其悲观态度；因子Q值越小，则表明聪明钱的交易多出现在价格较低处，这是逢低吸筹的表现，反映其乐观情绪
### 首先构造聪明度指标 S 
$$
\mathrm{S}_{\mathrm{t}}=\left|R_{t}\right| / \sqrt{V}_{t}
$$
### 其中，$R_{t}$为第t分钟的涨跌幅，$V_{t}$为第 t 分钟的成交量。指标$S_{t}$的值越大，则表示该分钟的交易越“聪明”。
### 借助指标 S，我们可以通过以下方法筛选聪明钱的交易：对于特定股票、特定时段的所有分钟行情数据，将其按照指标 S 从大到小进行排序，将成交量累积占比前 20% 视为聪明钱的交易。
### 对于特定股票、特定时段的分钟行情数据，按照上述方法划分出聪明钱的交易之后，我们可以构造聪明钱的情绪因子 Q：
$$
\mathrm{Q}=\mathrm{VWAP}_{\text {smart }} / \mathrm{VWAP}_{\text {all }}
$$
### 其中，$\mathrm{VWAP}_{\text {smart }}$是聪明钱的成交量加权平均价，$\mathrm{VWAP}_{\text {all }}$是所有交易的成交量加权平均价。因子 Q 实际上反映了在该时间段中聪明钱参与交易的相对价位。

### 导入相关库

In [8]:
import pandas as pd
import matplotlib.pyplot as plt
import datetime
import numpy as np
import warnings
warnings.filterwarnings('ignore')
import matplotlib
%matplotlib inline
from IPython import display

from pylab import mpl
# from jqdatasdk import *
mpl.rcParams['font.sans-serif'] = ['FangSong'] # 指定默认字体
mpl.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题

from sqlalchemy import create_engine

### 编写类，主要思想：
### 首先构造聪明钱指标Q，然后根据Q上穿上轨线和下穿下轨线分别发出买入卖出信号，最后进行回测观察指标的效果
###  整个函数运行过程中涉及的一些参数：
#### 上轨线参数：buy_std
#### 下轨线参数：sell_std
#### 计算Q指标的窗口长度：window
#### 计算Q指标的前r1%交易量：r1
#### 止盈率：r2
#### 止损率：r3
### 由于参数较多，因此采用改进版遗传算法进行调参，使用回测的净值，夏普，最大回撤作为遗传算法的fitness，选出使得fitness最大的参数组合#### 

In [91]:
class SmartMoney(object):
    
    def __init__(self,df,DNA_SIZE,POP_SIZE, N_KID,N_GENERATIONS,star,T,):
        
        self.df = df
        self.DNA_SIZE = DNA_SIZE  # 需要优化的 
        self.POP_SIZE = POP_SIZE  # 遗传算法的种群数量
        self.N_KID = N_KID        # 后代的数量
        self.N_GENERATIONS = N_GENERATIONS # 进化轮数
        self.star = star          # 样本内的开始时间点
        self.T = T  # 样本内区间长度

        """
        生成情绪指标Q指标
        """
    def create_Q(self,df,window,r1):                      # r1:交易量的前r1%
        R = df.Sigma.values                            # 收益的波动率
        V = df.Volume_pct.values                       # 成交量的涨跌幅
        Vo = df.volume.values                          # 成交量
        P = df.close.values                            # 分钟收盘价
        Q = []                                         # 聪明钱指标
        
        for t in range(window,len(df)):                
            Rt = R[t-window:t]                         # 给定窗口内收益率序列
            Vt = V[t-window:t]                         # 给定窗口内成交量的涨跌幅序列
            Vot = Vo[t-window:t]                       # 给定窗口内成交量序列
            Pt = P[t-window:t]                         # 给定窗口内价格序列
            St = np.abs(Rt) / np.sqrt(Vt)              # 计算聪明度指标 S
            St_sort = np.argsort(-St)                  # 按照 S 值从大到小对行情数据进行重新排序         
            n_smart = np.where((np.cumsum(Vot[St_sort]) / np.sum(Vot)) >= r1)[0][0]  # 返回成交量的前r1%索引
            
            
            index_smart = St_sort[:n_smart]            # 聪明钱的索引(成交量的前r1%)
            VWAP_smart = np.sum(Vot[index_smart] * Pt[index_smart]) / np.sum(Vot[index_smart]) # 聪明钱计算公式的分子
            VWAP_all = np.sum(Vot * Pt) / np.sum(Vot)  # 聪明钱计算公式的分母
            Qt = VWAP_smart / VWAP_all                 # t时刻聪明钱指标Q
            Q.append(Qt)                               
        return Q    
    
    """
    生成交易信号
    把聪明钱Q看作一个指标，当Q较大时，生成买入信号；Q较小时，生成卖出信号。
    那么怎么定义Q多大为较大，Q多小为较小呢？
    根据统计知识，如果Q服从正态分布，那么Q有68%的概率落在±1个标准差之间（深蓝区域）；有95的概率落在±2个标准差之间；
    有99%概率落在±3个标准差之间。因此这里以多少个标准差来衡量Q的一个相对大小。并且左右两个标准差的倍数可以不相同，如图所示：
    |                                            |
    |   sell_std*std------mean-----buy_std*std   |
    |                                            |  
    即当 Qt - mean > buy_std  时：认为Qt处于一个较大的水平，此时发出买入信号
    当   mean - Qt < sell_std 时：认为Qt处于一个较小的水平，此时发出卖出信号
     
    事实上，当sell_std==buy_std , Q=prices时，即为布林带
     
    """
    
    def create_y(self,df, window, buy_std, sell_std):
        ### df:数据，
        ### window用于计算布林带的窗口大小，
        ### buy_std:上轨标准差的倍数，
        ### sell_std:下轨标准差的倍数
        
        y1 = df.Q.values                        # 聪明钱指标
        y0 = np.zeros(len(df)-window)           # 用于存储交易信号的数组

        # 生成每一时刻的交易信号
        for i in range(window,len(y0)):         
            std = np.std(y1[i-window:i])        # 给定一个窗口的方差
            mean = np.mean(y1[i-window:i])      # 给定一个窗口的均值
            if (mean - y1[i]) > sell_std*std:   # t时刻Q值突破下轨线，发生卖出信号
                y0[i] = 2
            if (y1[i] -mean) > buy_std*std:     # t时刻Q值突破上轨线，发生买入信号
                y0[i] = 1
        return y0  
    
    """
    定义最大回撤函数
    """
    def Max_drawdown(self,values_f):       # 输入最终市值
        drawdown = []
        for t in range(len(values_f)):
            drawdown.append(1 - np.min(values_f[t:]) / values_f[t])
        return np.max(drawdown)
    
    """
    定义胜率函数
    """
    def Win_ratio(self,df3):
        v = df3.Value.values                                        # 市值
        Operate = df3.Operation.values                              # 操作
        buy_operate = np.where(Operate == 1)[0]                     # 买入操作的索引
        sell_operate = np.where(Operate == 2)[0]                    # 卖出操作的索引
        if len(buy_operate) - len(sell_operate) == 1:               # 最后买入尚未卖出
            
            diff_value = v[sell_operate] - v[buy_operate][:-1]      # 买卖之间的净市值
            return np.sum(diff_value>0) / len(buy_operate)
        
        else:
            try:
                diff_value = v[sell_operate] - v[buy_operate]       # 买卖之间的净市值
                return np.sum(diff_value>0) / len(buy_operate)
            except:
                return 0    
            
    """
    夏普函数
    """
    def sharp_ratio(self, V,r=0.03):                                    # r=0.03市场无风险利率
        return_rate_year = (V[-1]/V[0])**(8*250/len(V))-1      # 这里不同频率的数据的夏普函数需要做一些改变
        std_year = np.std(V.pct_change(8))*np.sqrt(250)
        return (return_rate_year-r)/std_year    
    
    """
    回测函数
    """
    def backtest(self,df1,r2,r3,start, end,period,plot=False,Test=False):
        df = df1.copy()
        Len = len(df) 
        # 直接在dataframe上进行修改赋值运行较慢，因此先将dataframe格式转为数组格式，对数组进行操作，最后输出阶段再转为直观的dataframe
        days = df.day.values            # 日期
        Signal = df.Signal.values       # 交易信号
        Close = df.close.values         # 30分钟收盘价
        Open = df.open.values           # 30分钟开盘价
        Value = np.zeros(Len)          # 市值
        Cash = np.zeros(Len)           # 现有现金流
        Stocks = np.zeros(Len)         # 持股数量  
        Operation = np.zeros(Len)      # 实际操作
        Value[:2] = 1000000            # 初始资金设为10万
        Cash[:2] = 1000000             # 初始市值等于初始资金
        Stocks[0] = 0                  # 初始持股
        ratio = 3./10000               # 手续费
        subfee = 0.001
        node = 0        
        for i in range(1, Len-period):
            
            ### 判断是否可以买入
            if (Signal[i] == 1) and (int(Cash[i] / (Open[i+1] *100 * (1+ratio) * (1+subfee))))>=1:    #买入 
                Operation[i+1] = 1 
                number = int(Cash[i] / (Open[i+1]  * (1+ratio) * (1+subfee)))   # 现有现金流下可以买入的数量
                Stocks[i+1] = Stocks[i] + number                                           # 持股数量增加
                Cash[i+1] = Cash[i] - number * Open[i+1] * (1+ratio) * (1+subfee)           # 买入后剩余现金流
                Value[i+1] = Cash[i+1] + Stocks[i+1] * Close[i+1]                          # 市值变化 
                
            ### 判断是否可以卖出（不考虑做空的情况）    
            elif Stocks[i] != 0:
                day = days[i]                               # 此刻所处的日期
                index = np.where(days==day)  # 这一天的所有分钟时刻的索引，比如说第二天的分钟索引是【8，9，10，11，12，13，14，15】
                index_i = np.where(days==(day+1))[0][0]     # 下一天第一根（10：00）开盘价的索引
                index1 = np.where(Operation == 1)[0][-1]   #上一次买入的时候的索引
                
                ### 不能持仓太久
                if (i-index1>10*period):  # 持仓超过10天
                    if np.sum(Operation[index]==0) != period:   # 今天已经进行过买入/卖出操作，则第二天开盘卖出
                        Operation[index_i] = 2                 # 执行卖出操作,下一天第一根K线处卖出
                        ### 在没能卖出之前，会继续持有
                        for j in range(i, index_i):
                            Stocks[j+1] = Stocks[j]                                                   # 持股数量保持不变
                            Cash[j+1] = Cash[j]                                                       # 现金保持不变
                            Value[j+1] = Cash[j+1] + Stocks[j+1] * Close[j+1]                          # 市值变化
                        
                        Cash[index_i] = Cash[index_i-1] + Stocks[index_i-1] * Open[index_i] *(1-ratio)*(1-subfee)        # 卖出后的现金流
                        Value[index_i] = Cash[index_i]                                                     # 市值变化
                        Stocks[index_i] = 0                       
                        node = 1   
                    
                    else:                                                                   # 今天没有进行过买入操作，则下一时刻卖出
                        Operation[i+1] = 2                                                         # 执行卖出操作
                        Cash[i+1] = Cash[i] + Stocks[i] * Open[i+1] *(1-ratio)*(1-subfee)        # 卖出后的现金流
                        Value[i+1] = Cash[i+1]                                                     # 市值变化
                        Stocks[i+1] = 0
            
                ### 判断是否属于止损情况（r2:止损率）
                elif (i % period == 0) and (i > period) and (Value[i] / Value[i-period]) <r2:
                    if np.sum(Operation[index]==0) != period:                     # 今天已经进行过买入/卖出操作，则第二天开盘卖出
                        Operation[index_i] = 2                 # 执行卖出操作,下一天第一根K线处卖出
                        for j in range(i, index_i):
                            Stocks[j+1] = Stocks[j]                                                   # 持股数量保持不变
                            Cash[j+1] = Cash[j]                                                       # 现金保持不变
                            Value[j+1] = Cash[j+1] + Stocks[j+1] * Close[j+1]                          # 市值变化

                        Cash[index_i] = Cash[index_i-1] + Stocks[index_i-1] * Open[index_i] *(1-ratio)*(1-subfee)        # 卖出后的现金流
                        Value[index_i] = Cash[index_i]                                                     # 市值变化
                        Stocks[index_i] = 0                                                           # 持股数量变为0
                        node = 1
                    else: # 今天没有进行过买入操作，则下一时刻卖出
                        Operation[i+1] = 2                                                         # 执行卖出操作
                        Cash[i+1] = Cash[i] + Stocks[i] * Open[i+1] *(1-ratio)*(1-subfee)        # 卖出后的现金流
                        Value[i+1] = Cash[i+1]                                                     # 市值变化
                        Stocks[i+1] = 0   
            
                ### 判断是否属于止盈情况(r3:止盈率)
                elif (i % period == 0) and (i > period) and (Value[i] / Value[index1]) >(1+r3):    
                    
                    if np.sum(Operation[index]==0) != period:                     # 今天已经进行过买入操作，则第二天开盘卖出
                        Operation[index_i] = 2                 # 执行卖出操作,下一天第一根K线处卖出
                        for j in range(i, index_i):
                            Stocks[j+1] = Stocks[j]                                                   # 持股数量保持不变
                            Cash[j+1] = Cash[j]                                                       # 现金保持不变
                            Value[j+1] = Cash[j+1] + Stocks[j+1] * Close[j+1]                          # 市值变化
                            
                        Cash[index_i] = Cash[index_i-1] + Stocks[index_i-1] * Open[index_i] *(1-ratio)*(1-subfee)        # 卖出后的现金流
                        Value[index_i] = Cash[index_i]                                                     # 市值变化
                        Stocks[index_i] = 0                       
                        node = 1      
                    
                    else:
                        Operation[i+1] = 2                                                         # 执行卖出操作
                        Cash[i+1] = Cash[i] + Stocks[i] * Open[i+1] *(1-ratio)*(1-subfee)        # 卖出后的现金流
                        Value[i+1] = Cash[i+1]                                                     # 市值变化
                        Stocks[i+1] = 0    
                        
                ### 判断是否是属于卖出信号情况
                elif Signal[i] == 2:                                     
                    if np.sum(Operation[index]==0) != period:                     # 今天已经进行过买入/卖出操作，则第二天开盘卖出                
                        Operation[index_i] = 2                                  # 第二天开盘执行卖出操作
                        for j in range(i, index_i):
                            Stocks[j+1] = Stocks[j]                                                   # 持股数量保持不变
                            Cash[j+1] = Cash[j]                                                       # 现金保持不变
                            Value[j+1] = Cash[j+1] + Stocks[j+1] * Close[j+1]                          # 市值变化

                        Cash[index_i] = Cash[index_i-1] + Stocks[index_i-1] * Open[index_i] *(1-ratio)*(1-subfee)        # 卖出后的现金流
                        Value[index_i] = Cash[index_i]                                                     # 市值变化
                        Stocks[index_i] = 0   
                        node = 1     
                    else:                                                           # 今天没有进行过买入操作，则下一时刻卖出
                        Operation[i+1] = 2                                                         # 执行卖出操作
                        Cash[i+1] = Cash[i] + Stocks[i] * Open[i+1] *(1-ratio)*(1-subfee)        # 卖出后的现金流
                        Value[i+1] = Cash[i+1]                                                     # 市值变化
                        Stocks[i+1] = 0     
                
                ### 继续持仓
                else:
                    Stocks[i+1] = Stocks[i]                                                   # 持股数量保持不变
                    Cash[i+1] = Cash[i]                                                       # 现金保持不变
                    Value[i+1] = Cash[i+1] + Stocks[i+1] * Close[i+1]                          # 市值变化   
                    if node == 1 and(i+1 == index_i):
                        Cash[index_i] = Cash[index_i-1] + Stocks[index_i-1] * Open[index_i] *(1-ratio)*(1-subfee)   # 卖出后的现金流
                        Value[index_i] = Cash[index_i]                                          # 市值变化
                        Stocks[index_i] = 0                                                     # 持股数量变为0
                        node = 0          

            ### 继续持仓
            else:
                Stocks[i+1] = Stocks[i]                                                   # 持股数量保持不变
                Cash[i+1] = Cash[i]                                                       # 现金保持不变
                Value[i+1] = Cash[i+1] + Stocks[i+1] * Close[i+1]                          # 市值变化                  

        ### 将数组转为dataframe格式，便于观察分析
        df['Stock'] = Stocks
        df['Operation'] = Operation
        df['Cash'] = Cash
        df['Value'] = Value
        result = df[:-period]        
        
        dradown = self.Max_drawdown(result.Value)    # 计算回撤
        win_rat = self.Win_ratio(result)             # 计算胜率
        sharpe = self.sharp_ratio(result.Value)      # 计算夏普
    #     print('买入次数：',np.sum([result.Operation == 1]))
    #     print('卖出次数：',np.sum([result.Operation == 2]))
    #     print('最终市值:%.2f'%(result.Value[-1]/result.Value[0]))
    #     print('最大回撤 %.2f'%(dradown*100) + '%')
    #     print('胜率：%.2f'%(win_rat*100) + '%')
    #     print('夏普：%.2f'%(sharpe))        
        # 可视化回测结果
        if plot == True:
            %matplotlib notebook
            fig = plt.figure()
            plt.plot(result.Value/result.Value[0], label='Value', c='r')
            plt.plot(result.close/result.close[0] ,color='k', label='000300')
            plt.title('30min:样本外%s---%s回测结果'%(start, end))
            plt.xticks(rotation=45)
            plt.legend(loc=2)
            plt.grid()   
        
        ### 样本外测试
        if Test == True:
            print('买入次数：',np.sum([result.Operation == 1]))
            print('卖出次数：',np.sum([result.Operation == 2]))
            print('最终市值:%.2f'%(result.Value[-1]/result.Value[0]))
            print('最大回撤 %.2f'%(dradown*100) + '%')
            print('胜率：%.2f'%(win_rat*100) + '%')
            print('夏普：%.2f'%(sharpe))
            return result.Value[-1]/result.Value[0] +  win_rat- dradown       

        return result.Value[-1]/result.Value[0] +  win_rat- dradown #+ np.min((np.sum([result.Operation == 2]) / (T+1) - 5) * 0.1, 0)     

    """
    主体函数：输入指定参数，输出回测结果（因为参数较多，且优化函数比较复杂，因此采用遗传算法进行调参）
    ### wind:计算情绪指标的时候的窗口大小（天）
    ### r1:表示以诚交量的前r作为聪明前交易
    ### buy_std:表示Q大于buy_std 倍标准差买入
    ### sell_std:表示Q小于sell_std 倍标准差卖出
    ### r2：止损率
    ### r3: 止盈率
    ### period:周期长度，如果周期为7，则表示回测交易的时候不考虑第一根K线，每天从第二跟K线买入；若为8，则表示从第一根K线买入    
    """
    def function(self,start, end,P, period=8, plot=False, Test=False):
        df0 = self.df
        wind = int(8 + 15*P[0])
        r1 =  0.1+0.8*P[0]
        buy_std = 1+P[1]*2
        sell_std =1.5+P[2]*1.5
        r2 = 0.95 + 0.05*P[4]
        r3 = 0.1*P[5]
        #print('参数：wind:%f, r1:%f, buy_std:%f, sell_std:%f,r2:%f, r3:%f,'%(wind, r1, buy_std, sell_std,r2,r3))
        if Test == True:
            print('参数：wind:%f, r1:%f, buy_std:%f, sell_std:%f,r2:%f, r3:%f,'%(wind, r1, buy_std, sell_std,r2,r3))
        
        ### 数据预处理
        data  = df0.copy()  # data不包含9：30-10：00的数据，用来计算交易信号（因为第一根K线噪音太多）
        data0 = df0.copy()  # data0包含9：30-10：00的数据，用来进行交易回测
        
        h = [str(i)[11:16] for i in  df0.index]   # 生成每条数据的小时和分钟
        data0['H_min'] = h
        data['H_min'] = h   # 生成每条数据的小时和分钟   
        
        index = data['2014-01-02 10':'2014-01-02 14:58']['H_min'].values     ###找出不包含9：30-10：00的K线的索引
        data = data[data['H_min'].isin(index)]  
        data['Return'] = np.abs(data.close.pct_change())     # 计算收益率的绝对值
        
        ## 计算收益率的波动率（不包含第一根K线）
        sigma = []         
        Len0 = 7   # 除去9：30-10：00 以及14：59：00 和15：00：00后，每天一共有209根K线
        for i in range(Len0,len(data)):
            sigma.append(np.std(data.Return.values[i-Len0:i]))

        data['Volume_pct'] = np.abs(data.volume.pct_change()) # 成交量的涨跌幅    
        data['Volume_pct'].replace(np.inf,0,inplace=True)      
        data = data[Len0:]   # 因为用到了Len0的窗口
        data['Sigma'] = sigma    # 收益率的波动率        
        
        ### 情绪因子Q
        window = Len0 * wind
        Q0 = self.create_Q(data, window, r1)
        data = data[window:]  # 因为用到了window的窗口
        data['Q'] = Q0

        ### 创建信号
        Signal0 = self.create_y(data, window,buy_std, sell_std)
        data = data[window:] # 因为用到了window的窗口
        data['Signal'] = Signal0
        data['day'] = np.array([[d+1]*Len0 for d in range(int(len(data)/Len0))]).reshape(-1,)    

        ### 最终数据
        data0 = data0[str(data.index[0])[:10]:]            # 保证data0和data是从同一天开始
        col = ['Return','Volume_pct', 'Sigma', 'Q', 'Signal', 'day']
        for c in col:
            data0[c] = -999

        for c in col:
            # data0[data0.H_min.isin(index)].index:不包含9：30-10：00的K线的索引
            data0.loc[data0[data0.H_min.isin(index)].index, c] = data.loc[:,c]

        data0['Signal'] = data0['Signal'].replace(-999,0) 
        data0['day'] = data0['day'].replace(-999,np.nan) 
        data0['day'] = data0['day'].fillna(method='bfill')

        train0 = data0[start:end]
        train1 = data[start:end]

        ### 运行回测
        if period == 7:
            return self.backtest(train1,r2,r3,start, end,period,plot,Test)
        elif period == 8:
            return self.backtest(train0,r2,r3,start, end,period,plot,Test)
        else:
            print('请输入正确的周期！')
            return 0        
        
    """
    改进版遗传算法调参（进化算法）
    """
    # 适应度函数
    def fit(self, P1):    
        fitne = np.zeros(P1.shape[0])
        for i in range(P1.shape[0]):
            fitne[i] = self.function(start=str(self.star),end=str(self.star+self.T-1), P = P1[i,:])
        return fitne        
    
    def get_fitness(self,pred):
        return pred.flatten()
    
    """
    繁殖过程：由双亲繁殖出新的后代(输入父代种群pop,现在所处的进化轮数gen)
    """
    def make_kid(self,pop,gen):
        
        kids = np.zeros((self.N_KID, self.DNA_SIZE))  # 后代种群(空)
        
        ### 对每个后代进行赋值（即根据父母产生后代数值）
        for i in range(self.N_KID):
            # 繁殖
            parent1, parent2 = np.random.choice(np.arange(self.POP_SIZE), size=2, replace=False)    # 选择参与交叉得个体（即选择双亲）
            cp = np.random.randint(0, 2, self.DNA_SIZE, dtype=np.bool)                              # 选择交叉得位置
            kids[i,cp] =  pop[parent1, cp]                                                     # 交叉后得个体
            kids[i,~cp] = pop[parent2, ~cp]                                                   # 交叉后得个体
            
            # 变异
            kids[i,0]  += 10 * np.random.randn(1) / np.sqrt(gen+1)  # 变异强度随着进化的轮数的增加而减少
            kids[i,1:] +=  np.random.randn(1) / np.sqrt(gen+1)            
            
            # 防止超出上下界 
            for j in range(self.DNA_SIZE):
                kids[i,j] = np.clip(kids[i,j], 0,1)  # 这里上下界可以调整
                
            # 计算后代的适应度
            kids_fitness = self.get_fitness(self.fit(kids))
                     
        return kids, kids_fitness
    
    """
    淘汰过程：根据双亲和后代的适应度更新种群
    """
    def kill_bad(self,pop, kids,parent_fitness, kids_fitness):
        
        # 把父母和孩子放在一起,淘汰适应度较低的个体
        pop = np.vstack([pop, kids])    # 按行合并 
        fitness = np.hstack([parent_fitness, kids_fitness])
        best_index = np.argmin(fitness)   #  最优个体索引
        best_pop = pop[best_index,:]      # 最优个体
        good_index = np.argsort(-fitness)[:self.POP_SIZE]  # 选出适应度最大的前POP_SIZE个个体,np.argsort()从小到大排序
        pop = pop[good_index]                # 更新种群
        parent_fitness = fitness[good_index]  # 更新父代适应度
        
        return pop,best_pop,parent_fitness      
    
    """
    输入DNA_SIZE:DNA长度，即参数个数；POP_SIZE:遗传算法种群的个数；N_KID:每一轮进化产生的新个体数
    N_GENERATIONS:进化的轮数；start:滚动区间开始的年份
    """
    def GA(self):
        
        ### 生成初始种群
        pop = np.random.normal(size=(self.POP_SIZE, self.DNA_SIZE))  #初始种群
        pop = np.clip(pop,0,1)
        
        Best_pop = pop[0]                         # 初始化最好个体
        parent_fitness = self.get_fitness(self.fit(pop))
        ### 进化
        for gen in range(self.N_GENERATIONS):
            if gen%2 == 0:
                print('第：%d代'%gen)
            
            kids,kids_fitness = self.make_kid(pop,gen)    # 产生后代
            pop,Best_pop,parent_fitness = self.kill_bad(pop,kids,parent_fitness, kids_fitness) # 更新种群，更新最优个体
        return Best_pop

### 导入数据

In [14]:
"""
读取MySQL数据库
"""
# connect = create_engine('mysql+pymysql://root:cczq@localhost:3306/指数?charset=utf8')
# data1 = pd.read_sql_table('000300', con=connect)


"""
删除熔断数据
"""        
data1['day'] = [str(i)[:10] for i in data1.index]      # 时间精确到天
List1 = list(data1[data1.volume == 0].day.values)
set2 = set(List1)
set3 = []
for i in set2:
    if List1.count(i) >1:
        set3.append(i)
for s in set3:                                         # 一天内连续出现2次及以上成交量为0，则判断为熔断
    data1 = data1[data1['day']!=s]

### 实例化对象

In [99]:
Smartmonry = SmartMoney(df=data1,DNA_SIZE=6,POP_SIZE=10,N_KID=5,N_GENERATIONS=10,star=2012,T=1)
best_par = Smartmonry.GA()  # 返回最优参数

第：0代
第：2代
第：4代
第：6代
第：8代


### 使用得到的参数测试样本内的回测结果

In [102]:
Smartmonry.function(start=str(2012),end=str(2013),P=best_par,plot=True,Test=True)

参数：wind:8.000000, r1:0.100000, buy_std:1.189857, sell_std:3.000000,r2:0.954746, r3:0.063239,


<IPython.core.display.Javascript object>

买入次数： 34
卖出次数： 33
最终市值:0.99
最大回撤 23.18%
胜率：50.00%
夏普：-0.23


1.2551644401041386

### 使用得到的参数测试样本外的回测结果

In [101]:
Smartmonry.function(start=str(2013),end=str(2014),P=best_par,plot=True,Test=True)

参数：wind:8.000000, r1:0.100000, buy_std:1.189857, sell_std:3.000000,r2:0.954746, r3:0.063239,


<IPython.core.display.Javascript object>

买入次数： 37
卖出次数： 36
最终市值:0.97
最大回撤 28.92%
胜率：51.35%
夏普：-0.29


1.1896825264670727