## Algoritmos de otimização

Descrição: A plataforma smarttbot é uma empresa de tecnologia especializada em investimento automatizado na bolsa de valores. Ela possibilita que investidores escolham estratégias que são formadas por indicadores  e configurem parâmetros dos principais indicadores do mercado, existem diversas estratégias, mas o escopo desse projeto vai considerar a tangram. Os parâmetros  
Objetivo: Encontrar os melhores parâmetros da estratégia que retornem um maior lucro.

In [1]:
#importação das bibliotecas
import time
import random
import math
import pandas as pd
import numpy as np
import chardet

In [2]:
#¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨
#Serão constantes
ticket = 'WIN'                                     #papel negociado
direction_operations = 'comprado&vendido'          #operações possiveis: compra e venda a descoberto
amount_orders = 1                                  #quantidade de ordens 
start_time = '09:00'                               #horário inicial
end_time = '17:00'                                 #horário limite de operação
#¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨¨
#Serão variáveis
time_frame = 1                                     #tempo gráfico em min
stop = -200                                        #limite de perda por operação
gain = 200                                         #algo de ganho por operação

In [3]:
# carregando os dados
with open('M4.csv', 'rb') as f:
    result = chardet.detect(f.read())  # or readline if the file is large

base = pd.read_csv('M4.csv', encoding=result['encoding'],dtype='unicode')

colunas = ['Data','Hora', 'open', 'high', 'low', 'close','VOL']
base = base[colunas][1:200]
base.head()

Unnamed: 0,Data,Hora,open,high,low,close,VOL
1,2014.10.20,09:15,56265.0,56270.0,56250.0,56260.0,65.0
2,2014.10.20,09:16,56260.0,56290.0,56250.0,56290.0,80.0
3,2014.10.20,09:17,56285.0,56300.0,56270.0,56270.0,124.0
4,2014.10.20,09:18,56280.0,56290.0,56270.0,56285.0,25.0
5,2014.10.20,09:19,56290.0,56375.0,56290.0,56335.0,237.0


In [4]:
#Calculando alguns dos indicadores para alteração de parâmetros
class Indicators():
    def __init__(self,name='indicators'):
        self.name = name    
    def sma(self,data,period,column):
        # sma_ = pd.Series(data[column].rolling(period).mean(),name ='SMA'+str(period))
        data['SMA'+str(period)] = data[column].rolling(period).mean()
        return data #data.join(sma_)
    def ema(self,data,period,column):
        data['EMA'+str(period)]=data[column].ewm(ignore_na=False,min_periods=period,com=period,adjust=True).mean()
        return data
    def macd(self,data,period_short=26,period_long=12,period_signal=9,column='close'):
        remove_cols = []
        if not 'EMA'+str(period_long) in data.columns:
            data = self.ema(data,period_long,column)
            remove_cols.append('EMA'+str(period_long))
            
        if not 'EMA'+str(period_short) in data.columns:
            data = self.ema(data, period_short,column)
            remove_cols.append('EMA' + str(period_short))
    
        data['macd_val'] = data['EMA' + str(period_short)] - data['EMA' + str(period_long)]
        data['macd_signal_line'] = data['macd_val'].ewm(ignore_na=False, min_periods=0, com=period_signal, adjust=True).mean()
        data = data.drop(remove_cols, axis=1)
        return data
    def bands(self,data, trend_periods=20, deviation=2, column='close'):
        data['bol_bands_middle'] = data[column].ewm(ignore_na=False, min_periods=0, com=trend_periods, adjust=True).mean()
        for index, row in data.iterrows():
            s = data[column].iloc[index - trend_periods: index]
            sums = 0
            middle_band = data.at[index, 'bol_bands_middle']
            for e in s:
                #e = float(e)
                #print('verificacao:',e,middle_band,type(e),type(middle_band))
                #print('----------------------')
                sums += np.square(e - middle_band)
            
            std = np.sqrt(sums / trend_periods)
            
            upper_band = middle_band + (deviation * std)
            lower_band = middle_band - (deviation * std)
            
            data.at[index,'bol_bands_upper']= upper_band
            data.at[index,'bol_bands_lower']= lower_band
        return data
    def ifr(self,data,period=14,column='close'):
        delta = data[column].diff().dropna()
        u = delta * 0
        d = u.copy()
        u[delta > 0] = delta[delta > 0]
        d[delta < 0] = -delta[delta < 0]
        u = u.ewm(span=period,min_periods=0,adjust=False).mean() #first value is sum of avg gains
        d = d.ewm(span=period,min_periods=0,adjust=False).mean() #first value is sum of avg losses
        data['IFR']=1 - 1 / (1 + u/d)
        return data
    def vwap(self,data):
        vol = data.VOL.values
        price = data.close.values
        data['VWAP'] = (vol*price).cumsum()/vol.cumsum()
        return data
        

In [5]:
# Classe trade, faz as operações e retorna o ganho, assim como dataframe com todas as operações realizadas
class Env_trade():
    comprado = False
    vendido = False
    ficha = 0
    cont = 0
    valor = 0
    contC = 0
    contV = 0
    hora = 0
    posicao = 0
    def __init__(self,name='wind'):
        self.name = name
        self.CC = []
        self.VV = []
        self.saida = pd.DataFrame(columns=['tipo','entrada','saida','ganho','inicio','fim','duracao','ganhofinal','acumulado','recompensas'])
        self.rewards = []
        self.atual = 0
        self.result = 0
        self.rec = 0
    def agente_(self,dados,acao,stop,gain,verbose,forma):
        self.cont += 1    
        self.posicao = 0
        self.result = 0
        hora = float(dados[0].split(':')[0])
        if hora >= 17 and self.comprado == False and self.vendido == False:
            return self.CC,self.VV, self.saida,self.ficha,self.comprado,self.vendido,0
        if acao == 0:
            recompensa = 0
        elif acao == 1 and self.comprado == False:
            if self.ficha == 0:
                self.ficha = 1
                self.comprado = True
                self.vendido = False
            else:
                self.ficha = 0
                self.comprado = False
                self.vendido = False
            self.posicao = self.compra(dados[1],dados[0],self.ficha,verbose)
        elif acao == 2 and self.vendido == False: 
            if self.ficha == 0:
                self.ficha = 1
                self.vendido = True
                self.comprado = False
            else:
                self.ficha = 0
                self.vendido = False
                self.comprado = False
            self.posicao = self.venda(dados[1],dados[0],self.ficha,verbose)
        if self.ficha == 1:
            rec = self.valor -dados[4]
            if self.vendido:
                self.rewards.append(rec)
            else:
                self.rewards.append(-rec)
        if self.comprado or self.vendido:
            self.posicao = self.verifica(dados,gain,stop,verbose)
        recompensa = 0
        if self.rec != 0:
            recompensa = self.rec
            self.rec = 0
        if forma == 0:
            if self.comprado:
                recompensa = dados[4] - self.valor 
            if self.vendido:
                recompensa = self.valor - dados[4]
        if forma == 1:
            if self.comprado == False and self.vendido == False:
                self.atual = 0
            if self.comprado:
                recompensa = dados[4] - self.valor
                if self.atual == 0:
                    self.atual = recompensa
                else:
                    dif = recompensa - self.atual
                    self.atual = recompensa
                    recompensa = dif
            if self.vendido:
                recompensa = self.valor - dados[4]
                if self.atual == 0:
                    self.atual = recompensa
                else:
                    dif = recompensa - self.atual
                    self.atual = recompensa
                    recompensa = dif
        if forma == 2:
            recompensa = 0
            if self.posicao == 4 or self.posicao == 2:
                recompensa = self.result
        if verbose == 1:
            print('##########################')
            print('Contador: ',self.cont)
            # print('Posicao: ',self.posicao)
            print('Hora: ',dados[0])
            print('Open: ',dados[1])
            print('High: ',dados[2])
            print('Low: ',dados[3])
            print('close: ',dados[4])
            print('acao: ',acao)
            print('stop: ',stop)
            print('gain: ',gain)
            print('Comprado: ',self.comprado)
            print('Vendido: ',self.vendido)
            print('Qtd: ',self.contC,self.contV)
            print('recompensa: ',recompensa)
            print('##########################')
        return self.saida,self.comprado,self.vendido,recompensa
    def verifica(self,dados,gain,stop,verbose):
        if self.comprado:
            stopmax = dados[3]-self.valor
            gainmin = dados[2]-self.valor
            if stopmax < stop:
                pontos = self.valor - (-stop)
                self.ficha = 0
                self.vendido = False
                self.comprado = False
                self.rec = stop
                return self.venda(pontos,dados[0],self.ficha,verbose)
            if gainmin > gain: 
                pontos = self.valor + gain
                self.ficha = 0
                self.vendido = False
                self.comprado = False
                self.rec = gain
                return self.venda(pontos,dados[0],self.ficha,verbose)
        if self.vendido:
            stopmax = self.valor - dados[2]
            gainmin = self.valor - dados[3]
            if stopmax < stop:
                pontos = self.valor + (-stop)
                self.ficha = 0
                self.vendido = False
                self.comprado = False
                self.rec = stop
                return self.compra(pontos,dados[0],self.ficha,verbose)
            if gainmin > gain:
                pontos = self.valor - gain
                self.ficha = 0
                self.vendido = False
                self.comprado = False
                self.rec = gain
                return self.compra(pontos,dados[0],self.ficha,verbose)
        return self.posicao
    def compra(self,entrada,hora,ficha,verbose):
        if ficha == 1:
            self.valor = entrada
            self.contC += 1 
            self.hora = hora
            if verbose == 1:
                print('        ')
                print('********************')
                print('COMPRA: ',entrada)
                print('********************')
                print('        ')
            return 1
        else:
            if verbose == 1:
                print('        ')
                print('********************')
                print('VENDIDO: ',self.valor)
                print('COMPRA: ',entrada)
                print('Lucro: ',self.valor - entrada)
                print('inicio: ',self.hora,' termino: ',hora)
                print('Duracao: ',self.Duracao(self.hora,hora))
                print('recompensas: ',self.rewards)
                print('********************')
                print('        ')
            self.result = self.valor - entrada
            tempo = self.Duracao(self.hora,hora)
            self.VV.append(self.result)
            self.ficha = 0
            self.saida = self.saida.append({'tipo': 'venda',
                                            'entrada':self.valor,
                                            'saida':entrada,
                                            'ganho': self.result,
                                            'inicio':self.hora,
                                            'fim':hora,
                                            'duracao': tempo,
                                            'ganhofinal': self.result - tempo,
                                            'acumulado': sum(self.saida.ganhofinal),
                                            'recompensas': self.rewards}, ignore_index=True)
            self.rewards = []
            return 2
    def venda(self,entrada,hora,ficha,verbose):
        if ficha == 1:
            self.valor = entrada
            self.contV += 1
            self.hora = hora
            if verbose == 1:
                print('        ')
                print('********************')
                print('VENDA: ',entrada)
                print('********************')
                print('        ')
            return 3
        else:
            if verbose == 1:
                print('        ')
                print('********************')
                print('COMPRADO: ',self.valor)
                print('VENDA: ',entrada)
                print('LUCRO: ',entrada - self.valor)
                print('inicio: ',self.hora,' termino: ',hora)
                print('Duracao: ',self.Duracao(self.hora,hora))
                print('recompensas: ',self.rewards)
                print('********************')
                print('        ')
            self.result = entrada - self.valor
            tempo = self.Duracao(self.hora,hora)
            self.CC.append(self.result )
            self.ficha = 0
            self.saida = self.saida.append({'tipo': 'compra',
                                            'entrada':self.valor,
                                            'saida':entrada,
                                            'ganho': self.result,
                                            'inicio':self.hora,
                                            'fim':hora,
                                            'duracao': tempo,
                                            'ganhofinal': self.result - tempo,
                                            'acumulado': sum(self.saida.ganhofinal),
                                            'recompensas': self.rewards}, ignore_index=True)
            self.rewards = []
            return 4          
    def Duracao(self,base1a,base2a):
        base1 = float(base1a.split(':')[1])
        base2 = float(base2a.split(':')[1])
        base3 = float(base1a.split(':')[0])
        base4 = float(base2a.split(':')[0])
        if base1 > base2:
            tempo = ((60*(base4-base3)) - base1)+ base2
        else:
            tempo = base2 - base1
        if base3 > 17 or base4 > 17 or tempo > 50:
            tempo = 0
        return tempo
    def reset(self):
        self.saida = self.saida.drop([i for i in range(len(self.saida))])
        self.ficha = 0
        self.cont = 0
        self.VV = []
        self.CC = []
        self.rewards = []
        self.comprado = False
        self.vendido = False

In [6]:
trader = Env_trade()
base = base.drop(['Data'],axis=1)
base['open'] = base['open'].astype(float)
base['high'] = base['high'].astype(float)
base['low'] = base['low'].astype(float)
base['close'] = base['close'].astype(float)
#agente(self,dados,acao,stop,gain,verbose=0,forma=0):
for i in range(100):
    action = random.randrange(0,3)
    result,buy,shell,reward = trader.agente_(base.values[i],action,stop,gain,0,0)

In [7]:
print('Ganho total: ',sum(result.ganhofinal))

Ganho total:  -292.0


In [8]:
#Configuração dos parâmetros
#Medias Moveis
regras_mm_curta = [{'tipo':['simples','exponecial'],
                    'periodo':[i for i in range(100)],
                    'valor_usado':['close','open','high','low']}]
regras_mm_longa = [{'tipo':['simples','exponecial'],
                    'periodo':[i for i in range(100)],
                    'valor_usado':['close','open','high','low']}]
regras_macd = [{'periodo_media_c':[i for i in range(100)],
                'periodo_media_l':[i for i in range(100)],
                'linha_sinal':[i for i in range(100)],
                'valor_usado':['close','open','high','low']}]
regras_ifr = [{'periodo':[i for i in range(100)],
               'valor_usado':['close','open','high','low']}]
regras_bands = [{'periodo':[i for i in range(100)],
               'valor_usado':['close','open','high','low']}]
print('media movel curta:',regras_mm_curta[0]['tipo'][0],regras_mm_curta[0]['periodo'][0],regras_mm_curta[0]['valor_usado'][0])

media movel curta: simples 0 close


# Indicadores

In [9]:
# Instância do objeto Indicators, calculando os valores dos indicadores
import random
indicators = Indicators()
base1 = base[['open', 'high', 'low', 'close','VOL']].astype(float)
#parâmetros aleatórios
parametro_media_curta = [random.randrange(0,2),random.randrange(0,100),random.randrange(0,4)]
parametro_media_longa = [random.randrange(0,2),random.randrange(0,100),random.randrange(0,4)]
parametros_macd = [random.randrange(0,100),
                   random.randrange(0,100),
                   random.randrange(0,100),
                   random.randrange(0,4)]

parametros_ifr = [random.randrange(0,100),random.randrange(0,4)]
parametros_bands = [random.randrange(0,100),random.randrange(0,4)]

if regras_mm_curta[0]['tipo'][parametro_media_curta[0]] == 'simples':
    base1 = indicators.sma(base1,
                           regras_mm_curta[0]['periodo'][parametro_media_curta[1]],
                           regras_mm_curta[0]['valor_usado'][parametro_media_curta[2]])
else:
    base1 = indicators.ema(base1,
                           regras_mm_curta[0]['periodo'][parametro_media_curta[1]],
                           regras_mm_curta[0]['valor_usado'][parametro_media_curta[2]])
    
if regras_mm_longa[0]['tipo'][parametro_media_longa[0]] == 'simples':
    base1 = indicators.sma(base1,
                           regras_mm_longa[0]['periodo'][parametro_media_longa[1]],
                           regras_mm_longa[0]['valor_usado'][parametro_media_longa[2]])
else:
    base1 = indicators.ema(base1,
                           regras_mm_longa[0]['periodo'][parametro_media_longa[1]],
                           regras_mm_longa[0]['valor_usado'][parametro_media_longa[2]])
# def macd(self,data,period_short=26,period_long=12,period_signal=9,column='close'):
base1 = indicators.macd(base1,
                       regras_macd[0]['periodo_media_c'][parametros_macd[0]],
                       regras_macd[0]['periodo_media_l'][parametros_macd[1]],
                       regras_macd[0]['linha_sinal'][parametros_macd[2]],
                       regras_macd[0]['valor_usado'][parametros_macd[3]])
base1 = indicators.vwap(base1)
base1 = indicators.ifr(base1,
                       regras_ifr[0]['periodo'][parametros_ifr[0]],
                       regras_ifr[0]['valor_usado'][parametros_ifr[1]])
# bands(self,data, trend_periods=20, deviation=2, column='close')
base1 = indicators.bands(base1,
                        regras_bands[0]['periodo'][parametros_bands[0]],
                        2,
                        regras_bands[0]['valor_usado'][parametros_bands[1]])

base1 = base1.dropna()
print('media curta: ',parametro_media_curta,
      regras_mm_curta[0]['tipo'][parametro_media_curta[0]],
      regras_mm_curta[0]['periodo'][parametro_media_curta[0]],
      regras_mm_curta[0]['valor_usado'][parametro_media_curta[0]])
print('media longa: ',parametro_media_longa,
        regras_mm_longa[0]['tipo'][parametro_media_longa[0]],
        regras_mm_longa[0]['periodo'][parametro_media_longa[1]],
        regras_mm_longa[0]['valor_usado'][parametro_media_longa[2]])
print('macd: ',parametros_macd,
        regras_macd[0]['periodo_media_c'][parametros_macd[0]],
        regras_macd[0]['periodo_media_l'][parametros_macd[1]],
        regras_macd[0]['linha_sinal'][parametros_macd[2]],
        regras_macd[0]['valor_usado'][parametros_macd[3]])

print('ifr: ',parametros_ifr,
        regras_ifr[0]['periodo'][parametros_ifr[0]],
        regras_ifr[0]['valor_usado'][parametros_ifr[1]])
base1.head(10)

media curta:  [1, 30, 0] exponecial 1 open
media longa:  [0, 45, 0] simples 45 close
macd:  [48, 77, 59, 2] 48 77 59 high
ifr:  [49, 1] 49 open


Unnamed: 0,open,high,low,close,VOL,EMA30,SMA45,macd_val,macd_signal_line,VWAP,IFR,bol_bands_middle,bol_bands_upper,bol_bands_lower
77,56200.0,56225.0,56140.0,56170.0,221.0,56125.174499,56112.444444,-2.488909,-2.488909,56137.165055,0.537002,56130.708227,56130.708227,56130.708227
78,56170.0,56190.0,56150.0,56165.0,174.0,56126.567106,56117.444444,-2.293571,-2.390419,56137.475781,0.519756,56131.377592,56131.377592,56131.377592
79,56165.0,56210.0,56165.0,56200.0,239.0,56129.127947,56122.111111,-1.999134,-2.257792,56138.420005,0.516875,56132.706772,56132.706772,56132.706772
80,56190.0,56205.0,56110.0,56125.0,219.0,56128.984368,56125.0,-1.743106,-2.125859,56138.236834,0.530435,56132.558623,56132.558623,56132.558623
81,56125.0,56215.0,56090.0,56175.0,347.0,56130.580865,56128.444444,-1.443499,-1.984762,56139.015068,0.492962,56133.368446,56133.368446,56133.368446
82,56180.0,56210.0,56155.0,56180.0,228.0,56132.291279,56131.222222,-1.18273,-1.845411,56139.577316,0.522683,56134.251759,56134.251759,56134.251759
83,56180.0,56230.0,56160.0,56200.0,351.0,56134.629202,56134.444444,-0.824241,-1.692072,56140.826999,0.522683,56135.488312,56135.488312,56135.488312
84,56195.0,56195.0,56145.0,56170.0,123.0,56135.847757,56137.222222,-0.669839,-1.556651,56141.036914,0.530822,56136.132848,56335.69379,55936.571905
85,56165.0,56165.0,56105.0,56120.0,170.0,56135.302983,56138.777778,-0.684655,-1.453123,56140.829761,0.512613,56135.833621,56333.607922,55938.059319
86,56115.0,56125.0,56105.0,56115.0,99.0,56134.606532,56139.888889,-0.916922,-1.395357,56140.682486,0.4838,56135.449809,56330.408543,55940.491074


In [10]:
#class regras
class rules():
    def __init__(self,name='regras'):
        self.name = name
        self.aux_venda =  True
        self.aux_compra = True
        self.macd_venda =  True
        self.macd_compra = True
        self.vwap_venda =  True
        self.vwap_compra = True
    def medias(self,ma_curta,ma_longa,regra):
        if np.isnan(ma_curta) or np.isnan(ma_longa):
            return 0
        r1 = True if regra=='cruz_mma'else False
        r2 = 'nada'
        if ma_curta > ma_longa and self.aux_compra:
            self.aux_compra = False
            self.aux_venda = True
            r2 = 'compra'
        if ma_curta < ma_longa and self.aux_venda:
            self.aux_compra = True
            self.aux_venda = False
            r2 = 'venda'
        if r1:
            if r2 =='compra':
                return 1
            if r2 == 'venda':
                return 2
            else:
                return 0
        else:
            if ma_curta > ma_longa:
                return 1
            else:
                return 2
    def macd(self,macd,sinal,regra):
        if np.isnan(macd) or np.isnan(sinal):
            return 0
        r1 = True if regra=='cruz_macd'else False
        r2 = 'nada'
        if macd > sinal and self.macd_compra:
            self.macd_compra = False
            self.macd_venda = True
            r2 = 'compra'
        if macd < sinal and self.macd_venda:
            self.macd_compra = True
            self.macd_venda = False
            r2 = 'venda'
        if r1:
            if r2 =='compra':
                return 1
            if r2 == 'venda':
                return 2
            else:
                return 0
        else:
            if macd > sinal:
                return 1
            else:
                return 2
    def vwap(self,preco,vwap,regra):
#       rompimento da vwap, compra quando rompe para cima, venda quando rompe para baixo.
#       compra acima da vwap/vende abaixo do vwap
#       vende acima da vwap/compra abaixo da vwap
        if np.isnan(vwap) and np.isnan(preco):
            return 0
        r1 = True if regra=='rompimento'else False
        r2 = True if regra=='compra_acima'else False
        r3 = True if regra=='venda_acima'else False
        r4 = 'nada'
        if preco > vwap and self.vwap_compra:
            self.vwap_compra = False
            self.vwap_venda = True
            r4 = 'compra'
        if preco < vwap and self.vwap_venda:
            self.vwap_compra = True
            self.vwap_venda = False
            r4 = 'venda'
        if r1:
            if r4 =='compra':
                return 1
            if r4 == 'venda':
                return 2
            else:
                return 0
        if r2:
            if preco > vwap:
                return 1
            else:
                return 2
        if r3:
            if preco < vwap:
                return 1
            else:
                return 2
        return 0

In [11]:
regras = rules()
media1 = base1.columns[5]
media2 = base1.columns[6]
media3 = base1.columns[7]
media4 = base1.columns[8]
media5 = base1.columns[9]
base1 = base1.reset_index(drop=True)
print(media1,media2,media3,media4,media5)
regras_medias_a = ['cruz_mma','cruz_mma1']
trader.reset()
for s in range(len(base1)):
    action = regras.medias(base1[media1][s],base1[media2][s],regras_medias_a[0])
    result,buy,shell,reward = trader.agente_(base.values[s],action,stop,gain,0,0)
result

EMA30 SMA45 macd_val macd_signal_line VWAP


Unnamed: 0,tipo,entrada,saida,ganho,inicio,fim,duracao,ganhofinal,acumulado,recompensas
0,compra,56265.0,56360.0,95.0,09:15,09:22,7.0,88.0,0,"[-5.0, 25.0, 5.0, 20.0, 70.0, 65.0, 85.0]"
1,compra,56215.0,56015.0,-200.0,10:01,10:15,14.0,-214.0,88,"[-20.0, -70.0, -35.0, -10.0, -45.0, 30.0, 10.0..."


In [12]:
trader.reset()
regras_macd_a = ['cruz_macd','cruz_macd1']
for s in range(len(base1)):
    action = regras.macd(base1[media1][s],base1[media2][s],regras_macd_a[0])
    result,buy,shell,reward = trader.agente_(base.values[s],action,stop,gain,0,0)    
result

Unnamed: 0,tipo,entrada,saida,ganho,inicio,fim,duracao,ganhofinal,acumulado,recompensas
0,compra,56265.0,56360.0,95.0,09:15,09:22,7.0,88.0,0,"[-5.0, 25.0, 5.0, 20.0, 70.0, 65.0, 85.0]"
1,compra,56215.0,56015.0,-200.0,10:01,10:15,14.0,-214.0,88,"[-20.0, -70.0, -35.0, -10.0, -45.0, 30.0, 10.0..."


In [14]:
trader.reset()
regras_vwap_a = ['rompimento','compra_acima','venda_acima']
for s in range(len(base1)):
    action = regras.vwap(base1['close'][s],base1[media5][s],regras_vwap_a[0])
    result,buy,shell,reward = trader.agente_(base.values[s],action,stop,gain,0,0)    
result

Unnamed: 0,tipo,entrada,saida,ganho,inicio,fim,duracao,ganhofinal,acumulado,recompensas
0,venda,56280.0,56290.0,-10.0,09:18,09:19,1.0,-11.0,0,[-5.0]
1,venda,56370.0,56170.0,200.0,09:23,09:27,4.0,196.0,-11,"[-5.0, 90.0, 90.0, 150.0, 230.0]"
2,compra,55750.0,55750.0,0.0,10:59,11:00,1.0,-1.0,185,[-0.0]
3,compra,55790.0,55590.0,-200.0,11:02,11:07,5.0,-205.0,184,"[-90.0, -30.0, -25.0, 25.0, 10.0, -205.0]"
