# <font color='red'>Backtest vectorizado para una estrategia 'Regresion lineal' definida.</font>

### Hackeado by J3viton (learning BackTesting 2021).

---

En este notebook vamos a automatizar el backtesting para estrategias. Previamente tenemos que definir **la estrategia** usando el template (import estrategia_XX as rg), donde definimos la clase estrategia que contiene los metodos de analisis, entreda y salida de mercado. Este módulo se programa y adapta para cada estrategia. Luego en el metodo 'analisis' se crea un fichero excel con las metricas y rendimientos para evaluar la estrategia.

Vamos a usar el módulo Pandas, para realizar un backtest vectorizado, es decir calcular el resultado del backtest sin iterar sobre las filas (barras) de la serie temporal.

Posteriormente graficamos y mostramos los parametros generales que nos permiten analizar la estrategia.

#### J3Viton  2021

link a la base:

https://github.com/Python-para-Trading/Webinars-Docs/blob/master/Webinar%202/Webinar%202%20-%20Backtest%20con%20Pandas%20v%202.ipynb.

---

# DEFINICION DEL SISTEMA

Como es usual, importamos los módulos que vamos a necesitar para las distintas tareas, y preparamos Matplotlib para una mejor visualización de los gráficos en el notebook.

Se importa un modulo llamado analisis, en realidad se trata de un archivo .py con algunas funciones de apoyo para el trabajo, debe estar guardado en la misma carpeta que este notebook.
Se importa el módulo 'estrategia_XX', donde se define la estrategia de entreda y salida

Es importante tener clara la lógica del sistema, pues debemos plasmarla de forma sencilla y correcta en el dataframe para realizar el backtest del mismo.


In [1]:
import analisis
import regresionAMedia as rg  #cambiar segun el módulo con la estrategia implementado
import pandas as pd
import datetime as dt
from time import time
import yfinance as yf
import numpy as np

{'id': 1473252352, 'first_name': 'vital_bot', 'is_bot': True, 'username': 'vital_quant_bot', 'can_join_groups': True, 'can_read_all_group_messages': False, 'supports_inline_queries': False}


In [2]:
%matplotlib inline
import matplotlib.pyplot as plt
plt.rcParams['figure.figsize'] = 18, 8
plt.style.use('ggplot')

from IPython.display import display, Markdown

***0.- RECOGIDA DE DATOS INICIALES***
Introducimos el instrumento y las fechas


In [3]:
instrumento_ = 'HSY'   # ticker del valor en yahooFinance

Fecha_Cominezo_Backtesting = dt.datetime(2015,1,2)
Fecha_Final_Backtesting    = dt.datetime(2021,11,18)
Fecha_Final_Backtesting    = dt.datetime.today()




***1.- Rango fechas a analizar***

Definimos el rango global de datos historicos que vamos a evaluar.
Definimos la ventana que vamos a ir desplazando por todo el espectro para ir analilazando como se comporta la estrategia. La funion 'analisis' nos vale para tiempo real y para backtesting, para back le pasamos la ventana como si la fecha de fin de la ventana fuera la fecha de hoy.
Tener en cuenta que la 'ventana' tiene uqe tener una anchura que nos permita hacer los calculos en rolling (ejemplo EMA 200)

In [4]:
# Rango completo para backTesting
#start2 =dt.datetime(2008,1,2)
start2= Fecha_Cominezo_Backtesting 
#end2   =dt.datetime(2021,11,18)
end2= Fecha_Final_Backtesting 
start_G= start2.strftime("%Y-%m-%d")
end_G  =   end2.strftime("%Y-%m-%d")
TOTAL_len= (end2-start2).days
print('Tamaño timeseries global a analizar:  ', TOTAL_len, 'sesiones')

#ventana de analisis 200 sesiones
startWindow2 = start2  #dt.datetime(2008,1,5)
endWindow2   =startWindow2 + dt.timedelta(days=500) #ventana grande para que se puedan hacer los calculos de EMA200
startWindow= startWindow2.strftime("%Y-%m-%d")
endWindow  =   endWindow2.strftime("%Y-%m-%d")
window_len= (endWindow2-startWindow2).days
print('Tamaño de la ventana a analizar paso a paso:  ', window_len, 'sesiones')

Tamaño timeseries global a analizar:   2695 sesiones
Tamaño de la ventana a analizar paso a paso:   500 sesiones


In [5]:
 #dff = pd.DataFrame(columns=('Close','Volume', 'Senal', 'Dif_Close', 'Retornos','Capital'))

***2.- Descargamos los datos para el marco Global***

In [6]:
instrumento = instrumento_  # 'rovi.mc'  #Vamos título a título. Mejora: Conjunto de títulos

In [7]:
dff = yf.download(instrumento, start_G,end_G)

[*********************100%***********************]  1 of 1 completed


In [8]:
dff.dropna(inplace=True)  
dff.head()

Unnamed: 0_level_0,Open,High,Low,Close,Adj Close,Volume
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2015-01-02,104.330002,104.589996,102.93,103.709999,87.301659,786500
2015-01-05,103.150002,104.0,102.5,102.980003,86.687164,857800
2015-01-06,103.349998,104.300003,102.900002,103.32,86.973366,1241200
2015-01-07,104.199997,105.489998,103.830002,105.139999,88.505432,1020600
2015-01-08,105.93,107.5,105.510002,107.169998,90.214256,1245800


***3.- Creamos la clase strategy que tiene toda la lógica***

In [9]:
regreMedia= rg.StrategyClass(back=True)    #Creamos la clase

***4.- Recorremos el dataframe con valores buscando las señales de la estrategia***

In [10]:
dff.index

DatetimeIndex(['2015-01-02', '2015-01-05', '2015-01-06', '2015-01-07',
               '2015-01-08', '2015-01-09', '2015-01-12', '2015-01-13',
               '2015-01-14', '2015-01-15',
               ...
               '2022-05-06', '2022-05-09', '2022-05-10', '2022-05-11',
               '2022-05-12', '2022-05-13', '2022-05-16', '2022-05-17',
               '2022-05-18', '2022-05-19'],
              dtype='datetime64[ns]', name='Date', length=1859, freq=None)

## Proceso de backTesting ##

En este 'for' vamos recorriendo la muestra del historico de datos (TOTAL), desplazando una sesión hacia el futuro 
en cada iteracion. Vamos pasando la movilola del pasado sesión a sesión por el análisis descrito en Strategy class.

Ouput:
El sistema registra los siguientes parámetros:

.-
.-
.-


In [11]:
startWindow

'2015-01-02'

In [12]:
tiempo_inicial = time()   # Tomamos tiempos para ver cuanto tarda en hacer la estrategia

In [13]:
dfe = pd.DataFrame({'A' : []})   #df empty

***En este 'for' desplazamos la ventana sesión a sesión a lo largo de todo el rango de fechas. Dejamos que las funciones de la clase estrategia hagan el trabajo de comprar//vender y anotar***


In [None]:
#Para pruebas
#TOTAL_len =1000

for i in range(TOTAL_len):
    endWindow3   =endWindow2 + dt.timedelta(days=i) 
    endWindow    =endWindow3.strftime("%Y-%m-%d")
    print ('end date:', endWindow)
    
    if(endWindow in dff.index):
        df_aux= dff.loc[startWindow:endWindow]       #voy pasando los datos desplazando la ventana
        
        recogo = regreMedia.analisis(instrumento, startWindow, endWindow, df_aux) #Llamada a la clase estrategia. LA CLAVE DE TODO!!!
        
        print ('................................................Analizando, muestra', i, 'de', TOTAL_len, 'fecha', endWindow)
        
            
    else:
        print('..............Día sin sesión, next please')

        

end date: 2016-05-16
fichero no existe
aqui estoy en out
 datos desde archivo
................................................Analizando, muestra 0 de 2695 fecha 2016-05-16
end date: 2016-05-17
 Datos desde archivo
Coefficients: 
 [-0.04325733]
Independent term: 
 100.98555965327948
Coefficients: 
 [0.00193612]
Independent term: 
 90.03540553761951
Coefficients: 
 [-0.028127]
Independent term: 
 94.32777779977307
  Instrumento  long_short_out       date      precio  beneficio  stoploss
0      IBE.MC               1 2011-08-10  123.000000        NaN       NaN
1         HSY               0 2019-10-16  151.529999  11.336146  5.002031
................................................Analizando, muestra 1 de 2695 fecha 2016-05-17
end date: 2016-05-18
 Datos desde archivo
Coefficients: 
 [-0.04306546]
Independent term: 
 100.96349518685055
Coefficients: 
 [0.0022297]
Independent term: 
 89.99299517958912
Coefficients: 
 [-0.02778748]
Independent term: 
 94.31114155946763
  Instrumento  long_s

 Datos desde archivo
Coefficients: 
 [-0.03933873]
Independent term: 
 100.52563545976135
Coefficients: 
 [0.00926022]
Independent term: 
 89.31315764128273
Coefficients: 
 [-0.02383089]
Independent term: 
 94.10822060795839
  Instrumento  long_short_out       date      precio  beneficio  stoploss
0      IBE.MC               1 2011-08-10  123.000000        NaN       NaN
1         HSY               0 2019-10-16  151.529999  11.336146  5.002031
................................................Analizando, muestra 22 de 2695 fecha 2016-06-07
end date: 2016-06-08
 Datos desde archivo
Coefficients: 
 [-0.03900098]
Independent term: 
 100.4852180349599
Coefficients: 
 [0.00967272]
Independent term: 
 89.29311440652876
Coefficients: 
 [-0.02353967]
Independent term: 
 94.09259148641533
  Instrumento  long_short_out       date      precio  beneficio  stoploss
0      IBE.MC               1 2011-08-10  123.000000        NaN       NaN
1         HSY               0 2019-10-16  151.529999  11.336146 

 Datos desde archivo
Coefficients: 
 [-0.03326003]
Independent term: 
 99.78481297261446
Coefficients: 
 [0.01923756]
Independent term: 
 88.84196222903122
Coefficients: 
 [-0.01938856]
Independent term: 
 93.85990973116365
  Instrumento  long_short_out       date      precio  beneficio  stoploss
0      IBE.MC               1 2011-08-10  123.000000        NaN       NaN
1         HSY               0 2019-10-16  151.529999  11.336146  5.002031
................................................Analizando, muestra 42 de 2695 fecha 2016-06-27
end date: 2016-06-28
 Datos desde archivo
Coefficients: 
 [-0.03288197]
Independent term: 
 99.73780735237717
Coefficients: 
 [0.02012299]
Independent term: 
 88.77896220990081
Coefficients: 
 [-0.01904889]
Independent term: 
 93.84009574096764
  Instrumento  long_short_out       date      precio  beneficio  stoploss
0      IBE.MC               1 2011-08-10  123.000000        NaN       NaN
1         HSY               0 2019-10-16  151.529999  11.336146  

 Datos desde archivo
Coefficients: 
 [-0.02113328]
Independent term: 
 98.24808317172756
Coefficients: 
 [0.05891935]
Independent term: 
 86.11257435585136
Coefficients: 
 [-0.01242459]
Independent term: 
 93.43587379788097
  Instrumento  long_short_out       date      precio  beneficio  stoploss
0      IBE.MC               1 2011-08-10  123.000000        NaN       NaN
1         HSY               0 2019-10-16  151.529999  11.336146  5.002031
................................................Analizando, muestra 64 de 2695 fecha 2016-07-19
end date: 2016-07-20
 Datos desde archivo
Coefficients: 
 [-0.02038204]
Independent term: 
 98.15092278590038
Coefficients: 
 [0.0618303]
Independent term: 
 85.8969848222875
Coefficients: 
 [-0.01185374]
Independent term: 
 93.39971979548757
  Instrumento  long_short_out       date      precio  beneficio  stoploss
0      IBE.MC               1 2011-08-10  123.000000        NaN       NaN
1         HSY               0 2019-10-16  151.529999  11.336146  5.

 Datos desde archivo
Coefficients: 
 [-0.01086948]
Independent term: 
 96.89876131571748
Coefficients: 
 [0.10245592]
Independent term: 
 82.84193554892468
Coefficients: 
 [-0.00197304]
Independent term: 
 92.60744242261534
  Instrumento  long_short_out       date      precio  beneficio  stoploss
0      IBE.MC               1 2011-08-10  123.000000        NaN       NaN
1         HSY               0 2019-10-16  151.529999  11.336146  5.002031
................................................Analizando, muestra 84 de 2695 fecha 2016-08-08
end date: 2016-08-09
 Datos desde archivo
Coefficients: 
 [-0.01021853]
Independent term: 
 96.81153288009973
Coefficients: 
 [0.10546435]
Independent term: 
 82.61429676909944
Coefficients: 
 [-0.00090401]
Independent term: 
 92.50800813750574
  Instrumento  long_short_out       date      precio  beneficio  stoploss
0      IBE.MC               1 2011-08-10  123.000000        NaN       NaN
1         HSY               0 2019-10-16  151.529999  11.336146  

  Instrumento  long_short_out       date      precio  beneficio  stoploss
0      IBE.MC               1 2011-08-10  123.000000        NaN       NaN
1         HSY               0 2019-10-16  151.529999  11.336146  5.002031
................................................Analizando, muestra 105 de 2695 fecha 2016-08-29
end date: 2016-08-30
 Datos desde archivo
Coefficients: 
 [-0.00098783]
Independent term: 
 95.5519458293427
Coefficients: 
 [0.13294179]
Independent term: 
 81.57344148208846
Coefficients: 
 [0.01649002]
Independent term: 
 90.99793746309325
***************** NoGo
***************** Señal...
  Instrumento  long_short_out       date      precio  beneficio  stoploss
0      IBE.MC               1 2011-08-10  123.000000        NaN       NaN
1         HSY               1 2016-08-30   99.650002   8.511799  5.451854
................................................Analizando, muestra 106 de 2695 fecha 2016-08-30
end date: 2016-08-31
aqui estoy en out
 datos desde archivo
.........

aqui estoy en out
 datos desde archivo
................................................Analizando, muestra 164 de 2695 fecha 2016-10-27
end date: 2016-10-28
aqui estoy en out
 datos desde archivo
................................................Analizando, muestra 165 de 2695 fecha 2016-10-28
end date: 2016-10-29
..............Día sin sesión, next please
end date: 2016-10-30
..............Día sin sesión, next please
end date: 2016-10-31
aqui estoy en out
 datos desde archivo
................................................Analizando, muestra 168 de 2695 fecha 2016-10-31
end date: 2016-11-01
aqui estoy en out
 datos desde archivo
................................................Analizando, muestra 169 de 2695 fecha 2016-11-01
end date: 2016-11-02
aqui estoy en out
 datos desde archivo
................................................Analizando, muestra 170 de 2695 fecha 2016-11-02
end date: 2016-11-03
aqui estoy en out
 datos desde archivo
................................................An

................................................Analizando, muestra 232 de 2695 fecha 2017-01-03
end date: 2017-01-04
aqui estoy en out
 datos desde archivo
................................................Analizando, muestra 233 de 2695 fecha 2017-01-04
end date: 2017-01-05
aqui estoy en out
 datos desde archivo


***Recogemos los datos de las entradas que ha realizado la Estrategia***

In [None]:
data=rg.StrategyClass.dfLog
#data.dropna(inplace=True) 

In [None]:
data.tail()

In [None]:
data['Senal'].plot(title = 'Señales de compra de la estrategia ' )
# Ploteando una parte
#data.loc['2010':'2022','Senal'].plot(title = 'Señales Regresión a la media ' +instrumento,xlim=('2010','2022'))

In [None]:
tiempo_final = time() 
 
tiempo_ejecucion = (tiempo_final - tiempo_inicial)/60
 
print ('El tiempo de ejecucion fue:',tiempo_ejecucion,"minutos") #En segundos

In [None]:
data.loc['2011-01-04':'2019-11-04']

In [None]:
#Guardamos el resultado del analisis en un pickle
#dff.to_pickle("./primerBack_IBE.pkl")

***3.- Ingeniería de datos para calcular la bondad de la estrategia***

In [None]:

data['Dif_Close'] = data.Price.pct_change()
data['Retornos'] = data.Dif_Close * data.Senal.shift(1)   
data['Capital'] = (data.Retornos + 1).cumprod() * 100
    
rg.StrategyClass.dfLog=data  #Ojo a esta liena, no me cuadra.

#quant_j.salvarExcel(StrategyClass.dfLog, "log"+instrumento)   
#data.to_pickle('almacen')    #df = pd.read_pickle(file_name)

>Para calcular los retornos del sistema, calculamos la diferencia relativativa entre el precio de cierre y el del día anterior. Para posteriormente multiplicarlo por la señal que del día anterior que nos indicaba la posición a tomar (si estaba comprado, sumo beneficio).

In [None]:
data.tail()

In [None]:
data[60:]

>El capital, por comodidad, lo calcularemos en base 100, es decir como si iniciaramos la inversión con 100 unidades monetarias. Para su calculo arrastramos el producto acumulado de los retornos mas 1, multiplicados como dijimos por 100.

Pero para observar gráficamente la evolución del sistema necesitamos un gráfico con mas información. Para ello definimos una función que nos mostrará un gráfico con la evolución de nuestra estrategia, comparandola con la del activo. En un subgráfico se visualizará el drawdown del sistema, comparado de nuevo con el del activo. Y por útlimo las posiciones que toma el sistema.

In [None]:
def grafico (df):
    estudio = df.copy()
    
    DD_bh, maxDD, maxDD_ini, maxDD_fin = analisis.DrawDown(estudio.Dif_Close[60:], info = False) 
    
    DD, maxDD, maxDD_ini, maxDD_fin = analisis.DrawDown(estudio.Retornos.fillna(0), info = False) 

    fig, (ax1, ax2, ax3) = plt.subplots(3, 1, sharex=True, figsize=(18, 12), gridspec_kw = {'height_ratios':[3, 1, 1]})
    fig.suptitle('Estrategia vs B & H', fontsize=20)

    #Primer plot analiza la evolcuion de una inversion de 100€ en buy&hold y la estrategia)
    ax1.plot(estudio.Capital)
    ax1.plot((estudio.Price) * (100/estudio.Price[1]))
    ax1.set_title('Capital')
    ax1.legend(['Estrategia','Buy & Hold'])

    ax2.plot(DD*100, c='0.5')
    ax2.plot(DD_bh*100, c='y')
    ax2.fill_between(DD.index, 0, DD*100, color='0.7')
    ax2.set_title('Drawdown')
    ax2.legend(['Estrategia','Buy & Hold'])

    ax3.plot(estudio.Senal, c='orange')
    #ax3.fill_between(estudio.index, 0, estudio.Senal*100, color='orange')
    ax3.set_title('Posición')

    plt.show()
    return

In [None]:
print(instrumento)

In [None]:
grafico(data)

---

In [None]:
#data[55:70]

---

# ANALISIS DEL SISTEMA

In [None]:
Beneficio_Bruto = data.Capital[-1] - data.Capital[1]
print ('Beneficio Bruto : {:.2f} €  con una inverison de 100€'.format(Beneficio_Bruto))

In [None]:
#Rentabilidad anual compuesta. Calculamos lo que la inversion se ha incrementado cada año con el interes compuesto
CAGR = analisis.CAGR(data.Retornos)
print ('CAGR : {:.2f}%'.format(CAGR * 100))

In [None]:
#Ratio calculado restando una rentabilidad segura a nuestra rentabilidad de estrategia y dividido por el riego (=volatilidad)
data.Retornos=data.Retornos.replace(0,np.e)  #Quito los cero (no sepuede hacer logariotmo de cero), pero no se que poner
Sharpe = CAGR / (np.log(data.Retornos + 1).std(skipna=True) * 252 ** 0.5)
print ('Sharpe : {:.3f}'.format(CAGR ))

In [None]:
# Actualizo la excel con los economic
regreMedia.analisisEconomics(instrumento)

---


In [None]:
# 

### Cálculo esperanza matemática
 
 (%Aciertos * beneficioMedio )-(%Errores * perdidaMedia)
 Nos da idea el benefcio esperado por entrada

In [None]:
print("Numero operaciones con beneficio ->", 
      data[data['ExitReason'] > 0]['ExitReason'].count()) 
print("Numero operaciones con perdidas ->", 
      data[data['ExitReason'] < 0]['ExitReason'].count()) 
  
data[data['ExitReason']>0]['ExitReason'] 

data[data['Senal']>0][1:10]
data[data['Senal']>0].index[1]

In [None]:
# ENTRADAS
print (data[(data['Senal']>0) & (data['Beneficio']>0)].index[0])
data[(data['Senal']>0) & (data['Beneficio']>0) ][0:5] 
# SALIDA PERDIDAS
print (data[(data['Senal'].shift(1) >0) & (data['ExitReason']== -1)].index[0])
data[(data['Senal'].shift(1) >0) & (data['ExitReason']== -1)][0:5]
# SALIDA GANANCIAS
data[(data['Senal'].shift(1) >0) & (data['ExitReason']== 1)][0:5]

In [None]:
serieIndicesENTRADA=data[(data['Senal']>0) & (data['Beneficio']>0)].index

print(serieIndicesENTRADA.size)

serieIndicesENTRADA

serieIndicesEXIT=data[(data['ExitReason']==1) | (data['ExitReason']==-1)].index

print(serieIndicesEXIT.size)

#data['ExitReason'][serieIndicesEXIT[2]]

In [None]:
serieIndicesENTRADA

In [None]:
#Cálculo Esperanza Matemática
countGanando=0
countPerdiendo=0

bolsaGanando=0
bolsaPerdiendo=0

for i in range(serieIndicesEXIT.size):
    if(data['ExitReason'][serieIndicesEXIT[i]] == -1):
        ref1  = data['Price'][serieIndicesEXIT[i]]
        ref2 = data['Price'][serieIndicesENTRADA[i]]
        #print ("-1",ref1, ref2)
        countPerdiendo= 1+countPerdiendo
        bolsaPerdiendo= bolsaPerdiendo + (ref1-ref2)

    
    if(data['ExitReason'][serieIndicesEXIT[i]] == 1):
        ref1  = data['Price'][serieIndicesEXIT[i]]
        ref2 = data['Price'][serieIndicesENTRADA[i]]
        print ("+1",ref1, ref2)
        countGanando= 1+countGanando
        bolsaGanando= bolsaGanando + (ref1-ref2)
    
#(%Aciertos * beneficioMedio )-(%Errores * perdidaMedia)

count=countGanando+countPerdiendo


print ("total ganado   --> ", bolsaGanando, "   numero operaciones ganando   ", countGanando)   
print ("total perdido -->", bolsaPerdiendo, "   numero operaciones perdiendo", countPerdiendo) 
print ("media perdiendo --> ", (bolsaPerdiendo/countPerdiendo), "  media ganando", (bolsaGanando/countGanando)) 


esperanza = (countGanando/count *(bolsaGanando/countGanando))+(countPerdiendo/count *(bolsaPerdiendo/countPerdiendo))
print("")
print("ESPERANZA MATEMATICA ES: ", esperanza)



---

In [None]:
serieIndicesEXIT

In [None]:
serieIndicesENTRADA