# Introduction

A continuación describo la forma de atacar el problema. 

Partimos de una serie de indicadores técnicos como: MACD, RSI, Zigzag, SMA, Bollinger, Fibonacci; a partir de los cuales he generado otros indicadores sintéticos más elaborados.

La idea es tratar de identificar el estado actual del mercado, mediante técnicas de 'Price Action' y para ello, como base de todo el proceso, utilizo los 'flips' del indicador ZigZag para identificar los puntos en los que el precio se da la vuelta (flip) y conocer el estado del mercado justo en esos instantes.

De esa forma, se pueden extraer ciertos patrones que pueden ser predecibles, como que el precio se de la vuelta al llegar a un soporte/resistencia relevante, o al tocar una media móvil, o un nivel fibo o al llegar al límite de un canal, o al coincidir una combinación de varios de ellos a la vez.

La idea es formar un vector que defina el estado del mercado, incluyendo la posición del precio respecto de esas zonas relevantes y predecir los dos siguientes movimientos (flips) del mismo. De esa forma, se podrá tener una idea más o menos aproximada de dónde situar las operaciones de entrada y los niveles de stoploss y takeprofit.

Por otro lado, puesto que saber si el precio está más o menos cerca de una zona relevante es bastante ambiguo, he creado una serie de variables borrosas (Fuzzy) que permitan al algoritmo tener una idea de esos conceptos abstractos y poder categorizarlos en conjuntos, como: Lejos, Cerca, Dentro, etc...

Además, la operativa del algoritmo se realizará en un timeframe determinado (por ejemplo supongamos en M15), y por ello, para tener una idea clara de lo que ocurre en timeframes más altos (perspectiva a vista de pájaro) es necesario añadir 2 timeframes superiores más. Así por ejemplo, para un timeframe de trabajo en M15, se podrían añadir los timeframes H1 y H4 y así disponer de una visión del estado del mercado en esas otras temporalidades.

Esta operativa 'multitimeframe' permitiría identificar ciertos patrones de mayor nivel: por ejemplo detectar una divergencia oculta alcista en un timeframe alto y una divergencia regular alcista en el retroceso de un timeframe más bajo, que nos indique que el precio tiene pinta de rebotar hacia arriba.

## Generación de datos

El algoritmo necesita conocer, por lo tanto, los diferentes estados del mercado. Y como he dicho, los estados los definirán los puntos en los que el precio cambia de sentido (flips en el indicador ZigZag). Puesto que un flip no se activa hasta que el precio ha iniciado ya el siguiente giro, no será hasta ese instante cuando se active la señal de cambio de estado.

Así, la columna boolena ```FLIP``` del dataframe de trabajo indicará dichas señales de cambio de estado, cuando tome el valor ```True```. Existirán señales de cambio de estado diferentes en las 3 temporalidades utilizadas y éstas servirán para formar el estado global del mercado en un instante dado.

Por otro lado, con  el indicador ZigZag (mirando los últimos flips), podemos identificar tendencias, soportes y resistencias validados, canales, niveles fibo, etc...; por lo tanto, utilizaremos esos últimos flips para crear una ventana temporal (loopback window) que valga como entrada a una red recurrente tipo LSTM o similar, comunmente utilizadas en problemas de predicción de series temporales.

Con todo esto, tendremos dos tipos de variables:

- Variables que proporcionan información del estado del mercado (MktSt): divergencias, tendencias, volatilidad, etc...
- Variables que proporcionan información de la posición del precio (PrcPos): cerca de soporte|resistencia, en nivel fibo, al límite de canal, etc...

El vector de entrada estará formado por ambas variables durante un número de estados previos (loopback window) correspondientes a los 3 timeframes, mientras que el vector de salida estará únicamente formado por la posición del precio en los siguientes 2 estados:

MktSt([0..N],[M15,H1,H4]),PrcPos([0..N], [M15,H1,H4]) ---------------> PrcPos([1,2], [M15,H1,H4])

## Datos de entrenamiento y validación

Para formar los datos de entrenamiento y validación, utilizo la clase ```FuzzyMarketState``` creada específicamente para este propósito. Esta clase nos proporciona un dataframe de trabajo con todos los estados de mercado y zonas del precio para un timeframe específico.

Por otro lado, con la utilidad ```MyUtils.mergeDataframes``` podemos unificar los tres dataframes resultantes en uno único y operar con él.

Las fases de la preparación de datos son éstas:

1) Extraer las variables MktSt y PrcPos para cada timeframe

2) Construir el dataframe de entrenamiento y validación ```df_tv``` con un loopback dado N (ej N=6)

3) Construir el modelo neuronal con Keras y entrenarlo

4) Verificar los resultados



In [2]:
%load_ext autoreload
%autoreload 2

The autoreload extension is already loaded. To reload it, use:
  %reload_ext autoreload


In [3]:
# import required packages
# Append relative path to FuzzyMarketState.py
import os
import sys
sys.path.append('../../common/')

from FuzzyMarketState import FuzzyMarketState
from FuzzyLib import Fuzzifier, FuzzyVar
import MyUtils

import plotly as py
import plotly.graph_objs as go
from plotly.graph_objs import *
from plotly.tools import FigureFactory as FF
import plotly.tools as tls
py.offline.init_notebook_mode(connected=True)

import logging
logging.basicConfig(level=logging.DEBUG, stream=sys.stdout)

import pandas as pd
import random
import datetime

print('Packages loaded!!')





Packages loaded!!


### Obtención de datos multi-timeframe (H1, H4, D1)

Voy a obtener datos de diversos pares de divisas para crear una base de datos de entrenamiento. Los datos obtenidos provienen de los siguientes pares y con fechas entre el 01/01/2010 y el 30/06/2019 ambos inclusives:

- EURUSD
- USDJPY
- GBPUSD
- USDCAD
- USDCHF
- AUDUSD
- NZDUSD
- EURGBP
- EURCHF
- EURCAD
- EURAUD
- EURNZD
- EURJPY
- GBPJPY
- GBPCAD

In [4]:
# for each forex-pair load each timeframe
path = '../csv_data'
items = dict()
fms = 'fms'

# r=root, d=directories, f = files
for r, d, f in os.walk(path):
  for file in f: 
    # file has format: SYMBOL_TIMEFRAME_STARTDATE_ENDDATE.csv
    tokens = file.split('_')
    print('tokens={}'.format(tokens))
    if len(tokens) == 4:
      symbol = tokens[0]
      timeframe = tokens[1]
      if symbol not in items.keys():
        items[symbol] = {timeframe : {'file' : '{}/{}'.format(path, file), 'fms' : FuzzyMarketState(logging.WARN)}}
      else:
        items[symbol][timeframe] = {'file' : '{}/{}'.format(path, file), 'fms' : FuzzyMarketState(logging.WARN)}
      print('New item: {}', items[symbol][timeframe])
      print('loading csv file: {}'.format(items[symbol][timeframe]['file']))
      items[symbol][timeframe][fms].loadCSV(items[symbol][timeframe]['file'], sep=';')        
      print('+++++++++++++++++++++++++++++++++++++')
        


tokens=['AUDUSD', 'Daily', '200101020000', '201907010000.csv']
New item: {} {'file': '../csv_data/AUDUSD_Daily_200101020000_201907010000.csv', 'fms': <FuzzyMarketState.FuzzyMarketState object at 0x000002D3CA685630>}
loading csv file: ../csv_data/AUDUSD_Daily_200101020000_201907010000.csv
+++++++++++++++++++++++++++++++++++++
tokens=['AUDUSD', 'H1', '201001040000', '201907010000.csv']
New item: {} {'file': '../csv_data/AUDUSD_H1_201001040000_201907010000.csv', 'fms': <FuzzyMarketState.FuzzyMarketState object at 0x000002D3CA685A90>}
loading csv file: ../csv_data/AUDUSD_H1_201001040000_201907010000.csv
+++++++++++++++++++++++++++++++++++++
tokens=['AUDUSD', 'H4', '200101020000', '201907010000.csv']
New item: {} {'file': '../csv_data/AUDUSD_H4_200101020000_201907010000.csv', 'fms': <FuzzyMarketState.FuzzyMarketState object at 0x000002D3CA685978>}
loading csv file: ../csv_data/AUDUSD_H4_200101020000_201907010000.csv
+++++++++++++++++++++++++++++++++++++
tokens=['EURAUD', 'Daily', '200201140

+++++++++++++++++++++++++++++++++++++
tokens=['GBPCAD', 'H4', '200708210800', '201907010000.csv']
New item: {} {'file': '../csv_data/GBPCAD_H4_200708210800_201907010000.csv', 'fms': <FuzzyMarketState.FuzzyMarketState object at 0x000002D3CAAD2DD8>}
loading csv file: ../csv_data/GBPCAD_H4_200708210800_201907010000.csv
+++++++++++++++++++++++++++++++++++++
tokens=['GBPJPY', 'Daily', '200101010000', '201907010000.csv']
New item: {} {'file': '../csv_data/GBPJPY_Daily_200101010000_201907010000.csv', 'fms': <FuzzyMarketState.FuzzyMarketState object at 0x000002D3CA69B9B0>}
loading csv file: ../csv_data/GBPJPY_Daily_200101010000_201907010000.csv
+++++++++++++++++++++++++++++++++++++
tokens=['GBPJPY', 'H1', '201001040000', '201907010000.csv']
New item: {} {'file': '../csv_data/GBPJPY_H1_201001040000_201907010000.csv', 'fms': <FuzzyMarketState.FuzzyMarketState object at 0x000002D3CA6D54A8>}
loading csv file: ../csv_data/GBPJPY_H1_201001040000_201907010000.csv
+++++++++++++++++++++++++++++++++++++

In [8]:
os.path.isfile('../csv_data/indicators/AUDUSD_Daily_ind.csv'.format())

False

### Construcción de indicadores

A continuación construyo los indicadores de cada item

In [None]:
# build indicators
for symbol in items.keys():
  for timeframe in items[symbol].keys():
    if os.path.isfile('../csv_data/indicators/{}_{}_ind.csv'.format(symbol, timeframe)):
        print('Indicator {}_{} already built'.format(symbol, timeframe))
        items[symbol][timeframe][fms].loadIndicatorCsv('../csv_data/indicators/{}_{}_ind.csv'.format(symbol, timeframe))
    else:
        print('Building indicators of {}_{}'.format(symbol, timeframe))
        items[symbol][timeframe][fms].buildIndicators()
        print('Saving dataframe {}_{}...'.format(symbol, timeframe))
        df = items[symbol][timeframe][fms].getDataframe()
        df.to_csv('../csv_data/indicators/{}_{}_ind.csv'.format(symbol, timeframe), sep=';')
        print('+++++++++++++++++++++++++++++++++++++')
    

Building indicators of AUDUSD_Daily
Saving dataframe AUDUSD_Daily...
+++++++++++++++++++++++++++++++++++++
Building indicators of AUDUSD_H1
Saving dataframe AUDUSD_H1...
+++++++++++++++++++++++++++++++++++++
Building indicators of AUDUSD_H4
Saving dataframe AUDUSD_H4...
+++++++++++++++++++++++++++++++++++++
Building indicators of EURAUD_Daily
Saving dataframe EURAUD_Daily...
+++++++++++++++++++++++++++++++++++++
Building indicators of EURAUD_H1
Saving dataframe EURAUD_H1...
+++++++++++++++++++++++++++++++++++++
Building indicators of EURAUD_H4
Saving dataframe EURAUD_H4...
+++++++++++++++++++++++++++++++++++++
Building indicators of EURCAD_Daily
Saving dataframe EURCAD_Daily...
+++++++++++++++++++++++++++++++++++++
Building indicators of EURCAD_H1
Saving dataframe EURCAD_H1...
+++++++++++++++++++++++++++++++++++++
Building indicators of EURCAD_H4
Saving dataframe EURCAD_H4...
+++++++++++++++++++++++++++++++++++++
Building indicators of EURCHF_Daily
Saving dataframe EURCHF_Daily...
++++

### Fuzzificación

A continuación ejecuto el fuzzificador de cada indicador para obtener una versión 'borrosa' de los mismos y poder procesarlos con términos vagos como: Lejos, Cerca, Entrando, Saliendo, EnRango, etc...

In [None]:
# fuzzification process... perhaps executing during next 2 days...X(
for symbol in items.keys():
  for timeframe in items[symbol].keys():
    if os.path.isfile('../csv_data/indicators/fuzzified/{}_{}_ind.csv'.format(symbol, timeframe)):
        print('Fuzzification of {}_{} already built'.format(symbol, timeframe))
        items[symbol][timeframe][fms].loadFuzzifiedCsv('../csv_data/indicators/fuzzified/{}_{}_ind.csv'.format(symbol, timeframe))
    else:
        print('Fuzzifying dataframe {}_{}...'.format(symbol, timeframe))
        df = items[symbol][timeframe][fms].fuzzifyIndicators()
        df.to_csv('../csv_data/indicators/fuzzified/{}_{}_ind.csv'.format(symbol, timeframe), sep=';')
        print('+++++++++++++++++++++++++++++++++++++')
    

### Unificación de dataframes

A continuación, uno los 3 dataframes de cada par para formar un único dataframe de trabajo. Para ello utilizo la funcionalidad ```MyUtils.mergeDataframes()```. Las temporalidades a crear son H1, H4 y D1 (Daily)

In [None]:
# fuzzification process... perhaps executing during next 2 days...X(
for symbol in items.keys():
  if os.path.isfile('../csv_data/indicators/fuzzified/merged/{}_{}_ind.csv'.format(symbol, timeframe)):
        print('Fuzzification of {}_{} already built'.format(symbol, timeframe))
        items[symbol][timeframe][fms].loadMergedCsv('../csv_data/indicators/fuzzified/merged/{}_h1h4d1.csv'.format(symbol, timeframe))
    else:
        print('Guardando merged dataframe del par: {}'.format(symbol))
        items[symbol]['merged'] = MyUtils.mergeDataframes(items[symbol]['H1'][fms].getDataframe(),
                                                    items[symbol]['H4'][fms].getDataframe(),
                                                    items[symbol]['Daily'][fms].getDataframe(),
                                                    prefixes=['h1_', 'h4_', 'd1_'])
        items[symbol]['merged'].to_csv('../csv_data/indicators/fuzzified/merged/{}_h1h4d1.csv'.format(symbol), sep=';')
        print('+++++++++++++++++++++++++++++++++++++')
    