# Parte 1: Codificación: Series Temporales

Entrenar o ajustar modelos que predictivos para series de temporales requiere organizar adecuadamente los datos. La codificación de series de tiempo se ocupa de representar eventos que ocurren a lo largo del tiempo. Hay muchos métodos diferentes para codificar los datos que ocurren con el tiempo. Sin embargo, una red neuronal multicapa falla al predecir procesos que dependen del tiempo, porque para dado un vector de entrada, la red siempre producirá el mismo vector de salida. Por este motivo para este tipo de problema utilizan redes neuronales recurrentes.

La variación de temperatura durante la semana es un ejemplo de datos de series de tiempo. Por ejemplo, si sabemos que la temperatura de hoy es de 25 grados y la temperatura de mañana es de 27 grados, las redes neuronales recurrentes y la codificación de series de tiempo brindan otra opción para predecir la temperatura correcta para la semana. Por el contrario, una red neuronal multicapa tradicional siempre responderá con la misma salida para una entrada determinada. Si entrenamos una red neuronal multicapa para predecir la temperatura de mañana, debería devolver un valor de 27 por 25. 

Anteriormente, entrenamos redes neuronales con entrada ($ x $) y salida esperada ($ y $). $ X $ era una matriz, las filas eran ejemplos de entrenamiento y las columnas eran valores a predecir. El valor $ x $ ahora contendrá secuencias de datos. La definición del valor $ y $ seguirá siendo la misma.

Dimensiones del conjunto de entrenamiento ($ x $):
* Eje 1: Elementos del conjunto de entrenamiento (secuencias) (debe ser del mismo tamaño que el tamaño de $ y $)
* Eje 2: Miembros de secuencia
* Eje 3: características en los datos (como neuronas de entrada)

Anteriormente, podíamos tomar como entrada un único precio de acción para predecir si deberíamos comprar (1), vender (-1) o mantener (0). El siguiente código ilustra esta codificación.

In [2]:
# 

x = [
    [32],
    [41],
    [39],
    [20],
    [15]
]

y = [
    1,
    -1,
    0,
    -1,
    1
]

print(x)
print(y)

[[32], [41], [39], [20], [15]]
[1, -1, 0, -1, 1]


El siguiente código crea un dataFrame:

In [3]:
from IPython.display import display, HTML
import pandas as pd
import numpy as np

x = np.array(x)
print(x[:,0])


df = pd.DataFrame({'x':x[:,0], 'y':y})
display(df)

[32 41 39 20 15]


Unnamed: 0,x,y
0,32,1
1,41,-1
2,39,0
3,20,-1
4,15,1


Es posible que desee agregar volumen con el precio de las acciones. El siguiente código muestra cómo podemos agregar una dimensión adicional para manejar el volumen.

In [4]:
x = [
    [32,1383],
    [41,2928],
    [39,8823],
    [20,1252],
    [15,1532]
]

y = [
    1,
    -1,
    0,
    -1,
    1
]

print(x)
print(y)

[[32, 1383], [41, 2928], [39, 8823], [20, 1252], [15, 1532]]
[1, -1, 0, -1, 1]


Nuevamente, como dataFrame

In [5]:
from IPython.display import display, HTML
import pandas as pd
import numpy as np

x = np.array(x)
print(x[:,0])


df = pd.DataFrame({'price':x[:,0], 'volume':x[:,1], 'y':y})
display(df)

[32 41 39 20 15]


Unnamed: 0,price,volume,y
0,32,1383,1
1,41,2928,-1
2,39,8823,0
3,20,1252,-1
4,15,1532,1


Ahora llegamos al formato de secuencia. Cuando queremos predecir algo en una secuencia, se debe agregar una dimensión yespecificar una longitud máxima de secuencia.

In [5]:
x = [
    [[32,1383],[41,2928],[39,8823],[20,1252],[15,1532]],
    [[35,8272],[32,1383],[41,2928],[39,8823],[20,1252]],
    [[37,2738],[35,8272],[32,1383],[41,2928],[39,8823]],
    [[34,2845],[37,2738],[35,8272],[32,1383],[41,2928]],
    [[32,2345],[34,2845],[37,2738],[35,8272],[32,1383]],
]

y = [
    1,
    -1,
    0,
    -1,
    1
]

print(x)
print(y)

[[[32, 1383], [41, 2928], [39, 8823], [20, 1252], [15, 1532]], [[35, 8272], [32, 1383], [41, 2928], [39, 8823], [20, 1252]], [[37, 2738], [35, 8272], [32, 1383], [41, 2928], [39, 8823]], [[34, 2845], [37, 2738], [35, 8272], [32, 1383], [41, 2928]], [[32, 2345], [34, 2845], [37, 2738], [35, 8272], [32, 1383]]]
[1, -1, 0, -1, 1]


Incluso si solo hay una característica (precio), se debe utilizar la tercera dimensión:


In [6]:
x = [
    [[32],[41],[39],[20],[15]],
    [[35],[32],[41],[39],[20]],
    [[37],[35],[32],[41],[39]],
    [[34],[37],[35],[32],[41]],
    [[32],[34],[37],[35],[32]],
]

y = [
    1,
    -1,
    0,
    -1,
    1
]

print(x)
print(y)

[[[32], [41], [39], [20], [15]], [[35], [32], [41], [39], [20]], [[37], [35], [32], [41], [39]], [[34], [37], [35], [32], [41]], [[32], [34], [37], [35], [32]]]
[1, -1, 0, -1, 1]
