## Rede Neural Recorrente Profunda para DDR

###  De DRL para Rede Neural Recorrente

Embora o modelo DRL tenha sido apresentado como uma **regressão**, ele pode ser interpretado como uma **rede neural com uma única camada** (veja a Fig. 1(a) do artigo).

- O **termo de bias** não é mostrado explicitamente na figura, mas na prática ele pode ser incorporado ao vetor de pesos $\bf w$, adicionando um valor constante (1) ao final do vetor de entrada ${\bf f}_t$.
- O **vetor de features ${\bf f}_t$** (nós verdes na figura) é a entrada direta do sistema.
- A estrutura é **recorrente**, pois há uma ligação do **output ($δ_t$) de volta para a entrada**, através do termo $u * δ_{t-1}$.

Essa estrutura caracteriza uma **rede neural recorrente (RNN)**, que tem como uma de suas propriedades a **capacidade de manter memória de longo prazo**.

No contexto do DRL:
- O modelo mantém em memória as decisões anteriores de trading.
- Isso serve para **desencorajar mudanças frequentes de posição**, o que ajuda a evitar custos de transação elevados.

###  Limitação do DRL

Apesar de incorporar recorrência, o **DRL sofre de uma limitação importante**:  
Ele **não possui uma etapa explícita de aprendizado de representações** (features) para lidar com as **condições ruidosas e complexas do mercado**.

---

###  Introdução do Deep Learning (DL)

Para superar essa limitação, o artigo propõe **integrar técnicas de Deep Learning (DL)** ao DRL. O objetivo é **unificar o aprendizado de representações (features)** com a **decisão dinâmica de trading**.

- O Deep Learning é uma estrutura de aprendizado muito poderosa e já mostrou excelentes resultados em diversas tarefas de aprendizado de máquina.
- Ele utiliza **redes neurais profundas (DNNs)** para transformar os dados **camada por camada**, extraindo **representações hierárquicas e informativas**.
- Essas representações profundas ajudam a **capturar padrões relevantes mesmo em dados muito ruidosos** — como é o caso do mercado financeiro.

###  Inspiração em neurociência

O artigo também menciona que essa **transformação hierárquica profunda** é **inspirada em descobertas da neurociência**, relacionadas a como o cérebro processa e descobre informações [referências 31 e 32].

### Unindo Deep Learning ao DRL

Ao incorporar Deep Learning ao modelo de Reinforcement Learning Direto, o sistema original mostrado na Fig. 1(a) evolui para a Fig. 1(b):

- Um **bloco de aprendizado de representações (painel azul)** é adicionado **antes da rede recorrente**, formando o que chamam de **Deep Recurrent Neural Network (DRNN)**.
- A ideia é aplicar uma **transformação profunda ao vetor de entrada ${\bf f}_t$** antes de gerar a decisão de trading.

Essa transformação é definida como:

$$
{\bf F}_t = g_d({\bf f}_t)
$$

Ou seja, o vetor de entrada ${\bf f}_t$ passa por uma **DNN (rede neural profunda)** com mapeamento não-linear $g_d(·)$ e resulta em uma **representação mais abstrata e informativa ${\bf F}_t$**.

A equação de decisão final fica:

$$
δ_t = tanh({\bf w}· g_d({\bf f}_t) + b + u · δ_{t−1})
$$



Essa é a **Equação (5)** do artigo. Ela mantém a estrutura original do DRL, mas agora a entrada do modelo é 
uma **representação profunda**, em vez do vetor bruto de retornos.

---

### Estrutura da Rede Profunda

O artigo explica como a DNN é construída:

- A rede profunda é formada por **múltiplas camadas ocultas totalmente conectadas**:
  - Cada neurônio da camada (l+1) está conectado a **todos os neurônios da camada l anterior**.
  - Isso caracteriza uma **arquitetura "fully connected"**.

#### Funcionamento de cada camada (Equação 6)

Para cada neurônio na camada $l$:

- $a_i^l$ representa a **entrada linear** do neurônio $i$ na camada $l$.
- $o_i^l$ representa a **saída ativada** desse neurônio.

As fórmulas são:

$$a_i^l = \left <{\bf w}_i^l, {\bf o}_i^{(l-1)} \right > + b_i^l$$  
$$o_i^l = \frac{1} {(1 + exp(-a_i^l))} ←  sigmoide$$ 


Ou seja:
- Cada neurônio realiza uma **soma ponderada dos sinais da camada anterior**.
- O resultado passa por uma **função de ativação não-linear (sigmoide)**.
- Isso permite capturar **relações complexas e não-lineares entre os dados**.

---

###  Configuração usada no artigo

- A parte de **transformação profunda** ($g_d$) tem:
  - **4 camadas ocultas**
  - **128 neurônios por camada**
  - Todas as camadas são totalmente conectadas (fully connected)
  - Ativação sigmoide entre camadas

Essa estrutura permite à rede **aprender representações cada vez mais abstratas dos dados de mercado**, camada após camada, antes de tomar uma decisão.

---

###  Conclusão

Ao aplicar Deep Learning ao DRL:
- O modelo passa a **aprender os padrões relevantes do mercado automaticamente**, a partir dos dados brutos.
- A rede neural profunda transforma o vetor ${\bf f}_t$ em ${\bf F}_t$, uma representação mais rica.
- O modelo final, o **DRNN**, une:
  - Aprendizado de representações (DL)
  - Memória temporal (recorrência)
  - Decisões de trading diretas (sem previsão intermediária)

Essa abordagem prepara o caminho para a próxima seção, onde será discutido **como treinar essa rede profunda com recorrência de forma eficiente**.
