# Example for anomaly detection with LSTM autoencoder architectures

There is a multitude of successful architecture. In the following we demonstrate the implementation of 3 possible architecture types.

## Models

In [1]:
from river import compose, preprocessing, metrics, datasets

from deep_river.anomaly import RollingAutoencoder
from torch import nn, manual_seed
import torch
from tqdm import tqdm

![](srivastava_ae.png)

LSTM Autoencoder Architecture by Srivastava et al. 2016 (https://arxiv.org/abs/1502.04681). Decoding is performed in reverse order to introduce short term dependencies between inputs and outputs. Additional to the encoding, the decoder gets fed the time-shifted original inputs. 

In [2]:
class LSTMAutoencoderSrivastava(nn.Module):
    def __init__(self, n_features, hidden_size=30, n_layers=1, batch_first=False):
        super().__init__()
        self.n_features = n_features
        self.hidden_size = hidden_size
        self.n_layers = n_layers
        self.batch_first = batch_first
        self.time_axis = 1 if batch_first else 0
        self.encoder = nn.LSTM(
            input_size=n_features,
            hidden_size=hidden_size,
            num_layers=n_layers,
            batch_first=batch_first,
        )
        self.decoder = nn.LSTM(
            input_size=hidden_size,
            hidden_size=n_features,
            num_layers=n_layers,
            batch_first=batch_first,
        )

    def forward(self, x):
        _, (h, _) = self.encoder(x)
        h = h[-1].view(1, 1, -1)
        x_flipped = torch.flip(x[1:], dims=[self.time_axis])
        input = torch.cat((h, x_flipped), dim=self.time_axis)
        x_hat, _ = self.decoder(input)
        x_hat = torch.flip(x_hat, dims=[self.time_axis])

        return x_hat

![](cho_ae.png)

Architecture inspired by Cho et al. 2014 (https://arxiv.org/abs/1406.1078). Decoding occurs in natural order and the decoder is only provided with the encoding at every timestep.

In [3]:
class LSTMAutoencoderCho(nn.Module):
    def __init__(self, n_features, hidden_size=30, n_layers=1, batch_first=False):
        super().__init__()
        self.n_features = n_features
        self.hidden_size = hidden_size
        self.n_layers = n_layers
        self.batch_first = batch_first
        self.encoder = nn.LSTM(
            input_size=n_features,
            hidden_size=hidden_size,
            num_layers=n_layers,
            batch_first=batch_first,
        )
        self.decoder = nn.LSTM(
            input_size=hidden_size,
            hidden_size=n_features,
            num_layers=n_layers,
            batch_first=batch_first,
        )

    def forward(self, x):
        _, (h, _) = self.encoder(x)
        target_shape = (
            (-1, x.shape[0], -1) if self.batch_first else (x.shape[0], -1, -1)
        )
        h = h[-1].expand(target_shape)
        x_hat, _ = self.decoder(h)
        return x_hat

![](sutskever_ae.png)

LSTM Encoder-Decoder architecture by Sutskever et al. 2014 (https://arxiv.org/abs/1409.3215). The decoder only gets access to its own prediction of the previous timestep. Decoding also takes performed backwards.

In [4]:
class LSTMDecoder(nn.Module):
    def __init__(
        self,
        input_size,
        hidden_size,
        sequence_length=None,
        predict_backward=True,
        num_layers=1,
    ):
        super().__init__()

        self.cell = nn.LSTMCell(input_size, hidden_size)
        self.input_size = input_size
        self.hidden_size = hidden_size

        self.predict_backward = predict_backward
        self.sequence_length = sequence_length
        self.num_layers = num_layers
        self.lstm = (
            None
            if num_layers <= 1
            else nn.LSTM(
                input_size=hidden_size,
                hidden_size=hidden_size,
                num_layers=num_layers - 1,
            )
        )
        self.linear = (
            None if input_size == hidden_size else nn.Linear(hidden_size, input_size)
        )

    def forward(self, h, sequence_length=None):
        """Computes the forward pass.

        Parameters
        ----------
        x:
            Input of shape (batch_size, input_size)

        Returns
        -------
        Tuple[torch.Tensor, Tuple[torch.Tensor, torch.Tensor]]
            Decoder outputs (output, (h, c)) where output has the shape (sequence_length, batch_size, input_size).
        """

        if sequence_length is None:
            sequence_length = self.sequence_length
        x_hat = torch.empty(sequence_length, h.shape[0], self.hidden_size)
        for t in range(sequence_length):
            if t == 0:
                h, c = self.cell(h)
            else:
                input = h if self.linear is None else self.linear(h)
                h, c = self.cell(input, (h, c))
            t_predicted = -t if self.predict_backward else t
            x_hat[t_predicted] = h

        if self.lstm is not None:
            x_hat = self.lstm(x_hat)

        return x_hat, (h, c)


class LSTMAutoencoderSutskever(nn.Module):
    def __init__(self, n_features, hidden_size=30, n_layers=1):
        super().__init__()
        self.n_features = n_features
        self.hidden_size = hidden_size
        self.n_layers = n_layers
        self.encoder = nn.LSTM(
            input_size=n_features, hidden_size=hidden_size, num_layers=n_layers
        )
        self.decoder = LSTMDecoder(
            input_size=hidden_size, hidden_size=n_features, predict_backward=True
        )

    def forward(self, x):
        _, (h, _) = self.encoder(x)
        x_hat, _ = self.decoder(h[-1], x.shape[0])
        return x_hat

## Testing

The models can be tested with the code in the following cells. Since River currently does not feature any anomaly detection datasets with temporal dependencies, the results should be expected to be somewhat inaccurate.  

In [5]:
_ = manual_seed(42)
dataset = datasets.CreditCard().take(5000)
metric = metrics.ROCAUC(n_thresholds=50)

module = LSTMAutoencoderSrivastava # Set this variable to your architecture of choice
ae = RollingAutoencoder(module=module, lr=0.005)
scaler = preprocessing.StandardScaler()


In [6]:
for x, y in tqdm(list(dataset)):
    scaler.learn_one(x)
    x = scaler.transform_one(x)
    score = ae.score_one(x)
    metric.update(y_true=y, y_pred=score)
    ae.learn_one(x=x, y=None)
print(f"ROCAUC: {metric.get():.4f}")


  0%|                                                                                                                                                                                     | 0/5000 [00:00<?, ?it/s]

  0%|                                                                                                                                                                             | 1/5000 [00:00<44:13,  1.88it/s]

  0%|▎                                                                                                                                                                           | 10/5000 [00:00<04:20, 19.18it/s]

  1%|█▌                                                                                                                                                                          | 47/5000 [00:00<00:51, 96.10it/s]

  2%|███                                                                                                                                                                        | 89/5000 [00:00<00:28, 173.22it/s]

  2%|████▏                                                                                                                                                                     | 122/5000 [00:00<00:23, 209.63it/s]

  3%|█████▏                                                                                                                                                                    | 152/5000 [00:01<00:23, 209.29it/s]

  4%|██████▍                                                                                                                                                                   | 191/5000 [00:01<00:19, 253.03it/s]

  4%|███████▌                                                                                                                                                                  | 222/5000 [00:01<00:18, 265.38it/s]

  5%|████████▉                                                                                                                                                                 | 262/5000 [00:01<00:15, 301.53it/s]

  6%|██████████▎                                                                                                                                                               | 305/5000 [00:01<00:13, 337.09it/s]

  7%|███████████▊                                                                                                                                                              | 347/5000 [00:01<00:12, 358.43it/s]

  8%|█████████████                                                                                                                                                             | 385/5000 [00:01<00:13, 339.45it/s]

  8%|██████████████▎                                                                                                                                                           | 421/5000 [00:01<00:13, 339.97it/s]

  9%|███████████████▌                                                                                                                                                          | 457/5000 [00:01<00:13, 344.06it/s]

 10%|█████████████████                                                                                                                                                         | 500/5000 [00:02<00:12, 367.04it/s]

 11%|██████████████████▍                                                                                                                                                       | 544/5000 [00:02<00:11, 388.00it/s]

 12%|███████████████████▉                                                                                                                                                      | 585/5000 [00:02<00:11, 394.17it/s]

 12%|█████████████████████▎                                                                                                                                                    | 625/5000 [00:02<00:11, 374.12it/s]

 13%|██████████████████████▌                                                                                                                                                   | 665/5000 [00:02<00:11, 379.91it/s]

 14%|███████████████████████▉                                                                                                                                                  | 704/5000 [00:02<00:11, 379.28it/s]

 15%|█████████████████████████▎                                                                                                                                                | 743/5000 [00:02<00:11, 381.82it/s]

 16%|██████████████████████████▌                                                                                                                                               | 783/5000 [00:02<00:10, 386.01it/s]

 16%|███████████████████████████▉                                                                                                                                              | 822/5000 [00:02<00:12, 329.64it/s]

 17%|█████████████████████████████▏                                                                                                                                            | 857/5000 [00:03<00:12, 320.98it/s]

 18%|██████████████████████████████▍                                                                                                                                           | 897/5000 [00:03<00:12, 341.75it/s]

 19%|████████████████████████████████                                                                                                                                          | 942/5000 [00:03<00:10, 369.76it/s]

 20%|█████████████████████████████████▍                                                                                                                                        | 982/5000 [00:03<00:10, 376.16it/s]

 20%|██████████████████████████████████▌                                                                                                                                      | 1021/5000 [00:03<00:10, 369.61it/s]

 21%|████████████████████████████████████                                                                                                                                     | 1067/5000 [00:03<00:10, 393.15it/s]

 22%|█████████████████████████████████████▌                                                                                                                                   | 1112/5000 [00:03<00:09, 409.25it/s]

 23%|███████████████████████████████████████▏                                                                                                                                 | 1159/5000 [00:03<00:09, 425.29it/s]

 24%|████████████████████████████████████████▊                                                                                                                                | 1206/5000 [00:03<00:08, 436.87it/s]

 25%|██████████████████████████████████████████▎                                                                                                                              | 1250/5000 [00:03<00:08, 435.04it/s]

 26%|███████████████████████████████████████████▊                                                                                                                             | 1296/5000 [00:04<00:08, 439.94it/s]

 27%|█████████████████████████████████████████████▍                                                                                                                           | 1343/5000 [00:04<00:08, 447.16it/s]

 28%|██████████████████████████████████████████████▉                                                                                                                          | 1389/5000 [00:04<00:08, 448.02it/s]

 29%|████████████████████████████████████████████████▍                                                                                                                        | 1434/5000 [00:04<00:08, 440.66it/s]

 30%|█████████████████████████████████████████████████▉                                                                                                                       | 1479/5000 [00:04<00:08, 434.92it/s]

 30%|███████████████████████████████████████████████████▌                                                                                                                     | 1525/5000 [00:04<00:07, 441.20it/s]

 31%|█████████████████████████████████████████████████████                                                                                                                    | 1571/5000 [00:04<00:07, 444.47it/s]

 32%|██████████████████████████████████████████████████████▋                                                                                                                  | 1617/5000 [00:04<00:07, 448.17it/s]

 33%|████████████████████████████████████████████████████████▏                                                                                                                | 1663/5000 [00:04<00:07, 448.84it/s]

 34%|█████████████████████████████████████████████████████████▋                                                                                                               | 1708/5000 [00:05<00:07, 444.14it/s]

 35%|███████████████████████████████████████████████████████████▎                                                                                                             | 1755/5000 [00:05<00:07, 448.92it/s]

 36%|████████████████████████████████████████████████████████████▊                                                                                                            | 1801/5000 [00:05<00:07, 450.84it/s]

 37%|██████████████████████████████████████████████████████████████▍                                                                                                          | 1847/5000 [00:05<00:06, 453.41it/s]

 38%|███████████████████████████████████████████████████████████████▉                                                                                                         | 1893/5000 [00:05<00:06, 454.85it/s]

 39%|█████████████████████████████████████████████████████████████████▌                                                                                                       | 1939/5000 [00:05<00:06, 449.58it/s]

 40%|███████████████████████████████████████████████████████████████████                                                                                                      | 1985/5000 [00:05<00:06, 450.03it/s]

 41%|████████████████████████████████████████████████████████████████████▋                                                                                                    | 2031/5000 [00:05<00:06, 451.24it/s]

 42%|██████████████████████████████████████████████████████████████████████▏                                                                                                  | 2077/5000 [00:05<00:06, 451.40it/s]

 42%|███████████████████████████████████████████████████████████████████████▊                                                                                                 | 2123/5000 [00:05<00:06, 451.61it/s]

 43%|█████████████████████████████████████████████████████████████████████████▎                                                                                               | 2169/5000 [00:06<00:06, 448.53it/s]

 44%|██████████████████████████████████████████████████████████████████████████▊                                                                                              | 2215/5000 [00:06<00:06, 450.33it/s]

 45%|████████████████████████████████████████████████████████████████████████████▍                                                                                            | 2261/5000 [00:06<00:06, 452.76it/s]

 46%|██████████████████████████████████████████████████████████████████████████████                                                                                           | 2308/5000 [00:06<00:05, 456.90it/s]

 47%|███████████████████████████████████████████████████████████████████████████████▌                                                                                         | 2354/5000 [00:06<00:05, 455.52it/s]

 48%|█████████████████████████████████████████████████████████████████████████████████                                                                                        | 2400/5000 [00:06<00:05, 450.95it/s]

 49%|██████████████████████████████████████████████████████████████████████████████████▋                                                                                      | 2446/5000 [00:06<00:05, 452.76it/s]

 50%|████████████████████████████████████████████████████████████████████████████████████▏                                                                                    | 2492/5000 [00:06<00:05, 454.41it/s]

 51%|█████████████████████████████████████████████████████████████████████████████████████▊                                                                                   | 2538/5000 [00:06<00:05, 451.75it/s]

 52%|███████████████████████████████████████████████████████████████████████████████████████▎                                                                                 | 2584/5000 [00:06<00:05, 452.25it/s]

 53%|████████████████████████████████████████████████████████████████████████████████████████▉                                                                                | 2630/5000 [00:07<00:05, 449.23it/s]

 54%|██████████████████████████████████████████████████████████████████████████████████████████▍                                                                              | 2675/5000 [00:07<00:05, 448.76it/s]

 54%|████████████████████████████████████████████████████████████████████████████████████████████                                                                             | 2722/5000 [00:07<00:05, 452.03it/s]

 55%|█████████████████████████████████████████████████████████████████████████████████████████████▌                                                                           | 2768/5000 [00:07<00:04, 451.94it/s]

 56%|███████████████████████████████████████████████████████████████████████████████████████████████▏                                                                         | 2815/5000 [00:07<00:04, 456.38it/s]

 57%|████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                        | 2861/5000 [00:07<00:04, 451.66it/s]

 58%|██████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                      | 2908/5000 [00:07<00:04, 454.76it/s]

 59%|███████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                     | 2954/5000 [00:07<00:04, 451.38it/s]

 60%|█████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                   | 3000/5000 [00:07<00:04, 451.28it/s]

 61%|██████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                  | 3046/5000 [00:07<00:04, 450.91it/s]

 62%|████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                | 3092/5000 [00:08<00:04, 445.38it/s]

 63%|██████████████████████████████████████████████████████████████████████████████████████████████████████████                                                               | 3137/5000 [00:08<00:04, 445.27it/s]

 64%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                             | 3183/5000 [00:08<00:04, 448.84it/s]

 65%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                           | 3229/5000 [00:08<00:03, 449.29it/s]

 65%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                          | 3274/5000 [00:08<00:03, 444.31it/s]

 66%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                        | 3319/5000 [00:08<00:03, 442.21it/s]

 67%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                       | 3366/5000 [00:08<00:03, 448.04it/s]

 68%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                     | 3412/5000 [00:08<00:03, 449.32it/s]

 69%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                    | 3458/5000 [00:08<00:03, 450.01it/s]

 70%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                  | 3504/5000 [00:08<00:03, 449.04it/s]

 71%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                 | 3549/5000 [00:09<00:03, 446.46it/s]

 72%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                               | 3594/5000 [00:09<00:03, 445.17it/s]

 73%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                              | 3639/5000 [00:09<00:03, 446.02it/s]

 74%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                            | 3684/5000 [00:09<00:03, 437.64it/s]

 75%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                           | 3729/5000 [00:09<00:02, 439.83it/s]

 76%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                         | 3775/5000 [00:09<00:02, 443.70it/s]

 76%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                        | 3820/5000 [00:09<00:02, 443.51it/s]

 77%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                      | 3866/5000 [00:09<00:02, 446.29it/s]

 78%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                    | 3912/5000 [00:09<00:02, 449.11it/s]

 79%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                   | 3959/5000 [00:10<00:02, 452.67it/s]

 80%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                 | 4005/5000 [00:10<00:02, 449.21it/s]

 81%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                | 4050/5000 [00:10<00:02, 447.22it/s]

 82%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                              | 4095/5000 [00:10<00:02, 447.92it/s]

 83%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                             | 4141/5000 [00:10<00:01, 450.09it/s]

 84%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                           | 4187/5000 [00:10<00:01, 450.35it/s]

 85%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                          | 4233/5000 [00:10<00:01, 446.67it/s]

 86%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                        | 4279/5000 [00:10<00:01, 447.97it/s]

 87%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                      | 4326/5000 [00:10<00:01, 451.72it/s]

 87%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                     | 4372/5000 [00:10<00:01, 451.62it/s]

 88%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                   | 4419/5000 [00:11<00:01, 454.39it/s]

 89%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                  | 4465/5000 [00:11<00:01, 449.97it/s]

 90%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                | 4511/5000 [00:11<00:01, 449.35it/s]

 91%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉               | 4556/5000 [00:11<00:00, 449.32it/s]

 92%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌             | 4601/5000 [00:11<00:00, 449.12it/s]

 93%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████            | 4646/5000 [00:11<00:00, 446.57it/s]

 94%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌          | 4691/5000 [00:11<00:00, 444.84it/s]

 95%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████         | 4736/5000 [00:11<00:00, 445.94it/s]

 96%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋       | 4782/5000 [00:11<00:00, 447.25it/s]

 97%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏     | 4827/5000 [00:11<00:00, 447.43it/s]

 97%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋    | 4872/5000 [00:12<00:00, 447.94it/s]

 98%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏  | 4917/5000 [00:12<00:00, 447.97it/s]

 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋ | 4962/5000 [00:12<00:00, 444.35it/s]

100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 5000/5000 [00:12<00:00, 405.19it/s]

ROCAUC: 0.5836



