<a href="https://colab.research.google.com/github/CodeHunterOfficial/ABC_DataMining/blob/main/ML/Anomaly%20Detection/1_%D0%9E%D0%B1%D0%BD%D0%B0%D1%80%D1%83%D0%B6%D0%B5%D0%BD%D0%B8%D0%B5_%D0%B0%D0%BD%D0%BE%D0%BC%D0%B0%D0%BB%D0%B8%D0%B9_(Anomaly_Detection)_%D0%B8_Z_Score_Algorithm.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Обнаружение аномалий (Anomaly Detection) и Z-Score Algorithm

## Введение

Обнаружение аномалий — это процесс выявления наблюдений или событий, которые значительно отличаются от большинства данных. Аномалии могут указывать на ошибки в данных, необычные события, мошеннические действия или даже интересные научные открытия. Примеры использования обнаружения аномалий включают:

- **Финансы**: Выявление мошеннических транзакций.
- **Медицина**: Диагностика редких заболеваний.
- **Интернет-безопасность**: Обнаружение кибератак.
- **Производство**: Контроль качества продукции.
- **Астрономия**: Поиск новых объектов во вселенной.

Одним из простых и часто используемых методов для обнаружения аномалий является алгоритм **Z-Score**. Давайте разберем его подробно.



## 1. Что такое Anomaly Detection?

### Определение
Аномалией называется точка данных, которая значительно отличается от остальных данных. Эти точки могут быть вызваны:
- Случайными флуктуациями.
- Неправильными данными.
- Исключительными событиями.

### Типы аномалий
1. **Точечные аномалии (Point Anomalies)**: Одиночные значения, которые сильно отличаются от других значений.
   - Пример: Температура в комнате обычно держится около 20°C, но внезапно фиксируется значение 50°C.

2. **Контекстные аномалии (Contextual Anomalies)**: Значения, которые являются аномальными только в определенном контексте.
   - Пример: Высокая температура тела (39°C) может быть нормальной при гриппе, но аномальной в обычных условиях.

3. **Коллективные аномалии (Collective Anomalies)**: Группа последовательных точек данных, которые вместе образуют аномалию.
   - Пример: Резкое падение курса акций компании за короткий промежуток времени.

# 2. Метод Z-Score для обнаружения аномалий

## 2.1. Что такое Z-Score?

Z-Score (или стандартный счет) — это статистическая мера, которая показывает, насколько конкретное значение отличается от среднего значения выборки в терминах стандартного отклонения. Другими словами, Z-Score позволяет стандартизировать данные и определить, насколько далеко каждое значение находится от среднего значения относительно разброса данных.

### 2.1.1. Формула Z-Score

Формула для расчета Z-Score выглядит следующим образом:

$$
Z = \frac{x - \mu}{\sigma}
$$

где:
- $x$ — конкретное значение из набора данных.
- $\mu$ — среднее значение выборки.
- $\sigma$ — стандартное отклонение выборки.

### 2.1.2. Интерпретация Z-Score

Значение Z-Score позволяет интерпретировать данные следующим образом:
- Если $|Z| < 2$: Значение считается нормальным. Это означает, что оно лежит в пределах двух стандартных отклонений от среднего значения.
- Если $|Z| \geq 2$: Значение может быть аномальным. Это указывает на то, что оно значительно удалено от среднего значения.
- Если $|Z| \geq 3$: Значение с высокой вероятностью является аномальным. Такие значения находятся за пределами трех стандартных отклонений от среднего.

Эти пороги основаны на свойствах нормального распределения:
- В нормальном распределении около **95%** всех значений лежат в пределах двух стандартных отклонений ($\pm 2\sigma$) от среднего значения.
- В нормальном распределении около **99.7%** всех значений лежат в пределах трех стандартных отклонений ($\pm 3\sigma$) от среднего значения.

Таким образом, если значение имеет $|Z| \geq 3$, оно с очень высокой вероятностью является выбросом или аномалией.

---

## 2.2. Алгоритм Z-Score для обнаружения аномалий

Алгоритм Z-Score для обнаружения аномалий состоит из нескольких шагов. Рассмотрим каждый из них подробно.

### Шаг 1: Вычисление среднего ($\mu$) и стандартного отклонения ($\sigma$)

Первым шагом является расчет основных статистических параметров выборки: среднего значения и стандартного отклонения.

#### Формулы:
1. **Среднее значение ($\mu$):**
   Среднее значение представляет собой центр тяжести данных и вычисляется как:
   $$
   \mu = \frac{1}{n} \sum_{i=1}^n x_i
   $$
   где:
   - $x_i$ — значение $i$-го элемента выборки.
   - $n$ — общее количество элементов в выборке.

2. **Стандартное отклонение ($\sigma$):**
   Стандартное отклонение измеряет разброс данных вокруг среднего значения и вычисляется как:
   $$
   \sigma = \sqrt{\frac{1}{n} \sum_{i=1}^n (x_i - \mu)^2}
   $$
   где:
   - $(x_i - \mu)$ — отклонение каждого значения от среднего.
   - $\sum_{i=1}^n (x_i - \mu)^2$ — сумма квадратов отклонений.

Пример:
Пусть у нас есть следующий набор данных:
$$
X = \{10, 12, 14, 16, 18\}
$$
1. Среднее значение:
   $$
   \mu = \frac{10 + 12 + 14 + 16 + 18}{5} = 14
   $$
2. Стандартное отклонение:
   $$
   \sigma = \sqrt{\frac{(10-14)^2 + (12-14)^2 + (14-14)^2 + (16-14)^2 + (18-14)^2}{5}} = \sqrt{\frac{16 + 4 + 0 + 4 + 16}{5}} = \sqrt{8} \approx 2.83
   $$

---

### Шаг 2: Вычисление Z-Score для каждого значения

На втором шаге мы рассчитываем Z-Score для каждого значения в наборе данных. Это позволяет стандартизировать данные и сравнить их относительно среднего значения.

#### Формула:
Для каждого значения $x_i$ Z-Score вычисляется по формуле:
$$
Z_i = \frac{x_i - \mu}{\sigma}
$$

Пример:
Используем те же данные $X = \{10, 12, 14, 16, 18\}$, где $\mu = 14$ и $\sigma \approx 2.83$:
1. Для $x_1 = 10$:
   $$
   Z_1 = \frac{10 - 14}{2.83} \approx -1.41
   $$
2. Для $x_2 = 12$:
   $$
   Z_2 = \frac{12 - 14}{2.83} \approx -0.71
   $$
3. Для $x_3 = 14$:
   $$
   Z_3 = \frac{14 - 14}{2.83} = 0
   $$
4. Для $x_4 = 16$:
   $$
   Z_4 = \frac{16 - 14}{2.83} \approx 0.71
   $$
5. Для $x_5 = 18$:
   $$
   Z_5 = \frac{18 - 14}{2.83} \approx 1.41
   $$

---

### Шаг 3: Определение порогового значения

После расчета Z-Score для каждого значения необходимо определить пороговое значение, которое будет использоваться для классификации аномалий. Обычно используются следующие пороги:
- $|Z| \geq 2$: Значение считается потенциальной аномалией.
- $|Z| \geq 3$: Значение с высокой вероятностью является аномалией.

Выбор порога зависит от специфики задачи и уровня строгости, который требуется для обнаружения аномалий.

---

### Шаг 4: Классификация аномалий

На последнем шаге мы сравниваем Z-Score каждого значения с выбранным порогом и классифицируем значения как нормальные или аномальные.

Пример:
Пусть у нас есть следующий набор данных:
$$
X = \{10, 12, 14, 16, 18, 50\}
$$
1. Среднее значение:
   $$
   \mu = \frac{10 + 12 + 14 + 16 + 18 + 50}{6} = 20
   $$
2. Стандартное отклонение:
   $$
   \sigma = \sqrt{\frac{(10-20)^2 + (12-20)^2 + (14-20)^2 + (16-20)^2 + (18-20)^2 + (50-20)^2}{6}} \approx 14.14
   $$
3. Z-Score для каждого значения:
   - $Z_1 = \frac{10 - 20}{14.14} \approx -0.71$
   - $Z_2 = \frac{12 - 20}{14.14} \approx -0.56$
   - $Z_3 = \frac{14 - 20}{14.14} \approx -0.42$
   - $Z_4 = \frac{16 - 20}{14.14} \approx -0.28$
   - $Z_5 = \frac{18 - 20}{14.14} \approx -0.14$
   - $Z_6 = \frac{50 - 20}{14.14} \approx 2.12$

4. Классификация:
   - Значения $x_1, x_2, x_3, x_4, x_5$ ($|Z| < 2$) считаются нормальными.
   - Значение $x_6$ ($|Z| \geq 2$) считается аномальным.

---

## 2.3. Преимущества и ограничения метода Z-Score

### Преимущества:
1. **Простота:** Метод Z-Score прост в реализации и понимании.
2. **Быстродействие:** Подходит для небольших и средних наборов данных.
3. **Универсальность:** Может применяться к различным типам данных.

### Ограничения:
1. **Чувствительность к выбросам:** Если данные содержат много аномалий, среднее и стандартное отклонение могут искажаться.
2. **Нормальное распределение:** Z-Score работает лучше всего, если данные приближаются к нормальному распределению.
3. **Не подходит для многомерных данных:** Z-Score эффективен только для одномерных данных. Для многомерных данных требуется более сложный анализ.

---

## 2.4. Улучшения Z-Score

Чтобы преодолеть некоторые ограничения Z-Score, можно использовать следующие подходы:
1. **Робастные методы:**
   - Использование медианы вместо среднего значения.
   - Использование интерквартильного размаха (IQR) вместо стандартного отклонения.
2. **Многомерный анализ:**
   - Применение методов, таких как Mahalanobis Distance, для анализа многомерных данных.
3. **Машинное обучение:**
   - Использование моделей, таких как Isolation Forest, Autoencoders или One-Class SVM, для обнаружения аномалий.



Таким образом, метод Z-Score — это простой и эффективный способ обнаружения аномалий в одномерных данных. Однако важно помнить о его ограничениях и использовать дополнительные методы для более сложных случаев. Обнаружение аномалий играет ключевую роль в различных областях, и правильный выбор инструментов может значительно повысить качество анализа данных.

$$
\boxed{\text{Z-Score — это мощный инструмент для быстрого анализа аномалий в одномерных данных.}}
$$

## Пример 1: Обнаружение аномалий в одномерных данных

### Задача:
У нас есть список температур (в градусах Цельсия), и мы хотим найти аномальные значения с помощью Z-Score.

```python
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# Данные (температура в °C)
data = [20, 22, 21, 19, 23, 20, 50, 22, 21]

# Шаг 1: Вычисление среднего и стандартного отклонения
mean = np.mean(data)
std_dev = np.std(data)

print(f"Среднее значение: {mean}")
print(f"Стандартное отклонение: {std_dev}")

# Шаг 2: Вычисление Z-Score для каждого значения
z_scores = [(x - mean) / std_dev for x in data]

# Шаг 3: Определение аномалий (порог |Z| >= 3)
threshold = 3
anomalies = [x for x, z in zip(data, z_scores) if abs(z) >= threshold]

print(f"Аномалии: {anomalies}")

# Визуализация данных
plt.figure(figsize=(10, 6))
plt.plot(data, label='Температура', marker='o')
plt.axhline(mean + threshold * std_dev, color='r', linestyle='--', label=f'Порог ({threshold}σ)')
plt.axhline(mean - threshold * std_dev, color='r', linestyle='--')
plt.scatter([i for i, z in enumerate(z_scores) if abs(z) >= threshold],
            [x for x, z in zip(data, z_scores) if abs(z) >= threshold],
            color='red', label='Аномалии')
plt.title('Обнаружение аномалий с помощью Z-Score')
plt.xlabel('Индекс')
plt.ylabel('Значение')
plt.legend()
plt.show()
```

### Результат:
- Среднее значение: ~27.56
- Стандартное отклонение: ~7.08
- Аномалия: `[50]`
- На графике показаны все данные, а аномальное значение выделено красным цветом.



## Пример 2: Обнаружение аномалий в DataFrame с использованием Pandas

### Задача:
У нас есть таблица с данными о продажах товаров, и мы хотим найти аномальные значения для каждой категории товаров.

```python
import pandas as pd
import numpy as np

# Создаем DataFrame с данными о продажах
data = {
    'Product': ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'],
    'Sales': [100, 120, 130, 110, 500, 200, 210, 205, 220, 800]
}
df = pd.DataFrame(data)

# Функция для вычисления Z-Score
def calculate_z_score(group):
    mean = group.mean()
    std_dev = group.std()
    return (group - mean) / std_dev

# Группировка данных по категории товара и вычисление Z-Score
df['Z_Score'] = df.groupby('Product')['Sales'].transform(calculate_z_score)

# Определение аномалий (порог |Z| >= 3)
threshold = 3
df['Anomaly'] = df['Z_Score'].apply(lambda z: 'Yes' if abs(z) >= threshold else 'No')

print(df)

# Вывод аномальных значений
anomalies = df[df['Anomaly'] == 'Yes']
print("\nАномальные значения:")
print(anomalies)
```

### Результат:
- DataFrame будет содержать дополнительные столбцы `Z_Score` и `Anomaly`.
- Аномальные значения будут выделены как `'Yes'`.

Пример вывода:
```
   Product  Sales    Z_Score Anomaly
0        A    100 -0.845154      No
1        A    120 -0.281718      No
2        A    130  0.000000      No
3        A    110 -0.563436      No
4        A    500  2.709380     Yes
5        B    200 -0.566265      No
6        B    210  0.000000      No
7        B    205 -0.283133      No
8        B    220  0.566265      No
9        B    800  3.389589     Yes

Аномальные значения:
   Product  Sales    Z_Score Anomaly
4        A    500  2.709380     Yes
9        B    800  3.389589     Yes
```



## Пример 3: Обнаружение аномалий в многомерных данных

Для многомерных данных можно использовать расширение Z-Score — **Mahalanobis Distance**. Вот пример:

```python
import numpy as np
from scipy.spatial.distance import mahalanobis
import matplotlib.pyplot as plt

# Многомерные данные (две переменные: X и Y)
data = np.array([
    [1, 2], [2, 3], [3, 4], [4, 5], [5, 6],
    [10, 12], [11, 13], [12, 14], [13, 15], [14, 16]
])

# Шаг 1: Вычисление среднего и ковариационной матрицы
mean = np.mean(data, axis=0)
cov_matrix = np.cov(data, rowvar=False)

# Шаг 2: Вычисление Mahalanobis Distance для каждой точки
distances = []
for point in data:
    dist = mahalanobis(point, mean, np.linalg.inv(cov_matrix))
    distances.append(dist)

# Шаг 3: Определение аномалий (порог Mahalanobis Distance > 5)
threshold = 5
anomalies = [point for point, dist in zip(data, distances) if dist > threshold]

print(f"Аномалии: {anomalies}")

# Визуализация данных
plt.figure(figsize=(8, 6))
plt.scatter(data[:, 0], data[:, 1], label='Данные', alpha=0.7)
plt.scatter([a[0] for a in anomalies], [a[1] for a in anomalies], color='red', label='Аномалии')
plt.title('Обнаружение аномалий с помощью Mahalanobis Distance')
plt.xlabel('X')
plt.ylabel('Y')
plt.legend()
plt.show()
```

### Результат:
- Аномальные точки будут выделены красным цветом на графике.
- Mahalanobis Distance учитывает корреляцию между переменными, что делает его более подходящим для многомерных данных.



 ##Обнаружение аномалий во временных рядах

## Введение

В предыдущей части мы рассмотрели метод Z-Score для обнаружения аномалий в одномерных данных. Однако, когда дело доходит до анализа временных рядов, появляются дополнительные сложности, такие как тренды, сезонность и автокорреляция. В этой части мы углубимся в специфические подходы к обнаружению аномалий во временных рядах.



## 1. Особенности временных рядов

Временные ряды — это последовательности данных, упорядоченные по времени. Они могут иметь следующие характеристики:

1. **Тренд (Trend):** Долгосрочное направление изменения данных (рост или падение).
2. **Сезонность (Seasonality):** Периодические колебания, повторяющиеся через определенные промежутки времени.
3. **Цикличность (Cyclic Patterns):** Менее регулярные колебания, не связанные с фиксированным временем года.
4. **Шум (Noise):** Случайные флуктуации, которые не имеют четкой закономерности.

Эти особенности делают обнаружение аномалий во временных рядах более сложной задачей, чем в статических данных.


## 2. Методы обнаружения аномалий во временных рядах

### 2.1. Метод Z-Score с учетом тренда и сезонности

Метод Z-Score можно адаптировать для временных рядов, но необходимо учитывать тренд и сезонность. Вот основные шаги:

1. **Удаление тренда:** Используйте скользящее среднее или дифференцирование для удаления тренда.
2. **Учет сезонности:** Примените декомпозицию временного ряда для разделения данных на тренд, сезонность и остатки.
3. **Вычисление Z-Score:** Рассчитайте Z-Score для детренденных или остаточных данных.

#### Пример реализации:
```python
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# Генерация временного ряда с трендом и шумом
np.random.seed(42)
time = pd.date_range(start='2023-01-01', periods=100, freq='D')
data = np.linspace(10, 50, 100) + np.random.normal(0, 5, 100)  # Линейный тренд + шум
data[20] += 30  # Искусственная аномалия
df = pd.DataFrame({'Date': time, 'Value': data})
df.set_index('Date', inplace=True)

# Удаление тренда (дифференцирование)
df['Trend'] = df['Value'].rolling(window=7).mean()  # Сглаживание тренда
df['Detrended'] = df['Value'] - df['Trend']

# Вычисление Z-Score
mean = df['Detrended'].mean()
std_dev = df['Detrended'].std()
df['Z_Score'] = (df['Detrended'] - mean) / std_dev

# Определение аномалий (порог |Z| >= 3)
threshold = 3
df['Anomaly'] = df['Z_Score'].apply(lambda z: 'Yes' if abs(z) >= threshold else 'No')

# Визуализация результатов
plt.figure(figsize=(12, 6))
plt.plot(df.index, df['Value'], label='Исходные данные', color='blue')
plt.scatter(df[df['Anomaly'] == 'Yes'].index,
            df[df['Anomaly'] == 'Yes']['Value'],
            color='red', label='Аномалии')
plt.title('Обнаружение аномалий во временном ряду с помощью Z-Score')
plt.xlabel('Дата')
plt.ylabel('Значение')
plt.legend()
plt.show()
```


### 2.2. Seasonal Decomposition для анализа остатков

Если данные содержат сезонность, можно использовать метод декомпозиции временного ряда для разделения данных на компоненты: тренд, сезонность и остатки. Затем анализируют остатки для обнаружения аномалий.

#### Алгоритм:
1. Разложите временной ряд на тренд, сезонность и остатки.
2. Вычислите Z-Score для остатков.
3. Классифицируйте значения с высоким Z-Score как аномальные.

#### Пример реализации:
```python
from statsmodels.tsa.seasonal import seasonal_decompose

# Декомпозиция временного ряда
result = seasonal_decompose(df['Value'], model='additive', period=7)

# Извлечение остатков
df['Residuals'] = result.resid

# Вычисление Z-Score для остатков
mean_residual = df['Residuals'].mean()
std_residual = df['Residuals'].std()
df['Z_Score_Residuals'] = (df['Residuals'] - mean_residual) / std_residual

# Определение аномалий (порог |Z| >= 3)
threshold = 3
df['Anomaly'] = df['Z_Score_Residuals'].apply(lambda z: 'Yes' if abs(z) >= threshold else 'No')

# Визуализация результатов
plt.figure(figsize=(12, 8))

# Исходные данные
plt.subplot(4, 1, 1)
plt.plot(df.index, df['Value'], label='Исходные данные')
plt.title('Исходные данные')
plt.legend()

# Тренд
plt.subplot(4, 1, 2)
plt.plot(result.trend, label='Тренд')
plt.title('Тренд')
plt.legend()

# Сезонность
plt.subplot(4, 1, 3)
plt.plot(result.seasonal, label='Сезонность')
plt.title('Сезонность')
plt.legend()

# Остатки и аномалии
plt.subplot(4, 1, 4)
plt.plot(df.index, df['Residuals'], label='Остатки', color='blue')
plt.scatter(df[df['Anomaly'] == 'Yes'].index,
            df[df['Anomaly'] == 'Yes']['Residuals'],
            color='red', label='Аномалии')
plt.title('Остатки и аномалии')
plt.legend()

plt.tight_layout()
plt.show()
```

### 2.3. Prophet для прогнозирования и обнаружения аномалий

Библиотека `Prophet` от Facebook позволяет строить модели временных рядов с учетом тренда и сезонности. Она также предоставляет возможность автоматически выявлять аномалии.

#### Алгоритм:
1. Постройте модель Prophet для временного ряда.
2. Вычислите ошибку между фактическими и прогнозируемыми значениями.
3. Используйте Z-Score или другой метод для классификации значений с большой ошибкой как аномальных.

#### Пример реализации:
```python
from fbprophet import Prophet

# Подготовка данных для Prophet
df_prophet = df.reset_index()
df_prophet.columns = ['ds', 'y']

# Создание и обучение модели
model = Prophet()
model.fit(df_prophet)

# Предсказание
future = model.make_future_dataframe(periods=0)
forecast = model.predict(future)

# Вычисление ошибки (разница между фактическими и прогнозируемыми значениями)
df_prophet['Forecast'] = forecast['yhat']
df_prophet['Error'] = df_prophet['y'] - df_prophet['Forecast']

# Вычисление Z-Score для ошибки
mean_error = df_prophet['Error'].mean()
std_error = df_prophet['Error'].std()
df_prophet['Z_Score_Error'] = (df_prophet['Error'] - mean_error) / std_error

# Определение аномалий (порог |Z| >= 3)
threshold = 3
df_prophet['Anomaly'] = df_prophet['Z_Score_Error'].apply(lambda z: 'Yes' if abs(z) >= threshold else 'No')

# Визуализация результатов
fig = model.plot(forecast)
ax = fig.gca()
anomalies = df_prophet[df_prophet['Anomaly'] == 'Yes']
ax.scatter(anomalies['ds'], anomalies['y'], color='red', label='Аномалии')
plt.legend()
plt.show()
```


### 2.4. Isolation Forest для обнаружения аномалий

Isolation Forest — это алгоритм машинного обучения, который эффективно работает для обнаружения аномалий в многомерных данных, включая временные ряды.

#### Алгоритм:
1. Преобразуйте временной ряд в формат, пригодный для обучения (например, используйте окна фиксированной длины).
2. Обучите модель Isolation Forest.
3. Классифицируйте значения, получившие низкий "степень изоляции", как аномальные.

#### Пример реализации:
```python
from sklearn.ensemble import IsolationForest

# Подготовка данных
X = df['Value'].values.reshape(-1, 1)

# Создание и обучение модели Isolation Forest
model = IsolationForest(contamination=0.01, random_state=42)
model.fit(X)

# Предсказание аномалий
df['Anomaly'] = model.predict(X)
df['Anomaly'] = df['Anomaly'].apply(lambda x: 'Yes' if x == -1 else 'No')

# Визуализация результатов
plt.figure(figsize=(12, 6))
plt.plot(df.index, df['Value'], label='Исходные данные', color='blue')
plt.scatter(df[df['Anomaly'] == 'Yes'].index,
            df[df['Anomaly'] == 'Yes']['Value'],
            color='red', label='Аномалии')
plt.title('Обнаружение аномалий с помощью Isolation Forest')
plt.xlabel('Дата')
plt.ylabel('Значение')
plt.legend()
plt.show()
```


## 3. Сравнение методов

| Метод                | Преимущества                                                                 | Недостатки                                                                 |
|----------------------|-----------------------------------------------------------------------------|---------------------------------------------------------------------------|
| Z-Score              | Простота реализации, интерпретируемость.                                   | Не учитывает сложные зависимости, чувствителен к выбросам.               |
| Seasonal Decomposition | Учет тренда и сезонности.                                                  | Требует правильного выбора параметров (период сезонности).                |
| Prophet              | Автоматическое учет тренда и сезонности, простота использования.           | Может быть менее точным для коротких временных рядов.                     |
| Isolation Forest     | Эффективен для сложных зависимостей, не требует явного расчета Z-Score.    | Требует больше вычислительных ресурсов, менее интерпретируем.             |


## 4. Заключение

Обнаружение аномалий во временных рядах — это важная задача, которая требует учета особенностей данных, таких как тренд и сезонность. Мы рассмотрели несколько подходов:

1. **Z-Score** с предварительной обработкой данных.
2. **Seasonal Decomposition** для анализа остатков.
3. **Prophet** для построения моделей с учетом тренда и сезонности.
4. **Isolation Forest** для автоматического обнаружения аномалий.

Выбор метода зависит от характера данных и целей анализа. Для простых задач подойдут Z-Score и Seasonal Decomposition, а для более сложных случаев рекомендуется использовать Prophet или Isolation Forest.

$$
\boxed{\text{Обнаружение аномалий во временных рядах требует учета тренда, сезонности и других характеристик данных.}}
$$