## PyOD

PyOD - это наиболее полная и постоянно расширяемая библиотека Python для обнаружения аномалий в многомерных данных. PyOD включает в себя более 40 алгоритмов обнаружения, от классического LOF(SIGMOD 2000) до новейшего ECOD (TKDE 2020). С 2017 года PyOD успешно используется в многочисленных учебных и научных исследованиях, и коммерческих продуктах с более чем 8 миллионами загрузок.<br>
<a href="https://pyod.readthedocs.io/_/downloads/en/latest/pdf/#page=187&zoom=100,96,556">Документация к библиотеке</a><br>
<a href="https://translated.turbopages.org/proxy_u/en-ru.ru.79d3c014-6321711b-eeca526b-74722d776562/https/pyod.readthedocs.io/en/latest/">Документация и ссылка на API на русском языке</a><br>
<a href="https://translated.turbopages.org/proxy_u/en-ru.ru.79d3c014-6321711b-eeca526b-74722d776562/https/github.com/yzhao062/Pyod/tree/master/examples">Репозиторий Github с примерами</a>


Преимущества PyOD:<br>
• Унифицированные API, подробная документация и интерактивные примеры различных алгоритмов.<br>
• Продвинутые модели, включая классическую оценку расстояния и плотности, новейшие методы глубокого обучения и новые алгоритмы, такие как CODE.<br>
• Оптимизированная производительность с помощью JIT и распараллеливания с использованием numba и joblib.<br>
• Быстрое обучение и прогнозирование с помощью SUOD (в PyOD можно одновременно обучать большое количество моделей используя фреймворк SUOD).<br>
• Совместимость как с Python 2, так и с Python 3. Все реализованные алгоритмы также совместимы с scikit-learn.

Инструментарий PyOD состоит из трех основных групп функциональных возможностей:<br>
 1) алгоритмы обнаружения аномалий;<br> 
 2) фреймворки для построения ансамблей моделей для поиска аномалий;<br>
 3) служебные функции для обнаружения аномалий.

Индивидуальные алгоритмы:

<u>Линейные модели для обнаружения выбросов:</u>

PCA: Анализ главных компонент
MCD: Определитель минимальной ковариации (использует расстояния Махаланобиса)
SVM: Одноклассовые методы опорных векторов

</u>Модели обнаружения выбросов на основе приближения:</u>

LOF: фактор локальных выбросов
CBLOF: фактор локальных выбросов на основе кластеризации
HBO: оценка выбросов на основе гистограммы
kNN: k ближайших соседей (использует расстояние до k-го ближайшего соседа в качестве показателя выбросов)

<u>Вероятностные модели для обнаружения выбросов:</u>

ABOD: обнаружение выбросов на основе угла (сравнения углов между парами векторов расстояний)
FastABOD: быстрое обнаружение выбросов на основе угла с использованием аппроксимации

<u>Ансамбли методы обнаружения анамалий и комбинированные фреймворки</u>

Алгоритм изоляционного леса (построен по теории дерева решений и случайного леса)
Пакетирование функций

Фреймворки для обнаружения выбросов / комбинирования результатов:

Пакетирование объектов: создание различных детекторов на основе случайно выбранных объектов
Среднее и средневзвешенное значение: просто объедините оценки путем усреднения
Максимизация: просто объедините оценки, взяв максимум по всем базовым детекторам
Среднее значение максимального значения (AOM)
Максимальное среднее значение (MOA)
Пороговая сумма (пороговое значение)

Служебные функции для обнаружения выбросов:

score_to_lable(): преобразование необработанных значений выбросов в двоичные метки
precision_n_scores(): одна из популярных оценочных метрик для анализа выбросов (точность @ ранг n)
generate_data(): генерирует псевдоданные для эксперимента по обнаружению выбросов
wpearsonr(): взвешенный Пирсон полезен для генерации псевдоземельной истины

 _ _ _
|тип алгоритма | Сокращенное название | описание алгоритма | год класс |
 _ _ _

| Вероятностный | ECOD | неконтролируемое обнаружение аномалий с использованием эмпирических кумулятивных функций распределения | 2022 | pyod.models.ecod.ECOD |
 _ _ _
| Вероятностный | COPOD | обнаружение выбросов на основе копул, описывающих структуру зависимости между случайными величинами |	2020 |	pyod.models.copod.COPOD |
 _ _ _
| Вероятностный	| ABOD | обнаружение выбросов на основе угла (сравнения углов между парами векторов расстояний) | 2008 | pyod.models.abod.ABOD |

Вероятностный	FastABOD	быстрое обнаружение выбросов на основе угла (сравнения углов между парами векторов расстояний)	2008	pyod.models.abod.ABOD

Вероятностный	MAD	на основе медианного абсолютного отклонения	1993	pyod.models.mad.MAD

Вероятностный	SOS	на основе выбора случайного выброса	2012	pyod.models.sos.SOS

Вероятностный	KDE	обнаружение выбросов на основе оценки плотности ядра	2007	pyod.models.kde.KDE

Вероятностный	Sampling	быстрое обнаружение аномалий на основе расстояния с помощью sampling	2013	pyod.models.sampling.Sampling

Вероятностный	GMM	на основе гауссовой смеси распределений		pyod.models.gmm.GMM

Линейный	PCA	на основе анализа главных компонент	2003	pyod.models.pca.PCA

Линейный	MCD	на основе определителя минимальной ковариации (использует расстояния Махаланобиса)	1999	pyod.models.mcd.MCD

Линейный	CD	используется расстояние Кука для обнаружения аномалий	1977	pyod.models.cd.CD

Линейный	OCSVM	используется одноклассовый метод опорных векторов	2001	pyod.models.ocsvm.OCSVM

Линейный	LMDD
	обнаружение аномалий на основе отклонений	1996	pyod.models.lmdd.LMDD

Основанный на близости 	LOF	на основе фактора локального выброса	2000	pyod.models.lof.LOF

Основанный на близости	COF	обнаружение аномалий на основе расстояния и плотности
2002	pyod.models.cof.COF

Основанный на близости	Incr. COF	обнаружение аномалий на основе расстояния и плотности с использованием памяти (работает медленнее)	2002	pyod.models.cof.COF

Основанный на близости	CBLOF	вычисляет показатель выбросов на основе кластерного локального коэффициента выбросов	2003	pyod.models.cblof.CBLOF

Основанный на близости	LOCI	интеграл локальной корреляции: предоставляет график LOCI для каждой точки, который суммирует много информации о данных в области вокруг точки	2003	pyod.models.loci.LOCI

Основанный на близости	HBOS	оценка выброса на основе гистограммы	2012	pyod.models.hbos.HBOS

Основанный на близости	kNN	на основе метода k ближайших соседей (использует расстояние до ближайшего соседа)	2000	pyod.models.knn.KNN

Основанный на близости	AvgKNN	на основе метода k ближайших соседей (использует среднее расстояние до ближайшего соседа)	2002	pyod.models.knn.KNN

Основанный на близости	MedKNN	на основе метода k ближайших соседей (использует медианное расстояние до ближайшего соседа)	2002	pyod.models.knn.KNN

Основанный на близости	SOD	обнаружение аномалий с помощью подпространств данных высокой размерности	2009	pyod.models.sod.SOD

Основанный на близости	ROD	обнаружение аномалий на основе вращения	2020	pyod.models.rod.ROD

Ансамбли	IForest	изоляционный лес	2008	pyod.models.iforest.IForest

Ансамбли	INNE	обнаружение аномалий на основе изоляции с помощью ансамблей ближайших соседей	2018	pyod.models.inne.INNE

Ансамбли	FB	Feature Bagging	2005	pyod.models.feature_bagging.FeatureBagging

Ансамбли	LSCP	Локально-выборочная комбинация параллельных ансамблей	2019	pyod.models.lscp.LSCP

Ансамбли	XGBOD	Обнаружение выбросов на основе экстремального усиления (под наблюдением)	2018	pyod.models.xgbod.XGBOD

Ансамбли	LODA	легкий он-лайн детектор аномалий	2016	pyod.models.loda.LODA

Ансамбли	SUOD	масштабируемое обнаружение неконтролируемых аномалий(ускоренное)	2021	pyod.models.suod.SUOD

Нейронные сети	AutoEncoder	полносвязный автоэнкодер (использует ошибку реконструкции в качестве оценки наличия аномалии)	2015	pyod.models.auto_encoder.AutoEncoder

Нейронные сети	VAE	вариационный автоэнкодер (использует ошибку реконструкции в качестве оценки наличия аномалии)	2013	pyod.models.vae.VAE

Нейронные сети	Beta-VAE	вариационный автоэнкодер (отличается в использовании множителя Лагранжа)	2018	pyod.models.vae.VAE

Нейронные сети	SO_GAAL	одноцелевое генеративное состязательное активное обучение	2019	pyod.models.so_gaal.SO_GAAL

Нейронные сети	MO_GAAL	многоцелевое генеративное состязательное активное обучение	2019	pyod.models.mo_gaal.MO_GAAL

Нейронные сети	DeepSVDD	глубокая одноклассовая классификация	2018	pyod.models.deep_svdd.DeepSVDD

Нейронные сети	AnoGAN	обнаружение аномалий с помощью генеративных состязательных сетей	2017	pyod.models.anogan.AnoGAN

Графовые нейронные сети	R-Graph	обнаружение выбросов с помощью R-графа	2017	pyod.models.rgraph.RGraph

Графовые нейронные сети	LUNAR	объединение методов обнаружения локальных выбросов с помощью графовых нейронных сетей	2022	pyod.models.lunar.LUNAR



In [None]:
! pip install pyod 