# Demostraciones prácticas de la entrega 2
Juan Francisco Mier Montoto, UO283319

In [None]:
# Para ejecutar los siguientes ejemplos, se necesitan las siguientes librerías
# %pip install pandas
# %pip install matplotlib
# %pip install numpy
# %pip install scikit-learn
# %pip install ipywidgets

In [25]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.spatial import distance
from sklearn.neighbors import KNeighborsClassifier, NearestNeighbors
from ipywidgets import interact, interactive, fixed, interact_manual
import ipywidgets as widgets

****

In [31]:
media, cov, n = np.array([0.01, 0.74]), np.array([[1.0, 0.5], [0.5, 1.0]]), 1000
rng = np.random.default_rng(7401) # generador de números aleatorios
data = rng.multivariate_normal(media, cov, n) # generación de muestras
x, y = data.T # separación de las muestras en dos vectores

## Ejemplo 1
Demostración del funcionamiento de la distancia de Mahalanobis con distribuciones multivariantes.

In [32]:
def plot_mahalanobis(media, cov, n, x, y, umbral):
	cov_inv = np.linalg.inv(cov) # inversa de la covarianza para calcular la distancia de Mahalanobis

	dist = [distance.mahalanobis(media, [x[i], y[i]], cov_inv) for i in range(n)]

	# dibujar el valor absoluto para las distancias y el umbral
	dist_abs = np.abs(dist)
	plt.title('Distancia absoluta de Mahalanobis')
	plt.plot(dist_abs, 'x')
	plt.axhline(y=umbral, color='r', linestyle='--', label='Umbral')
	plt.scatter(np.nonzero(dist_abs > umbral)[0], dist_abs[dist_abs > umbral], color='red', label='Anomalía')
	plt.legend()
	plt.show()

	# dibuajar el plot de las muestras originales coloreando las que están por encima del umbral
	plt.title('Muestras coloreadas por encima del umbral')
	plt.plot(x, y, 'x', color='purple', label='Muestra normal')
	plt.plot(x[np.abs(dist) > umbral], y[np.abs(dist) > umbral], 'x', color='orange', label='Muestra anómala')
	plt.legend()
	plt.show()

interact(plot_mahalanobis, media=fixed(media), cov=fixed(cov), n=fixed(n), x=fixed(x), y=fixed(y), umbral=(0, 5, 0.1))

interactive(children=(FloatSlider(value=2.0, description='umbral', max=5.0), Output()), _dom_classes=('widget-…

<function __main__.plot_mahalanobis(media, cov, n, x, y, umbral)>

## Ejemplo 2
Detección de anomalías basada en proximidad (knn)

In [34]:
def knn(media, cov, n, data, k, threshold):
	neighbours = NearestNeighbors(n_neighbors=k).fit(data)
	dist, _ = neighbours.kneighbors(data)
	dist = np.mean(dist, axis=1)
	plt.plot(dist, 'x')
	plt.axhline(y=threshold, color='r', linestyle='--', label='Umbral')
	plt.scatter(np.nonzero(dist > threshold)[0], dist[dist > threshold], color='red', label='Anomalía')
	plt.legend()
	plt.show()

interact(knn, media=fixed(media), cov=fixed(cov), n=fixed(n), data=fixed(data), k=(1, 10, 1), threshold=(0, 5, 0.1))

interactive(children=(IntSlider(value=5, description='k', max=10, min=1), FloatSlider(value=2.0, description='…

<function __main__.knn(media, cov, n, data, k, threshold)>