In [None]:
from sklearn.cluster import DBSCAN
from sklearn.datasets import make_blobs
import matplotlib.pyplot as plt
import numpy as np

# Número de puntos
n_points = 4000

# Generación aleatoria de puntos y ruido
points, y_true = make_blobs(n_samples=n_points,
                            centers=4,
                            cluster_std=0.06,
                            random_state=11,
                            center_box=(0, 1.0))

# Solo puntos positivos y con tres decimales
points = np.round(np.abs(points[:, ::-1]), 3)

# Guardando puntos a un archivo CSV
np.savetxt("../data/input/" + str(n_points) + "_data.csv", points, delimiter=",", fmt="%.3f")

# Agrupando y detectando ruido con DBSCAN
clusters = DBSCAN(eps=0.03, min_samples=10).fit_predict(points)

# Graficando ruido
plt.figure()
plt.title("Detecting noise with DBSCAN")
plt.scatter(points[:, 0], points[:, 1], c=np.where(clusters==-1, 0, 1), s=50)
plt.xticks([])
plt.yticks([])
plt.box(False)
plt.show()


In [None]:

# Cargando resultados del programa C++ en un arreglo de NumPy
result = np.loadtxt("../data/output/" + str(n_points) + "_results.csv", delimiter=",")

# Graficando ruido
plt.figure()
plt.title("Detecting noise with my DBSCAN")
plt.scatter(result.T[0], result.T[1], c=result.T[2], s=50)
plt.xticks([])
plt.yticks([])
plt.box(False)
plt.show()