# Gato en 3D

## Importamos las librerías

In [1]:
import matplotlib       
import matplotlib.pyplot as plt
import numpy as np
import sklearn
import kmapper as km

'Numerical Python' (numpy pa'los cuates) es una librería para procesar arreglos o listas de múltiples dimensiones (https://numpy.org/).

## Carguemos nuestros datos

In [2]:
data = np.genfromtxt("Cat.csv", delimiter=",")

'numpy.genfromtxt' carga los datos de un archivo de texto, con los valores faltantes manejados como se especifica.

### Parámetros:
* fname: Archivo, nombre del archivo, lista o archivo generador para leer.
* delimiter: La cadena usada para separar valores. Por default, considera cualquier sucesión de espacios en blanco consecutivos como delimitador. Se puede usar un número entero o sucesión de números enteros como el ancho de cada entrada.

### Salida:
* ndarray: Datos leídos desde un archivo de texto.

## Echémosle un ojo:

In [11]:
gato = data.view()

In [4]:
gato

array([[ 1.35790e-02,  2.15377e-01, -1.70891e-01],
       [ 1.04930e-02,  2.26649e-01, -1.73601e-01],
       [ 2.04150e-02,  2.30665e-01, -1.75927e-01],
       ...,
       [-1.71000e-04,  2.63030e-01, -4.59012e-01],
       [ 4.05300e-03,  2.64760e-01, -4.62176e-01],
       [ 2.31480e-02,  2.19681e-01, -1.73577e-01]])

'ndarray.view' sirve para visualizar arreglos tipo 'ndarray'.
### Parámetros:
* dtype: Descripción del tipo de datos
* type: Tipo de la vista devuelta, es decir, ndarray o matriz.

## Iniciamos MAPPER:

'sklearn.cluster.DBSCAN' ejecuta DBSCAN (Density-Based Spatial Clustering of Applications with Noise) para un arreglo de vectores o matriz de distancias. Encuentra muestras de núcleo de alta densidad y expande grupos a partir de ellas. Bueno para datos que contienen grupos de densidad similar.
### Parámetros
* eps: La máxima distancia entre dos muestras para ser consideradas vecinas. No es la máxima cota superior sobre las distancias entre puntos del cluster. Es el parámetro más importatne de DBSCAN que se debe elegir apropiadamente para el conjunto de datos y la métrica.
* min_samples: El número de muestras (o peso total) en la vecindad de un punto para que sea considerado como núcleo. Esto incluye al mismo punto.
* metric: La métrica que se usará al calcular la distancia entre instancias en la matriz. Por default es 'euclidean'. 
* metric_params: Argumentos clave adicionales para la métrica.
* algorithm: El algoritmo usado para el módulo (función) NearestNeighbors para calcular distancias y encontrar vecinos. Por default: auto.
* leaf_size: Tamaño de hoja para BallTree o cKDTree.
* p: La pontencia en la métrica de Minkowski (métrica p-ésima) usada para calcular distancias.
* n_jobs: El número de trabajos paralelos que van a correr.

### Atributos:
* core_sample_indices_: Índices de núcles de las muestras.
* components_: Copia de cada núcleo muestra encontrado para entrenamiento.
* labels_: Etiquetas de los clusters para cada punto en el conjunto de datos.
* n_features_in_: Número de características vistas.
* features_names_in_: Nombres de las características vistas.

In [5]:
mapper = km.KeplerMapper(verbose=3)
lens = mapper.fit_transform(data)

graph = mapper.map(
    lens,
    data,
    clusterer=sklearn.cluster.DBSCAN(eps=0.1, min_samples=5),
    cover=km.Cover(n_cubes=15, perc_overlap=0.2),
)

mapper.visualize(graph, path_html="Cat Sum.html",
                 title="Cat Sum")

KeplerMapper(verbose=3)
..Composing projection pipeline of length 1:
	Projections: sum
	Distance matrices: False
	Scalers: MinMaxScaler()
..Projecting on data shaped (7207, 3)

..Projecting data using: sum

..Scaling with: MinMaxScaler()

Mapping on data shaped (7207, 3) using lens shaped (7207, 1)

Minimal points in hypercube before clustering: 5
Creating 15 hypercubes.
   > Found 2 clusters in hypercube 0.
   > Found 2 clusters in hypercube 1.
   > Found 2 clusters in hypercube 2.
   > Found 1 clusters in hypercube 3.
   > Found 2 clusters in hypercube 4.
   > Found 2 clusters in hypercube 5.
   > Found 1 clusters in hypercube 6.
   > Found 1 clusters in hypercube 7.
   > Found 1 clusters in hypercube 8.
   > Found 1 clusters in hypercube 9.
   > Found 1 clusters in hypercube 10.
   > Found 1 clusters in hypercube 11.
   > Found 1 clusters in hypercube 12.
   > Found 1 clusters in hypercube 13.
   > Found 1 clusters in hypercube 14.

Created 19 edges and 20 nodes in 0:00:00.174322.
W

'<!DOCTYPE html>\n<html>\n\n<head>\n  <meta charset="utf-8">\n  <meta name="generator" content="KeplerMapper">\n  <title>Cat Sum | KeplerMapper</title>\n\n  <link rel="icon" type="image/png" href="http://i.imgur.com/axOG6GJ.jpg" />\n\n  <link href=\'https://fonts.googleapis.com/css?family=Roboto+Mono:700,300\' rel=\'stylesheet\' type=\'text/css\'>\n  <style>* {\n  margin: 0;\n  padding: 0;\n}\n\nhtml, body {\n  height: 100%;\n}\n\nbody {\n  font-family: "Roboto Mono", "Helvetica", sans-serif;\n  font-size: 14px;\n}\n\n#logo {\n  width:  85px;\n  height: 85px;\n}\n\n#display {\n  color: #95A5A6;\n  background: #212121;\n}\n\n#header {\n  background: #111111;\n}\n\n#print {\n  color: #000;\n  background: #FFF;\n}\n\nh1 {\n  font-size: 21px;\n  font-weight: 300;\n  font-weight: 300;\n}\n\nh2 {\n  font-size: 18px;\n  padding-bottom: 20px;\n  font-weight: 300;\n}\n\nh3 {\n  font-size: 14px;\n  font-weight: 700;\n  text-transform: uppercase;\n}\n\nh4 {\n  font-size: 13px;\n  font-weight: 700

In [6]:
lens = mapper.fit_transform(data, projection="l2norm")

graph = mapper.map(
    lens,
    data,
    clusterer=sklearn.cluster.DBSCAN(eps=0.5, min_samples=3),
    cover=km.Cover(n_cubes=15, perc_overlap=0.2),
)

mapper.visualize(graph, path_html="Cat l2norm.html",
                 title="Cat l2norm")

..Composing projection pipeline of length 1:
	Projections: l2norm
	Distance matrices: False
	Scalers: MinMaxScaler()
..Projecting on data shaped (7207, 3)

..Projecting data using: l2norm

..Scaling with: MinMaxScaler()

Mapping on data shaped (7207, 3) using lens shaped (7207, 1)

Minimal points in hypercube before clustering: 3
Creating 15 hypercubes.
   > Found 1 clusters in hypercube 0.
   > Found 1 clusters in hypercube 1.
   > Found 1 clusters in hypercube 2.
   > Found 1 clusters in hypercube 3.
   > Found 1 clusters in hypercube 4.
   > Found 1 clusters in hypercube 5.
   > Found 1 clusters in hypercube 6.
   > Found 1 clusters in hypercube 7.
   > Found 1 clusters in hypercube 8.
   > Found 1 clusters in hypercube 9.
   > Found 1 clusters in hypercube 10.
   > Found 2 clusters in hypercube 11.
   > Found 2 clusters in hypercube 12.
   > Found 2 clusters in hypercube 13.
   > Found 1 clusters in hypercube 14.

Created 17 edges and 18 nodes in 0:00:00.186051.
Wrote visualization

'<!DOCTYPE html>\n<html>\n\n<head>\n  <meta charset="utf-8">\n  <meta name="generator" content="KeplerMapper">\n  <title>Cat l2norm | KeplerMapper</title>\n\n  <link rel="icon" type="image/png" href="http://i.imgur.com/axOG6GJ.jpg" />\n\n  <link href=\'https://fonts.googleapis.com/css?family=Roboto+Mono:700,300\' rel=\'stylesheet\' type=\'text/css\'>\n  <style>* {\n  margin: 0;\n  padding: 0;\n}\n\nhtml, body {\n  height: 100%;\n}\n\nbody {\n  font-family: "Roboto Mono", "Helvetica", sans-serif;\n  font-size: 14px;\n}\n\n#logo {\n  width:  85px;\n  height: 85px;\n}\n\n#display {\n  color: #95A5A6;\n  background: #212121;\n}\n\n#header {\n  background: #111111;\n}\n\n#print {\n  color: #000;\n  background: #FFF;\n}\n\nh1 {\n  font-size: 21px;\n  font-weight: 300;\n  font-weight: 300;\n}\n\nh2 {\n  font-size: 18px;\n  padding-bottom: 20px;\n  font-weight: 300;\n}\n\nh3 {\n  font-size: 14px;\n  font-weight: 700;\n  text-transform: uppercase;\n}\n\nh4 {\n  font-size: 13px;\n  font-weight: 

## Para graficar el gato en 3D

In [19]:
import plotly.graph_objects as go
import numpy as np

# Create the layout
layout = go.Layout(
    scene=dict(xaxis=dict(showbackground=False),
               yaxis=dict(showbackground=False),
               zaxis=dict(showbackground=False)),
    margin=dict(
        l=0,
        r=0,
        b=0,
        t=0
    )
)

# Define the trace variable
trace = go.Scatter3d(x=data[:, 0], y=data[:, 1], z=data[:, 2], mode='markers',
                     marker=dict(color='black', size=2))

# Create the Figure and add the scatter plot
fig = go.Figure(data=[trace], layout=layout)

# Show the figure
fig.show()

Lo guardamos en HTML :D

In [18]:
import plotly.offline as pyo

# Create the Figure and add the scatter plot
fig = go.Figure(data=[trace], layout=layout)

# Save the figure as an HTML file
pyo.plot(fig, filename='GATO EN 3D LOLAZO.html', auto_open=True)

'GATO EN 3D LOLAZO.html'