# Using `Giotto-tda` Takens embedding algorithm 

Utilizaremos la paquetería de `giotto-tda` para realizar el encaje de Takens. Esta paquetería es una de las más completas para realizar análisis topológico de datos.

Para esto necesitas instalar la paquetería con el siguiente comando:

pip install giotto-tda

Una vez instalada la paquetería, importamos las librerías necesarias para realizar el encaje de Takens:



In [1]:
import numpy as np
import pandas as pd
from gtda.time_series import SingleTakensEmbedding, takens_embedding_optimal_parameters
import plotly.graph_objects as go
from gtda.plotting import plot_point_cloud

Utiliza las series de tiempo periódicas vistas la clase pasada (coseno, seno y f(t)) para realizar el encaje de Takens.

In [2]:
x_periodic = np.linspace(0, 10, 1000)
y_periodic = np.cos(5 * x_periodic)

# Escogemos nuestros parametros para el encaje
# d= embedding_dimension_periodic
# tau = embedding_time_delay_periodic
# stride = nos permite tomar un subconjunto de los datos.
embedding_dimension_periodic = 3
embedding_time_delay_periodic = 8
stride = 1

# Modifica el `stride` y el `delay` para obtener diferentes encajes, de lo anterior.

embedder_periodic = SingleTakensEmbedding(
    parameters_type="fixed",
    n_jobs=2,
    time_delay=embedding_time_delay_periodic,
    dimension=embedding_dimension_periodic,
    stride=stride,
)

y_periodic_embedded = embedder_periodic.fit_transform(y_periodic)
print(f"Shape of embedded time series: {y_periodic_embedded.shape}")

Shape of embedded time series: (984, 3)


In [3]:
plot_point_cloud(y_periodic_embedded)

### ¿Que es lo que modifica el `stride`?

El `stride`permite tomar una sub-muestra de nuestros datos (esto para reducir la cantidad de calculos en el análisis de persistencia).

### ¿Cómo se modifica mi encaje considerando el paramétro `stride`?

Supongamos que tenemos una muestra de 10 datos de $t\in[0,10],$ y tomamos un `stride` de 2, entonces nuestra sub-muestra sería: $[f(0),f(2),f(4),f(6),f(8),f(10)].$ Si consideramos un `delay` de 1 y un `dimension` de 2, entonces nuestro encaje sería: $[[f(0),f(1)],[f(2),f(3)],[f(4),f(5)],[f(6),f(7)],[f(8),f(9)]]$.

Si tomamos un `stride` de 4, entonces nuestra sub-muestra sería: $[f(0),f(4),f(8)].$ Si consideramos un `delay` de 2 y un `dimension` de 2, entonces nuestro encaje sería: $[[f(0),f(2)],[f(4),f(6)],[f(8),f(10)]]$.

### ¿Que es lo que modifica el `delay`?

El `delay` nos dice el tiempo que sucede entre la cada coordenada de nuestro encaje.

In [4]:
from openml.datasets.functions import get_dataset
lorenz = get_dataset(42182).get_data(dataset_format='array')[0][0:, 0]
t = [i for i in range(len(lorenz))]
fig = go.Figure()
fig.add_trace(go.Scatter(
    x=t, y=lorenz, mode='markers'))
fig.show()

In [10]:
embedding_dimension_periodic = 3
embedding_time_delay_periodic = 5
stride = 10

# Modifica el `stride` y el `delay` para obtener diferentes encajes, de lo anterior.

embedder_nperiodic = SingleTakensEmbedding(
    parameters_type="fixed",
    n_jobs=2,
    time_delay=embedding_time_delay_periodic,
    dimension=embedding_dimension_periodic,
    stride=stride,
)

lorenz_nperiodic_embedded = embedder_nperiodic.fit_transform(lorenz)
print(f"Shape of embedded time series: {lorenz_nperiodic_embedded.shape}")
plot_point_cloud(lorenz_nperiodic_embedded)

Shape of embedded time series: (494, 3)


In [6]:
y_periodic_embedded = y_periodic_embedded[None, :, :]
lorenz_nperiodic_embedded = lorenz_nperiodic_embedded[None, :, :]

In [7]:
from gtda.homology import VietorisRipsPersistence

# 0 - connected components, 1 - loops, 2 - voids
homology_dimensions = [0, 1, 2]

periodic_persistence = VietorisRipsPersistence(
    homology_dimensions=homology_dimensions, n_jobs=6
)
print("Persistence diagram for periodic signal")
periodic_persistence.fit_transform_plot(y_periodic_embedded)

nonperiodic_persistence = VietorisRipsPersistence(
    homology_dimensions=homology_dimensions, n_jobs=6
)
print("Persistence diagram for nonperiodic signal")
nonperiodic_persistence.fit_transform_plot(lorenz_nperiodic_embedded);

Persistence diagram for periodic signal


Persistence diagram for nonperiodic signal


In [11]:
Persistence diagram for lorenz_nperiodic_embedded signal

SyntaxError: invalid syntax (3323517513.py, line 1)