# Modules

In [1]:
#Importación de biblioteca numpy y renombrarla como np. Esta biblioteca 
# nos permitira trabajar con arreglos multidimensionales.
import numpy as np 
#Importación de biblioteca pandas y renombrarla como pd. Esta biblioteca 
# nos ayuda a manipular a analizar datos estructurados como DataFrames. 
# Un DF es como una tabla de excel.
import pandas as pd
#Importación de biblioteca math. Esta nos ayuda a utilizar funciones 
# matemáticas básicas.
import math
#La importación de plotly nos ayudará a poder utilizar objetos gráficos 
# como líneas, puntos y superficies.
import plotly.graph_objects as go
#Importar el módulo de distancia nos proporcionará funciones para poder 
# medir distancias en el espacio.
from scipy.spatial import distance
#Esta distribución (wrapcauchy) se utiliza para modelar ángulos o 
# direcciones en trayectorias, como en procesos estocásticos con giros.
from scipy.stats import wrapcauchy
#Al importar cauchy, podremos modelar datos que trabajan con colas pesadas, 
# específicamente nos va a servir para modelar CRW.
from scipy.stats import cauchy
#Con esta siguiente distribución podremos modelar datos con saltos grandes 
# e inesperados como el movimiento Browniano de Lévy.
from scipy.stats import levy_stable

## Vec2dClass

In [2]:
################# http://www.pygame.org/wiki/2DVectorClass ##################

#Qué hace esta parte?
#Estamos definiendo una clase llamada Vec2d, que hereda de 
# object, lo que es estándar en Python 2 y también compatible 
# con Python 3.

#Función: Esta clase es un modelo de un vector en 2D y proporciona 
# soporte para operadores matemáticos como suma y resta y funciones 
# útiles para manipulaciones vectoriales.
class Vec2d(object):
    """2d vector class, supports vector and scalar operators,
       and also provides a bunch of high level functions
       """
    #Esta siguiente línea __slots__ optimiza la memoria al defiir los 
    # atributos de la clase "x" y "y", restringiendo la creación de otros 
    # atributos. Esto es útil en aplicaciones de alta eficiencia, ya 
    # que evita el uso de un diccionario interno para almacenar atributos.
    __slots__ = ['x', 'y']

#Aquí vamos a inicializar un objeto de la clase Vec2d. __init__ es el 
# constructor que define cómo se crea un vector.
#Los parámetros que vamos a usar son:
#x_or_pair: Puede ser un par de valores, una lista, una tupla con dos 
# elementos o solo valor "x".
#y: Es opcional. Si no se proporciona, x_or_pair debe ser un par; si 
# se proporcina, x_or_pair es tratado como el valor de "x" y "y", es el valor de "y".
    def __init__(self, x_or_pair, y = None):
        if y == None:            
            self.x = x_or_pair[0]
            self.y = x_or_pair[1]
        else:
            self.x = x_or_pair
            self.y = y
            
    # Addition
    #Si "other" es otro Vec2d, suma componente a componente, si "other" tiene un método __getitem__
    # (es una lista o una tupla), suma los elementos correspondientes. Si "other" es un 
    # escalar, suma ese valor a ambos componentes "x" y "y".
    def __add__(self, other):
        if isinstance(other, Vec2d):
            return Vec2d(self.x + other.x, self.y + other.y)
        elif hasattr(other, "__getitem__"):
            return Vec2d(self.x + other[0], self.y + other[1])
        else:
            return Vec2d(self.x + other, self.y + other)

    # Subtraction
    #Lo mismo que el anterior, pero resta en vez de sumar.
    def __sub__(self, other):
        if isinstance(other, Vec2d):
            return Vec2d(self.x - other.x, self.y - other.y)
        elif (hasattr(other, "__getitem__")):
            return Vec2d(self.x - other[0], self.y - other[1])
        else:
            return Vec2d(self.x - other, self.y - other)
    
    # Vector length
    #Esta parte servirá para calcular la longitud o magnitud del vector utilizando el teorema de pitágoras.
    def get_length(self):
        return math.sqrt(self.x**2 + self.y**2)
    
    # rotate vector
    #Esta parte rota el vector por un ángulo dado en radianes.
    def rotated(self, angle):        
        cos = math.cos(angle)
        sin = math.sin(angle)
        x = self.x*cos - self.y*sin
        y = self.x*sin + self.y*cos
        return Vec2d(x, y)

## Brownian Motion

In [3]:
#Selecciona aleatoriamente un ángulo entre cuatro posibles valores: 
# 0, pi medios (90 grados), pi (180 grados) y 3 pi medios (270 grados). 
# Esta selección aleatoria se utiliza para determinar la dirección de 
# giro o rotación de un vector o movimieto en un plano bidimensional.
turn_angle=np.random.choice([0,np.pi/2,np.pi,3*np.pi/2])

In [4]:
#La función pd.read_csv() es una función de la librería de Pandas 
# que se utiliza para leer archivos CSV y convertirlos en un DataFrame de 
# Pandas. Se espera que el archivo esté en el mismo directorio desde 
# donde se está ejecutanto el script de Python. El resultado se guarda 
# en la variable: "BM_2d_df_3".
BM_2d_df_3=pd.read_csv('brownian_3.csv')

In [5]:
#En el siguiente fragmento de código, pos_1 y pos_2 representan las 
# coordenadas de dos puntos en un plano bidimensional.
#distance.euclidean es una función de la librería scipy 
# (específicamente del módulo scepy.spatial.distance) que calcula la
#  distancia euclideana entre dos puntos.
pos_1=[0,0]
pos_2=[3,4]

distance.euclidean(pos_1,pos_2)

np.float64(5.0)

In [6]:
#En estas líneas de código hacemos dos cosas, la primera es que leemos 
# el archivo "met_df_1.csv", y segundo es que le asignamos los datos 
# a la variable "met_pl".
met_pl=pd.read_csv('met_df_1.csv')
met_pl

Unnamed: 0,pl_BM_3,pl_BM_6,pl_CRW_6
0,3.0,6.0,6.0
1,6.0,12.0,12.0
2,9.0,18.0,18.0
3,12.0,24.0,24.0
4,15.0,30.0,30.0
...,...,...,...
994,2985.0,5970.0,5970.0
995,2988.0,5976.0,5976.0
996,2991.0,5982.0,5982.0
997,2994.0,5988.0,5988.0


In [7]:
# Init a figure
#En esta parte del código encontramos diferentes secciones, la primera: 
# go.Figure() inicializa una figura vacía, add_trace añade un trazo 
# (plot) a la figura fig_met_1. En este caso añade un gráfico de 
# dispersión (Scatter). x=met_pl.index define los valores del eje x. 
# Aquí se está utilizando el índice del DataFrame met_pl.
#y=met_pl.pl_BM_3 define los valores del eje y, que corresponden a la columna pl_BM_3 del DataFrame met_pl.
#marker=dict(size=2) define el tamaño de los marcadores del gráfico.
#line=dict(width=1) define el ancho de la línea que conecta los puntos en el gráfico.
#mode='lines' establece que los puntos se deben conectar con líneas. Esto es útil para mostrar secuencias continuas en los datos.
#name='BM_pl_3' asigna un nombre al trazo, que será mostrado en la leyenda del gráfico.
#showlegend=True indica que este trazo debe aparecer en la leyenda del gráfico.
fig_met_1=go.Figure()

fig_met_1.add_trace(go.Scatter(
    x=met_pl.index,
    y=met_pl.pl_BM_3,
    marker= dict(size=2),
    line= dict(width=1),
    mode='lines',
    name='BM_pl_3',
    showlegend=True))

fig_met_1.add_trace(go.Scatter(
    x=met_pl.index,
    y=met_pl.pl_BM_6,
    marker= dict(size=2),
    line= dict(width=6),
    mode='lines',
    name='BM_pl_6',
    showlegend=True))

fig_met_1.add_trace(go.Scatter(
    x=met_pl.index,
    y=met_pl.pl_CRW_6,
    marker= dict(size=2),
    line= dict(width=1),
    mode='lines',
    name='pl_CRW_6',
    showlegend=True))

fig_met_1.show()

In [8]:
#En esta parte del código cargamos 2 archivos, hay que recordar que deben compartir la misma ubicación para que no tengamos ningún problema.
CRW_2d_df_6_6=pd.read_csv('crw_6_6.csv')
CRW_2d_df_6_6

BM_2d_df_6=pd.read_csv('brownian_6.csv')

In [9]:
# Init a figure
#Como en la figura anterior, usaremos los mismos parámetros para plotear, 
# pero a diferencia de los anteriores, estos archivos que estamos ploteando 
# son característicos de un Correlated Random Walk, es por eso que la 
# gráfica es totalmente distinta.
fig_BM_2d=go.Figure()

fig_BM_2d.add_trace(go.Scatter(
    x=BM_2d_df_6.x_pos,
    y=BM_2d_df_6.y_pos,
    marker= dict(size=2),
    line= dict(width=1),
    mode='lines',
    name='BM_2d_6',
    showlegend=True))

fig_BM_2d.add_trace(go.Scatter(
    x=CRW_2d_df_6_6.x_pos,
    y=CRW_2d_df_6_6.y_pos,
    marker= dict(size=2),
    line= dict(width=1),
    mode='lines',
    name='CRW_2d_6_6',
    showlegend=True))

fig_BM_2d.show()

## Mean Squared Desplacement

In [10]:
#Aquí cargamos el archivo met_df_2.csv a la variable met_msd.
met_msd=pd.read_csv('met_df_2.csv')
met_msd

Unnamed: 0,MSD_BM,MSD_CRW
0,36.000000,3.600000e+01
1,74.422372,1.368477e+02
2,112.979349,2.966932e+02
3,154.127854,5.100141e+02
4,193.378233,7.720513e+02
...,...,...
994,98997.081835,2.512414e+06
995,97496.121246,2.520607e+06
996,96630.627308,2.529127e+06
997,97027.421373,2.539040e+06


In [11]:
#Este fragmento de código calcula la distancia euclidiana entre puntos de un DataFrame BM_2d_df_6.
#La inicialización de la variable n en 200 nos da el intervalo de separación entre los puntos cuyos pares de distancias serán calculadas.
#np.array convierte la lista generada por la comprensión de listas en un arreglo de Numpy. Esto es útil para manejar distancias como una serie numérica, facilitando su procesamiento posterior.
#El ciclo for itera sobre los índices del DataFrame en BM_2d_df_6 desde n hasta el final de los datos.
#BM_2d_df_6.shape[0] indica el número total de filas del DataFrame con un paso de 1.
#BM_2d_df_6.iloc[i-n] Selecciona la fila i-n del DataFrame. Esto nos da la posición del punto n pasos antes del índice i.
#BM_2d_df_6.iloc[i] selecciona la fila i del DataFrame, esto es la posición actual de la iteración.
#distance.euclidean() calcula la distancia euclidiana entre dos puntos en las posiciones i-n e i usando la función euclidean del módulo scipy.
n=200
np.array([distance.euclidean(BM_2d_df_6.iloc[i-n],BM_2d_df_6.iloc[i]) for i in range (n,BM_2d_df_6.shape[0],1) ])

array([149.87910469, 146.37734229, 149.57590324, 152.87636326,
       158.88049847, 153.7773263 , 149.41479509, 149.72664352,
       146.86693919, 140.26768587, 136.111148  , 140.06704648,
       141.07554665, 138.13773028, 149.69794899, 146.46537279,
       136.58443689, 134.50152819, 131.29724817, 133.49662493,
       127.72442062, 127.77599157, 129.08237565, 133.22926661,
       143.41522224, 137.03040974, 141.69582887, 131.1620217 ,
       128.14333406, 121.26846746, 120.25017692, 114.31371298,
       105.26988305, 105.40972131,  97.00882696, 101.22055189,
        96.31377939,  91.84242289,  88.66955264,  82.45298295,
        76.77704696,  85.92044748,  87.93346078,  78.96916386,
        81.85519193,  81.37850384,  80.8409455 ,  76.53473563,
        66.9593525 ,  68.78435656,  69.35465147,  68.07129346,
        56.79953509,  58.85228295,  61.71496529,  59.17716328,
        61.12285808,  63.09529257,  68.4535841 ,  63.11485991,
        62.06947253,  57.58651744,  54.75954195,  47.68

In [12]:
#Es un DataFrame que contiene datos organizados en filas y columnas. En el contexto de caminatas aleatorias o movimientos Brownianos.
#iloc[20:25] utiliza la función iloc para seleccionar filas basadas en sus posiciones numéricas (índices).
#[20:25] indica un rango de filas, comenzando en 20 y terminando en 24 (la fila 25 no incluida).
BM_2d_df_6_short=BM_2d_df_6.iloc[20:25]
BM_2d_df_6_short

Unnamed: 0,x_pos,y_pos
20,23.904767,0.148509
21,23.912158,-5.851486
22,18.845762,-9.065771
23,24.237529,-11.69804
24,29.670012,-9.150859


In [13]:
#Este código genera una gráfica 2D interactica de una trayectoria utilizando Plotly, 
#con datos de un subconjunto del DataFrame BM_2d_df_6_short.
#go.Figure inicializa una nueva figura vacía usando Plotly, una biblioteca de gráficos interactivos en Python.

#add_trace agrega un trazado (trace) a la figura, en este caso, un gráfico de dispersión (go.Scatter).
#x=BM_2d_df_6_short.xpos define la coordenada x usando la columna x_pos del DataFrame BM_2d_df_6_short. Esto representa las posiciones en el eje x de la trayectoria.
#y=BM_2d_df_6_short.ypos define la coordenada y usando la columna y_pos del DataFrame BM_2d_df_6_short. Esto representa las posiciones en el eje y de la trayectoria.

#marker=dict(size=2) configura el tamaño de los marcadores en la gráfica. En este caso, los marcadores son de size=2.
#line define las propiedades de la linea que conecta los puntos. El resto de parámetros de add_trace ya los conocemos.

#Ahora, para update_yaxes, modifica las propiedades del eje y del gráfico.
#scaleanchor='x' enlaza la escala del eje y con la del eje x, asegurando que ambos ejes mantengan la misma proporción, esto garantiza que las distancias visualizadas sean coherentes en ambas direcciones (x y y).
#scaleratio=1 establece la proporción de escala 1:1 entre los ejes x y y, manteniendo la simetría de la trayectoria sin distorción.


fig_2d=go.Figure()

fig_2d.add_trace(go.Scatter(
    x=BM_2d_df_6_short.x_pos,
    y=BM_2d_df_6_short.y_pos,
    marker= dict(size=2),
    line= dict(color='green' ,width=1),
    mode='lines',
    name='BM_2d_6_short',
    showlegend=True))
fig_2d.update_yaxes(

    scaleanchor='x',
    scaleratio=1
)

fig_2d.show()

In [15]:
met_tad = pd.read_csv('met_df_3.csv')
met_tad

Unnamed: 0,TA_CRW_6,TA_CRW_9
0,1.526081,0.131243
1,-1.995115,-0.116685
2,1.248337,0.310765
3,0.478471,-0.086050
4,-0.547363,1.131171
...,...,...
993,-0.615127,-0.199832
994,-0.762372,-0.877469
995,0.024496,0.140115
996,-0.637645,0.044725


In [16]:
MSD_BM_6 = pd.read_csv('brownian_3.csv')
MSD_CRW_6= pd.read_csv('crw_6_6.csv')
MSD_BM_6

Unnamed: 0,x_pos,y_pos
0,2.000000,5.000000
1,0.357011,2.489903
2,-1.432756,0.082262
3,-3.225488,2.487696
4,-2.443008,5.383853
...,...,...
995,-17.055597,-99.414167
996,-15.953410,-102.204361
997,-18.893715,-101.608872
998,-17.933843,-98.766576


In [17]:
def mean_squared_displacement(df, x_col='x_pos', y_col='y_pos'):
    """
    Calcula el Desplazamiento Cuadrático Medio (MSD) para una trayectoria de datos en un DataFrame.

    Parámetros:
    df -- DataFrame que contiene las coordenadas de la trayectoria.
    x_col -- Nombre de la columna que contiene las coordenadas en el eje x (por defecto 'x_pos').
    y_col -- Nombre de la columna que contiene las coordenadas en el eje y (por defecto 'y_pos').

    Retorna:
    msd -- Un DataFrame con el Desplazamiento Cuadrático Medio para diferentes tiempos de retraso.
    """
    
    # Verificar si las columnas especificadas para las coordenadas x e y existen en el DataFrame
    if x_col not in df.columns or y_col not in df.columns:
        raise ValueError("Las columnas especificadas no existen en el DataFrame")
    
    # Obtener el número total de puntos en la trayectoria
    N = len(df)
    
    # Crear una lista para almacenar los resultados del Desplazamiento Cuadrático Medio (MSD)
    msd = []
    
    # Calcular el MSD para diferentes intervalos de tiempo (retrasos) entre los puntos
    for delta in range(1, N//2):
        # Inicializar variables para sumar los desplazamientos cuadrados y contar el número de pares de puntos
        sq_displacement_sum = 0
        count = 0
        
        # Iterar sobre los puntos en la trayectoria para calcular el desplazamiento cuadrático
        for i in range(N - delta):
            # Calcular la diferencia en las coordenadas x e y entre dos puntos separados por un intervalo 'delta'
            x_diff = df[x_col].iloc[i + delta] - df[x_col].iloc[i]
            y_diff = df[y_col].iloc[i + delta] - df[y_col].iloc[i]
            
            # Sumar el cuadrado de las diferencias en x e y a la suma total
            sq_displacement_sum += x_diff**2 + y_diff**2
            count += 1
        
        # Calcular el promedio del desplazamiento cuadrático para este intervalo 'delta'
        msd.append(sq_displacement_sum / count)
    
    # Crear un DataFrame con los resultados del MSD, donde 'delta' es el intervalo de tiempo y 'MSD' es el valor calculado
    return pd.DataFrame({'delta': range(1, N//2), 'MSD': msd})

In [18]:
def mean_squared_displacement(df, x_col='x_pos', y_col='y_pos'):
    """
    Calcula el Desplazamiento Cuadrático Medio (MSD) para una trayectoria de datos en un DataFrame.

    Parámetros:
    df -- DataFrame que contiene las coordenadas de la trayectoria.
    x_col -- Nombre de la columna que contiene las coordenadas en el eje x (por defecto 'x_pos').
    y_col -- Nombre de la columna que contiene las coordenadas en el eje y (por defecto 'y_pos').

    Retorna:
    msd -- Un DataFrame con el Desplazamiento Cuadrático Medio para diferentes tiempos de retraso.
    """
    
    # Verificar si las columnas especificadas para las coordenadas x e y existen en el DataFrame
    if x_col not in df.columns or y_col not in df.columns:
        raise ValueError("Las columnas especificadas no existen en el DataFrame")
    
    # Obtener el número total de puntos en la trayectoria
    N = len(df)
    
    # Crear una lista para almacenar los resultados del Desplazamiento Cuadrático Medio (MSD)
    msd = []
    
    # Calcular el MSD para diferentes intervalos de tiempo (retrasos) entre los puntos
    for delta in range(1, N//2):
        # Inicializar variables para sumar los desplazamientos cuadrados y contar el número de pares de puntos
        sq_displacement_sum = 0
        count = 0
        
        # Iterar sobre los puntos en la trayectoria para calcular el desplazamiento cuadrático
        for i in range(N - delta):
            # Calcular la diferencia en las coordenadas x e y entre dos puntos separados por un intervalo 'delta'
            x_diff = df[x_col].iloc[i + delta] - df[x_col].iloc[i]
            y_diff = df[y_col].iloc[i + delta] - df[y_col].iloc[i]
            
            # Sumar el cuadrado de las diferencias en x e y a la suma total
            sq_displacement_sum += x_diff**2 + y_diff**2
            count += 1
        
        # Calcular el promedio del desplazamiento cuadrático para este intervalo 'delta'
        msd.append(sq_displacement_sum / count)
    
    # Crear un DataFrame con los resultados del MSD, donde 'delta' es el intervalo de tiempo y 'MSD' es el valor calculado
    return pd.DataFrame({'delta': range(1, N//2), 'MSD': msd})


In [20]:
# Cargar los datos de los archivos CSV en DataFrames
# Estos archivos deben estar en el mismo directorio que el script o proporcionar la ruta correcta.
BM_df = pd.read_csv('brownian_6.csv')  # Datos para el Movimiento Browniano (Brownian Motion)
CRW_df = pd.read_csv('crw_6_6.csv')    # Datos para el Movimiento Aleatorio Correlacionado (Correlated Random Walk)

# Calcular el Desplazamiento Cuadrático Medio (MSD) para cada conjunto de datos usando la función definida anteriormente
# La función 'mean_squared_displacement' debe estar definida previamente en el código
msd_BM = mean_squared_displacement(BM_df)  # MSD para los datos de Brownian Motion
msd_CRW = mean_squared_displacement(CRW_df) # MSD para los datos de Correlated Random Walk

# Crear una nueva figura para el gráfico
# Plotly se utiliza aquí para crear gráficos interactivos
fig_msd = go.Figure()

# Añadir la curva de MSD para el Movimiento Browniano a la figura
fig_msd.add_trace(go.Scatter(
    x=msd_BM['delta'],  # Intervalos de tiempo (delta) en el eje x
    y=msd_BM['MSD'],    # Desplazamiento Cuadrático Medio en el eje y
    mode='lines',       # Mostrar la curva como una línea
    name='BM MSD',     # Nombre de la serie de datos en la leyenda
    line=dict(width=2)  # Ancho de la línea del gráfico
))

# Añadir la curva de MSD para el Movimiento Aleatorio Correlacionado a la figura
fig_msd.add_trace(go.Scatter(
    x=msd_CRW['delta'],  # Intervalos de tiempo (delta) en el eje x
    y=msd_CRW['MSD'],    # Desplazamiento Cuadrático Medio en el eje y
    mode='lines',       # Mostrar la curva como una línea
    name='MSD CRW',     # Nombre de la serie de datos en la leyenda
    line=dict(width=2)  # Ancho de la línea del gráfico
))

# Configurar el diseño de la figura (layout)
fig_msd.update_layout(
    title='Mean Squared Displacement (MSD) Comparison',  # Título del gráfico
    xaxis_title='Lag Time (Delta)',  # Etiqueta para el eje x
    yaxis_title='BM MSD',  # Etiqueta para el eje y
    legend_title='Trajectories'  # Título para la leyenda
)

# Mostrar la figura
fig_msd.show()  # Renderiza el gráfico en una ventana interactiva


In [29]:
import pandas as pd
import numpy as np
import plotly.graph_objects as go
from scipy.stats import cauchy

def turning_angles(df, x_col='x_pos', y_col='y_pos'):
    if x_col not in df.columns or y_col not in df.columns:
        raise ValueError("Las columnas especificadas no existen en el DataFrame")
    
    angles = []
    N = len(df)
    
    for i in range(1, N-1):
        A = np.array([df[x_col].iloc[i-1], df[y_col].iloc[i-1]])
        B = np.array([df[x_col].iloc[i], df[y_col].iloc[i]])
        C = np.array([df[x_col].iloc[i+1], df[y_col].iloc[i+1]])
        
        AB = B - A
        BC = C - B
        
        angle = np.arctan2(np.linalg.det([AB, BC]), np.dot(AB, BC))
        angle_degrees = np.degrees(angle)
        angles.append(angle_degrees)
    
    return angles

def plot_turning_angle_distribution(angles, distribution, distribution_params, title):
    fig = go.Figure()
    
    fig.add_trace(go.Histogram(x=angles, histnorm='probability density', name='Distribución Observada', opacity=0.75))
    
    x = np.linspace(-180, 180, 1000)
    y = distribution.pdf(x, *distribution_params)
    
    fig.add_trace(go.Scatter(x=x, y=y, mode='lines', name='Distribución Teórica', line=dict(color='red')))
    
    fig.update_layout(title=title, xaxis_title='Ángulo de Giro (grados)', yaxis_title='Densidad', legend_title='Distribuciones')
    fig.show()

# Cargar datos para dos trayectorias diferentes
df1 = pd.read_csv('brownian_3.csv')
df2 = pd.read_csv('crw_6_9.csv')

# Calcular ángulos de giro para cada trayectoria
angles_1 = turning_angles(df1)
angles_2 = turning_angles(df2)

# Parámetros para la distribución teórica de Cauchy
params_1 = (0, 3)
params_2 = (0, 7)

# Crear y mostrar gráficos comparativos
plot_turning_angle_distribution(angles_1, cauchy, params_1, 'Distribución de Ángulos de Giro para Trayectoria 1 vs Distribución Teórica Cauchy')
plot_turning_angle_distribution(angles_2, cauchy, params_2, 'Distribución de Ángulos de Giro para Trayectoria 2 vs Distribución Teórica Cauchy')

