# Análisis de los datos

Mediante este notebook, obtenemos el clasificador mediante Random Forest.
Código muy inspirado en: [Eloquentarduino](https://eloquentarduino.github.io/2019/12/how-to-do-gesture-identification-on-arduino/)

En este Notebook, se muestran los datos utilizados para la obtención del clasificador, está estructurado de la siguiente forma:

1. En primer lugar, se justifica la elección del **tamaño de ventana elegido**, usando para ello los datos de aceleración para todos los movimientos que se pretenden analizar.

2. A continuación, se muestra la otra métrica elegida (a parte de las aceleraciones), y se trata de justificar su elección.

3. Se presentan otras métricas que en un principio se consideraron pero que finalmente se rechazaron.

4. Proceso de aumento de la cantidad de datos a partir de la interpolación entre ventanas.

5. Se obtiene el clasificador elegido (*Random Forest*) y se evalúa su precisión con datos de test. Tmabién se obtiene el archivo .h que debe ser introducido en la IDE de Arduino.

6. Finalmente, vistos los resultados obtenidos con el clasificador de Bosques Aleatorios, se propone un nuevo algoritmo basado en umbrales.

# 1) El por qué del tamaño de ventana elegido

En primer lugar, importamos las librerías necesarias:

In [2]:
# Importamos las librerías necesarias:
import pandas as pd
import numpy as np
%matplotlib notebook
#%matplotlib inline
import matplotlib.pyplot as plt
from ipywidgets import interactive

Cargamos los datos de **entrenamiento**:

In [3]:
# Cargamos los datos
df_andar = pd.read_csv('datosPreEntrenamiento/andar.csv', sep=';')
df_epil1 = pd.read_csv('datosPreEntrenamiento/epil1.csv', sep=';')
df_epil2 = pd.read_csv('datosPreEntrenamiento/epil2.csv', sep=';')
df_sent1 = pd.read_csv('datosPreEntrenamiento/sentado1.csv', sep=';')
df_sent2 = pd.read_csv('datosPreEntrenamiento/sentado2.csv', sep=';')

Visualizamos los datos que vamos a usar para ver qué formato tienen y por si acaso detectamos algún error:

In [3]:
# Vemos por si acaso el formato de los datos, así como los nombres de las columnas:
display(df_andar.head())
print('Nombres de las Columnas:')
df_andar.columns

Unnamed: 0,ax1,ay1,az1,ax2,ay2,az2,ax3,ay3,az3,ax4,...,az78,ax79,ay79,az79,ax80,ay80,az80,varx,vary,varz
0,-0.79,0.23,-0.05,-0.78,0.2,-0.02,-0.79,0.01,-0.01,-0.66,...,0.06,-0.84,-0.05,0.02,-0.83,0.05,0.08,0.04,0.04,0.02
1,-0.85,0.04,0.21,-0.88,0.02,0.17,-0.88,0.02,0.07,-0.85,...,-0.43,-0.69,-0.12,-0.33,-0.79,0.12,0.09,0.02,0.02,0.03
2,-0.85,0.06,0.11,-0.85,0.02,0.13,-0.99,0.2,0.06,-1.13,...,-0.08,-0.72,0.01,-0.03,-0.91,-0.24,-0.15,0.02,0.03,0.04
3,-0.77,-0.02,0.01,-0.85,0.0,-0.15,-0.92,0.17,-0.2,-0.91,...,0.21,-0.86,-0.01,0.09,-0.85,0.03,0.03,0.02,0.03,0.05
4,-0.93,0.12,0.04,-0.71,0.31,0.15,-1.0,-0.14,0.15,-0.86,...,0.0,-1.04,-0.06,0.01,-1.11,0.21,-0.01,0.04,0.03,0.03


Nombres de las Columnas:


Index(['ax1', 'ay1', 'az1', 'ax2', 'ay2', 'az2', 'ax3', 'ay3', 'az3', 'ax4',
       ...
       'az78', 'ax79', 'ay79', 'az79', 'ax80', 'ay80', 'az80', 'varx', 'vary',
       'varz'],
      dtype='object', length=243)

## Gráficas de las aceleraciones para cada movimiento:

In [5]:
# En caso de problemas de memoria, ejecutar celda para borrar la figura actual:
plt.clf()

**ANDAR**:

In [4]:
plt.rcParams['figure.figsize'] = [9,9]

fig, axs = plt.subplots(3,1)
df_andar.iloc[0, 0:240:3].plot(ax=axs[0])
axs[0].set_title('ax')
df_andar.iloc[0, 1:240:3].plot(ax=axs[1])
axs[1].set_title('ay')
df_andar.iloc[0, 2:240:3].plot(ax=axs[2])
axs[2].set_title('az')
#plt.show()

#row = df_andar.iloc[0, 0:240:3]
#row.plot()
#plt.show()

<IPython.core.display.Javascript object>

Text(0.5, 1.0, 'az')

Ahora, creamos una función que nos permita seleccionar el número de ventana que queramos:

In [5]:
plt.rcParams['figure.figsize'] = [9, 9]

def f_andar(w):    
    #Plots:
    fig, axs = plt.subplots(3,1)
    df_andar.iloc[w, 0:240:3].plot(ax=axs[0])
    axs[0].set_title('ax')
    df_andar.iloc[w, 1:240:3].plot(ax=axs[1])
    axs[1].set_title('ay')
    df_andar.iloc[w, 2:240:3].plot(ax=axs[2])
    axs[2].set_title('az')
    plt.show()

In [6]:
# Creamos el plot interactivo a partir de la función anterior:
interactive_plot = interactive(f_andar, w=list(range(0,80,5)))
interactive_plot

interactive(children=(Dropdown(description='w', options=(0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65,…

Como vemos, dentro de la ventana elegida (4 segundos), se aprecia la presencia de patrones. Tiene sentido puesto que cada paso al andar dura $\approx$ 1.5 segundos $\Rightarrow$ De manera aproximada se debería ver un patrón que se repitiese 2-3 veces en la ventana. Esto se observa en muchas de las ventanas elegidas.

**NOTA**: No en todas las ventanas elegidas se aprecia la repetición (de 2-3 veces) de un patrón. Esto lo podemos justificar debido a la forma de andar de mi abuelo: arrastrar el pie y frenarlo en seco $\to$ ese freno en seco, es lo que provoca un pico de acelración (los cuales se observan en muchas de las ventanas), pero que puede ser saltado si no coincide con la frecuencia de muestreo (20 Hz). Sin embargo, no se consideró aumentar dicha frecuencia debido a:
* Detectar ese movimiento brusco, requerería frecuencias de muestreo muy elevadas $\Rightarrow$ Podríamos quedarnos sin tiempo para ejecutar otras tareas (como el envío de datos).
* Motivos de ahorro de energía (mayor frecuencia de muestreo $\Rightarrow$ mayor consumo por parte del ESP32).
* Se consideró que se tienen los suficientes datos con patrones para inferir el movimiento.

**EPILEPSIA DE TIPO 1**:

Primero, creamos la misma función anterior (gráficas interactivas) particularizándola a este tipo de movimiento:

In [7]:
plt.rcParams['figure.figsize'] = [9, 9]

def f_epil1(w):    
    #Plots:
    fig, axs = plt.subplots(3,1)
    df_epil1.iloc[w, 0:240:3].plot(ax=axs[0])
    axs[0].set_title('ax')
    df_epil1.iloc[w, 1:240:3].plot(ax=axs[1])
    axs[1].set_title('ay')
    df_epil1.iloc[w, 2:240:3].plot(ax=axs[2])
    axs[2].set_title('az')
    plt.show()

In [8]:
# Creamos el plot interactivo a partir de la función anterior:
interactive_plot = interactive(f_epil1, w=list(range(0,170,5)))
interactive_plot

interactive(children=(Dropdown(description='w', options=(0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65,…

**EPILEPSIA DE TIPO 2**:

In [9]:
plt.rcParams['figure.figsize'] = [9, 9]

def f_epil2(w):    
    #Plots:
    fig, axs = plt.subplots(3,1)
    df_epil2.iloc[w, 0:240:3].plot(ax=axs[0])
    axs[0].set_title('ax')
    df_epil2.iloc[w, 1:240:3].plot(ax=axs[1])
    axs[1].set_title('ay')
    df_epil2.iloc[w, 2:240:3].plot(ax=axs[2])
    axs[2].set_title('az')
    plt.show()

In [10]:
# Creamos el plot interactivo a partir de la función anterior:
interactive_plot = interactive(f_epil2, w=list(range(0,80,1)))
interactive_plot

interactive(children=(Dropdown(description='w', options=(0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15,…

Se aprecia claramente la presencia de patrones para todos los ejes de la aceleración, consistentes en **3 repeticiones de aceleración - deceleración**

**FORMA DE ESTAR SENTADO TIPO 1**:

In [11]:
plt.rcParams['figure.figsize'] = [9, 9]

def f_sent1(w):    
    #Plots:
    fig, axs = plt.subplots(3,1)
    df_sent1.iloc[w, 0:240:3].plot(ax=axs[0])
    axs[0].set_title('ax')
    df_sent1.iloc[w, 1:240:3].plot(ax=axs[1])
    axs[1].set_title('ay')
    df_sent1.iloc[w, 2:240:3].plot(ax=axs[2])
    axs[2].set_title('az')
    plt.show()

In [12]:
# Creamos el plot interactivo a partir de la función anterior:
interactive_plot = interactive(f_sent1, w=list(range(0,80,5)))
interactive_plot

interactive(children=(Dropdown(description='w', options=(0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65,…

Al igual que sucede con la siguiente situación, **la motivación de estas gráficas es únicamente conocer los valores entre los que se encuentra la aceleración, al ser un movimiento prácticamente constante** (no hay que confundir la forma de las líneas con patrones, ya que el rango del eje y es de centésimas de unidades) 

**FORMA DE ESTAR SENTADO TIPO 2**:

In [13]:
plt.rcParams['figure.figsize'] = [9, 9]

def f_sent2(w):    
    #Plots:
    fig, axs = plt.subplots(3,1)
    df_sent2.iloc[w, 0:240:3].plot(ax=axs[0])
    axs[0].set_title('ax')
    df_sent2.iloc[w, 1:240:3].plot(ax=axs[1])
    axs[1].set_title('ay')
    df_sent2.iloc[w, 2:240:3].plot(ax=axs[2])
    axs[2].set_title('az')
    plt.show()

In [14]:
# Creamos el plot interactivo a partir de la función anterior:
interactive_plot = interactive(f_sent2, w=list(range(0,80,5)))
interactive_plot

interactive(children=(Dropdown(description='w', options=(0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65,…

Es por todos los motivos comentados previamente, que **se consideró como válido el muestreo usando una ventana de 4 segundos, con una frecuencia de muestreo de 20 Hz (por cada ventana se capturan 80 datos) y un solape de 50% entre ventanas**. 

---

## 2) La otra métrica elegida

**"INTEGRAL" de cada eje de aceleración en cada ventana**, a modo de estimación de la energía que conlleva la señal 

**En realidad no es la integral, sino que es la suma de todos los valores en la ventana**

In [15]:
plt.rcParams['figure.figsize'] = [4, 4]

#Andar
plt.figure()
df_andar.iloc[:, 0:240:3].sum(axis=1).plot(title='ANDAR', label='integral ax', legend=True)
df_andar.iloc[:, 1:240:3].sum(axis=1).plot(label='integral ay', legend=True)
df_andar.iloc[:, 2:240:3].sum(axis=1).plot(label='integral az', legend=True)

#Epilepsia 1:
plt.figure()
df_epil1.iloc[:, 0:240:3].sum(axis=1).plot(title='EPIL 1', label='integral ax', legend=True)
df_epil1.iloc[:, 1:240:3].sum(axis=1).plot(label='integral ay', legend=True)
df_epil1.iloc[:, 2:240:3].sum(axis=1).plot(label='integral az', legend=True)

#Epilepsia 2:
plt.figure()
df_epil2.iloc[:, 0:240:3].sum(axis=1).plot(title='EPIL 2', label='integral ax', legend=True)
df_epil2.iloc[:, 1:240:3].sum(axis=1).plot(label='integral ay', legend=True)
df_epil2.iloc[:, 2:240:3].sum(axis=1).plot(label='integral az', legend=True)

#Sentado 1:
plt.figure()
df_sent1.iloc[:, 0:240:3].sum(axis=1).plot(title='SENT 1', label='integral ax', legend=True)
df_sent1.iloc[:, 1:240:3].sum(axis=1).plot(label='integral ay', legend=True)
df_sent1.iloc[:, 2:240:3].sum(axis=1).plot(label='integral az', legend=True)

#Sentado 2:
plt.figure()
df_sent2.iloc[:, 0:240:3].sum(axis=1).plot(title='SENT 2', label='integral ax', legend=True)
df_sent2.iloc[:, 1:240:3].sum(axis=1).plot(label='integral ay', legend=True)
df_sent2.iloc[:, 2:240:3].sum(axis=1).plot(label='integral az', legend=True)

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<AxesSubplot:title={'center':'SENT 2'}>

Como vemos, la suma de valores de las aceleraciones en cada eje, son **prácticamente constantes** en diferentes ventanas $\Rightarrow$ Pueden ser de gran utilidad para distinguir entre movimientos diferentes.

---


## 3) Métricas rechazadas

En esta parte, se presentan algunas de las otras métricas que también se planteó su utilización, pero que al final se rechazó. Las justificaciones de esto se presentan para cada una a continuación.

### **DERIVADA** de la aceleración en cada eje:

Hay que destacar que *no se planteó como una derivada como tal*, sino que **se planteó como una diferencia entre dos valores de aceleración para cada eje**. De esta forma:
$$ \text{derivada }\approx ai_k - ai_{k-1}$$
Donde $i$ es el eje ($x,y$ o $z$) y $k$ representa el index del buffer.

Se planteó así para ahorrar así llevar a cabo la división. Se pensó que esto podía ser útil debido a que la distancia temporal entre un index $k$ y un index $k-1$, salvo errores, permanece constante (periodo de muestreo) $\to$ Supondría únicamente un reescalado de los valores.

Con estas consideraciones, se obtuvieron las siguientes gráficas:

**ANDAR**:

In [16]:
plt.rcParams['figure.figsize'] = [9, 9]

def f_deriv_andar(w):    
    #Plots:
    fig, axs = plt.subplots(3,1)
    df_andar.iloc[w, 0:240:3].diff().plot(ax=axs[0])
    axs[0].set_title('dax')
    df_andar.iloc[w, 1:240:3].diff().plot(ax=axs[1])
    axs[1].set_title('day')
    df_andar.iloc[w, 2:240:3].diff().plot(ax=axs[2])
    axs[2].set_title('daz')
    plt.show()

In [17]:
# Creamos el plot interactivo a partir de la función anterior:
interactive_plot = interactive(f_deriv_andar, w=list(range(0,80,5)))
interactive_plot

interactive(children=(Dropdown(description='w', options=(0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65,…

**EPIL 2**:

In [18]:
plt.rcParams['figure.figsize'] = [9, 9]

def f_deriv_epil2(w):    
    #Plots:
    fig, axs = plt.subplots(3,1)
    df_epil2.iloc[w, 0:240:3].diff().plot(ax=axs[0])
    axs[0].set_title('dax')
    df_epil2.iloc[w, 1:240:3].diff().plot(ax=axs[1])
    axs[1].set_title('day')
    df_epil2.iloc[w, 2:240:3].diff().plot(ax=axs[2])
    axs[2].set_title('daz')
    plt.show()

In [19]:
# Creamos el plot interactivo a partir de la función anterior:
interactive_plot = interactive(f_deriv_epil2, w=list(range(0,150,5)))
interactive_plot

interactive(children=(Dropdown(description='w', options=(0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65,…

Los motivos por los que se decidió no hacer uso de esta métrica (**derivada**) fueron los siguientes:
* Hay movimientos para los que no se aprecia un patrón tan claro como con las métricas anteriores. Aunque éste puede ser encontrado por el algoritmo de ML, debido también al siguiente punto se decidió no considerarlo.
* Supondría un incremento de la dimensionalidad de la ventana significativo, ya que pasaríamos a añadir 240 dimensiones más por ventana $\Rightarrow$ la duplicaríamos. Esto supondría un mayor consumo de memoria y mayor probabilidad de no rendir bien con nuestro algoritmo de ML (por el problema conocido como [*curse of dimensionality*](https://en.wikipedia.org/wiki/Curse_of_dimensionality))

### **VARIANZA** de la aceleración en cada eje:

Esta métrica se pensó en usarla ya que a primera vista pareció de utilidad. Por ello se implementó en Arduino de la siguiente forma:
$$\text{Var}(ai)= \frac{1}{n}\left(\sum (ai)^2\right) - \frac{1}{n^2}\left(\sum ai\right)^2 $$
Donde $i$ representa el eje de aceleración ($x,y$ o $z$), y $n$ el tamaño de los buffer. Una demostración de por qué esta fórmula es equivalente a la definición de la Varianza, se puede encontrar en [saddleback.edu](https://www.saddleback.edu/faculty/pquigley/math10/shortcut.pdf).

De esta forma, el cómputo se simplificaba al no necesitar el cálculo de la media del buffer para las aceleraciones de un determinado eje $\Rightarrow$ Se podía calcular a la vez que se llenaban los buffer.

A continuación se presentan algunas de las gráficas de esta métrica:

In [20]:
plt.rcParams['figure.figsize'] = [4, 4]

#Andar
plt.figure()
df_andar.iloc[:, 240].plot(title='ANDAR', label='Var(ax)', legend=True)
df_andar.iloc[:, 241].plot(label='Var(ay)', legend=True)
df_andar.iloc[:, 242].plot(label='Var(az)', legend=True)

#Epilepsia 1:
plt.figure()
df_epil1.iloc[:, 240].plot(title='EPIL1', label='Var(ax)', legend=True)
df_epil1.iloc[:, 241].plot(label='Var(ay)', legend=True)
df_epil1.iloc[:, 242].plot(label='Var(az)', legend=True)

#Epilepsia 2:
plt.figure()
df_epil2.iloc[:, 240].plot(title='EPIL2', label='Var(ax)', legend=True)
df_epil2.iloc[:, 241].plot(label='Var(ay)', legend=True)
df_epil2.iloc[:, 242].plot(label='Var(az)', legend=True)

#Sentado 1:
plt.figure()
df_sent1.iloc[:, 240].plot(title='SENT1', label='Var(ax)', legend=True)
df_sent1.iloc[:, 241].plot(label='Var(ay)', legend=True)
df_sent1.iloc[:, 242].plot(label='Var(az)', legend=True)

#Sentado 2:
plt.figure()
df_sent2.iloc[:, 240].plot(title='SENT2', label='Var(ax)', legend=True)
df_sent2.iloc[:, 241].plot(label='Var(ay)', legend=True)
df_sent2.iloc[:, 242].plot(label='Var(az)', legend=True)

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<AxesSubplot:title={'center':'SENT2'}>

Los motivos finales por los que esta métrica no se eligió, fueron poque no se observaron patrones claros que ayudasen a distinguir los movimientos (sobre todo en el movimiento ANDAR), en comparación con otras métricas como las aceleraciones o la integral en la ventana. 

Quizás el patrón más claro, es para los movimientos SENT1 y SENT2, al ser valores nulos. Sin embargo, esto es algo que se puede obtener de manera más directa comparando un valor con el anterior y viendo si su diferencia $< \varepsilon$, sin necesidad así de calcular la varianza.

## 4) Aumento de la cantidad de datos (*data augmentation*)

En esta parte se presenta el procedimiento usado para aumentar la cantidad de datos disponible y así poder reducir el posible *overfitting* del algoritmo de machine learning (Random Forest).

El procedimiento para aumentar estos datos ha sido simplemente el mover la ventana deslizante una muestra a la derecha y para todas las muestras. De esta forma, por ejemplo *en cuanto al movimiento de andar*, **se consigue pasar de 251 datos a más de 8.900 datos!**

A continuación, en la siguiente figura se muestra esta idea de manera gráfica:
<br /><br />

![image info](dataAugmentation.png)
*Fuente: elaboración propia*<br />
*Nota*: En Github parece no renderizarse bien. Si es así, para ver la imagen ir a la carpeta: *RSENSE20_TIRADO_TRABAJO/Graficas/* y abrir el archivo llamado: *dataAugmentation.png*.

**PERO OJO**, hay que tener en cuenta la longitud temporal del buffer: 20 segundos. Ya que solo podemos "unir" los datos según la figura de arriba, si éstos son datos que se han tomado de manera continua! (es decir durante 20 segundos, que era lo que duraba la toma de datos).

En primer lugar, para no tener datos repetidos al hacer el aumento de datos $\Rightarrow$ "**eliminamos**" filas alternas, ya que los datos hasta ahora tienen un solape del 50% $\to$ con el método descrito arriba estaríamos duplicando la mitad de los datos. Además eliminamos las columnas de varianza, que tal y como hemos visto antes, hemos decidido no quedarnos con ellas.

Para deshacernos de las filas con el solape del 50%, primero nos creamos los indices que queremos guardar mediante:

```[j for i in range(0, df.shape[0], 9) for j in range(i, i+9,2) if j<(df.shape[0])]```

Esto es así, ya que nos queremos guardar la 1a, 3a, 5a, ... , 9a ventanas de **todos** los datos tomados en cada prueba (1 prueba = 9 ventanas = 4 segundos cada una, con solape del 50%)

In [21]:
#Nos quedamos con filas sin solapr para evitar así los futuros duplicados:

df_andar2 = df_andar.iloc[[j for i in range(0, df_andar.shape[0], 9) for j in range(i, i+9,2) if j<(df_andar.shape[0])]]
df_andar2

df_epil12 = df_epil1.iloc[[j for i in range(0, df_epil1.shape[0], 9) for j in range(i, i+9,2) if j<(df_epil1.shape[0])]]

df_epil22 = df_epil2.iloc[[j for i in range(0, df_epil2.shape[0], 9) for j in range(i, i+9,2) if j<(df_epil2.shape[0])]]

df_sent12 = df_sent1.iloc[[j for i in range(0, df_sent1.shape[0], 9) for j in range(i, i+9,2) if j<(df_sent1.shape[0])]]

df_sent22 = df_sent2.iloc[[j for i in range(0, df_sent2.shape[0], 9) for j in range(i, i+9,2) if j<(df_sent2.shape[0])]]

In [22]:
# A continuación quitamos las columnas de las varianzas:

df_andar2.drop(['varx', 'vary','varz'], axis=1, inplace=True)

df_epil12.drop(['varx', 'vary','varz'], axis=1, inplace=True)

df_epil22.drop(['varx', 'vary','varz'], axis=1, inplace=True)

df_sent12.drop(['varx', 'vary','varz'], axis=1, inplace=True)

df_sent22.drop(['varx', 'vary','varz'], axis=1, inplace=True)

A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  errors=errors,


La función que se presenta a continuación (obtenida preguntando en [StackOverflow](https://stackoverflow.com/questions/65687738/how-to-combine-successive-rows-with-an-increasing-overlap-between-them-just-lik)), consigue obtener las ventanas intermedias (ver figura de arriba).

**OJO** también se obtienen ventanas intermedias entre 2 pruebas diferentes $\Rightarrow$ Las tenemos que eliminar ya que esas ventanas no tienen sentido (se eliminan a continuación):

In [23]:
def fun(dataframe,n):
    l = dataframe.stack().tolist()
    h = np.arange(0,len(l),3).tolist()
    return (pd.DataFrame([l[e:e+n] for e in h],
        columns=dataframe.columns).dropna().astype(dataframe.dtypes))

In [24]:
#Obtenemos las nuevas ventanas
df_andar2v = fun(df_andar2,df_andar2.shape[1])

df_epil12v = fun(df_epil12,df_epil12.shape[1])

df_epil22v = fun(df_epil22,df_epil22.shape[1])

df_sent12v = fun(df_sent12,df_sent12.shape[1])

df_sent22v = fun(df_sent22,df_sent22.shape[1])

A continuación creamos los índices que necesitamos quedarnos (todos excepto los comentados previamente que tenemos que eliminar).

In [25]:
# Como usamos 5 ventanas de 4 segundos (10 si consideramos solape) por cada prueba (20 seg/prueba)
n=79     #Numero de datos que tenemos que borrar entre 2 bloques de datos buenos
m=80*4+1 #Numero de datos que nos tenemos que guardar por bloque de datos buenos

df_andar2v2 = df_andar2v.iloc[[j for i in range(0,df_andar2v.shape[0], n+m) for j in range(i, m+i) if j<df_andar2v.shape[0]]]

df_epil12v2 = df_epil12v.iloc[[j for i in range(0,df_epil12v.shape[0], n+m) for j in range(i, m+i) if j<df_epil12v.shape[0]]]

df_epil22v2 = df_epil22v.iloc[[j for i in range(0,df_epil22v.shape[0], n+m) for j in range(i, m+i) if j<df_epil22v.shape[0]]]

df_sent12v2 = df_sent12v.iloc[[j for i in range(0,df_sent12v.shape[0], n+m) for j in range(i, m+i) if j<df_sent12v.shape[0]]]

df_sent22v2 = df_sent22v.iloc[[j for i in range(0,df_sent22v.shape[0], n+m) for j in range(i, m+i) if j<df_sent22v.shape[0]]]

Por último, se añaden las columnas correspondientes a la otra métrica elegida: <br />
***INTEGRAL*** de las aceleraciones en la ventana para cada eje de aceleración:

In [26]:
#Andar
df_andar2v2.loc[:,'sumax'] = df_andar2v2.iloc[:, 0:240:3].sum(axis=1)
df_andar2v2.loc[:,'sumay'] = df_andar2v2.iloc[:, 1:240:3].sum(axis=1)
df_andar2v2.loc[:,'sumaz'] = df_andar2v2.iloc[:, 2:240:3].sum(axis=1)

#Epil1
df_epil12v2.loc[:,'sumax'] = df_epil12v2.iloc[:, 0:240:3].sum(axis=1)
df_epil12v2.loc[:,'sumay'] = df_epil12v2.iloc[:, 1:240:3].sum(axis=1)
df_epil12v2.loc[:,'sumaz'] = df_epil12v2.iloc[:, 2:240:3].sum(axis=1)

#Epil2
df_epil22v2.loc[:,'sumax'] = df_epil22v2.iloc[:, 0:240:3].sum(axis=1)
df_epil22v2.loc[:,'sumay'] = df_epil22v2.iloc[:, 1:240:3].sum(axis=1)
df_epil22v2.loc[:,'sumaz'] = df_epil22v2.iloc[:, 2:240:3].sum(axis=1)

#Sent1
df_sent12v2.loc[:,'sumax'] = df_sent12v2.iloc[:, 0:240:3].sum(axis=1)
df_sent12v2.loc[:,'sumay'] = df_sent12v2.iloc[:, 1:240:3].sum(axis=1)
df_sent12v2.loc[:,'sumaz'] = df_sent12v2.iloc[:, 2:240:3].sum(axis=1)

#Sent2
df_sent22v2.loc[:,'sumax'] = df_sent22v2.iloc[:, 0:240:3].sum(axis=1)
df_sent22v2.loc[:,'sumay'] = df_sent22v2.iloc[:, 1:240:3].sum(axis=1)
df_sent22v2.loc[:,'sumaz'] = df_sent22v2.iloc[:, 2:240:3].sum(axis=1)

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  self.obj[key] = _infer_fill_value(value)
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  self.obj[item_labels[indexer[info_axis]]] = value


A continuación, se obtienen parte de las gráficas anteriores para comprobar que todo el proceso ha ido bien. A diferencia de antes, ahora podemos elegir entre más de 8000 ventanas distintas gracias al aumento de datos.

**ANDAR**

In [27]:
plt.rcParams['figure.figsize'] = [9, 9]

def f_andar2(w):    
    #Plots:
    fig, axs = plt.subplots(3,1)
    df_andar2v2.iloc[w, 0:240:3].plot(ax=axs[0])
    axs[0].set_title('ax')
    df_andar2v2.iloc[w, 1:240:3].plot(ax=axs[1])
    axs[1].set_title('ay')
    df_andar2v2.iloc[w, 2:240:3].plot(ax=axs[2])
    axs[2].set_title('az')
    plt.show()

In [28]:
# Creamos el plot interactivo a partir de la función anterior:
interactive_plot = interactive(f_andar2, w=list(range(0,9000,5)))
interactive_plot

interactive(children=(Dropdown(description='w', options=(0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65,…

**EPIL 1**

In [29]:
plt.rcParams['figure.figsize'] = [9, 9]

def f_epil1_2(w):    
    #Plots:
    fig, axs = plt.subplots(3,1)
    df_epil12v2.iloc[w, 0:240:3].plot(ax=axs[0])
    axs[0].set_title('ax')
    df_epil12v2.iloc[w, 1:240:3].plot(ax=axs[1])
    axs[1].set_title('ay')
    df_epil12v2.iloc[w, 2:240:3].plot(ax=axs[2])
    axs[2].set_title('az')
    plt.show()

In [30]:
# Creamos el plot interactivo a partir de la función anterior:
interactive_plot = interactive(f_epil1_2, w=list(range(0,9000,5)))
interactive_plot

interactive(children=(Dropdown(description='w', options=(0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65,…

**EPIL 2**

In [19]:
plt.rcParams['figure.figsize'] = [9, 9]

def f_epil2_2(w):    
    #Plots:
    fig, axs = plt.subplots(3,1)
    df_epil22v2.iloc[w, 0:240:3].plot(ax=axs[0])
    axs[0].set_title('ax')
    df_epil22v2.iloc[w, 1:240:3].plot(ax=axs[1])
    axs[1].set_title('ay')
    df_epil22v2.iloc[w, 2:240:3].plot(ax=axs[2])
    axs[2].set_title('az')
    plt.show()

In [20]:
# Creamos el plot interactivo a partir de la función anterior:
interactive_plot = interactive(f_epil2_2, w=list(range(0,9000,5)))
interactive_plot

interactive(children=(Dropdown(description='w', options=(0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65,…

Con esto, el pre-procesamiento para el entrenamiento del algoritmo de Random Forest **ha sido completado**.

A continuación, nos guardamos los datos en csvs, para así poder seguir el tutorial de [eloquentarduino](https://eloquentarduino.github.io/2019/12/how-to-do-gesture-identification-on-arduino/).

## 5) Entrenamiento del algoritmo de Random Forest (tutorial: EloquentArduino)

**A lo largo de esta parte, en casi su totalidad, se ha seguido el tutorial de EloquentArduino:** ["How to deploy an Arduino Machine learning classifier"](https://eloquentarduino.github.io/2019/11/how-to-train-a-classifier-in-scikit-learn/). <br />
Además, también fue de utilidad su [Repositorio de Github](https://github.com/eloquentarduino/EloquentArduino/tree/master/examples)

El primer paso, es guardarnos los anteriores dataframes como .csv y sin encabezados:

In [32]:
carpeta = 'datosEntrenamiento'

df_andar2v2.to_csv(carpeta + '/p_andar.csv', sep=';', header=False, index=False)
df_epil12v2.to_csv(carpeta + '/p_epil1.csv', sep=';', header=False, index=False)
df_epil22v2.to_csv(carpeta + '/p_epil2.csv', sep=';', header=False, index=False)
df_sent12v2.to_csv(carpeta + '/p_sent1.csv', sep=';', header=False, index=False)
df_sent22v2.to_csv(carpeta + '/p_sent2.csv', sep=';', header=False, index=False)

A continuación, creamos la función que permite cargar los datos a partir de estos .csv:

In [33]:
#Creamos la función que permite cargar los datos:

from glob import glob
from os.path import basename

def load_features(folder):
    dataset = None
    classmap = {}
    for class_idx, filename in enumerate(glob('%s/*.csv' % folder)):
        class_name = basename(filename)[:-4]
        classmap[class_idx] = class_name
        samples = np.loadtxt(filename, dtype=float, delimiter=';')
        labels = np.ones((len(samples), 1)) * class_idx
        samples = np.hstack((samples, labels))
        dataset = samples if dataset is None else np.vstack((dataset, samples))

    return dataset, classmap

Usamos la función para cargar los .csv, y así tener:

* Variable *features* $\to$ Almacena los datos (dimensiones y salida deseada - expresada como numeros enteros $\in$ [0,4], cada uno de ellos representando a un movimiento diferente)
* Variable *classmap* $\to$ Recoge los nombres de los movimientos (nombres de los archivos .csv que hemos guardado previamente).

In [34]:
features, classmap = load_features(r'C:\Users\admin\Desktop\UNIVERSIDAD\MASTER_ING_IND-ELECT\Segundo_Curso\1_Primer_Cuatrimestre\Redes_de_sensores_electronicos\RSENSE20_TIRADO_TRABAJO\Graficas\datosEntrenamiento')

Para poder comprobar las prestaciones del algoritmo, **dividimos los datos, en datos de entrenamiento y de test**:

In [35]:
# Datos y salida deseada:
X, y = features[:, :-1], features[:, -1]

from sklearn.model_selection import train_test_split

train_features, test_features, train_labels, test_labels = train_test_split(
    X, y, test_size = 0.25, random_state = 0)


# Imprimimos tamaños de los datos:
print('(n_datos, n_dimensiones) de Entrenamiento:', train_features.shape)
print('Numero de salidas a predecir de Entrenamiento:', train_labels.shape)
print('(n_datos, n_dimensiones) de Test:', test_features.shape)
print('Numero de salidas a predecir de Test:', test_labels.shape)

(n_datos, n_dimensiones) de Entrenamiento: (27206, 243)
Numero de salidas a predecir de Entrenamiento: (27206,)
(n_datos, n_dimensiones) de Test: (9069, 243)
Numero de salidas a predecir de Test: (9069,)


Entrenamos el clasificador y obtenemos las predicciones con los datos de test:

In [36]:
#Import Random Forest Model
from sklearn.ensemble import RandomForestClassifier

clf=RandomForestClassifier(30, max_depth=10)
clf.fit(train_features,train_labels)

y_pred=clf.predict(test_features)

Obtenemos la precisión sobre los datos de test:

In [37]:
from sklearn import metrics
print("Accuracy:",metrics.accuracy_score(test_labels, y_pred))

Accuracy: 1.0


Como vemos, obtenemos una precisión del 100% en los datos de test, por tanto **se consideró como válido el algoritmo de RandomForest par anuestra tarea de detección**.

Finalmente, obtenemos el código a incluir en Arduino con la siguiente función. <br/>
Con ella se obtiene el el archivo de texto **model.txt**, el cual a continuación hay que cambiarle el nombre a: **model.h** para poder incluirlo en la IDE de Arduino.

In [38]:
from sklearn.ensemble import RandomForestClassifier

def get_classifier(features):
    X, y = features[:, :-1], features[:, -1]
    return RandomForestClassifier(30, max_depth=10).fit(X, y)

La siguiente celda, sino se tiene instalado el paquete ```micromlgen``` no es posible utilizarla. Dicho paquete es posible instalarlo a través de, por ejemplo, el prompt de Anaconda (ejecutado con derechos de administrador) via pip:<br/>
```pip install micromlgen```
**Nota**: el ejecutarla o no, no es necesario para continuar con el notebook.

Sin embargo, en el foro de la web del paquete, se observó que hay usuarios que, una vez instalado, tenían problemas al ejecutar un código como el de la siguiente celda. En mi caso también tuve problemas, pero fueron solucionados siguiendo los siguientes pasos:

1. En caso de tener problemas y querer ejecutar el código, hay que descargar la carpeta ```templates``` del [github del paquete](https://github.com/eloquentarduino/micromlgen/tree/master/micromlgen). Para descargarla, puede usarse [DownGit](https://downgit.github.io/#/home).

2. Tras esto, dicha carpeta descargada, y descomprimida, hay que colocarla manualmente en la carpeta donde se instaló micromlgen (si se desconoce la ruta del paquete, se puede obtener con el siguiente código):
```import os
import micromlgen
path = os.path.abspath(micromlgen.__file__)
print(path)```

De tal forma, que al final, dicha carpeta debe aparecer de la siguiente forma:
![image info](carpetaTemplates.png)

In [39]:
from micromlgen import port
import micromlgen

if __name__ == '__main__':
    features, classmap = load_features(r'C:\Users\admin\Desktop\UNIVERSIDAD\MASTER_ING_IND-ELECT\Segundo_Curso\1_Primer_Cuatrimestre\Redes_de_sensores_electronicos\RSENSE20_TIRADO_TRABAJO\Graficas\datosEntrenamiento')
    classifier = get_classifier(features)
    c_code = port(classifier, classmap=classmap)
    #print(c_code)
    with open("model.txt", "w") as text_file:
        text_file.write(c_code)

## 6) Otro punto de vista: Clasificador mediante umbrales (sin RandomForest)

Tras los resultados obtenidos en pruebas reales con el clasificador de Random Forest, se planteó la posibilidad de intentar mejorar los resultados mediante umbrales **haciendo uso de las "integrales"** explicadas en apartados anteriores.

Además, se hizo uso del **sumatorio de los cambios absolutos de aceleración en todos los ejes**. Este último parámetro se planteó utilizarlo para así detectar aquellas posiciones en las que apenas hay movimiento (sentado con pierna arriba, y sentado con pierna abajo). Se calcula de la siguiente forma:
$$ 
\Delta a = \text{Sumatorio absoluto} = \sum_{i=1}^{80} \|a_x^{\{i\}}-a_x^{\{i-1\}}\| + \|a_y^{\{i\}}-a_y^{\{i-1\}}\| + \|a_z^{\{i\}}-a_z^{\{i-1\}}\|
$$
Donde $a_x^{\{0\}}$, $a_y^{\{0\}}$, $a_z^{\{0\}}$ (valores iniciales), se corresponden con el último valor de la ventana anterior.

Por otro lado, la motivación de hacer uso de las "integrales", reside en que representándola en 3D (con una leyenda asociada a cada movimiento), se crean *clusters* bastante distinguidos uno del otro.

Por ejemplo, si hacemos uso de los datos iniciales (los de antes de llevar a cabo el proceso de aumento de datos), tenemos:

In [93]:
import matplotlib as mpl
from mpl_toolkits.mplot3d import Axes3D

plt.rcParams['figure.figsize'] = [6,6]


mpl.rcParams['legend.fontsize'] = 10

# Representación 3D de la métrica "integrales"
fig = plt.figure()
ax = fig.gca(projection='3d')

# andar:
andar_x = df_andar.iloc[:, 0:240:3].sum(axis=1).to_numpy()
andar_y = df_andar.iloc[:, 1:240:3].sum(axis=1).to_numpy()
andar_z = df_andar.iloc[:, 2:240:3].sum(axis=1).to_numpy()

# epilepsia 1:
epil1_x = df_epil1.iloc[:, 0:240:3].sum(axis=1).to_numpy()
epil1_y = df_epil1.iloc[:, 1:240:3].sum(axis=1).to_numpy()
epil1_z = df_epil1.iloc[:, 2:240:3].sum(axis=1).to_numpy()

# epilepsia 2:
epil2_x = df_epil2.iloc[:, 0:240:3].sum(axis=1).to_numpy()
epil2_y = df_epil2.iloc[:, 1:240:3].sum(axis=1).to_numpy()
epil2_z = df_epil2.iloc[:, 2:240:3].sum(axis=1).to_numpy()

# sentado 1:
sent1_x = df_sent1.iloc[:, 0:240:3].sum(axis=1).to_numpy()
sent1_y = df_sent1.iloc[:, 1:240:3].sum(axis=1).to_numpy()
sent1_z = df_sent1.iloc[:, 2:240:3].sum(axis=1).to_numpy()

# sentado 2:
sent2_x = df_sent2.iloc[:, 0:240:3].sum(axis=1).to_numpy()
sent2_y = df_sent2.iloc[:, 1:240:3].sum(axis=1).to_numpy()
sent2_z = df_sent2.iloc[:, 2:240:3].sum(axis=1).to_numpy()

# Gráfica 3D:
ax.scatter(andar_x, andar_y, andar_z, label='andar', marker='o')
ax.scatter(epil1_x, epil1_y, epil1_z, label='epil1', marker='o')
ax.scatter(epil2_x, epil2_y, epil2_z, label='epil2', marker='o')
ax.scatter(sent1_x, sent1_y, sent1_z, label='sent1', marker='o')
ax.scatter(sent2_x, sent2_y, sent2_z, label='sent2', marker='o')
ax.legend()
ax.set_xlabel('$a_x$', fontsize=16)
ax.set_ylabel('$a_y$', fontsize=16)
ax.set_zlabel('$a_z$', fontsize=16)

<IPython.core.display.Javascript object>

Text(0.5, 0, '$a_z$')

Tal y como vemos, se crean regiones características al hacer uso de dicha métrica. Esto se sigue manteniendo si hacemos uso de los datos, tras el proceso de aumento de datos:

In [94]:
mpl.rcParams['legend.fontsize'] = 10

# Representación 3D de la métrica "integrales" para los datos aumentados:
fig = plt.figure()
ax = fig.gca(projection='3d')

# andar:
andar_x = df_andar2v2.iloc[:, 240].to_numpy()
andar_y = df_andar2v2.iloc[:, 241].to_numpy()
andar_z = df_andar2v2.iloc[:, 242].to_numpy()

# epil 1
epil1_x = df_epil12v2.iloc[:, 240].to_numpy()
epil1_y = df_epil12v2.iloc[:, 241].to_numpy()
epil1_z = df_epil12v2.iloc[:, 242].to_numpy()

# epil 2
epil2_x = df_epil22v2.iloc[:, 240].to_numpy()
epil2_y = df_epil22v2.iloc[:, 241].to_numpy()
epil2_z = df_epil22v2.iloc[:, 242].to_numpy()

# sentado 1
sent1_x = df_sent12v2.iloc[:, 240].to_numpy()
sent1_y = df_sent12v2.iloc[:, 241].to_numpy()
sent1_z = df_sent12v2.iloc[:, 242].to_numpy()

# sentado 2
sent2_x = df_sent22v2.iloc[:, 240].to_numpy()
sent2_y = df_sent22v2.iloc[:, 241].to_numpy()
sent2_z = df_sent22v2.iloc[:, 242].to_numpy()

# Gráfica 3D
ax.scatter(andar_x, andar_y, andar_z, label='andar', marker='o')
ax.scatter(epil1_x, epil1_y, epil1_z, label='epil1', marker='o')
ax.scatter(epil2_x, epil2_y, epil2_z, label='epil2', marker='o')
ax.scatter(sent1_x, sent1_y, sent1_z, label='sent1', marker='o')
ax.scatter(sent2_x, sent2_y, sent2_z, label='sent2', marker='o')
ax.legend()
ax.set_xlabel('$a_x$', fontsize=16)
ax.set_ylabel('$a_y$', fontsize=16)
ax.set_zlabel('$a_z$', fontsize=16)

<IPython.core.display.Javascript object>

Text(0.5, 0, '$a_z$')

Para conocer, los valores límite que determinan estas zonas, podemos obtener los valores máximos y mínimos en cada dimensión para cada tipo de movimiento:

In [39]:
#ANDAR:
print('ANDAR:\n')
print('Eje X -> v. máximo: ', df_andar2v2.iloc[:, 240].max(), ', v. mínimo: ',df_andar2v2.iloc[:, 240].min(),'\n')
print('Eje Y -> v. máximo: ', df_andar2v2.iloc[:, 241].max(), ', v. mínimo: ',df_andar2v2.iloc[:, 241].min(),'\n')
print('Eje Z -> v. máximo: %.2f' % df_andar2v2.iloc[:, 242].max(), ', v. mínimo: %.2f' % df_andar2v2.iloc[:, 242].min(),'\n\n')

#EPIL 1:
print('EPIL 1:\n')
print('Eje X -> v. máximo: %.2f' % df_epil12v2.iloc[:, 240].max(), ', v. mínimo: %.2f' % df_epil12v2.iloc[:, 240].min(),'\n')
print('Eje Y -> v. máximo: %.2f' % df_epil12v2.iloc[:, 241].max(), ', v. mínimo: %.2f' % df_epil12v2.iloc[:, 241].min(),'\n')
print('Eje Z -> v. máximo: %.2f' % df_epil12v2.iloc[:, 242].max(), ', v. mínimo: %.2f' % df_epil12v2.iloc[:, 242].min(),'\n\n')

#EPIL 2:
print('EPIL 2:\n')
print('Eje X -> v. máximo: %.2f' % df_epil22v2.iloc[:, 240].max(), ', v. mínimo: %.2f' % df_epil22v2.iloc[:, 240].min(),'\n')
print('Eje Y -> v. máximo: %.2f' % df_epil22v2.iloc[:, 241].max(), ', v. mínimo: %.2f' % df_epil22v2.iloc[:, 241].min(),'\n')
print('Eje Z -> v. máximo: %.2f' % df_epil22v2.iloc[:, 242].max(), ', v. mínimo: %.2f' % df_epil22v2.iloc[:, 242].min(),'\n\n')

#SENT 1:
print('SENT 1:\n')
print('Eje X -> v. máximo: %.2f' % df_sent12v2.iloc[:, 240].max(), ', v. mínimo: %.2f' % df_sent12v2.iloc[:, 240].min(),'\n')
print('Eje Y -> v. máximo: %.2f' % df_sent12v2.iloc[:, 241].max(), ', v. mínimo: %.2f' % df_sent12v2.iloc[:, 241].min(),'\n')
print('Eje Z -> v. máximo: %.2f' % df_sent12v2.iloc[:, 242].max(), ', v. mínimo: %.2f' % df_sent12v2.iloc[:, 242].min(),'\n\n')

#SENT 2:
print('SENT 2:\n')
print('Eje X -> v. máximo: %.2f' % df_sent22v2.iloc[:, 240].max(), ', v. mínimo: %.2f' % df_sent22v2.iloc[:, 240].min(),'\n')
print('Eje Y -> v. máximo: %.2f' % df_sent22v2.iloc[:, 241].max(), ', v. mínimo: %.2f' % df_sent22v2.iloc[:, 241].min(),'\n')
print('Eje Z -> v. máximo: %.2f' % df_sent22v2.iloc[:, 242].max(), ', v. mínimo: %.2f' % df_sent22v2.iloc[:, 242].min(),'\n\n')

ANDAR:

Eje X -> v. máximo:  -65.23 , v. mínimo:  -71.58 

Eje Y -> v. máximo:  9.8 , v. mínimo:  -0.61 

Eje Z -> v. máximo: 10.35 , v. mínimo: -9.60 


EPIL 1:

Eje X -> v. máximo: -35.41 , v. mínimo: -55.42 

Eje Y -> v. máximo: -13.84 , v. mínimo: -28.91 

Eje Z -> v. máximo: 71.97 , v. mínimo: 54.69 


EPIL 2:

Eje X -> v. máximo: -61.46 , v. mínimo: -64.97 

Eje Y -> v. máximo: -19.81 , v. mínimo: -28.70 

Eje Z -> v. máximo: 31.13 , v. mínimo: 16.43 


SENT 1:

Eje X -> v. máximo: -33.65 , v. mínimo: -34.86 

Eje Y -> v. máximo: 1.40 , v. mínimo: -7.16 

Eje Z -> v. máximo: 81.90 , v. mínimo: 80.99 


SENT 2:

Eje X -> v. máximo: -67.26 , v. mínimo: -68.01 

Eje Y -> v. máximo: -11.25 , v. mínimo: -15.92 

Eje Z -> v. máximo: 25.73 , v. mínimo: 21.56 




A partir de esto, y haciendo uso también del sumatorio absoluto de variaciones de aceleración explicado antes ($\Delta a$), se propuso el siguiente método de clasificación (el orden de comprobación es el mismo que el indicado a continuación):

* **SENTADO 1**:

\begin{align}
    \Delta a &< 4.0 \text{ g}\\
    \text{"integral de "} a_z &> 50.0 \text{ g}
\end{align}

* **SENTADO 2**:

\begin{align}
    \Delta a &< 4.0 \text{ g}\\
    \text{"integral de "} a_z &\leq 50.0 \text{ g}
\end{align}

* **EPILEPSIA 1**:

\begin{align}
   \Delta a &> 4.0 \text{ g}\\
   \text{"integral de "} a_z &> 42.0 \text{ g}
\end{align}

* **EPILEPSIA 2**:

\begin{align}
   \Delta a &> 4.0 \text{ g}\\
   \text{"integral de "} a_z &\leq 42.0 \text{ g}\\
   \text{"integral de "} a_y &< -10.0 \text{ g}
\end{align}

* **ANDAR**:

\begin{align}
   \Delta a &> 4.0 \text{ g}\\
   \text{"integral de "} a_z &\leq 42.0 \text{ g}\\
   \text{"integral de "} a_y &> -10.0 \text{ g}
\end{align}


**Los resultados de éste método, así como el método del calsifcador de Bosques Aleatorios, se recogen en la memoria en sus apartados correspondientes de resultados.**