# 1. LIBRERIAS

In [2]:
import os
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings("ignore")
import matplotlib.gridspec as gridspec
import seaborn as sns


# 2. DATA 

In [3]:
data_total=pd.read_csv('data_electrodos.csv')

In [None]:
data_estimulos = pd.read_csv('data_estimulos.csv')

**DIMENSIONES**

data_total es de dimension 1380 x 16, correspondientes a las 1380 señales temporales de los 16 electrodos

data_estimulos es de dimension 1380 x 2, correspondientes a los indices y a la etiqueta del estimulos

In [166]:
len(data_total['0'][0])

830

In [6]:
len(data_estimulos)

1380

In [178]:
data = data_total.values.copy()
data.resize(1380,16)
data = pd.DataFrame(data)

In [185]:
data[0][0] = data_total['0'][0]

In [187]:
len(data[0][0]) # data[electrodo][index]

830

In [82]:
label = data_estimulos.values.copy()
label.resize(1380,2)
label = pd.DataFrame(label)
label = label.drop([0],axis=1)
label.columns = ['est'] #estimulo

In [84]:
print(label['est'][1379])
label.head()

23.0


Unnamed: 0,est
0,1.0
1,1.0
2,1.0
3,1.0
4,1.0


Con estos cambios se obtienen:

**data** de dimensiones 1380 x 16 x N : Corresponde a 1380 datos de 16 electrodos, donde cada electrodo tiene N muestras en una serie temporal.

**label** de dimension 1380 : Corresponde a la etiqueta del estimulo que generan las señales temporales capturadas en los electrodos.

**DATA**

La data se encuentra distrubuida equitativamente para todos los estímulos, teniendose alrededor de 60 muestras por estímulo, correspondientes a 10 sujetos realizando 6 repeticiones de cada estímulo.

No existe desbalance entre clases, por lo que no hace falta aplicar extra procesamiento como undersampling, oversampling o SMOTE.

##### SEPARANDO LOS DATOS DE CADA ELECTRODO

In [188]:
data_e1 = data[:][0]
data_e2 = data[:][1]
data_e3 = data[:][2]
data_e4 = data[:][3]
data_e5 = data[:][4]
data_e6 = data[:][5]
data_e7 = data[:][6]
data_e8 = data[:][7]
data_e9 = data[:][8]
data_e10 = data[:][9]
data_e11= data[:][10]
data_e12 = data[:][11]
data_e13 = data[:][12]
data_e14 = data[:][13]
data_e15 = data[:][14]
data_e16 = data[:][15]

# 3. FEATURE EXTRACTION

## 3.1. PRIMER SET DE CARACTERÍSTICAS

Antes de seguir con las exploraciones, se nececita generar características (features) que representen la señal para poder realizar un análisis. Primero, vamos a definir las características que seran evaluadas

##### INTEGRATED EMG (IEMG)

In [88]:
def iemg(emg):
    I=sum(np.abs(emg))
    return I

##### ZERO CROSSING (ZC)

In [89]:
def ZC(emg,umbral):
    N=len(emg)
    product=np.multiply(emg[0:N-1],emg[1:N])
    dif=np.abs(emg[0:N-1]-emg[1:N])
    s=0
    for i in range(N-1):
        sgn=0
        dif_cond=0
        if(product[i]>=umbral):
            sgn=1
        if(dif[i]>=umbral):
            dif_cond=1
        s = s + (sgn*dif_cond)
    return s

##### WAVEFORM LENGTH (WL)

In [90]:
def WL(emg):
    N=len(emg)
    dif=emg[1:N]-emg[0:N-1]
    wl=sum(np.abs(dif))
    return wl

##### WILLISON AMPLITUDE (WAMP)

In [91]:
def WAMP(emg,umbral):
    N=len(emg)
    dif=emg[1:N]-emg[0:N-1]
    dif_abs=np.abs(dif)
    s=0
    for i in range(N-1):
        if (dif_abs[i]>= umbral):
            s=s+1
    return s

##### MEAN ABSOLUTE VALUE (MAV)

In [92]:
def mav(emg):
    N=len(emg)
    mav=(1/N)*sum(np.abs(emg))
    return mav

##### VARIANCE OF EMG (VAR)

In [93]:
def VAR(emg):
    N=len(emg)
    var=(1/(N-1))*sum(np.abs(emg)*np.abs(emg))
    return var

##### ROOT MEAN SQUARE (RMS)

In [94]:
def RMS(emg):
    N=len(emg)
    rms=np.sqrt((1/N)*sum(np.abs(emg)*np.abs(emg)))
    return rms

##### LOG DETECTOR (LOG)

In [95]:
def LOG(emg):
    N=len(emg)
    suma=sum(np.log(np.abs(emg)))
    LOG=np.exp(suma/N)
    return LOG

##### SLOPE SIGN CHANGE (SSC)

In [96]:
def SSC(emg,umbral):
    N=len(emg)
    dif1=emg[1:N-1]-emg[0:N-2]
    dif2=emg[1:N-1]-emg[2:N]
    product=np.multiply(dif1,dif2)
    s=0
    for i in range(N-2):
        if (product[i]>= umbral):
            s=s+1
    return s

##### GENERATE FEATURES 

In [139]:
def generate_features1(signal,params):
    
    umbral_zc = params[0]
    umbral_wamp = params[1]
    umbral_ssc = params[2]
    
    if isinstance(signal,pd.core.frame.DataFrame):
        features = pd.DataFrame()
        #Pasar por los 1380 datos
        for i in range(len(signal)):
            #Acceder a la serie temporal
            serie = signal.iloc[i]
            k = len(serie)
            ftrs = pd.DataFrame([iemg(serie), ZC(serie,umbral_zc), WL(serie), WAMP(serie,umbral_wamp),
                                mav(serie), VAR(serie), RMS(serie), LOG(serie), SSC(serie,umbral_ssc)]).T
            features = pd.concat([features, ftrs], axis=0, ignore_index = True)
    else:
        featuers = []
        for i in range(len(signal)):
            serie = signal.iloc[i]
            k = len(serie)
            ftrs = [iemg(serie), ZC(serie,umbral_zc), WL(serie), WAMP(serie,umbral_wamp),
                                mav(serie), VAR(serie), RMS(serie), LOG(serie), SSC(serie,umbral_ssc)]
            features = pd.append(ftrs)
    return features

##### DEFINIR LOS PARÁMETROS DE ALGUNAS ESTADÍSTICAS (ZC, WAMP, SSC)

In [137]:
params = [0,0,0]

In [189]:
features_e1 = generate_features1(data_e1,params)

TypeError: ufunc 'absolute' did not contain a loop with signature matching types dtype('<U830') dtype('<U830')

In [198]:
data_e1_1 = pd.DataFrame([data_e1[0]])