<a href="https://colab.research.google.com/github/alejandrazuleta1/analisis-multivariado-emg/blob/main/An%C3%A1lisis_Multivariado_EMG.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

**TRATAMIENTO DE SEÑALES III**

**Facultad de Ingeniería**

**Universidad de Antioquia**

*Alejandra Zuleta Gónzalez, Santiago Patiño Guerrero y Natalia Pérez Puentes*

*2021-2*

**Procedimiento para la Extracción de Características**


1. Se tiene una señal de entrada $y(t) \in \mathcal{R}^{20000\times 1}$
2. Para la señal original: Calculamos $D_1=13$ características las cuales son a) RMSE b) MAE c) 5 Potencias máximas d) 5 Frecuencias a Pmax, e) Num de cruces por cero. Dando lugar a un vector de características $x_1  \in \mathcal{R}^{13\times 1}$
3. Luego Adicionaremos a estas $D_1$ características, otro conjunto a partir de descomposiciones Wavelet. En el cual para la señal original se realizará un proceso de $M$ descomposiciones utilizando la $dwt$
4. Para cada nivel de descomposición $M$, se calcularán $D_2$ características, las cuales son: Entropía – variance, standard deviation, Mean, Median, 25th percentile value, 75th percentile value, Root Mean
Square value; square of the average of the squared amplitude values, The mean of the derivative
– Zero crossing rate, i.e. the number of times a signal crosses y = 0
– Mean crossing rate, i.e. the number of times a signal crosses y = mean(y). Dando lugar a $D_2 = 12$ características por cada nivel de descomposición.

Finalmente el vector completo de características para la señal $y(t)$, será:

$x = [x_1,x_{des_1},\cdots,x_{des_M}]^{\top} \in \mathcal{R}^{(D_1*(M*D_2))\times 1}$  

La matriz completa será:
$\mathbf{X} = [x_1^\top,x_2^\top,\cdots,x_N^\top] \in \mathcal{R}^{N\times (D_1*(M*D_2))}$

In [None]:
#librerías
from scipy.stats import entropy
from scipy.io import loadmat
import numpy as np
import matplotlib.pyplot as plt
from scipy import signal
import pandas as pd

In [None]:
#Funciones utilizadas
def cruces_por_cero(signal):
  cruces=0
  for cont,valor in enumerate(signal):
    if cont!=len(signal)-1:
      if signal[cont]*signal[cont+1]<=0:
        cruces+=1
    else:
      if signal[cont]*signal[cont-1]<0:
        cruces+=1
  return cruces




def featureExtractionEMG(sampleSignal):
  # Esta función toma como argumento de entrada una señal EMG de 20000 muestras y retorna 13 caracteristicas relacionadas a la señal
  # a. Removemos el nivel DC
  nivelDC = np.mean(sampleSignal)
  sampleSignal = sampleSignal-nivelDC
  # b. Normalicemos las señales para que tengan amplitud unitaria
  maxSignal = np.abs(np.max(sampleSignal))
  sampleSignal = sampleSignal/maxSignal
  # Realicemos el análisis STFT
  f, t, Zxx = signal.stft(sampleSignal, fs, nperseg=600)

  rms = np.sqrt((np.sum(sampleSignal)**2)/len(sampleSignal))
  mae = np.sum(np.abs(sampleSignal))/len(sampleSignal)
  # En la matriz Zxx se tiene una matriz de #defrecs * #times
# Zxx[i,j], sería el espectro en la frecuencia[i] y el tiempo [j]
  absZxx = np.abs(Zxx)
  Pmax_Zxx = np.max(absZxx,axis=1) # dB

  Pmax_Zxx_dB = 20*np.log10(Pmax_Zxx)
  idx = np.argsort(Pmax_Zxx_dB)
  maximos = Pmax_Zxx_dB[idx]
  auxPot = maximos[-5:]
  frecuencias = f[idx]
  fPmax_Zxx = frecuencias[-5:]
  feature_set = np.zeros((13,))
  feature_set[0] = rms
  feature_set[1] = mae
  feature_set[2:7] = auxPot
  feature_set[7:12] = fPmax_Zxx
  feature_set[12] = cruces_por_cero(sampleSignal)
  # To do : calcular el número de cruces por cero
  return feature_set




def first_features(data_EMG):
  L_Signal, Classes, Ntrials = np.shape(data_EMG)
  D = 13 # número de características

  X = np.zeros((Classes*Ntrials,D))
  t = np.zeros((Classes*Ntrials,1))
  pos = 0
  for clase in range(0,Classes):
    for n in range(0,Ntrials):
      sampleSignal = data_EMG[:,clase,n]
      # Luego le extraemos las D características a cada señal del experimento
      x_n = featureExtractionEMG(sampleSignal)
      X[pos, :] = x_n
      t[pos] = clase
      pos = pos + 1
  return X , t




def visualization(X,t):
  Nombres = ['RMS','MAE','P1','P2','P3','P4','P5','F1','F2','F3','F4','F5','Num Cruces Por Cero']

  dataFrame = pd.DataFrame(data = X, columns= Nombres)
  dataFrame['Tipo Mov'] = t

  return(dataFrame)



def calculate_entropy(list_values):
  value,counter_values = np.unique(list_values, return_counts=True)
  entropyVal = entropy(counter_values, base=None)
  return entropyVal




def calculate_statistics(list_values):
  n5 = np.nanpercentile(list_values, 5)
  n25 = np.nanpercentile(list_values, 25)
  n75 = np.nanpercentile(list_values, 75)
  n95 = np.nanpercentile(list_values, 95)
  median = np.nanpercentile(list_values, 50)
  mean = np.nanmean(list_values)
  std = np.nanstd(list_values)
  var = np.nanvar(list_values)
  rms = np.nanmean(np.sqrt(list_values**2))
  return [n5, n25, n75, n95, median, mean, std, var, rms]




def calculate_crossings(list_values):
  zero_crossing_indices = np.where(np.diff(np.signbit(list_values)))[0]
  no_zero_crossings = len(zero_crossing_indices)
  mean_crossing_indices = np.where(np.diff(np.signbit(list_values-np.nanmean(list_values))))[0]
  no_mean_crossings = len(mean_crossing_indices)
  return [no_zero_crossings, no_mean_crossings]




def get_features(list_values):
  entropy = calculate_entropy(list_values)
  crossings = calculate_crossings(list_values)
  statistics = calculate_statistics(list_values)
  return [entropy] + crossings + statistics


In [None]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [None]:
ruta = '/content/drive/Shareddrives/Señales III/EMG_SIGNAL/'
data1 = loadmat(ruta+'S1_20140620T021349.mat')
data2 = loadmat(ruta+'S2_20140623T203911.mat')
data3 = loadmat(ruta+'S3_20140623T192807.mat')

In [None]:
data_EMG_1 = data1['data_EMG']
data_EMG_2 = data2['data_EMG']
data_EMG_3 = data3['data_EMG']

fs = 4e3
Ts = 1./fs

In [None]:
x_1, t_1 = first_features(data_EMG_1)
x_2, t_2 = first_features(data_EMG_2)
x_3, t_3 = first_features(data_EMG_3)

#visualization(x_1,t_1)