**Resumo**

O eletromiograma de superfície (sEMG) é um biopotencial que pode ser utilizado em diversas aplicações na medicina, sendo a maior parte, para sistemas de reabilitação ou acessibilidade. Esse projeto realiza a aplicação da Transformada Wavelet Discreta (TWD) em um dataset aberto com sinais de sEMG para a classificação de 6 movimentos realizados por pacientes saudáveis. Para a classificação foi utilizado um modelo de Perceptron Multicamadas (MLP) que obteve uma precisão de 90% no experimento realizado. O trabalho pode ser melhorado com o aumento do dataset e mais testes precisam ser realizados com o uso de métricas para melhor avaliar seus resultados.

# Introdução

Sinais de sEMG podem ser amplamente utilizados em diversas aplicações como sistemas para reabilitação, controle de membros robóticos e de próteses mecânicas [[1]](#1)[[2]](#2). 

Para um correto controle das próteses, é necessário que seja possível identificar os movimentos realizados pelo paciente com precisão e uma forma de realizar essa identificação é por meio de algoritmos de Inteligência Artificial. Diversos trabalhos propuseram metodologias de processamento de sinais para melhorar a precisão de modelos de classificação de movimentos, sendo que, uma metodologia que apresentou destaque consiste no uso da Transformada Wavelet Discreta para análise da distribuição das frequências do sinal no tempo [3].

Um estudo foi realizado utilizando essa metodologia para a classificação de 6 tipos de movimentos de pacientes saudáveis e obteve resultados médios de 94,67% de precisão [3], porém, o mesmo não pode ser replicado em sua íntegra, visto que o datset utilizado para o treinamento e classificação do modelo não foi disponibilizado pelos pesquisadores.

Assim, tendo em vista as extensas aplicações de modelos preditivos para sinais de sEMG na área médica e a alta performance do algoritmo proposto é de suma importância que a metodologia proposta possa ser replicada e validada com outros datasets para averiguar sua flexibilidade e viabilidade de aplicação em cenários distintos.

O estudo realizado em (Sapsanis, 2013) realizou a coleta de dados de pacientes saudáveis para a classificação de seis movimentos utilizando Análise de Componentes Principais (PCA) e algoritmos de seleção de atributos para alimentar um modelo  linear de classificação. Esse estudo forneceu o dataset utilizado publicamente, o qual pode ser obtido através do repositório UCI.

Portanto, esse projeto propõe aplicar os conceitos já estudados para o uso da Transformada Wavelet Discreta em sinais de sEMG para reconhecimento de movimentos [3], aplicando-os em um dataset aberto para a classificação de 6 movimentos realizados por pacientes saudáveis [1].

# Metodologia

A metodologia utilizada nesse projeto toma como premissa a análise realizada em (Duan, 2016) com a diferença que, para a aplicação em questão não é utilizada uma *Wavelet Neural Network* e sim um Perceptron Multicamadas com configurações definidas empiricamente durante o experimento.

Nesse projeto foi realizado o processamento dos sinais de EMG utilizando a Transformada Wavelet Discreta (TWD) e os coeficientes obtidos foram utilizados como entradas para um Perceptron Multicamadas (MLP) para a classificação em 6 possíveis categorias de movimento, sendo:

| Código | Pegada/Classe |
|--------|------------|
| 0      | Cilíndrica |
| 1      | Pinça      |
| 2      | Gancho     |
| 3      | Palmar     |
| 4      | Esférica   |
| 5      | Lateral    |
<center>Tabela 1 - Movimentos utilizados como categorias no classificador</center>

Os demais tópicos dessa seção estão organizados da seguinte forma: A Subseção [2.1 Dataset](#Dataset) contém informações sobre como os dados para o projeto foram obtidos; a Subseção [2.2 Wavelet](#Wavelet) explica como foi utilizada a TWD para preparação do dataset e a Subseção [2.3 MLP](#MLP) aborda a aplicação do modelo de Perceptron Multicamadas para classificação dos movimentos.

## Dataset

Os dados utilizados no experimento foram coletados de *(Sapsanis, 2013)*. Nessa pesquisa, foram utilizados seis pacientes saudáveis (2 homens e 4 mulheres)  com idades entre 20 e 22 anos. Os pacientes realizaram os seis movimentos citados na Tabela 1, durante 6 segundos. Cada movimento foi repetido pelos pacientes 30 vezes e foram utilizados dois canais para a leitura do sinal de EMG. Assim, para cada paciente foi gerado um dataset contendo 180 registros de EMG de 6 segundos captados dois canais.

Para o experimento em questão foram utilizados somente os dados do primeiro paciente do sexo masculino, denominado no dataset como `male_1`.

## Wavelet

A análise de frequências no tempo, para sinais não estacionários, utilizando Transformada Discreta de Wavelet apresentou performances promissoras na literatura científica [3]. Esse método permite particionar as frequências de um sinal em porções do tempo, agregando maior nível de escala no tempo para frequências mais altas - que variam mais no tempo - e menor nível de escala para frequências mais baixas - que tendem a se mander constantes no tempo. 

A Transformada Wavelet Discreta pode ser executada com diversos níveis cada um oferecendo maior separação e detalhamento das frequências e, para seu processamento podem ser escolhidas diversas funções de aproximação. Nesse experimento foram utilizadas as mesmas configurações aplicadas em (Duan, 2016), sendo assim, foram aplicados 3 níveis na TWD com uso da função de aproximação `coif5`.

A TWD foi executada para os dois canais de cada uma das 30 repetições de cada movimento realizados pelo paciente `male_1`. Em cada execução da Transformada são retornados 4 vetores de coeficientes, sendo 3 vetores de Detalhe e 1 vetor de Aproximação. De cada vetor foi extraído o coeficiente de maior valor, assim resultando em 8 `features` para cada execução do paciente.

Portanto, o dataset final foi composto por uma matriz de 180 linhas (uma para cada experimento) e 8 colunas contendo os coeficientes de maior valor retornados pela TWD. A cada movimento foi atribuído um label numérico de 0 a 5, conforme especificado na Tabela 1.

## MLP

O modelo utilizado para classificação dos movimentos foi um Perceptron Multicamadas (MLP) obtido pela biblioteca `Scikit-Learn`. Para o treinamento do MLP foram utilizados os seguintes parâmetros definidos empiricamente:

- Camadas escondidas: 3 camadas com 9 neurônios em cada
- Máximo de Iterações: 10.000
- Taxa de Aprendizado Inicial: 0,005
- Nº de Iterações sem melhora até parar o treinamento: 100

# Código Fonte

In [16]:
# Importa as bibliotecas necessárias
import pywt
import scipy.io
from sklearn.neural_network import MLPClassifier
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split

# Lê o conteúdo do arquivo de dados para o primeiro paciente
file = scipy.io.loadmat('./EMG_Dataset/Database1/male_1.mat')

# Variáveis usadas para a TWD
levels = 3
mother_function = 'coif5'

# Dicionário de movimentos e leituras dos canais
movements = {
    'cyl': {
        'c1': np.array(file['cyl_ch1'][0:30]),
        'c2': np.array(file['cyl_ch2'][0:30])
    },
    'tip': {
        'c1': np.array(file['tip_ch1'][0:30]),
        'c2': np.array(file['tip_ch2'][0:30])
    },
    'hook': {
        'c1': np.array(file['hook_ch1'][0:30]),
        'c2': np.array(file['hook_ch2'][0:30])
    },
    'palm': {
        'c1': np.array(file['palm_ch1'][0:30]),
        'c2': np.array(file['palm_ch2'][0:30])
    },
    'spher': {
        'c1': np.array(file['spher_ch1'][0:30]),
        'c2': np.array(file['spher_ch2'][0:30])
    },
    'lat': {
        'c1': np.array(file['lat_ch1'][0:30]),
        'c2': np.array(file['lat_ch2'][0:30])
    }
}

# Dicionário para os coeficientes da TWD
coefs = {
    'cyl': [],
    'tip': [],
    'hook': [],
    'palm': [],
    'spher': [],
    'lat': []
}

# Processamento dos sinais com TWD e separação dos coeficientes
# >> Para cada um dos 30 experimentos processa o sinal de sEMG 
#    e coleta os maiores coeficientes de cada vetor retornado
out_counter = 0
for movement, channels in movements.items():
    experiments_c1 = channels['c1']
    experiments_c2 = channels['c2']
    
    for experiment in range(30):
        c1 = experiments_c1[experiment]
        c2 = experiments_c2[experiment]

        coefficients = pywt.wavedec(c1, mother_function, level=levels) + pywt.wavedec(c2, mother_function, level=levels)
        max_coefs = []
        for coefficient in coefficients:
            max_coef = max(coefficient)

            max_coefs.append(max_coef)

        coefs[movement].append(max_coefs)
        
    coefs[movement] = pd.DataFrame(coefs[movement])
    coefs[movement]['out'] = out_counter
    out_counter += 1

# Construção do dataset com todos os coeficientes
dataset = pd.DataFrame()
for key, data in coefs.items():
    dataset = dataset.append(data)

# Separa features (x) e output (y)
y = dataset['out']
x = dataset.drop(['out'], axis=1)

# Resultados

O dataset preparado foi reordenado aleatóriamente e foram separados 50% dos dados para treinamento do modelo e 50% para teste. O código para treinamento do modelo bem como o resultado do teste de `score` (precisão) realizado podem ser observados abaixo:

In [12]:
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.5)
mlp = MLPClassifier(
    hidden_layer_sizes=(9,9,9), 
    max_iter=10000, 
    learning_rate_init=0.005, 
    n_iter_no_change=100
)
mlp.fit(x_train, y_train)
mlp.score(x_test, y_test)

0.9

# Conclusões


Esse projeto propôs realizar a aplicação de uma metodologia já definida para processamento de sinais de sEMG com a Transformada Wavelet Discreta [3] em um dataset distinto com o objetivo de estudar a flexibilidade do modelo proposto.

Pode-se concluir que o experimento demonstrou a viabilidade da aplicação dos conceitos analisados em (Duan, 2016), de uso da Transformada Wavelet Discreta em um dataset completamente distinto, contendo informações coletadas com menos canais e para movimentos distintos daqueles inicialmente analisados.

O experimento realizado, porém, carece de maiores análises estatísticas para agregar confiabilidade a seu resultado. E poderia se beneficiar também de demais testes utilizando o dataset completo disponibilizado por (Sapsanis, 2013) bem como em datasets maiores, a fim de melhor analisar as limitações do modelo utilizado.

# Bibliografia

<a id="1">[1] C. Sapsanis, G. Georgoulas, e A. Tzes, “EMG based classification of basic hand movements based on time-frequency features”, in 21st Mediterranean Conference on Control and Automation, Platanias, Chania - Crete, Greece, jun. 2013, p. 716–722, doi: 10.1109/MED.2013.6608802.</a>


<a id="2">[2] M. C. F. Castro, E. L. Colombini, P. T. Junior, S. P. Arjunan, e D. K. Kumar, “sEMG feature evaluation for identification of elbow angle resolution in graded arm movement”, BioMed Eng OnLine, vol. 13, nº 1, p. 155, 2014, doi: 10.1186/1475-925X-13-155.</a>


<a id="3">[3] F. Duan, L. Dai, W. Chang, Z. Chen, C. Zhu, e W. Li, “sEMG-Based Identification of Hand Motion Commands Using Wavelet Neural Network Combined With Discrete Wavelet Transform”, IEEE Trans. Ind. Electron., vol. 63, nº 3, p. 1923–1934, mar. 2016, doi: 10.1109/TIE.2015.2497212.</a>