## Classificação por isolamento de frequência

Neste notebook será realizado um exemplo de classificação, isolando todas as frequências estimuladas no conjunto de dados `AVI SSVEP Single Target`. 

### Passos para a realização da classificação:

1. **Carrega** o arquivo `fif` (`mne.EpochsArray`) dos dados **filtrados**;
2. **Determine o limiar** para isolar cada uma das frequências estimuladas. Por exemplo, a faixa de frequência para o estímulo de 6.5 Hz irá resultar em pontos (`PSD`) que irão variar de 6.3 à 6.7 Hz, caso o limiar seja de 0.2 Hz;
3. **Obter a "energia"** do sinal por meio do cálculo `compute_psd` para cada uma das faixas de frequência que podem ser estimuladas. Por exemplo:
    - Obtenha todas as frequências estimuladas. Ex: 6, 6.5, 7, 7.5, 8.2 e 9.3;
    - Obtenha o valor mínimo e o máximo para cada frequência utilizando limiar. Ex: (5.8, 6.2), (6.3, 6.7), ...
    - Aplique o `compute_psd` para cada tupla (min, max), por meio dos parâmetros `fmin` e `fmax` do mesmo método.
4. Com as listas de pontos isoladas e computadas (`PSD`) para cada amostra, aplique um cálculo de característica adequada. Características manuais interessantes para este exemplo podem ser `max_value`, `average` ou `median`. No fim deste passo iremos obter um **vetor de características**;
5. Por fim, realize a **classificação**, que será um **cálculo de voto** simples (maior valor é provavelmente o a frequência evocada).

A seguir, um exemplo desta classificação com os dados `single target` de `AVI dataset`:

In [7]:
import mne
import numpy as np
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings('ignore')

data = mne.read_epochs("./mne_data_beta.fif")

Reading /home/kuak/Documentos/RP/RP_SSVEP/ssvep/src/beta/mne_data_beta.fif ...
Isotrak not found
    Found the data of interest:
        t =       0.00 ...    1462.89 ms
        0 CTF compensation matrices available
Not setting metadata
160 matching events found
No baseline correction applied
0 projection items activated


In [2]:
print(data.get_data().shape)
data

(160, 64, 750)


0,1
Number of events,160
Events,10.0: 4 10.2: 4 10.4: 4 10.6: 4 10.8: 4 11.0: 4 11.2: 4 11.4: 4 11.6: 4 11.8: 4 12.0: 4 12.2: 4 12.4: 4 12.600000000000001: 4 12.8: 4 13.0: 4 13.200000000000001: 4 13.4: 4 13.600000000000001: 4 13.8: 4 14.0: 4 14.200000000000001: 4 14.4: 4 14.600000000000001: 4 14.8: 4 15.0: 4 15.200000000000001: 4 15.4: 4 15.600000000000001: 4 15.8: 4 8.0: 4 8.2: 4 8.4: 4 8.6: 4 8.799999999999999: 4 9.0: 4 9.2: 4 9.4: 4 9.6: 4 9.8: 4
Time range,0.000 – 1.463 s
Baseline,off


In [3]:
y = np.load("../../datasets/beta/labels_beta.npy")
# print(y)

y_set = sorted(set(y))
y_set


[8.0,
 8.2,
 8.4,
 8.6,
 8.799999999999999,
 9.0,
 9.2,
 9.4,
 9.6,
 9.8,
 10.0,
 10.2,
 10.4,
 10.6,
 10.8,
 11.0,
 11.2,
 11.4,
 11.6,
 11.8,
 12.0,
 12.2,
 12.4,
 12.600000000000001,
 12.8,
 13.0,
 13.200000000000001,
 13.4,
 13.600000000000001,
 13.8,
 14.0,
 14.200000000000001,
 14.4,
 14.600000000000001,
 14.8,
 15.0,
 15.200000000000001,
 15.4,
 15.600000000000001,
 15.8]

In [10]:
# for i in range(len(data)):
#     # view = mne_data.compute_psd(method='welch', fmin=3, fmax=13)
#     view = data[i].compute_psd(method='multitaper', fmin=3, fmax=13, verbose=False)
#     view.plot(show=False)
#     print()
#     plt.title('Domínio da frequência')
#     plt.axvline(x=float(list(data[i].event_id)[0]), linestyle='--', color='green')
#     plt.show()
# print()

In [4]:
limiar = 0.1

alvos = [float(item) for item in data.event_id.keys()]
print(f"Alvos: {alvos}")

features = list()
for i in range(len(data)):
    sample = list()
    for alvo in alvos:
        freq_min = alvo - limiar
        freq_max = alvo + limiar
        sample.append(data[i].compute_psd(method='multitaper', fmin=freq_min, fmax=freq_max, verbose=False))

    features.append(sample)
    
X = np.array(features)
print("Formato dos dados calculados:", X.shape)

Alvos: [8.0, 8.2, 8.4, 8.6, 8.799999999999999, 9.0, 9.2, 9.4, 9.6, 9.8, 10.0, 10.2, 10.4, 10.6, 10.8, 11.0, 11.2, 11.4, 11.6, 11.8, 12.0, 12.2, 12.4, 12.600000000000001, 12.8, 13.0, 13.200000000000001, 13.4, 13.600000000000001, 13.8, 14.0, 14.200000000000001, 14.4, 14.600000000000001, 14.8, 15.0, 15.200000000000001, 15.4, 15.600000000000001, 15.8]


ValueError: zero-size array to reduction operation minimum which has no identity

In [None]:
# organizando os dados

X = X.reshape(X.shape[0], X.shape[1], X.shape[-1])
print("Formato padronizado dos dados com PSD calculado:", X.shape)

In [None]:
# TAREFA 4

# aplicando a característica de "maior valor"
max_values = np.max(X, axis=-1)
max_values.shape

In [None]:
# TAREFA 5

# entendimento dos dados
print(y, y.shape, alvos)

# classificação pelo "voto" do maior valor
i_max = max_values.argmax(axis=-1)
hits = [1 for i in range(len(i_max)) if alvos[i_max[i]] == y[i]]
acc = 100 * sum(hits) / len(y)
print(f'\nPorcentagem de acerto: {acc:.2f}%')