# Machine Learning para DOA - Dregon Dataset

O objetivo aqui é utilizar regrassão para determinar a direção de chegada. Para isso, já extraí os delays referentes a todas as combinações de microfones do Dregon Dataset - Clean Speech.

O algoritmo usado para extrair os delays foi o delayDatasetCreator.py. Pode ser que a informação de todos os delays seja redundante, uma vez que o algoritmo determinístico usa só os delays em relação ao microfone da origem do espaço vetorial.

In [1]:
import pandas as pd
import numpy as np
from math import sqrt, cos, sin, pi
from sklearn.linear_model import LinearRegression, LassoLars, RANSACRegressor
from sklearn.model_selection import train_test_split as tts
from sklearn.metrics import mean_squared_error as mse, r2_score as r2

#### Abrindo o CSV com Pandas e separando as features das classificações 

O dataset tem as seguintes colunas:

Nome do arquivo WAV, Features, Azimutal Real, Elevação Real

Eu vou nomear os vetores com "teste" já que eu vou treinar o regressor com dados fictícios. Os dados do dataset serão todos de teste.

In [22]:
dataset       = pd.read_csv("/home/dimi/Programming/IC2019/DOA/Datasets/dregonDelaysDataset.csv")
xTest         = np.array(dataset[dataset.columns[1:-2]]).astype(float)
yTestAzimutal = np.array(dataset[dataset.columns[-2]])
yTestElevacao = np.array(dataset[dataset.columns[-1]])

In [3]:
print(xTest[0], yTestAzimutal[0], yTestElevacao[0])

[ 12  12  22  18  17   7   6  -1  10   6   4  -5  -6  11   7   5  -5  -6
  -5  -6 -16 -17  -1 -11 -12  -9 -10  -1] 45 -30


#### Definindo algumas funções que vou precisar

In [4]:
def radParaGrau(angulo):
    return (angulo*180)/pi

def grauParaRad(angulo):
    return (angulo*pi)/180

def vetorUnitario(vetor):
    return vetor/np.linalg.norm(vetor)

def tempoParaAmostras(tempo, freqAmostragem):
    return tempo * freqAmostragem

#### Criando os dados fictícios de treino

Os dados de treino não serão dados reais. Vou usar a conta do produto interno para verificar qual seria o delay ideal entre cada microfone. Assim, posso criar dados fictícios que representam o caso ideal, e com eles, treinar os regressores.

http://www.labbookpages.co.uk/audio/beamforming/delayCalc.html

In [5]:
# COORDENADAS ORIGINAIS
coordenadasMics = np.array([
    [0.0420, 0.0615, -0.0410],
    [-0.0420, 0.0615, 0.0410],
    [-0.0615, 0.0420, -0.0410],
    [-0.0615, -0.0420, 0.0410],
    [-0.0420, -0.0615, -0.0410],
    [0.0420, -0.0615, 0.0410],
    [0.0615, -0.0420, -0.0410],
    [0.0615, 0.0420, 0.0410]
])

In [23]:
# CRIANDO OS ARRAYS DE XTRAIN E YTRAIN
xTrain         = []
yTrainAzimutal = []
yTrainElevacao = []

# VOU PRECISAR DA FREQUENCIA DE AMOSTRAGEM DO DATASET
freqAmostragem = 44100

# VOU CALCULAR OS DELAYS COMO SE O SOM TIVESSE VINDO DAS SEGUINTES COMBINACOES
# DE AZIMUTAIS E ELEVACOES
# for azimutalAtual in np.arange(0 , 91, 10):
#     for elevacaoAtual in np.arange(-90 , 1, 10):
azimutaisDesejados = [45, 60, 75, 90]
elevacoesDesejadas = [0, -15, -30]
for azimutalAtual in azimutaisDesejados:
    for elevacaoAtual in elevacoesDesejadas:
        
        # COLOCANDO NOS ARRAYS DE YTRAIN
        yTrainAzimutal.append(azimutalAtual)
        yTrainElevacao.append(elevacaoAtual)
        
        # TENHO QUE PASSAR PRA RADIANOS PRA FAZER AS CONTAS
        azimutalAtualRad = grauParaRad(azimutalAtual)
        elevacaoAtualRad = grauParaRad(elevacaoAtual)

        # PARA CADA COMBINAÇÃO DE MICROFONES
        linhaAtualXTrain = []
        for micI in range(0, 8):
            for micJ in range(micI + 1, 8):

                # COORDENADAS DA DIFERENCA DOS MICS
                coordenadasDiferenca = coordenadasMics[micI] - coordenadasMics[micJ]

                # COORDENADAS DO VETOR WAVEFRONT (JA VOU DEIXAR ELE UNITARIO)
                w = vetorUnitario(np.array([
                    cos(azimutalAtualRad)*cos(elevacaoAtualRad),
                    sin(azimutalAtualRad)*cos(elevacaoAtualRad),
                    sin(elevacaoAtualRad)
                ]))

                # CALCULANDO O PRODUTO INTERNO E DIVIDINDO PELA VELOCIDADE DO SOM
                delayTemporal = coordenadasDiferenca[0] * w[0]
                delayTemporal += coordenadasDiferenca[1] * w[1]
                delayTemporal += coordenadasDiferenca[2] * w[2]
                delayTemporal /= 340

                # VOU COLOCANDO OS RESULTADOS NA LINHA ATUAL DE XTRAIN
                linhaAtualXTrain.append(tempoParaAmostras(delayTemporal, freqAmostragem))
        
        # AGORA, JA POSSO COLOCAR A LINHA INTEIRA EM XTRAIN
        xTrain.append(linhaAtualXTrain)
        
# PASSANDO TUDO PRA NUMPY
xTrain = np.array(xTrain).astype(float)
yTrainAzimutal = np.array(yTrainAzimutal)
yTrainElevacao = np.array(yTrainElevacao)

#### Treinando o regressor e prezidendo dados

In [21]:
# PRIMEIRO COM O AZIMUTAL
regressorAzimutal = LinearRegression().fit(xTrain, yTrainAzimutal)
yPredAzimutal = regressorAzimutal.predict(xTest)

for i, predicao in enumerate(yPredAzimutal):
    print(yTestAzimutal[i], predicao)

45 -3289914092523.623
90 -5435072335883.113
60 -5358199920078.698
75 -5841729598496.477
60 -5578716758233.352
45 -3169481711986.1777
60 -6174924715343.387
45 -5608657672214.508
90 -7756705693004.785
90 -7782334373245.594
60 -9871350998555.418
60 -11620231099986.305
75 -6366014288651.885
45 -5302767924501.852
75 -9246220650701.227
90 -8682656245547.793
60 -5265758982736.915
60 -4774139897386.238
60 -9290241818273.691
75 -8041073039313.328
90 1673569327083.6875
75 -8589528872578.707
75 -11850099921220.828
60 -5518542544158.651
90 -5970373711153.871
45 -4395289920834.461
90 -8346274234633.465
75 -18122517293423.344
90 -5821899412071.09
75 -3837441848862.914
75 -10321337523628.137
90 -9819107073264.902
45 -4251131086318.035
45 -5172814527979.4375
60 -9631052775153.451
75 -9924389433225.828
60 -7246528299622.043
45 -6634452633957.18
45 -6655151574886.344
75 2029419150085.0635
75 -4169293050685.25
90 -6066783193000.916
75 -6645944884107.631
60 -3722652715587.0107
45 -7329989499039.912
75 -92