# DELAY SUM - GRAVAÇÃO 8

As coordenadas X, Y e Z em metros dos microfones são:

mic1 = [0, 0, 0]

mic2 = [0, 0.058, 0]

mic3 = [0.058, 0.058, 0]

mic4 = [0.058, 0, 0]

In [1]:
import librosa
import matplotlib.pyplot as plt
from IPython.display import Audio
import math
import numpy as np

## Declaração de Funções

### Função para verificar o delay entre os microfones

Essa função foi copiada e colada do algoritmo que já havia sido desenvolvido antes. É preciso mandar o argumento maxDelay, que é a quantidade de amostras contidas no maior delay possível entre dois microfones quaisquer.

In [22]:
def verificarDelay(sinalA, sinalB, maxDelay=15, verbose=False):
    
    # Verificando se os dois sinais tem o mesmo tamanho e se maxDelay é compatível
    if len(sinalA) != len(sinalB) or maxDelay >= len(sinalA)-1 :
        return False
    
    # Sei que o maior delay possível (em qtd de amostras) é maxDelay. Portanto, em cada iteração, 
    # a comparação entre os sinais para gerar a correlação se dará com arrays de tamanho 
    # len(sinal) - maxDelay
    tamanho = len(sinalA) - maxDelay
    
    # O delay será a qtd de amostras pra trás ou para frente que há
    # entre o sinal B em relação ao sinal A. Negativo significa que B está adiantado, 0 que não há
    # delay e positivo que está atrasado.
    delay = 0
    melhorCorrelacao = -1
    arrayCorrelacoes = []
    
    inicioA = 0
    fimA    = inicioA + tamanho
    inicioB = len(sinalB) - tamanho
    fimB    = inicioB + tamanho
    
    # Fazendo as iterações e calculando a correlação entre os sinais
    for i in range(-maxDelay, maxDelay+1):
        
        # Calculando a correlação da iteração atual
        corrAtual = np.corrcoef(sinalA[inicioA:fimA], sinalB[inicioB:fimB])[0][1]
        
        # Verificando se encontramos uma correlacao maior ainda para atualizar o delay
        if corrAtual > melhorCorrelacao:
            melhorCorrelacao = corrAtual
            delay = -i
        
        # Printando as iterações se verbose estiver ligado
        if verbose == True:
            arrayCorrelacoes.append(corrAtual)
            plt.title("Delay " + str(i))
            plt.plot(sinalA[inicioA:fimA])
            plt.plot(sinalB[inicioB:fimB])
            plt.show()
            print("Sinal A:", int(inicioA), "até", int(fimA))
            print("Sinal B:", int(inicioB), "até", int(fimB))
            print("Correlação Atual:", corrAtual)
            print("Melhor Correlação:", melhorCorrelacao, "(Delay " + str(delay) + ")\n\n\n")
            
        # Fazendo os indexes dos arrays da próxima iteração. De i = -maxDelay até 0, o Sinal A 
        # fica parado e o Sinal B vem vindo pra trás. A partir de i = 1 até maxDelay, o Sinal B
        # fica parado e o Sinal A vai embora.
        if i < 0:
            inicioB -= 1
            fimB     = inicioB + tamanho
        else:
            inicioA += 1
            fimA     = inicioA + tamanho
         
    # Se o verbose estiver ligado eu printo as correlações em função do delay tb
    if verbose == True:
        plt.title("Correlações em função dos delays")
        plt.plot(arrayCorrelacoes)
        plt.show()
    
    # Retornando o delay
    return -delay

### Função para calcular o maior delay possível na geometria utilizada

A função definirDelayMaximo pode calcular a quantidade de amostras do maior delay possível entre dois microfones. Basta enviar o tamanho do lado do array quadrado.

In [3]:
def definirDelayMaximo(freqAmostragem, L, velocidadeSom=340):
    
    # O delay máximo (em qtd de amostras) dar-se-á na diagonal dos microfones
    diagonal     = math.sqrt(2 * (L**2))
    tempo        = diagonal / velocidadeSom
    qtdAmostras  = freqAmostragem * tempo
    
    # Adicionando mais 1 amostra pra garantir
    return int(qtdAmostras + 1)

### Funções de geometria analítica

In [4]:
def vetorUnitario(vetor):
    return vetor/np.linalg.norm(vetor)

def anguloEntreDoisVetores(v1, v2):
    v1Unitario = vetorUnitario(v1)
    v2Unitario = vetorUnitario(v2)
    return np.arccos(np.clip(np.dot(v1Unitario, v2Unitario), -1.0, 1.0))

def anguloAzimutal(vetor):
    return np.arctan(vetor[1]/vetor[0])
    
def anguloElevacao(vetor):
    return anguloEntreDoisVetores([vetor[0], vetor[1], 0], vetor)

def radParaGrau(angulo):
    return (angulo*180)/math.pi

## Aplicando

### 45 azimutal e 30 de elevação

Importando os áudios

In [23]:
mic1, freqAmostragem = librosa.load('/home/dimi/Programming/IC2019/DOA/Gravacoes/Gravacao8/45_30_mic-01.wav', sr=None, mono=True)
mic2, freqAmostragem = librosa.load('/home/dimi/Programming/IC2019/DOA/Gravacoes/Gravacao8/45_30_mic-02.wav', sr=None, mono=True)
mic3, freqAmostragem = librosa.load('/home/dimi/Programming/IC2019/DOA/Gravacoes/Gravacao8/45_30_mic-03.wav', sr=None, mono=True)
mic4, freqAmostragem = librosa.load('/home/dimi/Programming/IC2019/DOA/Gravacoes/Gravacao8/45_30_mic-04.wav', sr=None, mono=True)

##### Parâmetros Iniciais 

In [24]:
coordenadasMic1 = [0, 0, 0]
coordenadasMic2 = [0, 0.058, 0]
coordenadasMic3 = [0.058, 0.058, 0]
coordenadasMic4 = [0.058, 0, 0]

tamanhoLado = 0.058

delayMax = definirDelayMaximo(freqAmostragem, L=tamanhoLado)
print("Delay máximo de acordo com a geometria (qtdAmostras):", delayMax)

Delay máximo de acordo com a geometria (qtdAmostras): 11


Calculando o delay entre os microfones tendo o primeiro como referência

In [25]:
delay12 = verificarDelay(mic1, mic2, maxDelay=delayMax)
delay13 = verificarDelay(mic1, mic3, maxDelay=delayMax)
delay14 = verificarDelay(mic1, mic4, maxDelay=delayMax)

print("Delay entre os microfones 1 e 2 (qtd amostras):", delay12)
print("Delay entre os microfones 1 e 2 (qtd amostras):", delay13)
print("Delay entre os microfones 1 e 2 (qtd amostras):", delay14)

Delay entre os microfones 1 e 2 (qtd amostras): 5
Delay entre os microfones 1 e 2 (qtd amostras): 11
Delay entre os microfones 1 e 2 (qtd amostras): 4


Resolvendo a equação matricial com mínimos quadrados

|mic2x mic2y mic2z| |wx| |vSom.delay12|

|mic3x mic3y mic3z|.|wy|=|vSom.delay13|

|mic4x mic4y mic4z| |wz| |vSom.delay14|

In [26]:
# A É A MATRIZ DAS INCOGNITAS
A = np.array([
    coordenadasMic2,
    coordenadasMic3,
    coordenadasMic4
])

# B É O VETOR DE COEFICIENTES
b = np.array([(delay12/freqAmostragem)*340, (delay13/freqAmostragem)*340, (delay14/freqAmostragem)*340])

# W É O VETOR QUE REPRESENTA O PONTO DE ONDE O SOM VEIO
w, residuals, rank, s = np.linalg.lstsq(A,b, rcond=None)
print(w)

[0.62032476 0.75325149 0.        ]


Calculando o resultado

In [27]:
print("Ângulo Azimutal:", radParaGrau(anguloAzimutal(w)))
print("Ângulo de Elevação:", radParaGrau(anguloElevacao(w)))

Ângulo Azimutal: 50.527540151656154
Ângulo de Elevação: 0.0


### 90 azimutal e 30 de elevação

Importando os áudios

In [28]:
mic1, freqAmostragem = librosa.load('/home/dimi/Programming/IC2019/DOA/Gravacoes/Gravacao8/90_30_mic-01.wav', sr=None, mono=True)
mic2, freqAmostragem = librosa.load('/home/dimi/Programming/IC2019/DOA/Gravacoes/Gravacao8/90_30_mic-02.wav', sr=None, mono=True)
mic3, freqAmostragem = librosa.load('/home/dimi/Programming/IC2019/DOA/Gravacoes/Gravacao8/90_30_mic-03.wav', sr=None, mono=True)
mic4, freqAmostragem = librosa.load('/home/dimi/Programming/IC2019/DOA/Gravacoes/Gravacao8/90_30_mic-04.wav', sr=None, mono=True)

Calculando o delay entre os microfones tendo o primeiro como referência

In [29]:
delay12 = verificarDelay(mic1, mic2, maxDelay=delayMax)
delay13 = verificarDelay(mic1, mic3, maxDelay=delayMax)
delay14 = verificarDelay(mic1, mic4, maxDelay=delayMax)

print("Delay entre os microfones 1 e 2 (qtd amostras):", delay12)
print("Delay entre os microfones 1 e 2 (qtd amostras):", delay13)
print("Delay entre os microfones 1 e 2 (qtd amostras):", delay14)

Delay entre os microfones 1 e 2 (qtd amostras): 6
Delay entre os microfones 1 e 2 (qtd amostras): 9
Delay entre os microfones 1 e 2 (qtd amostras): 3


Resolvendo a equação matricial com mínimos quadrados

|mic2x mic2y mic2z| |wx| |vSom.delay12|

|mic3x mic3y mic3z|.|wy|=|vSom.delay13|

|mic4x mic4y mic4z| |wz| |vSom.delay14|

In [30]:
# A É A MATRIZ DAS INCOGNITAS
A = np.array([
    coordenadasMic2,
    coordenadasMic3,
    coordenadasMic4
])

# B É O VETOR DE COEFICIENTES
b = np.array([(delay12/freqAmostragem)*340, (delay13/freqAmostragem)*340, (delay14/freqAmostragem)*340])

# W É O VETOR QUE REPRESENTA O PONTO DE ONDE O SOM VEIO
w, residuals, rank, s = np.linalg.lstsq(A,b, rcond=None)
print(w)

[0.3987802 0.7975604 0.       ]


Calculando o resultado

In [31]:
print("Ângulo Azimutal:", radParaGrau(anguloAzimutal(w)))
print("Ângulo de Elevação:", radParaGrau(anguloElevacao(w)))

Ângulo Azimutal: 63.43494882292201
Ângulo de Elevação: 0.0


### 180 azimutal e 60 de elevação

Importando os áudios

In [32]:
mic1, freqAmostragem = librosa.load('/home/dimi/Programming/IC2019/DOA/Gravacoes/Gravacao8/180_60_mic-01.wav', sr=None, mono=True)
mic2, freqAmostragem = librosa.load('/home/dimi/Programming/IC2019/DOA/Gravacoes/Gravacao8/180_60_mic-02.wav', sr=None, mono=True)
mic3, freqAmostragem = librosa.load('/home/dimi/Programming/IC2019/DOA/Gravacoes/Gravacao8/180_60_mic-03.wav', sr=None, mono=True)
mic4, freqAmostragem = librosa.load('/home/dimi/Programming/IC2019/DOA/Gravacoes/Gravacao8/180_60_mic-04.wav', sr=None, mono=True)

Calculando o delay entre os microfones tendo o primeiro como referência

In [33]:
delay12 = verificarDelay(mic1, mic2, maxDelay=delayMax)
delay13 = verificarDelay(mic1, mic3, maxDelay=delayMax)
delay14 = verificarDelay(mic1, mic4, maxDelay=delayMax)

print("Delay entre os microfones 1 e 2 (qtd amostras):", delay12)
print("Delay entre os microfones 1 e 2 (qtd amostras):", delay13)
print("Delay entre os microfones 1 e 2 (qtd amostras):", delay14)

Delay entre os microfones 1 e 2 (qtd amostras): 0
Delay entre os microfones 1 e 2 (qtd amostras): -1
Delay entre os microfones 1 e 2 (qtd amostras): 0


Resolvendo a equação matricial com mínimos quadrados

|mic2x mic2y mic2z| |wx| |vSom.delay12|

|mic3x mic3y mic3z|.|wy|=|vSom.delay13|

|mic4x mic4y mic4z| |wz| |vSom.delay14|

In [34]:
# A É A MATRIZ DAS INCOGNITAS
A = np.array([
    coordenadasMic2,
    coordenadasMic3,
    coordenadasMic4
])

# B É O VETOR DE COEFICIENTES
b = np.array([(delay12/freqAmostragem)*340, (delay13/freqAmostragem)*340, (delay14/freqAmostragem)*340])

# W É O VETOR QUE REPRESENTA O PONTO DE ONDE O SOM VEIO
w, residuals, rank, s = np.linalg.lstsq(A,b, rcond=None)
print(w)

[-0.04430891 -0.04430891  0.        ]


Calculando o resultado

In [35]:
print("Ângulo Azimutal:", radParaGrau(anguloAzimutal(w)))
print("Ângulo de Elevação:", radParaGrau(anguloElevacao(w)))

Ângulo Azimutal: 44.999999999999986
Ângulo de Elevação: 0.0
