# TMSD - Ex05 - `[escreva seu nome aqui]`

Neste exercício você vai analisar sinais por meio das funções de correlação e transformada de Fourier (FFT).

**HONESTIDADE ACADÊMICA**

Todo o trabalho feito neste curso deve ser exclusivamente seu. A colaboração de terceiros na realização dos trabalhos não é permitida.

Ver ou copiar o trabalho de outro indivíduo do curso ou retirar material de um livro, site ou outra fonte, mesmo em parte e apresentá-lo como seu próprio constitui desonestidade acadêmica, assim como mostrar ou dar a sua obra, mesmo em parte, a outro estudante. Da mesma forma, é desonestidade acadêmica fornecer ou tornar as soluções disponíveis dos trabalhos para os indivíduos que fazem ou poderão fazer este curso no futuro. Você está convidado a discutir o material do curso com os outros, a fim de melhor compreendê-lo. Você pode até discutir sobre os trabalhos com os colegas, mas você não pode compartilhar códigos, funções, projetos, tabelas, desenhos esquemáticos, mapas ou diagramas.

Você pode e deve recorrer à Web para obter referências na busca de soluções para os trabalhos, mas não por soluções definitivas para os problemas. No entanto, deve-se citar explicitamente no projeto a origem de qualquer procedimento ou técnica que você descubra fora do curso.

Todas as formas de desonestidade acadêmica são tratadas com rigor.


**Instruções:**
- Use a versão Python 3.x
- Evite sempre usar usar laços `for` e `while`, fazer contas no formato vetorial é sempre mais rápido.
- Não apague os comentários que já existem nas células de código. Mas é claro que você pode adicionar outros comentários.

**Objetivos**
- Implementar e analisar correlação entre sinais
- Implementar função de autocorrelação
- Analisar sinais no domínio da frequência

# Funções de correlação

A definição de correlação não é única. Consideraremos uma forma implementável para vetores finitos que representam os sinais que queremos analisar. Considere dois vetores de mesma dimensão $u,y\in\mathbb{R}^N$, em que $x\equiv [x(0) \: x(1) \: x(2) \: \cdots \: x(N)]^\top$ e $y\equiv [y(0) \: y(1) \: y(2) \: \cdots \: y(N)]^\top$.

Para cálculo da correlação entre esses sinais, é possível usar:

\begin{align}
r_{uy} (k) = \color{blue}{ \frac{1}{\lVert u \rVert \lVert y \rVert}} \sum_{n=-N}^{N} u(n+k) y(n) , \label{eq1}\tag{1}
\end{align}

em que $\lVert . \rVert$ denota a norma $L_2$ de cada vetor. Ao tratarmos da função de correlação, a variável independente $k$ é chamada de *atraso* já que ela denota o atraso de um sinal com relação ao outro no somatório.

***Autocorrelação***. Quando calculamos a correlação \eqref{eq1} de um sinal $u(k)$ com ele mesmo $y(k)\equiv u(k)$, chamamos de *autocorrelação*.

***Normalização***. O termo destacado de azul em \eqref{eq1} tem o papel de normalizar o vetor de correlação cruzada $r_{uy}$, de modo que, se $u(n+k)=y(n)\forall -N\le n\le N$, então $\lVert r_{uy}\rVert=1$. Isto é, o fator de normalização garante que a correlação unitária acontecerá quando os sinais forem idênticos a menos de uma constante.

***Janelamento***. Vale ressaltar também que, a rigor, em \eqref{eq1} é impossível calcular o valor de $u(n+k)$ quando $n+k>N$ ou $n+k<0$. Para viabilizar esses cálculos, faz-se um janelamento do sinal, considerando que $u(k)=0, \forall k<0, \forall k>N$. A mesma consideração é feita para $y$, em que $y(k)=0, \forall k<0, \forall k>N$.

O efeito do janelamento pode ser facilmente visualizado ao fazer a correlação entre dois sinais idênticos (autocorrelação) e periódicos. Se $u(k)$ é periódico com período $N_0$, por definição, $u(k)=u(k+N_0), \forall k$. Assim, poderíamos esperar que a função de correlação \eqref{eq1} de $u(k)$ com $y(k)\equiv u(k)$, fosse também um sinal periódico com período $N_0$, já que, a cada $N_0$, faríamos a correlação de dois sinais idênticos. Contudo, à rigor, na prática $u(k)$ não é periódico, pois é um sinal de duração finita e a condição de periodicidade não vale para todo valor de amostra $k$ (efeito janelamento). Decorre que $r_{uy}(k)$ também não será periódico, em que o efeito de janelamento pode ser percebido verificando-se que os picos de correlação se reduzem à medida que o valor do atraso $k$ se aproximam das bordas.

***Efeito da média***. Considere um sinal $u(k)$, de média nula, e outro sinal $y(k) = u(k)+1$, cuja média temporal é igual a um. Note que, neste caso, os sinais são idênticos a menos de uma constante. Em análise de sinais, seria interessante que a função de correlação intentifique a semelhança entre esses sinais, ou seja, que gostaríamos que $r_{uy} (0)=1$. Contudo, se calcularmos a correlação cruzada entre esses sinais para o atraso nulo, $k=0$, temos:
\begin{align}
r_{uy} (0) &= \frac{1}{\lVert u \rVert \lVert u+1 \rVert} \sum_{n=-N}^{N} u(n) [u(n)+1] , \\
&= \frac{1}{\lVert u \rVert \lVert u+1 \rVert} \sum_{n=-N}^{N} u^2(n) + \frac{1}{\lVert u \rVert \lVert u+1 \rVert} \sum_{n=-N}^{N} u(n) ,\\
&= \frac{\lVert u \rVert^2}{\lVert u \rVert \lVert u+1 \rVert} ,
\end{align}

em que nas últimas linhas usou-se o fato de que a média de $u(k)$ é nula, i.e., $\frac{1}{N} \sum^N_n u(n) = 0 \therefore \sum^N_n u(n) = 0$ e que $\sum_{n=-N}^{N} u^2(n)=\lVert u \rVert^2$. Então tem-se:

\begin{align}
r_{uy} (0) &= \frac{\lVert u \rVert}{\lVert u+1 \rVert} .
\end{align}

Note que $r_{uy} (0) \neq 1$ para o caso citado. Isso dificulta a interpretação da função de correlação para avaliar similaridade entre sinais. Desta forma, é comum retirar a média dos sinais $u(k)$ e $y(k)$ antes de calcular \eqref{eq1}.


***Vetor de atrasos***. Para o cálculo do somatório, parte na cor preta ao lado direito de \eqref{eq1}, é possível usar a função `np.correlate()` que, usada com vetores de mesmo tamanho, o vetor de atrasos em pode ser calculado como:
- `np.arange(-N+1, N)`: atraso em *amostras* $k$
- `np.arange(-N+1, N)*T`: atraso no *tempo amostrado* $kT$



Crie uma função que calcule a correlação normalizada, sem efeito de média, com os seguintes parâmetros:
1. Nome da função:
  + `corr(u, y=None, T=1)`
1. Entrada:
  + `u`: vetor representando o primeiro sinal
  + `y`: vetor representando o segundo sinal (se y=None, faça autocorrelação de `u`)
  + `T`: período de amostragem
1. Saída:
  + `lags`: vetor de atrasos calculado no *tempo amostrado*
  + `ruy`: vetor com os respectivos valores $r_{uy}(k)$ da função de correlação

Para os gráficos use `plt.figure(figsize=(8,1.5))` para especificar esse tamanho de figura.

In [15]:
### SEU CÓDIGO COMEÇA AQUI ###
def corr():
    return None

### FIM DO CÓDIGO ###

**Saída esperada**:
- Nenhuma saída esperada (mas teste a sua função!)
___

Use a função criada para calcular a correlação entre os sinais:
\begin{align}
 u(t) &= \cos(6\pi t) - 0,4 \cos(18\pi t) - 0,1 \cos(72\pi t) + 4 + e(t), \\
 y(t) &= \cos(6\pi t) - 0,4 \cos(36 t) - 0,1 \cos(140 t) + 1 + e(t).
\end{align}

Sendo $e(t)\sim \mathcal{N}(0;0,2)$ um ruído branco.

Mostre o gráfico de correlação cruzada $r_{uy}$ e autocorrelações $r_{u}$ e $r_{y}$.

In [19]:
### SEU CÓDIGO COMEÇA AQUI ###
None
### FIM DO CÓDIGO ###

**Saída esperada**:
- Gráfico 1 correlação cruzada entre $u$ e $y$
- Gráfico 2 autocorrelação de $u$
- Gráfico 3 autocorrelação de $y$
___

# Análise de sinais no domínio da frequência

Para analisar sinais de tempo contínuo usando ferramenta computacional é necessário trabalhar com sua versão *amostrada* e *finita*. Para isso, a série de Fourier no pacote `scipy.fft.fft` (https://docs.scipy.org/doc/scipy/reference/tutorial/fft.html) é implementada por:
$$ \tilde{X}[k]=\sum_{n=\langle N \rangle} \tilde{x}[n] e^{-jk(2\pi/N)n} .$$

Use a função `scipy.fft.fft` para o sinal abaixo:
$$x(t) = \mathrm{sen}(4\pi t) + 0,7\mathrm{cos}(6\pi t) + 0,2.$$

Note que o sinal é composto por duas frequências básicas, uma em $4\pi$ rad/s ($2$Hz) e outra em $6\pi$ rad/s ($3$Hz), e uma constante somada. A amplitude da primeira componente é unitária e a da segunda componente é $0,7$.

Para que a FFT seja melhor interpretável, esse sinal deve ser representado no domínio da frequência por um pico unitário em $4\pi$ rad/s ($2$Hz), um pico de amplitude $0,7$ em $6\pi$ rad/s ($3$Hz) e um pico de amplitude $0,2$ na frequência zero, representando a constante somada no sinal.

O sinal ainda está descrito no domínio do tempo contínuo. Use um período de amostragem de $T=0,1$s para representá-lo no tempo discreto, como um vetor. Escolha apropriadamente o tamanho do vetor a ser analisado e veja o efeito na representação no domínio da frequência. *Cuidado! Vetores muito grandes podem deixar o código muito lento!!*

1. Defina os parâmetros do sinal nas seguintes variáveis:
   - `N` (tamanho do vetor do sinal)
   - `n` (vetor com amostras de tempo correspondentes a $nT$)
   - `T` (período de amostragem utilizado)
- Implemente o sinal amostrado e mostre-o num gráfico (não se esqueça de nomear os eixos!)
- Use a função criada para obter o sinal no domínio da frequência $X[k]$
- Implemente as transformações necessárias no sinal de modo a exibir toda a potência do sinal no eixo positivo e não mostrar "repetições espelhadas" do espectro
- Implemente o eixo de frequências em Hertz (`omg_Hz`) e também em rad/s (`omg_rad`)
- Faça um gráfico do módulo do sinal no domínio da frequência com eixo horizontal em Hz (confira seus resultados)
- Faça um segundo gráfico do módulo do sinal **em dB** com eixo horizontal em escala logaritmica na unidade rad/s (confira seus resultados)

In [17]:
### SEU CÓDIGO COMEÇA AQUI ###
N = None #tamanho do sinal
n = None #vetor tempo
T = None #período de amostragem

### FIM DO CÓDIGO ###

**Saída esperada**:
- Gráfico 1 com pico unitário em $2$Hz, um pico de amplitude $0,7$ em $3$Hz e um pico de amplitude $0,2$ em zero
- Gráfico 2, em dB, com pico unitário em $4\pi$ rad/s, um pico de amplitude $0,7$ em $6\pi$ rad/s
___

## Completando com zeros (*zero-padding*)

Agora o objetivo é usar elevar o número de pontos no domínio da frequência usando zero-padding.

1. Usando o mesmo sinal $x(t)$, com um baixo valor de $N$ (e.g., $N=40$), calcule a FFT do sinal usando a função da biblioteca scipy
- Use o recurso de *zero padding* da função, especificando $M=200$ amostras para serem calculadas na FFT
- Faça as transformações apropriadas no sinal, de modo a obter o mesmo resultado esperado da função implementada. *Atente-se para o fato de que o sinal "original" tem $N=40$ amostras, mas a FFT é calculada com $M=200$ amostras. Para fazer a transformação de escala no sinal, deve ser usado $N$ (do sinal original) e não $M$.*
- Faça um gráfico do sinal no domínio da frequência representando módulo e frequência em Hz
- Faça um gráfico do sinal no domínio da frequência representando a fase do sinal em graus (use `np.angle` com parâmetro `deg=True`)

In [16]:
### SEU CÓDIGO COMEÇA AQUI ### (≈ 15 linhas de código)
None
### FIM DO CÓDIGO ###

**Saída esperada**:
- Gráfico de módulo do sinal (semelhante ao da atividade anterior, mas com efeitos do zero-padding)
- Gráfico de fase do sinal
___

Fim...
(Acabou rápido? Faça o desafio opcional abaixo! Se não fizer, tudo bem)


# Desafio! (opcional)

Faça a autocorrelação e a FFT de um sinal real de ECG (eletrocardiograma) de uma pessoa saudável e uma pessoa com alguma anomalia. Acesse os dados neste repositório:
https://github.com/iizukak/ecg-htm

Neste outro repositório tem uma explicação sobre o sinal ECG: https://github.com/mozanunal/digital-filtering-of-ecg-signal

É possível distinguir o ECG normal do anormal pela FFT do sinal?

In [8]:
### SEU CÓDIGO COMEÇA AQUI ###

### FIM DO CÓDIGO ###

Fim (ufa!)