# DFT - Challenges
Aldo André Díaz Salazar, PhD, EE

## Objetivo
Neste Notebook iremos explorar a aplicação da DFT como algoritmo para a extração de informações relevantes presentes em sinais diversos.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import sys
sys.path.append('/mnt/g/My Drive/!UFG/01_ensino/digital-signal-processing/notebooks/lib/')
from myFourierLib import *
from myPlotLib import *

In [None]:
plt.rcParams.update({
    'figure.figsize':    (6, 2), # figure size
    'figure.facecolor':  (0.0, 0.0, 0.0, 0.0), # black with alpha = 0%
    'axes.facecolor':    (0.0, 0.0, 0.0, 0.0), # black with alpha = 0%
    'savefig.facecolor': (0.0, 0.0, 0.0, 0.0), # black  with alpha = 0%
})

In [None]:
# Carregar sinais
with open('le07_datasets.npy', 'rb') as f:
    # Challenge 1
    signal1 = np.load(f) # sinal
    n1 = np.load(f) # indices das amostras
    
    # Challenge 2
    signal2 = np.load(f) # sinal
    n2 = np.load(f) # indices das amostras
    
    # Challenge 3
    signal3 = np.load(f) # sinal
    n3 = np.load(f) # indices das amostras
    
    # Challenge 4
    signal4 = np.load(f) # sinal
    n4 = np.load(f) # indices das amostras
    fs4 = np.load(f) # frequencia de amostragem

## Challenge 1 - Mystery signal
No primeiro desafio aprenderemos a extrair informações de um sinal completamente desconhecido (não se tem conhecimento de qual é o fenômeno ou dinâmica existente por trás deste sinal).

Para isso, iremos estudar a DFT e suas componentes constituintes para determinar um ***modelo aproximado do sinal***.

In [None]:
# Challenge 1
# Plot
fig, ax = plt.subplots()
plt.plot(n1, signal1, 'r')
plt.ylabel(r'$x[n]$')

figureFormat(ax, fig)

Uhm, a simples vista percebe-se um comportamento oscilatório no sinal.

Então, comecemos olhando o espectro do sinal, especificamente, as suas componentes real e imaginária.

In [None]:
# DFT
X1 = ...

In [None]:
# Plot - Componente real
fig, ax = plt.subplots()
plt.plot(..., 'r')
plt.ylabel(r'Re{$X_1$}')

figureFormat(ax, fig)

In [None]:
# Plot - Componente imaginária
fig, ax = plt.subplots()
plt.plot(..., 'r')
plt.ylabel(r'Im{$X_1$}')

figureFormat(ax, fig)

### Perguntas
1. O que pode se interpretar a partir dos gráficos da DFT acima?
2. Quais são as informações mais notórias que o sinal carrega?
3. O que os picos no gráfico têm a dizer sobre o sinal?

###  Opcional - Desafio para pensar
Esboçe um algoritmo para calcular os picos no gráfico da DFT: $\text{Re}\{X_1\}$

In [None]:
# Valores pico
k1 = ... # <- Como poderia ser calculado automaticamente?
k2 = ... # <- Como poderia ser calculado automaticamente?

# Plot
fig, ax = plt.subplots()
plt.plot(n1, X1.real, 'r')
plt.ylabel(r'Re{$X_1$}')

# Highlight the key frequencies
plt.scatter(n1[k1], X1.real[k1], s=200, facecolors='none', edgecolors='c', lw=1.5)
plt.text(k1+35, X1.real.max()*.95, r'$k=$'+str(k1), color='lime')
plt.scatter(n1[k2], X1.real[k2], s=200, facecolors='none', edgecolors='c', lw=1.5)
plt.text(k2-160, X1.real.max()*.95, r'$k=$'+str(k2), color='lime')

figureFormat(ax, fig)

### Modelo de sinal
A partir da sua observação, encontre uma possível expressão para o sinal:

$$
x_1[n] = A_1 \cos(\omega_1 n + \phi_1) + \eta_1[n]
$$

Parâmetros:
- $A_1$: Amplitude do sinal
- $\omega_1$: Frequencia digital
- $\phi_1$: Fase
- $\eta_1$: Componente de ruído

In [None]:
# Calculo da frequencia digital do sinal
P1 = ... # Período
omega1 = ... # Frequência digital

# Modelo do sinal
A1 = ... # amplitude
phi1 = ... # fase
osc1 = ... # Componente periódica
ruido1 = ... # O que sobrar é ruído
x1 = ... # Modelo completo do sinal

fig, ax = plt.subplots(figsize=(15, 2))
plt.plot(n1, osc1, 'r')
plt.plot(n1, signal1, 'c')
figureFormat(ax, fig)

fig, ax = plt.subplots(figsize=(15, 2))
plt.plot(n1, signal1, 'r')
plt.plot(n1, x1, 'c')
figureFormat(ax, fig)

###  Opcional - Autocorrelação
Existe uma segunda forma de determinar o modelo de sinais periódicos a partir do gráfico do ***correlograma***, utilizando a [***autocorrelação***](https://en.wikipedia.org/wiki/Autocorrelation).

In [None]:
# Sua solucao aqui

## Challenge 2 - Solar spots
Neste desafio aprenderemos a determinar o período do ciclo solar a partir de observações mensais da radiação do sol.

In [None]:
N2 = len(signal2) # Comprimento do sinal

# Horizonte de observação
yearFrom = n2[0].astype('datetime64[Y]').astype(int) + 1970
yearTo = n2[-1].astype('datetime64[Y]').astype(int) + 1970

In [None]:
fig, ax = plt.subplots()
plt.plot(n2, signal2, 'r')
plt.xlabel('year')
plt.title('Monthly solar spot activity, %i to %i' % (yearFrom, yearTo))
figureFormat(ax, fig)

Desta vez, começaremos diretamente a nossa análise a partir da magnitude do espectro do sinal

- Por quê?

In [None]:
# DFT
X2 = ...

# Magnitude da DFT
X2mag = ...

# Vetor de amostras (facilita achar o índice do valor pico)
nn2 = np.arange(len(n2))

In [None]:
# Plot
fig, ax = plt.subplots()
plt.plot(nn2, X2mag, 'r')
figureFormat(ax, fig)

Observe que:

1. Aproximadamente, a partir de uma certa amostra em diante, a magnitude do espectro se torna desprezível.

Portanto, podemos limitar a saída do gráfico no eixo horizontal para uma melhor análise do valor pico.

Qual é essa amostra?

2. A frequencia zero do sinal carrega um valor muito alto.

Assim, podemos limitar os valores no eixo vertical para visualizar melhor o pico relevante.


- A partir de ambas observações, plote o espectro do sinal num gráfico novo e determine o índice do valor pico mais relevante.

In [None]:
# Plot
fig, ax = plt.subplots()
plt.plot(nn2, X2mag, 'r')

figureFormat(ax, fig)

In [None]:
# Valor pico
k = ... # <- Que possibilidades temos de encontrá-lo de maneira automática? :)

In [None]:
# Plot
fig, ax = plt.subplots()
plt.plot(nn2, X2mag, 'r')
plt.scatter(nn2[k], X2mag[k], s=200, facecolors='none', edgecolors='c', lw=1.5)
plt.text(k+5, X2mag.max()/3.8, r'main peak at $k=$'+str(k), color='lime')

figureFormat(ax, fig)

Agora sim, o câlculo da periodicidade do ciclo solar (em unidade de anos) se torna uma tarefa trivial :)

In [None]:
P2m = ... # Período em meses
P2 = ... # Período em anos

In [None]:
print('O período do ciclo solar é de aproximadamente %.f anos' % np.around(P2))

## Challenge 3 - Daily temperature
Neste desafio aprenderemos a extrair o período de um sinal de temperatura (por exemplo, da cidade de Goiânia) a partir de medições do termômetro ao longo de vários dias.

Além disso, conseguiremos estimar o modelo do sinal, assim como seus valores médio, máximo e mínimo (*a.k.a.*, ***temperature excursion***).

In [None]:
fig, ax = plt.subplots()
plt.plot(n3, signal3, 'r')
plt.ylabel('ºC')
plt.xlabel('days')

# Mostrar eixo horizontal
ax.axhline(y=0, color='lime', lw=.5)

figureFormat(ax, fig)

Notoriamente, o gráfico do sinal apresenta muitos dados (ele aparece como se fosse uma linha grossa).

Apenas para propósitos de visualização, podemos tornar o gráfico um pouco mais "limpo" fazendo um recorte do sinal.

Faça um recorte do sinal experimentando com diferentes valores de `taxa_recorte`.

In [None]:
taxa_recorte = ...

fig, ax = plt.subplots()
plt.plot(..., 'r')
plt.ylabel('ºC')
plt.xlabel('days')

# Mostrar eixo horizontal
ax.axhline(y=0, color='lime', lw=.5)

figureFormat(ax, fig)

A partir da observação do sinal, podemos deduzir o seu modelo aproximado de sinal partindo de uma oscilação:

$$
x_3[n] = A_3 \cos(\omega_3 n + \phi_3)
$$

Parâmetros:
- $A_3$: Amplitude do sinal
- $\omega_3$: Frequencia digital
- $\phi_3$: Fase

Pela nossa intuição já desenvolvida ao longo da disciplina com este tipo de sinais oscilatórios e periódicos, a nossa ferramenta inicial de análise será a DFT.

Especicamente, a magnitude da DFT!

In [None]:
# DFT
X3 = ...

# Magnitude
X3mag = ...

In [None]:
# Plot
fig, ax = plt.subplots()
plt.plot(n3, X3mag, 'r')
plt.ylabel(r'$|X_3|$')

figureFormat(ax, fig)

Para obter um gráfico de espectro "mais informativo", vamos precisar **normalizar** a saída
para assim obter dados na mesma unidade do sinal de entrada, no nosso caso, em graus Celsius

In [None]:
# Espectro normalizado
X3magn = ...

In [None]:
# Plot
fig, ax = plt.subplots()
plt.plot(n3, X3magn, 'r')
plt.ylabel(r'$|X_3| / N$ (ºC)')

figureFormat(ax, fig)

Agora sim, as unidades do eixo vertical são diretamente compatíveis com valores de temperatura :)

Como segundo passo, vamos delimitar os eixos para uma melhor observação e análise dos valores pico.

In [None]:
# Plot recortado
fig, ax = plt.subplots()
plt.plot(n3, X3magn, 'r')
plt.ylabel(r'$|X_3| / N$ (ºC)')
plt.xlim(...)

figureFormat(ax, fig)

A partir da gráfica do espectro normalizado, é possível determinar a **temperatura média**,
a qual é dada pela "frequência zero" ($k_{\text{DC}} = 0$):

$$
\frac{1}{N} X_3[0] = \frac{1}{N} \sum_{n=0}^{N-1} x[n] \cdot e^{-j\frac{2\pi}{N} \cdot n \cdot 0} \\
           = \frac{1}{N} \sum_{n=0}^{N-1} x[n]
$$

A "frequência zero" também é conhecida como:
- *offset*
- *bias* (componente contínuo do sinal)
- "*valor DC*"

In [None]:
temp_media = ... # temperatura media

In [None]:
# Figure 3
fig, ax = plt.subplots()
plt.plot(n3, X3magn, 'r')
plt.scatter(n3[0], temp_media, s=200, facecolors='none', edgecolors='y', lw=1.5)
plt.text(2, X3magn.max()*.94, r'temp. média %.2f ºC' %(np.round(X3magn.max(),1)), color='lime')
plt.ylabel('ºC')
plt.xlim(...)
# Customizing the y-axis upper limit
ax.set_ylim(top=X3magn.max()*1.1)

figureFormat(ax, fig)

Além disso, precisamos lembrar que o valor do espectro normalizado no pico, em $k = ?$, guarda relação com a amplitude do sinal oscilatório:

$$
X_3[k_{\text{pico}}] = \frac{A_3}{2}
$$

Portanto, o valor da amplitude será:

$$
A_3 = 2 X_3[k_{\text{pico}}]
$$

In [None]:
k = ... # Valor pico
A3 = ... # Amplitude do sinal (em graus Celsius)
print(r'O valor do espectro normalizado da DFT em k = %i é %.1f ºC e a amplitude do sinal é %.1f ºC' % (k, X3magn[k], A3))

In [None]:
# Figure 3
fig, ax = plt.subplots()
plt.plot(n3, X3magn, 'r')
plt.scatter(n3[0], temp_media, s=200, facecolors='none', edgecolors='y', lw=1.5)
plt.text(2, .95*X3magn.max(), r'temp. média %.2f ºC' %(np.round(X3magn.max(),1)), color='lime')
plt.scatter(n3[k], X3magn[k], s=200, facecolors='none', edgecolors='c', lw=1.5)
plt.text(k+2, X3magn.max() // 2, r'pico principal em $k = %i$' %(k), color='lime')
plt.ylabel('ºC')
plt.xlim(...)
# Customizing the y-axis upper limit
ax.set_ylim(top=X3magn.max()*1.1)

figureFormat(ax, fig)

In [None]:
# Periodo do sinal
P3 = ... # em dias

# Temperature excursion (Variabilidade)
# -------------------------------------
temp_maxima = temp_media + A3
temp_minima = temp_media - A3

print(r'Temperatura média: %.1f ºC' % temp_media)
print(r'Temperatura máxima: %.1f ºC' % temp_maxima)
print(r'Temperatura mínima: %.1f ºC' % temp_minima)
print(r'Periodicidade do sinal: %i dias (faz total sentido!!!)' % P3)
print(r'Limites de temperatura: %.1f ºC ± %.1f ºC' %(temp_media, A3))