Notebook elaborado para estudar algumas características básicas da análise de dados GPR adquiridos em modo de afastamento constante.
Criado para a disciplina Geofísica II da Universidade Federal de Uberlândia.
O uso e a reprodução são livres para fins educacionais, pede-se apenas a citação da fonte.

[![License: GPL v3](https://img.shields.io/badge/License-GPLv3-blue.svg)](https://www.gnu.org/licenses/gpl-3.0)

Esta demonstração utiliza dados adquiridos sobre o Sítio Controlado de Geofísica Rasa do Instituto de Geofísica, Astronomia e Ciências Atmosféricas da Universidade de São Paulo (BORGES, 2007) e adquiridos sobre sedimentos costeiros da região de Jaguaruna em Santa Catarina (FORNARI, 2010).


Prof. Dr. Emerson Rodrigo Almeida<br>
Universidade Federal de Uberlândia<br>
Instituto de Geografia - Curso de Geologia<br>
emerson.almeida@ufu.br<br>

<p>&nbsp;</p>
Última modificação: 22/05/2021

---
### Referências

BORGES, W. R. **Caracterização geofísica de alvos rasos com aplicações no planejamento urbano e meio ambiente: estudo sobre o sítio controlado do IAG/USP**. Tese de Doutorado. São Paulo: Instituto de Astronomia, Geofísica e Ciências Atmosféricas, Universidade de São Paulo, 2010.

FORNARI, M. **Evolução sedimentar holocênica da retrobarreira na região de Jaguaruna-Laguna, Santa Catarina, Brasil**. Tese de Doutorado. São Paulo: Instituto de Geociências, Universidade de São Paulo, 2010.

---

<p>&nbsp;</p>

# Instruções iniciais

Neste notebook você irá trabalhar as ferramentas de ganho e de filtragem, fundamentais tanto no processamento de dados GPR quanto no processmamento de dados sísmicos. Para isto leia atentamente as instruções apresentadas antes de cada célula e execute-as uma a uma, para acompanhar o processo corretamente.

Não se preocupe em compreender o código em si, não é obrigatório que você conheça a programação para obter e interpretar os resultados da demonstração. Mesmo assim, sinta-se livre caso queira perguntar qualquer coisa para aprender mais sobre o código e sua elaboração.

<p>&nbsp;</p>

### Passo 01 - Preparação

Primeiramente vamos preparar o ambiente para a execução da demonstração. Importe os módulos e defina as funções que serão utilizadas no decorrer da demonstração. A célula abaixo contém as funções utilizadas nos cálculos e as funções utilizadas para gerar as figuras. Execute-a uma vez antes de executar qualquer outra parte do código e **não altere nada no código apresentado na célula** para não criar problemas na execução do código. Você pode executar o código na célula clicando sobre ela e em seguida clicando no botão **RUN** na barra do Jupyter Notebook ou pressionando as teclas **SHIFT+ENTER** no seu teclado. Se você preferir executar este notebook localmente, no seu computador, então exclua a célula abaixo para não afetar a sua instalação.

<p>&nbsp;</p>

**Importante!** Nem todas as células irão retornar algum tipo de mensagem ou figura após a execução. Isto é normal e não significa que a execução tenha falhado. Perceba o símbolo **In [   ]:** próximo ao canto superior esquerdo de cada célula. Ao iniciar a execução de uma delas você verá um asterisco ($*$) aparecer dentro dos colchetes. Você saberá que a execução ocorreu sem problemas quando o $*$ dentro dos colchetes for substituído por um número e nenhuma mensagem de erro aparecer abaixo da célula executada.

In [None]:
%matplotlib inline

import numpy as np
import matplotlib.pyplot as plt
from matplotlib import gridspec
from scipy.signal import detrend
from scipy.interpolate import interp1d
from scipy.fftpack import fft, fftfreq, ifft


class radargrama():
    def __init__(self, fname, ruido=None):
    
        tabela = np.loadtxt(fname)
        self.nome = fname
        self.eixo_x = np.unique(tabela[:, 0])
        self.eixo_t = np.unique(tabela[:, 1]) * 1e-9
        self.dados = detrend(np.reshape(tabela[:, 2], [len(self.eixo_x), len(self.eixo_t)]).T, axis=0)
        self.n_amostras, self.n_tracos = np.shape(self.dados)
   
        if ruido is not None:
            # quando é fornecida uma frequência de ruído de referência são inseridas 500 componentes de
            # frequências aleatórias em torno da frequência de referência com amplitude igual a 3% da
            # amplitude RMS de cada traço.
        
            n_freqs_ruido = 500

            # espectro de ruido com largura de banda igual à metade da frequencia central de referência para o ruído
            fmin, fmax = [ruido-(ruido/4), ruido+(ruido/4)]
            freqs = np.random.uniform(fmin, fmax, n_freqs_ruido)
            
            # amplitude de ruído igual a 3% da amplitude rms de cada traço
            amp_rms = np.sqrt(np.mean(self.dados**2, axis=0))
            amps = amp_rms * 0.03
            
            sujeira = np.zeros(np.shape(self.dados))

            for t, a in enumerate(amps):
                for f in freqs:
                    sujeira[:, t] = sujeira[:, t] + (a * np.sin(2*np.pi*f * self.eixo_t))

            self.dados = self.dados + sujeira
    
        self.eixo_f, self.espectro = calcula_espectro(self.eixo_t, self.dados)  # retorna frequencias positivas e negativas


    def ganho_exp(self, tmin=0.0, a=1.0, b=1.0, x=0.0, salva=False):
        
        it = np.abs(self.eixo_t - tmin).argmin()
        
        g_t = (a * np.exp(b * self.eixo_t[it:] * 1e7)).reshape([-1,1]) + 1
        g_t = np.repeat(g_t, self.n_tracos, axis=1)
        self.dados_aux = np.concatenate((self.dados[:it, :], self.dados[it:, :] * g_t), axis=0)
            
        if not salva:
            self.plota_aux(x, f_aux=g_t[:, 0])
            
        else:
            self.dados = self.dados_aux
            self.eixo_f, self.espectro = calcula_espectro(self.eixo_t, self.dados)  # retorna frequencias positivas e negativas
            self.plota_dados(x)
        
        
    def ganho_linear(self, tmin=0.0, a=1.0, x=0.0, salva=False):
        
        it = np.abs(self.eixo_t - tmin).argmin()
        
        g_aux = [0.0, a]
        t_aux = [self.eixo_t[it], self.eixo_t[-1]]

        gf = interp1d(t_aux, g_aux)
        g_t = gf(self.eixo_t[it:]).reshape([-1,1]) + 1
        g_t = np.repeat(g_t, self.n_tracos, axis=1)
        self.dados_aux = np.concatenate((self.dados[:it, :], self.dados[it:, :] * g_t), axis=0)
            
        if not salva:
            self.plota_aux(x, f_aux=g_t[:, 0])
            
        else:
            self.dados = self.dados_aux
            self.eixo_f, self.espectro = calcula_espectro(self.eixo_t, self.dados)  # retorna frequencias positivas e negativas
            self.plota_dados(x)
            
            
    def ganho_agc(self, tw, rms=1.0, x=0.0, salva=False):
        """
        AGC instantâneo
        
        YILMAZ, O. Seismic Data Analysis, Volume I. Tulsa: Society of Exploration Geophysicists, 2008.
        """
        
        dados_norm = self.dados / np.max(np.abs(self.dados))
        nw = np.abs(self.eixo_t - (self.eixo_t[0] + tw)).argmin()   # numero de amostras dentro da janela de tempo
        g_t = np.zeros(np.shape(dados_norm))

        for w in range(nw, self.n_amostras):
            w0 = w - nw
            g_t[w0:w+1, :] = rms / np.mean(np.abs(dados_norm[w0:w+1, :]), axis=0)
        
        self.dados_aux = self.dados * g_t
        
        if not salva:
            ix = np.abs(self.eixo_x - x).argmin()
            self.plota_aux(x, f_aux=g_t[:, ix])
            
        else:
            self.dados = self.dados_aux
            self.eixo_f, self.espectro = calcula_espectro(self.eixo_t, self.dados)  # retorna frequencias positivas e negativas
            self.plota_dados(x)

            
    def passa_banda(self, f_c, x=None, salva=False):
        
        self.dados_aux = executa_filtragem(self.espectro, f_c, self.eixo_f)

        if not salva:
            # self.plota_dados(x)
            self.plota_aux(x)
            
        else:
            # self.plota_dados(x)
            self.dados = self.dados_aux
            self.eixo_f, self.espectro = calcula_espectro(self.eixo_t, self.dados)  # retorna frequencias positivas e negativas
            self.plota_dados(x)

            
    def ajusta_hiperbole(self, v, xc, t0, x=0.0, r=0.5, dx=0.5):
        """
        Ristic, A. R.; Petrovacki, D.; Govedarica, M. A new method to simultaneously estimate the radius 
        of a cylindrical object and the wave propagation velocity from GPR data. Computers & Geosciences,
        v. 35, n. 8, p. 1620-1630, 2009.
        """

        if xc < np.min(self.eixo_x) or xc > np.max(self.eixo_x):
            xc = self.eixo_x[self.n_tracos//2]
        
        v = v * 1e9
        
        x1 = np.abs(self.eixo_x - (xc-dx)).argmin()
        x2 = np.abs(self.eixo_x - (xc+dx)).argmin()
        xi = self.eixo_x[x1:x2+1]
        ti = (2/v) * (np.sqrt(((v*t0)/2 + r)**2 + (xi - xc)**2) - r)
        
        h = {'xx': xi,
             'tt': ti}
        
        self.plota_dados(x, hiperbole=h)
        
            
            
    def tempo_profundidade(self, eps, x=0.0):
        self.eixo_z = ((3e8/np.sqrt(eps)) * self.eixo_t) / 2
        self.plota_profundidade(x)
            
            
    def plota_dados(self, x=None, hiperbole=None):
        
        if x and x <= np.max(self.eixo_x) and x >= np.min(self.eixo_x):
            i = np.abs(self.eixo_x - x).argmin()
            
        elif x and x > np.max(self.eixo_x):
            x = self.eixo_x[-1]
            i = -1
        
        elif x and x < np.min(self.eixo_x):
            x = self.eixo_x[0]
            i = 0
        
        else:
            x = self.eixo_x[0]
            i = 0
        
        proporcao = (np.max(self.eixo_x) - np.min(self.eixo_x)) / (1e9*(np.max(self.eixo_t) - np.min(self.eixo_t)))
        
        fig = plt.figure(figsize=(15, 7))
        gs = gridspec.GridSpec(1, 2, width_ratios=[3, 1])
        ax0 = plt.subplot(gs[0])
        ax0.imshow(self.dados / np.max(np.abs(self.dados)), extent=[self.eixo_x[0], self.eixo_x[-1], \
                                                                    self.eixo_t[-1]*1e9, self.eixo_t[0]*1e9], cmap='bwr_r')
        ax0.plot([x, x], [np.min(self.eixo_t)*1e9, np.max(self.eixo_t)*1e9], '--k', linewidth=1.0)
        
        if hiperbole is not None:
            ax0.plot(hiperbole['xx'], hiperbole['tt']*1e9, '-k')
        
        ax0.set_title(self.nome, fontsize=14)
        ax0.set_xlabel('Distância (m)', fontsize=14)
        ax0.set_ylabel('Tempo (ns)', fontsize=14)
        ax0.set_aspect('auto')
        ax0.grid()
        
        ax1 = plt.subplot(gs[1])
        ax1.plot(self.dados[:, i] / np.max(np.abs(self.dados[:, i])), self.eixo_t*1e9)
        ax1.set_title('Traço em ' + str(x) + ' m', fontsize=14)
        ax1.set_xlabel('Amplitude normalizada', fontsize=14)
        ax1.set_ylabel('Tempo (ns)', fontsize=14)
        ax1.grid()
        ax1.set_ylim([np.min(self.eixo_t)*1e9, np.max(self.eixo_t)*1e9])
        ax1.set_xlim([-1.2, 1.2])
        ax1.invert_yaxis()
        
        plt.tight_layout()
        plt.show()
        
        

    def plota_aux(self, x=None, f_aux=None):

        if x and x <= np.max(self.eixo_x) and x >= np.min(self.eixo_x):
            i = np.abs(self.eixo_x - x).argmin()
            
        elif x and x > np.max(self.eixo_x):
            x = self.eixo_x[-1]
            i = -1
        
        elif x and x < np.min(self.eixo_x):
            x = self.eixo_x[0]
            i = 0
        
        else:
            x = self.eixo_x[0]
            i = 0

        proporcao = (np.max(self.eixo_x) - np.min(self.eixo_x)) / (1e9*(np.max(self.eixo_t) - np.min(self.eixo_t)))

        fig = plt.figure(figsize=(15, 7))
        gs = gridspec.GridSpec(1, 2, width_ratios=[3, 1])
        ax0 = plt.subplot(gs[0])
        ax0.imshow(self.dados_aux / np.max(np.abs(self.dados_aux)), extent=[self.eixo_x[0], self.eixo_x[-1], \
                                                                    self.eixo_t[-1]*1e9, self.eixo_t[0]*1e9], cmap='bwr_r')
        ax0.plot([x, x], [np.min(self.eixo_t)*1e9, np.max(self.eixo_t)*1e9], '--k', linewidth=1.0)
        ax0.set_title(self.nome + ' (temporário)', fontsize=14)
        ax0.set_xlabel('Distância (m)', fontsize=14)
        ax0.set_ylabel('Tempo (ns)', fontsize=14)
        ax0.set_aspect('auto')
        ax0.grid()

        ax1 = plt.subplot(gs[1])
        ax1.plot(self.dados_aux[:, i] / np.max(np.abs(self.dados_aux[:, i])), self.eixo_t*1e9, label='traço após\no ganho')
        
        
        if f_aux is not None:
            ax1.plot(f_aux/np.max(f_aux), self.eixo_t[(len(self.eixo_t)-len(f_aux)):]*1e9, '-r', label='função de ganho\naplicada')
            ax1.legend(loc='lower left', fontsize=12)
        
        
        ax1.set_title('Traço em ' + str(x) + ' m', fontsize=14)
        ax1.set_xlabel('Amplitude normalizada', fontsize=14)
        ax1.set_ylabel('Tempo (ns)', fontsize=14)
        ax1.grid()
        ax1.set_ylim([np.min(self.eixo_t)*1e9, np.max(self.eixo_t)*1e9])
        ax1.set_xlim([-1.2, 1.2])
        ax1.invert_yaxis()

        plt.tight_layout()
        plt.show()
            

    def plota_espectro(self):
        n_samples = self.n_amostras       # vai ser o mesmo número de amostras do sinal porque a fft não usou zeros adicionais

        nf_positivas = round(n_samples / 2) + 1     # número de frequências positivas
        amplitudes = (2 / n_samples) * np.abs(self.espectro[:nf_positivas])
        frequencias = self.eixo_f[:nf_positivas] * 1e-6

        fig, ax = plt.subplots(figsize=(15,5))
        ax.plot(frequencias, np.mean(amplitudes, axis=1))
        ax.set_xlabel('Frequência (MHz)', fontsize=14)
        ax.set_ylabel('Amplitude (ua)', fontsize=14)
        ax.set_xlim([0, np.max(frequencias)])
        ax.set_ylim([0, np.max(np.mean(amplitudes, axis=1))*1.05])
        ax.set_title("Espectro de amplitudes do sinal original", fontsize=14)
        ax.grid()
        
    
    def plota_filtragem(self, f_c):
        """
        Apenas plota a representação da seleção de frequências com o filtro sobre a parte
        positiva do espectro, porém não executa a filtragem propriamente dita    
        """

        n_samples = self.n_amostras       # vai ser o mesmo número de amostras do sinal porque a fft não usou zeros adicionais
        nf_positivas = round(n_samples / 2) + 1     # número de frequências positivas
        amplitudes = (2 / n_samples) * np.abs(self.espectro[:nf_positivas])
        pos_ff = self.eixo_f[:nf_positivas] * 1e-6

        filtro = gera_filtro(f_c, self.eixo_f)
        escala_filtro = np.max(np.mean(amplitudes, axis=1)) + 0.05 * np.max(np.mean(amplitudes, axis=1))   # escala gráfica para plotar o contorno do filtro

        fig, ax = plt.subplots(nrows=2,ncols=1,figsize=(13,7))
        ax[0].plot(pos_ff, np.mean(amplitudes, axis=1))
        ax[0].plot(pos_ff, filtro[:nf_positivas] * escala_filtro, '--r')
        ax[0].set_xlabel('Frequência (MHz)', fontsize=14)
        ax[0].set_ylabel('Amplitude (ua)', fontsize=14)
        ax[0].set_xlim([0, np.max(pos_ff)])
        ax[0].set_ylim([0, np.max(np.mean(amplitudes, axis=1))*1.1])
        ax[0].set_title("Filtro passa-banda sobre o espectro", fontsize=14)
        ax[0].grid()

        ax[1].plot(pos_ff, np.mean(amplitudes, axis=1) * filtro[:nf_positivas])
        ax[1].set_xlabel('Frequência (MHz)', fontsize=14)
        ax[1].set_ylabel('Amplitude (ua)', fontsize=14)
        ax[1].set_xlim([0, np.max(pos_ff)])
        ax[1].set_ylim([0, np.max(np.mean(amplitudes, axis=1))*1.1])
        ax[1].set_title("Frequências remanescentes após a filtragem", fontsize=14)
        ax[1].grid()

        plt.tight_layout()
        
            
    def plota_profundidade(self, x=None):
        
        if x and x <= np.max(self.eixo_x) and x >= np.min(self.eixo_x):
            i = np.abs(self.eixo_x - x).argmin()
            
        elif x and x > np.max(self.eixo_x):
            x = self.eixo_x[-1]
            i = -1
        
        elif x and x < np.min(self.eixo_x):
            x = self.eixo_x[0]
            i = 0
        
        elif not x:
            x = self.eixo_x[0]
            i = 0
        
        proporcao = (np.max(self.eixo_x) - np.min(self.eixo_x)) / (np.max(self.eixo_z) - np.min(self.eixo_z))
        
        fig = plt.figure(figsize=(15, 7))
        gs = gridspec.GridSpec(1, 2, width_ratios=[3, 1])
        ax0 = plt.subplot(gs[0])
        ax0.imshow(self.dados / np.max(np.abs(self.dados)), extent=[self.eixo_x[0], self.eixo_x[-1], \
                                                                    self.eixo_z[-1], self.eixo_z[0]], cmap='bwr_r')
        ax0.plot([x, x], [np.min(self.eixo_z), np.max(self.eixo_z)], '--k', linewidth=1.0)
        ax0.set_title(self.nome + ' (Não migrado)', fontsize=14)
        ax0.set_xlabel('Distância (m)', fontsize=14)
        ax0.set_ylabel('Profundidade (m)', fontsize=14)
        ax0.set_aspect('auto')
        ax0.grid()
        
        ax1 = plt.subplot(gs[1])
        ax1.plot(self.dados[:, i] / np.max(np.abs(self.dados[:, i])), self.eixo_z)
        ax1.set_title('Traço em ' + str(x) + ' m', fontsize=14)
        ax1.set_xlabel('Amplitude normalizada', fontsize=14)
        ax1.set_ylabel('Profundidade (m)', fontsize=14)
        ax1.grid()
        ax1.set_ylim([np.min(self.eixo_z), np.max(self.eixo_z)])
        ax1.set_xlim([-1.2, 1.2])
        ax1.invert_yaxis()
        
        plt.tight_layout()
        plt.show()
            
            
def calcula_espectro(tt, ss):
    
    dt = tt[1] - tt[0]
    n_amostras = len(ss)   # considera o numero de amostras e não uma potência de 2

    espectro = fft(ss, axis=0, n=n_amostras)
    ff = fftfreq(n_amostras, dt)
    
    return ff, espectro


def gera_filtro(f_c, ff):
    i_max_freq = np.abs(ff-np.max(ff)).argmin()   # indice da máxima frequência positiva
    delta_rampa = ff[1] - ff[0]     # a largura das rampas é de apenas 1 delta_f

    amp_caixa = [0, 0, 1, 1, 0, 0]                      # amplitudes da caixa do filtro na parte positiva do espectro
    f_rampa_sub = f_c[0] - delta_rampa                                # frequência no início da rampa do filtro
    f_rampa_desc = f_c[1] + delta_rampa                               # frequência no fim da rampa do filtro
    f_caixa_pos = np.array([ff[0], f_rampa_sub, f_c[0], f_c[1], \
                            f_rampa_desc, np.max(ff)])                # caixa para a parte positiva do espectro

    # espelhamento da caixa na parte positiva do espectro
    f_caixa_neg = np.flip(-1 * f_caixa_pos)   # caixa para a parte negativa do espectro
    f_caixa_neg[-1] = ff[-1]
    f_caixa_neg[0] = ff[i_max_freq+1]

    # interpolação das funções caixa para as frequências do espectro
    caixa_pos = interp1d(f_caixa_pos, amp_caixa, kind='linear')
    caixa_neg = interp1d(f_caixa_neg, np.flip(amp_caixa), kind='linear')

    return np.concatenate([caixa_pos(ff[:i_max_freq+1]), caixa_neg(ff[i_max_freq+1:])], axis=0)


def executa_filtragem(espec, f_c, ff):
    filtro = gera_filtro(f_c, ff)
    filtro = np.reshape(filtro, [-1,1])
    filtro = np.repeat(filtro, np.shape(espec)[1], axis=1)
    
    return np.real(ifft(espec * filtro, axis=0))

        
def showspec(ff, espec):
    n_samples = np.shape(espec)[0]       # vai ser o mesmo número de amostras do sinal porque a fft não usou zeros adicionais

    nf_positivas = round(n_samples / 2) + 1     # número de frequências positivas
    amplitudes = (2 / n_samples) * np.abs(espec[:nf_positivas])
    frequencias = ff[:nf_positivas]
    
    fig, ax = plt.subplots(figsize=(15,5))
    ax.plot(frequencias, np.mean(amplitudes, axis=1))
    ax.set_xlabel('Frequência (MHz)', fontsize=14)
    ax.set_ylabel('Amplitude (ua)', fontsize=14)
    ax.set_xlim([0, np.max(frequencias)/4])
    ax.set_ylim([0, np.max(np.mean(amplitudes, axis=1))*1.05])
    ax.set_title("Espectro de amplitudes do sinal original", fontsize=14)
    ax.grid()

# Passo 02 - Importação dos dados

Neste passo você irá carregar os dados brutos que serão trabalhados. Há três opções de dados para você utilizar:

- **270_cabos.dat**: dados adquiridos com uma antena de 270 MHz com distância de 2 cm entre traços sobre um conjunto de cabos elétricos;
- **270_tubos.dat**: dados adquiridos com uma antena de 270 MHz com distância de 2 cm entre traços sobre um conjunto de dutos metálicos;
- **200_SC.dat**: dados adquiridos com uma antena de 200 MHz com distância de 10 cm entre traços sobre sedimentos costeiros.

O arquivo de dado pode ser selecionado escolhendo-se um dos nomes de arquivo em negrito e inserindo-o (incluindo a extensão '.dat') na primeira linha da célula abaixo. É possível contaminar o dado com ruído em uma determinada faixa de frequências atribuindo-se uma frequência de referência (em Hz) para a variável $ruido$ na segunda linha, mas você não fará isso neste momento.

Insira o arquivo '**270_cabos.dat**' no lugar do texto '*nome*' da célula abaixo e execute-a para carregar o arquivo de dados. Coloque o nome do arquivo sempre entre aspas simples.

In [None]:
arquivo = 'nome'
dados = radargrama(arquivo, ruido=0.0e6)
dados.plota_dados(x=0.0)

Na terceira linha desta célula de código acima da figura é possível atribuir um valor numérico à variável $x$ entre parêntesis. Este valor numérico corresponde a uma posição no radargrama (figura à esquerda) indicada por uma linha tracejada preta. O traço adquirido sobre esta posição é mostrado individualmente na figura à direita, assim você pode modificar este valor numérico como quiser para observar as características dos diferentes traços que compõem o radargrama. Altere este valor e verifique as características do sinal nas posições em que há hipérboles e nas posições em que não há nenhuma. Se o valor de $x$ estiver fora dos limites do radargrama a imagem exibirá automaticamente o traço correspondente a uma das extremidades do perfil.

# Passo 03 - Aplicação de ganho aos dados

Observe que os dados carregados no **Passo 02** apresentam informações muito mais claras na sua porção superior do que na sua porção inferior. Este efeito é causado pela atenuação do sinal conforme este se propaga a maiores profundidades em função da condutividade elétrica do meio geológico. Para compensar esta atenuação é necessário aplicar um *ganho* aos dados, isto é, aplicar um fator multiplicador a trechos do sinal de forma que a amplitude registrada torne as feições de interesse mais claramente visíveis na imagem. Estes valores são aplicados a cada amostra de sinal de cada traço no eixo de tempo. Existem diversos tipos de ganho que podem ser aplicados a um sinal, porém aqui você irá ver apenas os três principais: **ganho linear**, **ganho exponencial** e **ganho AGC**.

### Ganho linear
Corresponde a uma função do tipo $a t$ estritamente crescente, assumindo o valor igual a zero no tempo mínimo, o valor máximo $a$ no tempo final do registro e valores intermediários com uma distribuição linear entre estes dois tempos.

A célula abaixo apresenta este tipo de ganho. A variável $a$ representa o fator multiplicador máximo do ganho, a variável $x$ seleciona um traço em uma posição específica (em metros) para a visualização individual, a variável $tmin$ seleciona o tempo mínimo (em segundos) a partir do qual o ganho será aplicado e a variável $salva$ serve para armazenar o ganho aplicado ao dado caso você esteja satisfeito com a imagem obtida. Por enquanto mantenha a variável $salva$ com o valor **False** e altere os valores numéricos de $a$, $tmin$ e $x$ para avaliar o efeito do ganho linear sobre a imagem do radargrama. A função de ganho aplicada será mostrada em escala normalizada sobre o traço na figura à direita. Execute a célula após definir estes valores a seu critério.

**Obs.**: a palavra *temporário* irá aparecer na figura ao lado do nome do arquivo, indicando que o ganho foi aplicado porém ainda não foi salvo sobre os dados). Assim, quaisquer valores que você inserir serão aplicados apenas nos dados brutos visualizados no **Passo 02**.

In [None]:
dados.ganho_linear(a=10.0, tmin=0.0e-9, x=0.0, salva=False)

### Ganho exponencial

Corresponde a uma função do tipo $a e^{bt}$ estritamente crescente, assumindo o valor mínimo $a$ no tempo $t$=0.0 ns, o valor máximo $a e^{bt}$ no tempo final do registro e valores intermediários com uma distribuição exponencial entre estes dois tempos.

A célula abaixo apresenta este tipo de ganho. A variável $a$ representa o fator multiplicador linear do ganho, a variável $b$ representa o fator multiplicador exponencial do ganho, a variável $x$ seleciona um traço em uma posição específica (em metros) para a visualização individual, a variável $tmin$ seleciona o tempo mínimo (em segundos) a partir do qual o ganho será aplicado e a variável $salva$ serve para armazenar o ganho aplicado ao dado caso você esteja satisfeito com a imagem obtida. Por enquanto mantenha a variável $salva$ com o valor **False** e altere os valores numéricos de $a$, $b$, $tmin$ e $x$ para avaliar o efeito do ganho exponencial sobre a imagem do radargrama. A função de ganho aplicada será mostrada em escala normalizada sobre o traço na figura à direita. Execute a célula após definir estes valores a seu critério.

**Obs.**: a palavra *temporário* irá aparecer na figura ao lado do nome do arquivo, indicando que o ganho foi aplicado porém ainda não foi salvo sobre os dados). Assim, quaisquer valores que você inserir serão aplicados apenas nos dados brutos visualizados no **Passo 02**.

In [None]:
dados.ganho_exp(a=1.0, b=1.0, tmin=0.0e-9, x=0.0, salva=False)

### Ganho AGC

O AGC (*Automatic Gain Control*, Controle Automático de Ganho) é o tipo de ganho mais comum aplicados a dados de GPR e a dados sísmicos. Ele tende a equalizar as amplitudes do traço e corresponde a uma função que é calculada dinamicamente em função da própria amplitude apresentada pelo sinal. Define-se uma janela de tempo (menor do que o tempo máximo de registro do sinal) dentro da qual é calculado o valor da amplitude RMS, dado por:

$$A_{RMS} = \sqrt{\frac{1}{N}\sum_{i=1}^{N}{|s_{i}|^2}}$$

em que $N$ corresponde ao número de amostras dentro da janela de tempo definida e $s_i$ corresponde à $i$-ésima amostra do sinal. A razão entre uma amplitude RMS fixa de referência $A_{REF}$ e a amplitude RMS $A_{RMS}$ é calculada e o valor resultante é adotado como fator multiplicador a ser aplicado em cada amostra desta janela. A janela de tempo é então deslocada de uma amostra no tempo e o procedimento acima é repetido até que a janela percorra todo o traço. Isto é feito para cada traço do radargrama, de forma haverá uma função de ganho característica calculada automaticamente para cada traço.

A célula abaixo apresenta este tipo de ganho. A variável $tw$ representa o intervalo da janela de tempo desejada (em segundos) a variável $salva$ serve para armazenar o ganho aplicado ao dado caso você esteja satisfeito com a imagem obtida. Por enquanto mantenha a variável $salva$ com o valor **False** e altere o valor numéricos de $tw$ para avaliar o efeito do ganho AGC sobre a imagem do radargrama. A função de ganho aplicada será mostrada em escala normalizada sobre o traço na figura à direita. Execute a célula após definir este valor a seu critério.

**Obs.**: a palavra *temporário* irá aparecer na figura ao lado do nome do arquivo, indicando que o ganho foi aplicado porém ainda não foi salvo sobre os dados). Assim, quaisquer valores que você inserir serão aplicados apenas nos dados brutos visualizados no **Passo 02**.

In [None]:
dados.ganho_agc(tw=10.0e-9, salva=False)

Escolha o ganho que você julgar mais adequado dentre os três analisados acima e, assim que você definir valores numéricos satisfatórios, modifique o valor da variável $salva$ para **True** na célula correspondente. Isto irá armazenar as amplitudes do radargrama após o ganho ser aplicado. Observe que agora a palavra temporário não aparece mais ao lado do nome do arquivo, indicando que a alteração foi efetuada de forma definitiva. A função de ganho também não é mais apresentada na figura à direita, ficando apenas as amplitudes definitivas do traço. **Não avance para o próximo passo antes de aplicar o ganho definitivamente sobre os dados**.

**Obs. 1**: A aplicação do ganho não pode ser desfeita, então se você acidentalmente salvar um ganho inadequado precisará carregar o arquivo de dados novamente no **Passo 02** para corrigir o erro.

**Obs. 2**: Uma vez que você salva o dado com ganho ele torna-se o conjunto de dados padrão. Isto significa que se você executar alguma outra função de ganho ela será aplicada sobre os dados já amplificados, ou seja, você irá aplicar um ganho sobre outro ganho. Isto é sempre possível porém não é recomendado, pois juntamente com o dado que nos interessa há a amplificação também do ruído que pode estar presente no dado.

# Passo 04 - Filtragem

Caso o ruído do dado tenha sido amplificado (o que quase sempre acontece em um dado real de campo) é necessário removê-lo para possibilitar a visualização das feições de interesse no radargrama. Contudo, é necessário antes analisar o *espectro* do radargrama para avaliar o que pode ser ruído e o que pode não ser.

Execute a célula abaixo para visualizar o espectro médio do radargrama, que irá lhe indicar a faixa em que as frequências de maior amplitude do sinal se concentram.

In [None]:
dados.plota_espectro()

**Sugestão**: Se você estiver com muitas dúvidas ou não se lembrar dos fundamentos da filtragem pode acessar o [notebook sobre filtragem](https://mybinder.org/v2/gh/emrodalmeida/demoaulas/HEAD?filepath=Geofisica1%2Ffiltragem.ipynb) elaborado para a disciplina de Geofísica I. Se quiser entender por quê isso funciona, pode acessar o [notebook sobre as séries de Fourier](https://mybinder.org/v2/gh/emrodalmeida/demoaulas/HEAD?filepath=Geofisica1%2Fserie_fourier.ipynb), também elaborado para essa disciplina.

Sobre este esectro é necessário excluir algumas componentes de frequência que se considera estarem associadas ao ruído e manter as frequências que se considera que estejam associadas ao sinal de interesse. Não há uma regra para isto, visto que o ruído pode contaminar o sinal em qualquer faixa de frequência. Em geral busca-se melhorar a imagem removendo o mínimo possível das frequências do espectro e dando preferência pela remoção das frequências mais distantes da frequência nominal da antena empregada na aquisição. Não há nada que impeça a exclusão de frequências próximas à frequência nominal da antena, e de fato isto muitas vezes acaba sendo necessário, porém ao se fazer isso haverá a degradação do sinal ao invés de haver uma melhoria. Assim, deve-se sempre ponderar entre o quanto é possível remover ou manter no sinal para não degradá-lo demais.

Na célula abaixo você pode deifinir um filtro passa-banda definido por duas frequências de corte $f_{c1}$ e $f_{c2}$. O passa-banda é o tipo de filtro em que a banda de frequência existente entre as frequências $f_{c1}$ e $f_{c2}$ é mantida no espectro do sinal e todas as outras frequências são removidas. Os valores abaixo ($f_{c1}$ = 10 MHz e $f_{c2}$ = 600 MHz) estão definidos para um filtro de banda larga, ou seja, que compreende uma larga faixa de frequências a serem mantidas no espectro. Filtros passa-banda de banda larga tendem a alterar muito pouco o sinal. A primeira figura lhe mostrará o espectro original com a representação do filtro que foi definido e a segunda figura lhe mostrará o espectro após a aplicação do filtro.

In [None]:
freq_corte = [10e6, 600e6]
dados.plota_filtragem(f_c = freq_corte)

Execute a célula abaixo para visualizar o efeito desta filtragem sobre os dados. A figura resultante lhe mostrará o radargrama sem as frequências que ficaram fora da banda definida no filtro. As variáveis $x$ e $salva$ têm a mesma função apresentada nas etapas de ganho. Você pode alterar o valor da variável $x$, mas mantenha a variável $salva$ com o valor **False** por enquanto.

In [None]:
dados.passa_banda(freq_corte, x=1.1, salva=False)

Você irá notar que o efeito surtido pelo filtro sobre os dados foi imperceptível, pois o radargrama resultante é praticamente igual ao radargrama após a etapa de ganho. Isto é consequência da filtragem com uma banda larga, como mencionado acima.

Agora volte à célula em que foram definidas as frequências de corte $f_{c1}$ e $f_{c2}$ e defina outras bandas de filtragem. Veja como o dado é modificado. Quando encontrar uma banda satisfatória mude o valor da variável $salva$ para **True**.

**Opcional**: Caso você queira é possível aplicar a etapa de ganho novamente. Para isto basta executar novamente a célula com o ganho desejado *sem carregar novamente* o arquivo de dados. Na prática, as etapas de ganho e filtragem podem ser repetidas sucessivamente quantas vezes forem necessárias para se obter uma imagem passível de interpretação, desde que se tome o cuidado de não modificar demais o dado para evitar quaisquer vieses interpretativos.

# Passo 05 - Estimativa de velocidade das ondas EM

Em dados adquiridos em configuração de afastamento comum é possível estimar a velocidade de propagação das ondas eletromagnéticas através do ajuste de uma hipérbole teórica posicionada sobre uma hipérbole qualquer identificada no radargrama, causada pela difração das ondas em alvos pontuais. A abertura da hipérbole é determinada pela velocidade de propagação das ondas no meio geológico, considerado homogêneo. Velocidades mais altas geram hipérboles mais abertas, enquanto velocidades mais baixas geram hipérboles mais fechadas.

A célula baixo permite posicionar uma hipérbole teórica sobre os dados do arquivo carregado no **Passo 02**. A variável $v$ corresponde à velocidade de propagação das ondas (em m/ns), a variável $xc$ corresponde à posição central (em metros) da hipérbole, a variável $dx$ corresponde à extensão de cada braço da hipérbole (em metros), a variável $t0$ corresponde ao tempo do ápice da hiperbole (em segundos) e a variável $r$ corresponde ao raio do alvo pontual (em metros). Modifique estes valores e tente estimar a velocidade de propagação neste perfil. Este procedimento não modifica nada no dado em si.

**Obs.:** Se você trabalhar com o arquivo '**200_SC.dat**' você não conseguirá encontrar uma hipérbole para fazer a estimativa de velocidade (como você faria para estimá-la nesta situação?). Neste caso você pode considerar a velocidade de 0,077 m/ns, que foi determinada através de outros meios.

In [None]:
dados.ajusta_hiperbole(v=0.030, xc=5.0, dx=0.5, t0=5e-9, r=0.5)

A informação da velocidade é importante para estimar a constante dielétrica ($ \varepsilon_{r} $) do meio através do qual as ondas se propagam, fornecendo uma indicação sobre o tipo de material atravessado, e para estimar a profundidade dos alvos e feições identificados. A constante dielétrica é calculada através da equação

$$ \varepsilon_{r} = \left(\frac{c}{v}\right)^2 $$

em que $c$ é a velocidade da luz (= 0.3 m/ns) e $v$ é a velocidade de propagação (em m/ns) estimada pelo ajuste de hipérbole. Calcule o valor de $ \varepsilon_{r} $ e insira-o na célula abaixo como valor da variável $eps$ e execute a célula para converter a escala de tempo em escala de profundidade, estimando assim a profundidade a que os alvos encontram-se. A variável $x$ tem a mesma função já discutida nos passos anteriores.

In [None]:
dados.tempo_profundidade(eps=15.0, x=21.15)

# Passo 06 - Trabalhando com dados ruidosos

Agora reinicie o notebook, carregando novamente o mesmo arquivo de dados com o qual você trabalhou até agora, porém insira um ruído na faixa de frequência centrada em 900 MHz (900e6 Hz). Esta faixa de frequência está entre as adotadas por operadoras de telefonia celular. Execute os mesmos passos que você fez até aqui e veja como o ganho e o filtro atuam sobre os dados, interferindo na sua interpretação.