In [None]:
#hide
%load_ext autoreload
%autoreload 2 

In [None]:
import warnings
with warnings.catch_warnings():
    warnings.simplefilter("ignore")
from rich import print

# RFPYE
> Este módulo tem como objetivo o processamento e extração otimizada de dados dos arquivos `.bin` de monitoramento do espectro provenientes do script Logger executados nas estações de Monitoramento CRFS RFeye Node. Para tal utilizamos as várias funcionalidades da biblioteca [fastcore](https://fastcore.fast.ai/basics.html), que expande e otimiza as estruturas de dados da linguagem python. 

## Instalação

`Ubuntu`: 

```bash
python -m pip install rfpye
```

`Windows`:

Como parte dessa lib utiliza código c compilado com `Cython`, é preciso que um compilador `C` esteja instalado. Em Windows, uma opção é instalar a versão apropriada do Visual Studio seguindo as orientações do site da Microsoft. No entanto uma solução mais simples e a recomendada é utilizando o `conda`.

Primeiramente instale o [miniconda](https://docs.conda.io/en/latest/miniconda.html). Com o conda instalado e disponível no seu `PATH` ou através do `Anaconda Prompt` execute o comando:

```bash
conda install -c intel libpython m2w64-toolchain -y

echo [build] > %CONDA_PREFIX%\Lib\distutils\distutils.cfg

echo compiler = mingw32 >> %CONDA_PREFIX%\Lib\distutils\distutils.cfg
```

Depois disso basta instalar normalmente a lib:
`python -m pip install rfpye`

Em Linux normalmente o sistema já possui o compilador `gcc` instalado então basta executar o comando `pip install` acima.

## Como utilizar
Abaixo mostramos as funcionalidades principais dos módulos, utilizando-os dentro de algum outro script ou `REPL`

Precisamos necessariamente de um diretório de entrada, contendo um ou mais arquivos `.bin` e um diretório de saída no qual iremos salvar os arquivos processados. 
> Mude os caminhos abaixo para suas pastas locais caso for executar o exemplo.

Ao utilizar o script `process_bin`, as pastas `entrada` e `saída` esses serão repassadas como parâmetros na linha de comando.

In [None]:
from fastcore.xtras import Path
VERBOSE = True
entrada = Path(r'D:\OneDrive - ANATEL\Backup_Rfeye_SP\CGH\2021')
saida = Path(r'C:\Users\rsilva\Downloads\saida')

## Leitura de Arquivos

No módulo `parser.py`, há funções auxiliares para lidar com os arquivos `.bin`, pastas e para processar tais arquivos em formatos úteis. Nesse caso utilizaremos a função `get_files` que busca de maneira recursiva arquivos de dada extensão, inclusive links simbólicos se existirem
O caráter recursivo e a busca em links, `recurse` e `followlinks` simbólicos pode ser desativados por meio dos parâmetros e opcionalmente pode ser varrido somente o conjunto de pastas indicado em `folders` 

In [None]:
from rfpye.utils import get_files
arquivos = get_files(entrada, extensions=['.bin']) ; print(arquivos[:10])

> O Objeto retornado `L` é uma extensão da lista python com funcionalidades adicionais, uma delas como  podemos ver é que a representação da lista impressa mostra o comprimento da lista. Esse objeto pode ser usado de maneira idêntica à uma lista em python e sem substituição desta.

In [None]:
bin_file = arquivos[-3] ; print(bin_file.name)

In [None]:
from rfpye.parser import parse_bin, extract_metadata, extract_level

## Processamento dos blocos
A função seguinte `parse_bin` recebe um arquivo `.bin` e mapeia os blocos contidos nele retornando um dicionário que tem como chave o tipo de bloco e os valores como uma lista com os blocos extraídos sequencialmente.

In [None]:
%%time
map_bin = parse_bin(bin_file)['blocks']

Wall time: 5.26 s


In [None]:
for k, b in map_bin.items():
    print(f'Tipo de Bloco: {k[0]}, Fluxo (Thread ID): {k[1]}, #Blocos: {len(b)}')

In [None]:
gps = map_bin[(40,1)]
spec = map_bin[(67,110)]

A seguir é mostrado um exemplo dos atributos contidos num bloco de gps e num bloco de espectro

In [None]:
from rfpye.utils import getattrs
print(getattrs(gps[0][1]))

In [None]:
print(getattrs(spec[0][1]))

## Metadados
A função seguinte extrai os metadados `META` definidos no cabeçalho do arquivo `constants.py` e retorna um DataFrame.

In [None]:
gps_meta = extract_metadata(gps)
gps_meta.head()

Unnamed: 0_level_0,start_byte,stop_byte,altitude,data_size,gps_datetime,gps_status,heading,latitude,longitude,num_satellites,speed,thread_id,type
wallclock_datetime,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1
2021-05-16 14:43:00.532926,344,399,815.299988,40,2021-05-16 14:43:00,Differential GPS,0.0,-23.635859,-46.654255,12,0.014,1,40
2021-05-16 14:44:00.330070,5324,5379,817.299988,40,2021-05-16 14:43:59,Differential GPS,0.0,-23.635857,-46.654263,12,0.025,1,40
2021-05-16 14:45:00.752895,10304,10359,816.200012,40,2021-05-16 14:45:00,Differential GPS,0.0,-23.635859,-46.654266,12,0.007,1,40
2021-05-16 14:46:00.402776,86092,86147,815.299988,40,2021-05-16 14:46:00,Differential GPS,0.0,-23.635864,-46.654263,12,0.005,1,40
2021-05-16 14:47:00.302816,91072,91127,818.099976,40,2021-05-16 14:47:00,Differential GPS,0.0,-23.635859,-46.654266,12,0.025,1,40


In [None]:
spec_meta = extract_metadata(spec)
spec_meta.tail()

Unnamed: 0_level_0,start_byte,stop_byte,antenna_id,bw,data_size,data_type,desclen,description,dynamic_id,gerror,...,start_channel,start_mega,start_mili,step,stop,stop_channel,stop_mega,stop_mili,thread_id,type
wallclock_datetime,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
2021-05-21 00:00:00.695624,69731068,69732247,0,40,1164,1,36,PRD 2021 (Faixa principal 2 de 4).,0,-1,...,0,70,0,0.039101,1163,0,110,0,110,67
2021-05-21 00:05:00.635638,69826776,69827955,0,40,1164,1,36,PRD 2021 (Faixa principal 2 de 4).,0,-1,...,0,70,0,0.039101,1163,0,110,0,110,67
2021-05-21 00:10:00.606404,69861632,69862811,0,40,1164,1,36,PRD 2021 (Faixa principal 2 de 4).,0,-1,...,0,70,0,0.039101,1163,0,110,0,110,67
2021-05-21 00:15:00.355210,69896488,69897667,0,40,1164,1,36,PRD 2021 (Faixa principal 2 de 4).,0,-1,...,0,70,0,0.039101,1163,0,110,0,110,67
2021-05-21 00:20:00.385654,69992196,69993375,0,40,1164,1,36,PRD 2021 (Faixa principal 2 de 4).,0,-1,...,0,70,0,0.039101,1163,0,110,0,110,67


## Frequência e Nível
A função seguinte extrai as frequências e nível num formato de Tabela Dinâmica:
* Colunas: Frequências (MHz)
* Índice: Números de Bloco
* Valores: Níveis (dBm ou dBuV/m)

In [None]:
levels = extract_level(spec, dtype='float16')
levels.head()

Unnamed: 0,70.000000,70.039101,70.078201,70.117302,70.156403,70.195503,70.234604,70.273705,70.312805,70.351906,...,109.648094,109.687195,109.726295,109.765396,109.804497,109.843597,109.882698,109.921799,109.960899,110.000000
0,48.5,47.5,46.0,42.5,32.0,39.0,32.5,41.0,44.5,45.5,...,34.0,37.0,38.5,38.0,32.5,28.0,36.0,34.5,27.5,34.5
1,35.5,35.5,36.5,46.0,43.0,44.5,47.0,45.5,40.0,38.5,...,35.5,34.5,31.0,34.5,35.5,28.5,21.5,28.5,27.0,37.5
2,47.0,44.5,44.0,41.5,40.5,42.0,40.0,40.0,43.0,39.5,...,31.0,38.0,41.5,38.5,31.0,31.0,31.0,39.5,39.5,37.5
3,40.0,43.0,42.0,46.5,45.5,40.5,35.0,35.0,37.5,37.0,...,37.0,38.5,39.0,35.5,36.5,32.5,26.5,33.5,35.5,33.0
4,40.0,35.0,32.0,42.0,41.0,40.5,36.5,32.5,46.0,47.5,...,31.0,28.0,41.0,42.5,39.0,31.0,25.0,16.5,23.0,23.0


## Processamento, Extração e Salvamento dos Metadados e Espectro 
A função a seguir é um wrapper de toda funcionalidade desta biblioteca. Ela recebe o caminho `entrada` para um arquivo `.bin` ou pasta contendo vários arquivos `.bin`, extrai os metadados e os dados de espectro. Mescla o timestamp dos metadados com o arquivo de espectro e salva ambos na pasta `saida`. Essa pasta é usada como repositório e cache dos dados processados que serão utilizados pela função `extract_bin_stats`.

In [None]:
from rfpye.filter import process_bin, extract_bin_stats

In [None]:
process_bin(bin_file, saida)

Output()

Se chamarmos a função novamente:

In [None]:
process_bin(bin_file, saida)

Como vemos pela mensagem de saída, nada foi feito porque esse arquivo já foi processado anteriormente e todos os arquivos de metadados e espectros presentes já foram salvos na pasta `saida`

## Resumo do arquivo
Se o que interessa é somente os dados estatísticos do arquivo como `Min`, `Max` e `Mean` basta utilizar:

In [None]:
stats = extract_bin_stats(bin_file, cache=saida)
stats

Unnamed: 0,Frequency,Min,Max,Mean
0,50.000000,18.0,48.5,37.81250
1,50.039101,10.5,49.0,37.62500
2,50.078201,8.5,48.5,37.59375
3,50.117302,17.5,49.5,37.96875
4,50.156403,17.5,50.0,38.00000
...,...,...,...,...
43003,5159.843750,-128.5,-104.0,-112.43750
43004,5159.882812,-125.0,-103.5,-112.25000
43005,5159.921875,-127.0,-101.5,-111.37500
43006,5159.960938,-123.5,-101.0,-111.12500


Podemos filtrar o intervalo tanto de frequência quanto de tempo da extração:

In [None]:
stats = extract_bin_stats(bin_file, cache=saida, freq_start=88.1, freq_stop=107.9)
print(stats.head(20))

In [None]:
print(stats.tail(20))