In [1]:
#default_exp tests

In [1]:
#hide
%load_ext autoreload
%autoreload 2    
%load_ext line_profiler

In [2]:
#export
from pathlib import Path
from datetime import timedelta, datetime
from collections import defaultdict, namedtuple
from typing import *
import pandas as pd
import numpy as np
from tqdm.notebook import tqdm
from rfpy.main import parse_input
from rfpy.parser import get_files
from rfpy.blocks import *
from rfpy.utils import *
from nbdev.showdoc import *
from fastcore.xtras import parallel
from fastcore.foundation import L
from fastcore.test import *

Com o objetivo de estudar o código fui reescrevendo-o. Tentar reescrever funções é um bom exercício para entender e internalizar a implementação utilizada. Assim foi possível identificar várias oportunidades para simplesmente refatorar e simplificar o código. 

Utilizarei várias funcionalidades da biblioteca [fastcore](https://fastcore.fast.ai/basics.html), esta  extende de maneira muito eficiente várias funcionalidades básicas do python e assim não precisamos _reiventar a roda_.

### `config.tradutor.yaml` 

Como só temos 2 parâmetros, `entrada` e `saída` escolhi não utilizar um arquivo de configuração por não achar ser necessário. Outro benefício dessa abordagem é utilizar as variáveis que antes estavam no arquivo de configuração como parâmetros de entrada numa linha de comando.

Como não utilizei um arquivo de configuração não é necessário chamar a função `busca_arquivos` do arquivo `helper.py`

In [3]:
VERBOSE = True
entrada = Path(r'D:\OneDrive - ANATEL\Backup_Rfeye_SP\RPO\PMEC2020\Ribeirao_Preto_SP\SLMA')
saida = Path(r'C:\Users\rsilva\Downloads')

In [4]:
show_doc(get_files)

<h4 id="get_files" class="doc_header"><code>get_files</code><a href="https://github.com/ronaldokun/rfpy/tree/master/rfpy/parser.py#L17" class="source_link" style="float:right">[source]</a></h4>

> <code>get_files</code>(**`path`**, **`extensions`**=*`None`*, **`recurse`**=*`True`*, **`folders`**=*`None`*, **`followlinks`**=*`True`*)

Get all the files in `path` with optional `extensions`, optionally with `recurse`, only in `folders`, if specified.

In [5]:
arquivos = get_files(entrada) ; arquivos

(#255) [Path('D:/OneDrive - ANATEL/Backup_Rfeye_SP/RPO/PMEC2020/Ribeirao_Preto_SP/SLMA/rfeye002304_SLMA_bimestral_occ15min_200317_232233.bin'),Path('D:/OneDrive - ANATEL/Backup_Rfeye_SP/RPO/PMEC2020/Ribeirao_Preto_SP/SLMA/rfeye002304_SLMA_bimestral_occ15min_200318_225525.bin'),Path('D:/OneDrive - ANATEL/Backup_Rfeye_SP/RPO/PMEC2020/Ribeirao_Preto_SP/SLMA/rfeye002304_SLMA_bimestral_occ15min_200318_225535.bin'),Path('D:/OneDrive - ANATEL/Backup_Rfeye_SP/RPO/PMEC2020/Ribeirao_Preto_SP/SLMA/rfeye002304_SLMA_bimestral_occ15min_200318_225556.bin'),Path('D:/OneDrive - ANATEL/Backup_Rfeye_SP/RPO/PMEC2020/Ribeirao_Preto_SP/SLMA/rfeye002304_SLMA_bimestral_occ15min_200318_225615.bin'),Path('D:/OneDrive - ANATEL/Backup_Rfeye_SP/RPO/PMEC2020/Ribeirao_Preto_SP/SLMA/rfeye002304_SLMA_bimestral_occ15min_200410_183001.bin'),Path('D:/OneDrive - ANATEL/Backup_Rfeye_SP/RPO/PMEC2020/Ribeirao_Preto_SP/SLMA/rfeye002304_SLMA_bimestral_occ15min_200423_162327.bin'),Path('D:/OneDrive - ANATEL/Backup_Rfeye_SP/RPO/

O Objeto retornado `L` é uma extensão da lista python com funcionalidades adicionais, uma delas como  podemos ver é que a representaçõa da lista impressa vem com o número de arquivos da lista. 
Temos 255 arquivos bin na pasta entrada. Podemos filtrar por pasta também

In [6]:
arquivos_bin = get_files(entrada, extensions=['.bin'], folders='tmp')

In [7]:
arquivos_bin

(#1) [Path('D:/OneDrive - ANATEL/Backup_Rfeye_SP/RPO/PMEC2020/Ribeirao_Preto_SP/SLMA/tmp/rfeye002304_SLMA_bimestral_PEAK_200829_234902.bin')]

O Código executado em `tradutor_RFEYE.py` está totalmente contido de forma mais geral em `main.py`. Chamei de main justamente porque esse será o arquivo base que chama outros arquivos e funções.

In [8]:
LINHA_A = [[1,  '',  '',  '',  datetime(2020, 8, 29, 23, 50, 1, 59268),  38373,  108,
          137, 14848, 'peak', 1, '']]
LINHA_B = [1, 108.0, -75.0]

In [13]:
%%time
save_file_a = saida / 'file_a.csv'
save_file_b = saida / 'file_b.csv'

A = ['Block_Number', 'Latitude', 'Longitude', 'Altitude', 'Initial_Time',
     'Sample_Duration', 'Start_Frequency', 'Stop_Frequency', 'Vector_Length', 
     'Trace_Type', 'Antenna_Type', 'Equipement_ID']

B = ['Block_Number', 'Frequency(HZ)', 'Nivel(dBm)']

file_a = [] #pd.DataFrame(columns=A)
file_b = [] #pd.DataFrame(columns=B, dtype='float16')

block_apply = {}



lat = 0
long = 0
alt = 0
conta_bloco = 0  # contador de blocos processados

for file in arquivos_bin:
#     data = L(binary_file_generator(file))
#     tipos_bloco = data.map(Block).attrgot('block_type')    
    for i, data in enumerate(tqdm(binary_file_generator(file), total=13222)):
        bloco = create_base_block(data)
        hostname = ''
        latitude = ''
        longitude = ''
        altitude = ''
        if bloco.type == 21:
            hostname = DType21(bloco).hostname
        if bloco.type == 40:  # GPS Data
            gps = DType40(bloco)
            latitude = gps.latitude
            longitude = gps.longitude
            altitude = gps.altitude
        if bloco.type == 63:
            conta_bloco += 1  # contador de blocos processados
            espectro = DataType63(TimedBlock(bloco))
            start_datetime_stamp = espectro.datetime_stamp
            sample_duration = espectro.spent_time_microsecs
            start_frequency, stop_frequency  = espectro.banda_mega
            antena_id = espectro.id_antenna
            trace_type = espectro.processing
            rbw = espectro.rbw
            vector_length = espectro.data_points
            file_a.extend([[conta_bloco, latitude, longitude, altitude,start_datetime_stamp,
                      sample_duration, start_frequency, stop_frequency,vector_length,
                      trace_type, antena_id, hostname]])          
            
            file_b.extend([[conta_bloco, freq, nivel] for freq, nivel in zip(espectro.list_freq_mega, espectro.block_data)])
            break
            if i > 1000:
                break
#             file_a = file_a.append(pd.DataFrame(file_a, columns=A))
#             file_b = file_b.append(pd.DataFrame(file_b, columns=B))

HBox(children=(HTML(value=''), FloatProgress(value=0.0, max=13222.0), HTML(value='')))




AttributeError: 'BaseBlock' object has no attribute 'list_freq_mega'

In [54]:
t.banda_mega

(108, 137)

In [None]:
data = L(binary_file_generator(file)) ; len(data)

In [None]:
tipos_bloco = data.map(Block).attrgot('block_type') ; tipos_bloco

In [None]:
tipos_bloco.unique()

In [None]:
dict_bloco = defaultdict(list)

In [None]:
start = 52+(espectro._get_len_tunning_info()*4)+(espectro._get_len_agc())

In [None]:
stop = start+(espectro._get_number_data_points())

In [None]:
offset = espectro._get_level_offset() ; offset

In [None]:
raw = espectro._get_block_data()

In [None]:
from collections import namedtuple

BASEBLOCK = ['thread_id', 'block_size', 'block_type', 'block_trailer', 'block_data']

BaseBlock = namedtuple('Block', ' '.join(BASEBLOCK))

def create_base_block(bin_block: bytes):
    if not isinstance(bin_block, bytes):
        raise TypeError(f"Expected type 'bytes', got '{type(bin_block)}' instead.")    
    return BaseBlock(*L(bin_block[:4], bin_block[4:8], bin_block[8:12]).map(bin2dec), bin_block[-4:], bin_block[12:])

In [None]:
block = create_base_block(data)

In [None]:
block

In [None]:
def create_time_block()

In [None]:
data_vector = np.fromiter(raw[start:stop], dtype=np.float16) / 2 + offset - 127.5
data_vector

In [None]:
test_eq(np.array(data, dtype=np.float16), data_vector)

In [None]:
data_array_1 = np.fromiter(data, dtype=np.float16)

In [None]:
data_array = []
pos_inicial = 48
for delta_pos in range(espectro._get_number_data_points()):
    byte_index = pos_inicial + delta_pos
    data_array.append(bin2dec(data[byte_index:byte_index+1], False)/2)    

In [None]:
data_array_2 = np.array(data_array)