In [None]:
!git clone https://github.com/rafaseto/PIBIC-AnaliseDados.git

In [None]:
%cd PIBIC-AnaliseDados

In [None]:
import pip

In [None]:
!pip install dlisio

## Importa funções para o pré-processamento

In [1]:
from pre_processamento import *

In [2]:
from dlisio import dlis # ****extrair var/metadado que indica a unidade de medida****
import pandas as pd

In [3]:
# A função 'glob' do módulo 'glob' é usada para procurar todos os arquivos em um diretório com determinada extensão
import glob

## Carrega os dados

In [4]:
dli_dict = {}        # Conterá os arquivos lógicos
filenames = []  # Conterá os caminhos dos arquivos dlis
nomes_anp = []      # Conterá os nomes ANP dos poços
charId_inicio, charId_fim = 7, 10   # Índices de início e fim da substring identificadora do poço

# Utilizando a função 'glob' do módulo 'glob' para procurar todos os arquivos com extensão DLIS em 'Data'
for file in glob.glob(r'**/Data' + "/*.dlis", recursive=True):
    
    # Carregando os arquivos dlis com 'load' e armazenando-os em 'leitura'
    # 'tail' recebe valores restantes, caso a função retorne mais de uma peça de informação
    leitura, *tail = dlis.load(f'{file}')
    
    nome = leitura.origins[0].well_name

    nomes_anp.append(nome)    # armazenando o nome do poço
    
    filenames.append(file)      # armazenando o caminho dos arquivos dlis
    
    nome_abreviado = nome[charId_inicio : charId_fim]   # identificador do poço, e.g. '900'
    
    # Armazenando o arquivo lógico como valor em um dicionário onde a chave é o identificador do poço
    dli_dict[nome_abreviado] = leitura      

In [None]:
dli_dict['900'].describe()

## Cria dataframes para os poços

In [5]:
dlis_df_dict = {}   # Conterá os dataframes respectivos aos poços

# Curvas de perfis que não serão utilizadas
curvas_nao_utilizadas = ['WF11', 'AHV', 'AHVT', 'BHV', 'BHVT', 'CS', 'FCPS', 'HDCN', 'HMCN', 'ITT', 'ITTT', 'LSPD', 'MMK', 'NCPS', 'SP', 'TENS']

# Iterando sobre os arquivos lógicos de todos os poços (que estão armazenados em 'dli_dict'),
# '.values()' se refere aos valores do dicionário (não às chaves)
for chave, poco in dli_dict.items():
    try:
        # Armazenando as curvas que serão utilizadas em uma lista
        curvas_utilizadas = [
            channel.name                                    # Os elementos da lista serão os nomes das curvas
            for channel in poco.channels                    # As curvas são acessadas por meio de 'poco.channels'
            if channel.name not in curvas_nao_utilizadas    # As curvas que não utilizaremos não serão armazenadas na lista
        ]


        curvas = poco.frames[0].curves()

        # Criando um pandas dataframe do poço respectivo à atual iteração e armazenando o mesmo em dlis_df
        dlis_df_dict[chave] = pd.DataFrame(curvas[curvas_utilizadas])
    except:
        pass

In [6]:
# Transformados os valores -999.25 em nulos
for poco in dlis_df_dict.values():
    poco.replace([-999.25], [None], inplace = True)

## Remoção de Colunas

In [None]:
colunas_para_remover = ['CALI', 'RHOB', 'DRHO', 'PE', 'HDRS', 'HMRS', 'DTC']
dlis_df_dict['900'] = remove_colunas(dlis_df_dict['900'], colunas_para_remover)

In [None]:
dlis_df_dict['900']

## Renomeação de Colunas

In [None]:
dlis_df_dict['900'] = renomeiaColuna(dlis_df_dict['900'], "GR", "gamma-ray")

In [None]:
dlis_df_dict['900']

## Transformação NPHI

In [None]:
dlis_df_dict['897']

In [None]:
nphi_transform(dlis_df_dict, ['900', '897'])

In [None]:
dlis_df_dict['897']

## Remoção de Pontos com Falha

calcular limites para DCALI (2 polegadas, se for maior descartar), DRHO (-0.15, +0.15) --> nesse intervalo, fora descarta

In [None]:
dlis_df_dict['897']

In [None]:
pontos_com_falha = {
    '900': [250, 360],
    '889': [75, 210],
    '912': [60, 260],
    '897': [90, 221],
    '910': [64, 215],
    '907': [90, 320]
}

In [None]:
#dlis_df_dict['1847'].drop(dlis_df_dict['1847'][dlis_df_dict['1847']['TDEP'] > 300].index)

In [None]:
# Chamando a função
remove_pontos_com_falha(dlis_df_dict, pontos_com_falha)

## Adiciona coluna DCALI

In [7]:
add_DCALI(dlis_df_dict)

In [8]:
limita_curva(dlis_df_dict, "DCALI", -2, 2)

## Remove valores DRHO indesejados

In [9]:
limita_curva(dlis_df_dict, "DRHO", -0.15, 0.15)

In [10]:
pd.set_option('display.max_rows', None)
dlis_df_dict['897']

Unnamed: 0,TDEP,DTC,HDRS,HMRS,GR,CALI,NPHI,RHOB,DRHO,PE,BSZ,DCALI
0,319.0,,,,,,,,,,8.5,
1,318.9,,,,,,,,,,8.5,
2,318.8,,,,,,,,,,8.5,
3,318.7,,,,,,,,,,8.5,
4,318.6,,,,,,,,,,8.5,
5,318.5,,,,,,,,,,8.5,
6,318.4,,,,,,,,,,8.5,
7,318.3,,,,,,,,,,8.5,
8,318.2,,,,,,,,,,8.5,
9,318.1,,,,,,,,,,8.5,
