In [1]:
import pandas as pd
import numpy as np
import math
import os
import re
import json
import unicodedata
from owlready2 import *
from getpass import getpass
from IPython.display import clear_output
import collections

In [2]:
onto = get_ontology("file://OntoGeoLogicaEntidadesNomeadasPython.owl")

In [3]:
chave  = os.getenv('BG40')
senha  = getpass('Senha: ')

os.environ['HTTP_PROXY']  = f'http://{chave}:{senha}@inet-sys.petrobras.com.br:804'
os.environ['HTTPS_PROXY'] = f'http://{chave}:{senha}@inet-sys.petrobras.com.br:804'
os.environ['NO_PROXY']    = '127.0.0.1, localhost, petrobras.com.br, petrobras.biz'

Senha:  ··········


In [4]:
onto.load()

get_ontology("http://www.semanticweb.org/bg40/ontologies/2022/5/untitled-ontology-2#")

In [5]:
ontology_iri = str(onto.field.iri).split('#')[0]

#### Insert list of basins as individuals

Creates instances for the BASIN entity. Each instance is registered under a URI with an unique code (BASE_CD_BACIA)

In [8]:
lista_bacias = 'resources/bacia/bacias.json'

In [9]:
with open(lista_bacias, 'r') as f:
    individuos = json.load(f)

for individuo in individuos:
    new_ind=onto.basin('BASE_CD_BACIA_'+str(individuo).zfill(3))
    for sinonimo in individuos[individuo]:
        new_ind.label.append(sinonimo)

#### Insert list of fields as individuals

Creates instances for the FIELD entity. Each instance is registered under a URI with an unique code (CAMP_CD_CAMPO).

Each fields is also related to the basin in which it is located (**field** *located_in* **basin**)

In [10]:
lista_campos = 'resources/campo/campos.json'
relacoes_campo_bacia = 'resources/relacoes/campo_bacia.json'

In [11]:
with open(lista_campos, 'r') as f:
    individuos = json.load(f)

#with open(relacoes_campo_bacia, 'r') as f:
#    relacoes = json.load(f)
    
for individuo in individuos:
    new_ind=onto.field('CAMP_CD_CAMPO_'+str(individuo).zfill(4))
    for sinonimo in individuos[individuo]:
        new_ind.label.append(sinonimo)

#As relações serão inseridas de forma separada
#    for bacia in onto.search(iri = "*BASE_CD_BACIA_*"):
#        if relacoes[individuo] in bacia.label:
#            new_ind.located_in.append(bacia)

#### Insert list of lithostratigraphic units as individuals

Creates instances for the LITHOSTRATIGRAPHIC_UNIT entity. Each instance is registered under a sequential numeric code.

In [12]:
lista_unidades_litoestratigraficas = 'resources/litoestratigrafia/unidades_litoestratigraficas.json'
with open(lista_unidades_litoestratigraficas, 'r') as f:
    individuos = json.load(f)

In [13]:
for formacao in individuos['formation'].keys():
    new_formation=onto.formation(formacao)
    for nome_unidade in individuos['formation'][formacao]:
        new_formation.label.append(nome_unidade)

for grupo in individuos['group'].keys():
    new_group=onto.group(grupo)
    for nome_unidade in individuos['group'][grupo]:
        new_group.label.append(nome_unidade)
        
for membro in individuos['member'].keys():
    new_member=onto.member(membro)
    for nome_unidade in individuos['member'][membro]:
        new_member.label.append(nome_unidade)  

new_lito=onto.lithostratigraphic_unit('SD_000')
new_lito.label.append('Embasamento')

#### Insert geological structure instances

Creates instances for the GEOLOGICAL STRUCTURE entity. Each instance is registered under a URI with an unique numeric code.

In [14]:
lista_estruturas = 'resources/estrutura_textura_porosidade/estrutura.json'

In [15]:
with open(lista_estruturas, 'r') as f:
    individuos = json.load(f)

for individuo in individuos:
    new_ind=onto.geological_structure('TEFR_CD_TIPO_EST_FISICA_ROCHA_'+str(individuo).zfill(3))
    new_ind.label.append(individuos[individuo])        

#### Insert texture instances

Creates instances for the TEXTURE entity. Each instance is registered under a URI with an unique numeric code.

In [16]:
lista_texturas = 'resources/estrutura_textura_porosidade/textura.json'

In [17]:
with open(lista_texturas, 'r') as f:
    individuos = json.load(f)

for individuo in individuos:
    #new_ind=onto.textura('TIPH_CD_TIPO_POROSIDADE_ROCHA_'+str(individuo).zfill(3))  #AVALIAR NOVA NOMENCLATURA
    new_ind=onto.textura('textura_'+str(individuo).zfill(3))
    new_ind.label.append(individuos[individuo]) 

#### Insert porosity types instances

Creates instances for the POROSITY entity. Each instance is registered under a URI with an unique numeric code.

In [18]:
lista_porosidades = 'resources/estrutura_textura_porosidade/porosidade.json'

In [19]:
with open(lista_porosidades, 'r') as f:
    individuos = json.load(f)

for individuo in individuos:
    #new_ind=onto.tipo_de_porosidade('TIPH_CD_TIPO_POROSIDADE_ROCHA'+str(individuo).zfill(3))  #PROPOSTA PARA ADEQUAR A PADRAO BDIEP
    new_ind=onto.tipo_de_porosidade('porosidade_'+str(individuo).zfill(2))
    new_ind.label.append(individuos[individuo]) 

#### Insert list of chronostratigraphic units as individuals

Creates instances for the CHRONOSTRATIGRAPHIC_UNIT entity. Each instance is registered under a URI that represents the instance name.

In [20]:
lista_unidades_cronoestratigraficas = 'resources/cronoestratigrafia/unidades_cronoestratigraficas.json'
with open(lista_unidades_cronoestratigraficas, 'r') as f:
    individuos = json.load(f)

In [23]:
for tipo_unidade_crono in individuos.keys():
    #print(onto.search(iri = '*'+key))
    for unidade_crono in individuos[tipo_unidade_crono].keys():
        new_ind = onto.search(iri = ontology_iri+'#'+tipo_unidade_crono)[0](unidade_crono)
        for nome_unidade in individuos[tipo_unidade_crono][unidade_crono]:
            new_ind.label.append(nome_unidade)

In [24]:
len(list(onto.individuals()))

1642

#### Insert list of wells as individuals

In [30]:
def _semhifen(name):
    # DERIVANDO TERMO SEM OS HÍFENS 
    # EX. 3-RJS-739  => 3RJS739
    # EX. 7-CRT-17HP-RJS => 7CRT17HPRJS
    return(name.replace("-",""))

def _semhifen_semuf(name):
    # DERIVANDO TERMO SEM OS HÍFENS e sem o identificador de UF ao final  
    # EX. 7-CRT-17HP-RJS => 7CRT17HP
    return(re.sub("-[A-Z]{0,3}$", '', name).replace("-",""))

def _seminicio(name):
    # EX. 7-CRT-17HP-RJS => CRT-17HP-RJS
    return(re.sub("^[0-9]-", '', name))

def _semfim(name):
    # EX. 7-CRT-17HP-RJS => 7-CRT-17HP
    return(re.sub("-[A-Z]{0,3}$", '', name))

def _semtipo(name):
    # retira indicação de tipo -> D H P A B C
    # EX. 7-CRT-17HP-RJS => 7-CRT-17-RJS
    return(re.sub("(?<=[0-9])[A-Z]{0,3}-", '-', name))

def _versaocurta(name):
    # CRIAR ALTERNATIVA AO POCO_NM_COMPLETO COM NOME CURTO MUITO USUAL EM DOCUMENTOS
    # EX. 8-LL-108D-RJS  => LL-108D
    # EX. 3-RJS-739  => RJS-739
    # EX. 3-RJS-739A => RJS-739A
    #^ => identifica	início da linha 	modelo = "^abc" 	Match com = "abcde" 	associa texto que inicia com a sequência "abc", embora não "yabc".
    #$ => identifica	fim da linha 	modelo = "abc$" 	Match com = "yzabc" 	associa texto que termina com a sequência "abc", embora não "abcde". 
    return(re.sub("((^[0-9]-)|(-[A-Z]{0,3}$))", '', name))
    
def _well_names(index, row):
    wells = []
    
    SG_PRFX_POCO = row['DMPO_SG_PRFX_POCO']
    wells.append(SG_PRFX_POCO)
    wells.append(_semhifen(SG_PRFX_POCO))
    wells.append(_semhifen_semuf(SG_PRFX_POCO))
    wells.append(_seminicio(SG_PRFX_POCO))
    wells.append(_semfim(SG_PRFX_POCO))
    wells.append(_semtipo(SG_PRFX_POCO))
    wells.append(_versaocurta(SG_PRFX_POCO))
    
    if row['DMPO_NM_CMPT_POCO'] != '':
        NM_CMPT_POCO = row['DMPO_NM_CMPT_POCO']
        wells.append(NM_CMPT_POCO)
        wells.append(_semhifen(NM_CMPT_POCO))
        wells.append(_semhifen_semuf(NM_CMPT_POCO))
        wells.append(_seminicio(NM_CMPT_POCO))
        wells.append(_semfim(NM_CMPT_POCO))
        wells.append(_semtipo(NM_CMPT_POCO))
        wells.append(_versaocurta(NM_CMPT_POCO))
    
    if row['DMPO_SG_PRFX_POCO_ANP'] != '':
        SG_PRFX_POCO_ANP = row['DMPO_SG_PRFX_POCO_ANP']
        wells.append(SG_PRFX_POCO_ANP)
        wells.append(_semhifen(SG_PRFX_POCO_ANP))
        wells.append(_semhifen_semuf(SG_PRFX_POCO_ANP))
        wells.append(_seminicio(SG_PRFX_POCO_ANP))
        wells.append(_semfim(SG_PRFX_POCO_ANP))
        wells.append(_semtipo(SG_PRFX_POCO_ANP))
        wells.append(_versaocurta(SG_PRFX_POCO_ANP))

    if row['DMPO_SG_PREF_POCO_DEPEX'] != '':
        # DERIVANDO TERMO SEM OS ESPAÇOS 
        # EX. 1EDA 0001 BA  => 1EDA0001BA
        # EX. 1EBAN0001 SE  => 1EBAN0001SE
        SG_PREF_POCO_DEPEX_SEMESPACO = row['DMPO_SG_PREF_POCO_DEPEX'].replace(" ","")
        wells.append(SG_PREF_POCO_DEPEX_SEMESPACO)
    
        # DERIVANDO TERMO SEM OS ZEROS A ESQUERDA
        # EX. 1EBAN0001SE  => 1EBAN1SE
        # O techo (?<=[A-Z]) -> verifica se tem letra antes mas não considera na substituição, é chamado de asserção retroativa positiva
        wells.append(re.sub("(?<=[A-Z])0{1,3}", '', SG_PREF_POCO_DEPEX_SEMESPACO))

        # DERIVANDO TERMO SEM OS ESPAÇOS ENTRE OS IDENTIFICADORES PARA HOMOGENEIZAR COM OUTRAS FONTES
        # EX. 1EDA 0001 BA  => 1-EDA-0001-BA
        # EX. 1EBAN0001 SE  => 1-EBAN-0001-SE
        SG_PREF_POCO_DEPEX_COMHIFEN = re.sub("\s{1,5}", '-', row['DMPO_SG_PREF_POCO_DEPEX']) # SUBSTITUI ESPAÇOS
        SG_PREF_POCO_DEPEX_COMHIFEN = re.sub("(?<=[A-Z])0", '-0', SG_PREF_POCO_DEPEX_COMHIFEN)
        SG_PREF_POCO_DEPEX_COMHIFEN = re.sub("(?<=[A-Z])00", '-00', SG_PREF_POCO_DEPEX_COMHIFEN)
        SG_PREF_POCO_DEPEX_COMHIFEN = re.sub("(?<=[A-Z])000", '-000', SG_PREF_POCO_DEPEX_COMHIFEN)
        wells.append(SG_PREF_POCO_DEPEX_COMHIFEN)
    
        # DERIVANDO TERMO SEM OS ZEROS A ESQUERDA E COM HÍFEN INICIAL NA SEGUNDA POSIÇÃO
        # EX. 7CB-0017D-SES  => 7-CB-0017D-SES
        s = SG_PREF_POCO_DEPEX_COMHIFEN
        s = s[:1] + "-" +  s[1:]
        wells.append(s)
    
        # DERIVANDO TERMO SEM OS ZEROS A ESQUERDA
        # EX. 7CB-0017D-SES  => 7CB-17D-SES
        # como existem dados ruins na base onde não existe o hífen para referenciar, tenho que tratar
        SG_PREF_POCO_DEPEX_COMHIFEN_SEMZERONAESQUERDA = re.sub("(?<=[A-Z]|-)0{1,3}", '', SG_PREF_POCO_DEPEX_COMHIFEN)
        wells.append(SG_PREF_POCO_DEPEX_COMHIFEN_SEMZERONAESQUERDA)

        # DERIVANDO TERMO SEM OS ZEROS A ESQUERDA E COM HÍFEN INICIAL NA SEGUNDA POSIÇÃO
        # EX. 7CB-17D-SES  => 7-CB-17D-SES
        s = SG_PREF_POCO_DEPEX_COMHIFEN_SEMZERONAESQUERDA
        s = s[:1] + "-" +  s[1:]
        wells.append(s)

    return(set(wells))

In [31]:
def _well_type(row):
    wellTypeMap = {onto.well: ['NÃO ATRIBUÍDO'],
                   onto.special_well: ['ESPECIAL'],
                   onto.explotatory_well: ['INJECAO', 'PRODUCAO'],
                   onto.adjacent_well: ['PIONEIRO ADJACENTE'],
                   onto.appraisal_well: ['EXTENSAO'],
                   onto.deeper_prospect_well: ['JAZIDA MAIS PROFUNDA'],
                   onto.shallower_prospect_well: ['JAZIDA MAIS RASA'],
                   onto.stratigraphic_well: ['ESTRATIGRAFICO'],
                   onto.wildcat_well: ['PIONEIRO']
                  }
    for key, names in wellTypeMap.items():
        if row['DMPO_NM_CLSS_POCO'] in names:
            new_well = key('POCO_CD_POCO_'+str(row['DMPO_CD_POCO']).zfill(6))
    return new_well

In [32]:
def _well_quality(row):
    well_quality = -1
    wellQualityMap = {onto.abandonned_well: ['ABANDONADO POR ACIDENTE MECANICO',
                                             'ABANDONADO POR BLOW-OUT',
                                             'ABANDONADO POR IMPOSSIBILIDADE DE AVALIACAO',
                                             'ABANDONADO POR OBJETIVO FORA DE PREVISAO',
                                             'ABANDONADO POR OBJETIVO/ALVO NAO ATINGIDO',
                                             'ABANDONADO POR OUTRAS RAZOES',
                                             'ABANDONADO POR PERDA DE CIRCULACAO'
                                            ] ,
                      onto.commercial_well: ['PRODUTOR COMERCIAL DE GAS',
                                             'PRODUTOR COMERCIAL DE GAS E CONDENSADO',
                                             'PRODUTOR COMERCIAL DE OLEO',
                                             'PRODUTOR COMERCIAL DE OLEO E GAS',
                                             'PRODUTOR COMERCIAL DE OLEO, GAS E CONDENSADO'
                                            ],
                      onto.discovery_well: ['DESCOBRIDOR DE CAMPO COM GAS ',
                                            'DESCOBRIDOR DE CAMPO COM GAS E CONDENSADO ',
                                            'DESCOBRIDOR DE CAMPO COM OLEO ',
                                            'DESCOBRIDOR DE CAMPO COM OLEO E GAS ',
                                            'DESCOBRIDOR DE CAMPO COM OLEO, GAS E CONDENSADO',
                                            'DESCOBRIDOR DE NOVA JAZIDA COM GAS',
                                            'DESCOBRIDOR DE NOVA JAZIDA COM GAS E CONDENSADO',
                                            'DESCOBRIDOR DE NOVA JAZIDA COM OLEO',
                                            'DESCOBRIDOR DE NOVA JAZIDA COM OLEO E GAS',
                                            'DESCOBRIDOR DE NOVA JAZIDA COM OLEO, GAS E CONDENSADO'
                                           ],
                      onto.dry_hole_without_traces_of_hydrocarbon: ['SECO SEM INDICIOS DE PETROLEO'
                                                                   ],
                      onto.dry_hole_with_traces_of_hydrocarbon: ['SECO COM INDICIOS DE GAS',
                                                                 'SECO COM INDICIOS DE GAS E CONDENSADO',
                                                                 'SECO COM INDICIOS DE OLEO',
                                                                 'SECO COM INDICIOS DE OLEO E GAS',
                                                                 'SECO COM INDICIOS DE OLEO, GAS E CONDENSADO'
                                                                ],
                      onto.well_with_hydrocarbon:['PORTADOR DE GAS',
                                                  'PORTADOR DE GAS E CONDENSADO',
                                                  'PORTADOR DE OLEO',
                                                  'PORTADOR DE OLEO E GAS',
                                                  'PORTADOR DE OLEO, GAS E CONDENSADO'
                                                 ],
                      onto.subcommercial_well: ['PRODUTOR SUBCOMERCIAL DE GAS ',
                                                'PRODUTOR SUBCOMERCIAL DE GAS E CONDENSADO ',
                                                'PRODUTOR SUBCOMERCIAL DE OLEO',
                                                'PRODUTOR SUBCOMERCIAL DE OLEO E GAS ',
                                                'PRODUTOR SUBCOMERCIAL DE OLEO,GAS E CONDENSADO'
                                               ]
                     }
    for key, name in wellQualityMap.items():
        if row['DMPO_NM_RCLS_POCO'] in name:
            well_quality = key
    return well_quality

In [33]:
def _create_well_instance(row, generate_synonyms = False):
    if generate_synonyms:
        wells = _well_names(row)
    else:
        wells = []
        wells.append(row['DMPO_SG_PRFX_POCO'])
        if row['DMPO_NM_CMPT_POCO'] != '':
            wells.append(row['DMPO_NM_CMPT_POCO'])
        if row['DMPO_SG_PRFX_POCO_ANP'] != '':
            wells.append(row['DMPO_SG_PRFX_POCO_ANP'])
        wells = set(wells)   
        
    new_well = _well_type(row)
    #well_quality = _well_quality(row)
    for well in wells:
        new_well.label.append(well)

In [34]:
df = pd.read_excel('resources/poco/wellData.xlsx')

In [35]:
df_wells = df.fillna('')

In [36]:
for i, row in df_wells.iterrows():
    _create_well_instance(row)
    print(i)
    clear_output()

In [37]:
onto.save(file="OntoGeoLogicaInstancias.owl")

#### Insert Relations

In [None]:
def fill_zeros(x):
    if isinstance(x, str):
        return(0)
    else:
        return x

def treat_tables(df_poco, df_crono, df_unilito, df_lito):
    #NO EXPLORA ESTÃO VINDO COM CARACTERE ADICIONAL VAZIO
    df_poco.dropna(subset=['Sigla'], inplace=True)  
    df_poco['Sigla'] = df_poco['Sigla'].apply(lambda x: x[1:])
    
    df_unilito['Unidade'] = df_unilito['Unidade'].apply(lambda x: x[1:])
    df_unilito['Tipo Unidade'] = df_unilito['Tipo Unidade'].apply(lambda x: x[1:])
    
    df_crono['Unidade'] = df_crono['Unidade'].apply(lambda x: x[1:])
    df_lito['Litologia'] = df_lito['Litologia'].apply(lambda x: x[1:])
    
    df_unilito['Topo'] = df_unilito['Topo'].apply(lambda x: fill_zeros(x))
    df_unilito['Base'] = df_unilito['Base'].apply(lambda x: fill_zeros(x))
    df_crono['Topo'] = df_crono['Topo'].apply(lambda x: fill_zeros(x))
    df_crono['Base'] = df_crono['Base'].apply(lambda x: fill_zeros(x))
    df_lito['Topo'] = df_lito['Topo'].apply(lambda x: fill_zeros(x))
    df_lito['Base'] = df_lito['Base'].apply(lambda x: fill_zeros(x))
    
    df_litoestratigrafia = pd.merge(df_poco, df_unilito, how='outer')
    df_litoestratigrafia['Bacia'] = df_litoestratigrafia['Bacia'].apply(lambda x: x[1:])
    
    return(df_litoestratigrafia, df_crono, df_lito)

In [None]:
'''
#ESSA PARTE DAS RELACOES SERA EXECUTADA POSTERIORMENTE
    if well_quality != -1:
        quality_label = str(well_quality).split('.')[1]
        new_quality = well_quality(quality_label+'_'+str(row['DMPO_CD_POCO']).zfill(6))
        new_quality.label.append(well_quality.label[0])
        new_well.has_quality.append(new_quality)
    
    for bacia in onto.search(iri = "*BASE_CD_BACIA_*"):
        if row['DMPO_NM_BACI'] in bacia.label:
            new_well.located_in.append(bacia)
    
    for campo in onto.search(iri = "*CAMP_CD_CAMPO_*"):
        if row['DMPO_NM_CAMP'] in campo.label:
            new_well.located_in.append(campo)
'''

In [None]:
def _create_well_relations(df, onto, df_litoestratigrafia, df_crono, df_lito,
                           bacia_mapper, crono_mapper, lito_mapper):
    poco_problema=[]
    unidade_lito_problema=[]
    litologia_problema=[]
    for i in list(df_litoestratigrafia.dropna(subset=['Unidade']).index):
        print(str(i)+'/'+str(len(df_litoestratigrafia)))
        #Procura a Bacia onde se localiza a Unidade Litoestratigráfica
        bacia  = [k for k, v in bacia_mapper.items() if df_litoestratigrafia.loc[i]['Bacia'] in v]
        if len(bacia)==0:
            print('Bacia não encontrada:', df_litoestratigrafia.loc[i]['Bacia'])
        else:
            ind_bacia = onto.search(iri = '*BASE_CD_BACIA_'+bacia[0].zfill(3))
        if df_litoestratigrafia.loc[i]['Sigla'] not in list(df['DMPO_NM_CMPT_POCO']):
            #Verifica se o poço atravessado pela unidade lito consta da lista de poços que popula a ontologia
            poco_problema.append(df_litoestratigrafia.loc[i]['Sigla'])
        else:
            key_poco = str(list(df[df['DMPO_NM_CMPT_POCO']==df_litoestratigrafia.loc[i]['Sigla']]['DMPO_CD_POCO'])[0]).zfill(6)
            ind_poco = [f for f in onto.search(iri ="*POCO_CD_POCO*") if key_poco in str(f)]
            if len(ind_poco) == 1:
                topo_lito = float(df_litoestratigrafia.loc[i]['Topo'])
                base_lito = float(df_litoestratigrafia.loc[i]['Base'])
                tipo_unidade = unicodedata.normalize('NFD',df_litoestratigrafia.loc[i]['Tipo Unidade'].lower())
                tipo_unidade = tipo_unidade.encode('ascii', 'ignore').decode('ascii', 'ignore')
                #Verifica se a Unidade Litoestratigráfica consta da lista de unidades que popula a ontologia
                if len(onto.search(iri = "*"+tipo_unidade+"*"))==0:
                    #Verifica se o a unidade lito consta da lista de unidades que popula a ontologia
                    unidade_lito_problema.append(df_litoestratigrafia.loc[i]['Unidade'])
                for unilito in onto.search(iri = "*"+tipo_unidade+"*"):
                    labels = unilito.label
                    labels = [l.lower() for l in labels]
                    labels = [unicodedata.normalize('NFD', l).encode('ascii', 'ignore').decode('ascii', 'ignore') 
                              for l in labels]
                    if df_litoestratigrafia.loc[i]['Unidade'].lower() in labels:
                        ind_poco[0].atravessa.append(unilito)
                        for bacia in ind_bacia:
                            unilito.located_in.append(bacia)
                        #PREENCHIMENTO DAS RELAÇÕES DE UNIDADES CRONOESTRATIGRÁFICAS COM A LITOESTRATIGRÁFICAS (tem_idade)
                        df_cronoestratigrafia = df_crono[df_crono['Poço']==df_litoestratigrafia['Poço'][i]]
                        for j in list(df_cronoestratigrafia.index):
                            topo_crono = float(df_cronoestratigrafia.loc[j]['Topo'])
                            base_crono = float(df_cronoestratigrafia.loc[j]['Base'])
                            #idade = unicodedata.normalize('NFD',df_cronoestratigrafia.loc[i]['Unidade'].lower())
                            #idade = idade.encode('ascii', 'ignore').decode('ascii', 'ignore')
                            if (topo_lito!=0) & (base_lito!=0) & (topo_crono!=0):
                                if (((topo_lito >= topo_crono)&(topo_lito <= base_crono))|
                                    ((base_lito >= topo_crono)&(base_lito <= base_crono))):
                                    crono = [k for k, v in crono_mapper.items() if 
                                             df_cronoestratigrafia.loc[j]['Unidade'] in v][0].split('.')[1]
                                    crono_quality = onto.search(iri = '*'+crono)[0]
                                    geochronology = crono.replace("_quality", "")
                                    crono_geochronology = onto.search(iri = '*'+geochronology)[0]
                                    crono_unilito = str(crono_quality).split('.')[1]+'_'+str(unilito).split('.')[1].zfill(4)
                                    if len(onto.search(iri = '*'+crono_unilito))==0:
                                        new_crono_quality = crono_quality(crono_unilito)
                                        unilito.has_age.append(new_crono_quality)
                                        new_crono_quality.label.append(crono_quality.label[0])
                                        new_crono_quality.participates_in.append(crono_geochronology)
                                elif ((topo_lito < topo_crono)&(base_lito > base_crono)):
                                    crono = [k for k, v in crono_mapper.items() if 
                                             df_cronoestratigrafia.loc[j]['Unidade'] in v][0].split('.')[1]
                                    crono_quality = onto.search(iri = '*'+crono)[0]
                                    geochronology = crono.replace("_quality", "")
                                    crono_geochronology = onto.search(iri = '*'+geochronology)[0]
                                    crono_unilito = str(crono_quality).split('.')[1]+'_'+str(unilito).split('.')[1].zfill(4)
                                    if len(onto.search(iri = '*'+crono_unilito))==0:
                                        new_crono_quality = crono_quality(crono_unilito)
                                        unilito.has_age.append(new_crono_quality)
                                        new_crono_quality.label.append(crono_quality.label[0])
                                        new_crono_quality.participates_in.append(crono_geochronology)
                        #POVOAMENTO DAS LITOLOGIAS QUE COMPÕEM LITOESTRATIGRAFIAS
                        df_litologia = df_lito[df_lito['Poço']==df_litoestratigrafia['Poço'][i]]
                        lito = []
                        for k in list(df_litologia.index):
                            topo_rocha = float(df_litologia.loc[k]['Topo'])
                            base_rocha = float(df_litologia.loc[k]['Base'])
                            litologia = unicodedata.normalize('NFD',df_litologia.loc[k]['Litologia'].lower())
                            if (topo_lito!=0) & (base_lito!=0) & (topo_rocha!=0):
                                if ((topo_rocha >= topo_lito)&(base_rocha <= base_lito)):
                                    if litologia in [l for sublist in list(lito_mapper.values()) for l in sublist]:
                                        lito.append([k for k, v in lito_mapper.items() if 
                                                     litologia in v][0].split('.')[1])
                        for l in set(lito):
                            if len(onto.search(iri = '*'+l+'*'))>0:
                                name_ind = (l+'_'+str(unilito).split('.')[1]).zfill(4)
                                if len(onto.search(iri = '*'+name_ind))==0:
                                    #print(name_ind)
                                    new_ind = onto.search(iri = '*'+l)[0](name_ind)
                                    unilito.constituted_by.append(new_ind)
                                    labels=onto.search(iri = '*'+l)[0].label
                                    for label in labels:
                                        new_ind.label.append(label)
                                #else:
                                    #print('rocha existente')
                            else:
                                litologia_problema.append(l)
                        break
            else:
                print('mais de um poço')
    return(poco_problema, unidade_lito_problema, litologia_problema)

In [None]:
with open('resources/bacia/bacias.json', 'r') as f:
    bacia_mapper = json.load(f)

In [None]:
bacia_mapper['281'].append('CAMPOS (MAR)')
bacia_mapper['260'].append('MUCURI (TERRA)')
bacia_mapper['116'].append('SERGIPE (TERRA)')
bacia_mapper['116'].append('SERGIPE (MAR)')
bacia_mapper['90'].append('PARNAIBA')
bacia_mapper['20'].append('SOLIMOES')
bacia_mapper['60'].append('BRAGANCA-VIZEU')
bacia_mapper['100'].append('POTIGUAR (TERRA)')
bacia_mapper['240'].append('RECONCAVO (TERRA)')
bacia_mapper['240'].append('RECONCAVO (MAR)')
bacia_mapper['270'].append('ESPIRITO SANTO (TERRA)')

In [None]:
with open('resources/cronoestratigrafia/unidades_crono.json', 'r') as f:
    crono_mapper = json.load(f)

In [None]:
for age in crono_mapper:
    for label in crono_mapper[age]:
        norm_label = unicodedata.normalize('NFD',label).encode('ascii', 'ignore').decode('ascii', 'ignore')
        if norm_label not in crono_mapper[age]:
            crono_mapper[age].append(norm_label)

In [None]:
crono_mapper['onto.Ypresian_quality'].append('Eoceno Inferior')
crono_mapper['onto.Eoriodaserra_Subage_quality'].append('Rio da Serra Inferior')

In [None]:
crono_mapper['onto.Upper_Frasnian_Subage_quality'] = ['Neofrasniano',
                                                      'Frasniano Superior',
                                                      'Subandar Frasniano Superior',
                                                      'Subidade Neofrasniana']

In [None]:
with open('resources/litologia/litologia.json', 'r') as f:
    lito_mapper = json.load(f)

In [None]:
#onto_path.append("/ner_geologica/GeoCoreOntology.owl")
#onto = get_ontology("file://ner_geologica/ner_geologica.owl")
onto = get_ontology("file://OntoGeoLogicaPovoadaInstanciasRelacoes.owl")

In [None]:
chave  = os.getenv('BG40')
senha  = getpass('Senha: ')

os.environ['HTTP_PROXY']  = f'http://{chave}:{senha}@inet-sys.petrobras.com.br:804'
os.environ['HTTPS_PROXY'] = f'http://{chave}:{senha}@inet-sys.petrobras.com.br:804'
os.environ['NO_PROXY']    = '127.0.0.1, localhost, petrobras.com.br, petrobras.biz'

In [None]:
onto.load()

In [None]:
len(onto.search(iri = '*sandstone*'))

In [None]:
#JACUIPE, 'PANTANAL',
bacias=['ACRE', 'AMAZONAS', 'BARREIRINHAS', 'BRAGANCA-VIZEU', 'CAMAMU-ALMADA', 'CEARA',
        'CUMURUXATIBA', 'FOZ_DO_AMAZONAS', 'JATOBA', 'JEQUITINHONHA', 'MARAJO', 'MUCURI_MAR', 'MUCURI_TERRA',
        'PARA-MARANHAO','PARANA', 'PARECIS-ALTO_XINGU', 'PARNAIBA', 'PELOTAS', 'PERNAMBUCO-PARAIBA', 'RIO_DO_PEIXE',
        'SAO_FRANCISCO', 'SAO_LUIS', 'SOLIMOES', 'TACUTU', 'TUCANO_CENTRAL', 'TUCANO_NORTE', 'TUCANO_SUL',
        'SANTOS','CAMPOS', 'POTIGUAR', 'ESPIRITO_SANTO', 'SERGIPE-ALAGOAS', 'RECONCAVO']

In [None]:
#bacias = []
poco_problema=[]
unidade_lito_problema=[]
litologia_problema=[]

for b in bacias:
    clear_output()
    print(b)
    df_poco = pd.read_excel('resources/explora/'+b+'_Informações_Gerais.xlsx')
    df_crono = pd.read_excel('resources/explora/'+b+'_Cronoestratigrafia.xlsx')
    df_unilito = pd.read_excel('resources/explora/'+b+'_Litoestratigrafia.xlsx')
    df_lito = pd.read_excel('resources/explora/'+b+'_Litologia_Interpretada.xlsx')
    df_litoestratigrafia, df_crono, df_lito = treat_tables(df_poco, df_crono, df_unilito, df_lito)
    p, u, l = _create_well_relations(df, onto, df_litoestratigrafia, df_crono, df_lito,
                                     bacia_mapper, crono_mapper, lito_mapper)
    
    onto.save(file="OntoGeoLogicaPovoadaInstanciasRelacoes.owl")
    poco_problema.append(p)
    unidade_lito_problema.append(u)
    litologia_problema.append(l)

In [None]:
onto.search(iri = '*Jiquia_Age_quality*')

In [None]:
with onto:
    sync_reasoner()

In [None]:
onto.Paleogene.has_participant

In [None]:
onto.formacao_088.has_age

In [None]:
onto.formacao_088.crossed_by

In [None]:
onto.POCO_CD_POCO_022601.atravessa

In [None]:
onto.formacao_088.constituted_by

In [None]:
onto.formacao_088.located_in

In [None]:
onto.BASE_CD_BACIA_010.location_of