# Carga de dados - textos de queries e enunciados

In [1]:
import pandas as pd
import ast

In [2]:
df_queries = pd.concat([pd.read_csv('../../data/juris_tcu/query1.csv', sep=';', index_col='QUERY_ID'),
                        pd.read_csv('../../data/juris_tcu/query2.csv', sep=';', index_col='QUERY_ID'),
                        pd.read_csv('../../data/juris_tcu/query3.csv', sep=';', index_col='QUERY_ID')])
df_queries

Unnamed: 0_level_0,QUERY_TEXT
QUERY_ID,Unnamed: 1_level_1
1,técnica e preço
2,restos a pagar
3,aditivo a contrato
4,adesão a ata de registro de preços
5,sobrepreço e superfaturamento
...,...
146,É possível a inclusão de serviços já previstos...
147,O princípio da legalidade estrita pode ser afa...
148,Quais fontes devem ser prioritárias na pesquis...
149,Devem ser aceitas nas contratações de software...


In [3]:
df_enunciados = pd.read_csv('../../data/juris_tcu/doc.csv', index_col='ID')[['TEXT']].rename_axis('DOC_ID')
df_enunciados.columns = ['DOC_TEXT']
df_enunciados

Unnamed: 0_level_0,DOC_TEXT
DOC_ID,Unnamed: 1_level_1
13568,É ilegal a contagem de tempo ficto de serviço ...
11614,"SÚMULA TCU 283: Para fim de habilitação, a Adm..."
21087,A contratação de serviços por preços superiore...
35016,"Não se aplica, excepcionalmente, multa aos ges..."
29370,"Em contratatações de TI, não cabe aceitar prop..."
...,...
55,"SÚMULA TCU 51: Quando, no exame e julgamento d..."
95,"SÚMULA TCU 91: A falta de remessa, em tempo há..."
94,"SÚMULA TCU 90: O Parecer Prévio, em sentido fa..."
15,SÚMULA TCU 11: A omissão da remessa de contas ...


# Carga de resultados de busca e criação de dados de avaliação

In [4]:
def build_eval_data(run_path, df_queries, df_docs):
    df_run = pd.read_csv(run_path)
    df_run = df_run.merge(df_queries, on='QUERY_ID')
    df_run = df_run.merge(df_docs, on='DOC_ID')
    return df_run

In [5]:
df_bm25 = build_eval_data('../../data/search/juris_tcu/run_bm25.csv', df_queries, df_enunciados)
df_bm25

Unnamed: 0,QUERY_ID,RANK,DOC_ID,ENGINE,QUERY_TEXT,DOC_TEXT
0,1,1,20870,BM25,técnica e preço,"Nas licitações do tipo técnica e preço, a atri..."
1,5,281,20870,BM25,sobrepreço e superfaturamento,"Nas licitações do tipo técnica e preço, a atri..."
2,7,149,20870,BM25,acréscimos e supressões,"Nas licitações do tipo técnica e preço, a atri..."
3,10,124,20870,BM25,diarias e passagens,"Nas licitações do tipo técnica e preço, a atri..."
4,16,800,20870,BM25,inexequibilidade e comprovação,"Nas licitações do tipo técnica e preço, a atri..."
...,...,...,...,...,...,...
142078,149,920,85627,BM25,Devem ser aceitas nas contratações de software...,"A relação de dependência econômica, para fins ..."
142079,149,921,6969,BM25,Devem ser aceitas nas contratações de software...,"A relação de dependência econômica, para fins ..."
142080,149,982,30266,BM25,Devem ser aceitas nas contratações de software...,"O tempo de serviço exercido até 16/12/1998, da..."
142081,150,102,15329,BM25,Qual é a regra geral para a contratação de ent...,Os Serviços Sociais Autônomos observarão a reg...


In [6]:
df_sts = build_eval_data('../../data/search/juris_tcu/run_sts.csv', df_queries, df_enunciados)
df_sts

Unnamed: 0,QUERY_ID,RANK,DOC_ID,ENGINE,QUERY_TEXT,DOC_TEXT
0,1,1,34233,SentenceTransformerS,técnica e preço,Os fatores de avaliação das propostas técnicas...
1,8,236,34233,SentenceTransformerS,obras e serviços de engenharia,Os fatores de avaliação das propostas técnicas...
2,11,240,34233,SentenceTransformerS,bens e serviços comuns,Os fatores de avaliação das propostas técnicas...
3,12,109,34233,SentenceTransformerS,parcelas de maior relevância e valor significa...,Os fatores de avaliação das propostas técnicas...
4,15,125,34233,SentenceTransformerS,contas e materialidade,Os fatores de avaliação das propostas técnicas...
...,...,...,...,...,...,...
74995,150,455,30044,SentenceTransformerS,Qual é a regra geral para a contratação de ent...,É ilegal a inclusão nos proventos de servidor ...
74996,150,461,19599,SentenceTransformerS,Qual é a regra geral para a contratação de ent...,"A partir de 18/5/2001, data da publicação da d..."
74997,150,462,82304,SentenceTransformerS,Qual é a regra geral para a contratação de ent...,"A transformação, por lei, de emprego público e..."
74998,150,464,110843,SentenceTransformerS,Qual é a regra geral para a contratação de ent...,"A transformação, por lei, de emprego público e..."


In [7]:
df_bm25_reranker = build_eval_data('../../data/search/juris_tcu/run_bm25_reranker.csv', df_queries, df_enunciados)
df_bm25_reranker

Unnamed: 0,QUERY_ID,RANK,DOC_ID,ENGINE,QUERY_TEXT,DOC_TEXT
0,1,1,21064,BM25+Reranker,técnica e preço,Admite-se a preponderância da técnica sobre o ...
1,6,99,21064,BM25+Reranker,restrição a competitividade,Admite-se a preponderância da técnica sobre o ...
2,31,299,21064,BM25+Reranker,medida cautelar,Admite-se a preponderância da técnica sobre o ...
3,72,2,21064,BM25+Reranker,ponderação técnica e preço,Admite-se a preponderância da técnica sobre o ...
4,73,68,21064,BM25+Reranker,pontuação desarrazoada licitações técnica e preço,Admite-se a preponderância da técnica sobre o ...
...,...,...,...,...,...,...
44178,150,280,33564,BM25+Reranker,Qual é a regra geral para a contratação de ent...,"É reconhecido o direito à ""opção"" aos servidor..."
44179,150,285,130287,BM25+Reranker,Qual é a regra geral para a contratação de ent...,Em casos de acumulação de remuneração e pensão...
44180,150,286,141744,BM25+Reranker,Qual é a regra geral para a contratação de ent...,Em casos de acumulação de remuneração e pensão...
44181,150,289,13169,BM25+Reranker,Qual é a regra geral para a contratação de ent...,A regra geral que confere efeito suspensivo ao...


In [8]:
df_sts_reranker = build_eval_data('../../data/search/juris_tcu/run_sts_reranker.csv', df_queries, df_enunciados)
df_sts_reranker

Unnamed: 0,QUERY_ID,RANK,DOC_ID,ENGINE,QUERY_TEXT,DOC_TEXT
0,1,1,21064,STS+Reranker,técnica e preço,Admite-se a preponderância da técnica sobre o ...
1,12,269,21064,STS+Reranker,parcelas de maior relevância e valor significa...,Admite-se a preponderância da técnica sobre o ...
2,72,2,21064,STS+Reranker,ponderação técnica e preço,Admite-se a preponderância da técnica sobre o ...
3,73,60,21064,STS+Reranker,pontuação desarrazoada licitações técnica e preço,Admite-se a preponderância da técnica sobre o ...
4,85,6,21064,STS+Reranker,técnica e preço profissionais quadro permanente,Admite-se a preponderância da técnica sobre o ...
...,...,...,...,...,...,...
44995,150,293,25628,STS+Reranker,Qual é a regra geral para a contratação de ent...,Atividades não relacionadas às específicas dos...
44996,150,296,28500,STS+Reranker,Qual é a regra geral para a contratação de ent...,As decisões judiciais sobre incorporações de p...
44997,150,297,30125,STS+Reranker,Qual é a regra geral para a contratação de ent...,As decisões judiciais sobre incorporações de p...
44998,150,299,18989,STS+Reranker,Qual é a regra geral para a contratação de ent...,"Ao assumir o cargo, compete ao gestor público ..."


In [9]:
df_join_bm25_sts_reranker = build_eval_data('../../data/search/juris_tcu/run_join_bm25_sts_reranker.csv', df_queries, df_enunciados)
df_join_bm25_sts_reranker

Unnamed: 0,QUERY_ID,RANK,DOC_ID,ENGINE,QUERY_TEXT,DOC_TEXT
0,1,1,21064,(BM25|STS)+Reranker,técnica e preço,Admite-se a preponderância da técnica sobre o ...
1,6,121,21064,(BM25|STS)+Reranker,restrição a competitividade,Admite-se a preponderância da técnica sobre o ...
2,12,491,21064,(BM25|STS)+Reranker,parcelas de maior relevância e valor significa...,Admite-se a preponderância da técnica sobre o ...
3,31,526,21064,(BM25|STS)+Reranker,medida cautelar,Admite-se a preponderância da técnica sobre o ...
4,72,2,21064,(BM25|STS)+Reranker,ponderação técnica e preço,Admite-se a preponderância da técnica sobre o ...
...,...,...,...,...,...,...
82026,150,511,28527,(BM25|STS)+Reranker,Qual é a regra geral para a contratação de ent...,A aposentadoria fundamentada na Lei Complement...
82027,150,521,33564,(BM25|STS)+Reranker,Qual é a regra geral para a contratação de ent...,"É reconhecido o direito à ""opção"" aos servidor..."
82028,150,539,28500,(BM25|STS)+Reranker,Qual é a regra geral para a contratação de ent...,As decisões judiciais sobre incorporações de p...
82029,150,540,30125,(BM25|STS)+Reranker,Qual é a regra geral para a contratação de ent...,As decisões judiciais sobre incorporações de p...


In [10]:
df_most_relevants = pd.read_csv('../../data/llm_juris_tcu/eval_most_relevants.csv')
df_most_relevants

Unnamed: 0,QUERY_ID,RANK,DOC_ID,ENGINE,QUERY_TEXT,DOC_TEXT,LLM_SCORE,LLM_REASONING
0,1,1,21064,(BM25|STS)+Reranker,técnica e preço,Admite-se a preponderância da técnica sobre o ...,3.0,O enunciado aborda diretamente a relação entre...
1,72,2,21064,(BM25|STS)+Reranker,ponderação técnica e preço,Admite-se a preponderância da técnica sobre o ...,3.0,"O enunciado aborda diretamente a consulta, tra..."
2,1,2,42166,(BM25|STS)+Reranker,técnica e preço,Diante da complexidade e da natureza do objeto...,3.0,"O enunciado aborda diretamente a consulta, men..."
3,111,8,42166,(BM25|STS)+Reranker,Qual é a modalidade de licitação utilizada par...,Diante da complexidade e da natureza do objeto...,2.0,O enunciado aborda a modalidade de licitação '...
4,1,3,13702,(BM25|STS)+Reranker,técnica e preço,"Nas licitações do tipo técnica e preço, é irre...",3.0,O enunciado aborda diretamente a consulta sobr...
...,...,...,...,...,...,...,...,...
1495,100,1,17892,(BM25|STS)+Reranker,assistência médica a servidores,A contratação de entidade para prestação de se...,2.0,O enunciado aborda a contratação de entidade p...
1496,150,1,17892,(BM25|STS)+Reranker,Qual é a regra geral para a contratação de ent...,A contratação de entidade para prestação de se...,3.0,"O enunciado responde diretamente à pergunta, m..."
1497,106,7,17267,(BM25|STS)+Reranker,O pregão é adequado para concessões de uso de ...,No âmbito das concessões realizadas pela Agênc...,1.0,O enunciado está relacionado ao tópico de conc...
1498,150,8,91180,(BM25|STS)+Reranker,Qual é a regra geral para a contratação de ent...,É possível a contratação da execução indireta ...,1.0,O enunciado de jurisprudência aborda a contrat...


In [11]:
df_most_relevants.groupby('QUERY_ID').count()['DOC_ID'].to_dict()

{1: 10,
 2: 10,
 3: 10,
 4: 10,
 5: 10,
 6: 10,
 7: 10,
 8: 10,
 9: 10,
 10: 10,
 11: 10,
 12: 10,
 13: 10,
 14: 10,
 15: 10,
 16: 10,
 17: 10,
 18: 10,
 19: 10,
 20: 10,
 21: 10,
 22: 10,
 23: 10,
 24: 10,
 25: 10,
 26: 10,
 27: 10,
 28: 10,
 29: 10,
 30: 10,
 31: 10,
 32: 10,
 33: 10,
 34: 10,
 35: 10,
 36: 10,
 37: 10,
 38: 10,
 39: 10,
 40: 10,
 41: 10,
 42: 10,
 43: 10,
 44: 10,
 45: 10,
 46: 10,
 47: 10,
 48: 10,
 49: 10,
 50: 10,
 51: 10,
 52: 10,
 53: 10,
 54: 10,
 55: 10,
 56: 10,
 57: 10,
 58: 10,
 59: 10,
 60: 10,
 61: 10,
 62: 10,
 63: 10,
 64: 10,
 65: 10,
 66: 10,
 67: 10,
 68: 10,
 69: 10,
 70: 10,
 71: 10,
 72: 10,
 73: 10,
 74: 10,
 75: 10,
 76: 10,
 77: 10,
 78: 10,
 79: 10,
 80: 10,
 81: 10,
 82: 10,
 83: 10,
 84: 10,
 85: 10,
 86: 10,
 87: 10,
 88: 10,
 89: 10,
 90: 10,
 91: 10,
 92: 10,
 93: 10,
 94: 10,
 95: 10,
 96: 10,
 97: 10,
 98: 10,
 99: 10,
 100: 10,
 101: 10,
 102: 10,
 103: 10,
 104: 10,
 105: 10,
 106: 10,
 107: 10,
 108: 10,
 109: 10,
 110: 10,
 111: 10

# Seleção dos menos relevantes

In [95]:
query_id = 102
K = 5
seed = 40

df_least_relevants_base = df_bm25.merge(df_most_relevants, on=['QUERY_ID', 'DOC_ID'], how='left', indicator=True, suffixes=(None, '_y')).query('_merge == "left_only"')
df_least_relevants_base = df_least_relevants_base[['QUERY_ID', 'RANK', 'DOC_ID', 'QUERY_TEXT', 'DOC_TEXT']]
print(f'Média de registros BM25 por query: {len(df_bm25) / len(df_queries):.2f}')
print(f'Média de registros avaliados por LLM, por query: {len(df_most_relevants) / len(df_queries):.2f}')
print(f'Média de registros não avaliados por LLM, por query: {len(df_least_relevants_base) / len(df_queries):.2f}')
print(f'Sampling de {K} elementos do BM25 para a query id {query_id}:')
df_least_relevants_base.query('QUERY_ID == ' + str(query_id)).sample(n=K, replace=False, random_state=seed)

Média de registros BM25 por query: 947.22
Média de registros avaliados por LLM, por query: 10.00
Média de registros não avaliados por LLM, por query: 938.03
Sampling de 5 elementos do BM25 para a query id 102:


Unnamed: 0,QUERY_ID,RANK,DOC_ID,QUERY_TEXT,DOC_TEXT
103698,102,756,98592,A citação é considerada válida após o falecime...,No caso de localidades onde a entrega postal é...
83170,102,532,28487,A citação é considerada válida após o falecime...,As decisões judiciais sobre incorporações de p...
20558,102,237,43800,A citação é considerada válida após o falecime...,"Quando a prestação de contas, apresentada após..."
137401,102,446,83774,A citação é considerada válida após o falecime...,"O processo de controle externo, disciplinado p..."
79996,102,458,104533,A citação é considerada válida após o falecime...,Enquanto não ocorre a partilha dos bens eventu...


In [93]:
for query_id, row in df_queries.iterrows():
    query_text = row['QUERY_TEXT']
    query_type = 'Pergunta' if query_id > 100 else 'Consulta'    
    print (query_type, query_id, query_text)

Consulta 1 técnica e preço
Consulta 2 restos a pagar
Consulta 3 aditivo a contrato
Consulta 4 adesão a ata de registro de preços
Consulta 5 sobrepreço e superfaturamento
Consulta 6 restrição a competitividade
Consulta 7 acréscimos e supressões
Consulta 8 obras e serviços de engenharia
Consulta 9 fiscalizacao de contratos
Consulta 10 diarias e passagens
Consulta 11 bens e serviços comuns
Consulta 12 parcelas de maior relevância e valor significativo
Consulta 13 despesa sem cobertura contratual
Consulta 14 decreto-lei 4.657/1942
Consulta 15 contas e materialidade
Consulta 16 inexequibilidade e comprovação
Consulta 17 impedimento de licitar e contratar
Consulta 18 aditivo e obra
Consulta 19 fraude a licitacao
Consulta 20 auditoria interna
Consulta 21 fracionamento de despesas
Consulta 22 novo e improrrogável prazo
Consulta 23 inidoneidade de licitante
Consulta 24 licitações e contratos
Consulta 25 exigência de atestado de capacidade
Consulta 26 contrato com a administração pública
Consult

In [114]:
seed = 40

df_least_relevants = None
first = True
for query_id, row in df_queries.iterrows():
    query_text = row['QUERY_TEXT']
    query_type = 'Pergunta' if query_id > 100 else 'Consulta'
    df = df_least_relevants_base.query('QUERY_ID == ' + str(query_id)).sample(n=5, replace=False, random_state=seed)
    if first:
        df_least_relevants = df
        first = False
    else:
        df_least_relevants = pd.concat([df_least_relevants, df])
    print (f'{query_type} {query_id:3} ({query_text}) - {len(df_least_relevants):3} registros selecionados.')
df_least_relevants

Consulta   1 (técnica e preço) -   5 registros selecionados.
Consulta   2 (restos a pagar) -  10 registros selecionados.
Consulta   3 (aditivo a contrato) -  15 registros selecionados.
Consulta   4 (adesão a ata de registro de preços) -  20 registros selecionados.
Consulta   5 (sobrepreço e superfaturamento) -  25 registros selecionados.
Consulta   6 (restrição a competitividade) -  30 registros selecionados.
Consulta   7 (acréscimos e supressões) -  35 registros selecionados.
Consulta   8 (obras e serviços de engenharia) -  40 registros selecionados.
Consulta   9 (fiscalizacao de contratos) -  45 registros selecionados.
Consulta  10 (diarias e passagens) -  50 registros selecionados.
Consulta  11 (bens e serviços comuns) -  55 registros selecionados.
Consulta  12 (parcelas de maior relevância e valor significativo) -  60 registros selecionados.
Consulta  13 (despesa sem cobertura contratual) -  65 registros selecionados.
Consulta  14 (decreto-lei 4.657/1942) -  70 registros selecionad

Unnamed: 0,QUERY_ID,RANK,DOC_ID,QUERY_TEXT,DOC_TEXT
9458,1,474,22155,técnica e preço,Exigências de qualificação técnica de pessoal ...
5766,1,283,40647,técnica e preço,A ausência no edital de especificação técnica ...
1080,1,52,161,técnica e preço,SÚMULA TCU 157 (REVOGADA): A elaboração de pro...
17063,1,905,18435,técnica e preço,As receitas oriundas de acordo de cooperação t...
5130,1,250,11595,técnica e preço,"Nas empreitadas por preço global, alterações n..."
...,...,...,...,...,...
72209,150,243,34204,Qual é a regra geral para a contratação de ent...,A inexigibilidade de licitação para a prestaçã...
51778,150,328,70288,Qual é a regra geral para a contratação de ent...,É ilegal a exigência de prova de quitação com ...
12263,150,185,14904,Qual é a regra geral para a contratação de ent...,Nas licitações de serviços de manutenção integ...
135187,150,338,85641,Qual é a regra geral para a contratação de ent...,É vedada a averbação de tempo de serviço prest...


# Acesso ao ChatGPT e testes iniciais

In [118]:
import os
import openai
import langchain
from langchain import PromptTemplate, LLMChain
from langchain.chat_models import AzureChatOpenAI

In [None]:
############ Dados de conexão ao ChatGPT foram removidos
############ Dados de conexão ao ChatGPT foram removidos
############ Dados de conexão ao ChatGPT foram removidos
############ Dados de conexão ao ChatGPT foram removidos

In [169]:
############ Dados de conexão ao ChatGPT foram removidos
############ Dados de conexão ao ChatGPT foram removidos
############ Dados de conexão ao ChatGPT foram removidos
############ Dados de conexão ao ChatGPT foram removidos

In [125]:
prompt_template = "Responda a {question}"

 

llm_chain = LLMChain(
    llm=chat,
    prompt=PromptTemplate(template=prompt_template, input_variables=['question'])
)
llm_chain("fale sobre PMBOK")

{'question': 'fale sobre PMBOK',
 'text': 'O PMBOK, sigla para Project Management Body of Knowledge, é um conjunto de práticas, diretrizes e terminologias em gerenciamento de projetos, desenvolvido e mantido pelo Project Management Institute (PMI). O PMBOK é considerado um dos principais padrões globais para a indústria de gerenciamento de projetos e é frequentemente utilizado como referência por profissionais e organizações em todo o mundo.\n\nO PMBOK é apresentado na forma de um guia, chamado de "Guia PMBOK", que atualmente está em sua sexta edição. O guia descreve os principais processos, áreas de conhecimento e grupos de processos envolvidos no gerenciamento de projetos, fornecendo uma estrutura abrangente e padronizada para a execução bem-sucedida de projetos.\n\nAs áreas de conhecimento do PMBOK incluem:\n\n1. Integração: coordenação e integração de todas as partes do projeto.\n2. Escopo: definição e controle do escopo do projeto.\n3. Cronograma: planejamento e controle do cronog

In [129]:
prompt_template = '''Você é um especialista na jurisprudência do Tribunal de Contas da União com o objetivo de avaliar se um enunciado de jurisprudência responde a uma pergunta.
Deve retornar um valor de score de 0 a 3, sendo:
0 - irrelevante - o enunciado não responde a pergunta;
1 - relacionado - o enunciado apenas está no tópico da pergunta;
2 - relevante - o enunciado responde parcialmente a pergunta;
3 - altamente relevante - o enunciado responde a pergunta, tratando completamente de suas nuances.

Em seguida, explique a razão para a escolha do score.

Por favor, responda no formato JSON, contendo as chaves Razão e Score;
o valor de Razão deve ser a motivação para a escolha do score;
o valor de Score deve ser o valor do score atribuído.


Pergunta: {query}
Enunciado de jurisprudência: {statement}'''
llm_chain = LLMChain(llm=chat, prompt=PromptTemplate(template=prompt_template, input_variables=['query', 'statement']))

result = llm_chain({'query':'Qual é a modalidade de licitação adequada para a concessão remunerada de uso de bens públicos?', 
                    'statement':'Em regra, o pregão é a modalidade de licitação adequada para a concessão remunerada de uso de bens públicos, com critério de julgamento pela maior oferta em lances sucessivos.'})
print(result)
print(result['text'])


{'query': 'Qual é a modalidade de licitação adequada para a concessão remunerada de uso de bens públicos?', 'statement': 'Em regra, o pregão é a modalidade de licitação adequada para a concessão remunerada de uso de bens públicos, com critério de julgamento pela maior oferta em lances sucessivos.', 'text': '{\n  "Razão": "O enunciado responde diretamente à pergunta, indicando a modalidade de licitação adequada para a concessão remunerada de uso de bens públicos e o critério de julgamento.",\n  "Score": 3\n}'}
{
  "Razão": "O enunciado responde diretamente à pergunta, indicando a modalidade de licitação adequada para a concessão remunerada de uso de bens públicos e o critério de julgamento.",
  "Score": 3
}


In [140]:
from langchain.prompts import ChatPromptTemplate, SystemMessagePromptTemplate, HumanMessagePromptTemplate

system_prompt_text = '''Você é um especialista na jurisprudência do Tribunal de Contas da União com o objetivo de avaliar se um enunciado de jurisprudência responde a uma {tipo_query_lower}.
Deve retornar um valor de score de 0 a 3, sendo:
0 - irrelevante - o enunciado não responde a {tipo_query_lower};
1 - relacionado - o enunciado apenas está no tópico da {tipo_query_lower};
2 - relevante - o enunciado responde parcialmente a {tipo_query_lower};
3 - altamente relevante - o enunciado responde a {tipo_query_lower}, tratando completamente de suas nuances.

Em seguida, explique a razão para a escolha do score.

Por favor, responda no formato JSON, contendo as chaves Razão e Score;
o valor de Razão deve ser a motivação para a escolha do score;
o valor de Score deve ser o valor do score atribuído.'''

system_prompt = SystemMessagePromptTemplate(prompt = PromptTemplate(template=system_prompt_text, input_variables=['tipo_query_lower']))

human_prompt_text = '''{tipo_query}: {query_text}
Enunciado de jurisprudência: {doc_text}'''

human_prompt = HumanMessagePromptTemplate(prompt = PromptTemplate(template=human_prompt_text, input_variables=['query_text', 'doc_text', 'tipo_query']))

chat_prompt = ChatPromptTemplate.from_messages([system_prompt, human_prompt])
message = chat_prompt.format_prompt(query_text='Qual é a modalidade de licitação adequada para a concessão remunerada de uso de bens públicos?', 
                                    doc_text='Em regra, o pregão é a modalidade de licitação adequada para a concessão remunerada de uso de bens públicos, com critério de julgamento pela maior oferta em lances sucessivos.', 
                                    tipo_query='Pergunta',
                                    tipo_query_lower='pergunta').to_messages()

print(message)

llm_chain = LLMChain(llm=chat, prompt=chat_prompt)
result = llm_chain({'query_text': 'Qual é a modalidade de licitação adequada para a concessão remunerada de uso de bens públicos?', 
                    'doc_text': 'Em regra, o pregão é a modalidade de licitação adequada para a concessão remunerada de uso de bens públicos, com critério de julgamento pela maior oferta em lances sucessivos.', 
                    'tipo_query': 'Pergunta',
                    'tipo_query_lower': 'pergunta'}, return_only_outputs=True)
print(result['text'])

[SystemMessage(content='Você é um especialista na jurisprudência do Tribunal de Contas da União com o objetivo de avaliar se um enunciado de jurisprudência responde a uma pergunta.\nDeve retornar um valor de score de 0 a 3, sendo:\n0 - irrelevante - o enunciado não responde a pergunta;\n1 - relacionado - o enunciado apenas está no tópico da pergunta;\n2 - relevante - o enunciado responde parcialmente a pergunta;\n3 - altamente relevante - o enunciado responde a pergunta, tratando completamente de suas nuances.\n\nEm seguida, explique a razão para a escolha do score.\n\nPor favor, responda no formato JSON, contendo as chaves Razão e Score;\no valor de Razão deve ser a motivação para a escolha do score;\no valor de Score deve ser o valor do score atribuído.', additional_kwargs={}), HumanMessage(content='Pergunta: Qual é a modalidade de licitação adequada para a concessão remunerada de uso de bens públicos?\nEnunciado de jurisprudência: Em regra, o pregão é a modalidade de licitação adequ

In [145]:
dict_llm = ast.literal_eval(result['text'])
print(dict_llm)

{'Razão': 'O enunciado responde diretamente à pergunta, indicando a modalidade de licitação adequada para a concessão remunerada de uso de bens públicos e o critério de julgamento.', 'Score': 3}


In [147]:
def get_llm_score(query_text, doc_text, tipo_query = 'Consulta'):
    system_prompt_text = '''Você é um especialista na jurisprudência do Tribunal de Contas da União com o objetivo de avaliar se um enunciado de jurisprudência responde a uma {tipo_query_lower}.
Deve retornar um valor de score de 0 a 3, sendo:
0 - irrelevante - o enunciado não responde a {tipo_query_lower};
1 - relacionado - o enunciado apenas está no tópico da {tipo_query_lower};
2 - relevante - o enunciado responde parcialmente a {tipo_query_lower};
3 - altamente relevante - o enunciado responde a {tipo_query_lower}, tratando completamente de suas nuances.

Em seguida, explique a razão para a escolha do score.

Por favor, responda no formato JSON, contendo as chaves Razão e Score;
o valor de Razão deve ser a motivação para a escolha do score;
o valor de Score deve ser o valor do score atribuído.'''

    system_prompt = SystemMessagePromptTemplate(prompt = PromptTemplate(template=system_prompt_text, input_variables=['tipo_query_lower']))

    human_prompt_text = '''{tipo_query}: {query_text}
    Enunciado de jurisprudência: {doc_text}'''

    human_prompt = HumanMessagePromptTemplate(prompt = PromptTemplate(template=human_prompt_text, input_variables=['query_text', 'doc_text', 'tipo_query']))

    chat_prompt = ChatPromptTemplate.from_messages([system_prompt, human_prompt])
    llm_chain = LLMChain(llm=chat, prompt=chat_prompt)
    result = llm_chain({'query_text': query_text, 'doc_text': doc_text, 'tipo_query': tipo_query, 'tipo_query_lower': tipo_query.lower()}, return_only_outputs=True)
    dict_llm = ast.literal_eval(result['text'])
    return dict_llm['Score'], dict_llm['Razão']

query = 'Qual é a modalidade de licitação adequada para a concessão remunerada de uso de bens públicos?'
doc = 'Em regra, o pregão é a modalidade de licitação adequada para a concessão remunerada de uso de bens públicos, com critério de julgamento pela maior oferta em lances sucessivos.'
score, reasoning = get_llm_score(query, doc, 'Pergunta')
print(score, '-', reasoning)

3 - O enunciado responde diretamente à pergunta, indicando a modalidade de licitação adequada para a concessão remunerada de uso de bens públicos e o critério de julgamento.


In [148]:
df_least_relevants.query('QUERY_ID == 101').sort_values('RANK')

Unnamed: 0,QUERY_ID,RANK,DOC_ID,QUERY_TEXT,DOC_TEXT
80030,101,311,32963,Qual é a modalidade de licitação adequada para...,O servidor ou o dirigente de instituição públi...
53023,101,432,34113,Qual é a modalidade de licitação adequada para...,É cabível a constituição de garantias por empr...
132375,101,676,33481,Qual é a modalidade de licitação adequada para...,A ausência de designação formal do beneficiári...
14333,101,698,21838,Qual é a modalidade de licitação adequada para...,Os preços obtidos pela Administração na fase i...
62064,101,880,15187,Qual é a modalidade de licitação adequada para...,A exigência de certificação emitida por instit...


In [157]:
query_id = 101
for idx, row in df_least_relevants.query('QUERY_ID == ' + str(query_id)).iterrows():
    query_text = row['QUERY_TEXT']
    doc_text = row['DOC_TEXT']
    print('Query', query_id, '-', query_text)
    print('Rank', row['RANK'], '-', row['DOC_ID'], '-', doc_text)
    tipo_query = 'Pergunta' if query_id > 100 else 'Consulta'
    score, reasoning = get_llm_score(query_text, doc_text, tipo_query)
    print('Score', score, '-', reasoning)
    df_least_relevants.loc[idx, 'LLM_SCORE'] = score
    df_least_relevants.loc[idx, 'LLM_REASONING'] = reasoning
    print('---------------------')
df_least_relevants.query('QUERY_ID == ' + str(query_id))   

Query 101 - Qual é a modalidade de licitação adequada para a concessão remunerada de uso de bens públicos?
Rank 311 - 32963 - O servidor ou o dirigente de instituição pública está impedido de participar, direta ou indiretamente, da licitação ou da execução de obra ou serviço e do fornecimento de bens a eles necessários.
Score 0 - O enunciado de jurisprudência não aborda a modalidade de licitação adequada para a concessão remunerada de uso de bens públicos, mas sim a restrição de participação de servidores e dirigentes em licitações e execução de obras ou serviços.
---------------------
Query 101 - Qual é a modalidade de licitação adequada para a concessão remunerada de uso de bens públicos?
Rank 880 - 15187 - A exigência de certificação emitida por instituições públicas ou privadas credenciadas pelo Inmetro para aquisições de bens e serviços de informática e automação, prevista no art. 3º, inciso II, do Decreto 7.174/2010, é ilegal, visto que estipula novo requisito de habilitação por 

Unnamed: 0,QUERY_ID,RANK,DOC_ID,QUERY_TEXT,DOC_TEXT,LLM_SCORE,LLM_REASONING
80030,101,311,32963,Qual é a modalidade de licitação adequada para...,O servidor ou o dirigente de instituição públi...,0.0,O enunciado de jurisprudência não aborda a mod...
62064,101,880,15187,Qual é a modalidade de licitação adequada para...,A exigência de certificação emitida por instit...,0.0,O enunciado de jurisprudência não aborda a con...
14333,101,698,21838,Qual é a modalidade de licitação adequada para...,Os preços obtidos pela Administração na fase i...,0.0,O enunciado de jurisprudência não aborda a mod...
132375,101,676,33481,Qual é a modalidade de licitação adequada para...,A ausência de designação formal do beneficiári...,0.0,O enunciado de jurisprudência não aborda a que...
53023,101,432,34113,Qual é a modalidade de licitação adequada para...,É cabível a constituição de garantias por empr...,0.0,O enunciado de jurisprudência não aborda a mod...


# Execução Completa - todas as queries

## Execução 1 - queries 1 a 50

In [159]:
for query_id, row in df_queries.iterrows():
    query_text = row['QUERY_TEXT']
    query_type = 'Pergunta' if query_id > 100 else 'Consulta'    
    print (query_type, query_id, '-', query_text + ':')
    for idx, row in df_least_relevants.query('QUERY_ID == ' + str(query_id)).iterrows():
        score, reasoning = get_llm_score(row['QUERY_TEXT'], row['DOC_TEXT'], query_type)
        df_least_relevants.loc[idx, 'LLM_SCORE'] = score
        df_least_relevants.loc[idx, 'LLM_REASONING'] = reasoning
        rank = row['RANK']
        print('\tRank', rank, ' - score', score, '- razão:', reasoning)

Consulta 1 - técnica e preço:
	Rank 474  - score 1 - razão: O enunciado de jurisprudência aborda exigências de qualificação técnica e organização administrativa de licitantes, mas não trata diretamente da técnica e preço como critérios de julgamento em licitações.
	Rank 283  - score 1 - razão: O enunciado aborda a ausência de especificação técnica no edital, mas não menciona a relação entre técnica e preço, que é o foco da consulta.
	Rank 52  - score 1 - razão: O enunciado aborda a elaboração de projetos de engenharia e arquitetura, mencionando critérios de melhor qualidade e técnica, mas não trata diretamente da relação entre técnica e preço.
	Rank 905  - score 1 - razão: O enunciado aborda aspectos de cooperação técnica e financeira, mas não trata diretamente da técnica e preço em licitações ou contratações públicas.
	Rank 250  - score 1 - razão: O enunciado de jurisprudência aborda alterações no projeto ou especificações de obra ou serviço, mas não menciona diretamente a técnica e p

Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 1.0 seconds as it raised Timeout: Request timed out: HTTPSConnectionPool(host='openai-tcu-sandbox.openai.azure.com', port=443): Read timed out. (read timeout=600).


	Rank 225  - score 2 - razão: O enunciado aborda o tema de licitações e contratos, especificamente sobre a sanção de inidoneidade declarada pelo TCU, que está diretamente relacionada às licitações envolvendo recursos federais.
	Rank 110  - score 2 - razão: O enunciado aborda a aplicação de sanção de inidoneidade em licitações e procedimentos similares, tratando de um aspecto específico relacionado ao tema da consulta.
Consulta 25 - exigência de atestado de capacidade:
	Rank 438  - score 1 - razão: O enunciado de jurisprudência aborda a exigência de declaração de pessoal técnico especializado, mas não menciona especificamente o atestado de capacidade.
	Rank 427  - score 1 - razão: O enunciado de jurisprudência aborda a exigência de um contrato de exclusividade na contratação de profissional do setor artístico, mas não trata especificamente de atestado de capacidade.
	Rank 523  - score 1 - razão: O enunciado de jurisprudência aborda a republicação do edital de licitação e a reabertura de

KeyboardInterrupt: 

## Execução 2 - queries 51 a 99

In [162]:
for query_id, row in df_queries.iterrows():
    if query_id < 51:
        continue
    query_text = row['QUERY_TEXT']
    query_type = 'Pergunta' if query_id > 100 else 'Consulta'    
    print (query_type, query_id, '-', query_text + ':')
    for idx, row in df_least_relevants.query('QUERY_ID == ' + str(query_id)).iterrows():
        score, reasoning = get_llm_score(row['QUERY_TEXT'], row['DOC_TEXT'], query_type)
        df_least_relevants.loc[idx, 'LLM_SCORE'] = score
        df_least_relevants.loc[idx, 'LLM_REASONING'] = reasoning
        rank = row['RANK']
        print('\tRank', rank, ' - score', score, '- razão:', reasoning)

Consulta 51 - concessão remunerada de uso de bens públicos modalidade:
	Rank 436  - score 0 - razão: O enunciado de jurisprudência não aborda a concessão remunerada de uso de bens públicos modalidade, mas sim a responsabilização de empresários individuais por dano ao erário.
	Rank 406  - score 0 - razão: O enunciado de jurisprudência não aborda a concessão remunerada de uso de bens públicos, mas sim a licitação na modalidade pregão para contratação de serviços de engenharia.
	Rank 29  - score 0 - razão: O enunciado de jurisprudência aborda a modalidade pregão e sua aplicação na aquisição e contratação de bens e serviços comuns, mas não trata especificamente da concessão remunerada de uso de bens públicos.
	Rank 249  - score 0 - razão: O enunciado de jurisprudência não aborda a concessão remunerada de uso de bens públicos modalidade, mas sim a efetiva consecução do objeto pactuado com uso dos recursos de convênio.
	Rank 584  - score 1 - razão: O enunciado de jurisprudência trata de lici

Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 1.0 seconds as it raised Timeout: Request timed out: HTTPSConnectionPool(host='openai-tcu-sandbox.openai.azure.com', port=443): Read timed out. (read timeout=600).


	Rank 135  - score 1 - razão: O enunciado aborda a elaboração de projetos de engenharia e arquitetura e a seleção com base na melhor qualidade ou técnica, mas não menciona especificamente a pontuação desarrazoada em licitações técnica e preço.
	Rank 466  - score 0 - razão: O enunciado de jurisprudência aborda a questão de fraude em licitações e declaração de inidoneidade, mas não trata especificamente de pontuação desarrazoada em licitações técnica e preço.
	Rank 450  - score 0 - razão: O enunciado de jurisprudência trata de alterações no projeto ou especificações de obra ou serviço e a necessidade de celebração de termo aditivo, mas não aborda a pontuação desarrazoada em licitações técnica e preço.
Consulta 74 - prorrogação de contrato administrativo término prazo de vigência:
	Rank 799  - score 0 - razão: O enunciado não aborda a prorrogação de contrato administrativo ou término do prazo de vigência, mas sim a fixação de prazo para recolhimento de importância devida.
	Rank 926  - sco

Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 1.0 seconds as it raised Timeout: Request timed out: HTTPSConnectionPool(host='openai-tcu-sandbox.openai.azure.com', port=443): Read timed out. (read timeout=600).
Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 2.0 seconds as it raised APIError: Invalid response object from API: '{ "statusCode": 401, "message": "Unauthorized. Access token is missing, invalid, audience is incorrect (https://cognitiveservices.azure.com), or have expired." }' (HTTP response code was 401).
Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 4.0 seconds as it raised APIError: Invalid response object from API: '{ "statusCode": 401, "message": "Unauthorized. Access token is missing, invalid, audience is incorrect (https://cognitiveservices.azure.com), or have expired." }' (HTTP response code wa

APIError: Invalid response object from API: '{ "statusCode": 401, "message": "Unauthorized. Access token is missing, invalid, audience is incorrect (https://cognitiveservices.azure.com), or have expired." }' (HTTP response code was 401)

## Execução 3 - queries 100 a 117

In [166]:
for query_id, row in df_queries.iterrows():
    if query_id < 100:
        continue
    query_text = row['QUERY_TEXT']
    query_type = 'Pergunta' if query_id > 100 else 'Consulta'    
    print (query_type, query_id, '-', query_text + ':')
    for idx, row in df_least_relevants.query('QUERY_ID == ' + str(query_id)).iterrows():
        score, reasoning = get_llm_score(row['QUERY_TEXT'], row['DOC_TEXT'], query_type)
        df_least_relevants.loc[idx, 'LLM_SCORE'] = score
        df_least_relevants.loc[idx, 'LLM_REASONING'] = reasoning
        rank = row['RANK']
        print('\tRank', rank, ' - score', score, '- razão:', reasoning)

Consulta 100 - assistência médica a servidores:
	Rank 249  - score 1 - razão: O enunciado de jurisprudência aborda o pagamento de servidores e encargos sociais em relação a recursos de convênio, mas não trata especificamente de assistência médica a servidores.
	Rank 588  - score 0 - razão: O enunciado de jurisprudência aborda a contagem do período de inatividade para efeito de aposentadoria, mas não trata de assistência médica a servidores.
	Rank 903  - score 0 - razão: O enunciado não aborda o tema de assistência médica a servidores, mas sim a atualização de valores recebidos em decorrência de decisões judiciais que venham a ser revogadas ou rescindidas.
	Rank 488  - score 0 - razão: O enunciado de jurisprudência trata de horas extras e sua incompatibilidade com a Lei 8.112/1990, não abordando a consulta sobre assistência médica a servidores.
	Rank 730  - score 0 - razão: O enunciado de jurisprudência não aborda diretamente a assistência médica a servidores, mas sim a relação entre o 

KeyboardInterrupt: 

## Execução 3 - queries 118 a 150

In [170]:
for query_id, row in df_queries.iterrows():
    if query_id < 118:
        continue
    query_text = row['QUERY_TEXT']
    query_type = 'Pergunta' if query_id > 100 else 'Consulta'    
    print (query_type, query_id, '-', query_text + ':')
    for idx, row in df_least_relevants.query('QUERY_ID == ' + str(query_id)).iterrows():
        score, reasoning = get_llm_score(row['QUERY_TEXT'], row['DOC_TEXT'], query_type)
        df_least_relevants.loc[idx, 'LLM_SCORE'] = score
        df_least_relevants.loc[idx, 'LLM_REASONING'] = reasoning
        rank = row['RANK']
        print('\tRank', rank, ' - score', score, '- razão:', reasoning)

Pergunta 118 - Quais são as condições para que o restabelecimento total ou parcial de quantitativo de item anteriormente suprimido por aditivo contratual não configure compensação vedada pela jurisprudência do TCU?:
	Rank 425  - score 0 - razão: O enunciado de jurisprudência aborda a exigência de orçamento detalhado em contratação integrada, mas não trata das condições para restabelecimento de quantitativo de item suprimido por aditivo contratual.
	Rank 26  - score 0 - razão: O enunciado de jurisprudência aborda a vedação de inclusão de itens genéricos em planilhas de editais ou contratos, mas não trata das condições para o restabelecimento total ou parcial de quantitativo de item suprimido por aditivo contratual.
	Rank 41  - score 0 - razão: O enunciado de jurisprudência não aborda o tema da pergunta, que é sobre restabelecimento de quantitativo de item suprimido por aditivo contratual e compensação vedada. A Súmula TCU 272 trata de exigências de habilitação e pontuação técnica em edi

In [183]:
df_least_relevants['ENGINE'] = set(df_bm25['ENGINE'].values).pop()
df_least_relevants

Unnamed: 0,QUERY_ID,RANK,DOC_ID,QUERY_TEXT,DOC_TEXT,LLM_SCORE,LLM_REASONING,ENGINE
9458,1,474,22155,técnica e preço,Exigências de qualificação técnica de pessoal ...,1.0,O enunciado de jurisprudência aborda exigência...,BM25
5766,1,283,40647,técnica e preço,A ausência no edital de especificação técnica ...,1.0,O enunciado aborda a ausência de especificação...,BM25
1080,1,52,161,técnica e preço,SÚMULA TCU 157 (REVOGADA): A elaboração de pro...,1.0,O enunciado aborda a elaboração de projetos de...,BM25
17063,1,905,18435,técnica e preço,As receitas oriundas de acordo de cooperação t...,1.0,O enunciado aborda aspectos de cooperação técn...,BM25
5130,1,250,11595,técnica e preço,"Nas empreitadas por preço global, alterações n...",1.0,O enunciado de jurisprudência aborda alteraçõe...,BM25
...,...,...,...,...,...,...,...,...
72209,150,243,34204,Qual é a regra geral para a contratação de ent...,A inexigibilidade de licitação para a prestaçã...,0.0,O enunciado de jurisprudência aborda a inexigi...,BM25
51778,150,328,70288,Qual é a regra geral para a contratação de ent...,É ilegal a exigência de prova de quitação com ...,0.0,O enunciado de jurisprudência não aborda a con...,BM25
12263,150,185,14904,Qual é a regra geral para a contratação de ent...,Nas licitações de serviços de manutenção integ...,0.0,O enunciado de jurisprudência não aborda a con...,BM25
135187,150,338,85641,Qual é a regra geral para a contratação de ent...,É vedada a averbação de tempo de serviço prest...,0.0,O enunciado de jurisprudência não aborda a con...,BM25


In [184]:
df_least_relevants.to_csv('../../data/llm_juris_tcu/eval_least_relevants.csv', index=False)