# Carga de dados - textos de queries e enunciados

In [15]:
import pandas as pd
import ast

In [2]:
df_queries = pd.concat([pd.read_csv('../../data/juris_tcu/query1.csv', sep=';', index_col='QUERY_ID'),
                        pd.read_csv('../../data/juris_tcu/query2.csv', sep=';', index_col='QUERY_ID'),
                        pd.read_csv('../../data/juris_tcu/query3.csv', sep=';', index_col='QUERY_ID')])
df_queries

Unnamed: 0_level_0,QUERY_TEXT
QUERY_ID,Unnamed: 1_level_1
1,técnica e preço
2,restos a pagar
3,aditivo a contrato
4,adesão a ata de registro de preços
5,sobrepreço e superfaturamento
...,...
146,É possível a inclusão de serviços já previstos...
147,O princípio da legalidade estrita pode ser afa...
148,Quais fontes devem ser prioritárias na pesquis...
149,Devem ser aceitas nas contratações de software...


In [3]:
df_enunciados = pd.read_csv('../../data/juris_tcu/doc.csv', index_col='ID')[['TEXT']].rename_axis('DOC_ID')
df_enunciados.columns = ['DOC_TEXT']
df_enunciados

Unnamed: 0_level_0,DOC_TEXT
DOC_ID,Unnamed: 1_level_1
13568,É ilegal a contagem de tempo ficto de serviço ...
11614,"SÚMULA TCU 283: Para fim de habilitação, a Adm..."
21087,A contratação de serviços por preços superiore...
35016,"Não se aplica, excepcionalmente, multa aos ges..."
29370,"Em contratatações de TI, não cabe aceitar prop..."
...,...
55,"SÚMULA TCU 51: Quando, no exame e julgamento d..."
95,"SÚMULA TCU 91: A falta de remessa, em tempo há..."
94,"SÚMULA TCU 90: O Parecer Prévio, em sentido fa..."
15,SÚMULA TCU 11: A omissão da remessa de contas ...


# Carga de resultados de busca e criação de dados de avaliação

In [4]:
def build_eval_data(run_path, df_queries, df_docs):
    df_run = pd.read_csv(run_path)
    df_run = df_run.merge(df_queries, on='QUERY_ID')
    df_run = df_run.merge(df_docs, on='DOC_ID')
    return df_run

In [5]:
df_bm25 = build_eval_data('../../data/search/juris_tcu/run_bm25.csv', df_queries, df_enunciados)
df_bm25

Unnamed: 0,QUERY_ID,RANK,DOC_ID,ENGINE,QUERY_TEXT,DOC_TEXT
0,1,1,20870,BM25,técnica e preço,"Nas licitações do tipo técnica e preço, a atri..."
1,5,281,20870,BM25,sobrepreço e superfaturamento,"Nas licitações do tipo técnica e preço, a atri..."
2,7,149,20870,BM25,acréscimos e supressões,"Nas licitações do tipo técnica e preço, a atri..."
3,10,124,20870,BM25,diarias e passagens,"Nas licitações do tipo técnica e preço, a atri..."
4,16,800,20870,BM25,inexequibilidade e comprovação,"Nas licitações do tipo técnica e preço, a atri..."
...,...,...,...,...,...,...
142078,149,920,85627,BM25,Devem ser aceitas nas contratações de software...,"A relação de dependência econômica, para fins ..."
142079,149,921,6969,BM25,Devem ser aceitas nas contratações de software...,"A relação de dependência econômica, para fins ..."
142080,149,982,30266,BM25,Devem ser aceitas nas contratações de software...,"O tempo de serviço exercido até 16/12/1998, da..."
142081,150,102,15329,BM25,Qual é a regra geral para a contratação de ent...,Os Serviços Sociais Autônomos observarão a reg...


In [6]:
df_sts = build_eval_data('../../data/search/juris_tcu/run_sts.csv', df_queries, df_enunciados)
df_sts

Unnamed: 0,QUERY_ID,RANK,DOC_ID,ENGINE,QUERY_TEXT,DOC_TEXT
0,1,1,34233,SentenceTransformerS,técnica e preço,Os fatores de avaliação das propostas técnicas...
1,8,236,34233,SentenceTransformerS,obras e serviços de engenharia,Os fatores de avaliação das propostas técnicas...
2,11,240,34233,SentenceTransformerS,bens e serviços comuns,Os fatores de avaliação das propostas técnicas...
3,12,109,34233,SentenceTransformerS,parcelas de maior relevância e valor significa...,Os fatores de avaliação das propostas técnicas...
4,15,125,34233,SentenceTransformerS,contas e materialidade,Os fatores de avaliação das propostas técnicas...
...,...,...,...,...,...,...
74995,150,455,30044,SentenceTransformerS,Qual é a regra geral para a contratação de ent...,É ilegal a inclusão nos proventos de servidor ...
74996,150,461,19599,SentenceTransformerS,Qual é a regra geral para a contratação de ent...,"A partir de 18/5/2001, data da publicação da d..."
74997,150,462,82304,SentenceTransformerS,Qual é a regra geral para a contratação de ent...,"A transformação, por lei, de emprego público e..."
74998,150,464,110843,SentenceTransformerS,Qual é a regra geral para a contratação de ent...,"A transformação, por lei, de emprego público e..."


In [7]:
df_bm25_reranker = build_eval_data('../../data/search/juris_tcu/run_bm25_reranker.csv', df_queries, df_enunciados)
df_bm25_reranker

Unnamed: 0,QUERY_ID,RANK,DOC_ID,ENGINE,QUERY_TEXT,DOC_TEXT
0,1,1,21064,BM25+Reranker,técnica e preço,Admite-se a preponderância da técnica sobre o ...
1,6,99,21064,BM25+Reranker,restrição a competitividade,Admite-se a preponderância da técnica sobre o ...
2,31,299,21064,BM25+Reranker,medida cautelar,Admite-se a preponderância da técnica sobre o ...
3,72,2,21064,BM25+Reranker,ponderação técnica e preço,Admite-se a preponderância da técnica sobre o ...
4,73,68,21064,BM25+Reranker,pontuação desarrazoada licitações técnica e preço,Admite-se a preponderância da técnica sobre o ...
...,...,...,...,...,...,...
44178,150,280,33564,BM25+Reranker,Qual é a regra geral para a contratação de ent...,"É reconhecido o direito à ""opção"" aos servidor..."
44179,150,285,130287,BM25+Reranker,Qual é a regra geral para a contratação de ent...,Em casos de acumulação de remuneração e pensão...
44180,150,286,141744,BM25+Reranker,Qual é a regra geral para a contratação de ent...,Em casos de acumulação de remuneração e pensão...
44181,150,289,13169,BM25+Reranker,Qual é a regra geral para a contratação de ent...,A regra geral que confere efeito suspensivo ao...


In [8]:
df_sts_reranker = build_eval_data('../../data/search/juris_tcu/run_sts_reranker.csv', df_queries, df_enunciados)
df_sts_reranker

Unnamed: 0,QUERY_ID,RANK,DOC_ID,ENGINE,QUERY_TEXT,DOC_TEXT
0,1,1,21064,STS+Reranker,técnica e preço,Admite-se a preponderância da técnica sobre o ...
1,12,269,21064,STS+Reranker,parcelas de maior relevância e valor significa...,Admite-se a preponderância da técnica sobre o ...
2,72,2,21064,STS+Reranker,ponderação técnica e preço,Admite-se a preponderância da técnica sobre o ...
3,73,60,21064,STS+Reranker,pontuação desarrazoada licitações técnica e preço,Admite-se a preponderância da técnica sobre o ...
4,85,6,21064,STS+Reranker,técnica e preço profissionais quadro permanente,Admite-se a preponderância da técnica sobre o ...
...,...,...,...,...,...,...
44995,150,293,25628,STS+Reranker,Qual é a regra geral para a contratação de ent...,Atividades não relacionadas às específicas dos...
44996,150,296,28500,STS+Reranker,Qual é a regra geral para a contratação de ent...,As decisões judiciais sobre incorporações de p...
44997,150,297,30125,STS+Reranker,Qual é a regra geral para a contratação de ent...,As decisões judiciais sobre incorporações de p...
44998,150,299,18989,STS+Reranker,Qual é a regra geral para a contratação de ent...,"Ao assumir o cargo, compete ao gestor público ..."


In [9]:
df_join_bm25_sts_reranker = build_eval_data('../../data/search/juris_tcu/run_join_bm25_sts_reranker.csv', df_queries, df_enunciados)
df_join_bm25_sts_reranker

Unnamed: 0,QUERY_ID,RANK,DOC_ID,ENGINE,QUERY_TEXT,DOC_TEXT
0,1,1,21064,(BM25|STS)+Reranker,técnica e preço,Admite-se a preponderância da técnica sobre o ...
1,6,121,21064,(BM25|STS)+Reranker,restrição a competitividade,Admite-se a preponderância da técnica sobre o ...
2,12,491,21064,(BM25|STS)+Reranker,parcelas de maior relevância e valor significa...,Admite-se a preponderância da técnica sobre o ...
3,31,526,21064,(BM25|STS)+Reranker,medida cautelar,Admite-se a preponderância da técnica sobre o ...
4,72,2,21064,(BM25|STS)+Reranker,ponderação técnica e preço,Admite-se a preponderância da técnica sobre o ...
...,...,...,...,...,...,...
82026,150,511,28527,(BM25|STS)+Reranker,Qual é a regra geral para a contratação de ent...,A aposentadoria fundamentada na Lei Complement...
82027,150,521,33564,(BM25|STS)+Reranker,Qual é a regra geral para a contratação de ent...,"É reconhecido o direito à ""opção"" aos servidor..."
82028,150,539,28500,(BM25|STS)+Reranker,Qual é a regra geral para a contratação de ent...,As decisões judiciais sobre incorporações de p...
82029,150,540,30125,(BM25|STS)+Reranker,Qual é a regra geral para a contratação de ent...,As decisões judiciais sobre incorporações de p...


In [21]:
df_most_relevants = pd.read_csv('../../data/llm_juris_tcu/eval_most_relevants.csv')
df_most_relevants

Unnamed: 0,QUERY_ID,RANK,DOC_ID,ENGINE,QUERY_TEXT,DOC_TEXT,LLM_SCORE,LLM_REASONING
0,1,1,21064,(BM25|STS)+Reranker,técnica e preço,Admite-se a preponderância da técnica sobre o ...,3.0,O enunciado aborda diretamente a relação entre...
1,72,2,21064,(BM25|STS)+Reranker,ponderação técnica e preço,Admite-se a preponderância da técnica sobre o ...,3.0,"O enunciado aborda diretamente a consulta, tra..."
2,1,2,42166,(BM25|STS)+Reranker,técnica e preço,Diante da complexidade e da natureza do objeto...,3.0,"O enunciado aborda diretamente a consulta, men..."
3,111,8,42166,(BM25|STS)+Reranker,Qual é a modalidade de licitação utilizada par...,Diante da complexidade e da natureza do objeto...,2.0,O enunciado aborda a modalidade de licitação '...
4,1,3,13702,(BM25|STS)+Reranker,técnica e preço,"Nas licitações do tipo técnica e preço, é irre...",3.0,O enunciado aborda diretamente a consulta sobr...
...,...,...,...,...,...,...,...,...
1495,100,1,17892,(BM25|STS)+Reranker,assistência médica a servidores,A contratação de entidade para prestação de se...,2.0,O enunciado aborda a contratação de entidade p...
1496,150,1,17892,(BM25|STS)+Reranker,Qual é a regra geral para a contratação de ent...,A contratação de entidade para prestação de se...,3.0,"O enunciado responde diretamente à pergunta, m..."
1497,106,7,17267,(BM25|STS)+Reranker,O pregão é adequado para concessões de uso de ...,No âmbito das concessões realizadas pela Agênc...,1.0,O enunciado está relacionado ao tópico de conc...
1498,150,8,91180,(BM25|STS)+Reranker,Qual é a regra geral para a contratação de ent...,É possível a contratação da execução indireta ...,1.0,O enunciado de jurisprudência aborda a contrat...


In [23]:
df_most_relevants.groupby('QUERY_ID').count()['DOC_ID'].to_dict()

{1: 10,
 2: 10,
 3: 10,
 4: 10,
 5: 10,
 6: 10,
 7: 10,
 8: 10,
 9: 10,
 10: 10,
 11: 10,
 12: 10,
 13: 10,
 14: 10,
 15: 10,
 16: 10,
 17: 10,
 18: 10,
 19: 10,
 20: 10,
 21: 10,
 22: 10,
 23: 10,
 24: 10,
 25: 10,
 26: 10,
 27: 10,
 28: 10,
 29: 10,
 30: 10,
 31: 10,
 32: 10,
 33: 10,
 34: 10,
 35: 10,
 36: 10,
 37: 10,
 38: 10,
 39: 10,
 40: 10,
 41: 10,
 42: 10,
 43: 10,
 44: 10,
 45: 10,
 46: 10,
 47: 10,
 48: 10,
 49: 10,
 50: 10,
 51: 10,
 52: 10,
 53: 10,
 54: 10,
 55: 10,
 56: 10,
 57: 10,
 58: 10,
 59: 10,
 60: 10,
 61: 10,
 62: 10,
 63: 10,
 64: 10,
 65: 10,
 66: 10,
 67: 10,
 68: 10,
 69: 10,
 70: 10,
 71: 10,
 72: 10,
 73: 10,
 74: 10,
 75: 10,
 76: 10,
 77: 10,
 78: 10,
 79: 10,
 80: 10,
 81: 10,
 82: 10,
 83: 10,
 84: 10,
 85: 10,
 86: 10,
 87: 10,
 88: 10,
 89: 10,
 90: 10,
 91: 10,
 92: 10,
 93: 10,
 94: 10,
 95: 10,
 96: 10,
 97: 10,
 98: 10,
 99: 10,
 100: 10,
 101: 10,
 102: 10,
 103: 10,
 104: 10,
 105: 10,
 106: 10,
 107: 10,
 108: 10,
 109: 10,
 110: 10,
 111: 10

# Acesso ao ChatGPT e testes iniciais

In [10]:
import os
import openai
import langchain
from langchain import ConversationChain
from langchain.chat_models import AzureChatOpenAI
from langchain.agents import load_tools, initialize_agent, AgentType
from langchain.callbacks.streaming_stdout import StreamingStdOutCallbackHandler
from langchain.memory import ConversationBufferWindowMemory

In [None]:
############ Dados de conexão ao ChatGPT foram removidos
############ Dados de conexão ao ChatGPT foram removidos
############ Dados de conexão ao ChatGPT foram removidos
############ Dados de conexão ao ChatGPT foram removidos

In [12]:
############ Dados de conexão ao ChatGPT foram removidos
############ Dados de conexão ao ChatGPT foram removidos
############ Dados de conexão ao ChatGPT foram removidos
############ Dados de conexão ao ChatGPT foram removidos

In [13]:
conversation = ConversationChain(llm=chat, verbose=True)
print(conversation.predict(input='Você conhece o TCU?'))
print('-'* 100)
print(conversation.predict(input='Quando foi fundado?'))
print('-'* 100)
print(conversation.predict(input='Quantas perguntas eu já fiz?'))



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:

Human: Você conhece o TCU?
AI:[0m

[1m> Finished chain.[0m
Sim, eu conheço o TCU. O TCU é a sigla para Tribunal de Contas da União, um órgão do governo brasileiro responsável pela fiscalização e controle dos recursos públicos federais. Ele tem como principal objetivo garantir a correta aplicação dos recursos públicos e a transparência na gestão desses recursos. O TCU é composto por ministros e ministros substitutos, e sua atuação é fundamental para o bom funcionamento da administração pública no Brasil.
----------------------------------------------------------------------------------------------------


[1m> Entering new ConversationChain cha

In [36]:
conversation = ConversationChain(llm=chat, verbose=True, memory=ConversationBufferWindowMemory(k=1))
prompt = f'''Você é um especialista na jurisprudência do Tribunal de Contas da União com o objetivo de avaliar se um enunciado de jurisprudência responde a uma pergunta.
Deve retornar um valor de score de 0 a 3, sendo:
0 - irrelevante - o enunciado não responde a pergunta;
1 - relacionado - o enunciado apenas está no tópico da pergunta;
2 - relevante - o enunciado responde parcialmente a pergunta;
3 - altamente relevante - o enunciado responde a pergunta, tratando completamente de suas nuances.

Em seguida, explique a razão para a escolha do score.

Por favor, responda no formato JSON, contendo as chaves Razão e Score;
o valor de Razão deve ser a motivação para a escolha do score;
o valor de Score deve ser o valor do score atribuído.


Pergunta: Qual é a modalidade de licitação adequada para a concessão remunerada de uso de bens públicos?
Enunciado de jurisprudência: Em regra, o pregão é a modalidade de licitação adequada para a concessão remunerada de uso de bens públicos, com critério de julgamento pela maior oferta em lances sucessivos.'''

result = conversation.predict(input=prompt)
print(result)
dict_llm = ast.literal_eval(result)
print(dict_llm)



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:

Human: Você é um especialista na jurisprudência do Tribunal de Contas da União com o objetivo de avaliar se um enunciado de jurisprudência responde a uma pergunta.
Deve retornar um valor de score de 0 a 3, sendo:
0 - irrelevante - o enunciado não responde a pergunta;
1 - relacionado - o enunciado apenas está no tópico da pergunta;
2 - relevante - o enunciado responde parcialmente a pergunta;
3 - altamente relevante - o enunciado responde a pergunta, tratando completamente de suas nuances.

Em seguida, explique a razão para a escolha do score.

Por favor, responda no formato JSON, contendo as chaves Score e Razão;
o valor de Score deve ser o valor 

In [63]:
conversation = ConversationChain(llm=chat, verbose=True)
query_text = 'concessão remunerada de uso de bens públicos modalidade'
doc_text = 'Em regra, o pregão é a modalidade de licitação adequada para a concessão remunerada de uso de bens públicos, com critério de julgamento pela maior oferta em lances sucessivos.'
tipo_query = 'Consulta'
tipo_query_lower = tipo_query.lower()

prompt = f'''Você é um especialista na jurisprudência do Tribunal de Contas da União com o objetivo de avaliar se um enunciado de jurisprudência responde a uma {tipo_query_lower}.
Deve retornar um valor de score de 0 a 3, sendo:
0 - irrelevante - o enunciado não responde a {tipo_query_lower};
1 - relacionado - o enunciado apenas está no tópico da {tipo_query_lower};
2 - relevante - o enunciado responde parcialmente a {tipo_query_lower};
3 - altamente relevante - o enunciado responde a {tipo_query_lower}, tratando completamente de suas nuances.

Em seguida, explique a razão para a escolha do score.

Por favor, responda no formato JSON, contendo as chaves Razão e Score;
o valor de Razão deve ser a motivação para a escolha do score;
o valor de Score deve ser o valor do score atribuído.


{tipo_query}: {query_text}
Enunciado de jurisprudência: {doc_text}'''

result = conversation.predict(input=prompt)
dict_llm = ast.literal_eval(result)
print(dict_llm)



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3mThe following is a friendly conversation between a human and an AI. The AI is talkative and provides lots of specific details from its context. If the AI does not know the answer to a question, it truthfully says it does not know.

Current conversation:

Human: Você é um especialista na jurisprudência do Tribunal de Contas da União com o objetivo de avaliar se um enunciado de jurisprudência responde a uma consulta.
Deve retornar um valor de score de 0 a 3, sendo:
0 - irrelevante - o enunciado não responde a consulta;
1 - relacionado - o enunciado apenas está no tópico da consulta;
2 - relevante - o enunciado responde parcialmente a consulta;
3 - altamente relevante - o enunciado responde a consulta, tratando completamente de suas nuances.

Em seguida, explique a razão para a escolha do score.

Por favor, responda no formato JSON, contendo as chaves Score e Razão;
o valor de Score deve ser o valor 

In [20]:
def get_llm_score(query_text, doc_text, tipo_query = 'Consulta'):
    conversation = ConversationChain(llm=chat, verbose=False)
    tipo_query_lower = tipo_query.lower()

    prompt = f'''Você é um especialista na jurisprudência do Tribunal de Contas da União com o objetivo de avaliar se um enunciado de jurisprudência responde a uma {tipo_query_lower}.
Deve retornar um valor de score de 0 a 3, sendo:
0 - irrelevante - o enunciado não responde a {tipo_query_lower};
1 - relacionado - o enunciado apenas está no tópico da {tipo_query_lower};
2 - relevante - o enunciado responde parcialmente a {tipo_query_lower};
3 - altamente relevante - o enunciado responde a {tipo_query_lower}, tratando completamente de suas nuances.

Em seguida, explique a razão para a escolha do score.

Por favor, responda no formato JSON, contendo as chaves Razão e Score;
o valor de Razão deve ser a motivação para a escolha do score;
o valor de Score deve ser o valor do score atribuído.

{tipo_query}: {query_text}
Enunciado de jurisprudência: {doc_text}'''

    result = conversation.predict(input=prompt)
    dict_llm = ast.literal_eval(result)
    return dict_llm['Score'], dict_llm['Razão']


query = 'Qual é a modalidade de licitação adequada para a concessão remunerada de uso de bens públicos?'
doc = 'Em regra, o pregão é a modalidade de licitação adequada para a concessão remunerada de uso de bens públicos, com critério de julgamento pela maior oferta em lances sucessivos.'

score, reasoning = get_llm_score(query, doc, 'Pergunta')
print(score, '-', reasoning)

3 - O enunciado responde diretamente à pergunta, indicando a modalidade de licitação adequada para a concessão remunerada de uso de bens públicos e o critério de julgamento.


In [49]:
df_join_bm25_sts_reranker.query('RANK <= 10 and QUERY_ID == 101').sort_values('RANK')

Unnamed: 0,QUERY_ID,RANK,DOC_ID,ENGINE,QUERY_TEXT,DOC_TEXT
43851,101,1,2845,(BM25|STS)+Reranker,Qual é a modalidade de licitação adequada para...,"Em regra, o pregão é a modalidade de licitação..."
41428,101,2,17360,(BM25|STS)+Reranker,Qual é a modalidade de licitação adequada para...,É recomendável a utilização de pregão para a c...
66904,101,3,5714,(BM25|STS)+Reranker,Qual é a modalidade de licitação adequada para...,A cessão das áreas comerciais de centrais públ...
46534,101,4,58593,(BM25|STS)+Reranker,Qual é a modalidade de licitação adequada para...,Na licitação que tem por objeto a concessão re...
19717,101,5,14862,(BM25|STS)+Reranker,Qual é a modalidade de licitação adequada para...,O contrato administrativo de concessão remuner...
60024,101,6,149533,(BM25|STS)+Reranker,Qual é a modalidade de licitação adequada para...,Existe amparo legal à utilização do modelo de ...
74510,101,7,18865,(BM25|STS)+Reranker,Qual é a modalidade de licitação adequada para...,É cabível a utilização do pregão para concessõ...
41179,101,8,17929,(BM25|STS)+Reranker,Qual é a modalidade de licitação adequada para...,Para a aquisição de bens comuns a Administraçã...
41001,101,9,19399,(BM25|STS)+Reranker,Qual é a modalidade de licitação adequada para...,Deve ser utilizada a modalidade pregão para aq...
73636,101,10,34102,(BM25|STS)+Reranker,Qual é a modalidade de licitação adequada para...,Nas licitações para a concessão de serviços pú...


In [50]:
for idx, row in df_join_bm25_sts_reranker.query('RANK <= 10 and QUERY_ID == 101').iterrows():
    score, reasoning = get_llm_score(row['QUERY_TEXT'], row['DOC_TEXT'])
    df_join_bm25_sts_reranker.loc[idx, 'LLM_SCORE'] = score
    df_join_bm25_sts_reranker.loc[idx, 'LLM_REASONING'] = reasoning
    rank = row['RANK']
    print(rank, score, reasoning)

df_join_bm25_sts_reranker.query('RANK <= 10 and QUERY_ID == 101').sort_values('RANK')

5 1 O enunciado aborda o tema de concessão remunerada de uso de bens públicos e menciona a necessidade de um novo certame licitatório em caso de desistência, mas não especifica qual modalidade de licitação é adequada para essa situação.
9 1 O enunciado aborda o tema de modalidades de licitação, mas não trata especificamente da concessão remunerada de uso de bens públicos.
8 1 O enunciado de jurisprudência aborda a modalidade de licitação para a aquisição de bens comuns, mas não trata especificamente da concessão remunerada de uso de bens públicos.
2 2 O enunciado responde parcialmente à pergunta, mencionando a modalidade de licitação 'pregão' como recomendável para a concessão remunerada de uso de bens públicos. No entanto, não aborda completamente outras possíveis modalidades ou nuances relacionadas à escolha da modalidade adequada.
1 3 O enunciado responde diretamente à pergunta, indicando que o pregão é a modalidade de licitação adequada para a concessão remunerada de uso de bens pú

Unnamed: 0,QUERY_ID,RANK,DOC_ID,ENGINE,QUERY_TEXT,DOC_TEXT,LLM_SCORE,LLM_REASONING
43851,101,1,2845,(BM25|STS)+Reranker,Qual é a modalidade de licitação adequada para...,"Em regra, o pregão é a modalidade de licitação...",3.0,"O enunciado responde diretamente à pergunta, i..."
41428,101,2,17360,(BM25|STS)+Reranker,Qual é a modalidade de licitação adequada para...,É recomendável a utilização de pregão para a c...,2.0,"O enunciado responde parcialmente à pergunta, ..."
66904,101,3,5714,(BM25|STS)+Reranker,Qual é a modalidade de licitação adequada para...,A cessão das áreas comerciais de centrais públ...,3.0,"O enunciado responde diretamente à pergunta, i..."
46534,101,4,58593,(BM25|STS)+Reranker,Qual é a modalidade de licitação adequada para...,Na licitação que tem por objeto a concessão re...,1.0,O enunciado está relacionado ao tópico da perg...
19717,101,5,14862,(BM25|STS)+Reranker,Qual é a modalidade de licitação adequada para...,O contrato administrativo de concessão remuner...,1.0,O enunciado aborda o tema de concessão remuner...
60024,101,6,149533,(BM25|STS)+Reranker,Qual é a modalidade de licitação adequada para...,Existe amparo legal à utilização do modelo de ...,1.0,O enunciado de jurisprudência aborda a utiliza...
74510,101,7,18865,(BM25|STS)+Reranker,Qual é a modalidade de licitação adequada para...,É cabível a utilização do pregão para concessõ...,2.0,O enunciado aborda a modalidade de licitação p...
41179,101,8,17929,(BM25|STS)+Reranker,Qual é a modalidade de licitação adequada para...,Para a aquisição de bens comuns a Administraçã...,1.0,O enunciado de jurisprudência aborda a modalid...
41001,101,9,19399,(BM25|STS)+Reranker,Qual é a modalidade de licitação adequada para...,Deve ser utilizada a modalidade pregão para aq...,1.0,O enunciado aborda o tema de modalidades de li...
73636,101,10,34102,(BM25|STS)+Reranker,Qual é a modalidade de licitação adequada para...,Nas licitações para a concessão de serviços pú...,1.0,O enunciado está relacionado ao tema de licita...


In [74]:
import numpy as np

query_df = 'QUERY_ID == 101 and (RANK == ' + ' or RANK == '.join([str(r) for r in list(np.random.choice(700, 3, replace=False) + 301)]) + ')'
query_df

'QUERY_ID == 101 and (RANK == 873 or RANK == 400 or RANK == 557)'

In [79]:
df_bm25.query(query_df)

Unnamed: 0,QUERY_ID,RANK,DOC_ID,ENGINE,QUERY_TEXT,DOC_TEXT
50273,101,400,16858,BM25,Qual é a modalidade de licitação adequada para...,Diante de constatação que possa levar à negati...
76157,101,873,31572,BM25,Qual é a modalidade de licitação adequada para...,É causa de impedimento para participar de lici...
120324,101,557,13775,BM25,Qual é a modalidade de licitação adequada para...,Não é necessário desconsiderar a personalidade...


In [81]:
for i, (idx, row) in enumerate(df_bm25.query(query_df).iterrows()):
    score, reasoning = get_llm_score(row['QUERY_TEXT'], row['DOC_TEXT'])
    df_bm25.loc[idx, 'LLM_SCORE'] = score
    df_bm25.loc[idx, 'LLM_REASONING'] = reasoning
    rank = row['RANK']
    print(rank, score, reasoning)
df_bm25[df_bm25['LLM_SCORE'].notnull()].sort_values(['QUERY_ID', 'RANK'])

400 0 O enunciado de jurisprudência aborda o tema de registro de ato de admissão de pessoal e concessão de aposentadoria, reforma ou pensão, não tratando da modalidade de licitação adequada para a concessão remunerada de uso de bens públicos.
873 0 O enunciado de jurisprudência aborda o tema de impedimento para participar de licitação devido a relações de parentesco, mas não responde à consulta sobre a modalidade de licitação adequada para a concessão remunerada de uso de bens públicos.
557 0 O enunciado de jurisprudência não aborda a consulta sobre a modalidade de licitação adequada para a concessão remunerada de uso de bens públicos, mas sim a responsabilidade de entidades privadas e seus dirigentes na aplicação de recursos.


Unnamed: 0,QUERY_ID,RANK,DOC_ID,ENGINE,QUERY_TEXT,DOC_TEXT,LLM_SCORE,LLM_REASONING
50273,101,400,16858,BM25,Qual é a modalidade de licitação adequada para...,Diante de constatação que possa levar à negati...,0.0,O enunciado de jurisprudência aborda o tema de...
120324,101,557,13775,BM25,Qual é a modalidade de licitação adequada para...,Não é necessário desconsiderar a personalidade...,0.0,O enunciado de jurisprudência não aborda a con...
76157,101,873,31572,BM25,Qual é a modalidade de licitação adequada para...,É causa de impedimento para participar de lici...,0.0,O enunciado de jurisprudência aborda o tema de...


# Execução Completa - Docs + relevantes

In [86]:
del df_bm25['LLM_SCORE']
del df_bm25['LLM_REASONING']

In [92]:
for query_id, row in df_queries.iterrows():
    query_text = row['QUERY_TEXT']
    query_type = 'Pergunta' if query_id > 100 else 'Consulta'    
    print (query_type, query_id, query_text)

Consulta 1 técnica e preço
Consulta 2 restos a pagar
Consulta 3 aditivo a contrato
Consulta 4 adesão a ata de registro de preços
Consulta 5 sobrepreço e superfaturamento
Consulta 6 restrição a competitividade
Consulta 7 acréscimos e supressões
Consulta 8 obras e serviços de engenharia
Consulta 9 fiscalizacao de contratos
Consulta 10 diarias e passagens
Consulta 11 bens e serviços comuns
Consulta 12 parcelas de maior relevância e valor significativo
Consulta 13 despesa sem cobertura contratual
Consulta 14 decreto-lei 4.657/1942
Consulta 15 contas e materialidade
Consulta 16 inexequibilidade e comprovação
Consulta 17 impedimento de licitar e contratar
Consulta 18 aditivo e obra
Consulta 19 fraude a licitacao
Consulta 20 auditoria interna
Consulta 21 fracionamento de despesas
Consulta 22 novo e improrrogável prazo
Consulta 23 inidoneidade de licitante
Consulta 24 licitações e contratos
Consulta 25 exigência de atestado de capacidade
Consulta 26 contrato com a administração pública
Consult

## Execução 1 - queries 1 a 39

In [93]:
for query_id, row in df_queries.iterrows():
    query_text = row['QUERY_TEXT']
    query_type = 'Pergunta' if query_id > 100 else 'Consulta'    
    print (query_type, query_id, query_text + ':')
    for idx, row in df_join_bm25_sts_reranker.query('RANK <= 10 and QUERY_ID == ' + str(query_id)).iterrows():
        score, reasoning = get_llm_score(row['QUERY_TEXT'], row['DOC_TEXT'])
        df_join_bm25_sts_reranker.loc[idx, 'LLM_SCORE'] = score
        df_join_bm25_sts_reranker.loc[idx, 'LLM_REASONING'] = reasoning
        rank = row['RANK']
        print('\tRank', rank, ' - score', score, ' - razão', reasoning)

Consulta 1 técnica e preço
	Rank 1  - score 3  - razão O enunciado aborda diretamente a relação entre técnica e preço, mencionando a possibilidade de dar maior importância à técnica em detrimento do preço em situações específicas, como a complexidade do objeto e a manutenção da competitividade.
	Rank 2  - score 3  - razão O enunciado aborda diretamente a consulta, mencionando a técnica e o preço como critérios a serem adotados na licitação devido à complexidade e natureza do objeto, além de tratar de especificidades técnicas inéditas e de caráter intelectual.
	Rank 3  - score 3  - razão O enunciado aborda diretamente a consulta sobre técnica e preço, discutindo a irregularidade na atribuição de excessiva valoração ao quesito técnica em detrimento do preço e a importância de um estudo suficiente para justificar tal critério. Além disso, menciona o impacto dessa desproporção na competitividade e na obtenção da proposta mais vantajosa.
	Rank 4  - score 3  - razão O enunciado aborda direta

Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 1.0 seconds as it raised Timeout: Request timed out: HTTPSConnectionPool(host='openai-tcu-sandbox.openai.azure.com', port=443): Read timed out. (read timeout=600).


	Rank 1  - score 3  - razão O enunciado aborda diretamente a consulta, tratando da publicidade em relação aos atos praticados durante o concurso público e mencionando a publicação no Diário Oficial da União do resultado das provas e das notas atribuídas aos candidatos.
	Rank 2  - score 2  - razão O enunciado aborda o tema da publicidade no contexto de concurso público, mencionando a nomeação do candidato aprovado e a publicação do ato na imprensa oficial. No entanto, não trata especificamente de todos os aspectos relacionados à publicidade e concurso público.
	Rank 3  - score 2  - razão O enunciado aborda o tema de publicidade em relação a um concurso público, especificamente sobre a divulgação dos atos praticados pelo presidente do concurso e as notas dos candidatos. No entanto, não aborda completamente todas as nuances da consulta, como outros aspectos da publicidade no contexto de concursos públicos.
	Rank 4  - score 2  - razão O enunciado aborda a publicidade em processos seletivos

Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 1.0 seconds as it raised APIError: Invalid response object from API: '{ "statusCode": 401, "message": "Unauthorized. Access token is missing, invalid, audience is incorrect (https://cognitiveservices.azure.com), or have expired." }' (HTTP response code was 401).


	Rank 10  - score 3  - razão O enunciado aborda diretamente a consulta, tratando da validade da citação e explicando que a comunicação processual não precisa ser entregue pessoalmente ao destinatário, desde que o aviso de recebimento seja recebido no endereço do responsável, obtido em fonte de dados oficial.
Consulta 40 multa a particulares


Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 2.0 seconds as it raised APIError: Invalid response object from API: '{ "statusCode": 401, "message": "Unauthorized. Access token is missing, invalid, audience is incorrect (https://cognitiveservices.azure.com), or have expired." }' (HTTP response code was 401).
Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 4.0 seconds as it raised APIError: Invalid response object from API: '{ "statusCode": 401, "message": "Unauthorized. Access token is missing, invalid, audience is incorrect (https://cognitiveservices.azure.com), or have expired." }' (HTTP response code was 401).
Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 8.0 seconds as it raised APIError: Invalid response object from API: '{ "statusCode": 401, "message": "Unauthorized. Access token is missing, invalid, audie

APIError: Invalid response object from API: '{ "statusCode": 401, "message": "Unauthorized. Access token is missing, invalid, audience is incorrect (https://cognitiveservices.azure.com), or have expired." }' (HTTP response code was 401)

In [94]:
query_id

40

## Execução 2 - queries 40 a 75

In [98]:
for query_id, row in df_queries.iterrows():
    if query_id < 40:
        continue
    query_text = row['QUERY_TEXT']
    query_type = 'Pergunta' if query_id > 100 else 'Consulta'    
    print (query_type, query_id, query_text + ':')
    for idx, row in df_join_bm25_sts_reranker.query('RANK <= 10 and QUERY_ID == ' + str(query_id)).iterrows():
        score, reasoning = get_llm_score(row['QUERY_TEXT'], row['DOC_TEXT'])
        df_join_bm25_sts_reranker.loc[idx, 'LLM_SCORE'] = score
        df_join_bm25_sts_reranker.loc[idx, 'LLM_REASONING'] = reasoning
        rank = row['RANK']
        print('\tRank', rank, ' - score', score, ' - razão', reasoning)

Consulta 40 multa a particulares:
	Rank 5  - score 2  - razão O enunciado aborda a aplicação de multa a uma entidade privada contratada pela Administração Pública, que está relacionado à consulta sobre multa a particulares. No entanto, o enunciado se concentra na não aplicação da multa prevista no artigo 58 da Lei 8.443/1992, tratando apenas parcialmente da consulta.
	Rank 6  - score 2  - razão O enunciado aborda a aplicação de multa a dirigentes de entidades privadas, que se relaciona com a consulta sobre multa a particulares. No entanto, o enunciado se limita a discutir a ausência de amparo constitucional ou legal para aplicar multa sem a presença de débito ao erário associado a ato irregular praticado por agentes públicos, não abordando completamente todas as nuances da consulta.
	Rank 2  - score 2  - razão O enunciado aborda a aplicação de multas a particulares, mas especificamente aos que atuam como gestores de recursos públicos. No entanto, não aborda a aplicação de multas a part

Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 1.0 seconds as it raised Timeout: Request timed out: HTTPSConnectionPool(host='openai-tcu-sandbox.openai.azure.com', port=443): Read timed out. (read timeout=600).


	Rank 4  - score 2  - razão O enunciado aborda a aquisição de bens e serviços sem amparo contratual e menciona a aplicação de multa prevista na Lei 8.443/1992, o que está relacionado à consulta sobre despesas sem cobertura contratual e multa. No entanto, não trata completamente das nuances da consulta.
	Rank 8  - score 1  - razão O enunciado aborda o tema de despesas sem cobertura contratual, mas não menciona especificamente multas ou penalidades relacionadas a essa situação.
	Rank 1  - score 3  - razão O enunciado aborda diretamente a consulta, mencionando a aplicação de multa por grave infração à norma legal em casos de despesas sem cobertura contratual e sem licitação, além de destacar a responsabilidade do gestor na escolha de seus subordinados.
	Rank 7  - score 1  - razão O enunciado está relacionado ao tópico da consulta, pois aborda a irregularidade de pagamentos por serviços não realizados e sem previsão contratual. No entanto, não menciona especificamente despesas sem cobertur

Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 1.0 seconds as it raised Timeout: Request timed out: HTTPSConnectionPool(host='openai-tcu-sandbox.openai.azure.com', port=443): Read timed out. (read timeout=600).


	Rank 8  - score 1  - razão O enunciado está relacionado ao tópico da consulta, pois menciona estabelecimentos comerciais em aeroportos, mas não aborda especificamente o uso de áreas comerciais em aeroportos no contexto de um pregão.
Consulta 57 cessão das áreas comerciais de centrais públicas de abastecimento de gêneros alimentícios licitação:
	Rank 8  - score 1  - razão O enunciado de jurisprudência aborda o tema de licitação para aquisição de gêneros alimentícios, mas não trata especificamente da cessão das áreas comerciais de centrais públicas de abastecimento. Portanto, está relacionado ao tópico da consulta, mas não responde diretamente a ela.
	Rank 2  - score 1  - razão O enunciado aborda a concessão administrativa de uso de bem público e a necessidade de licitação, mas não trata especificamente das áreas comerciais de centrais públicas de abastecimento de gêneros alimentícios.
	Rank 3  - score 2  - razão O enunciado aborda a concessão administrativa de uso de bem público em emp

Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 1.0 seconds as it raised Timeout: Request timed out: HTTPSConnectionPool(host='openai-tcu-sandbox.openai.azure.com', port=443): Read timed out. (read timeout=600).


	Rank 9  - score 3  - razão O enunciado aborda diretamente a pesquisa de preços para elaboração do orçamento estimativo da licitação e menciona a importância de não se restringir apenas a cotações junto a potenciais fornecedores, mas também considerar outras fontes. Isso responde completamente à consulta sobre pesquisa de mercado, orçamento e fornecedores.
	Rank 7  - score 3  - razão O enunciado aborda diretamente a pesquisa de mercado, orçamento e fornecedores, fornecendo informações sobre como a pesquisa de preços deve ser conduzida e quais fontes podem ser utilizadas para elaborar um orçamento estimativo em licitações.
Consulta 65 pesquisa de preços obrigatória em licitações:
	Rank 3  - score 3  - razão O enunciado aborda diretamente a pesquisa de preços em licitações, destacando sua importância como instrumento indispensável para avaliar a razoabilidade dos valores apresentados pelos licitantes e a necessidade de realizá-la e anexá-la ao processo licitatório.
	Rank 6  - score 3  - 

Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 1.0 seconds as it raised Timeout: Request timed out: HTTPSConnectionPool(host='openai-tcu-sandbox.openai.azure.com', port=443): Read timed out. (read timeout=600).


	Rank 9  - score 1  - razão O enunciado aborda o tema de contratação de serviços advocatícios por conselho de fiscalização profissional, mas não trata especificamente do atestado de capacidade técnica.
Consulta 76 reposição de importâncias indevidamente percebidas boa-fé servidores erro escusável por órgão/entidade:
	Rank 6  - score 3  - razão O enunciado de jurisprudência aborda diretamente a consulta, tratando da dispensa de reposição de importâncias indevidamente percebidas em boa-fé por servidores, em virtude de erro escusável por parte do órgão/entidade ou autoridade legalmente investida. Além disso, menciona a presunção de legalidade do ato administrativo e o caráter alimentar das parcelas salariais, abordando as nuances da consulta.
	Rank 7  - score 3  - razão O enunciado de jurisprudência aborda diretamente a consulta, tratando da dispensa de reposição de importâncias indevidamente percebidas em casos de boa-fé e erro escusável por parte do órgão/entidade ou autoridade legalmen

Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 1.0 seconds as it raised APIError: Invalid response object from API: '{ "statusCode": 401, "message": "Unauthorized. Access token is missing, invalid, audience is incorrect (https://cognitiveservices.azure.com), or have expired." }' (HTTP response code was 401).


	Rank 2  - score 3  - razão O enunciado de jurisprudência aborda diretamente a consulta, tratando da reposição de importâncias indevidamente percebidas, boa-fé dos servidores e erro escusável por órgão/entidade. Além disso, menciona a dispensa da reposição em casos de erro escusável de interpretação de lei.


Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 2.0 seconds as it raised APIError: Invalid response object from API: '{ "statusCode": 401, "message": "Unauthorized. Access token is missing, invalid, audience is incorrect (https://cognitiveservices.azure.com), or have expired." }' (HTTP response code was 401).
Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 4.0 seconds as it raised APIError: Invalid response object from API: '{ "statusCode": 401, "message": "Unauthorized. Access token is missing, invalid, audience is incorrect (https://cognitiveservices.azure.com), or have expired." }' (HTTP response code was 401).
Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 8.0 seconds as it raised APIError: Invalid response object from API: '{ "statusCode": 401, "message": "Unauthorized. Access token is missing, invalid, audie

APIError: Invalid response object from API: '{ "statusCode": 401, "message": "Unauthorized. Access token is missing, invalid, audience is incorrect (https://cognitiveservices.azure.com), or have expired." }' (HTTP response code was 401)

In [99]:
query_id

76

## Execução 3 - queries 76 a 100

In [108]:
for query_id, row in df_queries.iterrows():
    if query_id < 101:
        continue
    query_text = row['QUERY_TEXT']
    query_type = 'Pergunta' if query_id > 100 else 'Consulta'    
    print (query_type, query_id, query_text + ':')
    for idx, row in df_join_bm25_sts_reranker.query('RANK <= 10 and QUERY_ID == ' + str(query_id)).iterrows():
        score, reasoning = get_llm_score(row['QUERY_TEXT'], row['DOC_TEXT'], query_type)
        df_join_bm25_sts_reranker.loc[idx, 'LLM_SCORE'] = score
        df_join_bm25_sts_reranker.loc[idx, 'LLM_REASONING'] = reasoning
        rank = row['RANK']
        print('\tRank', rank, ' - score', score, ' - razão', reasoning)

Consulta 76 reposição de importâncias indevidamente percebidas boa-fé servidores erro escusável por órgão/entidade:
	Rank 6  - score 3  - razão O enunciado de jurisprudência aborda diretamente a consulta, tratando da reposição de importâncias indevidamente percebidas, boa-fé, servidores, erro escusável e órgão/entidade. Além disso, menciona a dispensa de reposição nessas circunstâncias, o que responde completamente às nuances da consulta.
	Rank 7  - score 3  - razão O enunciado de jurisprudência aborda diretamente a consulta, tratando da reposição de importâncias indevidamente percebidas, boa-fé, servidores, erro escusável e órgão/entidade. Além disso, menciona a dispensa da reposição em virtude dessas condições, o que torna o enunciado altamente relevante para a consulta.
	Rank 5  - score 3  - razão O enunciado de jurisprudência aborda diretamente a consulta, tratando da reposição de importâncias indevidamente percebidas, boa-fé, servidores, erro escusável e órgão/entidade. Além disso

KeyboardInterrupt: 

## Execução 4 - queries 101 a 113

In [111]:
for query_id, row in df_queries.iterrows():
    if query_id < 101:
        continue
    query_text = row['QUERY_TEXT']
    query_type = 'Pergunta' if query_id > 100 else 'Consulta'    
    print (query_type, query_id, query_text + ':')
    for idx, row in df_join_bm25_sts_reranker.query('RANK <= 10 and QUERY_ID == ' + str(query_id)).iterrows():
        score, reasoning = get_llm_score(row['QUERY_TEXT'], row['DOC_TEXT'], query_type)
        df_join_bm25_sts_reranker.loc[idx, 'LLM_SCORE'] = score
        df_join_bm25_sts_reranker.loc[idx, 'LLM_REASONING'] = reasoning
        rank = row['RANK']
        print('\tRank', rank, ' - score', score, ' - razão', reasoning)

Pergunta 101 Qual é a modalidade de licitação adequada para a concessão remunerada de uso de bens públicos?:
	Rank 5  - score 1  - razão O enunciado aborda o tema de concessão remunerada de uso de bens públicos e licitação, mas não responde diretamente à pergunta sobre qual modalidade de licitação é adequada para essa situação.
	Rank 9  - score 1  - razão O enunciado aborda o tema de modalidades de licitação, mas não trata especificamente da concessão remunerada de uso de bens públicos.
	Rank 8  - score 1  - razão O enunciado aborda o tema de modalidades de licitação, mas não trata especificamente da concessão remunerada de uso de bens públicos.
	Rank 2  - score 2  - razão O enunciado aborda a modalidade de licitação, o pregão, para a concessão remunerada de uso de bens públicos, mas não esclarece se é a modalidade mais adequada ou se existem outras opções igualmente adequadas.
	Rank 1  - score 3  - razão O enunciado responde diretamente à pergunta, indicando que o pregão é a modalidad

Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 1.0 seconds as it raised Timeout: Request timed out: HTTPSConnectionPool(host='openai-tcu-sandbox.openai.azure.com', port=443): Read timed out. (read timeout=600).
Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 2.0 seconds as it raised APIError: Invalid response object from API: '{ "statusCode": 401, "message": "Unauthorized. Access token is missing, invalid, audience is incorrect (https://cognitiveservices.azure.com), or have expired." }' (HTTP response code was 401).
Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 4.0 seconds as it raised APIError: Invalid response object from API: '{ "statusCode": 401, "message": "Unauthorized. Access token is missing, invalid, audience is incorrect (https://cognitiveservices.azure.com), or have expired." }' (HTTP response code wa

APIError: Invalid response object from API: '{ "statusCode": 401, "message": "Unauthorized. Access token is missing, invalid, audience is incorrect (https://cognitiveservices.azure.com), or have expired." }' (HTTP response code was 401)

## Execução 5 - queries 114 a 150

In [117]:
for query_id, row in df_queries.iterrows():
    if query_id < 114:
        continue
    query_text = row['QUERY_TEXT']
    query_type = 'Pergunta' if query_id > 100 else 'Consulta'    
    print (query_type, query_id, query_text + ':')
    for idx, row in df_join_bm25_sts_reranker.query('RANK <= 10 and QUERY_ID == ' + str(query_id)).iterrows():
        score, reasoning = get_llm_score(row['QUERY_TEXT'], row['DOC_TEXT'], query_type)
        df_join_bm25_sts_reranker.loc[idx, 'LLM_SCORE'] = score
        df_join_bm25_sts_reranker.loc[idx, 'LLM_REASONING'] = reasoning
        rank = row['RANK']
        print('\tRank', rank, ' - score', score, ' - razão', reasoning)

Pergunta 114 É obrigatória pesquisa de mercado na elaboração do orçamento-base da licitação?:
	Rank 9  - score 3  - razão O enunciado de jurisprudência responde diretamente à pergunta, afirmando que a pesquisa de preços no mercado é indispensável para a avaliação da razoabilidade dos valores apresentados pelos licitantes e deve ser realizada para estimar o custo do objeto a ser adquirido, além de ser anexada ao processo licitatório.
	Rank 6  - score 3  - razão O enunciado de jurisprudência responde diretamente à pergunta, afirmando que a Administração deve observar as informações e valores do orçamento prévio e fazer constar nos processos a pesquisa de mercado utilizada para o cálculo do orçamento-base da licitação.
	Rank 4  - score 2  - razão O enunciado aborda a importância da pesquisa de preços na elaboração do orçamento básico de licitação, mencionando a Lei 8.666/1993. No entanto, não responde diretamente se a pesquisa de mercado é obrigatória, mas indica que a consulta a empresas

Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 1.0 seconds as it raised Timeout: Request timed out: HTTPSConnectionPool(host='openai-tcu-sandbox.openai.azure.com', port=443): Read timed out. (read timeout=600).


	Rank 4  - score 2  - razão O enunciado aborda a realização de pesquisas de preços em relação a renovações contratuais e menciona a necessidade de aferir os valores unitários dos preços praticados com os vigentes no mercado. Embora não responda diretamente se a pesquisa de preços correntes no mercado é obrigatória em licitações, o enunciado sugere a importância dessa prática.
	Rank 5  - score 3  - razão O enunciado responde diretamente à pergunta, afirmando que é obrigatória a realização de ampla pesquisa de mercado na elaboração do orçamento-base da licitação, utilizando fontes oficiais ou orçamentos de pelo menos três fornecedores, e que essa pesquisa deve estar documentada no processo licitatório.
	Rank 7  - score 2  - razão O enunciado aborda a pesquisa de preços na elaboração do orçamento estimativo da licitação, mencionando a necessidade de utilizar diversas fontes para obter informações sobre preços correntes no mercado. No entanto, não afirma explicitamente que a pesquisa de pr

Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 1.0 seconds as it raised Timeout: Request timed out: HTTPSConnectionPool(host='openai-tcu-sandbox.openai.azure.com', port=443): Read timed out. (read timeout=600).


	Rank 10  - score 2  - razão O enunciado aborda a prescrição da pretensão punitiva do TCU e seu impacto nos processos de controle externo, mas não trata especificamente do julgamento das contas em si.
	Rank 7  - score 1  - razão O enunciado de jurisprudência aborda a imprescritibilidade das ações de ressarcimento ao erário e a decisão do TCU, mas não trata diretamente da prescrição da pretensão punitiva e seu efeito no julgamento das contas.
Pergunta 145 O Banco de Preços em Saúde é uma referência de preços válida para a aquisição de medicamentos?:
	Rank 7  - score 3  - razão O enunciado de jurisprudência responde diretamente à pergunta, afirmando que o Banco de Preços em Saúde não deve ser utilizado como referência de preços válida para a aquisição de medicamentos devido às suas fragilidades e limitações.
	Rank 3  - score 3  - razão O enunciado responde diretamente à pergunta, afirmando que o Banco de Preços em Saúde é válido como referencial de preços de mercado na aquisição de medic

Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 1.0 seconds as it raised Timeout: Request timed out: HTTPSConnectionPool(host='openai-tcu-sandbox.openai.azure.com', port=443): Read timed out. (read timeout=600).


	Rank 7  - score 2  - razão O enunciado aborda a prorrogação contratual de serviços de natureza contínua e menciona a vantajosidade econômica sem a necessidade de pesquisa de mercado, porém não especifica quais fontes devem ser prioritárias na pesquisa de preços. Portanto, o enunciado responde parcialmente à pergunta.
	Rank 5  - score 2  - razão O enunciado aborda a pesquisa de preços para aquisição de bens e contratação de serviços em geral, mencionando a preferência por preços praticados no âmbito da Administração Pública e a utilização de pesquisa junto a fornecedores em último caso. Embora não trate especificamente de serviços de natureza continuada, as informações fornecidas são relevantes e podem ser aplicadas ao contexto da pergunta.


Retrying langchain.chat_models.openai.ChatOpenAI.completion_with_retry.<locals>._completion_with_retry in 1.0 seconds as it raised Timeout: Request timed out: HTTPSConnectionPool(host='openai-tcu-sandbox.openai.azure.com', port=443): Read timed out. (read timeout=600).


	Rank 6  - score 2  - razão O enunciado aborda a pesquisa de preços para aquisição de bens e contratação de serviços, mencionando a preferência por preços praticados no âmbito da Administração Pública e a utilização de pesquisa junto a fornecedores em último caso. No entanto, não trata especificamente de serviços de natureza continuada ou renovação de contrato.
	Rank 10  - score 2  - razão O enunciado aborda a importância de realizar pesquisas de preços antes da renovação de contratos de serviços continuados, mencionando a necessidade de comparar os valores unitários com os praticados no mercado. No entanto, não especifica quais fontes devem ser prioritárias na pesquisa de preços.
	Rank 4  - score 2  - razão O enunciado aborda a prorrogação de contratos de serviços continuados e menciona a necessidade de pesquisa de mercado para garantir condições e preços vantajosos. No entanto, não especifica quais fontes devem ser prioritárias na pesquisa de preços.
	Rank 1  - score 3  - razão O enu

# Finalização

In [118]:
df_most_relevants = df_join_bm25_sts_reranker[df_join_bm25_sts_reranker['LLM_SCORE'].notnull()]
df_most_relevants

Unnamed: 0,QUERY_ID,RANK,DOC_ID,ENGINE,QUERY_TEXT,DOC_TEXT,LLM_SCORE,LLM_REASONING
0,1,1,21064,(BM25|STS)+Reranker,técnica e preço,Admite-se a preponderância da técnica sobre o ...,3.0,O enunciado aborda diretamente a relação entre...
4,72,2,21064,(BM25|STS)+Reranker,ponderação técnica e preço,Admite-se a preponderância da técnica sobre o ...,3.0,"O enunciado aborda diretamente a consulta, tra..."
9,1,2,42166,(BM25|STS)+Reranker,técnica e preço,Diante da complexidade e da natureza do objeto...,3.0,"O enunciado aborda diretamente a consulta, men..."
18,111,8,42166,(BM25|STS)+Reranker,Qual é a modalidade de licitação utilizada par...,Diante da complexidade e da natureza do objeto...,2.0,O enunciado aborda a modalidade de licitação '...
21,1,3,13702,(BM25|STS)+Reranker,técnica e preço,"Nas licitações do tipo técnica e preço, é irre...",3.0,O enunciado aborda diretamente a consulta sobr...
...,...,...,...,...,...,...,...,...
80793,100,1,17892,(BM25|STS)+Reranker,assistência médica a servidores,A contratação de entidade para prestação de se...,2.0,O enunciado aborda a contratação de entidade p...
80795,150,1,17892,(BM25|STS)+Reranker,Qual é a regra geral para a contratação de ent...,A contratação de entidade para prestação de se...,3.0,"O enunciado responde diretamente à pergunta, m..."
81205,106,7,17267,(BM25|STS)+Reranker,O pregão é adequado para concessões de uso de ...,No âmbito das concessões realizadas pela Agênc...,1.0,O enunciado está relacionado ao tópico de conc...
81706,150,8,91180,(BM25|STS)+Reranker,Qual é a regra geral para a contratação de ent...,É possível a contratação da execução indireta ...,1.0,O enunciado de jurisprudência aborda a contrat...


In [119]:
df_most_relevants.to_csv('../../data/llm_juris_tcu/eval_most_relevants.csv', index=False)