In [1]:
import sys
#BASE_DIR = "/home/dzigen/Desktop/ITMO/smiles2024/RAG-project-SMILES-2024-"
BASE_DIR = "/trinity/home/team06/workspace/mikhail_workspace/rag_project"
sys.path.insert(0, BASE_DIR)

import pandas as pd 
import ast
import numpy as np
import json
from tqdm import tqdm
from IPython.display import clear_output
import os

from src.Retriever import RerankRetriever
from src.Scorer import SimilarityScorerConfig
from src.Reader import LLM_Model
from src.utils import ReaderMetrics, RetrieverMetrics, save_rag_trial_log, prepare_rerankretriever_configs, prepare_reader_configs, load_benchmarks_df
from src.utils import evaluate_retriever, evaluate_reader

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
# !!! TO CHANGE !!!
TRIAL = 1
BENCHMARKS_MAXSIZE = 500
BENCHMARKS_INFO = {'mtssquad': {'db': 'v2', 'table': 'v1'}}

# Retriever part
RETRIEVER_PARAMS = {
    "stage1_retriever_config": {
        "model_path": f"{BASE_DIR}/models/intfloat/multilingual-e5-small",
        "densedb_kwargs": {'metadata': {"hnsw:space": "ip"}},
        "model_kwargs": {'device':'cuda'},
        "encode_kwargs": {'normalize_embeddings': True, 'prompt': 'query: '},
        "params": {'fetch_k': 50, 'threshold': 0.23, 'max_k': 10}},
    "scorer_config": {
        "system_prompt": '''Ты - экспертная система, задача которой - оценить релевантность контекста по отношению к данному вопросу. На вход поступает вопрос и контекст в текстовом формате, твоя задача - вернуть одну из двух меток: "{cert_label}" - в контексте содержится информация, которая может быть использована для верного ответа на данный вопрос и "{uncert_label}" - в контексте не содержится информации, которая может быть использована для верного ответа на данный вопрос. Не пиши ничего другого, кроме предсказываемой метки релевантности: "{cert_label}" либо "{uncert_label}". 

Примеры: 

Вопрос: По просьбе Мадонны поменяли аранжировщика на более опытного?
Контекст: [' Everybody , как и хотела Мадонна, выпускают синглом. При нулевом бюджете на раскрутку фото певицы решают не помещать на обложке, чтобы не отпугнуть цветную аудиторию якобы негритянской диско-соул-певицы . Everybody поднимается на 3-е место в чарте Hot Dance Club Songs, а потом на 107 место в основном, немного не дотянув до первой сотни Hot 100 журнала Billboard[91]. Менеджмент считает это отличным результатом, учитывая нулевые затраты на пиар, и хочет убедиться, что взлёт Everybody не случаен. По просьбе Мадонны вместо Каминса берут более опытного штатного аранжировщика Warner Bros. Records Регги Лукаса (англ.)русск.. Второй сингл Burning Up тоже достигает в чарте танцевальных хитов 3-го места, повторив успех Everybody . И только после этого Мадонне позволяют арендовать студию для записи первого альбома[91].']
Метка: {cert_label}

Вопрос: Для чего осуществляется деятельность официальных органов по получению и применению финансовых средств?
Контекст: [' Общественные финансы связываются с деятельностью государства (или местной власти), заключающейся в получении и применении средств, необходимых для выполнения надлежащих функций[51], с процессом и механизмом формирования и использования государственных ресурсов, балансом доходов и расходов, соответствующим административным контролем[3]. Некоторые авторы[52] также подчёркивают, что предмет общественных финансов лежит на границе между экономикой и политикой, а также отмечают, что в современных обществах доходы и расходы органов государственной власти состоят, почти исключительно, из денежных поступлений.']
Метка: {cert_label}

Вопрос: Кто запретил Нансену высадиться на побережье Гренландии?
Контекст: ['29 февраля 1892 года столетие со дня рождения Россини было отмечено должным образом во Флоренции, но горожане, любившие его музыку, ощущали неловкость оттого, что на могиле Россини в Санта-Кроче все ещё не было подходящего памятника. На первом открытом конкурсе, состоявшемся в 1897 году, комиссия не сочла ни один проект приемлемым. На втором конкурсе, который состоялся в следующем году, новая комиссия одобрила проект Джузеппе Кассиоли. Получившийся в результате монумент был открыт 23 июня 1902 года. Поставленный на фоне северной стены Санта-Кроче, он содержит надпись: Джоаккино Россини . У его основания три датированных картуша гласят: Пезаро , Флоренция , Париж , таким образом, официально отрицая справедливые притязания Болоньи на то, что она внесла свою значительную лепту в длительную славу Россини.']
Метка: {uncert_label}

Вопрос: Кто в 1536 году был губернатором провинции Санта-Марта?
Контекст: ['9 (21) мая владыка Иннокентий заложил в Усть-Зейской станице храм в честь Благовещения Пресвятой Богородицы (по имени этого храма был впоследствии назван город). 12 (24) мая начались переговоры между представителями Цинской империи и чиновниками российского внешнеполитического ведомства во главе с Н. Н. Муравьёвым. Переговоры велись 5 дней, сопровождаясь многочисленными церемониями по китайским и русским обычаям. 16 (28) мая 1858 года был подписан Айгунский договор, по условиям которого весь левый берег Амура признавался российским.']
Метка: {uncert_label}''',
    "user_prompt_template": "Вопрос: {q}\nДокумент: {c}\nМетка: ",
    "cert_label": "1",
    "uncert_label": "0",
    "gen": {'max_new_tokens': 20, 'eos_token_id': 79097},
    "batch_size": 8
    }
}


# Reader part
READER_PARAMS = {
    'prompts': {
        "assistant": 'Отвечай на вопросы, используя информацию из текстов в списке ниже. Если ты не уверена в релевантности данных текстов по отношению к заданному вопросу, то сгенерируй следующий ответ: "У меня нет ответа на ваш вопрос.".',
        "system": "Ты вопросно-ответная система. Все ответы генерируй на русском языке. По вопросам отвечай кратко, чётко и конкретно. Не генерируй излишнюю информацию.",
    },
    'gen': {'max_new_tokens': 512, 'eos_token_id': 79097},
    'data_operate': {'batch_size': 1}
    }


ADDITIONAL_PARAMS = {
    'topk_score_list': 3
}

BERTSCORE_MODEL_PATH = "ru_electra_medium"
# !!! TO CHANGE !!!

SAVE_LOGDIR = f'./logs/trial{TRIAL}'
SAVE_HYPERPARAMS = f'{SAVE_LOGDIR}/hyperparams.json'
SAVE_READERCACHE = f'{SAVE_LOGDIR}/reader_cache.json'
SAVE_RETRIEVERCACHE = f'{SAVE_LOGDIR}/retriever_cache.json'

##### Configure Reader-part

In [3]:
reader_config = prepare_reader_configs(READER_PARAMS)
READER = LLM_Model(reader_config)

Loading checkpoint shards: 100%|██████████| 4/4 [03:41<00:00, 55.28s/it]


In [4]:
sim_score_config = SimilarityScorerConfig()

In [5]:
reader_metrics = ReaderMetrics(BASE_DIR, BERTSCORE_MODEL_PATH, sim_score_config, READER)

Loading Meteor...
Loading ExactMatch


##### Configure Retriever-part

In [6]:
retrievers_config, benchmarks_path = prepare_rerankretriever_configs(BASE_DIR, BENCHMARKS_INFO, RETRIEVER_PARAMS)
retriever_metrics = RetrieverMetrics()

In [7]:
benchmarks_df = load_benchmarks_df(benchmarks_path, BENCHMARKS_MAXSIZE)

In [8]:
RETRIEVERS = {name: RerankRetriever(config, READER) for name, config in retrievers_config.items()}

No sentence-transformers model found with name /trinity/home/team06/workspace/mikhail_workspace/rag_project/models/intfloat/multilingual-e5-small. Creating a new one with mean pooling.


##### Evaluating pipeline

In [9]:
retriever_scores, retriever_cache, predicted_chunks, cache_relevant_flags = evaluate_retriever(
    benchmarks_df, RETRIEVERS, retriever_metrics, show_step=5, topk_score_list=ADDITIONAL_PARAMS['topk_score_list'])

mtssquad


  0%|          | 0/500 [00:00<?, ?it/s]

uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  return (2 * self.precision(pred_cands, gold_cands, k) * self.recall(pred_cands, gold_cands, k)) / (self.precision(pred_cands, gold_cands, k) + self.recall(pred_cands, gold_cands, k))
  return _methods._mean(a, axis=axis, dtype=dtype,
  ret = ret.dtype.type(ret / rcount)
  0%|          | 1/500 [00:16<2:13:24, 16.04s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  0%|          | 2/500 [00:19<1:10:13,  8.46s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  1%|          | 3/500 [00:22<50:09,  6.05s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]  

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  1%|          | 4/500 [00:25<40:04,  4.85s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  1%|          | 5/500 [00:28<34:34,  4.19s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  1%|          | 6/500 [00:31<32:27,  3.94s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  1%|▏         | 7/500 [00:34<29:59,  3.65s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  2%|▏         | 8/500 [00:38<28:39,  3.49s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  2%|▏         | 9/500 [00:41<27:41,  3.38s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  2%|▏         | 10/500 [00:44<26:48,  3.28s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]You seem to be using the pipelines sequentially on GPU. In order to maximize efficiency please use a dataset


uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  2%|▏         | 11/500 [00:48<28:30,  3.50s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  2%|▏         | 12/500 [00:51<27:37,  3.40s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  3%|▎         | 13/500 [00:54<26:49,  3.30s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  3%|▎         | 14/500 [00:57<26:25,  3.26s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  3%|▎         | 15/500 [01:00<25:50,  3.20s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  3%|▎         | 16/500 [01:03<25:34,  3.17s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  3%|▎         | 17/500 [01:06<25:28,  3.16s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  4%|▎         | 18/500 [01:09<24:58,  3.11s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  4%|▍         | 19/500 [01:13<25:20,  3.16s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  4%|▍         | 20/500 [01:16<25:19,  3.17s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  4%|▍         | 21/500 [01:19<25:08,  3.15s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  4%|▍         | 22/500 [01:22<25:25,  3.19s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  5%|▍         | 23/500 [01:25<24:44,  3.11s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  5%|▍         | 24/500 [01:28<24:30,  3.09s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  5%|▌         | 25/500 [01:31<24:06,  3.05s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  5%|▌         | 26/500 [01:34<23:52,  3.02s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  5%|▌         | 27/500 [01:37<24:11,  3.07s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  6%|▌         | 28/500 [01:40<23:53,  3.04s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  6%|▌         | 29/500 [01:43<24:03,  3.06s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  6%|▌         | 30/500 [01:47<24:01,  3.07s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  6%|▌         | 31/500 [01:50<24:17,  3.11s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  6%|▋         | 32/500 [01:53<24:09,  3.10s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  7%|▋         | 33/500 [01:56<24:09,  3.10s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  7%|▋         | 34/500 [01:59<24:25,  3.14s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  7%|▋         | 35/500 [02:02<24:37,  3.18s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  7%|▋         | 36/500 [02:06<24:47,  3.21s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  7%|▋         | 37/500 [02:09<24:21,  3.16s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  8%|▊         | 38/500 [02:12<24:21,  3.16s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  8%|▊         | 39/500 [02:15<24:21,  3.17s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  8%|▊         | 40/500 [02:18<23:49,  3.11s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  8%|▊         | 41/500 [02:21<23:42,  3.10s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  8%|▊         | 42/500 [02:24<23:25,  3.07s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  9%|▊         | 43/500 [02:27<23:08,  3.04s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  9%|▉         | 44/500 [02:30<22:56,  3.02s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  9%|▉         | 45/500 [02:33<22:49,  3.01s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  9%|▉         | 46/500 [02:36<22:51,  3.02s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


  9%|▉         | 47/500 [02:39<23:00,  3.05s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 10%|▉         | 48/500 [02:42<22:42,  3.01s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 10%|▉         | 49/500 [02:45<22:32,  3.00s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 10%|█         | 50/500 [02:48<22:40,  3.02s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 10%|█         | 51/500 [02:51<23:00,  3.07s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 10%|█         | 52/500 [02:54<22:46,  3.05s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 11%|█         | 53/500 [02:57<22:45,  3.06s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 11%|█         | 54/500 [03:01<22:47,  3.07s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 11%|█         | 55/500 [03:04<22:35,  3.05s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 11%|█         | 56/500 [03:06<22:16,  3.01s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 11%|█▏        | 57/500 [03:10<22:43,  3.08s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 12%|█▏        | 58/500 [03:13<23:02,  3.13s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 12%|█▏        | 59/500 [03:16<22:59,  3.13s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 12%|█▏        | 60/500 [03:19<22:31,  3.07s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 12%|█▏        | 61/500 [03:22<22:26,  3.07s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 12%|█▏        | 62/500 [03:25<22:27,  3.08s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 13%|█▎        | 63/500 [03:28<22:33,  3.10s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 13%|█▎        | 64/500 [03:31<22:35,  3.11s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 13%|█▎        | 65/500 [03:35<22:28,  3.10s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 13%|█▎        | 66/500 [03:38<22:26,  3.10s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 13%|█▎        | 67/500 [03:41<23:09,  3.21s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 14%|█▎        | 68/500 [03:44<22:51,  3.17s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 14%|█▍        | 69/500 [03:47<22:41,  3.16s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 14%|█▍        | 70/500 [03:51<24:09,  3.37s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 14%|█▍        | 71/500 [03:55<23:58,  3.35s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 14%|█▍        | 72/500 [03:58<24:06,  3.38s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 15%|█▍        | 73/500 [04:01<24:08,  3.39s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 15%|█▍        | 74/500 [04:05<24:01,  3.38s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 15%|█▌        | 75/500 [04:08<23:20,  3.30s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 15%|█▌        | 76/500 [04:11<23:00,  3.26s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 15%|█▌        | 77/500 [04:14<23:00,  3.26s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 16%|█▌        | 78/500 [04:17<22:38,  3.22s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 16%|█▌        | 79/500 [04:21<22:28,  3.20s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 16%|█▌        | 80/500 [04:24<22:04,  3.15s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 16%|█▌        | 81/500 [04:27<21:43,  3.11s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 16%|█▋        | 82/500 [04:30<22:11,  3.19s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 17%|█▋        | 83/500 [04:33<22:25,  3.23s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 17%|█▋        | 84/500 [04:37<22:48,  3.29s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 17%|█▋        | 85/500 [04:40<23:07,  3.34s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 17%|█▋        | 86/500 [04:44<23:06,  3.35s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 17%|█▋        | 87/500 [04:47<23:28,  3.41s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 18%|█▊        | 88/500 [04:51<23:35,  3.44s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 18%|█▊        | 89/500 [04:54<22:48,  3.33s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 18%|█▊        | 90/500 [04:57<22:08,  3.24s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 18%|█▊        | 91/500 [05:00<21:34,  3.17s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 18%|█▊        | 92/500 [05:03<21:10,  3.11s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 19%|█▊        | 93/500 [05:06<21:10,  3.12s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 19%|█▉        | 94/500 [05:09<21:05,  3.12s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 19%|█▉        | 95/500 [05:12<20:49,  3.09s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 19%|█▉        | 96/500 [05:15<20:26,  3.04s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1
uncert raw len:  1


 19%|█▉        | 97/500 [05:18<20:25,  3.04s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]

uncert raw len:  1
uncert raw len:  1
10 0


 19%|█▉        | 97/500 [05:20<22:13,  3.31s/it, MRR=0, mAP=0, Recall=0, Precision=0, F1=0, NoRelContextScore=nan]


KeyboardInterrupt: 

In [None]:
contexts = {name: [reader_config.prompts.assistant + "\n\n" + "\n\n".join([f'{i+1}. {doc[1]}' for i, doc in enumerate(docs)]) 
                                                                      for docs in chunks] for name, chunks in predicted_chunks.items()}

In [13]:
reader_scores, reader_cache = evaluate_reader(benchmarks_df, READER, reader_metrics, contexts)

  return _methods._mean(a, axis=axis, dtype=dtype,
  ret = ret.dtype.type(ret / rcount)
  1%|          | 10/1000 [01:19<3:03:00, 11.09s/it, BLEU2=0.258, BLEU1=0.328, ExactMatch=0, METEOR=0.539, BertScore=nan]You seem to be using the pipelines sequentially on GPU. In order to maximize efficiency please use a dataset
100%|██████████| 1000/1000 [1:01:16<00:00,  3.68s/it, BLEU2=0.206, BLEU1=0.257, ExactMatch=0.013, METEOR=0.403, BertScore=nan] 


In [14]:
save_rag_trial_log(SAVE_LOGDIR, reader_scores, retriever_scores, 
                   SAVE_HYPERPARAMS, SAVE_READERCACHE, SAVE_RETRIEVERCACHE,
                   reader_cache, retriever_cache_ids, BENCHMARKS_INFO, BENCHMARKS_MAXSIZE,
                   READER_PARAMS, RETRIEVER_PARAMS)