huggingface · NathanHB · Feb 25, 2025 · Feb 18, 2025 · Feb 18, 2025 · Feb 21, 2025
diff --git a/src/lighteval/logging/evaluation_tracker.py b/src/lighteval/logging/evaluation_tracker.py
@@ -198,7 +198,7 @@ def save(self) -> None:
         details_datasets: dict[str, Dataset] = {}
         for task_name, task_details in self.details_logger.details.items():
             # Create a dataset from the dictionary - we force cast to str to avoid formatting problems for nested objects
-            dataset = Dataset.from_list([{k: str(v) for k, v in asdict(detail).items()} for detail in task_details])
+            dataset = Dataset.from_list([asdict(detail) for detail in task_details])
 
             # We don't keep 'id' around if it's there
             column_names = dataset.column_names

diff --git a/src/lighteval/logging/info_loggers.py b/src/lighteval/logging/info_loggers.py
@@ -201,6 +201,7 @@ class Detail:
         num_effective_few_shots: int = 0
         num_asked_few_shots: int = 0
         predictions: list = field(default_factory=list)
+        prediction_logits: list = field(default_factory=list)
         input_tokens: list = field(default_factory=list)
         cont_tokens: list = field(default_factory=list)
         truncated: list = field(default_factory=list)

diff --git a/src/lighteval/models/model_output.py b/src/lighteval/models/model_output.py
@@ -63,7 +63,7 @@ class GenerativeResponse(ModelResponse):
     logits: Optional[list[float]] = None  # Generated text logits
 
     def get_result_for_eval(self):
-        return self.result if self.logits is None else (self.result, self.logits)
+        return self.result
 
 
 @dataclass

diff --git a/tests/logging/test_evaluation_tracker.py b/tests/logging/test_evaluation_tracker.py
@@ -99,8 +99,8 @@ def test_results_logging(mock_evaluation_tracker: EvaluationTracker):
 @pytest.mark.evaluation_tracker(save_details=True)
 def test_details_logging(mock_evaluation_tracker, mock_datetime):
     task_details = {
-        "task1": [DetailsLogger.CompiledDetail(truncated=10, padded=5)],
-        "task2": [DetailsLogger.CompiledDetail(truncated=20, padded=10)],
+        "task1": [DetailsLogger.CompiledDetail(hashes=None, truncated=10, padded=5)],
+        "task2": [DetailsLogger.CompiledDetail(hashes=None, truncated=20, padded=10)],
     }
     mock_evaluation_tracker.details_logger.details = task_details