argilla-io · frascuchon · Jan 19, 2022 · Jan 17, 2022 · Jan 18, 2022 · Jan 18, 2022
diff --git a/src/rubrix/server/tasks/text_classification/api/model.py b/src/rubrix/server/tasks/text_classification/api/model.py
@@ -489,7 +489,12 @@ class TextClassificationQuery(BaseModel):
     status: List[TaskStatus] = Field(default_factory=list)
     predicted: Optional[PredictionStatus] = Field(default=None, nullable=True)
 
-    def as_elasticsearch(self) -> Dict[str, Any]:
+    only_uncovered: bool = Field(
+        default=False,
+        description="If enabled, filter records that are not affected by defined rules",
+    )
+
+    def as_elasticsearch(self, rules: List[LabelingRule]) -> Dict[str, Any]:
         """Build an elasticsearch query part from search query"""
 
         if self.ids:
@@ -506,6 +511,15 @@ def as_elasticsearch(self) -> Dict[str, Any]:
                 filters.status(self.status),
                 filters.predicted(self.predicted),
                 filters.score(self.score),
+                filters.boolean_filter(
+                    must_not_query=filters.boolean_filter(
+                        should_filters=[
+                            filters.text_query(rule.query) for rule in rules
+                        ]
+                    )
+                )
+                if self.only_uncovered and rules
+                else None,
             ]
             if query_filter
         ]

diff --git a/src/rubrix/server/tasks/text_classification/service/service.py b/src/rubrix/server/tasks/text_classification/service/service.py
@@ -135,10 +135,11 @@ def search(
             The matched records with aggregation info for specified task_meta.py
 
         """
+        rules = self.__labeling__.list_rules(dataset)
         results = self.__dao__.search_records(
             dataset,
             search=RecordSearch(
-                query=query.as_elasticsearch(),
+                query=query.as_elasticsearch(rules),
                 sort=sort_by2elasticsearch(
                     sort_by,
                     valid_fields=[
@@ -187,8 +188,9 @@ def read_dataset(
             the provided query filters. Optional
 
         """
+        rules = self.__labeling__.list_rules(dataset)
         for db_record in self.__dao__.scan_dataset(
-            dataset, search=RecordSearch(query=query.as_elasticsearch())
+            dataset, search=RecordSearch(query=query.as_elasticsearch(rules))
         ):
             yield TextClassificationRecord.parse_obj(db_record)