# Best practices to work with your data

## Filter for documents that belong to one category

In Project 46 you want to get all documents that belong to category with ID 63.

In [17]:
from konfuzio_sdk.data import Project

prj = Project(id_=46)
category = prj.get_category_by_id(63)

category.documents()

[Gehalt.pdf: 44823,
 Festlohn.pdf: 44834,
 vermögenswirksame Leistungen.pdf: 44839,
 betriebliche Altersvorsorge AG finanziert.pdf: 44840,
 Weihnachtsgeld.pdf: 44841,
 Stundenlohn.pdf: 44842,
 Fahrtkostenzuschuss pauschal versteuert.pdf: 44843,
 Betirebliche Altersvorsorge Mischfinanzierung.pdf: 44845,
 Darlehen.pdf: 44846,
 Dienstwagen mit Gehaltsverzicht.pdf: 44847,
 Auswertungspaket - unterschiedliche B_N-Auswertungen.pdf_1.pdf: 44848,
 Auswertungspaket - unterschiedliche B_N-Auswertungen.pdf_2.pdf: 44850,
 Auswertungspaket - unterschiedliche B_N-Auswertungen.pdf_4.pdf: 44851,
 Auswertungspaket - unterschiedliche B_N-Auswertungen.pdf_3.pdf: 44852,
 Auswertungspaket - unterschiedliche B_N-Auswertungen.pdf_5.pdf: 44853,
 Auswertungspaket - unterschiedliche B_N-Auswertungen.pdf_6.pdf: 44854,
 Auswertungspaket - unterschiedliche B_N-Auswertungen.pdf_7.pdf: 44855,
 Auswertungspaket - unterschiedliche B_N-Auswertungen.pdf_8.pdf: 44856,
 Auswertungspaket - unterschiedliche B_N-Auswertungen

## Edit an Annotation that is online

In [18]:
doc = prj.get_document_by_id(44864)
annotations = doc.annotations(start_offset=10, end_offset=200)
annotations

[Austellungsdatum (159, 169)]

Let's look into the first Annotation

In [19]:
first_annotation = annotations[0]
first_annotation.__dict__

{'id_local': 6789,
 'is_correct': True,
 'revised': True,
 'normalized': '2017-12-21',
 'translated_string': None,
 'document': 2022-02-13 16:19:30.684745: 44864,
 '_spans': [Span (159, 169)],
 'id_': 672245,
 'confidence': 1.0,
 'label': Austellungsdatum,
 'label_set': Lohnabrechnung (63),
 'annotation_set': AnnotationSet(78791) of Lohnabrechnung (63) in 2022-02-13 16:19:30.684745: 44864.,
 'selection_bbox': {'bottom': 44.129,
  'page_index': 0,
  'top': 35.129,
  'x0': 468.48,
  'x1': 526.8,
  'y0': 797.551,
  'y1': 806.551},
 'page_number': None,
 'top': 35.129,
 'x0': 468.48,
 'x1': 526.8,
 'y0': 797.551,
 'y1': 806.551,
 'bottom': 44.129,
 'bboxes': [{'bottom': 44.129,
   'end_offset': 169,
   'line_number': 2,
   'offset_string': '21.12.2017',
   'offset_string_original': '21.12.2017',
   'page_index': 0,
   'start_offset': 159,
   'top': 35.129,
   'x0': 468.48,
   'x1': 526.8,
   'y0': 797.551,
   'y1': 806.551}],
 '_tokens': [],
 '_regex': None}

We want to change the revised status to False.

In [20]:
first_annotation.revised = False

Now we have it locally, but not online. So save it to save it online.

In [21]:
first_annotation.save()

False

In [22]:
first_annotation.__dict__

{'id_local': 6789,
 'is_correct': True,
 'revised': False,
 'normalized': '2017-12-21',
 'translated_string': None,
 'document': 2022-02-13 16:19:30.684745: 44864,
 '_spans': [Span (159, 169)],
 'id_': 672245,
 'confidence': 1.0,
 'label': Austellungsdatum,
 'label_set': Lohnabrechnung (63),
 'annotation_set': AnnotationSet(78791) of Lohnabrechnung (63) in 2022-02-13 16:19:30.684745: 44864.,
 'selection_bbox': {'bottom': 44.129,
  'page_index': 0,
  'top': 35.129,
  'x0': 468.48,
  'x1': 526.8,
  'y0': 797.551,
  'y1': 806.551},
 'page_number': None,
 'top': 35.129,
 'x0': 468.48,
 'x1': 526.8,
 'y0': 797.551,
 'y1': 806.551,
 'bottom': 44.129,
 'bboxes': [{'bottom': 44.129,
   'end_offset': 169,
   'line_number': 2,
   'offset_string': '21.12.2017',
   'offset_string_original': '21.12.2017',
   'page_index': 0,
   'start_offset': 159,
   'top': 35.129,
   'x0': 468.48,
   'x1': 526.8,
   'y0': 797.551,
   'y1': 806.551}],
 '_tokens': [],
 '_regex': None}