# Erstellung von Übersichten für die Aussonderung im Zentralen Aktenmagazin

## Einlesen des Findbuches

In [1]:
# Import von Pandas unter dem Kürzel pd
import pandas as pd

In [2]:
# Einlesen der Exceldatei Findbuch.xlsx mit den Daten, auf welchen die Aussonderungsübersichten beruhen. Bennennung des Dataframes als fb (=Findbuch).
fb = pd.read_excel('Findbuch.xlsx')

In [3]:
# Anzeige fb (=Findbuch) zur Kontrolle.
fb

Unnamed: 0,Zugangsnr.,Provenienz,Datum,Ansprechpartner,Stück,Aktenzeichen,Aktentitel,Enthält,Darin,Laufzeit Beginn,Laufzeit Ende,A.-frist,Archivwürdig?,Reihe,Regal,Seite Papierfindbuch,Kassations-vermerk,Datum Kassation,Ausleihe
0,78913,Intendanz,1999-07-01 00:00:00,,58,,,,,,,Dauerhaft,,30,3,77,,NaT,
1,78914,Intendanz,1999-07-01 00:00:00,,58,,,,,,,Dauerhaft,,30,3,77,,NaT,
2,78915,Intendanz,1999-07-01 00:00:00,,58,,,,,,,Dauerhaft,,30,3,77,,NaT,
3,78916,Intendanz,1999-07-01 00:00:00,,58,,,,,,,Dauerhaft,,30,3,77,,NaT,
4,78917,Intendanz,1999-07-01 00:00:00,,58,,,,,,,Dauerhaft,,30,3,77,,NaT,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
10056,109253,MSOE Leitung,24.04.2014,Dagmar Heinelt\n(4603),74,70,Distribution: Evaluation,"Interne Evaluationsberichte, Feinjustierung, S...",,2010,2010,2020,HA? (oder aus DD),32,5,,,NaT,
10057,109254,MSOE Leitung,24.04.2014,Dagmar Heinelt\n(4603),74,71,Etat 2012,,,2012,2012,2022,/,32,5,,,NaT,
10058,109255,MSOE Leitung,24.04.2014,Dagmar Heinelt\n(4603),74,72,"Personalabteilung: Allgemein, Höhergruppierung...",,,2012,2013,2023,/,32,8,,,NaT,
10059,109256,MSOE Leitung,24.04.2014,Dagmar Heinelt\n(4603),74,73,"Leitung: Allgemein, Korrespondenten 2011 2012 ...","Diverses u.a.: Die HA MSOE auf einen Blick, Pe...",Gedruckte Farbfotografien der Abteilung,2011,2013,2023,HA?,32,8,,,NaT,


Dieser Schritt kann zukünftig entfallen. Er wird an dieser Stelle vollzogen, um ein Bild der Tabelle sowie der Darstellung der Tabelleninhalte zu erhalten.

Es fällt auf, dass in der Spalte ***Datum*** verschiedene Formate zum Einsatz kommen. Zu sehen sind hier _YYYY-MM-DD hh:mm:ss_ sowie _DD.MM.YYYY_.

Viele Zellen enthalten den Eintrag ***NaN***. _NAN_, _NaN_ oder _nan_ steht für _Not a Number_ und verweist auf fehlende Werte (_Missing Value_).

Ebenso verhält es sich mit den Einträgen ***NaT*** in der Spalte _Datum Kassation_. _NAT_, _NaT_ oder _nat_ steht für _Not a Time_ und verweist auf fehlende Werte (_Missing Value_).

## Filterung der Datensätze auf zu bearbeitenden Akten

In [4]:
# Anzeige aller Spaltentitel (=columns) von fb (=Findbuch) zur besseren Orientierung. Dieser Schritt kann in Zukunft entfallen.
fb.columns

Index(['Zugangsnr.', 'Provenienz', 'Datum', 'Ansprechpartner', 'Stück',
       'Aktenzeichen', 'Aktentitel', 'Enthält', 'Darin', 'Laufzeit Beginn',
       'Laufzeit Ende', 'A.-frist', 'Archivwürdig?', 'Reihe', 'Regal',
       'Seite Papierfindbuch', 'Kassations-vermerk', 'Datum Kassation',
       'Ausleihe'],
      dtype='object')

Ausgeschlossen werden sollen alle Akten, die an das Historische Archiv oder das Bundesarchiv abgegeben oder bereits kassiert wurden. Ihnen ist gemein, dass sie über einen Eintrag in der Spalte ***Datum Kassation*** verfügen.

Ziel ist es folglich alle Datensätze aufzurufen, die über keinen Eintrag in der Spalte _Datum Kassation_ verfügen bzw. denen an dieser Stelle der Eintrag _NaN_ zugewiesen wird. Fehlende Werte lassen sich allerdings nicht suchen, weshalb an dieser Stelle mit der Methode _.isnull()_ gearbeitet wird. Pandas prüft hierbei, ob es sich um einen Wert handelt, der _NaN_ entspricht.

In [5]:
# Anzeige aller Datensätze ohne Eintrag in Datum Kassation, somit Anzeige aller unbearbeiteten im ZAM noch vorhandenen Akten. Dieser Schritt kann entfallen.
fb[fb['Datum Kassation'].isnull()]

Unnamed: 0,Zugangsnr.,Provenienz,Datum,Ansprechpartner,Stück,Aktenzeichen,Aktentitel,Enthält,Darin,Laufzeit Beginn,Laufzeit Ende,A.-frist,Archivwürdig?,Reihe,Regal,Seite Papierfindbuch,Kassations-vermerk,Datum Kassation,Ausleihe
0,78913,Intendanz,1999-07-01 00:00:00,,58,,,,,,,Dauerhaft,,30,3,77,,NaT,
1,78914,Intendanz,1999-07-01 00:00:00,,58,,,,,,,Dauerhaft,,30,3,77,,NaT,
2,78915,Intendanz,1999-07-01 00:00:00,,58,,,,,,,Dauerhaft,,30,3,77,,NaT,
3,78916,Intendanz,1999-07-01 00:00:00,,58,,,,,,,Dauerhaft,,30,3,77,,NaT,
4,78917,Intendanz,1999-07-01 00:00:00,,58,,,,,,,Dauerhaft,,30,3,77,,NaT,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
10056,109253,MSOE Leitung,24.04.2014,Dagmar Heinelt\n(4603),74,70,Distribution: Evaluation,"Interne Evaluationsberichte, Feinjustierung, S...",,2010,2010,2020,HA? (oder aus DD),32,5,,,NaT,
10057,109254,MSOE Leitung,24.04.2014,Dagmar Heinelt\n(4603),74,71,Etat 2012,,,2012,2012,2022,/,32,5,,,NaT,
10058,109255,MSOE Leitung,24.04.2014,Dagmar Heinelt\n(4603),74,72,"Personalabteilung: Allgemein, Höhergruppierung...",,,2012,2013,2023,/,32,8,,,NaT,
10059,109256,MSOE Leitung,24.04.2014,Dagmar Heinelt\n(4603),74,73,"Leitung: Allgemein, Korrespondenten 2011 2012 ...","Diverses u.a.: Die HA MSOE auf einen Blick, Pe...",Gedruckte Farbfotografien der Abteilung,2011,2013,2023,HA?,32,8,,,NaT,


In [6]:
# Defintion der unbearbeiteten Akten als fbu (=Findbuch unedited/unbearbeitet)
fbu = fb[fb['Datum Kassation'].isnull()]

In [7]:
# Ausgabe der Werte ohne Dopplungen für die Spalte A.-frist (=Aufbewahrungsfrist) von fbu (=Findbuch unedited)
print(fbu['A.-frist'].unique())

['Dauerhaft' 2020 2015 2014 2016 2017 2019 2018 2028 2022
 '2015 (verlängert um 3 Jahre)' 2034 2021 2030 2025 2013
 'Überhaupt erforderlich?' 2012 2042 2023 2009 2010 2041 2040 2024 2043
 2044 2027 2031 2032 2026]


Alle Akten, deren __Aufbewahrungsfrist__ bereits abgelaufen ist, d.h. alle Datensätze mit einem Wert von kleiner als 2021, sind für die zu erstellenden Übersichten von Relevanz. Da die Spaltenwerte neben Jahreszahlen auch einen Wert wie _Dauerhaft_ oder Kommentare wie _verlängert um 3 Jahre_ enthalten, ist es nicht möglich, sie über die Bedingung _<2021_ zu filtern oder eine Zeitspanne von Jahren wie _2013-2020_ anzugeben. Aus diesem Grund wird eine Liste der zu bearbeitenden Werte angelegt.

Bei der zukünftigen Erstellung von Übersichten müssen die in der Liste hinterlegten Werte entsprechend angepasst werden. Die Liste wird mit der Bezeichnung _y_ für _Years_ versehen.

In [8]:
# Auflistung der relevanten Jahreswerte aus der Spalte A.-frist. Bennennung der Liste als y (=Years) 
y=[2020,2019,2018,2017,2016,2015,2014,2013,2012,2011,2010,2009]

In [9]:
# Anzeige aller Datensätze des Dataframes fbu (=Findbuch unedited) deren Wert in der Spalte A.frist einem Wert aus der Liste y (=Years) entspricht. Dieser Schritt kann entfallen.
fbu[fbu['A.-frist'].isin(y)]

Unnamed: 0,Zugangsnr.,Provenienz,Datum,Ansprechpartner,Stück,Aktenzeichen,Aktentitel,Enthält,Darin,Laufzeit Beginn,Laufzeit Ende,A.-frist,Archivwürdig?,Reihe,Regal,Seite Papierfindbuch,Kassations-vermerk,Datum Kassation,Ausleihe
272,84360,FSD Büro Köln,30.07.2001,,15,,,,,,,2020,,11,3,83,,NaT,
273,84361,FSD Büro Köln,30.07.2001,,15,,,,,,,2020,,11,3,83,,NaT,
274,84362,FSD Büro Köln,30.07.2001,,15,,,,,,,2020,,11,3,83,,NaT,
275,84363,FSD Büro Köln,30.07.2001,,15,,,,,,,2020,,11,3,83,,NaT,
276,84364,FSD Büro Köln,30.07.2001,,15,,,,,,,2020,,11,3,83,,NaT,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
10017,109214,MSOE Leitung,24.04.2014,Dagmar Heinelt\n(4603),74,31,SOG/DW Medientagung Bonn 22./23. November 2010...,,,2010,2010,2020,/,28,6,,,NaT,
10019,109216,MSOE Leitung,24.04.2014,Dagmar Heinelt\n(4603),74,33,"Südost-Europa Gesellschaft: Allgemein, Veranst...",,,2005,2010,2018,/,28,6,,,NaT,
10048,109245,MSOE Leitung,24.04.2014,Dagmar Heinelt\n(4603),74,62,Distribution: Evaluation - Präsentation der Ev...,"Interne Evaluationsberichte, Feinjustierung, S...",,2009,2010,2020,HA?,28,5,,,NaT,
10053,109250,MSOE Leitung,24.04.2014,Dagmar Heinelt\n(4603),74,67,"Verica Spasovska: Allgemein, Reiseabrechnung D2",,,2000,2007,2017,/,32,5,,,NaT,


In [10]:
# Defintion der unbearbeiteten Akten mit abgelaufener Aufbewahrungsfrist als fbe (=Findbuch (to) edit/(zu) bearbeiten)
fbe = fbu[fbu['A.-frist'].isin(y)]

## Defintion der externen Übersicht

In [11]:
# Anzeige aller Spaltentitel (=columns) von fbe (=Findbuch edit) zur besseren Orientierung
fbe.columns

Index(['Zugangsnr.', 'Provenienz', 'Datum', 'Ansprechpartner', 'Stück',
       'Aktenzeichen', 'Aktentitel', 'Enthält', 'Darin', 'Laufzeit Beginn',
       'Laufzeit Ende', 'A.-frist', 'Archivwürdig?', 'Reihe', 'Regal',
       'Seite Papierfindbuch', 'Kassations-vermerk', 'Datum Kassation',
       'Ausleihe'],
      dtype='object')

Die Spalten und Titel der Dataframes _fb_, _fbu_ und _fbe_ sind identisch. Sie werden an dieser Stelle lediglich ausgegeben, um das Scrollen am Bildschirm zu umgehen. Da an den Spaltentiteln keine Änderungen vorgenommen werden, kann der Schritt in Zukunft entfallen.

Die angezeigten Spaltentitel werden auf __Relevanz der Spaltenwerte__ für die abgebenenden Stellen geprüft. Als relevant eingestuft werden _Zugangsnr_, _Provenienz_, _Datum_, _Aktenzeichen_, _Aktentitel_, _Laufzeit Beginn_, _Laufzeit Ende_ sowie _A.-frist_.

Nicht von Belang sind die Spalten _Ansprechpartner_ (Name und Telefonnummer der Person, welche die Abgabe der Akten ursprünglich veranlasst hat), _Stück_ (die Menge der Akten, welche im Rahmen einer Abgabe an das ZAM übergeben wurden), _Enthält_- und _Darin_-Vermerke (archivinterne Notizen und Ergänzungen der Titel), _Archivwürdig?_ (Einschätzung im Rahmen der ersten Bewertung), _Reihe_ und _Regal_ (Standort im Magazin), _Seite Papierfindbuch_ (Verweis auf das physische Eingangsbuch), _Kassationsvermerk_, _Datum Kassation_ und _Ausleihe_ (ebenfalls archivinterne, den Workflow betreffende Spalten).

Die relevanten Spalten werden darüberhinaus in eine __sinnvolle Abfolge__ gebracht. Die Benennung der Übersicht als _ext_ (=externe Übersicht) verweist auf deren externe Zielgruppe: die zuständigen Stellen.

In [12]:
# Defintion ext (=externe Übersicht) mit den Spalten Provenienz, Zugangsnr., Datum, Aktenzeichen, Aktentitel, Laufzeit Beginn, Laufzeit Ende, A.-frist aus dem Dataframe fbe (=Findbuch edit)
ext = fbe[["Provenienz", "Zugangsnr.", "Datum", "Aktenzeichen", "Aktentitel", "Laufzeit Beginn", "Laufzeit Ende", "A.-frist"]]

In [13]:
# Anzeige ext (=externe Übersicht) zur Kontrolle. Dieser Schritt kann entfallen.
ext

Unnamed: 0,Provenienz,Zugangsnr.,Datum,Aktenzeichen,Aktentitel,Laufzeit Beginn,Laufzeit Ende,A.-frist
272,FSD Büro Köln,84360,30.07.2001,,,,,2020
273,FSD Büro Köln,84361,30.07.2001,,,,,2020
274,FSD Büro Köln,84362,30.07.2001,,,,,2020
275,FSD Büro Köln,84363,30.07.2001,,,,,2020
276,FSD Büro Köln,84364,30.07.2001,,,,,2020
...,...,...,...,...,...,...,...,...
10017,MSOE Leitung,109214,24.04.2014,31,SOG/DW Medientagung Bonn 22./23. November 2010...,2010,2010,2020
10019,MSOE Leitung,109216,24.04.2014,33,"Südost-Europa Gesellschaft: Allgemein, Veranst...",2005,2010,2018
10048,MSOE Leitung,109245,24.04.2014,62,Distribution: Evaluation - Präsentation der Ev...,2009,2010,2020
10053,MSOE Leitung,109250,24.04.2014,67,"Verica Spasovska: Allgemein, Reiseabrechnung D2",2000,2007,2017


## Defintion der internen Übersicht

Anschließend werden alle Spaltentitel auf **Relevanz der Spaltenwerte** für die Mitarbeitenden des ZAM geprüft. Als relevant eingestuft werden _Zugangsnr._, _Provenienz_, _Aktenzeichen_, _Aktentitel_, _Archivwürdig?_, _Reihe_ und _Regal_ sowie eine noch zu generierende **leere Spalte** für Notizen wie z.B. Vermerke über das Fehlen einer Akte.

Die relevanten Spalten werden in eine **sinnvolle Abfolge** gebracht. Da Mitarbeitende mit dieser Übersicht durch die fünf Magazinräume gehen, die Akten aus den Regalen heben und entsprechend ihrer Archviwürdigkeit weiterbearbeiten, liegt es nahe, die **Sortierung** nach dem Aktenstandort (_Reihe_ und _Regal_) statt nach organisatorischer Zugehörigkeit (_Provenienz_) oder Reihenfolge des Eingangs (_Zugangsnr._) vorzunehmen.

Die Benennung der Übersicht als _int_ (=interne Übersicht) verweist auf deren interne Zielgruppe: die Mitarbeitenden des ZAM.

In [14]:
# Hinzufügen einer neuen Spalte als Platz für Notizen im Dataframe fbe (=Findbuch edit) mit dem Spaltentitel Notizen
fbe=fbe.assign(Notizen="")

In [15]:
# Defintion int (=interne Übersicht) mit den Spalten Reihe, Regal, Zugangsnr., Aktenzeichen, Aktentitel, Provenienz, Archivwürdigkeit?, Notizen aus dem Dataframe fbe (=Findbuch edit)
int = fbe[["Reihe", "Regal", "Zugangsnr.", "Aktenzeichen", "Aktentitel", "Provenienz", "Archivwürdig?", "Notizen"]]

In [16]:
# Anzeige int (=interne Übersicht) zur Kontrolle. Dieser Schritt kann entfallen.
int

Unnamed: 0,Reihe,Regal,Zugangsnr.,Aktenzeichen,Aktentitel,Provenienz,Archivwürdig?,Notizen
272,11,3,84360,,,FSD Büro Köln,,
273,11,3,84361,,,FSD Büro Köln,,
274,11,3,84362,,,FSD Büro Köln,,
275,11,3,84363,,,FSD Büro Köln,,
276,11,3,84364,,,FSD Büro Köln,,
...,...,...,...,...,...,...,...,...
10017,28,6,109214,31,SOG/DW Medientagung Bonn 22./23. November 2010...,MSOE Leitung,/,
10019,28,6,109216,33,"Südost-Europa Gesellschaft: Allgemein, Veranst...",MSOE Leitung,/,
10048,28,5,109245,62,Distribution: Evaluation - Präsentation der Ev...,MSOE Leitung,HA?,
10053,32,5,109250,67,"Verica Spasovska: Allgemein, Reiseabrechnung D2",MSOE Leitung,/,


## Erstellung von Beispielübersichten im Excel-Format

### Indonesian Service

In [17]:
# Druck aller Werte der Spalte Provenienz des Dataframes fbe (=Findbuch edit) ohne Dopplungen und alphabetisch sortiert
# An dieser Stelle ist es sinnvoll, fbe zu nutzen, weil andere Dataframes Provenienzen enthalten können, die aktuell nicht zur Bearbeitung anstehen und daher die Ergebnismenge unnötig erhöhen
print(sorted(fbe['Provenienz'].unique()))

['ABD', 'Afghanische Redaktion', 'Afrika Französisch', 'Afrika Leitung', 'Afrika NMO Sekretariat', 'Afrika NO Portugiesisch', 'Afrika Nahost', 'Afrika Sekretariat', 'Akademie', 'Albanisch Leitung', 'Asien China', 'Asien Leitung', 'Auslandsmarketing', 'Auslandspromotion', 'Besucherservice', 'CRR Hintergrund Dtl.', 'Chefredaktion', 'Chefredaktion Fremdsprachen', 'Chefredaktion Hörfunk', 'Chefredaktion LBE', 'China Redaktion', 'Chinesische Red.', 'Chinesischen Redaktion', 'DP Charles/Hörerpost', 'DP Kultur', 'DP Kultur Musik', 'DP Kultur Musik TS', 'DP Leitung', 'DP Politik', 'DP Sport', 'DRM Direktion', 'DW Akademie', 'DW-WORLD.DE', 'Deutsches Programm Leitung', 'Distribution Europa', 'FSD Büro Köln', 'GPR', 'Gebäudeverwaltung', 'Geräteausgabe', 'Gesamtpersonalrat', 'Gleichstellungsbeauftragte', 'HA Afrika NMO', 'HA Asien', 'HA Kommunikation', 'Hintergrund Deutschland', 'IT', 'IT Organisation', 'IT Systemplanung', 'IT-Systemplanung', 'Indonesische Red.', 'Inernationale Angelegeneiten', '

Dem Zuständigkeitsbereich des _Indonesian Service_ werden aus dem Datenbestand Datensätze mit der Provenienz _Indonesische Red._ zugeordnet. Da die Buchstabenfolge _Ind_ in keiner andere Provenienz vorkommt, erfolgt die Filterung über ***Ind***. Die Übersichten in den erstellten Excel-Dateien beinhalten alle Akten aus dem Zuständigkeitsbereich des _Indonesian Service_ deren Aufbewahrungsfrist abgelaufen ist und die bisher noch nicht bearbeitet wurden.

In [18]:
# ext (=externe Übersicht) mit Filter nach Provenienz enthält die Zeichenfolge Ind wird als Excel-Datei mit Dateinamen 2021_Indonesian_Service_ext.xls ausgegeben
ext[ext["Provenienz"].str.contains("Ind")].to_excel("2021_Indonesian_Service_ext.xls")

In [19]:
# int (=interne Übersicht) mit Filter nach Provenienz enthält die Zeichenfolge Ind wird als Excel-Datei mit Dateinamen 2021_Indonesian_Service_int.xls ausgegeben
int[int["Provenienz"].str.contains("Ind")].to_excel("2021_Indonesian_Service_int.xls")

### DW Akademie

In [20]:
# Druck aller Werte der Spalte Provenienz des Dataframes fbe (=Findbuch edit) ohne Dopplungen und alphabetisch sortiert
# An dieser Stelle ist es sinnvoll, fbe zu nutzen, weil die anderen Dataframes Provenienzen enthalten können, die aktuell nicht zur Bearbeitung anstehen und daher die Ergebnismenge unnötig erhöhen
print(sorted(fbe['Provenienz'].unique()))

['ABD', 'Afghanische Redaktion', 'Afrika Französisch', 'Afrika Leitung', 'Afrika NMO Sekretariat', 'Afrika NO Portugiesisch', 'Afrika Nahost', 'Afrika Sekretariat', 'Akademie', 'Albanisch Leitung', 'Asien China', 'Asien Leitung', 'Auslandsmarketing', 'Auslandspromotion', 'Besucherservice', 'CRR Hintergrund Dtl.', 'Chefredaktion', 'Chefredaktion Fremdsprachen', 'Chefredaktion Hörfunk', 'Chefredaktion LBE', 'China Redaktion', 'Chinesische Red.', 'Chinesischen Redaktion', 'DP Charles/Hörerpost', 'DP Kultur', 'DP Kultur Musik', 'DP Kultur Musik TS', 'DP Leitung', 'DP Politik', 'DP Sport', 'DRM Direktion', 'DW Akademie', 'DW-WORLD.DE', 'Deutsches Programm Leitung', 'Distribution Europa', 'FSD Büro Köln', 'GPR', 'Gebäudeverwaltung', 'Geräteausgabe', 'Gesamtpersonalrat', 'Gleichstellungsbeauftragte', 'HA Afrika NMO', 'HA Asien', 'HA Kommunikation', 'Hintergrund Deutschland', 'IT', 'IT Organisation', 'IT Systemplanung', 'IT-Systemplanung', 'Indonesische Red.', 'Inernationale Angelegeneiten', '

Dem Zuständigkeitsbereich der _DW Akademie_ werden aus dem Datenbestand Datensätze mit der Provenienz _Akademie_ und _DW Akademie_ zugeordnet. Auch hier reicht die Suche nach wenigen Buchstaben aus, um alle relevanten Datensätze zu erhalten. Die Filterung erfolgt daher über ***Ak***. Die Übersichten in den erstellten Excel-Dateien beinhalten alle Akten aus dem Zuständigkeitsbereich der _DW Akademie_ deren Aufbewahrungsfrist abgelaufen ist und die bisher noch nicht bearbeitet wurden.

In [21]:
# ext (=externe Übersicht) mit Filter nach Provenienz enthält die Zeichenfolge Ak wird als Excel-Datei mit Dateinamen 2021_DW_Akademie_ext.xls ausgegeben
ext[ext["Provenienz"].str.contains("Ak")].to_excel("2021_DW_Akademie_ext.xls")

In [22]:
# int (=interne Übersicht) mit Filter nach Provenienz enthält die Zeichenfolge Ak wird als Excel-Datei mit Dateinamen 2021_DW_Akademie_int.xls ausgegeben
int[int["Provenienz"].str.contains("Ind")].to_excel("2021_DW_Akademie_int.xls")

### Editorial Lead, Information and News

In [23]:
# Druck aller Werte der Spalte Provenienz des Dataframes fbe (=Findbuch edit) ohne Dopplungen und alphabetisch sortiert
# An dieser Stelle ist es sinnvoll, fbe zu nutzen, weil die anderen Dataframes Provenienzen enthalten können, die aktuell nicht zur Bearbeitung anstehen und daher die Ergebnismenge unnötig erhöhen
print(sorted(fbe['Provenienz'].unique()))

['ABD', 'Afghanische Redaktion', 'Afrika Französisch', 'Afrika Leitung', 'Afrika NMO Sekretariat', 'Afrika NO Portugiesisch', 'Afrika Nahost', 'Afrika Sekretariat', 'Akademie', 'Albanisch Leitung', 'Asien China', 'Asien Leitung', 'Auslandsmarketing', 'Auslandspromotion', 'Besucherservice', 'CRR Hintergrund Dtl.', 'Chefredaktion', 'Chefredaktion Fremdsprachen', 'Chefredaktion Hörfunk', 'Chefredaktion LBE', 'China Redaktion', 'Chinesische Red.', 'Chinesischen Redaktion', 'DP Charles/Hörerpost', 'DP Kultur', 'DP Kultur Musik', 'DP Kultur Musik TS', 'DP Leitung', 'DP Politik', 'DP Sport', 'DRM Direktion', 'DW Akademie', 'DW-WORLD.DE', 'Deutsches Programm Leitung', 'Distribution Europa', 'FSD Büro Köln', 'GPR', 'Gebäudeverwaltung', 'Geräteausgabe', 'Gesamtpersonalrat', 'Gleichstellungsbeauftragte', 'HA Afrika NMO', 'HA Asien', 'HA Kommunikation', 'Hintergrund Deutschland', 'IT', 'IT Organisation', 'IT Systemplanung', 'IT-Systemplanung', 'Indonesische Red.', 'Inernationale Angelegeneiten', '

Dem Zuständigkeitsbereich von _Editorial Lead, Information and News_, d.h. der Chefredaktion werden aus dem Datenbestand Datensätze mit der Provenienz _Chefredaktion_ aber auch Akten der früheren Abteilungen _Chefredaktion Fremdsprachen_, _Chefredaktion Hörfunk_ und _Chefredaktion LBE_ zugeordnet. Die Datensätze können gebündelt mit der Zeichenfolge ***Chef*** gesucht werden. 

_Editorial Lead, Information and News_ zugeordnet werden außerdem sämtliche Akten mit Provenienz _CRR Hintergrund Dtl._ und _Hintergrund Deutschland_ sowie die Akten des ehemaligen Deutschen Programms _DP Charles/Hörerpost_, _DP Kultur_, _DP Kultur Musik_, _DP Kultur Musik TS_, _DP Leitung_, _DP Politik_, _DP Sport_ und _Deutsches Programm Leitung_. Die Datensätze können mit ***Hinter***, ***DP*** bzw. ***Deutsches*** gesucht werden.

In den Zuständigkeitsbereich von _Editorial Lead, Information and News_ zählen weiter die Akten, die der _Zentralen Programm Redaktion_ zugeordnet werden können. Hierzu zählen _MMDR Zentrale Aufgaben_, _ZPR_, _ZPR Planung_, _ZPR Zentrale Aufgaben_, _Zentrale Aufgaben_ sowie _Zentralredaktion_. Um den Zentraleinkauf auszuschließen wird an dieser Stelle nach ***ZPR***, ***Zentralr*** sowie ***Aufgaben*** gesucht.

Auch die früheren Abteilungen _DW_WORLD.DE_, _MMDR Planung_ und _PPP_ können _Editorial Lead, Information and News_ zugerechnet werden. Sie werden über ***MMDR P***, ***PPP*** und ***DW-W*** gesucht, um Provenienzen wie _Pojekte Planung_ oder _MMDR Afrika_ auszuschließen.

Dei Filterung nach dem Vorkommen eines von mehreren möglichen Zeichenfolgen wird mittels ***|*** umgesetzt. Die Übersichten in den erstellten Excel-Dateien beinhalten alle Akten aus dem Zuständigkeitsbereich von _Editorial Lead, Information and News_ deren Aufbewahrungsfrist abgelaufen ist und die bisher noch nicht bearbeitet wurden.

In [24]:
# ext (=externe Übersicht) mit Filter nach o.g. Provenienz wird als Excel-Datei mit Dateinamen 2021_Editorial_Lead_Information_and_News_ext.xls ausgegeben
ext[ext["Provenienz"].str.contains('Chef|Hinter|DP|Deutsches|ZPR|Zentralr|Aufgaben|MMDR P|PPP|DW-W')].to_excel("2021_Editorial_Lead_Information_and_News_ext.xls")

In [25]:
# int (=interne Übersicht) mit Filter nach o.g. Provenienz wird als Excel-Datei mit Dateinamen 2021_Editorial_Lead_Information_and_News_int.xls ausgegeben
int[int["Provenienz"].str.contains('Chef|Hinter|DP|Deutsches|ZPR|Zentralr|Aufgaben|MMDR P|PPP|DW-W')].to_excel("2021_Editorial_Lead_Information_and_News_int.xls")

## Zusammenfassung

Neben der originären Datei _Findbuch.xlsx_ liegen nun sechs weitere Excel-Dateien vor. Ihre Dateinamen verweisen auf das Bearbeitungsjahr (und somit die inbegriffenen Datensätze <2021), die zuständige Stelle (welche aufgrund von Umbenennungen und Umstrukturierungsmaßnahmen oftmals nicht identisch mit der Aktenprovenienz ist) sowie die Zielgruppe für diese Übersichten (intern bzw. extern). Sind die Daten vollständig um eine Entscheidung über die Aufbewahrungsfrist zu treffen, können sie mit einem Begleitschreiben an die zuständigen Stellen versandt werden. Enthalten die Übersichten Akten aus der Zeit, in der diese nur auf Abgabenebene im Eingangsbuch verzeichnet wurden, müssen Mitarbeitende des ZAM die zugehörigen Abgabelisten heraussuchen. Statt die Daten händisch zu ergänzen bietet sich das Scannen oder Abfotografieren der Abgabelisten an. Diese können als PDFs dem Anschreiben und der Übersicht beigelegt werden. Aus der Exceltabelle kann außerdem an entsprechender Stelle ein Link auf die jeweilige PDF-Datei erstellt werden.

Nach Eingang der Rückmeldungen aus den Fachabteilungen findet die physische Umsetzung der Aussonderung in den Magazinräumen statt. Mittels der internen Übersicht sortiert nach dem physischen Standort der Akten (_Reihe_ und _Regal_) werden dabei unnötige Gehwege eingespart. Anhand von _Aktenzeichen_ und _Aktentitel_ kann ergänzend zu _Zugangsnr._ sichergestellt werden, dass die richtigen Akten kassiert werden. Vermerke auf fehlende Akten oder die Einschätzung zur Archviwürdigkeit während der zweiten Bewertung im Magazin können in der leeren Spalte _Notizen_ festgehalten werden. Dadurch können diese Informationen direkt den Akten zugeordnet werden, statt wie bisher auf diversen Notizzetteln oder Listenrückseiten unsystematisch notiert zu werden. Diese Vermerke werden neben _Datum Kassation_ und _Kassationsvermerk_ in der Datei _Findbuch.xlsx_ eingepflegt. Wodurch gewährleistet wird, dass bei der Erstellung neuer Übersichten bereits bearbeitete Akten nicht mehr berücksichtigt werden.

Es ist zwingend erforderlich, dass an der Datei _Findbuch.xlsx_ bei der Übersichtserstellung __keine Änderungen__ vorgenommen werden und die Reduzierung der Spalten wie die Filterung der Datensätze nur in der temporären Ausgabe oder einer neuen Excel-Datei umgesetzt wird. Ebenso ist es nicht sinnvoll unterschiedliche Provenienzen in einer Schreibweise zusammenzufassen, da diese z.T. die Historie dieser widergeben. Zusätze wie _MMDR_ verweisen beispielsweise darauf, dass diese Akten nach Abschaffung der medialen Trennung (_TV_, _Hörfunk_, _Online_) entstanden sind, als es eine _Multimediadirektion Global_ und eine _Multimediaredaktion Regional_ gab. Für die Zuordnung der aktuell zuständigen Stelle können diese Zusätze wichtig sein.

Eine komplette Automatisierung des Verfahrens durch feste vordefinierte Listen, in denen alle im Dataframe _fb_ (=Findbuch) enthaltenen Provenienzen einer aktuell zuständigen Stelle zugeordnet werden ist nicht sinnvoll. Durch nahezu permanent stattfindene Umstrukturierungen, Umbenennungen und Aufgabenverschiebungen kann keine Zuordnung für einen längeren Zeitraum gewährleistet werden. Das Python Skript kann den Aussonderungsprozess im Alltag um zahlreiche _Copy & Paste_ Schritte erleichtern, die benötigte Zeit der Vorarbeiten um ein Vielfaches reduzieren sowie die Umstellung auf ein digitales Verfahren unterstützen. Es kann aber nicht die benötigte intellektuelle Analyse der registraturbildenden Stellen hin zu ihren Funktionsnachfolgern und somit den aktuellen Zuständigkeiten klären.