# 5. Arbeiten mit Dateien

Mit Python konnen wir auch auf externe Dateien zugreifen bzw. Text/Werte/Daten in externe Dateien schreiben (damit wir diese dann mit anderen Programmen weiterverarbeiten können).

## Achtung: Dieses Notebook funktioniert nur mit einer lokalen Installation von winPython. Über den online-Dienst mybinder.org ist es leider nicht möglich, Dateien ein oder auszulesen !!!

## 5.1 Aufbau einer Datei und Speicherpfad

Dateien sind folgendermaßen aufgebaut: 

Dateikopf (Header) - Daten - Dateiende (EOF)

Im Header sind Metadaten gespeichert (Dateiname, Größe, Typ,...), im Datenabschnitt ist dann der eigentliche Dateiinhalt enthalten und das Dateiende besteht aus einem speziellen Zeichen, das das Ende der Datei signalisiert.    

Der Speicherort einer Datei wird über den Dateipfad beschrieben. In diesem Dateipfad ist die Festplatte und die Ordner/Unterordner, in denen die Datei sich befindet, in ihrer Reihenfolge aufgelistet:

Ein Dateipfad kann z.B. unter Windows folgendermaßen aussehen:

D:\Python\Spyder_Programme\test.py

Die Datei test.py befindet sich auf Festplatte (oder Partition) D:, im Ordner "Python" und Unterordner "Spyder_Programme".

Unter Linux werden die Order nicht mit einem "\" sondern mit einem "/" voneinander abgegrenzt.

Da "\" in Python ein Sonderzeichen mit einer bestimmten Bedeutung ist, sollten wir alle Dateipfade (auch unter Windows) immer mit einem "/" angeben.

## 5.2 Dateien einlesen

In einem ersten Schritt wollen wir Dateien einlesen. Wir werden uns in diesem Kurs nur mit ASCII-Dateien beschäftigen (direkt lesbaren Dateien). Für binäre Dateien sei auf entsprechende Literatur/Tutorials verwiesen.

Zum Einlesen einer Datei müssen wir diese zuerst öffnen. Dies geschieht mit der built-in Funktion open().
Der Funktion open müssen wir auf jeden Fall den den Dateipfad mitteilen. Außerdem sollten wir uns schon beim Öffnen der Datei Gedanken machen, dass wir die Datei am Programmende auf jeden Fall wieder schließen, da sonst andere Programme evtl. nicht mehr darauf zugreifen können. Die Anweisugen dazu lauten:

\# normales Öffnen einer Datei:

datei = open(dateipfad, modus)

\# normales Schließen

datei.close()


Ein Problem haben wir dann, wenn unser Programm zwischendurch bei der Ausführung mit einer Fehlermeldung abbricht. Um sicherzustellen, dass eine Datei wirklich geschlossen wird (auch bei auftretenden Fehlern), können wir die with-Anweisung nutzen:

with open(dateipfad, Modus) as datei:

Die with-Anweisung kümmert sich damm immer automatisch auch um das Schließen.

In der Funktione open() solten wir noch den Modus angeben, wie wir die Datei öffnen wollen. Normalerweise wollen wir entweder eine Datei einlesen oder eine Datei schreiben. Dazu gibt es folgende Modi (Auswahl):

    "r" : read-only - nur Lesen
    "w" : write - Datei schreiben
    "a" : append - Datei schreiben aber am Ende der Datei anfügen
    
In diesem Kapitel werden wir nur mit dem Modus "r" arbeiten

Bevor wir uns ein Beispiel ansehen, müssen wir eine Datei unserem Jupyter-System bereitstellen (Sie alle haben ja andere Dateiordner und -pfade, weshalb keine allgmeingültigen Angaben zum Dateiort hier angegeben werden können). 

Als erstes wollen wir mit einer Datei des Deutschen Wetterdienstes arbeiten. Die Datei finden Sie auf Ilias im Ordern "Daten" und heißt: DWD_Jahresniederschlag_Kiebingen.txt

Laden Sie sich diese Datei herunter und Kopieren Sie sie in den selben Ordner in Ihrem winPython-Verzeichnis, in dem Sie auch Ihre Jupyter-Notebooks gespeichert haben.

Die Datei sollte dann über Ihren Jupyter-Filebrowser sichtbar sein. 

![grafik.png](attachment:82e2d010-22ee-4bfe-a765-b32121bf965b.png)

Falls die Datei hier sichtbar ist, können wir sie nun öffnen:

In [93]:
with open("DWD_Jahresniederschlag_Kiebingen.txt", "r") as datei:
    print("bisher haben wir die Datei nur geöffnet aber noch nicht gelesen")
    

bisher haben wir die Datei nur geöffnet aber noch nicht gelesen


Nun ist die Datei also geöffnet und wir haben uns durch die with-Anweisung auch um das Schließen gekümmert. Nun können wir die Daten einlesen. Dazu gibt es drei Möglichkeiten (auch hier arbeiten wir nur mit einfachen Möglichkeiten):

    datei.read()     :Datei komplett einlesen und in einem String ausgeben
    datei.readln()   :Nur eine Zeile der Datei einlesen und in einem String ausgeben
    datei.readlines():alle Zeilen der Datei einlesen und in einer String-Liste ausgeben
Probieren wir die einzelnen Methoden aus:

In [94]:
with open("DWD_Jahresniederschlag_Kiebingen.txt", "r") as datei:
    inhalt=datei.read() #ganze Datei einlesen
print(inhalt)

STATIONS_ID;MESS_DATUM_BEGINN;MESS_DATUM_ENDE;QN_6;JA_NSH;JA_RR;JA_SH_S;JA_MX_RS;eor
       4294;19800101;19801231;    5;     38;   588.8;    147;   23.7;eor
       4294;19810101;19811231;   10;     83;   668.0;    433;   36.0;eor
       4294;19820101;19821231;   10;     44;   887.7;    399;   66.6;eor
       4294;19830101;19831231;   10;     30;   576.8;     92;   31.1;eor
       4294;19840101;19841231;   10;     42;   684.4;    163;   31.7;eor
       4294;19850101;19851231;   10;     59;   612.8;    532;   44.6;eor
       4294;19860101;19861231;   10;     84;   807.0;    520;   40.2;eor
       4294;19870101;19871231;   10;     47;   747.7;    285;   59.8;eor
       4294;19880101;19881231;   10;     67;   897.3;    158;   41.0;eor
       4294;19890101;19891231;   10;      0;   652.0;      0;   82.0;eor
       4294;19900101;19901231;   10;     26;   668.8;     79;   27.8;eor
       4294;19910101;19911231;    9;     13;   471.3;     60;   23.5;eor
       4294;19920101;19921231;    9;   

In [95]:
with open("DWD_Jahresniederschlag_Kiebingen.txt", "r") as datei:
    inhalt=datei.readline()  # Eine Zeile einlesen
    print(inhalt)
    inhalt=datei.readline()  # die nächste Zeile einladen
    print(inhalt)

STATIONS_ID;MESS_DATUM_BEGINN;MESS_DATUM_ENDE;QN_6;JA_NSH;JA_RR;JA_SH_S;JA_MX_RS;eor

       4294;19800101;19801231;    5;     38;   588.8;    147;   23.7;eor



In [96]:
with open("DWD_Jahresniederschlag_Kiebingen.txt", "r") as datei:
    inhalt=datei.readlines()  # ganze datei zeilenweise einlesen und in einer Liste ausgeben
print(inhalt)

['STATIONS_ID;MESS_DATUM_BEGINN;MESS_DATUM_ENDE;QN_6;JA_NSH;JA_RR;JA_SH_S;JA_MX_RS;eor\n', '       4294;19800101;19801231;    5;     38;   588.8;    147;   23.7;eor\n', '       4294;19810101;19811231;   10;     83;   668.0;    433;   36.0;eor\n', '       4294;19820101;19821231;   10;     44;   887.7;    399;   66.6;eor\n', '       4294;19830101;19831231;   10;     30;   576.8;     92;   31.1;eor\n', '       4294;19840101;19841231;   10;     42;   684.4;    163;   31.7;eor\n', '       4294;19850101;19851231;   10;     59;   612.8;    532;   44.6;eor\n', '       4294;19860101;19861231;   10;     84;   807.0;    520;   40.2;eor\n', '       4294;19870101;19871231;   10;     47;   747.7;    285;   59.8;eor\n', '       4294;19880101;19881231;   10;     67;   897.3;    158;   41.0;eor\n', '       4294;19890101;19891231;   10;      0;   652.0;      0;   82.0;eor\n', '       4294;19900101;19901231;   10;     26;   668.8;     79;   27.8;eor\n', '       4294;19910101;19911231;    9;     13;   471

Bevor wir jetzt mit den Daten arbeiten, müssen wir uns ersteinmal mit dem DWD-Datenformat beschäftigen. Schauen wir uns deshalb nochmals die Datei komplett an:

In [97]:
with open("DWD_Jahresniederschlag_Kiebingen.txt", "r") as datei:
    inhalt=datei.read() #ganze Datei einlesen
print(inhalt)

STATIONS_ID;MESS_DATUM_BEGINN;MESS_DATUM_ENDE;QN_6;JA_NSH;JA_RR;JA_SH_S;JA_MX_RS;eor
       4294;19800101;19801231;    5;     38;   588.8;    147;   23.7;eor
       4294;19810101;19811231;   10;     83;   668.0;    433;   36.0;eor
       4294;19820101;19821231;   10;     44;   887.7;    399;   66.6;eor
       4294;19830101;19831231;   10;     30;   576.8;     92;   31.1;eor
       4294;19840101;19841231;   10;     42;   684.4;    163;   31.7;eor
       4294;19850101;19851231;   10;     59;   612.8;    532;   44.6;eor
       4294;19860101;19861231;   10;     84;   807.0;    520;   40.2;eor
       4294;19870101;19871231;   10;     47;   747.7;    285;   59.8;eor
       4294;19880101;19881231;   10;     67;   897.3;    158;   41.0;eor
       4294;19890101;19891231;   10;      0;   652.0;      0;   82.0;eor
       4294;19900101;19901231;   10;     26;   668.8;     79;   27.8;eor
       4294;19910101;19911231;    9;     13;   471.3;     60;   23.5;eor
       4294;19920101;19921231;    9;   

Die Datei beinhaltet u.a. die Jahresniederschläge für die Station Rottenburg-Kiebingen von 1980-2019.
Dabei sind die Daten in Spalten (durch ";" getrennt) und Zeilen strukturiert. In der ersten Zeile sind die Überschriften der Messungen zu finden in den weiteren Zeilen finden Sie die eigentlichen Messdaten.
Schauen wir uns die Spalten an: 

    Spalte 1: Stationsnummer für Kiebingen (immer 4294)
    Spalte 2: Datum Messbeginn
    Spalte 3: Datum Messende
    Spalte 4: Qualität der Messung (schauen wir uns hier nicht weiter an)
    Spalte 5: Jahresneuschneehöhe [cm]
    Spalte 6: Jahresniederschlag [mm]
    Spalte 7: Jahresschneehöhe [cm]
    Spalte 8: Maximaler Tagesniederschlag [mm]


### Aufgabe 5.1

Schreiben Sie ein Programm, das die ganze Datei zeilenweise einliest (readlines). Versuchen Sie die aus diesen Daten die Jahresniederschläge zu extrahieren und berechnen Sie den mittleren Jährlichen Niederschlag.

Einige Hinweise und Tipps, da diese Aufgabe wirklich schwer ist:

- Lesen Sie mit readlines alle Zeilen der Datei in eine Liste ein: inhalt=datei.readlines()
- Erzeugen Sie eine neue, leere Liste für die Niederschläge: niederschlaege=[]
- Wir wollen durch alle Zeilen der Datei durchgehen, wobei wir die erste Zeile (Überschriften) überspringen müssen. Dazu erzeugen wir uns mit range() eine numerische Liste mit allen Zeilennummern die wir berücksichtigen wollen (Zeile 2 bis Anzahle_zeilen): zeilennummern = range (1,len(inhalt)) 
- mit einer for-Schleife können Sie nun durch jedes Element der range-Liste durchgehen: for z in zeilennummern: 
- Somit können wir in jedem Umlauf die z-te Zeilen aus der inhalt-Liste abgreifen: zeilen_text=inhalt[z]
- diesen Zeilentext müssen wir jetzt mit der Methode split in Einzelteile zerlegen: teile = zeilen_text.split(";")
- das 6. Element (Index 5 !!!) dieser Teile ist unser Niederschlag als Text, den wir mit float() gleich noch in eine Dezimalzahl umwandeln: n=float(teile[5]
- diesen Niederschlag n fügen wir nun über die Methode append an unsere leere Liste niederschlaege an: niederschlaege.append(n)
- nach Ende der Schleife können Sie mit der Liste den Mittelwert berechnen (Funktionen sum() und len())

In [98]:
# Ihr Programm

### Lösung Aufgabe 5.1

Bitte ggf. auf ... klicken !!!

In [99]:
with open("DWD_Jahresniederschlag_Kiebingen.txt", "r") as datei:
    inhalt=datei.readlines()  # ganze datei zeilenweise einlesen und in einer Liste ausgeben
niederschlaege=[] # Leere Liste für Niederschläge erzeugen
zeilennummern=range(1,len(inhalt))

for z in zeilennummern:
    zeilen_text=inhalt[z]
    teile=zeilen_text.split(";")
    n=float(teile[5])
    niederschlaege.append(n)
mittel=sum(niederschlaege)/len(niederschlaege)
print(mittel)

695.1527777777778


In [100]:
# weitere Lösunsvorschlag    
with open("DWD_Jahresniederschlag_Kiebingen.txt", "r") as datei:
    inhalt=datei.readlines()  # ganze datei zeilenweise einlesen und in einer Liste ausgeben
niederschlaege=[] # Leere Liste für Niederschläge erzeugen
for index,zeile in enumerate(inhalt): # zeile und zeilennummer(index) gleichzeitig ausgeben
    if index>0:  #wenn index >0 (ab Zeile 2:)
        niederschlaege.append(float(zeile.split(";")[5])) #split,float und append in einer Anweisung
mittel=sum(niederschlaege)/len(niederschlaege)
print(mittel)   

# weitere Möglichkeiten sind ntürlich auch denkbar


695.1527777777778


Sie sehen, mit wenigen Zeilen in Python können wir uns viel Arbeit bei der Auswertung sparen und es gibt immer mehrere Möglichkeiten, Probleme zu lösen. Wir werden in Kapitel 7 noch schnellere Möglichkeiten zum einlesen der Daten kennenlernen.

### Exkurs: Datum- und Datum-Zeit-Typen

Nun lernen wir noch einen neuen Datentyp kennen, der sich speziell auf Datumsangaben bzw. Datums- und Zeitangaben bezieht. Oft kommt es vor, dass wir mit Datums-/Zeitangaben arbeiten müssen (z.B. wie viele Tage sind es vom 13.11.2020 bis zum 31.12.2020 ?). Dazu gibt es in Python spezielle Datentypen, die im Modul "datetime" zusammengefasst sind. In diesem Kurs schauen wir uns vor allem die Typen "date" und "datetime" an.

#### date und datetime

Um date zu initialisieren müssen wir uns zuerst das Module "datetime" bzw. "date" from "datetime" importieren. 

In [101]:
from datetime import date

Anschließend können wir uns ein neues Datums-Objekt erstellen (z.B. mit Datum 13.11.2020)

In [102]:
d = date(2020,11,13)
print(d)

2020-11-13


Wir müssen dem date-Objekt also drei Integerwerte (Jahr,Monat,Tag) angeben.

Analog dazu verhält es sich mit datetime (Beispiel: 13.11.2020 12:31 Uhr und 12 s):

In [103]:
from datetime import datetime
dt = datetime(2020,11,13,12,31,12)
print(dt)

2020-11-13 12:31:12


Beachten Sie bitte, dass normalerweise die lokale Zeitzone verwendet wird. Oftmals benötigen wir z.B. UTC-Zeit. Wenn wir eine datetime-Objekt in einer bestimmten Zeitzone erzeugen wollen, können wir wie folgt vorgehen:

In [104]:
from datetime import datetime
from datetime import timezone
dt = datetime(2020,11,13,12,31,12,tzinfo=timezone.utc )
print(dt)

2020-11-13 12:31:12+00:00


Wir können sowohl das aktuelle Datum als auch die aktuelle Uhrzeit (Ortszeit) ausgeben lassen :

In [105]:
print(date.today())
print(datetime.today())


2020-11-13
2020-11-13 12:51:18.610231


#### Achtung: Oftmals sind Zeitangaben von Messinstrumenten nur in Winterzeit oder in UTC. Dann müssen Sie dies über tzinfo berücksichtigen.

Wenn wir zwei date- oder datetime-Objekte haben, können wir damit auch "rechnen" (z.B. können wir die Differenz ausrechnen):

In [106]:
# Wann ist endlich Weihnachten

from datetime import date

d1=date.today()
d2=date(2020,12,24)  # Achtung richtiges Jahr eingeben

diff=d2-d1
print(diff)

dt1=datetime.today()
dt2=datetime(2020,12,24,18,0,0) # um 18:00 Uhr ist Bescherung
print(dt2-dt1)


41 days, 0:00:00
41 days, 5:08:41.376699


Wenn wir wissen wollen, welches Datum in 100 Tagen ist, müssen wir ein neues Objekt timedelta definieren.   

In [107]:
from datetime import date
from datetime import timedelta

d1=date.today()
t_delta =timedelta(days=100)
d2=d1+t_delta
print(d2)

2021-02-21


timedelta können wir nicht nur mit Tagen sondern auch mit  Sekunden (und Microsekunden) initialisieren (nicht jedoch mit Stunden und Minuten). Wenn wir zu einem datetime-Objekt z.B. 10 Tage, 6 Stunden und 35 Minuten hinzufügen wollen, müssen wir die Stunden und Minuten diese in Sekunden ausdrücken.

In [108]:
from datetime import datetime
from datetime import timedelta

dt1=datetime.today()
t_delta =timedelta(days=10,seconds=6*60*60+35*60)
dt2=dt1+t_delta
print(dt2)


2020-11-23 19:26:18.651342


#### Formatgebundene Ausgabe von date-/datetime-Objekten

Sie können ein date-/datetime-Objekt auch in einem eigenen Format ausgeben. Die geschieht mit der strftime()-Methode (string from time - Text aus Zeit)

In [109]:
from datetime import datetime
dt1=datetime.today()
ausgabe_text=dt1.strftime("%d.%m.%Y %H:%M und %S Sekunden")
print(ausgabe_text)

13.11.2020 12:51 und 18 Sekunden


Das %d bedeutet dabei z.B. den Tag mit voranstehender "0" also z.B. "04" oder auch "13". Eine genau Beschreibung der Formatangabe finden Sie unter https://docs.python.org/3/library/datetime.html#strftime-strptime-behavior

### Aufgabe 5.2

Wie lange haben Sie noch bis zur Abgabe Ihre Projektarbeit in unserem Kurs (Abgabetermin: 28.2.2021 23:59:59). Geben Sie das Abgabedatum ebenfalls noch mit einem geeigneten Format aus (das timedelta-Objekt kann man leider nicht so einfach formatgebunden ausgeben).

In [110]:
# Ihr Programm

### Lösung Aufgabe 5.2

Bitte ggf. auf ... klicken !!

In [111]:
from datetime import datetime

jetzt=datetime.today()
abgabe=datetime(2021,2,28,23,59,59)

zeitraum=abgabe-jetzt

abgabe_text=abgabe.strftime("%d.%m.%Y %H:%M und %S Sekunden")

print("Bis zum {0} sind es noch {1}".format(abgabe_text,zeitraum))

Bis zum 28.02.2021 23:59 und 59 Sekunden sind es noch 107 days, 11:08:40.309548


### Aufgabe 5.3

Ändern Sie Ihr Programm aus Aufgabe 5.1 so ab, dass Sie die Differenz von Messbeginn und Messend in jedem Jahr (Zeile) ausgeben. Diese Aufgabe können wir gerne auch zusammen machen.


1. Wir starten, indem wir unser Ergebnis aus Aufgabe 5.1 kopieren (ich nutze hier den 2. Lösungsvorschlag)

In [112]:
# weitere Lösunsvorschlag    
with open("DWD_Jahresniederschlag_Kiebingen.txt", "r") as datei:
    inhalt=datei.readlines()  # ganze datei zeilenweise einlesen und in einer Liste ausgeben
niederschlaege=[] # Leere Liste für Niederschläge erzeugen
for index,zeile in enumerate(inhalt): # zeile und zeilennummer(index) gleichzeitig ausgeben
    if index>0:  #wenn index >0 (ab Zeile 2:)
        niederschlaege.append(float(zeile.split(";")[5])) #split,float und append in einer Anweisung
mittel=sum(niederschlaege)/len(niederschlaege)
print(mittel)   

695.1527777777778


2. Für diese Aufgabe benötigen wir nicht die 6 Spalte, sondern die 2. und 3. Also lassen wir uns diese ausgeben, die Änderungen sind also vor allem nach dem "if index>0:"

In [113]:
with open("DWD_Jahresniederschlag_Kiebingen.txt", "r") as datei:
    inhalt=datei.readlines()  # ganze datei zeilenweise einlesen und in einer Liste ausgeben
niederschlaege=[] # Leere Liste für Niederschläge erzeugen
for index,zeile in enumerate(inhalt): # zeile und zeilennummer(index) gleichzeitig ausgeben
    if index>0:  #wenn index >0 (ab Zeile 2:)
        #Messbeginn (Spalte 2, Index 1 ausgeben)
        messbeginn = zeile.split(";")[1]
        #Messende (Spalte 3, Index 2 ausgeben)
        messende =zeile.split(";")[2]
        #Ausgabe zur Kontrolle
        print(messbeginn+" "+messende)
        
        
        
        


19800101 19801231
19810101 19811231
19820101 19821231
19830101 19831231
19840101 19841231
19850101 19851231
19860101 19861231
19870101 19871231
19880101 19881231
19890101 19891231
19900101 19901231
19910101 19911231
19920101 19921231
19930101 19931231
19960101 19961231
19970101 19971231
19980101 19981231
19990101 19991231
20000101 20001231
20010101 20011231
20040101 20041231
20050101 20051231
20060101 20061231
20070101 20071231
20080101 20081231
20090101 20091231
20100101 20101231
20110101 20111231
20120101 20121231
20130101 20131231
20140101 20141231
20150101 20151231
20160101 20161231
20170101 20171231
20180101 20181231
20190101 20191231


3. Wir sehen also, dass die Datumsangaben folgendes Format haben:
- Zeichen 1-4: Jahresangabe
- Zeichen 5-6: Monatsangabe
- zeichen 7-8: Tagesangabe

Also extrahieren wir uns das Jahr, den Monat und den Tag über die Indexposition (dies geht nicht mit split())    
    
    

In [114]:
with open("DWD_Jahresniederschlag_Kiebingen.txt", "r") as datei:
    inhalt=datei.readlines()  # ganze datei zeilenweise einlesen und in einer Liste ausgeben
niederschlaege=[] # Leere Liste für Niederschläge erzeugen
for index,zeile in enumerate(inhalt): # zeile und zeilennummer(index) gleichzeitig ausgeben
    if index>0:  #wenn index >0 (ab Zeile 2:)
        #Messbeginn (Spalte 2, Index 1 ausgeben)
        messbeginn = zeile.split(";")[1]
        jahrbeginn=messbeginn[0:4]
        monatbeginn=messbeginn[4:6]
        tagbeginn=messbeginn[6:8]
        
        #Messende (Spalte 3, Index 2 ausgeben)
        messende =zeile.split(";")[2]
        jahrende=messende[0:4]
        monatende=messende[4:6]
        tagende=messende[6:8]
        #Ausgabe zur Kontrolle
        print(jahrbeginn+" "+monatbeginn+" "+tagbeginn)
        
        

1980 01 01
1981 01 01
1982 01 01
1983 01 01
1984 01 01
1985 01 01
1986 01 01
1987 01 01
1988 01 01
1989 01 01
1990 01 01
1991 01 01
1992 01 01
1993 01 01
1996 01 01
1997 01 01
1998 01 01
1999 01 01
2000 01 01
2001 01 01
2004 01 01
2005 01 01
2006 01 01
2007 01 01
2008 01 01
2009 01 01
2010 01 01
2011 01 01
2012 01 01
2013 01 01
2014 01 01
2015 01 01
2016 01 01
2017 01 01
2018 01 01
2019 01 01


4. Nun können wir aus den Jahr-, Monat- und Tagtexten ein Datumsobjekt erzeugen. Dazu importieren wir uns date und müssen die Jahr-, Monats- und Tagtexte noch in eine Integerzahl umwandeln (und gleich in date() angeben).

In [115]:
from datetime import date

with open("DWD_Jahresniederschlag_Kiebingen.txt", "r") as datei:
    inhalt=datei.readlines()  # ganze datei zeilenweise einlesen und in einer Liste ausgeben
niederschlaege=[] # Leere Liste für Niederschläge erzeugen
for index,zeile in enumerate(inhalt): # zeile und zeilennummer(index) gleichzeitig ausgeben
    if index>0:  #wenn index >0 (ab Zeile 2:)
        #Messbeginn (Spalte 2, Index 1 ausgeben)
        messbeginn = zeile.split(";")[1]
        jahrbeginn=messbeginn[0:4]
        monatbeginn=messbeginn[4:6]
        tagbeginn=messbeginn[6:8]
        datumbeginn = date(int(jahrbeginn), int(monatbeginn), int(tagbeginn))
        #Messende (Spalte 3, Index 2 ausgeben)
        messende =zeile.split(";")[2]
        jahrende=messende[0:4]
        monatende=messende[4:6]
        tagende=messende[6:8]
        datumende = date(int(jahrende), int(monatende), int(tagende))
        #Ausgabe zur Kontrolle
        print(datumbeginn)
        print(datumende)
        
        

1980-01-01
1980-12-31
1981-01-01
1981-12-31
1982-01-01
1982-12-31
1983-01-01
1983-12-31
1984-01-01
1984-12-31
1985-01-01
1985-12-31
1986-01-01
1986-12-31
1987-01-01
1987-12-31
1988-01-01
1988-12-31
1989-01-01
1989-12-31
1990-01-01
1990-12-31
1991-01-01
1991-12-31
1992-01-01
1992-12-31
1993-01-01
1993-12-31
1996-01-01
1996-12-31
1997-01-01
1997-12-31
1998-01-01
1998-12-31
1999-01-01
1999-12-31
2000-01-01
2000-12-31
2001-01-01
2001-12-31
2004-01-01
2004-12-31
2005-01-01
2005-12-31
2006-01-01
2006-12-31
2007-01-01
2007-12-31
2008-01-01
2008-12-31
2009-01-01
2009-12-31
2010-01-01
2010-12-31
2011-01-01
2011-12-31
2012-01-01
2012-12-31
2013-01-01
2013-12-31
2014-01-01
2014-12-31
2015-01-01
2015-12-31
2016-01-01
2016-12-31
2017-01-01
2017-12-31
2018-01-01
2018-12-31
2019-01-01
2019-12-31


5. Nun können wir uns wieder die Differenz ausrechnen lassen und die dann ausgeben. Und das war's dann schon.

In [116]:
from datetime import date

with open("DWD_Jahresniederschlag_Kiebingen.txt", "r") as datei:
    inhalt=datei.readlines()  # ganze datei zeilenweise einlesen und in einer Liste ausgeben
niederschlaege=[] # Leere Liste für Niederschläge erzeugen
for index,zeile in enumerate(inhalt): # zeile und zeilennummer(index) gleichzeitig ausgeben
    if index>0:  #wenn index >0 (ab Zeile 2:)
        #Messbeginn (Spalte 2, Index 1 ausgeben)
        messbeginn = zeile.split(";")[1]
        jahrbeginn=messbeginn[0:4]
        monatbeginn=messbeginn[4:6]
        tagbeginn=messbeginn[6:8]
        datumbeginn = date(int(jahrbeginn), int(monatbeginn), int(tagbeginn))
        #Messende (Spalte 3, Index 2 ausgeben)
        messende =zeile.split(";")[2]
        jahrende=messende[0:4]
        monatende=messende[4:6]
        tagende=messende[6:8]
        datumende = date(int(jahrende), int(monatende), int(tagende))
        
        #Differenz berechnen und ausgeben
        differenz = datumende-datumbeginn
        print(differenz)
       
                
               

365 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
365 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
365 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
365 days, 0:00:00
364 days, 0:00:00
365 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
365 days, 0:00:00
364 days, 0:00:00
365 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
365 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
365 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
365 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00


Wir sehen hier, dass wir immer einen Tag vergessen haben, da wir angenommen haben, dass Messbeginn und Messende jeweils um 0:00 Uhr stattgefunden haben. D.h. die Messungen endeten immer am 31.12. um 0:00 Uhr. Das soll uns aber bei dieser Aufgabe nicht weiter kümmern.



Ich möchte Ihnen nur noch kurz vorstellen, dass wir den Datumstext auch noch schneller in ein datetime-Objekt umwandeln können. Dazu können wir die methode strptime() nutzen (die Funktion macht das Gegenteil von strftime)
Achtung: dies geht nur mit datetime nicht mit date !!

In [117]:
from datetime import datetime

with open("DWD_Jahresniederschlag_Kiebingen.txt", "r") as datei:
    inhalt=datei.readlines()  # ganze datei zeilenweise einlesen und in einer Liste ausgeben
niederschlaege=[] # Leere Liste für Niederschläge erzeugen
for index,zeile in enumerate(inhalt): # zeile und zeilennummer(index) gleichzeitig ausgeben
    if index>0:  #wenn index >0 (ab Zeile 2:)
        #Messbeginn (Spalte 2, Index 1 ausgeben)
        messbeginn = zeile.split(";")[1]
        datumbeginn = datetime.strptime(messbeginn,"%Y%m%d")
        #Messende (Spalte 3, Index 2 ausgeben)
        messende =zeile.split(";")[2]
        datumende = datetime.strptime(messende,"%Y%m%d")
        
        #Differenz berechnen und ausgeben
        differenz = datumende-datumbeginn
        print(differenz)
       
                
               

365 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
365 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
365 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
365 days, 0:00:00
364 days, 0:00:00
365 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
365 days, 0:00:00
364 days, 0:00:00
365 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
365 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
365 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
365 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00
364 days, 0:00:00


## 5.3 in Dateien schreiben

Wir können unsere Ergebnisse nicht nur auf dem Bildschirm ausgeben lassen, sondern auch in eine Datei schreiben lassen. Dazu müssen wir uns zuerst eine Datei im Schreibmodus "w" öffnen.
### Achtung: Falls die Datei schon existiert, wird Sie überschrieben (und kann auch nicht mehr wiederhergestellt werden !!!) 
Wir nutzen wieder die with-Anweisung:


In [118]:
with open("ausgabe.txt", "w") as datei: #Achtung, die Datei "ausgabe.txt" wird ohne Warnung überschrieben
    print("die Datei wird erzeugt und sollte in Ihrem Dateiexplorer (wie die DWD-Datei) sichtbar sein")

die Datei wird erzeugt und sollte in Ihrem Dateiexplorer (wie die DWD-Datei) sichtbar sein


Nun können wir mit den Methoden write() und writelines() in die Datei schreiben:

In [119]:
with open("ausgabe.txt", "w") as datei: #Achtung, die Datei "ausgabe.txt" wird ohne Warnung überschrieben
    datei.write("Hallo")
    datei.write("Wie geht es Dir")


Die erzeugte Datei "ausgabe.txt" können wir einfach wie ein Notebook einladen (Doppelklick auf den Dateinamen). Dabei sehen wir, dass der Text einfach immer hintereinander in die Datei geschrieben wird. Falls wir in eine neue Zeile schreiben wollen, müssen wir dies noch mit "\n" (new line) angeben:

In [120]:
with open("ausgabe.txt", "w") as datei: #Achtung, die Datei "ausgabe.txt" wird ohne Warnung überschrieben
    datei.write("Hallo\n")
    datei.write("Wie geht es Dir\n")

Mit der Methode wirtelines() können wir gleich eine ganze Stringliste in die Datei schreiben:

In [121]:
with open("ausgabe.txt", "w") as datei: #Achtung, die Datei "ausgabe.txt" wird ohne Warnung überschrieben
    liste=["Hallo","Wie geht es Dir"]
    datei.writelines(liste)


Auch hier sehen wir, dass wir uns um das Zeilenende selbst kümmern müssen:

In [122]:
with open("ausgabe.txt", "w") as datei: #Achtung, die Datei "ausgabe.txt" wird ohne Warnung überschrieben
    liste=["Hallo\n","Wie geht es Dir\n"]
    datei.writelines(liste)


Mit diesen Methoden können wir nun also jede Art von Text in Dateien überführen.