## Dateien ##
Um in den Zugriff auf Daten zu vereinfachen wollen wir gerne auf (Text-) Dateien zugreifen können.
- Öffnen von Dateien 
- Zeilenweises lesen von Dateien 
- Zeilenweises Schreiben 
- Vollständiges Lesen einer Datei
- Schliessen einer Datei

Eine Datei muss zur Bearbeitung geöffnet werden. Dabei wird festgelegt, ob die Daten nur gelesen oder auch geschrieben werden sollen.
- File Open: open("mytext.txt", "r"), open("newtext.txt", "w"), open("doboth.txt", "r+w"
Nach der Bearbeitung sollte die datei immer wieder geschlossen werden.
- File Close: file.close()
- Mit der with-Anweisung kann das Schliessen der Datei automatisch sichergestellt werden: with open("mytxt.txt", "w") as my_file


In [None]:
# Öffnen einer Datei zum Lesen
insp_file = open('inspire.txt', 'r')
# Zeilenweises lesen
for line in insp_file:
    print (line.strip())            #Strip entfernt eventuelle zusätzlich Leerzeichen und Linebreaks
# Schliessen
insp_file.close()

In [None]:
# Eine neue Datei erstellen
out_file = open('beispiel.txt','w')
# Schreiben einer Zeile
out_file.write("INSPIRE ist cool!")
# Schliessen
out_file.close()

In [None]:
# Lesen einer Datei im Ganzen
insp_file = open('inspire.txt', 'r')
# Einlesen in einen String
inspire_string = insp_file.read()
# Schliessen
insp_file.close()

print (inspire_string)

In [None]:
# Trick: Mit der with Anweisung übernimmt Python das korrekte Schliessen der Datei
with open('inspire.txt', 'r') as autoclose_file:
    line_no = 0
    for line in autoclose_file:
        line_no +=1
        print (line_no, end="-")
    print('fertig')

**Aufgabe**   
Die Datei 'bev_2012_2016_clean.csv' in Ihrem Ordner enthält in einer Liste die Bevölkerungszahlen für die Landkreise Deutschlands der Jahre 2012-2016. Der Aufbau der Datei ist zeilenweise und jede Zeile enthält:   
Id; Name; Bevölkerung 2012; Bevölkerung 2013; Bevölkerung 2014; Bevölkerung 2015; Bevölkerung 2016   

``` 12064;Märkisch-Oderland;186925;187668;188422;190714;191685
12065;Oberhavel;202162;203012;204898;207524;208639
12066;Oberspreewald-Lausitz;115212;113842;112896;112450;111962
12067;Oder-Spree;177047;176850;177823;182397;178849
12068;Ostprignitz-Ruppin;99125;98944;98886;99110;99414
12069;Potsdam-Mittelmark;204388;205520;207498;210910;212207
...```

Lesen Sie die Datei ein und speichern Sie die Bevölkerungsentwicklung der Kreise 'Bochum', 'München', 'Dortmund' und 'Berlin' in einer neuen Datei in folgender Form:
'Name: Bevölkerung 2016, 2015, 2014, 2013, 2012, 2016-2012'


(Hinweis 1: Einige Namen kommen aufgrund neuer Ids und Neuordnungen öfters vor; daher haben einige Einträge auch die gegebene Bevölkerung 0)   
(Hinweis 2: Einen Zeilenumbruch gestalten Sie z.B. mit einem \n nach der Zeile)


In [None]:
# Öffnen der Datei 
kreis_set = ('Bochum', 'München', 'Dortmund', 'Berlin')
with open('bev_2012_2016_clean.csv', 'rt') as pop_file:
    with open ('Bevoelkerung.txt', 'wt') as bev_file:
        for pop_line in pop_file:
            pop_line_string = pop_line.strip()
            pop_record = pop_line_string.split(';')
            if (pop_record[1] in kreis_set):
                new_line = pop_record[1] + ", " \
                    + pop_record[6]+ ", " \
                    + pop_record[5]+ ", " \
                    + pop_record[4]+ ", " \
                    + pop_record[3]+ ", " \
                    + pop_record[2]+ ", " \
                    + str(int(pop_record[6])-int(pop_record[2]))
                bev_file.write(new_line)
print ('done')

**Extras - aktuell uniteressant**   
Es gibt viele Sonderfälle für die Dateibehandlung (siehe auch die Hilfe).
Angeführt sind Lesen von binären Daten und Zugriff von Daten einer http Ressource.

In [None]:
# Extras
# Binary Byte for Byte
with open("myfile", "rb") as f:
    byte = f.read(1)
    while byte:
        # Do stuff with byte.
        byte = f.read(1)

In [None]:
# Extras
# Binary Chunkwise
file = open("filename", "rb")
try:
    bytes_read = file.read(CHUNKSIZE)
    while bytes_read:
        for b in bytes_read:
            process_byte(b)
        bytes_read = file.read(CHUNKSIZE)
finally:
    file.close()

In [None]:
# Wenn es denn Daten aus dem Netz sind
import urllib.request

url = 'https://www-genesis.destatis.de/genesis/online?sequenz=tabelleDownload&selectionname=12411-0015&regionalschluessel=&format=csv'
response = urllib.request.urlopen(url)
data = response.read()      # a `bytes` object
text = data.decode('ISO-8859-1') 
print (text)