## Dateien ##
Um in den Zugriff auf Daten zu vereinfachen wollen wir gerne auf (Text-) Dateien zugreifen können.
- Öffnen von Dateien 
- Zeilenweises lesen von Dateien 
- Zeilenweises Schreiben 
- Vollständiges Lesen einer Datei
- Schliessen einer Datei

Eine Datei muss zur Bearbeitung geöffnet werden. Dabei wird festgelegt, ob die Daten nur gelesen oder auch geschrieben werden sollen.
- File Open: open("mytext.txt", "r"), open("newtext.txt", "w"), open("doboth.txt", "r+w"
Nach der Bearbeitung sollte die datei immer wieder geschlossen werden.
- File Close: file.close()
- Mit der with-Anweisung kann das Schliessen der Datei automatisch sichergestellt werden: with open("mytxt.txt", "w") as my_file


In [None]:
# Öffnen einer Datei zum Lesen
insp_file = open('inspire.txt', 'r')
# Zeilenweises lesen
for line in insp_file:
    print (line.strip())            #Strip entfernt eventuelle zusätzlich Leerzeichen und Linebreaks
# Schliessen
insp_file.close()

In [None]:
# Eine neue Datei erstellen
out_file = open('beispiel.txt','w')
# Schreiben einer Zeile
out_file.write("INSPIRE ist cool!")
# Schliessen
out_file.close()

In [None]:
# Lesen einer Datei im Ganzen
insp_file = open('inspire.txt', 'r')
# Einlesen in einen String
inspire_string = insp_file.read()
# Schliessen
insp_file.close()

print (inspire_string)

In [None]:
# Trick: Mit der with Anweisung übernimmt Python das korrekte Schliessen der Datei
with open('inspire.txt', 'r') as autoclose_file:
    line_no = 0
    for line in autoclose_file:
        line_no +=1
        print (line_no, end="-")
    print('fertig')

**Aufgabe**   
Die Datei 'bev_2018_2022_clean.csv' in Ihrem Ordner enthält in einer Liste die Bevölkerungszahlen für die Landkreise Deutschlands der Jahre 2012-2016. Der Aufbau der Datei ist zeilenweise und jede Zeile enthält:   
Id; Name; Bevölkerung 2018; Bevölkerung 2019; Bevölkerung 2020; Bevölkerung 2021; Bevölkerung 2022   

``` 12064;Märkisch-Oderland;186925;187668;188422;190714;191685
12065;Oberhavel;202162;203012;204898;207524;208639
12066;Oberspreewald-Lausitz;115212;113842;112896;112450;111962
12067;Oder-Spree;177047;176850;177823;182397;178849
12068;Ostprignitz-Ruppin;99125;98944;98886;99110;99414
12069;Potsdam-Mittelmark;204388;205520;207498;210910;212207
...```

Lesen Sie die Datei ein und speichern Sie die Bevölkerungsentwicklung der Stadt Frankfurt am Main ('Frankfurt am Main, kreisfreie Stadt') in einer neuen Datei:
'Name: Bevölkerung 2018, 2019, 2020, 2021, 2022, 2022- 2018'


(Hinweis 1: Einige Namen kommen aufgrund neuer Ids und Neuordnungen öfters vor; daher haben einige Einträge auch die gegebene Bevölkerung -)   
(Hinweis 2: Einen Zeilenumbruch gestalten Sie z.B. mit einem \n nach der Zeile)


In [None]:
# Öffnen der Datei 
with open('bev_2018_2022_clean.csv', 'r', encoding='utf-8') as autoclose_file:
    ...

**Extras - aktuell uniteressant**   
Es gibt viele Sonderfälle für die Dateibehandlung (siehe auch die Hilfe).
- Lesen von binären Daten 
- Zugriff von Daten einer http Ressource.

In [7]:
# Extras
# Binary Byte for Byte
with open("myfile", "rb") as f:
    byte = f.read(1)
    while byte:
        # Do stuff with byte.
        byte = f.read(1)
        print(int.from_bytes(byte), end="-")

73-70-56-57-97-236-1-122-1-247-0-0-0-0-0-0-0-51-0-0-102-0-0-153-0-0-204-0-0-255-0-43-0-0-43-51-0-43-102-0-43-153-0-43-204-0-43-255-0-85-0-0-85-51-0-85-102-0-85-153-0-85-204-0-85-255-0-128-0-0-128-51-0-128-102-0-128-153-0-128-204-0-128-255-0-170-0-0-170-51-0-170-102-0-170-153-0-170-204-0-170-255-0-213-0-0-213-51-0-213-102-0-213-153-0-213-204-0-213-255-0-255-0-0-255-51-0-255-102-0-255-153-0-255-204-0-255-255-51-0-0-51-0-51-51-0-102-51-0-153-51-0-204-51-0-255-51-43-0-51-43-51-51-43-102-51-43-153-51-43-204-51-43-255-51-85-0-51-85-51-51-85-102-51-85-153-51-85-204-51-85-255-51-128-0-51-128-51-51-128-102-51-128-153-51-128-204-51-128-255-51-170-0-51-170-51-51-170-102-51-170-153-51-170-204-51-170-255-51-213-0-51-213-51-51-213-102-51-213-153-51-213-204-51-213-255-51-255-0-51-255-51-51-255-102-51-255-153-51-255-204-51-255-255-102-0-0-102-0-51-102-0-102-102-0-153-102-0-204-102-0-255-102-43-0-102-43-51-102-43-102-102-43-153-102-43-204-102-43-255-102-85-0-102-85-51-102-85-102-102-85-153-102-85-204-1

In [4]:
# Extras
# Binary Chunkwise
CHUNKSIZE = 10
file = open("myfile", "rb")
try:
    bytes_read = file.read(CHUNKSIZE)
    while bytes_read:
        print ("new chunk")
        for b in bytes_read:
            print(b, end="-")
        bytes_read = file.read(CHUNKSIZE)
finally:
    file.close()

new chunk
71-73-70-56-57-97-236-1-122-1-new chunk
247-0-0-0-0-0-0-0-51-0-new chunk
0-102-0-0-153-0-0-204-0-0-new chunk
255-0-43-0-0-43-51-0-43-102-new chunk
0-43-153-0-43-204-0-43-255-0-new chunk
85-0-0-85-51-0-85-102-0-85-new chunk
153-0-85-204-0-85-255-0-128-0-new chunk
0-128-51-0-128-102-0-128-153-0-new chunk
128-204-0-128-255-0-170-0-0-170-new chunk
51-0-170-102-0-170-153-0-170-204-new chunk
0-170-255-0-213-0-0-213-51-0-new chunk
213-102-0-213-153-0-213-204-0-213-new chunk
255-0-255-0-0-255-51-0-255-102-new chunk
0-255-153-0-255-204-0-255-255-51-new chunk
0-0-51-0-51-51-0-102-51-0-new chunk
153-51-0-204-51-0-255-51-43-0-new chunk
51-43-51-51-43-102-51-43-153-51-new chunk
43-204-51-43-255-51-85-0-51-85-new chunk
51-51-85-102-51-85-153-51-85-204-new chunk
51-85-255-51-128-0-51-128-51-51-new chunk
128-102-51-128-153-51-128-204-51-128-new chunk
255-51-170-0-51-170-51-51-170-102-new chunk
51-170-153-51-170-204-51-170-255-51-new chunk
213-0-51-213-51-51-213-102-51-213-new chunk
153-51-21

In [10]:
# Wenn es denn Daten aus dem Netz sind
import urllib.request

url = 'https://raw.githubusercontent.com/CSSEGISandData/COVID-19/refs/heads/master/csse_covid_19_data/csse_covid_19_daily_reports/11-13-2022.csv'
response = urllib.request.urlopen(url)
data = response.read()      # a `bytes` object
text = data.decode('ISO-8859-1') 
print (text)

FIPS,Admin2,Province_State,Country_Region,Last_Update,Lat,Long_,Confirmed,Deaths,Recovered,Active,Combined_Key,Incident_Rate,Case_Fatality_Ratio
,,,Afghanistan,2022-11-14 04:21:09,33.93911,67.709953,204510,7829,,,Afghanistan,525.349898676648,3.8281746613857512
,,,Albania,2022-11-14 04:21:09,41.1533,20.1683,333156,3593,,,Albania,11576.760025019112,1.0784737480339541
,,,Algeria,2022-11-14 04:21:09,28.0339,1.6596,270939,6881,,,Algeria,617.862156665236,2.539686054794622
,,,Andorra,2022-11-14 04:21:09,42.5063,1.5218,46664,155,,,Andorra,60394.74535688863,0.332161837819304
,,,Angola,2022-11-14 04:21:09,-11.2027,17.8739,103131,1917,,,Angola,313.78981026990954,1.8588009424906187
,,,Antarctica,2022-11-14 04:21:09,-71.9499,23.347,11,0,,,Antarctica,,0.0
,,,Antigua and Barbuda,2022-11-14 04:21:09,17.0608,-61.7964,9106,146,,,Antigua and Barbuda,9298.668409443671,1.6033384581594552
,,,Argentina,2022-11-14 04:21:09,-38.4161,-63.6167,9721718,130011,,,Argentina,21510.23534787332,1.3373253575139703
,,,Ar