# Dateien
Dateien sind sind sehr praktisch. Mit ihnen kann man neue Daten einlesen und abspeichern. Wie geht das eigentlich mit Python?

## Eine Textdatei lesen und ihren Inhalt ausgeben

In [1]:
# Wir öffnen die Datei lesen.txt zum Lesen ("r") und speichern ihren Inhalt in die Variable file
file = open("lesen.txt", "r")

# Wir gehen alle Zeilen nacheinander durch
# In der txt-Datei stehen für uns nicht sichtbare Zeilenumbruchszeichen, durch die jeweils das Ende einer Zeile markiert ist
for line in file:
    # Eine Zeile ohne Zeilenumbruch ausgeben
    print(line.strip())
file.close()

Hallo Leute.
Ich bin eine wunderschöne weitere Zeile.


## In eine Textdatei schreiben
In eine Textdatei zu schreiben ist fast genauso einfach wie sie zu lesen:

In [8]:
# Wir öffnen eine Datei zum Schreiben ("w": write) 
file = open("schreiben.txt", "a")

students = ["Max", "Monika", "Erik", "Franziska"]

# Wir loopen mit einer for-Schleife durch die Liste students
for student in students:
    # Mit der write-Methode schreiben wir den aktuellen String student und einen Zeilenumbruch in das file-Objekt
    file.write(student + "\n")

# Abschließend müssen wir die Datei wieder schließen
file.close()
with open("schreiben.txt", "r") as newfile:
    for line in newfile:
        print(line.strip())
        


Max
Monika
Erik
Franziska
Max
Monika
Erik
Franziska


## Dateien öffnen mit with
Wenn wir Dateien mit einer with-Konstruktion öffnen, dann brauchen wir sie nicht mehr explizit mit der close()-Methode schließen.

In [12]:
with open("lesen.txt", "r") as file:
    for line in file:
        print(line.strip())

Hallo Leute.
Ich bin eine wunderschöne weitere Zeile.


## CSV-Datei lesen
CSV steht für comma separated values. Auch solche csv-Dateien können wir mit Python auslesen.

In [11]:
with open("datei.csv") as file:
    for line in file:
        data = line.split(";")
        print(data[2].strip() + ": " + data[1].strip())

MUC: 1800000
BER: 3000000
BUD: 2000000


## CSV-Datei lesen (und Daten überspringen)

CSV Dateien sind genauso dateien wie jede andere auch. Für sie ist es ganz z.B. ganz praktisch wenn du Zeilen überspringen kannst. 

In [12]:
with open("datei.csv") as file:
    for line in file:
        data = line.split(";")
        
        if int(data[1]) < 2000000:
            continue
        
        if data[2] == "BUD":
            continue
        
        print(data)

['Berlin', '3000000', 'BER\n']


## Übung
- Zum ersten mal können wir endlich mit einem "echten" Datensatz arbeiten!
- Besorgt euch die datei https://data.stadt-zuerich.ch/dataset/pd-stapo-hundenamen/resource/8bf2127d-c354-4834-8590-9666cbd6e160
- Ihr findet sie auch im Ordner 20151001_hundenamen.csv
- Findet heraus wie oft der Hundename "Aaron" zwischen 2000 - 2012 gebraucht wurde. 

In [8]:
#Hinweis 1:
n = "1975"
print(int(n) < 1990)

True


In [9]:
# Hinweis 2:
jahre = ["Year", "1990", "1992"]

for jahr in jahre:
    if jahr == "Year":
        continue
    print(int(jahr))

1990
1992


In [50]:
### Hundenamen-Check
### 
resultlist = []
range_begin = 2000
range_end = 2012
search_name = "Sir"

search_name = input("Nach welchem Hundenamen möchten Sie suchen? ")
with open("20151001_hundenamen2.csv", "r") as input_file:
    for line in input_file:
        # iterate through every line
        # if(line.count(',')>2:
        # line = line.replace('"','')
        
        # split line in list
        data = line.strip().split(',')
        
        counter = 0
        found_problem = False
        problem_id = 0
        for element in data:
            # iterate through list
            if element[0] != '"':
                # if element is integer we don't care
                try:
                    int(element)
                    continue
                except Exception: 
                    # element is string, now we care
                    # now we have a string that had a , so we have to put it together again
                    # we concatenate the string with the string before
                    data[counter-1] = data[counter-1]+data[counter]
                    # mark a problem
                    found_problem = True
                    problem_id = counter
            # counter++
            counter = counter + 1
        # we had to fix the , in this line, so we have to remove the now empty column
        if found_problem:
            data.pop(problem_id)
        
        if search_name.lower() in data[0].lower():
            # check if name matches
            # print(data)
            # print(data[1])
            if int(data[1]) in range(range_begin,range_end+1):
                # check if year is in range
                # print(data)
                resultlist.append(data)
                
print(resultlist)

Nach welchem Hundenamen möchten Sie suchen? Sir
[['"Daisy  Desirée Rainerschlössel"', '2011', '"w"'], ['"Eska-Sira"', '2004', '"w"'], ['"Everest First Sir John Bonito"', '2010', '"m"'], ['"Sir Bubbles"', '2012', '"m"'], ['"Sir Collin-Flash"', '2010', '"m"'], ['"Sir Hustings"', '2007', '"m"'], ['"Sir Vladimir"', '2012', '"m"'], ['"Sira"', '2009', '"w"'], ['"Sira"', '2010', '"w"'], ['"Sira"', '2008', '"w"'], ['"Sira"', '2006', '"w"'], ['"Sira"', '2005', '"w"'], ['"Sira"', '2004', '"w"'], ['"Siri"', '2008', '"w"'], ['"Siri"', '2012', '"w"'], ['"Siri (Bella)"', '2005', '"w"'], ['"Siri (PluckyJumper)"', '2010', '"w"'], ['"Siria"', '2004', '"w"'], ['"Siro"', '2001', '"m"'], ['"Siro"', '2001', '"m"'], ['"Siro"', '2010', '"m"'], ['"Sirya"', '2007', '"w"'], ['"X-Sir Smokey"', '2011', '"m"']]
