# Load and save data to files
Filändelser är associerade med ett program, och operativsystemet gör att det programmet öppnas när filen klickas på och sedan laddas upp i det programmet.

We can categorize files into 2 main categories, text files and binary files. 
- Text files store text / characters in a human readable format. 
- Binary files stores byte data (1's and 0's) that only computers understand. 

## Common text based files to store data
Samtliga nedan är textdata strukturerade olika
- **.txt** Plain english (or other language) text. Se exempel när vi sparar ned namn i lista nedan i kod
- **.csv** Comma separated values, utifrån exempel nedan när vi sparar ned namn i en lista, tänk att man vill spara fler sådana kolumner i datat. Första rad labels sedan data
- **.json** 
(Syntax som dictionary, om det läses in via dess paket i python fås det ut som dictionary ("object") och man kommer åt dess data via detta sätt)


## File names and file paths

A file name usually has two parts, the name and the file extension, separated with a dot (name.extension)


e.g. hello.txt data.json myimage.jpg

Paths can be expressedeither relative or absolute. 
- **Absolute:** Full path to access a file or folder. Ex. c:\users\younis\documents\myfile.txt
- **Relative:** Relative from the current active folder: data\data.json  

## File modes
It's possible to open a file in python in different modes:
- **'r':** for reading (default)
- **'a':** for appending (also writing, but keeps existing content and append new content at end of file)
- **'w':** for writing (overwrites everything in file)
- **'x':** Creates the specified file, returns an error if the file exists


# Open file for reading

In [3]:
file = open("..\data\hello.txt")      

content = file.read()

print(content)

file.close()

Testing how to change the entire content in a textfile by python
Test
Test 2



# Open with context management
Preferred way to do it, minimizing the risk to introduce bugs in the code. 

In [2]:
new_content = input("Enter text: ")

with open("..\\data\\hello.txt", "a") as file:    
    file.write(new_content + '\n')
    print(new_content)
    

Test 2


# Open file for writing

In [7]:
new_content = input("Enter text: ")

with open("..\\data\\hello.txt", "w") as file:
    file.write(new_content)

    print(new_content)

Testing how to change the entire content in a textfile by python


# Mini-uppgift
Skapa ett program som har en tom lista. När programmet körs får användaren mata in namn(input) i en loop tills användaren matar in en tom rad. När den är klar så skrivs alla namn ut på skärmen, samt sparas till en fil (med ett namn på varje rad). Nästa gång man startar programmet så läser den in de befintliga namnen.

In [1]:
with open("..\\data\\namelist.txt", "r") as file:
    #names = file.readlines()   #Läser in radvis men lägger till newline(backslash n), därför strippas de, annars adderas på varandra då writelines inte lägger till
    names = [name.strip("\n") for name in file.readlines()]  #list comprehension

while True:
    name = input("Enter name: ")
    if not name: break
    names.append(name)

print(names)

#for name in names:
#    print(name)

with open("..\\data\\namelist.txt", "w") as file:    
    file.writelines([name + '\n' for name in names]) #skriver om alla namn i listan, de från början o de jag lagt till, därför alla är kvar. Lägger ej newline dock o bara efter varandra, så vi lägger in det här

print("Names are saved!")

['Mohammad', 'Hossein', 'Ali', 'Younis', 'Younis', 'Mohammad', 'Ali']
Names are saved!


# Write .CSV file

In [1]:
students = [
    {"name": "adam", "class": "AI23", "email": "adam@gmail.com"},
    {"name": "kalle", "class": "AI23", "email": "kalle@gmail.com"},
    {"name": "eva", "class": "AI22", "email": "eva@hotmail.com"},
] #List of dictionaries

print(students)

with open("..\\data\\students.csv", "w") as file:
    for student in students:
        file.write(f"{student['name']}, {student['class']}, {student['email']}\n") #Notera \n på slutet
        #THIS IS DONE SINCE YOU NEVER CAN TYPE DICTIONARY DATA OR OTHER TO FILES; ONLY TEXT OR BINARY DATA.

[{'name': 'adam', 'class': 'AI23', 'email': 'adam@gmail.com'}, {'name': 'kalle', 'class': 'AI23', 'email': 'kalle@gmail.com'}, {'name': 'eva', 'class': 'AI22', 'email': 'eva@hotmail.com'}]


# Using csv package
För att läsa in csv filer i python (reverse the above method)

In [2]:
import csv

students = []

with open("..\\data\\students.csv") as file:
    reader = csv.DictReader(file)     #Reads into a dictionary at once

    for row in reader:
        #print(row["name"])
        students.append({"name": row["name"], "class": row["class"], "email": row["email"]})  #första nyckel jag anger här är valfri men andra från row spelar roll

print(students)


KeyError: 'name'

## Json serialization and deserialization
Paketet gör detta: Tar objekt i python (t.ex. dictionary) o gör om till textsträng enlig json formatet som kan skrivas till fil. Omvänt tar man json kod, deserialiserar o får ut som python objekt.



In [7]:
import json

# Ta detta teacher objekt , serialisera till Json o få ut som fik

teacher = {
    "firstname":"Fredrik",
    "lastname":"Johansson", 
    "age":42,
    "languages": ["Python", "C#", "Javascript"],
    "contact info": {
        "phone":"0701981713",
        "email":"younis@dvv.se",
        "adress": [
            'sweden',
            'lebanon'
            ]
        }
    }

serialized_data = json.dumps(teacher, indent=4)

#print(serialized_data)
# Vi hade kunnat göra print(teacher) då hade python gjort om till sträng åt oss
# Men vi gör om till sträng vi Json o ser nästan lika ut, Json kod som kan skrivas till fil.

with open("..\\data\\teacher.json", "w") as file:
    file.write(serialized_data)

In [10]:
with open("..\\data\\teacher.json", "r") as file:
    data = file.read()

#print(data)   #obs får ut en sträng och kan därför bara använda strängmetoder på.
teacher = json.loads(data)    # deserialize
type(data)    #text, stärng
type(teacher)   #dictionary, hade json data varit lista hade vi fått lista istället etc.

print(teacher)    #visar samma som print(data) men olika datatyp. Allt som skrivs till filer ska vara text, o därför görs serialization och därefter när vi vill ha i 
# python igen görs deserialization (teacher)




{'firstname': 'Fredrik', 'lastname': 'Johansson', 'age': 42, 'languages': ['Python', 'C#', 'Javascript'], 'contact info': {'phone': '0701981713', 'email': 'younis@dvv.se', 'adress': ['sweden', 'lebanon']}}


In [19]:
with open("..\\data\\autos_json.json", "r") as file:
    data = file.read()

cars = json.loads(data) 
print(len(cars))    #antal bilar
print(cars[0])     # få ut specifik bil

#for key, value in cars[0].items():       #skriva ut key o dess values
    #print(f"{key} = {value}")

# få ut lista med alla "make" keys, skapa lista från befintlig lista


#brands = [car["make"] for car in cars]    
brands = set([car["make"] for car in cars])     #Få ut alla märken, unika?

#for brand in brands: 
#    print(brand)

for brand in sorted(brands):  # han sade något om att det inte längre är set då, returnerar lista, det görs om till lista igen för bara listor sorteras.
    print(brand)



205
{'aspiration': 'std', 'body-style': 'convertible', 'bore': 3.47, 'city-mpg': 21.0, 'compression-ratio': '9', 'curb-weight': 2548, 'drive-wheels': 'rwd', 'engine-location': 'front', 'engine-size': 130.0, 'engine-type': 'dohc', 'fuel-system': 'mpfi', 'fuel-type': 'gas', 'height': 48.8, 'highway-mpg': 27.0, 'horsepower': 111.0, 'length': 168.8, 'make': 'alfa-romero', 'normalized-losses': None, 'num-of-cylinders': 'four', 'num-of-doors': 'two', 'peak-rpm': 5000.0, 'price': 13495.0, 'stroke': 2.68, 'symboling': 3.0, 'wheel-base': 88.6, 'width': 64.1}
alfa-romero
audi
bmw
chevrolet
dodge
honda
isuzu
jaguar
mazda
mercedes-benz
mercury
mitsubishi
nissan
peugot
plymouth
porsche
renault
saab
subaru
toyota
volkswagen
volvo
