# Datoteke

## Datotečni sistem

Datoteke hranimo na nosilcih (trdi disk, SSD, DVD, USB). Te lahko razdelimo na particije - npr. 1000 GB disk na particiji `C` (100 GB) in `D` (900 GB). V Windows vsaka particija dobi črko. Datoteke organiziramo v gnezdene mape, začenši s korensko mapo (Linux/macOS: `/`, Windows: `C:\`).

## Absolutna in relativna pot

Absolutna pot določa polni "naslov" datoteke (npr. `C:\RP-F\08Datoteke\Datoteke.ipynb`), vključno z mapami, ločenimi z `\` (Windows) ali `/` (Linux/macOS). Relativna pot pa opisuje lokacijo glede na trenutno mapo - pika (`.`) pomeni trenutno mapo. Gleden na mapo `RP-F` je relativna pot do `Datoteke.ipynb`: `.\08Datoteke\Datoteke.ipynb`.

## Ukazna vrstica

Kot v Raziskovalcu (File Explorer) smo v tudi ukaznem pozivu (Terminal) vedno v neki mapi (Current Working Directory - CWD), ki je prikazana v vrstici. V ukaznem pozivu najprej napišemo ukaz nato parametre, ki jih želimo podati, ločene s presledki. Ukaz izvedemo s tipko Enter.

Ukazi:
* `cd argument` - za argument podamo pot (relativno ali absolutno) do mape, v katero se želimo premakniti.
* `dir` - izpiše vse datoteke in mape, ki se nahajajo v trenutni mapi.

Za več glej https://ucilnica.fmf.uni-lj.si/mod/page/view.php?id=2505.


## Pisanje in Branje

Za odpiranje datotek uporabljamo funkcijo `open(file, mode, encoding)`, kjer je `file` pot do naše datoteke, `mode` specificra kako odprmo datoteko in `encoding` način kodiranja naše datoteke. Ko končamo z datoteko na njej pokličemo metodo `datoteka.close()`.

Če podamo samo file='datoteka.txt' bo Python iskal v CWD - običajno mapa v kateri imamo Python skripto. Vsi parametri za `mode`

| Znak | Pomen | Opomba
|------|-------|-------|
| 'r' | odpri za branje (privzeto) | če datoteka ne obstaja, sproži napako |
| 'w' | odpri za pisanje, najprej pobriši vsebino | če datoteka ne obstaja, ustvari novo; če obstaja, izbriše prejšnjo vsebino datoteke |
| 'x' | odpri za ekskluzivno ustvarjanje, javi napako če datoteka že obstaja | če datoteka že obstaja, sproži napako |
| 'a' | odpri za pisanje, dodajanje na konec če datoteka obstaja | če datoteka ne obstaja, ustvari novo; če obstaja, NE izbriše prejšnje vsebine |
| 'b' | binarni način | npr. slike |
| 't' | tekstovni način (privzeto) | npr. .txt, .csv, .tex, .html, .py |
| '+' | odpri za posodabljanje (branje in pisanje) | |

in njihove lastnosti

| Lastnost | Kombinacija črk | r | r+ | x | x+ | w | w+ | a | a+ |
|----------|------------------|---|----|----|----|----|----|----|----| 
| branje | | x | x | | x | | x | | x |
| pisanje | | | x | x | x | x | x | x | x |
| datoteka mora obstajati | | x | x | | | | | | |
| datoteka ne sme obstajati | | | | x | x | | | | |
| zbriše prejšnjo vsebino datoteke | | | | | | x | x | | |
| pisanje na konec datoteke | | | | | | | | x | x |

Uporabljao `encoding='utf-8'`, saj podpira č, š, ž, đ, ć. Privzeta vrednost tega argumenta je na Windows računalnikih 'windows-1252', kar je zastarel standard. Na macOS in Linux je vrednost utf-8 že privzeta.


### Pisanje

Datoteko odpremo z `mode='w'` ali `mode=a` in uporabiom metodo `datoteka.write()`.

In [23]:
datoteka = open('himna.txt', mode = 'w', encoding='utf-8')

datoteka.write("Živé naj vsi naródi,")
datoteka.write("\nki hrepené dočakat' dan,")
datoteka.write("\nda koder sonce hodi, \nprepir iz svéta bo pregnan, \nda rojak \nprost bo vsak, \nne vrag, le sosed bo mejak!")

datoteka.close()


Boljši način kot uporaba metode `datoteka.close()` je uporaba `with` stavka. Namesto

In [None]:
datoteka = open('ime.txt', 'r')
# ... delo z datoteko ...
datoteka.close()  # Lahko pozabimo zapreti ali pa pride do napake prej

uporabimo

In [None]:
with open('data.txt', 'r') as file:
    # ... delo z datoteko ...
    # Python bo samodejno zaprl datoteko ob koncu bloka

Torej z `with` stavkom

In [24]:
with open('himna.txt', 'w', encoding='utf-8') as datoteka:
    datoteka.write("Živé naj vsi naródi,")
    datoteka.write("\nki hrepené dočakat' dan,")
    datoteka.write("\nda koder sonce hodi, \nprepir iz svéta bo pregnan, \nda rojak \nprost bo vsak, \nne vrag, le sosed bo mejak!")

pa še z uporabo niza čez več vrstic - `"""niz"""`.

In [25]:
with open('himna.txt', 'w', encoding='utf-8') as datoteka:
    besedilo = """Živé naj vsi naródi,
ki hrepené dočakat' dan,
da koder sonce hodi,
prepir iz svéta bo pregnan,
da rojak
prost bo vsak,
ne vrag, le sosed bo mejak!"""
    datoteka.write(besedilo)

Nezaprte datoteke zasedajo sistemske vire in lahko povzročijo težave. With stavek deluje kot varnostna mreža - tudi če naša koda sproži napako, se bo datoteka vseeno zaprla. 

### Branje

Datoteko odrpemo z `mode='r'` in uporabiom metodo `datoteka.read()`.

In [26]:
# Branje celotne vsebine datoteke naenkrat  
with open('himna.txt', mode='r', encoding='utf-8') as datoteka:
    vsebina = datoteka.read()
print(vsebina)

Živé naj vsi naródi,
ki hrepené dočakat' dan,
da koder sonce hodi,
prepir iz svéta bo pregnan,
da rojak
prost bo vsak,
ne vrag, le sosed bo mejak!


Z metodo `datoteka.readlines()` dobimo seznam, v katerem so posamezne vrstice iz datoteke.

In [27]:
with open('himna.txt', mode='r', encoding='utf-8') as datoteka:
    vrstice = datoteka.readlines()
print(vrstice)

['Živé naj vsi naródi,\n', "ki hrepené dočakat' dan,\n", 'da koder sonce hodi,\n', 'prepir iz svéta bo pregnan,\n', 'da rojak\n', 'prost bo vsak,\n', 'ne vrag, le sosed bo mejak!']


Po vrsticah datoteke gremo lahko tudi z `for` zanko. Tu uporabimo metodo `niz.strip()`, ki odstrani odvečne znake za novo vrstico `\n`.

In [28]:
 # Branje po vrsticah
with open('himna.txt', 'r', encoding='utf-8') as datoteka:
    for vrstica in datoteka: 
        print(vrstica.strip())

Živé naj vsi naródi,
ki hrepené dočakat' dan,
da koder sonce hodi,
prepir iz svéta bo pregnan,
da rojak
prost bo vsak,
ne vrag, le sosed bo mejak!
