<img src="Slike/vua.png">

# Rad s dokumentima

Sada kada smo savladali osnovne vještine koje su nam potrebne za pisanje
programa, vrijeme je da ih učinimo upotrebljivijima. U ovom poglavlju naučit
ćemo raditi s datotekama kako bi programi mogli brzo analizirati podatke iz
dokumenata. Rad s datotekama i spremanje podataka učinit će vaše programe lakšim
za korištenje. Korisnici će moći odabrati koje podatke treba učitati.

Velike količine podataka dostupne su u tekstualnim datotekama. Tekstualne
datoteke mogu sadržavati vremenske podatke, podatke o prometu, socioekonomske
podatke, književna djela i drugo. Čitanje iz datoteke posebno je korisno u
aplikacijama za analizu podataka, ali se također može primijeniti na svaku
situaciju u kojoj želite analizirati ili izmijeniti podatke pohranjene u
datoteci. Kada želimo raditi s podatcima u tekstualnoj datoteci, prvi korak je
učitavanje datoteke u memoriju. Možemo čitati cijeli sadržaj datoteke ili jedan
po jedan red.

Za početak, učitajmo dokument pi.txt koji sadrži broj pi zapisan s 30 decimalnih mjesta, ali tako da se u svakom retku nalazi po 10.  
```python
3.1415926535  
  8979323846  
  2643383279  
```
Pogledajmo program koji otvara datoteku, učitava je i ispisuje sadržaj.

In [None]:
with open('pi.txt') as file_object:
    sadrzaj = file_object.read()
print(sadrzaj)

U prvoj liniji koda ovog programa imamo funkciju *open()* koja otvara datoteku
da bismo joj mogli pristupiti. Funkcija *open()* zahtijeva jedan argument (naziv
datoteke koju želimo otvoriti). Python traži tu datoteku u direktoriju u kojemu
je pohranjen program koji se trenutno izvodi. U ovom je primjeru trenutno
pokrenut dokument *Lab_28_Rad_s_dokumetima*, pa Python traži *pi.txt* u tom
direktoriju, gdje se i nalazi. Funkcija *open()* prikazuje objekt koji
predstavlja datoteku. Python to interno pohranjuje u objekt tipa *file_object*
koji kasnije koristimo u programu.

Primijetite kako pozivamo funkciju *open()* u ovom programu, ali ne i funkciju
*close(),* koja služi za zatvaranje datoteke. Datoteku možete otvoriti i
zatvoriti pozivanjem *open()* i *close()*. Ako neka greška u programu spriječi
izvršavanje funkcije *close(),* datoteka se možda nikada neće zatvoriti.
Nepropisno zatvorene datoteke mogu uzrokovati gubitak ili oštećenje podataka.
Ako pak napravimo *close()* prerano u svom programu, svi pokušaji pristupu
datoteci generirat će greške. Nije uvijek jednostavno odlučiti kada trebamo
zatvoriti datoteku, pa Python to može pokušati napraviti za nas, korištenjem
izraza *with*. Trebamo samo otvoriti datoteku i raditi s njom po želji, pa će
je, kad izađemo iz bloka *with*, Python automatski zatvoriti.

Jednom kada imamo objekt koji predstavlja pi.txt, koristimo metodu *read()* da
čitamo sadržaj datoteke i pohranimo ga u varijablu *sadrzaja*. Kada ispišemo
vrijednost *sadrzaja* vidimo cijeli sadržaj datoteke.

Kada proslijedite samo naziv datoteke kao što je *pi.txt* u funkcije *open()
Python je pokušava pronaći u direktoriju u kojem se nalazi program. Međutim,
ponekad želimo otvoriti datoteku koja nije u istom direktoriju kao programska
datoteka. Primjerice, sve Python datoteke pohranimo u mapi projekta u kojoj se
nalazi druga mapa, Podaci, u koju spremamo sve datoteke s kojima radimo. Iako se
mapa Podaci nalazi u mapi u kojoj je i program, ako proslijedimo funkciji
open()* samo imena datoteke, program neće raditi. U svojem okruženju imamo
datoteku *pi2.txt* koja je identična ovoj postojećoj, ali se nalazi u mapi
*Podaci*. Kada je pokušamo otvoriti, dobit ćemo poruku o grešci.

In [None]:
with open('pi2.txt') as file_object:
    sadrzaj = file_object.read()
print(sadrzaj)

Da bi Python otvorio datoteku iz neke druge mape, uz naziv datoteke moramo
proslijediti i putanju. Kako se mapa *Podaci* nalazi u istoj mapi u kojoj je i
program, možemo koristiti relativnu putanju. Relativna putanja datoteke
prosljeđuje Pythonu informaciju da traži lokaciju u odnosu na mapu u kojoj je
pohranjen trenutni program.

In [None]:
with open('Podaci/pi2.txt') as file_object:
    sadrzaj = file_object.read()
print(sadrzaj)

Ponekad želimo koristiti i apsolutne putanje koje predstavljaju lokaciju u
odnosu na operativni sustav, a ne trenutnu mapu. Ako iz programa želimo vidjeti
apsolutnu putanju prema mapi u kojoj se program nalazi, možemo iskoristiti
funkciju *getcwd()* iz modula *os* koja vraća test s apsolutnom putanjom.
Iskoristimo ga da otvorimo datoteku pi2.txt korištenjem pune putanje. Kako su
apsolutne putanje dosta duže, nerijetko se u programima spremaju u zasebne
varijable koje se kasnije koriste u funkciji *open()*.

In [None]:
import os

putanja = os.getcwd()
print ('Trenutna putanja je: ' + putanja)

putanja += '/Podaci/pi2.txt'
print ('Nova putanja je: ' + putanja)

with open(putanja) as file_object:
    sadrzaj = file_object.read()
print(sadrzaj)

Pomoću apsolutnih putanja možemo čitati datoteke s bilo kojeg mjesta na
računalu. Zasada je najjednostavnije da datoteke s podatcima spremamo u istu
mapu kao i programske datoteke ili, ako ih ima puno, da to bude podmapa tako da
možemo koristiti relativne putanje.

Kada čitamo datoteku, često želimo pregledavati svaki redak zasebno, tražiti
određene informacije ili možda izmijeniti određeni tekst. Primjerice, ako imamo
datoteku s meteorološkim podatcima i želimo uzeti samo retke u kojima postoji
riječ *sunčano* u opisu dana. Možemo koristiti petlju *for* za pregledavanje
redaka jedan po jedan.

In [None]:
datoteka = 'pi.txt'
with open(datoteka) as file_object:
    for line in file_object:
        print(line)

Ime datoteke koju čitamo spremamo u varijablu *datoteka*. To je uobičajena
konvencija pri radu s datotekama. Budući da varijabla *datoteka* ne predstavlja
stvarnu datoteku, već samo tekst naziva datoteke, lako možemo zamijeniti
'pi.txt' drugom datotekom s kojom želimo raditi. Nakon što smo pozvali *open()*,
objekt koji predstavlja datoteku pohranjuje se u varijablu *file_object*. Ponovo
koristimo sintaksu *with* kako bismo Pythonu omogućili ispravno otvaranje i
zatvaranje datoteke. Za ispis sadržaja datoteke prolazimo kroz svaki redak i
ispisujemo ga. Primijetite da je Python dodao prazne retke između zapisa. Prazni
redci se pojavljuju zbog nevidljivog znaka za novi redak u našoj datoteci. Kako
naša naredba *print* dodaje novi redak kod svakog poziva, na izlazu imamo dva
nova retka umjesto jednog. To možemo popraviti ako iskoristimo metodu *rstrip()*
koja briše prazne i nevidljive znakove s kraja teksta, odnosno, u ovom slučaju,
s kraja svakog retka.

In [None]:
datoteka = 'pi.txt'
with open(datoteka) as file_object:
    for line in file_object:
        print(line.rstrip())

Kada koristimo *with*, objekt koji vraća funkcija *open()* dostupan je samo
unutar njegova bloka. Ako želimo zadržati pristup sadržaju datoteke izvan bloka
*with*, možemo retke datoteke spremiti u listu te tu listu kasnije koristiti
bilo gdje.

In [None]:
datoteka = 'pi.txt'
with open(datoteka) as file_object:
    lines = file_object.readlines()
    
for line in lines:
    print(line.rstrip())

Metoda *readlines()* uzima sve linije teksta u objektu i pretvara ih u listu.

<br><div class="alert alert-info"><b>Vježba</b></div></br>

Kreirajte novu tekstualnu datoteku u mapi *Dan 4* (**New**/**Text File**) i
napišite nekoliko redaka koji opisuju što ste naučili o Pythonu do sada.  
Započnite svaku liniju izrazom "U Pythonu možete...".  
Klikom miša na **untitled.txt** u vrhu prozora promijenite naziv datoteke u
python.txt.  
Ne zaboravite nakon toga spremiti datoteku (**File**/**Save**).  
Napišite program koji čita datoteku i ispisuje ono što ste napisali tri puta.
 
1.  Ispišite sadržaj čitanjem cijele datoteke.
2.	Ispišite sadržaj čitanjem red po red.
3.	Ispišite sadržaj izvan bloka *with*.

<br><div class="alert alert-info"><b>Kraj</b></div></br>