#Fitxers

En aquest quadern treballarem els fitxers, per poder emmagatzemar informació fora dels programes.

Comencem definint una llista de cadenes, la primera estrofa del poema de J.V.Foix [És quan dormo que hi veig clar](https://www.ccma.cat/jordi-cervera/jv-foix-es-quan-dormo-que-hi-veig-clar/post/3024791/).

In [None]:
poema_Foix = [
    'És quan plou que ballo sol',
    'Vestit d\'algues, or i escata,',
    'Hi ha un pany de mar al revolt',
    'I un tros de cel escarlata,',
    'Un ocell fa un giravolt',
    'I treu branques una mata,',
    'El casalot del pirata',
    'És un ample gira-sol.',
    'És quan plou que ballo sol',
    'Vestit d\'algues, or i escata.'
]


A continuació, escriurem el contingut d'aquesta llista al fitxer **Foix.txt**

In [None]:
with open(r'Foix.txt', 'w') as fp:
    for vers in poema_Foix:
        fp.write("%s\n" % vers)
    print('Fet.')

Fet.


Podem comprovar que el fitxer s'ha creat prement la icona Files al menú gràfic de l'esquerra.

A continuació, obrirem el fitxer que acabam de crear.

In [None]:
path = 'Foix.txt'
f = open(path)

Per defecte, el fitxer s'obre en mode de només lectura. Podem tractar el manejador del fitxer `f` com una llista i iterar sobres les línies.

In [None]:
for line in f:
    print(line)

És quan plou que ballo sol

Vestit d'algues, or i escata,

Hi ha un pany de mar al revolt

I un tros de cel escarlata,

Un ocell fa un giravolt

I treu branques una mata,

El casalot del pirata

És un ample gira-sol.

És quan plou que ballo sol

Vestit d'algues, or i escata.



Les línies venen del fitxer amb els seus marcadors de final de línia (EOL, End Of Line). El codi següent obté la llista de línies sense marcadors EOL.

In [None]:
lines = [x.rstrip() for x in open(path)]
lines

['És quan plou que ballo sol',
 "Vestit d'algues, or i escata,",
 'Hi ha un pany de mar al revolt',
 'I un tros de cel escarlata,',
 'Un ocell fa un giravolt',
 'I treu branques una mata,',
 'El casalot del pirata',
 'És un ample gira-sol.',
 'És quan plou que ballo sol',
 "Vestit d'algues, or i escata."]

Quan usam open per crear objectes file, és important tancar explícitament el fitxer quan l'hem acabat d'usar. Tancar el fitxer allibera i retorna els recursos al sistema operatiu.

In [None]:
f.close()

Una de les formes de tancar automàticament els fitxers oberts és usar la sentència `with`.

In [None]:
with open(path) as f:
    lines = [x.rstrip() for x in f]

Quan escrivim

`f = open(path, 'w')`

cream un nou fitxer, sobreescrivint-lo si ja hi era.

També hi ha el mode **x**, que crea un fitxer en mode d'escriptura però retorna un error si el fitxer ja existeix.

La taula següent mostra els modes possibles dels fitxers.

|Mode|Descripció|
|----|----------|
|r|Només lectura|
|w|Només escriptura; crea un nou fitxer, esborrant les dades que hi hagués amb el mateix nom de fitxer.|
|x|Només escriptura; crea un nou fitxer si no hi era; retorna error si ja existia|
|a|Afegeix a un fitxer que existeix; crea el fitxer si no hi era|
|r+|Lectura i escriptura|
|b|S'afegeix al mode per indicar fitxers binaris ('rb' o 'wb')|
|t|Mode text (decodifica els octets automàticament a Unicode). És el mode per defecte si no s'especifica. S'afegeix t a altres modes ('rt' o 'xt')|

En els fitxers de lectura, alguns dels mètodes més usats són `read`, `seek` i `tell`.

`read` retorna un cert nombre de caràcters del fitxer. El que constitueix un caràcter ho determina la codificació del fitxer (per exemple, UTF-8)
o simplement octets directes si el fitxer s'obre en mode binari.

In [None]:
f = open(path)
f.read(10)

'És quan pl'

In [None]:
f2 = open(path, 'rb')
f2.read(10)

b'\xc3\x89s quan p'

El mètode read avança la posició del manejador (handle) del fitxer la quantitat d'octets llegits.

El mètode `tell` dona la posició actual.

In [None]:
f.tell()

11

In [None]:
f2.tell()

10

Tot i que s'han llegit 10 caràcters del fitxer, la posició és 11 perquè han calgut aquests octets per formar els 10 caràcters amb la codificació per defecte.

Es pot confirmar la codificació per defecte en el mòdul `sys`.

In [None]:
import sys
sys.getdefaultencoding()

'utf-8'

El mètode seek seek canvia la posició dins el fitxer a l'octet indicat.

In [None]:
f.seek(3)

3

In [None]:
f.read(4)

' qua'

Finalment, recordem tancar tots els fitxers.

In [None]:
f.close()
f2.close()

Per escriure text en un fitxer, podem usar els mètodes de `file` `write` o `writelines`.

In [None]:
with open('tmp.txt', 'w') as handle:
    handle.writelines(x for x in open(path) if len(x) > 1)
with open('tmp.txt') as f:
    lines = f.readlines()
lines

['És quan plou que ballo sol\n',
 "Vestit d'algues, or i escata,\n",
 'Hi ha un pany de mar al revolt\n',
 'I un tros de cel escarlata,\n',
 'Un ocell fa un giravolt\n',
 'I treu branques una mata,\n',
 'El casalot del pirata\n',
 'És un ample gira-sol.\n',
 'És quan plou que ballo sol\n',
 "Vestit d'algues, or i escata.\n"]

Acabem aquest quadern amb una taula dels mètodes de `file` més usats.

|Mètode|Descripció|
|-----|----------|
|read([size])| Retorna dades del fitxer com a cadena (*string*) amb l'argument opcional size que indica el nombre d'octets que s'han de llegir.|
|readlines([size])| Retorna una llista de línies del fitxer, amb l'argument opcional de quantes.|
|write(str)|Escriure al fitxer la cadena passada com a argument|
|writelines(strings)| Escriu la seqüència de cadenes al fitxer|
|close()| Tancar el manejador (*handle*) del fitxer|
|flush()| Traspassa el buffer intern d'entrada/sortida al disc|
|seek(pos)| Moure a la posició del fitxer indicada (entera)|
|tell()| Retorna la posició actual al fitxer com a enter|
|closed| *True* si el fitxer està tancat