# Tema 6

## Fitxers

Fins ara els nostres programes sempre han rebut la informació d'una única font: el teclat. Per altra banda a l'hora de
generar la informació només la sabem mostrar per pantalla.

Aquest fet suposa una limitació per al tipus de programes que podem construir, ja que la informació que produïm
es perd cada cop que tornem a executar el programa o tanquem l'ordinador.

Podem superar aquestes problemàtiques si sabem fer ús de fitxers.


## Que és un fitxer?

Abans de poder treballar amb fitxers, és important entendre què són i com els sistemes operatius moderns gestionen
alguns dels seus aspectes.

Bàsicament, un fitxer és un conjunt contigu de bytes usats per emmagatzemar dades. Aquestes dades s'organitzen en un
format específic i poden ser tan simples com una seqüència de text o tan complexes com l'executable d'un programa. Els
fitxers es poden emmagatzemar en memòria secundària (disc dur) i per tant la informació que hi guardem perdura més
enllà del temps que l'ordinador es troba encès.

Els fitxers de la majoria de sistemes moderns es componen de tres parts:

* **Capçalera**: metadades sobre el contingut del fitxer (nom de fitxer, organització interna, tipus, etc.).
* **Dades**: contingut del fitxer escrit pel creador o editor.
* **Final del fitxer** (EOF): caràcter especial que indica el final del fitxer, en el nostre cas aquest caràcter serà
 el caràcter buit "" (no confondre amb l'espai " ").



## Localització (Path)

Quan accedim a un fitxer del nostre sistema operatiu des d'un programa, és necessari indicar quin camí hem de seguir
de la localització on es troba el programa fins a arribar al fitxer. El camí o *path* del fitxer es representa en el nostre
programa amb un *string* a l'hora de construir un objecte de la classe fitxer. La localització d'un fitxer es
divideix en tres parts principals:

  * **Ruta de carpetes**: la ubicació de la carpeta al sistema de fitxers on les carpetes posteriors estan separades
  per una barra inclinada `/`. Per accedir a carpetes anteriors usarem el símbol `..`.
  * **Nom del fitxer**: el nom real del fitxer. Com a anècdota podem comentar que Windows no permetia noms iniciats
  amb punt fins la seva versió 10, ja que era un nom reservat per a fitxers del mateix sistema.
  * **Extensió**: el final del camí del fitxer marcat amb un símbol (.) ens serveix per indicar el tipus de fitxer. En
   cap cas condiciona el seu contingut, un fitxer amb extensió `.txt` pot tenir informació referent a l'estructura
   d'una imatge.
  
Els *paths* poden ser:
  
  * **Absoluts**: Respecte a l'arrel del sistema. El que coneixem com C: (Windows) o `/` (UNIX).
  * **Relatius**: Respecte a la carpeta on estem situats.
  
<pre><span></span>/  ← arrel (C: en windows)
│ 
├── path/ 
│   │
│   ├── to/ 
│   │   ├── main.py
│   │   └── cats.txt
│   │
│   ├── main2.py
│   │
│   └── dogs.txt 
│
└── animals.csv   </pre>

Si ens trobem en la carpeta **to** i volem accedir al fitxer **cats.txt** ho farem amb els següents _strings_:

    path_relatiu = "cats.txt"
    path_absolut = "/path/to/cats.txt"

Si ens trobem a la carpeta **path** i volem accedir al fitxer **cats.txt** ho farem amb els següents _strings_:

    path_relatiu = "to/cats.txt"
    path_absolut = "/path/to/cats.txt"

Si ens trobem a la carpeta **to** i volem accedir al fitxer **dogs.txt** ho farem amb els següents _strings_:

    path_relatiu = "../../animals.csv"
    path_absolut = "/path/dogs.txt"


## Us de fitxers a Python

Quan vulguem treballar amb un fitxer, el primer que hem de fer és obrir-lo. Això es fa invocant la funció integrada
`open` que té un únic argument obligatori que és el camí (*path*) cap al fitxer. `open` **ens retorna un objecte de
la classe** _file_.

```
fitxer = open("harry_potter.txt")  # el fitxer harry_potter es a la mateixa carpeta que el fitxer amb el codi
```

Després d’obrir un fitxer, el següent que aprendrem és com tancar-lo. Ho podem fer amb la sentència `close`:

```
fitxer.close() # tancam el fitxer 
```

**Advertència!!!** Hem d’assegurar-nos que un fitxer obert està tancat correctament.

És important saber que tancar el fitxer és la nostra responsabilitat com a programadors. En la majoria dels casos, un
cop finalitzat el programa o en el mètode en el qual s'ha obert el fitxer, aquest es tancarà. No obstant això, no hi
ha cap garantia que això succeeixi i podem tenir ocupacions de memòria no desitjades.

Assegurar-nos que el nostre codi es comporta d'una manera ben definida i no es dóna qualsevol comportament no
desitjat és una bona pràctica de programació.

Una de les maneres recomanades d'assegurar que un fitxer es tanca correctament és usant la següent estructura de codi:

```
with open('harry_potter.txt') as fitxer:
    # Processament del fitxer
```

La sentència `with` s'encarrega de tancar el fitxer automàticament, fins i tot en casos d’error. És recomanable usar
el bloc `with` sempre que sigui possible, ja que permet un codi més net i facilita el maneig de qualsevol error
inesperat.


## El mode d'un fitxer

A l'hora d'obrir un fitxer també necessitarem usar el segon argument del mètode open: `mode`. Aquest argument és un
_string_ que pot contenir diverses combinacions de caràcters per representar com volem obrir el fitxer. El valor per
defecte és `r`, que representa obrir el fitxer en mode de només lectura, tal com hem fet a l'exemple anterior.


<table class="table table-hover">
<thead>
<tr>
<th>Caracter</th>
<th>Significat</th>
</tr>
</thead>
<tbody>
<tr>
<td><code>'r'</code></td>
<td>Obre per a lectura ( per defecte)</td>
</tr>
<tr>
<td><code>'w'</code></td>
<td>Obre per a escriptura, sobrescriu el que teniem abans</td>
</tr>
<tr>
<td><code>'a'</code></td>
<td>Obre el fitxer en mode escriptura i afegeix la informació al final</td>
</tr>
<tr>
<td><code>'r+'</code></td>
<td>Obre el fitxer en mode lectura i escriptura</td>
</tr>
</tbody>
</table>



## Llegir i escriure en fitxers oberts

Un cop obert un fitxer, hi podem llegir o escriure informació. Hi ha diversos mètodes de la classe fitxer que es
poden usar per acomplir aquesta tasca:

<table class="table table-hover">
<thead>
<tr>
<th>Mètode</th>
<th>Funció</th>
</tr>
</thead>
<tbody>
<tr>
<td><code>read(1)</code></td>
<td>Llegeix des del fitxer en funció del nombre de bytes <code> size </code>. Si no es passa cap argument es llegirà tot el fitxer. Nosaltres com feim amb el text de teclat, llegirem els fitxers caracter a caracter.</td>
</tr>
<tr>
<td><code>readline(size=-1)</code></td>
<td> Llegeix com a màxim el nombre de <code> size </code> de caràcters de la línia. Si no es passa cap argument es llegirà tota la línia (o la resta de la línia).</td>
</tr>
<tr>
<td><code>readlines()</code></td>
<td> Llegeix les línies restants de l’objecte de fitxer i les retorna com a llista.</td>
</tr>
</tbody>
</table>

Ara ens centrarem en l’escriptura de fitxers. Igual que amb la lectura de fitxers, els objectes de fitxer tenen
diversos mètodes útils per escriure en un fitxer:

<table class="table table-hover">
<thead>
<tr>
<th>Mètode</th>
<th>Funció</th>
</tr>
</thead>
<tbody>
<tr>
<td><code>write(string)</code></td>
<td>Escriu el string en el fitxer. Ens hem d'ocupar de fer el salt de línia pel nostre compte.</td>
</tr>
<tr>
<td><code>writelines(seq)</code></td>
<td>Això escriu la seqüència al fitxer. No s'afegeix cap finalització de línia a cada element de la seqüència. Depèn
de nosaltres afegir les línies apropiades.</td>
</tr>
</tbody>
</table>

**Anem a veure alguns exemples**

Lectura de tots els caràcters d'un fitxer.


In [4]:
with open("harry_potter.txt", 'r') as harry:
  
  lletra = harry.read(1)
  
  while lletra != "": # Final de fitxer
    
    print(lletra, end="")
    lletra = harry.read(1)

Juro solemnemente que esto es una travesura
Me voy a la cama antes de que a alguno de los dos se os ocurra otra genial idea y acabemos muertos. O peor: expulsados
Dobby no mata, solo mutila o hiere de gravedad
Es Leviosa, no leviosa

In [7]:
with open("harry_potter.txt", 'r') as fitxer:
  
 for linia in fitxer:
        print(linia, end=" ")


Juro solemnemente que esto es una travesura
 Me voy a la cama antes de que a alguno de los dos se os ocurra otra genial idea y acabemos muertos. O peor: expulsados
 Dobby no mata, solo mutila o hiere de gravedad
 Es Leviosa, no leviosa 

Anem a veure com escriure

In [16]:
text = ["En", "un" , "agujero" , "en" , "el" , "suelo" , "habitaba" , "un" , "hobbit"]

with open("resultat.txt", 'w') as res:
  
  for element in text:
    res.write(element)
    res.write("\n")  

## Introducció a la serialització d'objectes

Quan programem, sovint necessitem **guardar informació** perquè es pugui reutilitzar més endavant. Per exemple, podem voler:

- Guardar la partida d’un joc.
- Desar una llista de tasques.
- Emmagatzemar dades d’un formulari per carregar-les després.

Per fer això, hem de **guardar els objectes de Python en un fitxer**, però els fitxers només entenen **text** o **bytes**, no objectes directament. Aquí és on entra la **serialització**.

## Què és la serialització?

**Serialitzar** vol dir convertir un objecte de Python (com una llista, un diccionari o una instància d’una classe) en un format que es pugui guardar en un fitxer (normalment bytes).

Així, més endavant, podem **deserialitzar** aquest contingut i reconstruir l’objecte original.

A Python existeix el mòdul `pickle` que té dues operacions:

   - `dump`: permet guardar un objecte en un fitxer ja obert.
   - `load`: permet carregar un objecte d'un fitxer ja obert. 

### Exemple senzill amb `pickle`

```python
import pickle

# Dades que volem guardar
dades = {"nom": "Anna", "edat": 21, "aficions": ["música", "excursions"]}

# Serialització: guardar al fitxer
with open("dades.pkl", "wb") as fitxer:
    pickle.dump(dades, fitxer)

# Deserialització: carregar del fitxer
with open("dades.pkl", "rb") as fitxer:
    dades_carregades = pickle.load(fitxer)

print(dades_carregades)
