# Ficheros

## Apertura y cierre de ficheros

Para leer un fichero necesitamos "abrirlo" y obtener un objeto de tipo fichero. Para ello se utiliza la función `open` que recibe como primer argumento la **ruta** del fichero.

La ruta permite localizar el fichero. Puede ser:
- ruta **relativa** al propio directorio en el que está trabajando Python (**working directory/folder**). El caso más habitual es únicamente el nombre del fichero o incluir algún directorio tal que se pueda navegar desde el directorio actual hasta ese fichero.
- ruta **absoluta**: no depende del directorio de trabajo.

Ejemplo de cómo abrir un fichero en modo lectura usando `open`:

```python
with open(filename, 'r') as f:
    # en este punto utilizaríamos f para leer el fichero
    read_data = f.read()
```

La llamada a `open` puede llevar más argumentos:

```
open(file, mode='r', buffering=-1, encoding=None, errors=None,
     newline=None, closefd=True, opener=None)
```

- Los valores más relevantes para `mode` son:

    - `'r'` modo lectura
    - `'w'` modo escritura
    - `'b'` modo binario: lee/escribe bytes y no realiza ningún proceso de codificación/decodificación
    - `'t'` modo texto

    Las opciones `b` y `t` se pueden combinar (como prefijo) a los modos `r` y `w`.

- El argumento `encoding` sólo tiene sentido en modo texto (no en binario) y puede ser una cadena con el nombre de un encoding (ejemplos: `'UTF-8'` y `'latin1'`).

- El argumento `newline`, también usado en modo texto, tiene que ver con cómo se procesan los cambios de línea sea en lectura sea en escritura. Mirar el manual para más detalles (lamentablemente, no todos los sistemas operativos generan el mismo tipo de cambio de línea, algunos de tipo `'\r'`, otros `'\n'` e incluso algunos `'\r\n'`.

### ¿Abrir y cerrar el fichero con `open` y `close`?

Una alternativa a utilizar:

```python
with open(filename, ...) as f:
    # en este punto utilizaríamos f para leer el fichero
```

es:

```python
f = open(filename, ...)
# en este punto utilizaríamos f para leer el fichero
f.close()
```

Pero es **preferible** utilizar `with`. Citando el [manual de Python](https://docs.python.org/3/tutorial/inputoutput.html#reading-and-writing-files):

> It is good practice to use the `with` keyword when dealing with file objects. The advantage is that the file is properly closed after its suite finishes, even if an exception is raised at some point. Using with is also much shorter than writing equivalent `try-finally` blocks.

Digamos que con `with`:

- Nunca te olvidas de que se cierre el fichero. Se cierra automáticamente al salir del bloque.
- Muy importante: si por cualquier motivo se produce un error (una excepción), con `with` se cerrará el fichero. Esto podría no suceder con la otra alternativa si por culpa de la excepción no se ejecuta el código de `f.close()`.


## Lectura de datos del fichero

Una vez abierto el fichero, podemos leer **todo su contenido** con el método `read`:

```python
with open(filename, 'r') as f:
    read_data = f.read()
    print("El contenido íntegro del fichero es:",read_data)
```

Pero, cuando los ficheros son enormes o porque simplemente nos convenga leerlo línea por línea, podemos iterar directamente sobre el objeto fichero, en cuyo caso irá dándonos los datos **línea por línea**:

```python
with open(filename, 'r') as f:
    for linea in f:
        print(linea)
```

**Nota:** normalmente las líneas leídas del fichero contienen el cambio de línea al final, de manera que las líneas van a salir impresas con líneas en blanco de por medio, a menos que usemos `print(linea,end="")`.

## Lectura de datos en formato CSV

Es probable que si lees ficheros en [formato .csv](https://es.wikipedia.org/wiki/Valores_separados_por_comas) lo hagas directamente desde la biblioteca [pandas](https://pandas.pydata.org) utilizando los [dataframe](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.html).

También es posible utilizar el módulo csv (ver [enlace](https://docs.python.org/3/library/csv.html)) como en el siguiente ejemplo:

In [19]:
import csv

with open('notas.csv', newline='') as csvfile:
    spamreader = csv.reader(csvfile, delimiter=';', quotechar='|')
    for row in spamreader:
        print(repr(row)) # observa que lee TODO COMO CADENAS

['Nombre', 'Grupo', 'Par1', 'Par2', 'Clase', 'Practicas']
['Alf', 'A', '6.13', '8.25', '8.83', '6.5']
['Alien', 'B', '3.4', '5.5', '6.17', '4.5']
['Asterix', 'B', '6.95', '3', '7.2', '8.25']
['Bart Simpson', 'C', '4.95', '1.1', '0', '0']
['Batman', 'C', '7.25', '8.75', '9.92', '10']
['Bob Esponja', 'C', '2.2', '0.75', '0', '2.5']
['Bugs Bunny', 'A', '1.75', '', '1.67', '']
['Buzz Lightyear', 'A', '4.7', '4.95', '8.33', '10']
['Capitan Sparrow', 'A', '2.25', '0.25', '6.11', '4']
['Captain America', 'A', '2.95', '2.45', '7.22', '7.5']
['Catwoman', 'C', '8.75', '8.75', '10', '10']
['Chewbacca', 'B', '6.15', '2', '2.67', '3']
['Darth Vader', 'A', '7.15', '7.1', '10', '10']
['Eduardo Manostijeras', 'B', '1.45', '0.85', '5', '0']
['Forrest Gump', 'A', '3.5', '0.35', '1.94', '0']
['Freddy Krueger', 'B', '5.55', '4.05', '5.8', '7.25']
['Frodo', 'B', '2.8', '0.55', '4.33', '0']
['Gandalf', 'B', '9.25', '9.75', '9.63', '10']
['Garfield', 'C', '9.15', '9.7', '10', '9.5']
['Gollum', 'B', '6.1', '3

## Escritura en ficheros

Una vez abierto un fichero en modo escritura, podemos escribir en él utilizando métodos como `write`, como `writelines`:

In [8]:
lineas = ["uno","dos","tres"]
with open("prueba.txt", 'w') as f:
    for i in range(10):
        f.write(f'escribo un {i}') # write NO añade \n!!!!
    f.writelines(lineas) # TAMPOCO añade \n!!!!!!
    
# vamos a abrir el fichero a ver si está lo que hemos escrito:
with open("prueba.txt", 'r') as f:
    contenido = f.read()
    print(contenido)

escribo un 0escribo un 1escribo un 2escribo un 3escribo un 4escribo un 5escribo un 6escribo un 7escribo un 8escribo un 9unodostres


In [10]:
# ahora con \n
lineas = ["uno","dos","tres"]
with open("prueba.txt", 'w') as f:
    for i in range(10):
        f.write(f'escribo un {i}\n')
    f.writelines(linea+'\n' for linea in lineas) # listas intensionales...
    
# vamos a abrir el fichero a ver si está lo que hemos escrito:
with open("prueba.txt", 'r') as f:
    contenido = f.read()
    print(contenido)

escribo un 0
escribo un 1
escribo un 2
escribo un 3
escribo un 4
escribo un 5
escribo un 6
escribo un 7
escribo un 8
escribo un 9
uno
dos
tres



## Ficheros StringIO

En algunos casos nos gustaría usar las mismas operaciones que sobre un fichero pero sin crear un fichero tal cual sino trabajando en la memoria del ordenador:

In [11]:
txt = """uno
dos
tres"""

print(txt)

uno
dos
tres


In [12]:
from io import StringIO

with StringIO(txt) as f:
    for line in f:
        print(line, end="")

uno
dos
tres

In [14]:
d = int(input("De qué valor quieres la tabla de multiplicar? "))
with StringIO("contenido inicial") as f:
    for i in range(10):
        f.write(f'{i} x {d:2} = {i*d:3}\n')
    tabla = f.getvalue()
print(tabla)

De qué valor quieres la tabla de multiplicar? 5
0 x  5 =   0
1 x  5 =   5
2 x  5 =  10
3 x  5 =  15
4 x  5 =  20
5 x  5 =  25
6 x  5 =  30
7 x  5 =  35
8 x  5 =  40
9 x  5 =  45



**Nota:** El ejemplo anterior (y prácticamente cualquier ejemplo) se podría haber realizado sin utilizar `StringIO`. Puede que `StringIO` no lo utilices jamás, la idea es que se puede utilizar **como un fichero**. Por tanto, si tienes código que espere un fichero y quieres el resultado en memoria sin pasar por disco puede ser útil.