<img src="img/viu_logo.png" width="200"><img src="img/python_logo.png" width="250"> *Mario Cervera*

# Acceso a ficheros

## Ficheros

* *File* es un tipo de objeto predefinido en Python (*built-in*).
* Permite acceder a ficheros desde programas Python.
* Los ficheros son de un tipo especial:
    * Son *built-in*, pero no son ni *números*, ni *secuencias*, ni *mappings*. Tampoco responden a operadores en expresiones.
* La función *open* permite crear objetos de tipo fichero.

## Acceso para Lectura

Formato general para abrir un fichero:

```
afile = open(filename, mode)
```

* *mode* es opcional. Por defecto, los ficheros se abren en modo lectura.
* Los datos leidos de un fichero siempre se obtienen en formato *string*. Lo mismo ocurre con escritura.
* Los ficheros se deben cerrar invocando *close* (liberación de recursos).

In [None]:
# Lectura desde fichero usando método 'read'. Devuelve todo el contenido del fichero.
my_fichero = open('res/UnaLinea.txt')
print(my_fichero.read())
my_fichero.close()

In [None]:
# Lectura linea a linea a través del bucle 'for'.
my_fichero = open('res/VariasLineas.txt')
for linea in my_fichero:
    print(linea, end= '')
my_fichero.close()

In [None]:
# leer de un archivo a una lista.
my_fichero = open('res/VariasLineas.txt')
lineas = my_fichero.readlines()
my_fichero.close()

print(lineas)

* *close* autómatico con sentencia *with.* Esta es la forma habitual de leer de fichero en Python.

In [None]:
with open('res/VariasLineas.txt') as my_fichero:
    for linea in my_fichero:
        print(linea, end= '')

* Se puede abrir varios ficheros en un mismo *with*.

In [None]:
#abrir varios ficheros en el mismo with
ruta1 = 'res/UnaLinea.txt'
ruta2 = 'res/VariasLineas.txt'
with open(ruta1) as fichero1, open(ruta2) as fichero2:
    print(fichero1.readlines())
    print(fichero2.readlines())

## Modos de acceso

* Al crear un objeto de tipo *File* se puede espeficiar el modo de acceso (lectura/escritura).

| Modo Acceso | Descripción |
|:---------|:-----|
| r | Solo Lectura |
| w | Solo Escritura (Borra si el archivo ya existe) |
| x | Solo Escritura (Falla si el archivo ya existe) |
| a | Crea Fichero (Si existe lo abre y se añade al final) |
| r+ | Lectura y Escritura |

## Acceso para escritura

In [None]:
with open('res/FicheroParaEscritura.txt', 'w') as fichero:
    fichero.write('Cabecera\n')
    lista = [str(x) + '\n' for x in range(5)] # [0, 1, 2 ,3, 4]
    fichero.writelines(lista)

#### Buffering

* Por defecto, el texto que transfieres desde tu programa a un fichero no se guarda en disco inmediatamente. Se almacena en un buffer.
* Acciones como cerrar un fichero o invocar el método **flush** fuerzan que se transfiera el contenido del buffer a disco.

In [None]:
ruta = 'res/FicheroParaEscritura.txt'
fichero_write = open(ruta, 'w')
fichero_write.write('foo')

fichero_read = open(ruta, "r")
print(fichero_read.readlines())

fichero_write.flush()

print(fichero_read.readlines())

fichero_write.close()
fichero_read.close()

## Ficheros de texto y binarios

* Ficheros de **texto**.
   * Contenido en formato *string*.
   * Se lleva a cabo la (de)codificación Unicode automáticamente.


* Ficheros **binarios**.
   * Contenido en binario.
   * Permiten a los programas acceder al contenido de los ficheros sin ningún tipo de alteración.

* El tipo de acceso se especifica en el segundo argumento de la función *open*.

| Modo Acceso | Descripción |
|:---------|:-----|
| t | Acceso en modo texto (por defecto) |
| b | Acceso binario |

In [None]:
data = open('img/viu_logo.png', 'rb').read()
print(data[20:30])

## Archivos CSV

* Python permite leer datos de ficheros CSV y también escribir ficheros en este formato.
* Popular formato en ciencia de datos.

In [None]:
# tabla_operaciones.csv contiene valores separados por comas
import csv

with open("res/tabla_operaciones.csv") as fichero:
    data_reader = csv.reader(fichero, delimiter=',')
    for linea in data_reader:
        print(linea[0] + ' -- ' + linea[1])

## Archivos JSON

* JSON es un formato de intercambio de datos ampliamente utilizado.
* Permite la serializacion y deserialización de objetos Python para su almacenamiento y transmisión.
* Portable e independiente de lenguaje.
* Soportado por una amplia variedad de sistemas.

* Sintaxis muy cercana a diccionarios de Python, lo que facilita la traducción.

Ejemplo:

```
{
   'nombre_completo' : {
      'nombre': 'Pablo',
      'apellido': 'Garcia'
   },
   'trabajo' : ['desarrollador', 'manager'],
   'edad' : 40
}
```

In [None]:
# Conversion Python -> JSON.
import json

objeto_nombre_completo = dict(nombre='Pablo', apellido='Garcia')
persona = dict(nombre_completo=objeto_nombre_completo, trabajo=['desarrollador', 'manager'], edad=40)

objeto_json = json.dumps(persona)
print(objeto_json)

In [None]:
# Conversion JSON -> Python.
objeto_python = json.loads(objeto_json)
print(objeto_python)
#print(objeto_python['edad'])

## Ejercicios

1. Escribe una función que reciba una ruta de un fichero de texto y una cadena de caracteres a buscar y determine si la cadena aparece en el fichero.

2. Escribe una función que reciba una lista, una ruta destino y un número *n*. La función debe crear un fichero en la ruta especificada. El contenido del fichero serán los primeros *n* elementos de la lista.

3. Escribe una función que reciba una ruta de un fichero de texto devuelva un diccionario con la frecuencia de aparición de cada palabra. Ejemplo: un fichero que contenga la frase 'es mejor que venga que que no venga' devolverá el siguiente diccionario: {'es' : 1, 'mejor' : 1, 'que' : 3, 'venga' : 2, 'no' : 1}