# Manejo de Ficheros

* [Operaciones básicas con ficheros](#u3c4.1)
* [Lectura de ficheros](#u3c4.2)
* [Escritura en ficheros](#u3c4.3)
* [Añadir información a un fichero](#u3c4.4)
* [Códigos](#u3c4.5)
* [Ejemplos](#u3c4.6)
* [Ejercicios](#u3c4.7)


Vamos a describir procedimientos para las siguientes cuestiones:

* Leer el contenido de un fichero
* Escribir información en un fichero
* Añadir información a un fichero

Se van a utilizar la ficheros: `Recuerde2.txt`, `numeros.txt`, `a18b.txt`,  `a18b_utf-8.txt`, `listado.txt` y `palabras_español_utf-8.txt`

__Referencia__

https://docs.python.org/3/tutorial/inputoutput.html#reading-and-writing-files


<a id="u3c4.1"></a>
## Operaciones básicas con ficheros

Nombre | Uso | Efecto
:-- | :-- | :--
open  con r| fichero = open(nombre_archivo,'r') | abre el archivo "nombre_archivo" para lectura, genera una secuencia con las líneas del archivo y asigna al objeto creado a la variable "fichero" 
open con w    |  fichero = open(nombre_archivo,'w') | abre o crea el archivo "nombre_archivo" para escritura - borra el contenido del archivo si ya existiera
close | fichero.close() | cierra el archivo que se había abierto y elimina el objeto "fichero"

<a id="u3c4.2"></a>
## Lectura de ficheros

Se genera un objeto con la función `open()` que toma por argumentos el nombre de un fichero y el parámetro `r` cuando se quiere leer (r -> read -> leer)

In [None]:
poema = open('../data/Recuerde2.txt', 'r', encoding = 'utf8')

In [None]:
type(poema)

Esto objeto es un iterable y cada elemento es una línea del fichero. Vamos a guardar la información en una lista: cada línea sera un elemento de la lista que creemos  

In [None]:
texto = []
for linea in poema:
    texto.append(linea)
texto

Al acabar esta operación es muy importante cerrar el fichero

In [None]:
poema.close()

Veamos que pasa si imprimimos una línea detrás de otra

In [None]:
for p in texto:
    print(p)

Es destacable que cada elemento, aparte de tener los caracteres de cada línea contiene el carácter que se representa por los símbolos `\n`. Esto es un símbolo "invisible" con el que se indica que hay que empezar una nueva línea. Por esta razón aparece una línea en blanco al imprimir los elementos de la lista. El carácter que se representa con `\n` produce un línea nueva.

¿Como podemos deshacernos de él?  

Veamos dos procedimientos

__*Primer procedimiento:*__ añadir todos los caracteres de cada línea menos el último

In [None]:
texto_nuevo = []
for p in texto:
    texto_nuevo.append(p[:-1])
texto_nuevo

Veamos ahora que, efectivamente, ya no se imprime una línea en blanco. 

In [None]:
for p in texto_nuevo:
    print(p)

__*Segundo procedimiento:*__ utilizar el método `.strip()` de las cadenas (https://docs.python.org/3/library/stdtypes.html#string-methods)

Cuando no se utiliza ningún argumento, este método elimina los caracteres en "blanco" delante y detrás de la cadena. En particular el carácter "invisble" correspondiente al cambio de línea, `\n`.

Algunos de los carateres "invisbles" son:` `, `\t`, `\n`, `\r`, `\x0b`y `\x0c`.

In [None]:
import string
string.whitespace

Con este segundo método haríamos lo siguiente: 

In [None]:
texto_nuevo2 = []
for p in texto:
    texto_nuevo2.append(p.strip())
texto_nuevo

Si quiero que cada verso esté en una lista cuyos elementos son las palabras del correspondiente verso

In [None]:
lista = []
poema = open('../data/Recuerde2.txt')
for linea in poema:
    verso = linea.strip()
    #lista.append(verso)
    lista.append(verso.split(' '))
poema.close()
lista

Hay que destacar que primero hay que quitar el caracter de cambio de linea con el método `.strip()`. Después se descompone la corresponiente cadena  a cada verso en palabras que formarán una lista con el método `.split()`. En este caso los cortes se hacen por la cadena del un espacio en blanco `' '`.  


### Ejemplos

1. El fichero ``numeros.txt`` contiene datos para lectura. Leemos su contenido de diferentes maneras y obtendremos el resultado de diferentes operaciones con los números que contiene el fichero.

In [None]:
fichero=open('../data/numeros.txt','r')

for linea in fichero:
    print(linea.strip())
    print(type(linea))

fichero.close()

Observad, de nuevo, la diferenca de no utilizar o utilizar el método para cadenas `.strip()`

In [None]:
fichero = open('../data/numeros.txt','r')

c1 = ''
for linea in fichero:
    c1 += linea
print(c1)
    
fichero.close()

In [None]:
fichero = open('../data/numeros.txt','r')

c2 = ''
for linea in fichero:
    c2 += linea.strip()  
print(c2)

fichero.close()

Ahora escribimos una lista con los elementos del objeto que genera `open()` cuando no se "limpian" los elementos de ese objeto iterable con el método `.srtrip()`.

In [1]:
fichero = open('../data/numeros.txt','r')

contenido = []
for linea in fichero:
    contenido.append(linea)  

print(contenido)
print("hola"+"\n"+"adios")

fichero.close()

['\n', '0\n', '1\n', '2\n', '3\n', '4\n', '5\n', '6\n', '7\n', '8\n', '9\n', '3\n', '4\n', '7\n', '3\n', '4\n', '7\n', '3\n', '4\n', '7\n', '3\n', '4\n', '7\n', '3\n', '4\n', '7\n', '3\n', '4\n', '7\n', '3\n', '4\n', '7\n', '3\n', '4\n', '7\n', '3\n', '4\n', '7\n', '3\n', '4\n', '7\n']
hola
adios


Necesitamos quitar los saltos de línea que aparecen. El método `.strip()` elimina los espacios en blanco y los saltos de línea de una cadena

In [2]:
fichero=open('../data/numeros.txt','r')

contenido=[]
for linea in fichero:
    contenido.append(linea.strip())  

print(contenido)

fichero.close()

['3', '4', '7']


Hemos conseguido construir una lista con las líneas que contenía el archivo. Ahora trabajaremos con ellas  

In [None]:
fichero = open('../data/numeros.txt','r')

contenido=[]

for linea in fichero:
    contenido.append(linea.strip()) 
suma = 0

for elemento in contenido[1:]:
    suma += int(elemento)

fichero.close()

print(suma/(len(contenido[1:])))

In [None]:
contenido

¿Quien es suma?

Definimos una función `suma(lista)` que tome el fichero anterior y devuelva suma de los números que contiene el fichero.

In [None]:
def suma(lista):
    fichero = open(lista,'r')
    contenido = []
    for linea in fichero:
        contenido.append(linea.strip()) 
    suma = 0
    for elemento in contenido[1:]:
        suma += int(elemento)
    fichero.close()
    return suma

In [None]:
suma("../data/numeros.txt")

In [None]:
fichero = open('../data/numeros.txt','r')

contenido = []
for linea in fichero:
    contenido.append(linea.strip()) 

s = int(contenido[1])+int(contenido[len(contenido)-1])  

fichero.close()

print(s)

¿Quien es `s`?

Definimos una función `suma1(lista)` que tome el fichero anterior y devuelva `s`

In [None]:
def suma1(lista):
    fichero = open(lista,'r')
    contenido = []
    for linea in fichero:
        contenido.append(linea.strip()) 
    s = int(contenido[1]) + int(contenido[len(contenido)-1])  
    fichero.close()
    return(s)

In [None]:
suma1("../data/numeros.txt")

2. El fichero `a18b.txt` contiene el listado de palabras del diccionario RAE que comienzan por `a` y tienen exactamente 18 letras.

In [None]:
fichero = open('../data/a18b.txt','r')

fichero es un objeto que contiene las líneas de `a18b.txt`. Se puede iterar sobre él:

In [None]:
for linea in fichero:
    print(linea)

In [None]:
fichero.close()

Aunque Python ha imprimido las palabras contenidas en el fichero, ha dejado entre ellas una línea que no hemos pedido.

Si creamos una lista con las palabras de `a18.txt` veremos por que ocurre esto.

In [None]:
fichero = open('../data/a18b.txt','r')
palabras18 = []
for u in fichero:
    palabras18.append(u)
    
fichero.close()

palabras18

Vemos que al final de cada palabra aparece el símbolo `\n`. Ese símbolo tiene la función de indicarle a Python que salte a la línea siguiente.

Nosotros no lo necesitamos. Por ello, podemos crear la lista palabras18 de dos formas:

In [None]:
fichero = open('../data/a18b.txt','r')
palabras18 = []
for u in fichero:
    palabras18.append(u[:-1])
    
fichero.close()

palabras18

O también:

In [None]:
fichero = open('../data/a18b.txt','r')
palabras18 = []
for u in fichero:
    palabras18.append(u.strip())
    
fichero.close()

palabras18

El método `strip()` para cadenas elimina los espacios en blanco y saltos de línea al principio y final de la palabra.

<a id="u3c4.3"></a>
## Escritura en ficheros

Nombre | Uso | Efecto
:-- | :-- | :--
open con w    |  fichero = open(nombre_archivo,'w') | abre o crea el archivo "nombre_archivo" para escritura creando el objeto "fichero" - borra el contenido del archivo si ya existiera
write  | fichero.write(texto) | añade una línea con la cadena "texto" al archivo que se ha abierto usando el objeto "fichero"

Ahora se utliza la función `open()` con el argumento `w` (w -> write -> escribir).

In [None]:
numeros1_w = open('../data/numeros1.txt', 'w')
numeros1_w.write('\n')
for p in range(3):
    numeros1_w.write(str(p) + '\n')

Al invocar `open()` con la opción `w`, se crea un fichero con el nombre especificado

**Atención:** si hubiera un fichero con el nombre especificado, desaparecería.

Como antes, una vez acabado le trabajo requerido, se debe cerrar el fichero. 

In [None]:
numeros1_w.close()

Veamos si se ha guardado la información como se deseaba

In [None]:
numeros1_r = open('../data/numeros1.txt', 'r')

In [None]:
numeros1 = []
for linea in numeros1_r:
    if len(linea.strip()) == 0:
        numeros1.append(linea.strip())
    else:
        numeros1.append(int(linea.strip()))
numeros1

In [None]:
numeros_r.close()

### Ejemplos

1. El fichero `numeros.txt` contiene números. Creamos un fichero nuevo `divisiones.txt` donde escribimos cada uno de los números del fichero numeros.txt dividido entre 2 

In [None]:
fichero_n = open('../data/numeros.txt','r')

contenido = []
for linea in fichero_n:
    contenido.append(linea.strip())  

fichero_n.close()
        
fichero_d = open('../data/divisiones.txt', 'w')

fichero_d.write('Resultados de la división\n\n')

for u in contenido[1:]: 
    fichero_d.write(str(int(u)/2)+'\n')
        
fichero_d.close()

Observad que

In [None]:
contenido

Ahora se puede abrir el fichero `divisiones.txt` para ver que efectivamente contiene los números decimales que se obtienen al dividir por dos los números del fichero `numeros.txt`. Observad que la primera línea contiene el texto `Resultados de la división`, y después hay una línea en blanco; además la última también está en blanco.

**Recordad**

- Una vez que abrimos un archivo para escritura se borra su contenido.

- No debemos olvidar cerrar los ficheros una vez que hemos trabajado con ellos, podrían dañarse si no lo hacemos.

- Es posible leer o escribir ficheros en directorios distintos del directorio de trabajo.  Por ejemplo, si trabajos en el directorio **CNP**, contenido en el directorio **Clases** y queremos leer el archivo **apuntes.txt** del directorio **EDM** que también se encuentra en **Clases**, debemos escribir

      '../EDM/apuntes.txt'

2. Creamos el fichero `a18_mayusculas.txt` donde escribimos las palabras de `a18b.txt` en letras mayúsculas. El contenido de este fichero lo volcamos, en un ejemplo anterior, en la lista `palabras18`.



In [None]:
fichero = open('../data/a18_mayusculas.txt', 'w')

fichero.write('Palabras de 18 letras del idioma español en mayúsculas\n\n')
for u in palabras18:
    fichero.write(u.upper() + '\n')
    
fichero.close()

El fichero se guardará en el mismo directorio donde estamos trabajando.

<a id="u3c4.4"></a>
## Añadir información a un fichero

Ahora se utiliza la opción `a`

Nombre | Uso | Efecto
:-- | :-- | :--
open con a    |  fichero = open(nombre_archivo,'a') | abre o crea el archivo "nombre_archivo" para escritura creando el objeto "fichero" - no borra el contenido del archivo si ya existiera
write  | fichero.write(texto) | añade una línea con la cadena "texto" al final del archivo que se ha abierto para escritura

In [None]:
numeros_wa = open('../data/numeros.txt', 'a')

In [None]:
for p in range(3):
    q = p**2 + 3
    numeros_wa.write(str(q) + '\n')

In [None]:
numeros_wa.close()

In [None]:
numeros_wa_r = open('../data/numeros.txt', 'r')

In [None]:
numeros = []
for p in numeros_wa_r:
    numeros.append(p.strip())

numeros_wa_r.close()
numeros

<a id="u3c4.5"></a>
## Códigos

Linux o Mac suelen usar el código `utf-8` para su los ficheros se producen. Sin embargo, Windows suele usar `cp1252`. Por esta, razón a veces será necesario utilizadr la opción `encoding` con el valor `utf8` si estamos en Windows y el ficehro se ha creado en Linux o `cp1252` si el fichero se ha creado en Windows y estamos en Linux.

In [None]:
fichero = open('../data/a18.txt','r')
contenido = [elemento.strip() for elemento in fichero]
fichero.close()
contenido

En este fichero no se utliza el código `utf8`; utiliza el código `cp1252`

In [None]:
fichero = open('../data/a18.txt','r', encoding = 'cp1252')
contenido = [elemento.strip() for elemento in fichero]
fichero.close()
contenido

Para saber qué codigo se está utilizando usar la función `getpreferredencoding()` del módulo `locale`

In [None]:
import locale
locale.getpreferredencoding()

Cuando se utilicen alguno de los ficheros de este curso en un sistema Windows habrá que utilizar la opción `encoding = 'utf8'`.

<a id="u3c4.6"></a>
## Ejemplos

1. Tenemos el fichero `listado.txt` donde se almacena el listado de las personas matriculadas en un curso. El listado contiene un nombre por línea:

    Ana María Gómez Ramírez
    
    Abelardo Suarez López
    
    Carlos Pérez Manzano
    
    Azucena Pinto Rodríguez
    
    Miriam García Cuesta
    
    .......
    

Queremos realizar las siguientes acciones
- Leer el listado desde el fichero para crear una lista donde se almacenarán las notas
- Imprimir un listado de alumnos con su correspondiente nota en el archivo **notas.txt**

Abrimos el archivo para lectura

In [None]:
fichero = open('../data/listado.txt','r')

Creamos una lista con los nombres:

In [None]:
nombres = []
for linea in fichero:
    nombres.append(linea.strip())
    
fichero.close()

Creamos la lista `notas` con las notas correspondientes:

In [None]:
notas = [5,7.5, 6, 8, 4.5, 6, 3]

Creamos el archivo `notas.txt` con la función `open()`, escribimos en él con la opción `w` y cerramos el objeto `fichero` que acabamos de crear:

In [None]:
fichero = open('../data/notas.txt', 'w')

fichero.write('NOTAS'.rjust(15) + '\n\n')
for u in range(len(nombres)):
    fichero.write(nombres[u].ljust(30) + str(notas[u]).ljust(3) + '\n')
    
fichero.close()

2. Definir la función `palabra_aleatoria(nombre_fichero)` que devuelve una palabra escogida aleatoriamente del fichero `nombre_fichero`. Aquí, `nombre_fichero` es una cadena de texto con el nombre de un archivo que contiene una lista de palabras, una por línea.

In [None]:
def palabra_aleatoria(nombre_fichero):
    fichero = open(nombre_fichero, 'r')
    contenido = [u.strip() for u in fichero]
    fichero.close()
    from random import randint
    N = len(contenido)
    return contenido[randint(0, N - 1)] 

Llamamos la anterior para el archivo `palabras_español_utf-8.txt`

In [None]:
palabra_aleatoria('../data/palabras_español_utf-8.txt')

Como hemos dicho antes, si se produce un error, ejecutar la siguiente celda que permite conocer que codificación utiliza tu ordenador

In [None]:
import locale
locale.getpreferredencoding()

Si no devuelve `utf8`, habrá que utilizar `fichero = open(lista, 'r', encoding = 'utf8')` en la definición de la anterior función. Esta función devolverá `cp1252` en Windows.

3. Definir la función `palabra_aleatoria_5(nombre_fichero)` que devuelve una palabra de cinco letras escogida aleatoriamente del fichero `nombre_fichero`.

In [None]:
def palabra_aleatoria_5(nombre_fichero):
    while True:
        aux = palabra_aleatoria(nombre_fichero)
        if len(aux) == 5:
            break
    return aux

In [None]:
palabra_aleatoria_5('../data/palabras_español_utf-8.txt')

4. Definir la función `palabras(nombre_fichero,N)` que crea el fichero `Npalabras.txt`  que contiene `N` palabras, una por línea, escogidas aleatoriamente del fichero `nombre_fichero`. Observad que en cada llamada de la función `palabras()` el segundo parámetro es un número entero.

In [None]:
def palabras(nombre_fichero, N):
    # creamos la lista aux con N palabras escogidas aleatoriamente
    fichero = open(nombre_fichero, 'r', encoding = 'utf8')
    contenido = [u.strip() for u in fichero]
    fichero.close()
    M = len(contenido)
    from random import randint
    aux = [contenido[randint(0, M - 1)] for u in range(N)]
    
    # creamos el fichero con la lista de palabras de aux
    fichero = open(str(N) + '../data/palabras.txt', 'w')
    for u in aux[:-1]:
        fichero.write(u + '\n')
    fichero.write(aux[-1])
    fichero.close()

In [None]:
palabras('../data/palabras_español_utf-8.txt', 10)

5. Definir la función `mayor_longitud(nombre_fichero)` que devuelve la mayor longitud de las palabras contendias en el fichero `nombre_fichero`.

In [None]:
def mayor_longitud(nombre_fichero):
    fichero = open(nombre_fichero, 'r', encoding = 'utf8')
    contenido = [u.strip() for u in fichero]
    fichero.close()
    aux = [len(u) for u in contenido]
    return max(aux)

In [None]:
mayor_longitud('../data/palabras_español_utf-8.txt')

En los siguientes ejercicios, el archivo `nombre_fichero` es una cadena de texto con el nombre de un archivo que contiene una lista de números enteros, uno por línea.

6. Definir la función `mayor(nombre_fichero)` que devuelve el mayor de los números contenidos en el fichero `nombre_fichero`.

Busquemos primero qué código debemos usar en la función que nos piden.

In [None]:
fichero = open('../data/numeros.txt', 'r', encoding = 'utf8')
contenido = [u.strip() for u in fichero]
fichero.close()
print(contenido)

In [None]:
contenido_i = [int(u) for u in contenido if u != '']
print(contenido_i)

Se ha de eliminar el caso en el que tengamos una línea en blanco. Al utilizar el método `.striop()` la línea en blanco se convierte en una cadena vacia.

In [None]:
def mayor(nombre_fichero):
    fichero = open(nombre_fichero, 'r', encoding = 'utf8')
    contenido = [int(u.strip()) for u in fichero if u.strip() != '']
    fichero.close()
    return max(contenido)

In [None]:
mayor('../data/numeros.txt')

7. Definir la función `cuantos(nombre_fichero)` que devuelve la cantidad de  números contenidos en el fichero `nombre_fichero`.

In [None]:
def cuantos(nombre_fichero):
    fichero = open(nombre_fichero, 'r')
    contenido = [int(u.strip()) for u in fichero if u.strip() != '']
    fichero.close()
    return len(contenido)

In [None]:
cuantos('../data/numeros.txt')

8. Definir la función `media(nombre_fichero)`  que devuelve la media de los números contenidos en el fichero `nombre_fichero` con dos decimales.

In [None]:
def media(lista):
    fichero = open(lista, 'r')
    contenido = [int(u.strip()) for u in fichero if u.strip() != '']
    fichero.close()
    return round(sum(contenido)/len(contenido), 2)

In [None]:
media('../data/numeros.txt')

<a id="u3c4.7"></a>
## Ejercicios

1. Crear un archivo que contenga la tabla de multiplicar por 7 con el formato:

    7 x 1 =  7

    7 x 2 = 14

    7 x 3 = 21

    ...
    
    7 x 9 = 63 
    

2. Definir una función `palabra_larga(nombre_fichero)` que devuelva la palabra más larga en el fichero `nombre_fichero`. Utilizar el archivo `palabras_español_utf-8.txt`para probar la función.

3. Definir la función `palabra_aleatoria(nombre_fichero)` que devuelve una palabra escogida aleatoriamente del fichero `nombre_fichero`. Utilizar el archivo `palabras_español_utf-8.txt` para probar la función.
    
    Obs. Necesitamos la función `randint()` de la librería `random`. Utilizar la expresión **from random import randint** para cargar la librería.
    
4. Definir la función cifrar(mensaje, resultado) que lee un texto del archivo `mensaje.txt`, lo cifra y lo escribe en el fichero `resultado.txt`. Para el cifrado, a cada letra se le hace corresponder la siguiente en el orden alfabético y a la `z` la `a`. Los signos de puntuación no se cambian. El mensaje no contiene vocales con tilde.  

## U3.4.6 Cuestionarios de Moodle

[Estadística de una encuesta](https://moodle.upm.es/titulaciones/oficiales/mod/quiz/view.php?id=230409)