# Lab 3: Funciones y módulos. Entrada y salida de ficheros
## 1. Funciones
### 1.1. Definiendo funciones
Una función es un bloque de código reutilizable que realiza una tarea específica. 
Las funciones son útiles porque permiten hacer programas más grandes mejorando la modularidad de los mismos. ¿Recuerdas Divide y vencerás?

Como hemos visto Python ofrece funciones built-in o incorporadas para una multitud de tareas, como por ejemplo *print()*, que imprime mensajes por la salida estándar, o *input()*, que recoge una entrada. 

Además de estas funciones predefinidas, el lenguaje Python te permite especificar tus propias funciones. A estas funciones se les llama *funciones definidas por el usuario* (en contraposición a built-in).

Si recuerdas, en el pasado hemos definido las funciones así:

In [None]:
def dime_hola():     # El nombrado de funciones sigue las mismas normas que el de variables.
    print("Hola")    # Los parámetros son opcionales (pero hay que seguir usando paréntesis)
    return           # La función puede devolver un valor explícito (si no, devuelve None). 

### 1.2. Llamando a las funciones
Para llamar a una función una vez que ha sido definida, todo lo que hay que hacer es escribir su nombre y el de los argumentos que queramos pasarle:

In [None]:
dime_hola() #La función no admite argumentos, así que no le paso ninguno...

Si hago que la función *dime_hola* admita un argumento: 

In [None]:
def dime_hola(nombre):
    print("Hola,",nombre)

#Ahora puedo llamarla con el argumento que yo quiera
dime_hola("Alex")

### 1.3. Paso por referencia
En Python todo paso de variables (parámetros) a una función es **por referencia**. Esto significa que si se cambia una variable 

In [None]:
##Cadena
def cambia_cadena(cadena):
    print('La cadena dentro de la función antes de cambiarla es:', cadena)
    cadena = cadena + " [MUTADA]"
    print('La cadena dentro de la función después de cambiarla es:', cadena)
    return

mi_cadena = "Esta es una cadena que va a mutar dentro de la función"
print('La cadena antes de llamar a la función es:', mi_cadena)
cambia_cadena(mi_cadena)
print('La cadena después de llamar a la función es:', mi_cadena)

print('#######')

def cambia_lista(lista):
    print('La lista dentro de la función antes de cambiarla es:', lista)
    lista.append('5')
    print('La lista dentro de la función después de cambiarla es:', lista)
    return

mi_lista = [1,2,3,4]
print('La lista antes de llamar a la función es:', mi_lista)
cambia_lista(mi_lista)
print('La lista después de llamar a la función es:', mi_lista)

### 1.4. Parámetros (o argumentos) obligatorios,  por defecto y claves de argumento
Los argumentos obligatorios o requeridos de una función son aquellos que se pasan a la función en el orden en el que están definidos. Si tratamos de invocar la función sin estos argumentos la ejecución fallará. 

In [None]:
def imprime(cadena, nombre, despedida):
    print('Hola ' + nombre +', esta es tu cadena: "' + cadena + '". ' + despedida)
    return
imprime() #Llamamos a la función sin los argumentos "cadena", "nombre" y "despedida"


In [None]:
#Por el contrario, si uso:
imprime("Quo Vadis?", "Alex", "Hasta luego!")
#Ya funciona!

Si se quiere evitar el error al llamar a una función sin los parámetros necesarios, hay que usar los llamados **parámetros por defecto"**.

Estos parámetros, que se especifican en la interfaz de la función, asignan valores por defecto a un argumento cuando en la llamada a la función no hayan sido especificados.

In [None]:
def imprime(cadena="Et tu, Brute?", nombre="Lucía", despedida="Bye bye!"):
    print('Hola ' + nombre +', esta es tu cadena: "' + cadena + '". ' + despedida)
    return
imprime() #Llamamos a la función sin los argumentos "cadena", "nombre" y "despedida", pero ahora funciona! 

Las claves de argumento se definen en las llamadas a la función. Permiten identificar los argumentos usando no el orden en el que aparecen, sino el nombre del parámetro. 
Esto permite saltarse argumentos o usarlos sin emplear el orden de definición:

In [None]:
#Aqui puedo variar el orden de llamada especificando el nombre de los argumentos
imprime(nombre="Juan", despedida="Chao!", cadena="Tu quoque, Brute, fili mi")

#Pero si no uso argumentos clave, el orden es el esperado:
imprime("Chao!", "Tu quoque, Brute, fili mi", "Juan")

#Usando claves de parámetro y argumentos por defecto:
imprime("Memento Mori", despedida="See you!")


### 1.5. Funciones anónimas
Las funciones lambda o anónimas (sin nombre) permiten emplear una **sintaxis abreviada** para declarar funciones de una sóla expresión (línea). Son muy útiles en algunos casos para declarar procedimientos sencillos, para los cuales no es necesario usar una sintaxis tan verbosa como la habitual. 

Las funciones anónimas no se declaran usando la palabra reservada **def**: por el contrario, emplearemos la palabra reservada **lambda** para definirlas. Además, estas funciones no hacen uso de `return`: se sobreentiende que devuelven el resultado de evaluar la expresión que contienen.

Por ejemplo, si quisiéramos ordenar la siguiente lista por longitud de los elementos, podríamos pasar una función `lambda` como parámetro `key` al método built-in `sorted` que hemos visto anteriormente.

In [None]:
lista = ['CGTA', 'ATCGATA', 'ATCGATAATCGATA', 'TCGAATCGATA', 'ATCATCGATA', 'CGAT', 'CGAA']

In [None]:
#Orden ascendente
#Cuidado, no ordena lexicográficamente! ¿Cómo lo harías?
sorted(lista, key=lambda elemento: len(elemento))

In [None]:
#Orden descendente
sorted(lista, key=lambda elemento: len(elemento), reverse=True)

In [None]:
##También puedo declarar una función lambda y usarla en distintas partes del código:
##Por ejemplo, si quisiera ordenar las cadenas por el número de 'T's que contienen:
sort_by_gs = lambda cadena: cadena.count('T')
print(sorted(lista, key=sort_by_gs))
print(sorted(lista, key=sort_by_gs, reverse=True))

# 2. Entrada y salida de ficheros
Al igual que leemos de la entrada estándar usando la función `input` y escribimos en la salida estándar empleando `print`, una tarea muy útil es hacer lo mismo en ficheros que se guardan en el almacenamiento secundario (por ej., el disco duro). Esto nos va a permitir salvar y recuperar información entre distintas sesiones o ejecuciones de nuestro código y es la forma más simple de **base de datos** (y la única que veremos en este curso).

## 2.1 Abrir y cerrar ficheros
La manipulación más básica de ficheros de datos incluye la **apertura** y el **cerrado** de los mismos.
Antes de leer o escribir en un fichero, es necesario abrirlo. Para ello se emplea la función built-in *open*, que devolverá un **objeto de tipo fichero** que será empleado para llamar a otras funciones asociadas al mismo.
Cada fichero contará además con un puntero de fichero, que es una variable asociada al mismo que marca la posición por la que se va leyendo/escribiendo.

La interfaz de esta función es la siguiente
```python
fichero = open(nombre_fichero [, modo_de_acceso][, buffering])
```
1. nombre_fichero: Cadena que contiene el nombre del fichero al que se quiere acceder.
2. modo_de_acceso (opcional): Determina el modo en el que se accede al fichero: lectura, escritura, adjuntar...
3. buffering (opcional). Activa/desactiva el buffer de lectura/escritura. No lo usaremos.

**Los modos de acceso que manejaremos son los siguientes:**
1. `r` :  El fichero se abre en modo sólo lectura. El puntero de fichero se coloca al inicio.
2. `r+` : El fichero se abre en modo lectura/escritura. El puntero de fichero se coloca al inicio.
3. `w` :  El fichero se abre en modo sólo escritura. El puntero de fichero se coloca al inicio. Sobreescribe el fichero si este existe.
4. `w+`:  El fichero se abre en modo escritura/lectura. Sobreescribe el fichero si este existe. Si no existe, crea uno nuevo. 
5. `a` : El fichero se abre en modo adjuntar. El puntero de fichero se coloca al final si es que éste existe. Si no, crea un nuevo fichero para ser escrito.
6. `a+`: El fichero se abre en modo adjuntar y lectura. El puntero de fichero se coloca al final si es que éste existe, abriéndolo en modo adjuntar. Si no, crea un nuevo fichero en modo lectura/escritura.

**Una vez abierto el fichero, en cualquier momento puedes ejecutar las siguientes operaciones sobre el objeto fichero:**
1. `fichero.closed`: Devuelve *true* si el fichero está cerrado, y falso en caso contrario.
2. `fichero.mode`: Devuelve el modo en el que se abrió el fichero.
3. `fichero.name`: Devuelve el nombre del fichero.

Cuando hayas terminado de operar sobre el fichero, recuerda **siempre** llamar a la función built-in *close* para terminar de guardar o leer la información que te encontrases escribiendo/leyendo. Una vez llamada esta función, no podrás seguir escribiendo en el fichero. 

## 2.2 Escribiendo en los ficheros
Contamos con la función built-in `write` para escribir en los ficheros una vez hayan sido abiertos. En esta asignatura nos limitaremos a escribir cadenas, aunque podríamos escribir datos en binario directamente. 
Ejemplo: 

In [1]:
fo  = open("dialogo_casual_alumnos_bioinformatica.txt", "w+") # Abro el fichero en modo escritura (no existía)
fo.write("- La expresividad de Python para el manejo de cadenas de texto es impresionante!\n- Cierto! A pesar de ser un lenguaje interpretado, merece la pena sacrificar rendimiento por la comodidad que supone para implementar muchas de las tareas típicas de nuestra amada disciplina, la genómica!\n- Qué razón tienes, pardiez!") # Añado dos líneas de un diálogo ficticio.
fo.close() # Cierro el fichero

## 2.3 Leyendo desde ficheros
La función `read` lee una cadena desde un fichero que ha sido abierto. `read` admite un único argumento, un número entero que indica el número de bytes que se quieren leer desde el fichero, a partir de la posición en la que se encuentre el puntero de fichero. Una vez leída la información, se avanza el puntero de fichero tantos bytes como se hayan leído. Si no se indica el número de bytes, se lee todo lo que se pueda, hasta encontrar el final de fichero.

In [2]:
# Abrimos el fichero que guardamos previamente
fo = open("dialogo_casual_alumnos_bioinformatica.txt", "r")
cadena_1 = fo.read(80) # Leo 80 caracteres
cadena_2 = fo.read() # Leo todo lo restante
print('cadena_1:')
print(cadena_1)
print('cadena_2:')
print(cadena_2.strip()) # Elimino caracteres no alfanuméricos al comienzo y al final de cadena_2
fo.close() #Cierro el fichero

cadena_1:
- La expresividad de Python para el manejo de cadenas de texto es impresionante!
cadena_2:
- Cierto! A pesar de ser un lenguaje interpretado, merece la pena sacrificar rendimiento por la comodidad que supone para implementar muchas de las tareas típicas de nuestra amada disciplina, la genómica!
- Qué razón tienes, pardiez!


In [3]:
print(cadena_1)

- La expresividad de Python para el manejo de cadenas de texto es impresionante!


## 2.4 tell y seek
Las funciones `tell` y `seek` complementan la funcionalidad de escritura y lectura de ficheros.
1. `tell()`: informa de la posición actual dentro del puntero de fichero. Dicho de otra manera, nos dice dónde dentro del fichero ocurrirá la próxima lectura o escritura.
2. `seek(offset)`: cambia la posición del puntero de fichero a aquella indicada por el argumento offset, dado como posición absoluta.

In [5]:
# Open a file
fo = open("dialogo_casual_alumnos_bioinformatica.txt", "r+")
cadena = fo.read(80)
print("He leído el siguiente texto: %s" % cadena)

# Comprobar posición del cursor/puntero
posicion = fo.tell()
print ("El cursor está ahora en la posición : ", posicion)

# Reposicionamos el puntero al inicio del fichero de nuevo
#Vuelve a la posición inicial
print("Vuelvo a la posición 0...")
fo.seek(0)
cadena = fo.read(80) # Vuelvo a leer y...
print("He leído el siguiente texto: %s" % cadena)

print("Posicionando el cursor en 288")
posicion = fo.seek(288)
print("Ok, estoy en %d" % posicion)
cadena = fo.read()
print("He leído el siguiente texto: %s" % cadena)
# Terminado, podemos cerrar el fichero
fo.close() 

He leído el siguiente texto: - La expresividad de Python para el manejo de cadenas de texto es impresionante!
El cursor está ahora en la posición :  80
Vuelvo a la posición 0...
He leído el siguiente texto: - La expresividad de Python para el manejo de cadenas de texto es impresionante!
Posicionando el cursor en 288
Ok, estoy en 288
He leído el siguiente texto: - Qué razón tienes, pardiez!


## 2.5 writelines, readlines
Las funciones `readlines` and `writelines` son funciones que se ejecutan sobre el descriptor de fichero y sirven para eso, para leer y escribir líneas, respectivamente, (trozos de texto separados por retornos de carro) en un fichero!

`readlines` devuelve una lista con todas las líneas leídas.

In [6]:
def imprimir_lineas(lineas):
    for i, linea in enumerate(lineas):
        print(i, linea)

In [7]:
fo = open('dialogo_casual_alumnos_bioinformatica.txt', 'r')
imprimir_lineas(fo.readlines())

0 - La expresividad de Python para el manejo de cadenas de texto es impresionante!

1 - Cierto! A pesar de ser un lenguaje interpretado, merece la pena sacrificar rendimiento por la comodidad que supone para implementar muchas de las tareas típicas de nuestra amada disciplina, la genómica!

2 - Qué razón tienes, pardiez!


Podemos usar `readlines/writelines` para modificar las líneas de un fichero rápidamente.

Por ejemplo, he aquí unos versos de García Lorca:

In [8]:
fo = open("bodas.txt", "r+") # r+ leer y escribir
lineas = fo.readlines()
#Imprimimos las líneas que hemos leído:
for i, linea in enumerate(lineas):
    print(i, linea)

0 La luna deja un cuchillo

1 abandonado en el aire,

2 que siendo acecho de plomo

3 quiere ser dolor de sangre.


Análogamente, a `writelines` se le pasa una lista con las líneas que se quiere escribir:

In [9]:
#Ojo! Hay que añadir los retornos de carro explícitamente
mas_lineas = ["\n¡Dejadme entrar! ¡Vengo helada", 
              "\npor paredes y cristales!", 
              "\n¡Abrid tejados y pechos", 
              "\ndonde pueda calentarme!"]
lineas = ['\n'] + lineas + mas_lineas #Añado un salto de línea inicial!
fo.writelines(lineas)
fo.close()

In [10]:
#Ahora vuelvo a leer :
fo = open("bodas.txt", "r")
lineas = fo.readlines()
for i, linea in enumerate(lineas):
    print(i, linea)

0 La luna deja un cuchillo

1 abandonado en el aire,

2 que siendo acecho de plomo

3 quiere ser dolor de sangre.

4 La luna deja un cuchillo

5 abandonado en el aire,

6 que siendo acecho de plomo

7 quiere ser dolor de sangre.

8 ¡Dejadme entrar! ¡Vengo helada

9 por paredes y cristales!

10 ¡Abrid tejados y pechos

11 donde pueda calentarme!


# Ejercicio 1

Define una función `inv_comp(cadena)` a la que le pases una secuencia de nucleótidos y calcule su inversa complementaria
- A <---> T
- C <---> G

In [4]:
def inv_comp(cadena):
    rev = reversed(cadena)
    result = ""
    print(rev)
    for c in rev:
        if c == 'A':
            result+='T'
        elif c == 'C':
            result+='G'
        elif c == 'T':
            result+='A'
        else:
            result+='C'
    return result
    

In [5]:
vc_oric = 'atcaatgatcaacgtaagcttctaagcatgatcaaggtgctcacacagtttatccacaacctgagtggatgacatcaagataggtcgttgtatctccttcctctcgtactctcatgaccacggaaagatgatcaagagaggatgatttcttggccatatcgcaatgaatacttgtgacttgtgcttccaattgacatcttcagcgccatattgcgctggccaaggtgacggagcgggattacgaaagcatgatcatggctgttgttctgtttatcttgttttgactgagacttgttaggatagacggtttttcatcactgactagccaaagccttactctgcctgacatcgaccgtaaattgataatgaatttacatgcttccgcgacgatttacctcttgatcatcgatccgattgaagatcttcaattgttaattctcttgcctcgactcatagccatgatgagctcttgatcatgtttccttaaccctctattttttacggaagaatgatcaagctgctgctcttgatcatcgtttc'

In [6]:
inv_comp(vc_oric)

<reversed object at 0x7fa3d4085860>


'CCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCC'

# Ejercicio 2
Los ficheros _.fasta_ son ficheros de texto para la representación de secuencias de nucleótidos o proteínas. En la carpeta donde está este notebook, he puesto un fichero llamadao _oric.fasta_, échale un ojo, te espero. 
1. Como has podido ver, los ficheros fasta pueden contener varias secuencias, que suelen ir precedidas por una descripción de la secuencia en cuestión, indicada por el caracter `>`. 
2. En concreto, las descripciones de este fichero indican que contiene los orígenes de replicación del _Vibrio Cholerae_ y de la _Thermotoga petrophila_ (otra bacteria). 

__Pregunta__: Implementa una función llamada `salva_inv_comp_fasta(nombre_fichero)` que:
1. Abra el fichero que se pasa como argumento.
2. Recorra las líneas del fichero y, para cada secuencia, y haciendo uso de la función del ejercicio 1, calcule su inversa complementaria. 
3. Guarde las conversión en otro archivo con el mismo formato, _nombre_fichero_convertido.fasta_. 
4. Devuelva una lista con las cadenas convertidas. 