# Repaso de conceptos básicos de Python

Para poder aprovechar este curso es necesario dominar algunos conceptos básicos de Python. Vamos a refrescarlos y hacer un breve repaso de su uso:

- **Estructuras de datos:** tipos de datos que se pueden utilizar. Algunos son sencillos, como un número entero, y otros complejos, como puede ser conjunto de datos formado por mi nombre, DNI, fecha de nacimiento y dirección.
- **Estructuras de control de flujo:** la secuencia de pasos no siempre es lineal. Por ejemplo, un proceso puede variar de acuerdo a si tengo un archivo FASTA o uno FASTQ.
- **Estructuras de iteración:** iterar es repetir. Muchas veces lo que tenemos que hacer con los datos es sencillo, pero hace falta repetirlo muchas veces. A veces la cantidad de veces que se repite algo está predeterminado; otras, depende de alguna condición que se determina en el momento.
- **Funciones:** sirven para encapsular código y dejarlo disponible para volver a usarlo, y no tener que escribir ese paso cada vez que uno lo vuelve a necesitar.
- **Formas de "comunicarse" con el exterior:** Casi cualquier programa va a necesitar leer o escribir archivos, mostrarnos resultados por la pantalla, o en algunos casos conectarse a una base de remota
- **Bibliotecas:** no es una parte esencial del lenguaje, pero son indispensables. Son repositorios de funciones, y a veces también datos, que nos evitan tener que escribir un programa para cada tarea. Biopython, por ejemplo, es una biblioteca grande que permite realizar muchas tareas bioinformáticas sin tener que programarlas de cero. 

## Estructuras de datos

Comencemos repasando los tipos de datos más sencillos, números y cadenas de caracteres, con algunos ejemplos.

In [1]:
num1 = 12
num1

12

In [2]:
num1 * 10

120

In [3]:
import math
math.sqrt(num1)

3.4641016151377544

In [4]:
type(num1)

int

In [5]:
type(math.sqrt(num1))

float

In [6]:
texto1 = "Hola"
texto2 = "Mundo"
texto1 + " " + texto2

'Hola Mundo'

In [7]:
type(texto1)

str

#### Métodos para cadenas de caracteres

Como otros lenguajes de programación, Python realiza muchas actividades usando funciones. Por ejemplo, en los celdas anteriores *type()* y *sqrt()* son ejemplos de funciones. Existe otra herramienta para realizar operaciones que son los métodos. Lo que diferencia a una función de un método es que el segundo es un tipo de operación asociado a un tipo particular de construcción llamada objeto. Los objetos son tipos de datos complejo que realizan actividades muy específicas. Un ejemplo de objeto en Python son las cadenas de caracteres.

Las cadenas de caracteres tienen métodos para realizar tareas que son especificas de este tipo de datos. Por ejemplo, convertir todas las letras de una cadena de caracteres a mayúsculas o a minúsculas.

In [8]:
texto3 = "Una Cadena Que incluye letras y 1234"
texto3 = texto3.upper()
texto3

'UNA CADENA QUE INCLUYE LETRAS Y 1234'

In [9]:
print(texto3.lower())

una cadena que incluye letras y 1234


También hay métodos que toman uno o más argumentos. Por ejemplo, el método para hacer reemplazos.

In [10]:
texto3.replace('C', 'K')

'UNA KADENA QUE INKLUYE LETRAS Y 1234'

## Funciones

Vamos a construir una función para calcular esta fórmula:

\begin{equation}
\frac{(2+v1)^3}{v2}
\end{equation}

Supongamos que esta fórmula hace algún cálculo que vamos a precisar muchas veces. Una de las ventajas de programar es que podemos generalizar tareas y reutilizarlas. Es el momento de transformar nuestra fórmula en una función:

In [2]:
def mi_funcion_1(v1, v2):
    "Una función para calcular nuestra primera fórmula. Tiene dos parámetros requeridos: v1 y v2, que deben ser números"
    resultado = ((2+v1)**3)/v2
    return(resultado)

help(mi_funcion_1)

Help on function mi_funcion_1 in module __main__:

mi_funcion_1(v1, v2)
    Una función para calcular nuestra primera fórmula. Tiene dos parámetros requeridos: v1 y v2, que deben ser números



Revisemos en detalle lo que hicimos:

* La palabra clave *def* indica que lo que sigue es la definición de una función
* La linea que sigue está indentada a la derecha. Esto no es simplemente prolijidad, es **esencial** para que el interprete de Python entienda cuál es el contenido de la función.
* Esta segunda línea describe lo que hace la función, es importante para documentar.
* "mi_funcion_1* es el nombre con el que vamos a llamar a la función desde otras partes de código.
* *v1* y *v2* son los parámetros de la función. Son los valores con los que quiero calcular mi fórmula.
* Le asignamos a la variable *resultado* el valor calculado con la fórmula.
* Con *return()* indicamos que la salida de nuestra función es el valor que quedó guardado en *resultado*.

In [3]:
mi_funcion_1(3,4)

31.25

Podemos guardar el resultado en otra variable:

In [4]:
calculo_1 = mi_funcion_1(3,4)
calculo_1

31.25

Y hasta podemos llamar a la ayuda de Python pasando como argumento el nombre de la función:

In [5]:
help(mi_funcion_1)

Help on function mi_funcion_1 in module __main__:

mi_funcion_1(v1, v2)
    Una función para calcular nuestra primera fórmula. Tiene dos parámetros requeridos: v1 y v2, que deben ser números



No sería raro que queramos usar nuestra función para calcular muchos pares v1, v2 diferentes. no de a uno, como hicimos hasta ahora. Para esto vamos a necesitar una estructura de datos nueva, y una forma de iterar, es decir, repetir algo la canitdad de veces que sea necesario.

Para esto precisamos conocer que es una lista en Python.

## Listas en Python


Una lista es una estructura de datos organizados en una secuencia. Crear una lista en Python es fácil:


In [6]:
v_lista_1 = [1, 3, 3, 4, 5, 6]
v_lista_1

[1, 3, 3, 4, 5, 6]

También se puede crear una lista vacía, a la que más adelante se le agregar datos:

In [7]:
lista_vacia = list()
lista_vacia

[]

In [8]:
type(v_lista_1)

list

Una de las ventajas de las listas es que nos permiten mantener agregados datos que forman un conjunto. Otro ventaja es que son conjuntos ordenados. Esto sirve para recuperar elementos específicos de la lista.

Por ejemplo, para recuperar el primer elemento de la lista:

In [9]:
v_lista_1[0]

1

**Atención, atención**: las secuencias en Python comienzan en cero. Esto es causa de infinitas confusiones con R, donde las secuencias comienzan en uno.

Ahora recuperamos los tres primeros elementos de la lista:

In [10]:
v_lista_1[0:3]

[1, 3, 3]

Atención, atención: "0:3" es la forma de inidicar una secuencia, de principio a fin. En este caso la secuencia 0, 1, 2. Intituitivamente uno esperaría que la secuencia incluyera al 3, pero no. Esto tiene una justificación, pero no la vamos a ver por ahora. En este momento lo importante es recordar que si uno quiere recuperar hasta el elemento n inclusive, la descripción de la secuencia tiene que llegar hasta n+1.


Otro ejemplo. De esta manera recuperamos el segundo elemento y los que le siguen:

In [11]:
v_lista_1[-1]

6

Y este otro:

In [12]:
v_lista_1[-2:]

[5, 6]

Estas son formas de recuperar el último elemento de la lista, o una fracción de la lista empezando desde atrás. Observar que en estos casos el último elemento es -1. Esto es así porque no tiene sentido expresarlo como -0.

### Funciones y métodos para listas

A continuación van algunos ejemplos. La mayoria son auto-explicativos, para otros busquen en la ayuda de Python. Hagan pruebas con otros argumentos. Y como siempre busquen cometer errores y tratar de entender qué pasó.

In [13]:
len(v_lista_1)

6

In [14]:
v_lista_1

[1, 3, 3, 4, 5, 6]

In [15]:
v_lista_1.reverse()

In [16]:
v_lista_1.count(3)

2

In [17]:
v_lista_1.count(2)

0

**Prestar mucha atención a lo que sigue:**

In [18]:
lista_temp = v_lista_1

In [19]:
lista_temp

[6, 5, 4, 3, 3, 1]

In [20]:
v_lista_1[2] = 10

In [21]:
v_lista_1

[6, 5, 10, 3, 3, 1]

In [22]:
lista_temp

[6, 5, 10, 3, 3, 1]

¡También se modificó lista_temp!

Probablemente esto no es lo que queríamos. La manera correcta de crear una copia nueva de la lista es:

In [23]:
lista_temp = v_lista_1.copy()

In [24]:
v_lista_1[2] = 3

In [25]:
lista_temp

[6, 5, 10, 3, 3, 1]

In [26]:
v_lista_1

[6, 5, 3, 3, 3, 1]

¡Ahora sí!

También se pueden crear listas conteniendo cadenas de caracteres o de valores lógicos, o de otros tipos de datos, pero en una lista todos deben ser del mismo tipo.

Estas listas son válidas:

In [27]:
['enero', 'febrero', 'marzo', 'abril']

['enero', 'febrero', 'marzo', 'abril']

In [28]:
[True, True, False, True, True, False]

[True, True, False, True, True, False]

## Iteraciones

Supongamos que queremos usar nuestra función *mi_funcion_1* para dos listas de números. La función tiene dos parámetros, *v1* y *v2*, por lo que necesitaremos dos listas de números, una para cada parámetro. De esta manera, primero calculamos la función para los primeros elementos de ambas listas -ese es nuestro primer par de argumentos-, luego para los dos segundos elementos, y así hasta terminar la lista.

La lista que creamos antes, *v_lista_1*, la usaremos como uno de los argumentos, y creamos otra para el segundo argumento:

In [34]:
v_lista_2 = [1, 2, 6, 8, 10, 12]

Ahora necesitamos alguna estructura que nos permita recorrer estas dos listas, un elemeno de cada una por vez, hasta llegar al final. Es decir, necesitaríamos hacer algo así, pero automático:

In [35]:
mi_funcion_1( v_lista_1[0], v_lista_2[0])
mi_funcion_1( v_lista_1[1], v_lista_2[1])
mi_funcion_1( v_lista_1[2], v_lista_2[2])
#...
mi_funcion_1( v_lista_1[5], v_lista_2[5])


42.666666666666664

En Python, y en otros lenguajes, la estructura que se usa para esto es un loop *for*. Vamos a empezar con una versión simple, pero que funciona.

¿Qué hicimos? Le pedimos a *for* que recorra una lista y que en cada paso la variable *i* tome un valor sucesivo de esa lista, desde cero hasta cinco.

Prestar atención: el código que queremos repetir dentro del loop va indentado.

Funciona, pero podemos hacer varias mejoras. La primera: es un poco molesto tener que explicitar la lista completa. Para simplificar esto usaremos la función *range()*:

In [37]:
range(6)

range(0, 6)

In [39]:
for i in range(6):
    print(mi_funcion_1(v_lista_1[i], v_lista_2[i] ))

27.0
62.5
20.833333333333332
27.0
34.3
42.666666666666664


¡Mejor! Pero se puede mejorar aún más. No hace falta que conozcamos de antemano el largo de las listas. Hay una función para determinar el largo, *len()*, y como las listas son del mismo largo, con determinar uno es suficiente:

In [40]:
for i in range(len(v_lista_1)):
     print(mi_funcion_1(v_lista_1[i], v_lista_2[i] ))

27.0
62.5
20.833333333333332
27.0
34.3
42.666666666666664


De esta manera conseguimos un çodigo más abstracto y general. 

Si quisiéramos asignar los valores a una lista nueva, en lugar de imprimir los valores, podemos hacerlo usando el método *append()* de las listas:

In [41]:
lista_resultado = list()
for i in range(len(v_lista_1)):
    resultado = mi_funcion_1(v_lista_1[i], v_lista_2[i] )
    lista_resultado.append(resultado) 
   
print(lista_resultado)

[27.0, 62.5, 20.833333333333332, 27.0, 34.3, 42.666666666666664]


## Repaso

Al llegar aquí deberías haber recordado y refrescado estos puntos:

* Cómo construir una función sencilla.
* Cómo crear listas listas
* Entender para que sirve una lista y hacer algunas operaciones con ellas.
* Poder hacer un iteración usando el comando *for*