# Primeros pasos en programación y en Python

Hoy en día Python es un lenguaje de programación extremadamente popular y que se usa en una variedad creciente de áreas. En el campo de la bioinformática la combinación R/Bioconductor ofrece una base de recursos muy grandes y especializados que por el momento supera lo que ofrece Python/Biopython. Sin embargo, hay un número creciente de aplicaciones bioinformáticas escritas en Python y la biblioteca Biopython permite hacer operaciones cada vez más sofisticadas con datos bioinformáticos.

Una ventaja importante de Python, y una de las causas de su popularidad, es que es un lenguaje poderoso y al mismo tiempo fácil de aprender. Es ideal para quienes se inician en la programación y se convirtió en la opción casi por defecto para aprender a programar. Por eso, en este curso, vamos a aprender primero a programar con Python.


## ¿Qué esperamos de un lenguaje de programación?

Un lenguaje de programación es un medio para interactuar con una computadora, en los casos específicos que nos interesan queremos que una computadora procese datos bioinformáticos para obtener alguna información nueva. 

Ahora bien, una planilla de cálculo también sirve para procesar datos y las más conocidas, Excel, LibreOffice, también se pueden programar ¿Cuál es la diferencia? La respuesta se pude resumir en dos palabras, flexibilidad y generalidad. 

Un lenguaje de programación de alto nivel, como Python o R, nos permite trabajar con cualquier tipo de datos que nos podamos encontrar y definir casi cualquier tipo de operación que necesitemos hacer con ellos. Para marcar el contraste, sería muy dificil usar una planilla de cálculo para almacenar un conjunto de secuencias de DNA y desde la misma planilla hacer un Blast contra Genbank, descargar los resultados y filtrarlos. Con un lenguaje de progrmación de uso general y las bibliotecas auxiliares apropiadas, es una tarea que se puede describir en pocas lineas de código.

La contrapartida es que programar requiere seguir unas reglas estrictas, no es posible por el momento dirigir a una computadora de manera conversacional, y abstracción. Estas dos características son las que hacen que mucha gente encuentre dificultades al aprender a programar. Trabajar con Python facilita el proceso de aprendizaje, y si se avanza de a poco y practicando mucho, no hay mayores dificultades en comprender como se programa, y descubrir que es una actividad muy estimulante.

## Los componentes de un lenguaje de programación

Un programa de computación es una serie de pasos donde describimos cuáles son los datos que queremos procesar, cuáles son los pasos que requiere el resultado que queremos lograr, definir si esa secuencia de pasos se puede modificar, cuántas veces queremos repetir algún paso y qué queremos hacer con los resultados. Casi todos los lenguajes de programación de alto nivel, y definitivamente Python y R, tienen los siguientes componentes para lograr esto:

* **Estructuras de datos**: tipos de datos que se pueden utilizar. Algunos son sencillos, como un número entero, y otros complejos, como puede ser conjunto de dayos formado por mi nombre, DNI, fecha de nacimiento y dirección.
* **Estructuras de control de flujo**: la secuencia de pasos no siempre es lineal. Por ejemplo, puedo un proceso puede variar de acuerdo a si tengo un archivo FASTA o un registro GBK.
* **Estructuras de iteración**: iterar es repetir. Muchas veces lo que tenemos que hacer con los datos es sencillo, pero hace falta repetirlo muchas veces.
* **Funciones**: sirven para encapsular código y dejarlo disponible para volver a usarlo, y no tener que escribir ese paso cada vez que uno lo vuelve a necesitar.
* **Formas de "comunicarse" con el exterior**: Casi cualquier programa va a necesitar leer o escribir archivos, mostrarnos resultados por la pantalla o en algunos casos conectarse a una base de remota
* **Bibliotecas**: no es una parte esencial de un lenguaje, pero son indispensables. Son repositorios de funciones y a veces también datos que nos evitan tener que escribir un programa para cada tarea. Biopython es una biblioteca grande y Bioconductor es un proyecto que suma más de 1000 bibliotecas para diferentes usos.

## Nos ponemos a trabajar: primeros comandos y tipos de datos básicos en Python

### Observen los siguientes comando, corranlos, cambiénlos y corranlos de nuevo

In [1]:
2+2

4

In [2]:
3*3

9

In [3]:
5**2

25

In [4]:
5/2

2.5

In [5]:
5//2

2

In [6]:
# EL resto o residuo de la división entero
5 % 2

1

In [7]:
(2+5) * 7

49

Estos fueron nuestros primeros comandos, y estuvimos usando Pyrhon como si fuera una calculadora. Interesante, pero no es algo que nos permita generalizar una operación, para eso podemos usar variables.

Pero antes escriban un comando que calcule esta fórmula:

\begin{equation}
\frac{(2+3)^3}{29}
\end{equation}

El resultado es 4.31034

Y después modifiquenla para que nos devuelva el valor entero del cociente

Ahora si, las variables. 

Una variable nos permite almacenar un valor en un "contenedor" y usarla o modificarla cuantas veces sea necesario. Vamos a crear una variable con el mombre "int1" y le asignamos el número 12.5:


In [8]:
int1 = 12.5

Ahora podemos usar *int1* para hacer cálculos:

In [9]:
int1 * 2

25.0

También podemos modificar el valor de *int1*

In [10]:
int1 = 3.4
int1 * 2

6.8

Nuestra variable *int1* es una variable de tipo real, o en la terminología de Python, un *float*: un número real de punto flotante:

In [11]:
type(int1)

float

En el comando anterior utilizamos por primera vez una función, *type()*. En este caso la función toma como argumento nuestra variable *int1* y nos devuelve su tipo. Veamos que pasa cuando le pasamos a *type()* como argumento un número entero:

In [12]:
type(3)

int

Modifiquemos nuestra fórmula anterior para incluir dos variables, *v1* y *v2*:

\begin{equation}
\frac{(2+v1)^3}{v2}
\end{equation}

In [13]:
# Ejecutar esto (sin el signo numeral):
# ((2+v1)**3)/v2

Dio un error ¿No?

Está bien. El objetivo inmediato era ver cómo es un mensaje de error. El intérprete de Python nos está avisando que *v1* no está definida. ¿Cómo se soluciona esto? Hace falta ejecutar dos comandos que le asignen valores a *v1* y *v2*:


In [14]:
v1 = 4
v2 = 9


In [15]:
((2+v1)**3)/v2

24.0

¡Ahora si funcionó!

Anteriormente habíamos usado Python como una calculadora, y vimos como calcular una potenciación, pero no una raíz. Esto es porque para calcular una raíz necesitamos una función, y todavía no habíamos visto ninguna, pero además, la función para calcular raíces cuadradas no forma parte del intérprete de Python, hay que cargar antes una biblioteca para hacr eso y que se llama *math*. Probemoslo:

In [16]:
import math
math.sqrt(3)

1.7320508075688772

Con las operaciones matemáticas básicas podríamos haber hecho esto:

In [17]:
3 ** (1/2)

1.7320508075688772

Pero no es tan cómodo o intuitivo

¿Y para calcular una raíz cúbica?

In [18]:
27 ** (1/3)

3.0

In [19]:
math.pow(27, 1/3)

3.0

La función *pow* de la biblioteca *math* sirve para calcular cualqier tipo de potenciaciones, incluyendo raíces.

### El tipo de dato "string"

Casi en cualquier programa que se nos ocurra en algún momento es necesario trabajar con texto. El tipo básico de datos que tiene Python para trabajar con texto son los *strings*.

Al igual que los tipos numéricos son muy sencillos de crear:

In [20]:
text1 = 'esta es una cadena de caracteres'

In [21]:
text1

'esta es una cadena de caracteres'

In [22]:
type(text1)

str

Una operación que se puede hacer con un string es concatenarlo con otro usando "+":

In [23]:
text1 + ", es decir, un tipo string"

'esta es una cadena de caracteres, es decir, un tipo string'

Aqui ocurre algo interesante, el símbolo "+" produce diferentes efectos dependiendo del tipo del dato o datos a los que se aplica. Esta es una de las razones, no la única, de porque es importante para un lenguaje de programación definir claramente diferentes tipos de datos.

¿Qué pasa si concatenamos un string y una variable numérica? Por ejemplo,  v1 + text1.

Da error. Pero esto sí funciona:

In [24]:
str(v1) + " " + text1

'4 esta es una cadena de caracteres'

¿Qué hace la función *str()*?

Pueden buscar en internet, o más fácil, usar la ayuda de Python: *help(str)*

Una función interesante, y que se usa mucho con strings es *len()*:

In [25]:
len(text1)

32

¿Qué hace *len()?

Hay muchas otras operaciones disponibles para hacer con strings. Por ejemplo, pasemos todas sus letras a mayúsculas:

In [26]:
text1.upper()

'ESTA ES UNA CADENA DE CARACTERES'

Pero acá hay algo raro ¿No? Hasta ahora veníamos usando funciones del tipo *nombre_función(variable)*. 

Vamos a volver sobre este tipo de llamadas muchas veces en el curso, pero aprovechemos para tener una primera aproximación. Internamente Python está considerando a *text1* como un **objeto**. Este es un concepto muy importante en computación, no solo para Python-. La idea es que *text1* es un objeto de la **clase** String. Al crear una clase, entre otras cosas, se puede definir un tipo de dato y una serie de operaciones válidas sobre esos datos, que en este caso en lugar de llamarse funciones, se llaman **métodos**.

Entonces, *upper()* es un método de la clase String que sirve para convertir a un objeto de esa clase, en nuestro caso *text1*, a mayúsculas.

¿Qué pasaría si intentáramos llamar a *upper* como si fuera una función:

upper(text1)

Error.

¿Hay otros métodos disponibles para un string? Si, unos cuantos. Pueden ver el detalle en la ayuda de Python, o si están siguiendo esta guía desde el notebook Jupyter o desde un IDE, escribiendo "text1." y luego presionando la tecla "tab".

Acá van algunos ejemplos:

In [27]:
text1.lower()

'esta es una cadena de caracteres'

In [28]:
text1.replace('c', 'C')

'esta es una Cadena de CaraCteres'

In [29]:
text1.find("de")

14

¿Qué hizo *find()*?

In [30]:
text1.startswith("e")

True

En el ejemplo anterior es interesante ver lo que devuelve el método. Estamos preguntando si *text1* empieza con "e" y *startswith* devuelve True.

True es un tipo de dato en Python ¿Cuál?

In [31]:
type(True)

bool

Es un tipo de dato lógico o booleano, por eso la respuesta 'bool'. El otro valor posible que puede tomar un dato booleano es False:


In [32]:
type(False)

bool

Ejecutar y prestar atención a lo que pasa en estos casos:

type(true)

type('True')

## Repaso

Al llegar aquí deberías entender estos puntos:

* Cómo ejecutar operaciones matemáticas básicas en Python
* Conocer algunos tipos de datos básicos: números enteros (*int*), números reales (*float*), cadenas de carácteres (*str*) y lógicos o booleanos (*bool*)
* Qué es una función
* Que los datos en Python se pueden comportar como objetos (sin profundizar mucho más por ahora) y que la clase del objeto determina qué métodos tiene disponibles

## ¡¡ Muy importante !!

Sólo leer esta guía no sirve para aprender. Hay que correr los ejercicios en Python y probar variantes, las que se les ocurran. Y si al probar variantes salen errores, mejor. Se aprende muchísimo al entender qué causó un error y tratando de entender los mensajes de error del interprete. 
