# Introducción a la programación 
### Semillero de Biologia computacional
Santiago Hincapie

## ¿Que es python?
Python es un lenguaje de programación:
* Interpretado e Interactivo
* Fácil de aprender, programar y leer (menos bugs)
* De muy alto nivel
* Multiparadigma
* Orientado a objetos
* Libre y con licencia permisiva
* Eficiente
* Versátil y potente!
* Con gran documentación
* Y una gran comunidad de usuarios

In [None]:
import this

## ¿ Como podemos usar python?
* **Consolas interactivas**
* **Jupyter**
* **Scripts**



## ¡Queremos programar!
### Los Números
Los tipos numéricos básicos son int (enteros sin limite), float (reales, ) y complex (complejos)

In [None]:
1 + 1.4 - 12

In [None]:
4283687263848293782318426**23

In [None]:
5 % 3

Las operaciones aritméticas básicas son:
* adición: +
* sustracción: -
* multiplicación: *
* división: /
* módulo (resto de división): %
* potencia: **
* división entera: //

Las operaciones se pueden agrupar con paréntesis y tienen precedencia estándar

#### Outs vs prints
* La función `print` imprime (muestra) el resultado por pantalla y pero no devuelve un valor (estrictamente devuelve None). Quiere decir que el valor mostrado no queda disponible para seguir operando.
* Si la última sentencia de una celda tiene un resultado distinto a None, se guarda y se muestra en `Out[x]`
* Los últimas ejecuciones se guardan en variables automáticas _, __ (última y anteúltima) o en general _x o `Out[x]`

In [None]:
_

In [None]:
Out[5]    # que es Out (sin corchetes)? Pronto lo veremos

### Los Textos
Una cadena o string es una secuencia de caracteres (letras, números, simbolos).

In [None]:
print("Hola mundo!")

In [None]:
calle = "O'Higgings"
metafora = 'Los "patitos" en fila'
V = '''Me gustas cuando "callas"
porque estas como ausente...'''
print(V)

En python las palabras tienen ciertas funciones asociadas las cuales facilitan trabajar con ellas

In [None]:
v = "hola amigos"
v.capitalize()

Se pueden operar palabras palabras 

In [None]:
a = "fue un soldado de San Martin"
'*' + a

Para separar una cadena se usa el método `split`

In [None]:
a = "hola,amigos,como"
a.split(',')

Y el método inverso es join, para unir muchas cadenas intercalandolas con otra

In [None]:
" ".join(['Hola', 'mundo'])

#### Y el Input? 
para el input, se utiliza la funcion `input`, esta funcion lee desde la linea de comando y guarda el resultado como una cadena de python

In [None]:
a = input("Escribe tu año de nacimiento:\n")
print("En el 2019 cumpliras:")
print(2019 - int(a))

Tambien existe la funcion `open`, la cual nos permite leer directamente un archivo.
La sintaxis de `open` es la siguiente:

```open('direccion del archivo', 'modo de lectura)```

al utilizar la funcion `open`, este retorna a python un archivo (no una cadena).

In [None]:
f = open('sequence.fasta', 'r')
f


Utilizando el metodo `read`, es posible convertir dicho archivo en una cadena de python

In [None]:
f.read()

## Problema
Muchos analistas de datos suelen guardar sus matrices de datos utilizando el formato `*.csv` o valores separado por comas, sin embargo, muchos otros optan por utilizar el formato `*.tsv` o valores separados por tabs.

Realice un programa en python que lea un archivo CSV y lo convierta a TSV.

#### NOTA:
imprimir el archivo TSV en la terminal (`print`)

#### Indizado y rebanado
Las cadenas son **secuencias**. O sea, conjuntos ordenados que se pueden indizar, recortar, reordenar, etc.
<img src="https://raw.githubusercontent.com/shpotes/python-introduction/master/index_slicing.png">

In [None]:
cadena = "HOLA MUNDO"
cadena[0]

In [None]:
cadena[2:4]

In [None]:
cadena[1:5:2]

El tipo str en python es inmutable, lo que quiere decir que, una vez definido un objeto tipo cadena no podemos modificarlo.

In [None]:
cadena[0] = 'B'

In [None]:
'B' + cadena[1:]

In [None]:
cadena = 'B'.join(cadena.split('H'))
cadena

#### longitud de una secuencia
La función len (de lenght) devuelve la cantidad de elementos de cualquier secuencia

In [None]:
len(cadena)

#### interpolación
Se puede crear un string a partir de una "plantilla" con un formato predeterminado. La forma más poderosa es a través del método [format](https://docs.python.org/2.7/library/string.html#format-examples)

In [None]:
"%s mundo" % "hola"

In [None]:
"{saludo} {planeta}".format(saludo='Hola', planeta='Mundo') # placeholders por nombre de argumentos

#### Casting de tipos
Python es dinámico pero de tipado es fuerte. Quiere decir que no intenta adivinar lo que estamos intentando hacer y nos exige ser explícitos.

In [None]:
"2" + "2"

In [None]:
int("2") + int("2")

In [None]:
float('2.34545') ** 2

In [None]:
int("a")

## Problema
Dado una cadena, imprima una version "rotada a la izquierda 2" donde los primeros dos caracteres se desplacen hasta el final.

La longitud de la cuerda será de al menos 2 caracteres.

Ejemplo:
```
'Hello' → 'lloHe'
'java' → 'vaja'
'Hi' → 'Hi'
```

Source: http://codingbat.com/prob/p160545


## Listas

In [None]:
nombres = ["Rosa", "Valentina", "Santiago"]

In [None]:
type(nombres)

In [None]:
mezcolanza = [1.2, "Jairo", 12e6, calle, nombres[1]]
print mezcolanza

Las listas tambien son secuencias, por lo que el indizado y rebanado funciona igual

In [None]:
nombres[-1]

las listas son mutables. Es decir, es un objeto que puede cambiar: extenderse con otra secuencia, agregar o quitar elementos, cambiar un elemento o una porción por otra, reordenarse, etc.

In [None]:
mezcolanza.extend([1,2])
mezcolanza

In [None]:
mezcolanza[0] = "otra cosa"
mezcolanza

In [None]:
mezcolanza[0:2] = ['A', 'B']     # notar que no hace falta que el valor tenga el mismo tamaño que el slice
mezcolanza

#### packing/unpacking
Como toda secuencia, las listas y tuplas se pueden desempacar

In [None]:
nombre, nota = ["Santiago", 5.0]
print("{} sacó {}".format(nombre, nota)) 

Una funcion `built-in` muy muy útil es `range`

In [None]:
range(5)

In [None]:
range(-10, 10)

In [None]:
range(0, 25, 5)

También hay una función estándar que da la sumatoria

In [None]:
sum([1, 5.36, 5, 10])

En toda secuencia tenemos el método index, que devuelve la posición en la que se encuentra un elemento

In [None]:
a = [1, 'hola', []]
a.index('hola')


y como las listas son mutables también se pueden reordenar in place (no se devuelve un valor, se cambia sobre la misma variable)

In [None]:
a = [1, 2, 3]
a.reverse()
a

In [None]:
list(reversed(a))

## Problema
Dada una secuencia de enteros ingresada desde la linea de comandos, imprimir su promedio.
#### Ejemplo:
```$ python prom.py
2 3 4 5 6 2 1 4 2 3 5 1 2 4
3
```

## Estructuras de control de flujos
#### if/elif/else
En todo lenguaje necesitamos controlar el flujo de una ejecución segun una condición Verdadero/Falso (booleana). Si (condicion) es verdadero hacé (bloque A); Sino hacé (Bloque B). En pseudo código:
```
Si (condicion):
    bloque A
sino:
    bloque B
```
y en Python es muy parecido!

In [None]:
edad = input('edad: ')
if edad < 18:
    print("Usted es menor de edad.")    
else:
    print("Usted es mayor de edad")

Los operadores lógicos en Python son muy explicitos.
```
A == B 
A > B 
A < B
A >= B
A <= B
A != B
A in B
```
* A todos los podemos combinar con `not`, que niega la condición
* Podemos combinar condiciones con `AND` y `OR`, las funciones `all` y `any` y paréntesis]

En un `if`, la conversión a tipo boolean es implícita. El tipo None (vacío), el 0, una secuencia (lista, string) vacía siempre es `False` para python. Cualquier otro objeto será True.

In [None]:
a = 5 - 5

if a: 
    a = "No es cero"
else: 
    a = "Dio cero"
print(a)

Para hacer asignaciones condicionales se puede usar la estructura ternaria del `if`: A si (condicion) sino B

In [None]:
b = 5 - 6
a = "No es cero" if b else "dio cero"
print(a)

## Problema:
Decidir si una cadena dada es palindrome

#### For
Otro control es iterar sobre una secuencia (o "iterador"). Obtener cada elemento para hacer algo. En Python se logra con la sentencia `for`

In [None]:
sumatoria = 0
for elemento in [1, 2, 3.6]: 
    sumatoria = sumatoria + elemento
sumatoria

Notar que no iteramos sobre el índice de cada elemento, sino sobre los elementos mismos.

In [None]:
for i in xrange(10):
    print i

El bloque for se corre hasta el final del iterador o hasta encontrar un sentencia break

In [None]:
sumatoria = 0
for elemento in range(1000):
    if elemento > 100:
        break
    sumatoria = sumatoria + elemento
print sumatoria, elemento


También podemos usar continue para omitir la ejecución de "una iteración"

In [None]:
sumatoria = 0
for elemento in range(20):
    if elemento % 2:
        continue
    print elemento,
    sumatoria = sumatoria + elemento
sumatoria

## Problema
Dadas dos cadenas s y t de igual longitud, la distancia de Hamming entre s y t, denotada $d_H(s, t)$, es el número de caracteres correspondientes que difieren en s y t. Dado dos cadenas de ADN s y t de igual longitud, imprimir la distancia de Hamming $d_H(s, t)$.
```
$ python Hamming.py
GAGCCTACTAACGGGAT
CATCGTAATGACGGCCT

7```

Source: http://rosalind.info/problems/hamm/

Muchas veces queremos iterar una lista para obtener otra, con sus elementos modificados. Por ejemplo, obtener una lista con los cuadrados de los primeros 10 enteros.

In [None]:
cuadrados = []
for i in range(-3,15,1):
    cuadrados.append(i**2)
print cuadrados

Una forma compacta y elegante de escribir esta estructura muy frecuente son las listas por comprehensión:

In [None]:
[n*2 for n in range(5)]

#### While
Otro tipo de sentencia de control es while: iterar mientras se cumpla cierta condición

In [None]:
a = input('ingrese un numero ')
while a < 10:
    print (a)
    a += 1

## Problema
Dado una cadena $s$ y un numero $k$, imprimir todos los kmers de dicha cadena.
```
$ python kmers
GATTACA 4
GATT
ATTA
TTAC
TACA

$ python kmers
MISSISSIPPI 5
MISSI
ISSIS
SSISS
SISSI
ISSIP
SSIPP
SIPPI
```