<img src="imagenes/python-logo.png">

# ¿Por qué aprender Python?

- **¡Fácil de aprender!**  
    Python es un lenguaje de alto nivel, fácil de leer y escribir: Sintaxis simple, similar al Inglés.
- **Multiplataforma**  
    Corre tanto en Unix como en Windows
- **Muchas herramientas** disponibles para computación científica: *BioPython*, *SciPy*, *Numpy*, *pandas*, *matplotlib*
- **Multipropósito**  
    Se puede programar desde software de visualización de proteínas hasta servidores webs
- Lenguaje **popular**, requerido por la industria de desarrollo de software o *data mining*

## Software libre y código abierto  

Tanto **Python** como *R* y *Julia* son proyectos **open source**.
Éstos permiten que la comunidad mejore continuamente las herramientas. Sin cajas negras ni necesidades de reinventar la rueda.

### Las 4 libertades del software libre:  

1. La **libertad de usar** el programa, con cualquier propósito
2. La **libertad de estudiar** cómo funciona el programa y modificarlo, adaptándolo a tus necesidades
3. La **libertad de distribuir** copias del programa, con lo cual puedes ayudar a tu prójimo
4. La **libertad de mejorar** el programa y hacer públicas esas mejoras a los demás, de modo que toda la comunidad se beneficie

## Apto para procesamiento por lotes (*Batch processing*)

El programador define como la computadora debe resolver el problema en un principio, pero no interactúa con el proceso mientras se ejecuta.   

Es útil para **tareas lentas o repetitivas** sobre grandes conjuntos de datos, archivos, etc.  

**Lenguajes para *Batch processing*:** *Perl*, *Python*, *Julia*, *R*, etc.

### *Scripts* y *pipelines*

Un programa que ejecuta otros programas, con algún código o lógica *"de pegamento"*, es normalmente llamado **script**.  

El *script* puede ser en particular un **pipeline** si los programas son ordenados, de manera de que la salida de uno es la entrada del otro.  

**Lenguajes particularmente buenos para escribir *scripts*:** *Bash*, *Julia* y *Python*, los dos primeros permiten además escribir *pipelines* muy fácilmente.

## Interactivo

En la computación interactiva (*interactive computing*) las personas son parte activa del proceso. El programador usa la computadora como una herramienta para pensar y resolver problemas.

En ciencias biológicas es útil para el **análisis de datos**, donde el científico debe ser parte activa del proceso.

También es útil para **facilitar el desarrollo** de programas que luego serán usados para procesamiento por lotes (*scripts*).

Se utilizan lenguajes de alto nivel a través de una **consola** o **REPL** (*read-eval-print loop*).

**Lenguajes interactivos:** *Python*, *Julia*, *R*, etc.

<img src="imagenes/jupyter_logo.svg">

**Jupyter** es una consola interactiva para diversos lenguajes o **kernels**, principalmente **Ju**lia (*IJulia*), **Pyt**hon (*IPython*) y ***R***.  
Permite integrar código con sus resultados, anotaciones, imágenes, etc. Finalmente se obtiene una *notebook* que puede compartirse para que otros la ejecuten.  
La idea detrás de esto es acercarse hacia una ciencia reproducible.
> *Galileo was the first person to discover the moons of Jupiter. His publication on the moons of Jupiter is an early example of research that includes the underlying data in the publication. This is one of the core ideas and requirements for scientific reproducibility. Reproducibility is one of the main focuses of our project.*

**Celda** de *Jupyter* con anotaciones en [Markdown.](http://jupyter-notebook.readthedocs.io/en/latest/examples/Notebook/Working%20With%20Markdown%20Cells.html)

In [None]:
print("Celda con código.")

# Introducción a la programación  


## Primeros pasos con Python

Siempre el primer programa es un **Hola mundo**, no rompamos la tradición.

In [None]:
# Esto es un comentario, no se ejecutan
# Los comentarios comienzan con #
# Solo sirven para anotar el código

print("Hola mundo")

`print()` es una **función**. Las funciones reciben sus argumentos entre los paréntesis y ejecutan una acción, a veces retornando algo. En este caso es una función que imprime a pantalla lo que recibe.  

`"Hola mundo"` es un **string**. Las cadenas de texto/caracteres o *strings* se escriben entre comillas.

Un **Hola mundo** en **Julia** sería:
```julia
println("Hola mundo") # ln es por line
```
Mientras en **R** es:
```r
print("Hola mundo")
```
En los tres lenguajes los comentarios comienzan con numeral (`#`)

### Asignación de una variable

Una **variable** almacena un **valor** en un espacio de memoria con un determinado **nombre**. En **Python** se asigna un valor a una variable de la siguiente forma:  

```python
nombre = valor
```

In [None]:
mensaje = "Hola mundo"

Luego de ejecutar la asignación anterior tenemos un espacio en memoria con el nombre `mensaje` que contiene el valor `"Hola mundo"`.

La **asignación de una variable** es igual en **Julia**:
```julia
nombre = valor
```
Pero en **R** se usa `<-` en lugar de `=` :
```r
nombre <- valor
```

La ventaja de almacenar un valor en una variable, es que puedo accederla y utilizarla más adelante en el programa.

In [None]:
print(mensaje)

In [None]:
celsius = 24 # Número entero

In [None]:
fahrenheit = celsius * (9.0/5.0) + 32.0 # Valores de coma flotante

fahrenheit # Retorno el valor de la variable fahrenheit como output de la celda

## Estructuras de control  


### Decisión

<img src="imagenes/if.png">

In [3]:
# En Python verdadero es True y falso es False
condicion = True

if condicion:
    # El código condicional va acá 
    # debería ejecutarse dado que condicion es True
    # Si no tenemos aún el código, pero necesitas ocupar el lugar por la sintaxis podemos usar pass
    pass
else:
    pass # No hay nada que hacer si es falso

En **Python** los bloques están delimitados por el sangrado (indentación o *indentation*)
```python
if condicion:
    # Bloque
```
En lugar de terminados con la sentencia `end` como en **Julia** 
```python
if condicion
    # Bloque
end
```
O encerrados entre llaves como en **R**: 
```r
if (condicion){
   # Bloque
}
```
El sangrado es obligatorio en Python, pero recomendado para todos los lenguajes.  

<img src="imagenes/bloque.png">

In [4]:
if True:
    pass # Block 1
    if True:
        pass # Block 2
        if True:
            pass # Block 3
        # Block 2, continuation
    # Block 1, continuation

#### Operadores de comparación

In [6]:
"Hola" == "mundo."

False

In [7]:
"Hola" != "mundo."

True

In [11]:
20 >= 30

False

In [12]:
20 <= 30

True

#### Operadores lógicos

En **Python** son `and`, `or` y `not`, pero en **Julia** y **R** son `&`, `|` y `!` (en estos últimos dos lenguajes tambien exiten `&&` y `||` que son **short-circuit** como los de Python).

In [13]:
(10 <= 15) and (15 <= 20)

True

### Iteración (*while loops*)

<img src="imagenes/while.png">

In [26]:
numero = 0

while numero < 3:
    print(numero)
    numero += 1

0
1
2


### Iteración (*for loops*)

<img src="imagenes/for.png">

In [28]:
dna = "ATGCAT"

for base in dna:
    print(base)

A
T
G
C
A
T


### Ejercicio

<img src="imagenes/flow.png">  

**Completar** el cuerpo de la función siguiendo el diagrama.  
Notar que **def** permite definir una función en Python.  
Esta función va a tomar dos argumentos numéricos y debera retornar un *string* usando la sentencia **return**.

In [43]:
def ejercicio(pay, hours):
    pass # Completar

## Programación orientada a objetos

Python es un lenguaje orientado a objetos.

Los objetos poseen **atributos** y **métodos**:   
- Los atributos pueden pensarse como variables que pertenecen al objeto  
- Los métodos pueden pensarse como funciones propias del objeto   

Ambos se acceden usando el operador punto, aunque la mayoría de las objetos poseen métodos especiales para llamar a sus atributos.  

```python
objeto.atributo
objeto.metodo(argumentos)
```

Por ejemplo los strings son un tipo de objeto que poseen métodos especiales como `upper` y `lower` para pasar a mayúsculas o minúsculas.  


In [47]:
dna = "ATGCATATT" # String

In [49]:
dna.lower() # Uso el método lower del objeto

'atgcatatt'

En **Julia** y en **R** hacemos `metodo(objeto)` en lugar de `objeto.metodo()`

En Python, los métodos y atributos que comienzan con guiones bajos, se consideran **privados** y **no** debe accederse a ellos de manera directa.  
Algunos son especiales, como por ejemplo `__len__`:

In [50]:
dna = "ATGCAT"

dna.__len__() 

6

In [52]:
len(dna) # La función len() llama al método privado y especial __len__

6

### Tipos de objetos básicos en Python  
 

#### str
Cadena de caracteres (inmutable)

*Los tipos inmutables no permiten modificar un objeto ya creado*

In [54]:
texto = "Hola mundo!"

#### list
Lista de diversos objetos (mutable)

In [55]:
lista = [ 1 , "str" , [ 10.0 , 42 ] ]

#### tuple
Lista de diversos objetos (inmutable)

In [56]:
tupla = ( 1, "str" , ( 10.0 , 42 ) )

#### set
Conjunto de valores únicos, no ordenados (mutable)

In [57]:
conjunto = set( [ 'A', 'A', 'C', 'A', 'T', 'T'] )

#### dict
Diccionario, pares de keys (llaves) y values (valores)

In [None]:
diccionario = {'A':0.20,'T':0.20,'C':0.30,'G':0.30}