# Antes de empezar
* Ir a una consola de sistema operativo
* Ir a la carpeta con el contenido del curso
<pre>
> jupyter notebook
</pre>
* Deberían poder ver esta presentación en el navegador

# Bienvenidos al curso de Python
## ¿Por qué python?
* Easy to learn (hard to master)
* Es rápido escribir código
* Multiplataforma
* Muchos recursos disponibles
  * Documentación oficial: https://docs.python.org/3/


# Distribuciones de Python y herramientas
## Python "oficial" ( http://www.python.org)
* La más actualizada

## Anaconda (https://anaconda.org/)
* Contiene paquetes compilados para diferentes sistemas
* Suele ser más fácil de usar en Windows.

## Versiones
* Actualmente, hay dos series de versiones de Python que se siguen manteniendo.
 * Python 2 (2000) - 2.7.14
 * Python 3 (2008) - 3.6.4 
* ¿Por qué?, incompatibilidad entre versiones.
 * La comunidad de python se mueve muy lentamente a python 3.

## Jupyter notebook
* Permite registrar el código y los resultados parciales que se obtienen, junto con documentación.
* Muy útil para hacer análisis de datos.

## Entornos de desarrollo (IDE)
* Ofrecen muchas herramientas: análisis de códido, depuración, integración con repositorios, etc.
* Necesario para desarrollar aplicaciones en python:
 * pycharm
 * Eclipse + pydev
 * atom
 * VScode

# Usando python
Python se puede utilizar de forma interactiva (dentro de la consola de python o jupyter)

<pre>
>>> a = 'hola'
>>> b = 'chau'
>>> print a
hola
>>> print b
chau
</pre>
... o ejecutando scripts en la consola del sistema operativo. 
<pre>
> python mi_script.py 
</pre>


## Jupyter
Jupyter es una consola interactiva para diversos lenguajes, principalmente Julia (IJulia), Python (IPython) y R.
Permite integrar código con sus resultados, anotaciones, imágenes, etc. Finalmente se obtiene una **notebook** que puede compartirse para que otros la ejecuten.

Los elementos básicos de jupyter son **celdas**, que pueden ser de código o de comentarios. Cada celda se puede ejecutar individualmente y el resultado se registra debajo de cada celda. 

Las céldas de comentarios se pueden escribir en un formato se llamado **markdown**

http://jupyter-notebook.readthedocs.io/en/stable/examples/Notebook/Working%20With%20Markdown%20Cells.html

Para abrir jupyter:
<pre>
$ jupyter notebook
</pre>

# El 'Hola mundo' de Python
## El primer 'Hola mundo'

In [1]:
# Esta línea es un comentario.
print("Hola mundo!")

Hola mundo!


"hola mundo!" es un cadena de caracteres o **string**.

**print** es una función. 
Las funciones en general reciben argumentos entre paréntesis, realizan alguna acción y devuelven un valor.

In [None]:
Cambien el contenido de "Hola mundo!" por otra frase, luego hacer clic en 'RUN'

## El segundo 'Hola mundo'

In [2]:
saludo = "Hola mundo!"
print(saludo)

Hola mundo!


**saludo** es un variable a la que se le está asignando el **string** "Hola mundo!"

# Variables, valores y tipos

Una **variable** es un espacio para almacenar datos modificables en la memoria de la computadora; una vez declarada Python recordara que esa variable contiene los datos que le hayamos asignado.
Todas las **variables** tienen un **valor** asignado y todos los **valores** tienen un tipo asociado.

In [27]:
saludo = 'Hola'
numero = 1
resultado = numero + 1

In [None]:
¿Cuáles son variables, cuales son los valores y cuales son los tipos de esos valores?

La función type() se usa para conocer el **tipo** de un **valor**:

In [2]:
print(type(5))
numero=6
print(type(numero))

<class 'int'>
<class 'int'>


In [None]:
numero=6
print(type(numero))

**Desafío**: Declará una 'numero_doble' que almacene el doble del valor de la variable 'numero' e imprimí el tipo de dato que almacena.

## Algunos delos tipos básicos de datos en Python son:
* int - para representar números enteros
* long - para representar números enteros muy largos
* float - para representar números decimales
* bool - para representar valores de verdad (True/False)
* complex - para representar números complejos (1+2j)

## Operadores y funciones matemáticas 
| Operación | Resuldado                        |
| --------- | ---------                        |
| x + y     | Suma                             |
| x - y     | Resta                            |
| x / y     | División. Cuidado con los enteros|
| x * y     | Multiplicación                   |
| x % y     | Resto                            |
| abs(x)    | Absoluto                         |
| int(x)    | Convierte a entero.              |
| long(x)   | Convierte a entero largo.        |
| x ** y    | Eleva x a la y                   |

**Desafío**:¿Qué resultado arroja la siguiente operación?¿Podrías definir cuál fue la sucesión de pasos que se ejecutaron en esa linea?
```python
print(5+30*20)
```

## Operadores y funciones lógicas 
| Operación | Resuldado                        |
| --------- | ---------                        |
| x and y   | Y lógico entre x e y             |
| x or y    | O lógico entre x e y             |
| not x     | Negación de x                    |

**and** y **or** son cortocircuito.

## Operadores de comparación 
| Operación | Resuldado                        |
| --------- | ---------                        |
| x < y     | True si x es menor a y           |
| x <= y    | True si x es menor o igual a y   |  
| x > y     | True si x es mayor a y           |
| x >= y    | True si x es mayor o igual a y   |
| x == y    | True si x es igual a y           |
| x is y    | True si x es idéntico a y        |


In [4]:
print( 1 < 2)

True


In [6]:
print('A' >= 'B')

True


In [7]:
print('a'>'A')

True


In [5]:
a = [1,2,3]
b = [1,2,3]
print( a == b )
print( a is b )

True
False


# Manejo de strings
+ **String** es un tipo de dato que se puede entender como una sucesión de caracteres o una cadena de caracteres. 
+ Podemos un string simplemente escribiendo los caracteres/el caracter entre comillas. 
```python
mi_string = "este es mi primer string"
```
+ Python trata las comillas simples al igual que las comillas dobles.
+ En un string el primer calor tiene índice cero.
+ Hay varias funciones y operadores que permiten trabajar con strings.

**Desafío**: ¿Qué resultado nos daría la siguiente operación?: 
```python
type(1) == type('1')
```
¿Y qué resultado nos daría la siguiente operación?: 
```python
'python' == 'Python'
```

In [6]:
# El operador '+' permite concatenar dos strings
nuevoString = "Este" + " " + "es" + " " + "un" + " " + "String"
print(nuevoString)

Este es un String


**Desafío**:¿Qué otros operadores matemáticos funcionan con strings?¿Qué resultados obtenes?

La función **str()** convierte valores a string.

In [7]:
pi = 3.1416
pi_str = str(pi)
type(pi_str)

str

Se puede acceder a los caracteres individuales de un string, del siguiente modo:

In [8]:
s = "este es un string"
a = s[ 1 : 4 ] # 1 es el índice de la primer posición incluida, 4 es el índice de la primer posición excluida.
print(a)
b = s[ 4 : -1 ] # Se pueden usar índices negativos, que comienzan desde el final del string
print(b)

ste
 es un strin


# Estructuras de datos

Las variables que vimos hasta ahora son sencillas y contienen un único **dato**.
Python permite usar estructuras de datos más complejas que permiten almacenar y organizar colecciones de datos.
Algunas de estas estructuras de datos son:
* listas
* diccionarios

## Listas
* Agrupamiento ordenado de valores, usualmente muchos
* Los valores no tienen que ser del mismo tipo.
* Las listas son mutables.
* El número de orden un de un valor en la lista es su **índice**, el primer valor tiene índice **cero**.


In [1]:
listaSimple = [1,2,3]
print(listaSimple)
print(type(listaSimple))
delCeroAlNueve = list(range(10))
print(delCeroAlNueve)
print(type(delCeroAlNueve))
print(delCeroAlNueve[5])

[1, 2, 3]
<class 'list'>
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
<class 'list'>
5


In [2]:
listaSimple[0] = 5
# Los valores de las listas pueden reasignarse
print(listaSimple)

[5, 2, 3]


### Agregar y quitar elementos de una lista


In [3]:
listaSimple.append(18)
print(listaSimple)
listaSimple.insert(4,0)
print(listaSimple)

[5, 2, 3, 18]
[5, 2, 3, 18, 0]


* La función **append()** agrega un elemento a una lista.

¿Por qué está el punto entre el nombre de la variable y **append()**?

In [4]:
print(listaSimple)
listaSimple.remove(18)
print(listaSimple)

[5, 2, 3, 18, 0]
[5, 2, 3, 0]


* La función **remove()** elimina un elemento a una lista.

In [5]:
otraLista = [1,2,3,2]
otraLista.remove(2)
print(otraLista)

[1, 3, 2]


* Si el valor que se quiere eliminar está más de una vez, solo se elimina el primero

In [6]:
valorEliminado = otraLista.pop(0)
print(valorEliminado)
print(otraLista)

1
[3, 2]


* La función **pop()** elimina un valor por el índice.

### Selecciones de sublistas

In [7]:
listaSimple = ['a','b','c','d','e']
subLista = listaSimple[0:2]
# Para obtener una sublista se debe indicar el índice del primer valor incluido y el índice del primer valor excluido
print(subLista)

['a', 'b']


In [8]:
listaSimple[:2]
# Si el primer índice es 0, puede obviarse

['a', 'b']

In [9]:
listaSimple[3:]
# Si el último índice es la longitud de la lista, también puede obviarse

['d', 'e']

### Concatenación de listas


In [10]:
listaSimple = [0,1,2,3] + [4,5,6]
print(listaSimple)

[0, 1, 2, 3, 4, 5, 6]


### Otras funciones de listas importantes 
* extend() = agrega elementos de una lista a otra.
* index() = devuelve el índice en la lista de un valor dado.
* count() = devuelve la cantidad de veces que un elemento está en la lista.
* sort() = ordena los valores de la lista
* reverse() = invierte los valores de una lista
* len() = devuelve la cantidad de elementos en la lista.

## Recorrer listas

In [13]:
lista = [1,2,3,4,5,6,7,8,9,10] 

for x in lista:
    print(x)

1
2
3
4
5
6
7
8
9
10


**Desafío**:
Recorrer la lista anterior y imprimir el cuadrado de cada valor



**Desafío**:
Crear una nueva lista con que contenga los cuadrados de los valores de la lista anterior.


In [15]:
nueva_lista = []
for x in lista:
    ...

print(nueva_lista)

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]


## Diccionarios
* Los diccionarios son agrupaciones de datos del tipos Clave -> Valor. No tienen orden. Así como las listas se declaran con corchetes, los diccionarios se declaran con llaves, siguiendo la sintaxis:
```python
mamiferos = {
    "orangutan" : 'placentario', 
    "canguro" : 'marsupial'
}
```
* Se puede acceder a los valores para cada clave haciendo, por ejemplo:
```python
mamiferos['orangutan']
```
* ¿Qué cosas quiero hacer un diccionario?
 * Guardar (o actualizar) un dato con clave
 * Recuperar un dato por su clave
 * Saber si una valor dado es una clave
 * Recuperar todas las claves
 * Eliminar valores.
 
### Guardar y recuperar valores

In [11]:
personas = dict()  # la función dict crea un nuevo diccionario vacio.
personas[20000001] = 'Jose Perez'
personas[20000002] = 'Julian Alvarez'
personas[20000001] = 'Jose Jorge Perez'
# Se guardan los nombres de personas usando como clave el DNI.
print(personas[20000001])


Jose Jorge Perez


### Recuperar todas las claves y valores
* Las funciones **keys()** y **values()** permiten recuperar listas con las claves y los valores. 
* No tienen ningún orden.

In [12]:
print( personas.keys() )
print( personas.values() )

dict_keys([20000001, 20000002])
dict_values(['Jose Jorge Perez', 'Julian Alvarez'])


* Las claves pueden ser valores de diferentes tipos: str, int, bool, tuplas. Pero no listas. 
* Los valores también pueden valores de diferentes tipos, incluyendo listas.

In [13]:
personas["20000003"] = "Jose de San Martin"
personas[( 1,2) ] = False

### Comprobar si una clave pertenece a un diccionario
* El operador **in** permite esto.

In [14]:
(1,2) in personas

True

In [15]:
20000005 in personas

False

### Diferentes formas de construir un diccionario
#### Crear un diccionario vacio y agregar elementos individualmente.


In [16]:
diccionarioUno = {}
diccionarioUno[1] = 'Uno'
diccionarioUno[2] = 'Dos'

#### Usar el constructor '{}'
* Se usa ':' para separar la clave del valor.

In [17]:
diccionarioDos = { 1 : 'Uno', 2 : 'Dos' }

#### Usar el constructor dict()
* El argumento es una lista de tuplas.
* El primer elemento de cada tupla es la clave, el segundo es el valor.

In [18]:
diccionarioTres = dict( [ ( 1,'Uno'), ( 2, 'Dos' ) ] )

### Otras funciones útiles de diccionarios
* clear() : Borra todos los elementeos de diccionario
* copy() : Devuelve una copia del diccionario
* items() : Delvuelve una lista de tuplas (clave, valor)
* update() : Actualiza un diccionario con valores de otro.
* len() : Devuelve la cantidad de elementos en el diccionario.

## Sets
* Los sets con agrupaciones no ordenadas de valores que no permiten repeticiones.
* Que quiero hacer con un set:
 * Guardar valores
 * Eliminar valores
 * Saber si un valor pertenece al set
 * Recuperar los valores del set

### Agregar y eliminar elementos

In [19]:
setUno = set()
setUno.add(1)
setUno.add(2)
setUno.add(3)
setUno.add(5)
setUno.add(7)
setUno.remove(1)
print(setUno)

{2, 3, 5, 7}


### Saber si un elemento pertenece al set

In [20]:
1 in setUno

False

In [21]:
2 in setUno

True

### Recuperar los valores del set
* Se puede convertir el set en una lista que contenga los valores.
* La lista no tienen ningún orden particular.

In [22]:
listaDesdeSet = list( setUno )
print( listaDesdeSet )

[2, 3, 5, 7]


# Estructuras de control
Python, al igual que todos los lenguages de programación, incluye sentencias permiten controlar el flujo del programa. Esto permite tomar desiciones, repetir una tarea y recorrer estructuras de datos.


## Ejecución condicional: if

La estructura general es:
```python
if condicion:
    Codigo si la condicion es verdadera
else :
    Codigo si la condicion es falsa
```

In [23]:
a = 1
if a == 0 :
    mensaje = "a es igual a cero"
    print(mensaje)
else :
    print("a no es igual a cero")

a no es igual a cero


La sentencia **else** es opcional

In [24]:
a = 0
if a == 0 :
    mensaje = "a es igual a cero"
    print(mensaje)

a es igual a cero


### If anidados

In [25]:
a = 3
if a == 0 :
    print("a es igual a cero")
else :
    if a == 1:
        print("a es igual a uno")
    else :
        if a == 2:
            print("a es igual a dos")
        else :
            print("a no es cero, ni uno, dos")

a no es cero, ni uno, dos


Esto mismo puede escribirse de una forma más legible usando **elif**

In [26]:
a = 3
if a == 0 :
    print("a es igual a cero")
elif a == 1:
    print("a es igual a uno")
elif a == 2:
    print("a es igual a dos")   
else :
    print("a no es cero, ni uno, dos")

a no es cero, ni uno, dos


## Iteración por los elementos de una estructura de datos: for

La sentencia **for** se usa para recorrer listas, diccionarios, strings, etc.

La estructura general es:
```python
for elemento in coleccion:
    Codigo para cada elemento
```

In [50]:
for letra in "hola" :
    print(letra)

h
o
l
a


**Desafío** calcular la suma de lista de números

In [51]:
fibo = [0,1,1,2,3,5,8]
...
print(suma)

20


La función **range** permite crear listas para la iteración con **for**

In [53]:
inicio = 1
final = 10
salto = 2
for impar in range(inicio, final, salto) :
    print(str(impar) + " es un número impar")

1 es un número impar
3 es un número impar
5 es un número impar
7 es un número impar
9 es un número impar


In [None]:
**desafío** crear una lista con los múltiplos de 7 menores que 100

In [18]:
lista = []
for n in range(0,100,7):
    lista.append(n)
print(lista)

[0, 7, 14, 21, 28, 35, 42, 49, 56, 63, 70, 77, 84, 91, 98]


**desafío** crear, a partir de la lista que aparece abajo, una nueva lista que contenga solo las palabras con un número par de caracteres.

In [23]:
lista = ["calculadora", "lápiz", "cubo", "mágico", "anteojos", "papel"]





### Recorrer diccionarios

In [54]:
dicc = { 'rojo' : (255,0,0), 'verde': (0,255,0), 'azul' : (0,0,255) }
for color in dicc :
    print("El código RGB de " +color+ " es " + str(dicc[color]))

El código RGB de rojo es (255, 0, 0)
El código RGB de verde es (0, 255, 0)
El código RGB de azul es (0, 0, 255)


In [55]:
for color in dicc.keys() :
    print("El código RGB de " +color+ " es " + str(dicc[color]))

El código RGB de rojo es (255, 0, 0)
El código RGB de verde es (0, 255, 0)
El código RGB de azul es (0, 0, 255)


In [56]:
for rgb in dicc.values() :
    print(str(rgb))

(255, 0, 0)
(0, 255, 0)
(0, 0, 255)


In [57]:
for color, rgb in dicc.items() :
    print("El código RGB de " +color+ " es " + str(rgb))

El código RGB de rojo es (255, 0, 0)
El código RGB de verde es (0, 255, 0)
El código RGB de azul es (0, 0, 255)


# Definir funciones propias

No solo podemos usar la funciones propias de Python, sino que podemos crear las nuestras propias.

In [25]:
def contarCaracteres( cadena ) :
    resultado = {}
    for letra in cadena:
        if not letra in resultado:
            resultado[letra] = 0
        resultado[letra] = resultado[letra] + 1
    return resultado

print(contarCaracteres('abbcccdddd'))

{'a': 1, 'b': 2, 'c': 3, 'd': 4}


# Importar funciones y módulos 
Ya vimos en varios ejemplos como usar funciones de la instalación estándar de python.
Sin embargo gran parte de la funcionalidad de python proviene de funciones no incluidas dentro de esta, sino que están incluidas en otros **módulos**.

In [27]:
import Bio # Carga el módulo de biopython

Se puede cargar solo lo necesario de un módulo.

In [28]:
from Bio import PDB # Carga 'PDB' desde el modulo Bio.

# Objetos
* Los objetos son estructuras que agrupan valores y funciones (o métodos) para esos datos.
* El operador '**.**' (punto)se usa para especificar un método o un valor de un objeto:
  * objeto.metodo( argumentos )
  * objeto.valor

In [34]:
from Bio.Seq import Seq

obj = Seq("ATG---AUG")
other_obj = obj.ungap(gap="-")


# Lectura y escritura de archivos

Tanto para leer o escribir un archivo existente, o crear uno nuevo es necesario "abrirlo".
Esto se hace con la función **open()**. Lo que podemos hacer con ese archivo abierto depende de los argumentos que le pasemos a la función. Finalmente, hay que "cerrar" el archivo. Con la función **close()**

In [68]:
fh = open( 'mi_archivo.txt', 'w')
# El primer argumento es el nombre del archivo, el segundo es el modo de acceso.
# En este caso es de escritura 'w' : write
fh.write("Este es el contenido del archivo\n")
# \n representa el caracter de fin de línea.
fh.close()

Los modos de acceso para archivos de texto son:
* w - Write / Escritura
* r - Read / Lectura
* a - Append / Agrega nuevos datos a un archivo existente
* r+ - Read+Write / Lectura y escritura simultánea.

In [69]:
filename = 'sam_file.extract.txt'
fh = open( filename, 'r')
for line in fh :
    fields = line.strip().split()
    print(fields[0] + " - " + fields[1][:10])
fh.close()

@SRR6749457.1.1 - TTCTGGCGCA
@SRR6749457.1.2 - TTTTCCTATT
@SRR6749457.2.1 - TTAATACCTT
@SRR6749457.2.2 - CTTTCCTCCC
@SRR6749457.3.1 - TTAATGGTGA
@SRR6749457.3.2 - CACAACTAGT
@SRR6749457.4.1 - TAATACCAGG
@SRR6749457.4.2 - CCTTTAACCT
@SRR6749457.5.1 - TTTCAGCACA
@SRR6749457.5.2 - TTTCTCTCCC


Lo mismo se puede hacer usando la sentencia **with**, esta misma se encarga de cerrar el archivo.

In [70]:
filename = 'sam_file.extract.txt'
with open( filename, 'r') as fh:
    for line in fh :
        fields = line.strip().split()
        print(fields[0] + " - " + fields[1][:10])

@SRR6749457.1.1 - TTCTGGCGCA
@SRR6749457.1.2 - TTTTCCTATT
@SRR6749457.2.1 - TTAATACCTT
@SRR6749457.2.2 - CTTTCCTCCC
@SRR6749457.3.1 - TTAATGGTGA
@SRR6749457.3.2 - CACAACTAGT
@SRR6749457.4.1 - TAATACCAGG
@SRR6749457.4.2 - CCTTTAACCT
@SRR6749457.5.1 - TTTCAGCACA
@SRR6749457.5.2 - TTTCTCTCCC
