# Bienvenidos al curso de Python
## ¿Por qué python?
* Easy to learn (hard to master)
* Es rápido escribir código
* Muchos recursos disponibles
  * Documentación oficial: https://docs.python.org/3/
* Multiplataforma

# Antes de empezar
* Ir a una consola de sistema operativo
* Ir a la carpeta con el contenido del curso
<pre>
$ jupyter nbconvert presentation.ipynb --to slides --post serve
</pre>
* Deberían poder ver esta presentación en el navegador

# Distribuciones de Python y herramientas
## Python "oficial" ( http://www.python.org)
* La más actualizada

## Anaconda (https://anaconda.org/)
* Contiene paquetes compilados para diferentes sistemas
* Suele ser más fácil de usar en Windows.

## Versiones
* Actualmente, hay dos series de versiones de Python que se siguen manteniendo.
 * Python 2 (2000) - 2.7.14
 * Python 3 (2008) - 3.6.4 
* ¿Por qué?, incompatibilidad entre versiones.
 * La comunidad de python se mueve muy lentamente a python 3.

## Jupyter notebook
* Permite registrar el código y los resultados parciales que se obtienen, junto con documentación.
* Muy útil para hacer análisis de datos.

## Entornos de desarrollo (IDE)
* Ofrecen muchas herramientas: análisis de códido, depuración, integración con repositorios, etc.
* Necesario para desarrollar aplicaciones en python:
 * pycharm
 * Eclipse + pydev
 * atom
 * VScode

# Usando python
Python se puede utilizar de forma interactiva ( dentro de la consola de python o jupyter)

<pre>
>>> a = 'hola'
>>> b = 'chau'
>>> print a
hola
>>> print b
chau
</pre>
... o ejecutando scripts en la consola del sistema operativo. 
<pre>
$ python mi_script.py 
</pre>


## Jupyter
Jupyter es una consola interactiva para diversos lenguajes, principalmente Julia (IJulia), Python (IPython) y R.
Permite integrar código con sus resultados, anotaciones, imágenes, etc. Finalmente se obtiene una **notebook** que puede compartirse para que otros la ejecuten.

Los elementos básicos de jupyter son **celdas**, que pueden ser de código o de comentarios. Cada celda se puede ejecutar individualmente y el resultado se registra debajo de cada celda. 

Las céldas de comentarios se pueden escribir en un formato se llamado **markdown**

http://jupyter-notebook.readthedocs.io/en/stable/examples/Notebook/Working%20With%20Markdown%20Cells.html

Para abrir jupyter:
<pre>
$ jupyter notebook
</pre>

# El 'Hola mundo' de Python
## El primer 'Hola mundo'

In [1]:
# Esta línea es un comentario.
print("Hola mundo!")

Hola mundo!


"hola mundo!" es un cadena de caracteres o **string**.

**print** es una función. 
Las funciones en general reciben argumentos entre paréntesis, realizan alguna acción y devuelven un valor.

## El segundo 'Hola mundo'

In [2]:
saludo = "Hola mundo!"
print(saludo)

Hola mundo!


**saludo** es un variable a la que se le está asignando el **string** "Hola mundo!"

# Variables, valores y tipos

Una **variable** es un espacio para almacenar datos modificables en la memoria de la computadora; una vez declarada Python recordara que esa variable contiene los datos de las caracteristicas que le hayamos asignado.
Estas pueden ser declaradas simplemente haciendo:

In [6]:
variable1 = 1
mi_variable = 'Hola'
variable2 = variable1 + 1

## Todas las variables tienen un valor asignado y todos los valores tienen un tipo asociado. 
Por medio de la función type() podemos conocer el tipo de dato que almacena nuestra variable:

In [7]:

print(type(variable1))
print(type(variable2))


<class 'int'>
<class 'int'>


**Reto**: Declará una 'variable_3' que almacene el doble del valor de la variable 2 e imprimí el tipo de dato que almacena.

**Reto**: Declará una 'variable_4' que almacene el cociente entre la variable 3 y la variable 2. ¿Qué tipo de datos almacena la variable 4?

## Algunos delos tipos básicos de datos en Python son:
* int - para representar números enteros
* long - para representar números enteros muy largos
* float - para representar números decimales
* bool - para representar valores de verdad (True/False)
* complex - para representar números complejos (1+2j)
* NoneType - Tipo especial del valor None

## Pero las variables no tienen un tipo. 
La variable variable1 no está 'atada' a un tipo específico, como sucede en otros lenguajes de programación. De hecho, podríamos reasignar valores a una variable simplemente declarandolo de este modo:
```python
variable_4 = "Roberto"
```
¿Qué ocurre si aplicamos la función **type()** a la variable 4 ahora?

La variable **variable1** no está 'atada' a un tipo específico, como sucede en otros lenguajes de programación.

## Operadores y funciones matemáticas 
| Operación | Resuldado                        |
| --------- | ---------                        |
| x + y     | Suma                             |
| x - y     | Resta                            |
| x / y     | División. Cuidado con los enteros|
| x * y     | Multiplicación                   |
| x % y     | Resto                            |
| abs(x)    | Absoluto                         |
| int(x)    | Convierte a entero. No redondea. |
| long(x)   | Convierte a entero largo. No redondea. |
| x ** y    | Eleva x a la y                   |

**Reto**:¿Qué resultado arroja la siguiente operación?¿Podrías definir cuál fue la sucesión de pasos que se ejecutaron en esa linea?
```python
print(5+30*20)
```

## Operadores y funciones lógicas 
| Operación | Resuldado                        |
| --------- | ---------                        |
| x and y   | Y lógico entre x e y             |
| x or y    | O lógico entre x e y             |
| not x     | Negación de x                    |

**and** y **or** son cortocircuito.

## Operadores de comparación 
| Operación | Resuldado                        |
| --------- | ---------                        |
| x < y     | True si x es menor a y           |
| x <= y    | True si x es menor o igual a y   |  
| x > y     | True si x es mayor a y           |
| x >= y    | True si x es mayor o igual a y   |
| x == y    | True si x es igual a y           |
| x is y    | True si x es idéntico a y        |


In [8]:
a = [1,2,3]
b = [1,2,3]
print( a == b )
print( a is b )

True
False


# Manejo de strings
+ **String** es un tipo de dato que se puede entender como una sucesión de caracteres o una cadena de caracteres. 
+ Podemos un string simplemente escribiendo los caracteres/el caracter entre comillas. 
```python
mi_string = "este es mi primer string"
```
+ Python trata las comillas simples al igual que las comillas dobles.
+ En un string el primer calor tiene índice cero.
+ Hay varias funciones y operadores que permiten trabajar con strings.

**Reto**: ¿Qué resultado nos daría la siguiente operación?: 
```python
type(1) == type('1')
```
¿Y qué resultado nos daría la siguiente operación?: 
```python
'python' == 'Python'
```

In [9]:
# El operador '+' permite concatenar dos strings
nuevoString = "Este" + " " + "es" + " " + "un" + " " + "String"
print(nuevoString)

Este es un String


**Reto**:¿Qué otros operadores matemáticos funcionan con strings?¿Qué resultados obtenes?

La función **str()** convierte valores a string.

In [10]:
pi = 3.1416
pi_str = str(pi)
type(pi_str)

str

Se puede acceder a los caracteres individuales de un string, del siguiente modo:

In [11]:
s = "este es un string"
a = s[ 1 : 4 ] # 1 es el índice de la primer posición incluida, 4 es el índice de la primer posición excluida.
print(a)
b = s[ 4 : -1 ] # Se pueden usar índices negativos, que comienzan desde el final del string
print(b)

ste
 es un strin


Las funciones **upper()** y **lower()** permiten convertir los strings a mayúsculas y minúsculas

In [12]:
nuevoString = "hola".upper()
print(nuevoString)
nuevoString = "HOLA".lower()
print(nuevoString)

HOLA
hola


La función **split()** separa un string en una lista de strings, usando una caracter como separador. Por defecto el separador es un espacio en blanco o un tab.

In [13]:
s = "Este es un string que se va a dividir"
s.split()

['Este', 'es', 'un', 'string', 'que', 'se', 'va', 'a', 'dividir']

La función **join()** junta varios strings en uno solo, usando otro string como separador. 

In [14]:
s = ['a','b','c','d']
','.join(s)

'a,b,c,d'

Las funciones **strip()**, **rstrip()** y **lstrip()** eliminan los carácteres en blanco al inicio y/o fin de un string.

In [15]:
a = "   hola   "
a.strip()

'hola'

La función **replace()** permite cambiar un fragmento de un string por otro.

In [16]:
nombre = "Mi nombre es Pedro"
nombre.replace("Pedro","Javier")

'Mi nombre es Javier'

La función **find()** busca un string dentro de otro. Devuelve el índice de la primera vez que se encuentra.

In [17]:
s = "Buscar una aguja en un pajar"
s.find("aguja")

11

La función **startswith()** checkea si un string comienza con un dado caracter o substring y nos devuelve un booleano:

In [18]:
s = "Buscar una aguja en un pajar"
s.startswith("aguja")

False

# Estructuras de datos

Las variables que vimos hasta ahora son sencillas y contienen un único **dato**.
Python permite usar estructuras de datos más complejas que permiten almacenar y organizar colecciones de datos.
Algunas de estas estructuras de datos son:
* tuplas
* listas
* diccionarios
* sets

## Tuplas
- Agrupamiento ordenado de valores, usualmente pocos. 
- Los valores no tienen que ser del mismo tipo. 
- Las tuplas son inmutables.

In [19]:
t2 = (1,2)   # (1,2) es un tupla
t3 = (1,2,3) # (1,2,3) es otra tupla
print(t2[0])

1


In [20]:
t2 = (1,2)
t2[0] = 2
# No se puede asignar uno de los valores de una tupla.

TypeError: 'tuple' object does not support item assignment

## Listas
* Agrupamiento ordenado de valores, usualmente muchos
* Los valores no tienen que ser del mismo tipo.
* Las listas son mutables.
* El número de orden un de un valor en la lista es su **índice**, el primer valor tiene índice **cero**.


In [21]:
listaSimple = [1,2,3]
print(listaSimple)
print(type(listaSimple))
delCeroAlNueve = range(10)
print(delCeroAlNueve)
print(type(delCeroAlNueve))
print(delCeroAlNueve[5])

[1, 2, 3]
<class 'list'>
range(0, 10)
<class 'range'>
5


In [22]:
listaSimple[0] = 5
# Los valores de las listas pueden reasignarse
print(listaSimple)

[5, 2, 3]


### Agregar y quitar elementos de una lista


In [23]:
listaSimple.append(18)
print(listaSimple)
listaSimple.insert(4,0)
print(listaSimple)

[5, 2, 3, 18]
[5, 2, 3, 18, 0]


* La función **append()** agrega un elemento a una lista.

¿Por qué está el punto entre el nombre de la variable y **append()**?

In [24]:
print(listaSimple)
listaSimple.remove(18)
print(listaSimple)

[5, 2, 3, 18, 0]
[5, 2, 3, 0]


* La función **remove()** elimina un elemento a una lista.

In [25]:
otraLista = [1,2,3,2]
otraLista.remove(2)
print(otraLista)

[1, 3, 2]


* Si el valor que se quiere eliminar está más de una vez, solo se elimina el primero

In [26]:
valorEliminado = otraLista.pop(0)
print(valorEliminado)
print(otraLista)

1
[3, 2]


* La función **pop()** elimina un valor por el índice.

### Selecciones de sublistas

In [27]:
listaSimple = ['a','b','c','d','e']
subLista = listaSimple[0:2]
# Para obtener una sublista se debe indicar el índice del primer valor incluido y el índice del primer valor excluido
print(subLista)

['a', 'b']


In [28]:
listaSimple[:2]
# Si el primer índice es 0, puede obviarse

['a', 'b']

In [29]:
listaSimple[3:]
# Si el último índice es la longitud de la lista, también puede obviarse

['d', 'e']

### Concatenación de listas


In [30]:
listaSimple = [0,1,2,3] + [4,5,6]
print(listaSimple)

[0, 1, 2, 3, 4, 5, 6]


El operador '+' permite concatenar dos listas.

**¿Qué otros operadores matemáticos funcionan con listas?¿Qué resultados obtenes?**

### Otras funciones de listas importantes 
* extend() = agrega elementos de una lista a otra.
* index() = devuelve el índice en la lista de un valor dado.
* count() = devuelve la cantidad de veces que un elemento está en la lista.
* sort() = ordena los valores de la lista
* reverse() = invierte los valores de una lista
* len() = devuelve la cantidad de elementos en la lista.

## Diccionarios
* Los diccionarios son agrupaciones de datos del tipos Clave -> Valor. No tienen orden. Así como las listas se declaran con corchetes y las tuple con paréntesis, los diccionarios se declaran con llaves, siguiendo la sintaxis midict = {clave_1: "valor",clave_2: "valor"}
```python
mamiferos = {"orangutan" : 'placentario',"canguro" : 'marsupial'}
```
* Se puede acceder a los valores para cada clave haciendo, por ejemplo:
```python
mamiferos['orangutan']
```
* ¿Qué cosas quiero hacer un diccionario?
 * Guardar (o actualizar) un dato con clave
 * Recuperar un dato por su clave
 * Saber si una valor dado es una clave
 * Recuperar todas las claves
 * Eliminar valores.
 
### Guardar y recuperar valores

In [31]:
personas = dict()  # la función dict crea un nuevo diccionario vacio.
personas[20000001] = 'Jose Perez'
personas[20000002] = 'Julian Alvarez'
personas[20000001] = 'Jose Jorge Perez'
# Se guardan los nombres de personas usando como clave el DNI.
print(personas[20000001])


Jose Jorge Perez


### Recuperar todas las claves y valores
* Las funciones **keys()** y **values()** permiten recuperar listas con las claves y los valores. 
* No tienen ningún orden.

In [32]:
print( personas.keys() )
print( personas.values() )

dict_keys([20000001, 20000002])
dict_values(['Jose Jorge Perez', 'Julian Alvarez'])


* Las claves pueden ser valores de diferentes tipos: str, int, bool, tuplas. Pero no listas. 
* Los valores también pueden valores de diferentes tipos, incluyendo listas.

In [33]:
personas["20000003"] = "Jose de San Martin"
personas[( 1,2) ] = False

### Comprobar si una clave pertenece a un diccionario
* El operador **in** permite esto.

In [34]:
(1,2) in personas

True

In [35]:
20000005 in personas

False

### Diferentes formas de construir un diccionario
#### Crear un diccionario vacio y agregar elementos individualmente.


In [36]:
diccionarioUno = {}
diccionarioUno[1] = 'Uno'
diccionarioUno[2] = 'Dos'

#### Usar el constructor '{}'
* Se usa ':' para separar la clave del valor.

In [37]:
diccionarioDos = { 1 : 'Uno', 2 : 'Dos' }

#### Usar el constructor dict()
* El argumento es una lista de tuplas.
* El primer elemento de cada tupla es la clave, el segundo es el valor.

In [38]:
diccionarioTres = dict( [ ( 1,'Uno'), ( 2, 'Dos' ) ] )

### Otras funciones útiles de diccionarios
* clear() : Borra todos los elementeos de diccionario
* copy() : Devuelve una copia del diccionario
* items() : Delvuelve una lista de tuplas (clave, valor)
* update() : Actualiza un diccionario con valores de otro.
* len() : Devuelve la cantidad de elementos en el diccionario.

## Sets
* Los sets con agrupaciones no ordenadas de valores que no permiten repeticiones.
* Que quiero hacer con un set:
 * Guardar valores
 * Eliminar valores
 * Saber si un valor pertenece al set
 * Recuperar los valores del set

### Agregar y eliminar elementos

In [39]:
setUno = set()
setUno.add(1)
setUno.add(2)
setUno.add(3)
setUno.add(5)
setUno.add(7)
setUno.remove(1)
print(setUno)

{2, 3, 5, 7}


### Saber si un elemento pertenece al set

In [40]:
1 in setUno

False

In [41]:
2 in setUno

True

### Recuperar los valores del set
* Se puede convertir el set en una lista que contenga los valores.
* La lista no tienen ningún orden particular.

In [42]:
listaDesdeSet = list( setUno )
print( listaDesdeSet )

[2, 3, 5, 7]


# Estructuras de control
Python, al igual que todos los lenguages de programación, incluye sentencias permiten controlar el flujo del programa. Esto permite tomar desiciones, repetir una tarea y recorrer estructuras de datos.

## Estructuración por indentación
* La indentación es el espacio que existe entre cada línea de código y el margen.
* A diferencia de muchos otros lenguages de programación, la indentación en python no es sólo por estética sino que define la estructura del código.
* Es importante tener presente las identaciones(o espacios al comienzo de linea) luego de los dos puntos. Esta define bloques de ejecución.
* Esta identación se escribe automaticamente en entornos como Jupyter. De hacerlo manualmente, se recomientda utilizar un tab a modo de identacion, aunque puede elegirse un o dos espacios. Siempre a lo largo del código debe respetarse la identacion elegida.
* De no utilizar la correcta identación Python nos alertará de nuestro error con un cartel **'IdentationError'**:

## Ejecución condicional: if

La estructura general es:
```python
if condicion:
    Codigo si la condicion es verdadera
else :
    Codigo si la condicion es falsa
```

In [43]:
a = 1
if a == 0 :
    mensaje = "a es igual a cero"
    print(mensaje)
else :
    print("a no es igual a cero")

a no es igual a cero


La sentencia **else** es opcional

In [44]:
a = 0
if a == 0 :
    mensaje = "a es igual a cero"
    print(mensaje)

a es igual a cero


In [45]:
a = 0
if a == 0 :
    mensaje = "a es igual a cero"
print(mensaje)

a es igual a cero


In [46]:
a = 0
if a == 0 :
    mensaje = "a es igual a cero"
print(mensaje)

a es igual a cero


### If anidados

In [47]:
a = 3
if a == 0 :
    print("a es igual a cero")
else :
    if a == 1:
        print("a es igual a uno")
    else :
        if a == 2:
            print("a es igual a dos")
        else :
            print("a no es cero, ni uno, dos")

a no es cero, ni uno, dos


Esto mismo puede escribirse de una forma más legible usando **elif**

In [48]:
a = 3
if a == 0 :
    print("a es igual a cero")
elif a == 1:
    print("a es igual a uno")
elif a == 2:
    print("a es igual a dos")   
else :
    print("a no es cero, ni uno, dos")

a no es cero, ni uno, dos


## Repetición hasta que una condición se cumpla: while


La estructura general es:
```python
while condicion:
    Codigo mientras la condicion es verdadera
else:
    Codigo cuando la condicion pasa a ser falsa
```

In [49]:
contador = 0
while contador < 5 :
    print(contador)
    contador = contador +1
else :
    print("no hay más números mayores o iguales que cero y menores que 5")

0
1
2
3
4
no hay más números mayores o iguales que cero y menores que 5


## Iteración por los elementos de una estructura de datos: for

La sentencia **for** se usa para recorrer listas, diccionarios, tuplas, strings, etc.

La estructura general es:
```python
for elemento in coleccion:
    Codigo para cada elemento
```

In [50]:
for letra in "hola" :
    print(letra)

h
o
l
a


### Recorrer listas

In [51]:
fibo = [0,1,1,2,3,5,8]
suma = 0
for numero in fibo :
    suma = suma + numero
print(suma)

20


La función **enumerate** permite iterar un string o estructura de datos guardando el índice de cada elemento.

In [52]:
for index, value in enumerate("hola"):
    print(str(index) + " / " + str(value))
    

0 / h
1 / o
2 / l
3 / a


La función **range** permite crear listas para la iteración con **for**

In [53]:
for impar in range(1,10,2) :
    print(str(impar) + " es un número impar")

1 es un número impar
3 es un número impar
5 es un número impar
7 es un número impar
9 es un número impar


### Recorrer diccionarios

In [54]:
dicc = { 'rojo' : (255,0,0), 'verde': (0,255,0), 'azul' : (0,0,255) }
for color in dicc :
    print("El código RGB de " +color+ " es " + str(dicc[color]))

El código RGB de rojo es (255, 0, 0)
El código RGB de verde es (0, 255, 0)
El código RGB de azul es (0, 0, 255)


In [55]:
for color in dicc.keys() :
    print("El código RGB de " +color+ " es " + str(dicc[color]))

El código RGB de rojo es (255, 0, 0)
El código RGB de verde es (0, 255, 0)
El código RGB de azul es (0, 0, 255)


In [56]:
for rgb in dicc.values() :
    print(str(rgb))

(255, 0, 0)
(0, 255, 0)
(0, 0, 255)


In [57]:
for color, rgb in dicc.items() :
    print("El código RGB de " +color+ " es " + str(rgb))

El código RGB de rojo es (255, 0, 0)
El código RGB de verde es (0, 255, 0)
El código RGB de azul es (0, 0, 255)


## Construcción de listas por comprensión
La comprensión de listas permite crear listas usando una sintaxis similar a la que se usa en teoría de conjuntos.

S = { 2 * x | x in { 0 .. 9 } }

In [58]:
s = [ 2 * x for x in range(10) ]
print( s )

[0, 2, 4, 6, 8, 10, 12, 14, 16, 18]


Se puede usar condicionales en la comprensión de listas.

In [59]:
s = [ 2 * x for x in range(10) if x % 3 == 0 ]
print(s)

[0, 6, 12, 18]


Es posible recorrer más de una variable.

In [60]:
s = [ (x,y) for x in ['a','b','c'] for y in ['1','2'] ]
print(s )

[('a', '1'), ('a', '2'), ('b', '1'), ('b', '2'), ('c', '1'), ('c', '2')]


## Construcción de diccionarios por comprensión

In [61]:
s = { x : len(x) for x in ['Rojo','Azul','Verde'] }
print(s)

{'Rojo': 4, 'Azul': 4, 'Verde': 5}



Al igual que con las listas, se pueden usar más de una variable y usar condicionales.

In [62]:
s = { z:len(z) for z in [ x+" "+y for x in ['Rojo','Azul','Verde'] if not x.startswith('R') for y in ['Oscuro','Claro'] ] }
print(s)

{'Azul Oscuro': 11, 'Azul Claro': 10, 'Verde Oscuro': 12, 'Verde Claro': 11}


# Importar funciones y módulos 
Ya vimos en varios ejemplos como usar funciones de la instalación estándar de python.
Sin embargo gran parte de la funcionalidad de python proviene de funciones no incluidas dentro de esta, sino que están incluidas en otros **módulos**.

In [63]:
import Bio # Carga el módulo de biopython

Se puede cargar solo lo necesario de un módulo.

In [64]:
from numpy import array # Carga 'array' desde el modulo numpy.

Se puede usar un alias en la importación.

In [65]:
from numpy import array as ar
ar([1,2,4]) # en lugar de array([1,2,4])

array([1, 2, 4])

# Definir funciones propias

No solo podemos usar la funciones propias de Python, sino que podemos crear las nuestras propias.

In [66]:
def contarCaracteres( cadena ) :
    cadena = cadena.upper()
    return { x: cadena.count(x) for x in set(cadena) }

contarCaracteres('Buenos dias')

{' ': 1,
 'A': 1,
 'B': 1,
 'D': 1,
 'E': 1,
 'I': 1,
 'N': 1,
 'O': 1,
 'S': 2,
 'U': 1}

# Objetos
* Los objetos son estructuras que agrupan valores y funciones (o métodos) para esos datos.
* Es necesario definir una clase, que es el molde para construir los objetos de ese tipo.
* El operador '**.**' (punto)se usa para especificar un método o un valor de un objeto:
  * objeto.metodo( argumentos )
  * objeto.valor

* Por ejemplo podemos pensar objetos de una clase particular para representar personas.
 * Nos interesan algunos datos particulares de las personas: nombre, apellido y DNI.
 * Nos interesa que las personas **sepan** saludar y decir cual es su DNI.

In [67]:
class Persona:
    def __init__(self, nombre , apellido, dni) :
        self.nombre = nombre
        self.apellido = apellido
        self.dni = dni
    def saludar(self) :
        return "Mi nombre es " + self.nombre + " " + self.apellido
    def informarDNI(self):
        return "Mi DNI es " + self.dni
    
persona_1 = Persona("Laura","Lopez","12345678")

print(persona_1.nombre)
print(persona_1.saludar())

Laura
Mi nombre es Laura Lopez


# Lectura y escritura de archivos

Tanto para leer o escribir un archivo existente, o crear uno nuevo es necesario "abrirlo".
Esto se hace con la función **open()**. Lo que podemos hacer con ese archivo abierto depende de los argumentos que le pasemos a la función. Finalmente, hay que "cerrar" el archivo. Con la función **close()**

In [68]:
fh = open( 'mi_archivo.txt', 'w')
# El primer argumento es el nombre del archivo, el segundo es el modo de acceso.
# En este caso es de escritura 'w' : write
fh.write("Este es el contenido del archivo\n")
# \n representa el caracter de fin de línea.
fh.close()

Los modos de acceso para archivos de texto son:
* w - Write / Escritura
* r - Read / Lectura
* a - Append / Agrega nuevos datos a un archivo existente
* r+ - Read+Write / Lectura y escritura simultánea.

In [69]:
filename = 'sam_file.extract.txt'
fh = open( filename, 'r')
for line in fh :
    fields = line.strip().split()
    print(fields[0] + " - " + fields[1][:10])
fh.close()

@SRR6749457.1.1 - TTCTGGCGCA
@SRR6749457.1.2 - TTTTCCTATT
@SRR6749457.2.1 - TTAATACCTT
@SRR6749457.2.2 - CTTTCCTCCC
@SRR6749457.3.1 - TTAATGGTGA
@SRR6749457.3.2 - CACAACTAGT
@SRR6749457.4.1 - TAATACCAGG
@SRR6749457.4.2 - CCTTTAACCT
@SRR6749457.5.1 - TTTCAGCACA
@SRR6749457.5.2 - TTTCTCTCCC


Lo mismo se puede hacer usando la sentencia **with**, esta misma se encarga de cerrar el archivo.

In [70]:
filename = 'sam_file.extract.txt'
with open( filename, 'r') as fh:
    for line in fh :
        fields = line.strip().split()
        print(fields[0] + " - " + fields[1][:10])

@SRR6749457.1.1 - TTCTGGCGCA
@SRR6749457.1.2 - TTTTCCTATT
@SRR6749457.2.1 - TTAATACCTT
@SRR6749457.2.2 - CTTTCCTCCC
@SRR6749457.3.1 - TTAATGGTGA
@SRR6749457.3.2 - CACAACTAGT
@SRR6749457.4.1 - TAATACCAGG
@SRR6749457.4.2 - CCTTTAACCT
@SRR6749457.5.1 - TTTCAGCACA
@SRR6749457.5.2 - TTTCTCTCCC


# Expresiones regulares
Si se tienen las siguientes cadenas.
* 'a'
* 'aa'
* 'aaa'
* 'aaaa'
* etc...
Todas tienen algo en común, son sucesiones de 'a' y pueden ser representadas con una **expresión regular**.
Las expresiones regulares se describen con cadenas de caracteres donde algunos símbolos tienen un significado especial. En particular, para este caso la expresión regular es "a+". Significa 'la letra a una o más veces'.

| Símbolo | Significado                                             |
|---------|---------------------------------------------------------|
| .       | Reconoce cualquier caracter                             |
| *       | Reconoce el último caracter cero o más veces            |
| +       | Reconoce el último caracter una o más veces             |
| ?       | Reconoce el último caracter cero o una vez              |
| ^       | Reconoce el inicio de un string                         |
| $       | Reconoce el fin de un string                            |
| []      | Reconoce un subconjunto de caracteres (dentro de [])    |
| ()      | Define grupos. Útil para hacer reemplazos               |
| \       | Símbolo de escape para caracteres especiales            |





## Algunos ejemplos
* Cadenas de ácidos nucleicos : **^[ACTGNactgn-]+\$**
* pfam_acc : **^PF[0-9][0-9][0-9][0-9][0-9]\$** o **^PF[0-9]{5}\$** o **^PF\d{5}\$**

## Búsqueda y substitución de expresiones regulares
El módulo **re** permite hacer búsquedas y reemplazos de expresiones regulares.

In [71]:
import re
ids = ['PF00001','PF89347','PF213314']
pattern = re.compile("^PF[0-9][0-9][0-9][0-9][0-9]$")
for id in ids:
    m = pattern.match(id)
    if m : print(m.group() + " es un pfam accesion válido")
    else : print(id + " no un pfam accesion válido")

PF00001 es un pfam accesion válido
PF89347 es un pfam accesion válido
PF213314 no un pfam accesion válido


In [72]:
a = 'DNI:12345678;Laura Lopez'
pattern = re.compile("^(DNI):([0-9]+);(.+)$")
re.sub( pattern, 'El \\1 de \\3 es \\2', a )
#re.sub( r"^(DNI):([0-9]+);(.+)$", 'El \\1 de \\3 es \\2', a )


'El DNI de Laura Lopez es 12345678'

## Otras funciones importantes para usar con expresiones regulares
* re.search : Busca una expresión regular en cualquier parte de un string. Devuelve solo el primer resultado.
* re.split : Divide un string por una expresión regular.
* re.findall : Encuentra todas las ocurrencias de la expresión regular en un string.

In [73]:
s = "aaabccbdddbaaabcccccb"
exp = re.compile("c+b")
m1 = exp.match( s )
print(m1)
m2 = exp.search( s )
print (m2.group())
m3 = exp.findall( s )
for mx in m3 :
    print (mx)

None
ccb
ccb
cccccb


## Donde obtener la documentación de las expresiones regulares

https://docs.python.org/3.4/library/re.html

# Ejecutar comandos externos en python
* Python permite ejecutar procesos externos y recuperar los datos de su salida.
* Todos los procesos que se ejecutan en una PC, tienen tres (al menos) __buffers__ de memoria que pueden usarse para comunicarse con otros procesos:
 * Entrada estándar : stdin . Permite leer datos provistos por otros programas o el usuario.
 * Salida estándar : stdout . Escribe los resultados.
 * Error estándar : stderr  . Informa de errores en la ejecución.
<img style="width:45%" src='images/std_buffers.png'>

In [74]:
import subprocess
from subprocess import PIPE

In [75]:
comando = 'dir'
p = subprocess.run([comando], stdout = PIPE)
print( "Error code:" + str( p.returncode ) )
for archivo in p.stdout.split(): 
    print( str( archivo.decode('UTF-8')) )

Error code:0
exercises.ipynb
Presentation.ipynb
secuencias_filtered.txt
images
Presentation.slides.html
secuencias.txt
makeIndex.py
README.md
mi_archivo.txt
sam_file.extract.txt


Donde obtener la documentación de **subprocess**<br>
https://docs.python.org/3/library/subprocess.html

# Manejo de archivos
Python ofrece funciones para realizar tareas comunes con archivos y carpetas como copiar, mover, etc.


Para tener esta funcionalidad es necesario cargar el módulo **os**, **os.path** y shutil

In [76]:
import os
import os.path as path
import shutil

## Obtener y cambiar la carpeta de trabajo

In [77]:
oldDir = os.getcwd()
print( "Current working folder: " + oldDir )
newDir = os.path.join( oldDir,'images')
print( "New working folder: " + newDir )
os.chdir( newDir )

# Vuelve a la directorio inicial
os.chdir( oldDir )

Current working folder: /home/curso/python-leloir-course
New working folder: /home/curso/python-leloir-course/images


## Crear una carpeta

In [78]:
folder = 'mi_carpeta'
if not os.path.exists( folder ) :
    os.mkdir(folder)

## Listar archivos

In [79]:
print( os.listdir() )

['.ipynb_checkpoints', 'makeIndex.py', 'mi_archivo.txt', 'README.md', 'mi_carpeta', 'secuencias.txt', '.git', '.gitignore', 'exercises.ipynb', 'sam_file.extract.txt', 'secuencias_filtered.txt', 'images', 'Presentation.ipynb', 'Presentation.slides.html']


## Elimimar una carpeta

In [80]:
os.rmdir(folder) # Cuidado, realmente van a borrar una carpeta !!

## Copiar archivos 

In [81]:
shutil.copy( 'README.md', 'README.md.copia' )

'README.md.copia'

## Mover archivos


In [82]:
shutil.move('README.md.copia' ,'README.md.copia2')

'README.md.copia2'

## Borrar archivos

In [83]:
os.remove( 'README.md.copia2' )

## Más info:

* https://docs.python.org/3/library/shutil.html
* https://docs.python.org/3/library/os.html
* https://docs.python.org/3/library/os.path.html