---
# Estructura del lenguaje
* ## Listas y Tuplas
* ## Diccionarios
* ## DataFrames
---

## <font color = blue>Listas y tuplas</font>

* ### Son de estructura similar
* ### Las listas están delimitadas por corchetes `[]` y las tuplas por paréntesis `()`  
* ### Las listas son dinámicas y las tuplas estáticas (inmutables)
* ### Pueden contener diferentes objetos: números, cadenas, funciones, listas, tuplas, dataframes, etc.
* ### Cada valor es un elemento.

El índice de los elementos empieza desde el cero `0`

### <font color = limegreen>Crear una lista</font> 

In [None]:
# se crea un objeto vacío
lista = list()
lista

In [None]:
# se crea un objeto vacío
lista = []
lista

In [None]:
aa = ['A', 'R', 'C', 'Q', 'G', 'H', 'K', 'M', 'F', 'P', 'S', 'V']
aa

In [None]:
aminoacidos = ['Ala', 'Arg', 'Cys', 'Gln', 'Gly', 'His', 'Lys', 'Met', 'Phe', 'Pro', 'Ser', 'Val']
aminoacidos

In [None]:
# Agrega un elemento al final de la lista, la fenilalanina
aminoacidos.append('Phe')

In [None]:
aminoacidos

In [None]:
# El primer argumento es el índice del ítem y lo que se insertará
aminoacidos.insert(1, 'XXX')

In [None]:
aminoacidos

In [None]:
# Quita el primer elemento de la lista cuyo valor sea x
aminoacidos.remove('XXX')

In [None]:
aminoacidos

In [None]:
# Quita el elemento en la posición dada de la lista, y lo imprime
aminoacidos.pop(9)

In [None]:
aminoacidos

In [None]:
# Quita todos los elementos de la lista
aminoacidos.clear()

In [None]:
aminoacidos

In [None]:
# volverla a definir
aminoacidos = ['Ala', 'Arg', 'Cys', 'Gln', 'Gly', 'His', 'Lys', 'Met', 'Phe', 'Pro', 'Ser', 'Val']

In [None]:
# Devuelve un índice basado en cero en la lista del primer elemento cuyo valor sea x
aminoacidos.index('Arg')

In [None]:
# Devuelve el número de veces que x aparece en la lista.
aminoacidos.count('Cys')

In [None]:
# Invierte los elementos de la lista
aminoacidos.reverse()

In [None]:
aminoacidos

In [None]:
# Ordena los elementos de la lista
aminoacidos.sort()

In [None]:
aminoacidos

## <font color = red>Ejercicio:</font>
- Cómo saber la cantidad de elementos de la lista `aminoacidos`

### <font color = limegreen>Acceso a los elementos</font> 

<img src="https://raw.githubusercontent.com/Bioinformatica2020/Anexos/master/extraccion_de_lista.jpg" width = 80%>

In [None]:
lista = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [None]:
# acceso a un elemento
lista[5]

In [None]:
# extraer un segmento de la lista
lista[0:5]

In [None]:
lista[3:8]

In [None]:
# extrae todo lo que está adelande de la primera posición asignada
lista[0:]

In [None]:
# extrae todo lo que está adelande de la 5ta posición asignada
lista[5:]

In [None]:
# extrae todo lo que está hasta la 5ta posición asignada
lista[:5]

### <font color = limegreen>Crear una tupla</font>

In [None]:
tupla = (1, 'a', 3, 'z', 5, [1,2,3,4])

In [None]:
tupla

In [None]:
# acceder a los elementos de la tupla
tupla[4]

## <font color = red>Ejercicio:</font>
- Convertir la lista `aminoacidos` en una tupla

## <font color = blue>Diccionarios</font>

* ### Es una estructura de datos que permite almacenar cualquier tipo de objeto
* ### Permite identificar cada elemento por una clave
* ### Un diccionario está delimitado por llaves `{}`
* ### Las parejas clave-valor se separan por comas `,`
* ### La clave y el valor se separan por dos puntos `:`

In [None]:
# ejemplo
nucleotidos = {'A':'adenine', 'T':'thymine', 'G':'guanine', 'C':'cytosine'}
nucleotidos

## <font color = red>Ejercicio:</font>
1. Transforma la lista `aminoacidos` en un diccionario, de tal forma que la clave esté en código de una letra, ejemplo {'L': 'Leu', ...}
2. Al nuevo diccionario llámalo `amino_dict`

In [None]:
amino_dict = dict(zip(aa, aminoacidos))

In [None]:
amino_dict

### <font color = limegreen>Cómo acceder a los valores del diccionario</font> 

In [None]:
# accedemos mediante la clave del elemento
amino_dict['H']

### <font color = green>Cómo obtener todas las claves del diccionario</font> 

In [None]:
amino_dict.keys()

## <font color = red>Ejercicio:</font>
1. Cómo transformarías `amino_dict.keys()` en una lista

### <font color = green>Cómo obtener todos los valores del diccionario</font> 

In [None]:
amino_dict.values()

## <font color = red>Ejercicio:</font>
1. Cómo transformarías `amino_dict.values()` en una lista

### <font color = green>Eliminar claves del diccionario</font> 
- Recibe como parámetro una clave, elimina esta y devuelve su valor. Si no lo encuentra, devuelve error.

In [None]:
amino_dict.pop('H')

In [None]:
amino_dict

### <font color = green>Agregar elementos a un diccionario</font>
- Recibe como parámetro otro diccionario.
- Si se tienen claves iguales, actualiza el valor de la clave repetida; si no hay claves iguales, este par clave-valor es agregado al diccionario.

In [None]:
aminoacidos2 = {'I':'Ile', 'Y':'Tyr'}
aminoacidos2

In [None]:
# actualizando el diccionario
amino_dict.update(aminoacidos2)

In [None]:
# cómo quedó finalmente el nuevo diccionario
amino_dict

# Responder encuesta

https://forms.gle/RtAGaF98HagywgUS7

# Programación estructurada

## <font color = blue>Estructuras de control de flujo condicionales</font>
- ### <font color = limegreen>if</font>, significa "si" (condición).
- ### <font color = limegreen>elif</font>, es una segunda condición y se evalúa si `if` es `False`
- ### <font color = limegreen>else</font>, significa "si no".
### <font color = magenta>Los condicionales son las estructuras de control más importantes en toda la programación</font>
<img src="https://raw.githubusercontent.com/Bioinformatica2020/Anexos/master/if_else.jpg" width = 60%>

<img src="https://raw.githubusercontent.com/Bioinformatica2020/Anexos/master/if_elif_else.jpg" width = 40%>

---
Puedes ingresar a este sitio, hay varios ejemplos de condicionales  
https://www.mclibre.org/consultar/python/lecciones/python-if-else.html

---

### <font color = green>Un ejemplo bastante sencillo</font>

In [None]:
#
numero = 0
if numero > 0:
    print('Tu número es positivo')
else:
    print('Tu número es negativo')

#### te das cuenta que si ingresas `0` lo registra como número negativo, cómo se resuelve el reconocimiento del `0`

In [None]:
numero = 0
if numero > 0:
    print('Tu número es positivo')
elif numero == 0:
    print('Tu número es 0')
else:
    print('Tu número es negativo')

---
# <font color = blue>Estructuras de control iterativas</font>
---
# <font color = orange>En informática iteración significa que se van a usar bucles</font>
# <font color = orange>Un bucle es una parte de código que se repite una y otra vez</font>
---

<img src="https://raw.githubusercontent.com/Bioinformatica2020/Anexos/master/for_loop.jpg" width = 80%> <br>

## Iteración <img src="https://raw.githubusercontent.com/Bioinformatica2020/Anexos/master/ezgif.com-crop.gif" width = 40%> <br>
---

---
## Ejercicio:
#### Usando la variable sec realiza las siguientes acciones para cada secuencia:

- Imprime un contador
- Imprime la longitud de cada secuencia
- Imprime la cantidad de A, T, G y C
- Calcula el % de GC
- Cantidad del patrón GC
- Convierte cada secuencia a mayúsculas
---

In [None]:
from collections import Counter # módulo para cuantificar cadenas de  caracteres

In [None]:


sec = ['caagggatctatgatagaccac','tatgccctcgtctatacacctaggcgc','taagcgcatatctatcgcaaatccagtt',
       'gtcttatgcctgtgtcaggatctacttcct','aaattagttttctgtgtttagagcacct','ggcctcacatgagtctacagacct',
       'agtacccccatttgtcaagcg','ttaggggtatttacacagcccgcgtac','attggctcagaaccggagctatcaaggact',
       'ttaccgtactcgcctca','ggtgaactccccctagtattgtgg','ttgctctggcggatttcttcaggc',
       'ccagttataactcctgagtattct','gtcaatttgaatggggtttgac','tactccggtgtgatccattatggagat',
       'acggtaaaacgatggacgttgtccca','ggcctcattctccttcccataa','gtacatggttctccccgcgatcat',
       'ccatcgacaatgagctaaacctg','gctatgctgggtcctaccggcaacc','gcgtaactaatgagcatcctat',
       'agagtaaaggtaatgggtggttat','ctaggtatcgactgtcgaataatccgtcc','catctgtatccc',
       'cttgcccgtctacatggcctaggggca','tgctaaacggccacatcccaagaccctg','cccgaggcgacagttcatcgcccatgacg',
       'acgcttgaccgtcagtgtaagtccg','gaatctcaaaacgcataatgccaata','aatgcgccagtgtaaaagtattgcggat',
       'cgggagacaccttatgtcgcaagatct','ggaaccacatccataacacacgtctc','cacacactctttatcata',
       'tacgcgtgct','cactttcgatag','gtgtggggttttggaacttcagaataga', 'ggtgaactccccctagtattgtgg',
       'gtggccagagcgcactatctagt','gccccccgattacgatacacgcctatgct','tcggtcacccatcacgtaaattggagtaat',
       'gggttcgtcccccagttccctcttccc','ttgatggctaggtctgtcgatttaag','gtcttggctgtttccttggagtccgtc',
       'aataggcgcgatgttgtgtgtcaat','acacgcaagccacgtcgtttgta','tacgtaggctgggctgtgcgattgcgtt',
       'agcagtgggatttatagttattta','cgaaagcgaggccatcactggtgaa','gctatcatctggctacaaaaaatagacct',
       'ttccccgtaggagaaccaagagaa','tagcgtgcgttctctactataaga', 'ttaccgtactcgcctca',
       'ttaccgtactcgcctca','ggtgaactccccctagtattgtgg','ttgctctggcggatttcttcaggc',
       'ccagttataactcctgagtattct','gtcaatttgaatggggtttgac','tactccggtgtgatccattatggagat',
       'acggtaaaacgatggacgttgtccca','ggcctcattctccttcccataa','gtacatggttctccccgcgatcat',
       'ccatcgacaatgagctaaacctg','gctatgctgggtcctaccggcaacc','gcgtaactaatgagcatcctat',
       'agagtaaaggtaatgggtggttat','ctaggtatcgactgtcgaataatccgtcc','catctgtatccc', 'ttaccgtactcgcctca',
       'cttgcccgtctacatggcctaggggca','tgctaaacggccacatcccaagaccctg','cccgaggcgacagttcatcgcccatgacg',
       'acgcttgaccgtcagtgtaagtccg','gaatctcaaaacgcataatgccaata','aatgcgccagtgtaaaagtattgcggat',
       'cgggagacaccttatgtcgcaagatct','ggaaccacatccataacacacgtctc','cacacactctttatcata',
       'tacgcgtgct','cactttcgatag','gtgtggggttttggaacttcagaataga', 'ttgctctggcggatttcttcaggc',
       'caagggatctatgatagaccac','tatgccctcgtctatacacctaggcgc','taagcgcatatctatcgcaaatccagtt',
       'gtcttatgcctgtgtcaggatctacttcct','aaattagttttctgtgtttagagcacct','ggcctcacatgagtctacagacct',
       'agtacccccatttgtcaagcg','ttaggggtatttacacagcccgcgtac','attggctcagaaccggagctatcaaggact']



#### cuántas secuencias tiene la variable sec

#### ¿hay secuencias duplicadas?

#### 2 maneras de agregar un contador

#### longitud de la secuencia

#### cantidad de A, T, G y C

#### % de GC

#### patrón GC

#### ecuencia en mayúsculas

## uso de consicionales

#### filtrar aquellas secuencias con %GC menor a 50

#### filtrar aquellas secuencias con longitud mayor o igual a 25

## Integramos todas las instrucciones en un solo comando

---
## Ejercicio de tarea:
#### Usando la variable sec realiza las siguientes acciones solo para aquellas secuencias que tengan el patrón GC:

- Imprime un contador
- Imprime la longitud de cada secuencia
- Imprime la cantidad de A, T, G y C
- Calcula el % de GC
    - Cuántas secuencias tienen un %GC mayor o igual a 50
- Cantidad del patrón GC
- Convierte cada secuencia a mayúsculas
- Guardar la información en un dataframe, con columnas etiquetadas
---