---
# Estructura del lenguaje
* ## Listas y Tuplas
* ## Cadenas de caracteres (expresiones regulares)
* ## Diccionarios
* ## DataFrames
---

## Comentarios en programación

#### Es recomendable agregar comentarios cuando se escribe código, pues ayuda a puntualizar acciones específicas, o a tener un control sobre los que está haciendo cada paso del código.

### <font color = limegreen>Pueden usar una de estas formas:</font>  
* Para descripción de código o funciones usar triple comilla doble/simple `"""` o `'''` antes y después de la descripción, en filas diferentes.
* Para comentarios usar el símbolo de numeral `#`

In [None]:
# El siguiente código obtiene el grado de hidrofobicidad de péptidos

def rev_com():
    """
    El siguiente código obtiene el reverso complementario de una secuencia de nucleótidos.
    """
    
    print('Secuencia')

In [None]:
rev_com()

#### al ejecutar la ayuda `?` verán la descripción de la función

In [None]:
?rev_com

In [None]:
# Um ejemplo real de cómo usan la descripción y comentarios para dar información del código

print('https://upsetplot.readthedocs.io/en/stable/_modules/upsetplot/plotting.html#UpSet')

## <font color = blue>Listas y tuplas</font>

* ### Son de estructura similar
* ### Las listas están delimitadas por corchetes `[]` y las tuplas por paréntesis `()`  
* ### Las listas son dinámicas y las tuplas estáticas (inmutables)
* ### Pueden contener: números, cadenas, funciones, listas, tuplas, arreglos, etc.
* ### También pueden contener diferentes objetos.
* ### Cada valor es un elemento.

El índice de los elementos empieza desde el cero `0`

### <font color = limegreen>Crear una lista</font> 

In [None]:
# se crea un objeto vacío
lista = list()
lista

In [None]:
# se crea un objeto vacío
lista = []
lista

In [None]:
aa = ['A', 'R', 'C', 'Q', 'G', 'H', 'K', 'M', 'F', 'P', 'S', 'V']
aa

In [None]:
aminoacidos = ['Ala', 'Arg', 'Cys', 'Gln', 'Gly', 'His', 'Lys', 'Met', 'Phe', 'Pro', 'Ser', 'Val']
aminoacidos

In [None]:
# Agrega un elemento al final de la lista, la fenilalanina
aminoacidos.append('Phe')

In [None]:
aminoacidos

In [None]:
# El primer argumento es el índice del ítem y lo que se insertará
aminoacidos.insert(1, 'XXX')

In [None]:
aminoacidos

In [None]:
# Quita el primer elemento de la lista cuyo valor sea x
aminoacidos.remove('XXX')

In [None]:
aminoacidos

In [None]:
# Quita el elemento en la posición dada de la lista, y lo imprime
aminoacidos.pop(9)

In [None]:
aminoacidos

In [None]:
# Quita todos los elementos de la lista
aminoacidos.clear()

In [None]:
aminoacidos

In [None]:
# volverla a definir
aminoacidos = ['Ala', 'Arg', 'Cys', 'Gln', 'Gly', 'His', 'Lys', 'Met', 'Phe', 'Pro', 'Ser', 'Val']

In [None]:
# Devuelve un índice basado en cero en la lista del primer elemento cuyo valor sea x
aminoacidos.index('Arg')

In [None]:
# Devuelve el número de veces que x aparece en la lista.
aminoacidos.count('Cys')

In [None]:
# Invierte los elementos de la lista
aminoacidos.reverse()

In [None]:
aminoacidos

In [None]:
# Ordena los elementos de la lista
aminoacidos.sort()

In [None]:
aminoacidos

## <font color = red>Ejercicio:</font>
- Cómo saber la cantidad de elementos de la lista `aminoacidos`

### <font color = limegreen>Acceso a los elementos</font> 

In [None]:
# acceso a un elemento
aminoacidos[5]

In [None]:
# extraer un segmento de la lista
aminoacidos[0:5]

<img src="https://raw.githubusercontent.com/Bioinformatica2020/Anexos/master/extraccion_de_lista.jpg" width = 80%>

In [1]:
lista = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

### <font color = limegreen>Crear una tupla</font>

In [None]:
tupla = (1, 'a', 3, 'z', 5, [1,2,3,4])

In [None]:
tupla

In [None]:
# acceder a los elementos de la tupla
tupla[4]

## <font color = red>Ejercicio:</font>
- Cómo convertirías la lista `aminoacidos` en una tupla

## <font color = blue>Diccionarios</font>

* ### Es una estructura de datos que permite almacenar cualquier tipo de objeto
* ### Permite identificar cada elemento por una clave
* ### Un diccionario está delimitado por llaves `{}`
* ### Las parejas clave-valor se separan por comas `,`
* ### La clave y el valor se separan por dos puntos `:`

In [None]:
# ejemplo
nucleotidos = {'A':'adenine', 'T':'thymine', 'G':'guanine', 'C':'cytosine'}
nucleotidos

## <font color = red>Ejercicio:</font>
1. Transforma la lista `aminoacidos` en un diccionario, de tal forma que la clave esté en código de una letra, ejemplo {'L': 'Leu', ...}
2. Al nuevo diccionario llámalo `amino_dict`

In [None]:
amino_dict = dict(zip(aa, aminoacidos))

In [None]:
amino_dict

### <font color = limegreen>Cómo acceder a los valores del diccionario</font> 

In [None]:
# accedemos mediante la clave del elemento
amino_dict['H']

### <font color = limegreen>Cómo obtener todas las claves del diccionario</font> 

In [None]:
amino_dict.keys()

## <font color = red>Ejercicio:</font>
1. Cómo transformarías `amino_dict.keys()` en una lista

### <font color = limegreen>Cómo obtener todos los valores del diccionario</font> 

In [None]:
amino_dict.values()

## <font color = red>Ejercicio:</font>
1. Cómo transformarías `amino_dict.values()` en una lista

### <font color = limegreen>Eliminar claves del diccionario</font> 
- Recibe como parámetro una clave, elimina esta y devuelve su valor. Si no lo encuentra, devuelve error.

In [None]:
amino_dict.pop('H')

In [None]:
amino_dict

### <font color = limegreen>Agregar elementos a un diccionario</font>
- Recibe como parámetro otro diccionario.
- Si se tienen claves iguales, actualiza el valor de la clave repetida; si no hay claves iguales, este par clave-valor es agregado al diccionario.

In [None]:
aminoacidos2 = {'I':'Ile', 'Y':'Tyr'}
aminoacidos2

In [None]:
# actualizando el diccionario
amino_dict.update(aminoacidos2)

In [None]:
# cómo quedó finalmente el nuevo diccionario
amino_dict

## <font color = blue>Cadenas de  caracteres</font>

* ### Las cadenas o _strings_ almacenan secuencias de caracteres.
* ### Para crear una, es necesario incluir el texto entre comillas dobles `"` o simples `'`.

El índice de los elementos empieza desde el cero `0`