---
# Estructura del lenguaje
* ## Listas y Tuplas
* ## Cadenas de caracteres (expresiones regulares)
* ## Diccionarios
* ## DataFrames
---

## Comentarios en programación

#### Es recomendable agregar comentarios cuando se escribe código, pues ayuda a puntualizar acciones específicas, o a tener un control sobre los que está haciendo cada paso del código.

### <font color = limegreen>Pueden usar una de estas formas:</font>  
* Para descripción de código o funciones usar triple comilla doble/simple `"""` o `'''` antes y después de la descripción, en filas diferentes.
* Para comentarios usar el símbolo de numeral `#`

In [1]:
# El siguiente código obtiene el grado de hidrofobicidad de péptidos

def rev_com():
    """
    El siguiente código obtiene el reverso complementario de una secuencia de nucleótidos.
    """
    
    print('Secuencia')

In [2]:
rev_com()

Secuencia


#### al ejecutar la ayuda `?` verán la descripción de la función

In [3]:
?rev_com

In [4]:
# Um ejemplo real de cómo usan la descripción y comentarios para dar información del código

print('https://upsetplot.readthedocs.io/en/stable/_modules/upsetplot/plotting.html#UpSet')

https://upsetplot.readthedocs.io/en/stable/_modules/upsetplot/plotting.html#UpSet


## <font color = blue>Listas y tuplas</font>

* ### Son de estructura similar
* ### Las listas están delimitadas por corchetes `[]` y las tuplas por paréntesis `()`  
* ### Las listas son dinámicas y las tuplas estáticas (inmutables)
* ### Pueden contener: números, cadenas, funciones, listas, tuplas, arreglos, etc.
* ### También pueden contener diferentes objetos.
* ### Cada valor es un elemento.

El índice de los elementos empieza desde el cero `0`

### <font color = limegreen>Crear una lista</font> 

In [5]:
# se crea un objeto vacío
lista = list()
lista

[]

In [6]:
# se crea un objeto vacío
lista = []
lista

[]

In [7]:
aa = ['A', 'R', 'C', 'Q', 'G', 'H', 'K', 'M', 'F', 'P', 'S', 'V']
aa

['A', 'R', 'C', 'Q', 'G', 'H', 'K', 'M', 'F', 'P', 'S', 'V']

In [8]:
aminoacidos = ['Ala', 'Arg', 'Cys', 'Gln', 'Gly', 'His', 'Lys', 'Met', 'Phe', 'Pro', 'Ser', 'Val']
aminoacidos

['Ala',
 'Arg',
 'Cys',
 'Gln',
 'Gly',
 'His',
 'Lys',
 'Met',
 'Phe',
 'Pro',
 'Ser',
 'Val']

In [9]:
# Agrega un elemento al final de la lista, la fenilalanina
aminoacidos.append('Phe')

In [10]:
aminoacidos

['Ala',
 'Arg',
 'Cys',
 'Gln',
 'Gly',
 'His',
 'Lys',
 'Met',
 'Phe',
 'Pro',
 'Ser',
 'Val',
 'Phe']

In [11]:
# El primer argumento es el índice del ítem y lo que se insertará
aminoacidos.insert(1, 'XXX')

In [12]:
aminoacidos

['Ala',
 'XXX',
 'Arg',
 'Cys',
 'Gln',
 'Gly',
 'His',
 'Lys',
 'Met',
 'Phe',
 'Pro',
 'Ser',
 'Val',
 'Phe']

In [13]:
# Quita el primer elemento de la lista cuyo valor sea x
aminoacidos.remove('XXX')

In [14]:
aminoacidos

['Ala',
 'Arg',
 'Cys',
 'Gln',
 'Gly',
 'His',
 'Lys',
 'Met',
 'Phe',
 'Pro',
 'Ser',
 'Val',
 'Phe']

In [15]:
# Quita el elemento en la posición dada de la lista, y lo imprime
aminoacidos.pop(9)

'Pro'

In [16]:
aminoacidos

['Ala',
 'Arg',
 'Cys',
 'Gln',
 'Gly',
 'His',
 'Lys',
 'Met',
 'Phe',
 'Ser',
 'Val',
 'Phe']

In [17]:
# Quita todos los elementos de la lista
aminoacidos.clear()

In [18]:
aminoacidos

[]

In [19]:
# volverla a definir
aminoacidos = ['Ala', 'Arg', 'Cys', 'Gln', 'Gly', 'His', 'Lys', 'Met', 'Phe', 'Pro', 'Ser', 'Val']

In [20]:
# Devuelve un índice basado en cero en la lista del primer elemento cuyo valor sea x
aminoacidos.index('Arg')

1

In [21]:
# Devuelve el número de veces que x aparece en la lista.
aminoacidos.count('Cys')

1

In [22]:
# Invierte los elementos de la lista
aminoacidos.reverse()

In [23]:
aminoacidos

['Val',
 'Ser',
 'Pro',
 'Phe',
 'Met',
 'Lys',
 'His',
 'Gly',
 'Gln',
 'Cys',
 'Arg',
 'Ala']

In [24]:
# Ordena los elementos de la lista
aminoacidos.sort()

In [25]:
aminoacidos

['Ala',
 'Arg',
 'Cys',
 'Gln',
 'Gly',
 'His',
 'Lys',
 'Met',
 'Phe',
 'Pro',
 'Ser',
 'Val']

## <font color = red>Ejercicio:</font>
- Cómo saber la cantidad de elementos de la lista `aminoacidos`

### <font color = limegreen>Acceso a los elementos</font> 

In [26]:
# acceso a un elemento
aminoacidos[5]

'His'

In [27]:
# extraer un segmento de la lista
aminoacidos[0:5]

['Ala', 'Arg', 'Cys', 'Gln', 'Gly']

### <font color = limegreen>Crear una tupla</font>

In [28]:
tupla = (1, 'a', 3, 'z', 5, [1,2,3,4])

In [29]:
tupla

(1, 'a', 3, 'z', 5, [1, 2, 3, 4])

In [30]:
# acceder a los elementos de la tupla
tupla[4]

5

## <font color = red>Ejercicio:</font>
- Cómo convertirías la lista `aminoacidos` en una tupla

## <font color = blue>Diccionarios</font>

* ### Es una estructura de datos que permite almacenar cualquier tipo de objeto
* ### Permite identificar cada elemento por una clave
* ### Un diccionario está delimitado por llaves `{}`
* ### Las parejas clave-valor se separan por comas `,`
* ### La clave y el valor se separan por dos puntos `:`

In [31]:
# ejemplo
nucleotidos = {'A':'adenine', 'T':'thymine', 'G':'guanine', 'C':'cytosine'}
nucleotidos

{'A': 'adenine', 'T': 'thymine', 'G': 'guanine', 'C': 'cytosine'}

## <font color = red>Ejercicio:</font>
1. Transforma la lista `aminoacidos` en un diccionario, de tal forma que la clave esté en código de una letra, ejemplo {'L': 'Leu', ...}
2. Al nuevo diccionario llámalo `amino_dict`

In [32]:
amino_dict = dict(zip(aa, aminoacidos))

In [33]:
amino_dict

{'A': 'Ala',
 'R': 'Arg',
 'C': 'Cys',
 'Q': 'Gln',
 'G': 'Gly',
 'H': 'His',
 'K': 'Lys',
 'M': 'Met',
 'F': 'Phe',
 'P': 'Pro',
 'S': 'Ser',
 'V': 'Val'}

### <font color = limegreen>Cómo acceder a los valores del diccionario</font> 

In [34]:
# accedemos mediante la clave del elemento
amino_dict['H']

'His'

### <font color = limegreen>Cómo obtener todas las claves del diccionario</font> 

In [35]:
amino_dict.keys()

dict_keys(['A', 'R', 'C', 'Q', 'G', 'H', 'K', 'M', 'F', 'P', 'S', 'V'])

## <font color = red>Ejercicio:</font>
1. Cómo transformarías `amino_dict.keys()` en una lista

### <font color = limegreen>Cómo obtener todos los valores del diccionario</font> 

In [36]:
amino_dict.values()

dict_values(['Ala', 'Arg', 'Cys', 'Gln', 'Gly', 'His', 'Lys', 'Met', 'Phe', 'Pro', 'Ser', 'Val'])

## <font color = red>Ejercicio:</font>
1. Cómo transformarías `amino_dict.values()` en una lista

### <font color = limegreen>Eliminar claves del diccionario</font> 
- Recibe como parámetro una clave, elimina esta y devuelve su valor. Si no lo encuentra, devuelve error.

In [37]:
amino_dict.pop('H')

'His'

In [38]:
amino_dict

{'A': 'Ala',
 'R': 'Arg',
 'C': 'Cys',
 'Q': 'Gln',
 'G': 'Gly',
 'K': 'Lys',
 'M': 'Met',
 'F': 'Phe',
 'P': 'Pro',
 'S': 'Ser',
 'V': 'Val'}

### <font color = limegreen>Agregar elementos a un diccionario</font>
- Recibe como parámetro otro diccionario.
- Si se tienen claves iguales, actualiza el valor de la clave repetida; si no hay claves iguales, este par clave-valor es agregado al diccionario.

In [39]:
aminoacidos2 = {'I':'Ile', 'Y':'Tyr'}
aminoacidos2

{'I': 'Ile', 'Y': 'Tyr'}

In [40]:
# actualizando el diccionario
amino_dict.update(aminoacidos2)

In [41]:
# cómo quedó finalmente el nuevo diccionario
amino_dict

{'A': 'Ala',
 'R': 'Arg',
 'C': 'Cys',
 'Q': 'Gln',
 'G': 'Gly',
 'K': 'Lys',
 'M': 'Met',
 'F': 'Phe',
 'P': 'Pro',
 'S': 'Ser',
 'V': 'Val',
 'I': 'Ile',
 'Y': 'Tyr'}

## <font color = blue>Cadenas de  caracteres</font>

* ### Las cadenas o _strings_ almacenan secuencias de caracteres.
* ### Para crear una, es necesario incluir el texto entre comillas dobles `"` o simples `'`.

El índice de los elementos empieza desde el cero `0`