# Iteraciones y estructuras de datos

## Iteraciones

A diferencia de las estructuras de control condicionales, las estructuras de control iterativas (cíclicas, bucles o *loops*), nos permiten ejecutar código de manera repetitiva siempre y cuando se cumpla una condición. Las dos que existen en Python son `while`y `for`.

**while**

In [16]:
edad = 24

while edad <= 34:
    print("Tengo %i años" % edad)
    edad = edad + 1

Tengo 24 años
Tengo 25 años
Tengo 26 años
Tengo 27 años
Tengo 28 años
Tengo 29 años
Tengo 30 años
Tengo 31 años
Tengo 32 años
Tengo 33 años
Tengo 34 años


In [None]:
edad = 24
while edad <= 34:
    print("Tengo %i años" % edad)
    edad += 1

Cada iteración, cada vuelta, se incrementa el valor de la variable edad que condiciona el bucle. Si la condición fuera `True`todo el tiempo el bucle estaría ejecutándose indefinidamente pero puedo usar una condición y `break` para romper el bucle de `while`

In [22]:
edad = 24
while edad > 20:
    print("Tengo %i años" % edad)
    edad += 1
    if edad > 34:
        break

Tengo 24 años
Tengo 25 años
Tengo 26 años
Tengo 27 años
Tengo 28 años
Tengo 29 años
Tengo 30 años
Tengo 31 años
Tengo 32 años
Tengo 33 años
Tengo 34 años


**for**

El blucle `for` nos permite iterar sobre variables que contengan objetos más complejos, como **listas** o **tuplas**. En el siguiente ejemplo utilizaremos la función `range()` para crear un rango entre dos números.

<div class="alert alert-block alert-success">

Hasta ahora hemos usado las siguientes funciones y métodos *built-in*:
    
* `print()`
* `type()`
* `int()`
* `float()`
* `round()`
* `is_integer()`

</div>

In [29]:
for edad in range(24, 34):
    print("Tengo %i años" % edad)

Tengo 24 años
Tengo 25 años
Tengo 26 años
Tengo 27 años
Tengo 28 años
Tengo 29 años
Tengo 30 años
Tengo 31 años
Tengo 32 años
Tengo 33 años


In [24]:
seq_1 = "ATGGTCGTTAGTTGCTGATG"

for nucleotide in seq_1:
    print(nucleotide)

A
T
G
G
T
C
G
T
T
A
G
T
T
G
C
T
G
A
T
G


## Estructura de datos

### Listas

Hay diferentes tipos de estructura de datos que permiten utilizar datos compuestos. La más versátil es la lista, para definir una basta con escribir valores entre corchetes, separando los elementos con comas cada uno.

In [30]:
lista_supermercado = ['huevos', 'jamón', 'leche', 'café']

In [31]:
print(lista_supermercado)

['huevos', 'jamón', 'leche', 'café']


In [32]:
type(lista_supermercado)

list

Las listas en Python son:

* **heterogéneas**: pueden estar conformadas por elementos de distintos *tipo*, incluidos otras listas.
* **mutables**: sus elementos pueden modificarse.

In [42]:
lista = ['huevos', 'jamón', 100, 45, 3.14]

In [37]:
print(lista)

['huevos', 'jamón', 100, 45, 3.14]


In [36]:
# print(*lista)

huevos jamón 100 45 3.14


In [38]:
nueva_lista = [lista_supermercado, lista]

In [39]:
print(nueva_lista)

[['huevos', 'jamón', 'leche', 'café'], ['huevos', 'jamón', 100, 45, 3.14]]


In [40]:
type(nueva_lista)

list

**slicing**

Al igual que las cadenas de texto, puedo acceder a los elementos de la lista utilizando *slicing* o el índice. **Recuerda que Python empieza a contar desde 0**.

In [43]:
lista[0]

'huevos'

In [44]:
lista[1]

'jamón'

In [45]:
lista[2]

100

In [47]:
lista[0:3]

['huevos', 'jamón', 100]

Alguien puede explicar ¿qué está sucediendo en la siguientes celdas?

In [48]:
nueva_lista

[['huevos', 'jamón', 'leche', 'café'], ['huevos', 'jamón', 100, 45, 3.14]]

In [49]:
nueva_lista[0][2:4]

['leche', 'café']

In [50]:
nueva_lista[1][0:2]

['huevos', 'jamón']

Puedo utilizar la función `len()` parar acceder al número de elementos de la lista.

In [51]:
len(lista_supermercado)

4

In [52]:
len(lista)

5

In [56]:
len(nueva_lista)

2

Un ejemplo más relevante

In [60]:
ranks = ["kingdom", "phylum", "class", "order"]
lower_ranks = ranks[-2:]

In [59]:
lower_ranks

['class', 'order']

Puedo agregar elementos a la lista.

In [61]:
ranks.append("family")

In [62]:
ranks

['kingdom', 'phylum', 'class', 'order', 'family']

In [63]:
ranks.append("genus", "species")

TypeError: append() takes exactly one argument (2 given)

Si quiero agregar más de un elemento debo usar `extend()`

In [65]:
ranks.extend(["genus", "species"])

In [66]:
ranks

['kingdom', 'phylum', 'class', 'order', 'family', 'genus', 'species']

Pero qué tal si quiero agregar un elemento a una lista de listas. ¿Qué hago?

In [67]:
nueva_lista

[['huevos', 'jamón', 'leche', 'café'], ['huevos', 'jamón', 100, 45, 3.14]]

In [None]:
nueva_lista[0].append("azúcar")  # Selecciono el índice de la lista a la que quiero agregar el elemento

In [68]:
nueva_lista[1][1] = "tocino"  # Puedo reemplazar un elemento por otro utilizando los índices

In [70]:
nueva_lista

[['huevos', 'jamón', 'leche', 'café'], ['huevos', 'tocino', 100, 45, 3.14]]

Ok, regresemos a la lista `ranks`

In [71]:
sorted(ranks)  # Ordena pero no modifica el orden original de la lista

['class', 'family', 'genus', 'kingdom', 'order', 'phylum', 'species']

In [72]:
ranks

['kingdom', 'phylum', 'class', 'order', 'family', 'genus', 'species']

In [73]:
ranks.reverse()  # Ordena de manera inversa y el cambio es permanente

In [75]:
ranks.reverse()

In [76]:
ranks

['kingdom', 'phylum', 'class', 'order', 'family', 'genus', 'species']

In [None]:
ranks.sort()  # Ordena y el cambio es permanente

In [None]:
ranks

**Pregunta**: `apend()`, `extend()`, `sort()`, `reverse()`, `sorted()` ¿Son funciones o métodos?

Cada estructura de datos tiene métodos integrados.

¿Cuál creen que sea el método para eliminar elementos de una lista? ¿`delete()`, `remove()`, `del()` o `rm()`?

**for**

In [79]:
for clade in ranks:
    print(clade)

kingdom
phylum
class
order
family
genus
species


¿Qué es lo que realiza el método `index()`?

In [80]:
for clade in ranks:
    print(ranks.index(clade))

0
1
2
3
4
5
6


In [82]:
codones = "CAG, CGU, CGC, CGA, CGG, AUU, AUC"

In [83]:
print(codones)

CAG, CGU, CGC, CGA, CGG, AUU, AUC


In [84]:
type(codones)

str

El método `split()` utiliza un argumento, llamado delimitador, y divide la cadena de texto original donde quiera que encuentre el delimitador produciendo una lista.

In [85]:
lista_codones = codones.split(",")

In [86]:
print(lista_codones)

['CAG', ' CGU', ' CGC', ' CGA', ' CGG', ' AUU', ' AUC']


In [88]:
type(lista_codones)

list

#### Ejercicios 2

**Hagamos un programa simple para calcular el contenido de GC de una secuencia de DNA.**

In [117]:
seq = "ATGCGTGATGCGCTGAGCGCTAGCGCGATAGCGATAGCGATCAAAGGCGCGCGCGTCGCTGCTGCTATGA"

c = a = g = t = 0

# c = 0
# a = 0
# g = 0
# t = 0

In [118]:
for nucl in seq:
    if nucl == "C":
        c += 1
    elif nucl == "G":
        g += 1
    elif nucl == "A":
        a += 1
    elif nucl == "T":
        t += 1

In [119]:
print(c, g, a, t)

18 25 14 13


In [120]:
print("C: %i, G: %i, A: %i, T: %i" % (c, g, a, t))

C: 18, G: 25, A: 14, T: 13


In [102]:
gc_content = (g + c) * 100 / (a + t + g + c)

In [101]:
print(gc_content)

61.42857142857143


In [116]:
print("GC content: %.2f" % gc_content + "%")

GC content: 61.43%


¿Y qué tal si quiero reutilizar este código?

In [122]:
def get_gc_content(seq):
    """
    Se acuerdan de esta opción de comentario

    Este es un programa que hace magia.
    Calcula el contenido de GC.
    """
    c = a = g = t = 0

    for nucl in seq:
        if nucl == "C":
            c += 1
        elif nucl == "G":
            g += 1
        elif nucl == "A":
            a += 1
        elif nucl == "T":
            t += 1

    gc_content = (g + c) * 100 / (a + t + g + c)
    return gc_content

In [123]:
help(get_gc_content)

Help on function get_gc_content in module __main__:

get_gc_content(seq)
    Se acuerdan de esta opción de comentario
    
    Este es un programa que hace magia.
    Calcula el contenido de GC.



In [131]:
awesome_seq = "ATGCGTGAGTCGCGTAGCGCTAGGCGCGCTATTTTTTTTTTTTTTTATCTATGACCCCCCCCCCCCCCGGGGGG"

In [132]:
get_gc_content(awesome_seq)

56.75675675675676

In [None]:
print("GC content: %.2f" % get_gc_content(seq2))

**Hagamos un programa para convertir secuencias de DNA a RNA.**

In [1]:
seq = "ATGCGTGATGCGCTGAGCGCTAGCGCGATAGCGATAGCGATCAAAGGCGCGCGCGTCGCTGCTGCTATGA"

seq_rna = seq.replace("T", "U")

In [2]:
seq_rna

'AUGCGUGAUGCGCUGAGCGCUAGCGCGAUAGCGAUAGCGAUCAAAGGCGCGCGCGUCGCUGCUGCUAUGA'

**Crear lista de codones**

In [3]:
codon_list = []

for i in range(0, len(seq_rna), 3):
    codon = seq_rna[i:i+3]
    if len(codon) < 3:
        codon_list.append("*")
    else:
        codon_list.append(codon)

In [5]:
["*" if len(seq_rna[i:i+3]) < 3 else seq_rna[i:i+3] for i in range(0, len(seq_rna), 3)]

['AUG',
 'CGU',
 'GAU',
 'GCG',
 'CUG',
 'AGC',
 'GCU',
 'AGC',
 'GCG',
 'AUA',
 'GCG',
 'AUA',
 'GCG',
 'AUC',
 'AAA',
 'GGC',
 'GCG',
 'CGC',
 'GUC',
 'GCU',
 'GCU',
 'GCU',
 'AUG',
 '*']

In [139]:
print(codon_list)

['AUG', 'CGU', 'GAU', 'GCG', 'CUG', 'AGC', 'GCU', 'AGC', 'GCG', 'AUA', 'GCG', 'AUA', 'GCG', 'AUC', 'AAA', 'GGC', 'GCG', 'CGC', 'GUC', 'GCU', 'GCU', 'GCU', 'AUG', '*']


Podemos generar una **funcion** para utilizar el código más adelante con una secuencia diferente.

In [145]:
def get_codons(seq):
    """
    Esta función divide la secuencia en segmentos de 3
    y envía cada fragmento a una lista
    """
    codon_list = []

    for i in range(0, len(seq_rna), 3):
        codon = seq_rna[i:i + 3]
        if len(codon) < 3:
            codon_list.append("*")
        else:
            codon_list.append(codon)
    return codon_list

In [None]:
help(get_codons)

In [146]:
get_codons(seq_rna)

['AUG',
 'CGU',
 'GAU',
 'GCG',
 'CUG',
 'AGC',
 'GCU',
 'AGC',
 'GCG',
 'AUA',
 'GCG',
 'AUA',
 'GCG',
 'AUC',
 'AAA',
 'GGC',
 'GCG',
 'CGC',
 'GUC',
 'GCU',
 'GCU',
 'GCU',
 'AUG',
 '*']

### Diccionarios

Los diccionarios son usados para almacenar valores de datos en pares llave:valor (key:value). A partir de Python 3.7 los diccionarios se evaluan de manera **ordenada**. No permite duplicados.

In [1]:
desayuno = {
    "Lunes": "Chilaquiles",
    "Martes": "Huevos rancheros",
    "Miércoles": "Zucaritas",
    "Jueves": "Quesadillas (con queso)",
    "Viernes": "Guajolota Combo Mix",
}

In [2]:
desayuno

{'Lunes': 'Chilaquiles',
 'Martes': 'Huevos rancheros',
 'Miércoles': 'Zucaritas',
 'Jueves': 'Quesadillas (con queso)',
 'Viernes': 'Guajolota Combo Mix'}

In [20]:
desayuno['Lunes']

'Chilaquiles'

In [16]:
desayuno.get('Lunes')

'Chilaquiles'

In [17]:
desayuno['Sábado']

KeyError: 'Sábado'

El método `get()` regresa un valor `None` si no encuentra el valor de la llave.

In [18]:
desayuno.get('Sábado')

In [3]:
type(desayuno)

dict

In [8]:
desayuno.items()

dict_items([('Lunes', 'Chilaquiles'), ('Martes', 'Huevos rancheros'), ('Miércoles', 'Zucaritas'), ('Jueves', 'Quesadillas (con queso)'), ('Viernes', 'Guajolota Combo Mix')])

In [6]:
desayuno.values()

dict_values(['Chilaquiles', 'Huevos rancheros', 'Zucaritas', 'Quesadillas (con queso)', 'Guajolota Combo Mix'])

In [7]:
desayuno.keys()

dict_keys(['Lunes', 'Martes', 'Miércoles', 'Jueves', 'Viernes'])

Los diccionarios en Python son:

* **heterogéneas**: pueden estar conformadas por elementos de distintos *tipo*, incluidos otros diccionarios.
* **mutables**: sus elementos pueden modificarse.

In [49]:
dict_mix = {
  "A": desayuno,
  "B": (False, True),
  "C": 1986,
  "D": ["uno", "dos", "tres"]
}

¿Cómo podríamos acceder al valor `"dos"`?

**Modificar la llave v1**: copiar la llave a una llave con un nuevo nombre y eliminar la llave anterior.

In [40]:
dict_mix["Desayunos"] = dict_mix["A"]

In [41]:
del dict_mix["A"]

In [42]:
dict_mix

{'B': (False, True),
 'C': 1986,
 'D': ['uno', 'dos', 'tres'],
 'Desayunos': {'Lunes': 'Chilaquiles',
  'Martes': 'Huevos rancheros',
  'Miércoles': 'Zucaritas',
  'Jueves': 'Quesadillas (con queso)',
  'Viernes': 'Guajolota Combo Mix'}}

**Modificar la llave v2**: usando la función `pop()`.

In [43]:
dict_mix["Números"] = dict_mix.pop("D")

In [44]:
dict_mix

{'B': (False, True),
 'C': 1986,
 'Desayunos': {'Lunes': 'Chilaquiles',
  'Martes': 'Huevos rancheros',
  'Miércoles': 'Zucaritas',
  'Jueves': 'Quesadillas (con queso)',
  'Viernes': 'Guajolota Combo Mix'},
 'Números': ['uno', 'dos', 'tres']}

**Modificar valores**: redefinir mediante asignación.

In [45]:
dict_mix['C'] = 2022

In [46]:
dict_mix

{'B': (False, True),
 'C': 2022,
 'Desayunos': {'Lunes': 'Chilaquiles',
  'Martes': 'Huevos rancheros',
  'Miércoles': 'Zucaritas',
  'Jueves': 'Quesadillas (con queso)',
  'Viernes': 'Guajolota Combo Mix'},
 'Números': ['uno', 'dos', 'tres']}

¿Cómo podríamos agregar un valor a la lista de `Números`?

### Tuplas

Las tuplas son un registro de campos que no tienen nombre. Son datos inmutables, no se pueden modificar una vez definidos.

In [53]:
datos = {"Nombre": "Otto", "Edad": 35}

name, age = datos["Nombre"], datos["Edad"]

In [54]:
print(name, age)

Otto 35


In [55]:
persona = ("Otto", 35)
name, age = persona

In [56]:
print(name, age)

Otto 35


In [58]:
esta_es_una_tupla = 1, 2, 3, 4

In [59]:
type(esta_es_una_tupla)

tuple

In [60]:
esta_tambien_es_una_tupla = (1, 2, 3, 4)

In [61]:
type(esta_tambien_es_una_tupla)

tuple

Operadores que se pueden utilizar con tuplas: `+`, `*`, `[]`, `[:]`, `in`, `not in`