# Lab 4: Más tipos de datos: Diccionarios y Conjuntos
## 1. Diccionarios
Un tipo muy conocido de abstracciones de datos en Python son los **diccionarios**, también llamados a veces **listas asociativas**

Conceptualmente, un diccionario es un conjunto desordenado de elementos (a diferencia de las listas, que están ordenadas). Los elementos del diccionario son parejas **clave-valor** y se separan entre ellos mediante comas. Además, los elementos pertenecientes a un mismo diccionario se delimitan mediante el uso de llaves {}. Tanto la clave como el valor han de ser tipos válidos en Python (int, string, etc.), con la salvedad de que en el caso de las claves han de ser tipos **inmutables**.

**Ojo! Los diccionarios NO son secuencias y tienen su propio tipo! Por lo tanto no soportan las mismas operaciones.**

### 1.1 Acceder y modificar valores
Los elementos en los diccionarios, a diferencia de las listas, son accedidos mediante su clave y no su posición (ya que **no tienen orden**). 

Cada elemento especificado por una clave es único en el diccionario (Tan sólo hay un elemento asociado a cada clave). 

Vamos a verlo con unos ejemplos:


In [2]:
#Definiendo diccionarios (En este caso diccionarios vacíos. Podemos usar las llaves o la palabra reservada "dict")
dic_vacio = {} 
dic_vacio_2 = dict()
print(dic_vacio)
print(dic_vacio_2)

{}
{}


In [3]:
#Inicializando diccionarios no vacíos
cliente_1 = {"nombre" : "Maria Gonzalez", 
             "direccion" : "Rios Rosas 52",
             "saldo" : 500}

#También puedo inicializar un diccionario con una tupla (o lista) de tuplas clave-valor:
cliente_2 = dict((("nombre", "Pedro Lopez"), 
                  ("direccion", "Portugalete 10"), 
                  ("saldo", 200)))

#O usando la función zip para crear las tuplas, si tengo las claves y valores en listas separadas:
claves = ["nombre", "direccion", "saldo"]
valores = ["Juan Lanas", "Gran Vía 2", 1000]

cliente_3 = dict(zip(claves, valores)) 

print(cliente_1)
print(cliente_2)
print(cliente_3)

{'nombre': 'Maria Gonzalez', 'direccion': 'Rios Rosas 52', 'saldo': 500}
{'nombre': 'Pedro Lopez', 'direccion': 'Portugalete 10', 'saldo': 200}
{'nombre': 'Juan Lanas', 'direccion': 'Gran Vía 2', 'saldo': 1000}


In [4]:
#Accediendo a los valores de un diccionario (corchetes)
print(cliente_1['nombre'])
print(cliente_2['saldo'])

Maria Gonzalez
200


In [5]:
#Ya que no hay orden no puedo hacer cosas como:
cliente_1[1]

KeyError: 1

In [6]:
#También obtendremos error si intentamos acceder al valor de una clave inexistente:
cliente_1['edad']

KeyError: 'edad'

In [7]:
#Modificando y actualizando diccionarios previamente declarados
#Vamos a usar la notación de corchetes:
cliente_1['edad'] = 25
cliente_2['edad'] = 34
cliente_1['direccion'] = "Gran Vía 25"
print(cliente_1)
print(cliente_2)

{'nombre': 'Maria Gonzalez', 'direccion': 'Gran Vía 25', 'saldo': 500, 'edad': 25}
{'nombre': 'Pedro Lopez', 'direccion': 'Portugalete 10', 'saldo': 200, 'edad': 34}


### 1.2 Eliminar pares
Una operación común que haremos sobre los diccionarios es la de eliminar un par clave-valor. Para ello usaremos la palabra reservada **del** o las operación **pop()**, que ya vimos en las listas, aunque ahora se define de manera ligeramente diferente o **popitem()**.

In [8]:
#Eliminamos la clave edad y su valor correspondiente
del cliente_1['edad']
print(cliente_1)

{'nombre': 'Maria Gonzalez', 'direccion': 'Gran Vía 25', 'saldo': 500}


#### "Cuando haces pop()"
En el caso de **pop()** (recuerda lo visto en listas), queremos eliminar un elemento del diccionario pero salvándolo a una variable sobre la que podamos operar con él. Recordemos que en las listas la operación **pop()** extraía el último elemento de la lista en cuestión pero entonces ¿Tiene sentido usar pop en un diccionario, cuando sabemos que no tiene orden?

La respuesta es que sí, ya que en este caso **pop()** no realiza exactamente lo mismo. Para un diccionario D y una clave k, *D.pop(k)* va a eliminar la clave k devolviendo el valor correspondiente:

In [9]:
v = cliente_2.pop('edad')
print(v)
print(cliente_2)

34
{'nombre': 'Pedro Lopez', 'direccion': 'Portugalete 10', 'saldo': 200}


In [10]:
#La clave tendrá que existir u obtendremos un error:
cliente_2.pop('edad')

KeyError: 'edad'

#### popitem()
El caso de **popitem()** es ligeramente diferente: no acepta ningún parámetro y elimina un elemento devolviendo el par clave-valor en forma de **tupla**. Esto es muy conveniente cuando queremos procesar y descartar los elementos de un diccionario uno a uno:

In [11]:
#El orden en el que se devuelven los elementos es arbitrario. 
#estado, capital es una tupla (Una nueva manera de usar las tuplas es usar una variable para guardar cada elemento de las mismas)
capitales = {"Valladolid":"Castilla y Leon", "Sevilla":"Andalucía", "Barcelona": "Cataluña", "Santiago de Compostela":"Galicia", "Vitoria-Gasteiz":"País Vasco", "Zaragoza":"Aragón"}
estado, capital = capitales.popitem()
otra_tupla = capitales.popitem()
print(estado, capital)
print(otra_tupla[0], otra_tupla[1])

Zaragoza Aragón
Vitoria-Gasteiz País Vasco


In [12]:
capitales = {"Valladolid":"Castilla y Leon", "Sevilla":"Andalucía", "Barcelona": "Cataluña", "Santiago de Compostela":"Galicia", "Vitoria-Gasteiz":"País Vasco", "Zaragoza":"Aragón"}

while len(capitales.keys()) > 0:
    
    cap, prov = capitales.popitem()
    print(cap*2, prov*2)

ZaragozaZaragoza AragónAragón
Vitoria-GasteizVitoria-Gasteiz País VascoPaís Vasco
Santiago de CompostelaSantiago de Compostela GaliciaGalicia
BarcelonaBarcelona CataluñaCataluña
SevillaSevilla AndalucíaAndalucía
ValladolidValladolid Castilla y LeonCastilla y Leon


### 1.3 Comprobar si existe una clave
Hemos visto que si intentamos acceder a una clave inexistente en el diccionario obtendremos un error. Sin embargo hay una manera de evitar esto, comprobando si un diccionario contiene cierta clave usando los operadores **in** y **not in** que vimos en otros labs.

In [14]:
if "Valladolid" in capitales:
    print('La capital de ' + capitales["Valladolid"] + ' es Valladolid')
if "Toledo" not in capitales:
          print("No se de qué comunidad autónoma es capital Toledo 😔")

No se de qué comunidad autónoma es capital Toledo 😔


Otra manera es usar **get()**, que no devuelve un error si no existe la clave, sino que devuelve None (palabra y tipo reservados).

In [15]:
print(capitales.get('Valladolid'))
print(capitales.get('Toledo'))

None
None


### 1.4 Copiando diccionarios
Los diccionarios se pueden copiar usando la función **copy()**.
¡Cuidado! Se realiza una copia superficial, por lo que las modificaciones a elementos aninados siguen afectando a las copias.

In [17]:
from copy import copy

cursos = { "curso1":{"titulo":"Introducción a Python", 
                         "localidad":"Madrid", 
                         "instructor":"Dr. Acula"},
              "curso2":{"titulo":"Python Avanzado",
                         "localidad":"Salamanca",
                         "instructor":"Abel Benito"},
              "curso3":{"titulo":"Procesamiento de Textos",
                         "localidad":"Zamora",
                         "instructor":"Armando Guerra"}
              }

cursos_copia = copy(cursos)
cursos["curso2"]["titulo"] = "Javascript Avanzado"
print(cursos_copia)

##Sin embargo si añadimos un nuevo elemento, funciona como esperamos
cursos["curso2"] = {"titulo":"Seminario de Latex para Principiantes",
                         "localidad":"Salamanca",
                         "instructor":"Yola Prieto"}

print(cursos)
print(cursos_copia)


{'curso1': {'titulo': 'Introducción a Python', 'localidad': 'Madrid', 'instructor': 'Dr. Acula'}, 'curso2': {'titulo': 'Javascript Avanzado', 'localidad': 'Salamanca', 'instructor': 'Abel Benito'}, 'curso3': {'titulo': 'Procesamiento de Textos', 'localidad': 'Zamora', 'instructor': 'Armando Guerra'}}
{'curso1': {'titulo': 'Introducción a Python', 'localidad': 'Madrid', 'instructor': 'Dr. Acula'}, 'curso2': {'titulo': 'Seminario de Latex para Principiantes', 'localidad': 'Salamanca', 'instructor': 'Yola Prieto'}, 'curso3': {'titulo': 'Procesamiento de Textos', 'localidad': 'Zamora', 'instructor': 'Armando Guerra'}}
{'curso1': {'titulo': 'Introducción a Python', 'localidad': 'Madrid', 'instructor': 'Dr. Acula'}, 'curso2': {'titulo': 'Javascript Avanzado', 'localidad': 'Salamanca', 'instructor': 'Abel Benito'}, 'curso3': {'titulo': 'Procesamiento de Textos', 'localidad': 'Zamora', 'instructor': 'Armando Guerra'}}


### 1.5 Limpiando
Por último, el diccionario puede ser limpiado (no borrado!) con el método **clear()**

In [18]:
cursos.clear()
print(cursos)

{}


### 1.6. Más operaciones: concatenar e iterar:
De manera análoga a como concatenábamos listas, podemos hacer lo mismo con diccionarios usando el método **update(dict)**. Este método une las claves y valores de un diccionario, sobreescribiendo los valores para claves repetidas.

In [19]:
cursos.update({"curso2": {"titulo" : "Seminario de Javascript para Principiantes",
                         "localidad":"Valladolid",
                         "instructor":"Dolores Fuertes"}})

print(cursos)

{'curso2': {'titulo': 'Seminario de Javascript para Principiantes', 'localidad': 'Valladolid', 'instructor': 'Dolores Fuertes'}}


Para iterar utilizaremos el ya conocido operador for ... in y las funciones keys() y values(), que devuelven listas con las claves y valores del diccionario, respectivamente.

In [20]:
for curso in cursos:
    print(curso)

print('#########')

for clave in cursos.keys():
    print(clave)
    
print('#########')
    
for value in cursos.values():
    print(value)

print('#########')

#Más lento
for clave in cursos.keys():
    print(cursos[clave])

print('#########')
#Tuplas clave-valor
for clave, valor in cursos.items():
    print(clave)
    print(valor)


curso2
#########
curso2
#########
{'titulo': 'Seminario de Javascript para Principiantes', 'localidad': 'Valladolid', 'instructor': 'Dolores Fuertes'}
#########
{'titulo': 'Seminario de Javascript para Principiantes', 'localidad': 'Valladolid', 'instructor': 'Dolores Fuertes'}
#########
curso2
{'titulo': 'Seminario de Javascript para Principiantes', 'localidad': 'Valladolid', 'instructor': 'Dolores Fuertes'}


## 2. Conjuntos
La teoría de conjuntos es una rama de la lógica matemática que estudia las colecciones de objetos y es parte integral de las matemáticas modernas. 
En lo que nos atañe, los miembros de los conjuntos pueden ser cualquier cosa, por ejemplo: números, caracteres, palabras, nombres, letras, listas e incluso otros conjuntos. 

![imagen de conjuntos](img/conjuntos.png)

Los representantes de los conjuntos en Python son las colecciones **set** (conjunto) y **frozenset** (conjunto congelado). Los conjuntos son colecciones **desordenadas** de elementos **únicos** (no puede haber dos elementos iguales), así que a diferencia de las listas, no podrán contener múltiples ocurrencias del mismo elemento (por ejemplo la misma cadena).

Para crear un conjunto en Python, vamos a usar la función built-in **set()** o las llaves {}, a la que le pasaremos como argumento una secuencia:

In [19]:
#Para crear un conjunto podemos usar una cadena:
x = set("Esto son los elementos")
print(x) #Los conjuntos no tienen orden!

#O bien una lista
y = set(["Azul", "Negro", "Blanco"])
print(y)


{'a', 'g', 'c', 't'}
{'Azul', 'Negro', 'Blanco'}


Fíjate lo que ha pasado en el conjunto x: Los elementos se han desordenado y por ejemplo la letra "o" sólo aparece una vez, aunque en la frase original había más de una. Esto es porque la comparación 'o' == 'o' devuelve True, o lo que es lo mismo, los objetos son iguales.
Siguiendo la misma lógica, ¿qué pasaría con las tuplas?

In [4]:
ciudades = set(("Salamanca", "Bilbao", "Barcelona", "Cáceres", "Zamora", "Gijón", "Salamanca")) #usando set()
print(ciudades) # la segunda aparición de Salamanca también es rechazada.
ciudades_bis = {"Salamanca", "Bilbao", "Coruña"} # usando llaves
print(ciudades_bis)

{'Gijón', 'Barcelona', 'Cáceres', 'Bilbao', 'Salamanca', 'Zamora'}
{'Bilbao', 'Coruña', 'Salamanca'}


### 2.1. Los conjuntos sólo admiten objetos inmutables
Los conjuntos por defecto no permiten incluir objectos mutables como elementos debido al hecho de que serían muy costosos de mantener en memoria. Si algo puede mutar en cualquier momento, todo el conjunto debería ser reevaluado para comprobar que es consistente. En el caso de listas, y por las razones que vimos en sesiones anteriores, esto sería especialmente complicado.

Esta es la razón por la que no se pueden incluir listas como elementos:

In [5]:
ciudades_2 = set((("Salamanca", "Bilbao"), ("Barcelona", "Madrid", "Zamora")))
print(ciudades_2)
ciudades_3 = set((["Salamanca", "Bilbao"], ["Barcelona", "Madrid", "Zamora"])) #OPPPS!

{('Barcelona', 'Madrid', 'Zamora'), ('Salamanca', 'Bilbao')}


TypeError: unhashable type: 'list'

### 2.2. Operaciones
Como es de esperar, los conjuntos, como el resto de colecciones que hemos visto a lo largo del curso, también soportan operaciones que detallamos a continuación:

### Añadir, quitar, modificar

In [6]:
### add(elemento)
## Un método que añade un elemento, que tiene que ser inmutable, a un conjunto.
colores = {"rojo", "amarillo", "azul"}
print("colores vale: ", colores)
print("añado 'verde'")
colores.add("verde")
print("colores vale: ", colores)
print("añado 'rojo'")
colores.add("rojo")
print("colores vale: ", colores)

colores vale:  {'rojo', 'azul', 'amarillo'}
añado 'verde'
colores vale:  {'rojo', 'verde', 'azul', 'amarillo'}
añado 'rojo'
colores vale:  {'rojo', 'verde', 'azul', 'amarillo'}


In [7]:
### clear()
## Elimina todos los elementos del conjunto
ciudades_5 = {"Salamanca", "Zamora", "León", "Palencia"}
ciudades_5.clear()
print(ciudades_5)

set()


In [9]:
### copy()
## Crea una copia superficial del conjunto.
ciudades_6 = {"Valladolid", "Teruel", "Albacete"}
ciudades_6_copia = ciudades_6.copy()
ciudades_6_copia_bis = ciudades_6
ciudades_6.clear()

##Qué pasa aqui??
print(ciudades_6_copia)
print(ciudades_6_copia_bis)

{'Teruel', 'Valladolid', 'Albacete'}
set()


In [10]:
### difference()
## Devuelve la diferencia entre dos o mas conjuntos en un nuevo conjunto
x = {"a", "b", "c", "d", "e"}
print("x vale: ", x)
y = {"b", "c"}
print("y vale: ", y)
z = {"c", "d"}
print("z vale: ", z)
print()
print('x - y = ', x.difference(y))
print('y - x = ', x.difference(y))

## O simplemente usando el operador -
print('x - y = ', x - z)

x vale:  {'a', 'e', 'c', 'd', 'b'}
y vale:  {'c', 'b'}
z vale:  {'c', 'd'}

x - y =  {'a', 'e', 'd'}
y - x =  {'a', 'e', 'd'}
x - y =  {'a', 'e', 'b'}


In [11]:
### difference_update()
## Igual que difference(), salvo que al conjunto que 
## ejecuta este método se le sustraen los elementos de un segundo conjunto, quedando así modificado
## Se puede interpretar como x = x - y (x-=y)
x = {"a", "b", "c", "d", "e"}
print("x vale: ", x)
y = {"b", "c"}
print("y vale: ", y)

x.difference_update(y) #operación in-place
print("x.difference_update(y) = ", x)


x vale:  {'a', 'e', 'c', 'd', 'b'}
y vale:  {'c', 'b'}
x.difference_update(y) =  {'e', 'a', 'd'}


In [12]:
### remove() y discard()
## Para eliminar objetos de un conjunto usaremos estas dos funciones.
## La diferencia entre ambos es que remove() lanza una excepción si el elemento dado no existe en el conjunto!
x = {"a","b","c","d","e"}
print("x vale: ", x)
print('Hago x.remove("a")')
x.remove("a")
print("x vale: ", x)

a = x.pop()
print("x.pop() = ", a)
print("x vale: ", x)

x vale:  {'a', 'e', 'c', 'd', 'b'}
Hago x.remove("a")
x vale:  {'e', 'c', 'd', 'b'}
x.pop() =  e
x vale:  {'c', 'd', 'b'}


In [13]:
print('x.remove("c")')
x.remove("c") # más rápido pero no comprueba existencia (lanza excepción)
print("x vale: ", x) 

x.remove("c")
x vale:  {'d', 'b'}


In [15]:
print('x.discard("c")')
x.discard("c") # menos rápido pero más seguro
print("x vale: ", x) 

x.discard("c")
x vale:  {'d', 'b'}


### Operaciones con conjuntos

In [16]:
### union() e intersection()
## Devuelven la unión y la intersección de dos conjuntos.
x = {"a","b","c","d","e"}
print("x vale: ", x) 
y = {"c","d","e","f","g"}
print("y vale: ", y)
print("x | y = ", x | y) # o x.union(y)
print("x & y = ", x & y) # o x.intersection(y)

x vale:  {'a', 'e', 'c', 'd', 'b'}
y vale:  {'e', 'g', 'c', 'd', 'f'}
x | y =  {'c', 'f', 'a', 'e', 'd', 'g', 'b'}
x & y =  {'e', 'c', 'd'}


In [17]:
### isdisjoint(), issubset(), issuperset()
## Devuelven True o False dependiendo de si el conjunto que el conjunto sobre el que se invoca el método es
## disjunto con el conjunto que se pasa como parámetro o es subconjunto o superconjunto del mismo, respectivamente.
x = {"a","b","c","d","e"}
print("x vale: ", x) 
y = {"f", "g"}
print("y vale: ", y) 
z = {"a", "b"}
print("z vale: ", z) 

print('x e y son disjuntos? ' + str(x.isdisjoint(y)))
print('z es un subconjunto de x? ' + str(z.issubset(x)))
print('x es un subconjunto de si mismo? ' + str(x.issubset(x)))
print('x es un superconjunto de si mismo? ' + str(x.issubset(x)))

##Los subconjuntos/superconjuntos propios son aquellos subconjuntos/superconjuntos de un conjunto dado que no son dicho conjunto.
##Para expresar esto en python usaremos los símbolos mayor (>) y menor (<) estrictos.
##Mayor o igual (>=) o menor o igual (<=) son equivalentes a issuperset y issubset respectivamente.

print('x es un subconjunto propio de si mismo? ' + str((x < x)))
print('y es un superconjunto propio de si mismo? ' + str(x > x))



x vale:  {'a', 'e', 'c', 'd', 'b'}
y vale:  {'g', 'f'}
z vale:  {'a', 'b'}
x e y son disjuntos? True
z es un subconjunto de x? True
x es un subconjunto de si mismo? True
x es un superconjunto de si mismo? True
x es un subconjunto propio de si mismo? False
y es un superconjunto propio de si mismo? False


### Ejercicio 1
Usando el fichero covid-samples.fasta, calcula, empleando conjuntos, los alfabetos usado en cada una de las secuencias. Después, calcula la intersección entre todas las combinaciones de los alfabetos obtenidos. 
¿Qué secuencias tienen más simbolos en común?

# Extra: comprensión de listas 

Para final, vamos a ver una sintaxis en Python para crear listas y diccionarios (en general cualquier iterable) a partir de los elementos de otras colecciones. 

En la comprensión de listas, se utiliza la notación de corchetes con una expresión y un bucle `for`, a la que le pueden seguir más expresiones. La lista que obtendremos será el resultado de evaluar la expresión en el contexto de la cláusula `for` que incluyamos. Vamos a verlo. 

Imagina que tienes una lista con secuencias, tal que así:

In [21]:
seqs = ['cctaagaagcta',
       'taatagatggtagaatgtaaaaggcacttttacacttttt',
       'tgttatag',
       'actcgtgtcctgtcaac',
       'caatagtctgaacaactggtgtaagttccatctctaattga',
       'tcaa']

In [22]:
for seq in sorted(seqs, key=lambda seq: len(seq)):
    print(seq)

tcaa
tgttatag
cctaagaagcta
actcgtgtcctgtcaac
taatagatggtagaatgtaaaaggcacttttacacttttt
caatagtctgaacaactggtgtaagttccatctctaattga


Pero, ¿y si queremos almacenar la longitud de cada cadena para luego poder operar con ella? 
Para esto podemos usar comprensión de listas. 
Si te digo `seq_lens` que generes una lista con las longitudes de las secuencias en `seqs`, probablemente hagas esto:

In [23]:
seq_lens = []
for seq in seqs:
    seq_lens.append(len(seq))
print(seq_lens)

[12, 40, 8, 17, 41, 4]


Con comprensión de listas es mucho más fácil y legible:

In [24]:
seq_lens = [ len(seq) for seq in seqs ]
print(seq_lens) #Voilá

[12, 40, 8, 17, 41, 4]


Las listas, como es lógico, puede contener cualquier cosa, incluso diccionarios:

In [26]:
seq_infos = [{"seq": seq, 
              "index": i, 
              "len": len(seq)} for i,seq in enumerate(seqs)]

for el in seq_infos:
    print(el)

{'seq': 'cctaagaagcta', 'index': 0, 'len': 12}
{'seq': 'taatagatggtagaatgtaaaaggcacttttacacttttt', 'index': 1, 'len': 40}
{'seq': 'tgttatag', 'index': 2, 'len': 8}
{'seq': 'actcgtgtcctgtcaac', 'index': 3, 'len': 17}
{'seq': 'caatagtctgaacaactggtgtaagttccatctctaattga', 'index': 4, 'len': 41}
{'seq': 'tcaa', 'index': 5, 'len': 4}


También puedo generar diccionarios usando la sintaxis apropiada, aquí uso el índice de la secuencia en la lista original como clave del diccionario:

In [27]:
seq_infos_dict = {i : {"seq": seq, "len": len(seq)} for i,seq in enumerate(seqs)}

In [28]:
for k in seq_infos_dict.keys():
    print(k, seq_infos_dict[k])

0 {'seq': 'cctaagaagcta', 'len': 12}
1 {'seq': 'taatagatggtagaatgtaaaaggcacttttacacttttt', 'len': 40}
2 {'seq': 'tgttatag', 'len': 8}
3 {'seq': 'actcgtgtcctgtcaac', 'len': 17}
4 {'seq': 'caatagtctgaacaactggtgtaagttccatctctaattga', 'len': 41}
5 {'seq': 'tcaa', 'len': 4}


Finalmente, las cláusulas se pueden anidar. Aquí calculo las frecuencias absolutas de nucleótidos en cada secuencia como una lista de diccionarios:

In [29]:
[dict({'seq_index': i, 
       "nucl": nucl, 
       "freq": seq.upper().count(nucl)}) for i, seq in enumerate(seqs) for nucl in ['A', 'C', 'T', 'G']]

[{'seq_index': 0, 'nucl': 'A', 'freq': 5},
 {'seq_index': 0, 'nucl': 'C', 'freq': 3},
 {'seq_index': 0, 'nucl': 'T', 'freq': 2},
 {'seq_index': 0, 'nucl': 'G', 'freq': 2},
 {'seq_index': 1, 'nucl': 'A', 'freq': 14},
 {'seq_index': 1, 'nucl': 'C', 'freq': 4},
 {'seq_index': 1, 'nucl': 'T', 'freq': 15},
 {'seq_index': 1, 'nucl': 'G', 'freq': 7},
 {'seq_index': 2, 'nucl': 'A', 'freq': 2},
 {'seq_index': 2, 'nucl': 'C', 'freq': 0},
 {'seq_index': 2, 'nucl': 'T', 'freq': 4},
 {'seq_index': 2, 'nucl': 'G', 'freq': 2},
 {'seq_index': 3, 'nucl': 'A', 'freq': 3},
 {'seq_index': 3, 'nucl': 'C', 'freq': 6},
 {'seq_index': 3, 'nucl': 'T', 'freq': 5},
 {'seq_index': 3, 'nucl': 'G', 'freq': 3},
 {'seq_index': 4, 'nucl': 'A', 'freq': 13},
 {'seq_index': 4, 'nucl': 'C', 'freq': 8},
 {'seq_index': 4, 'nucl': 'T', 'freq': 13},
 {'seq_index': 4, 'nucl': 'G', 'freq': 7},
 {'seq_index': 5, 'nucl': 'A', 'freq': 2},
 {'seq_index': 5, 'nucl': 'C', 'freq': 1},
 {'seq_index': 5, 'nucl': 'T', 'freq': 1},
 {'seq_

🤔Espera un momento, veo muchos `seq_index: X` repetidos! Alerta de redundancia!!! 🚨🚨

¿Y si meto más niveles?

In [30]:
{i: {nucl: seq.upper().count(nucl) for nucl in ['A', 'C', 'T', 'G']} for i, seq in enumerate(seqs)}

{0: {'A': 5, 'C': 3, 'T': 2, 'G': 2},
 1: {'A': 14, 'C': 4, 'T': 15, 'G': 7},
 2: {'A': 2, 'C': 0, 'T': 4, 'G': 2},
 3: {'A': 3, 'C': 6, 'T': 5, 'G': 3},
 4: {'A': 13, 'C': 8, 'T': 13, 'G': 7},
 5: {'A': 2, 'C': 1, 'T': 1, 'G': 0}}

Más organizadito todo. ¡Qué bien! 😌