# Lab 5-2: Conjuntos
La teoría de conjuntos es una rama de la lógica matemática que estudia las colecciones de objetos y es parte integral de las matemáticas modernas. 
En lo que nos atañe, los miembros de los conjuntos pueden ser cualquier cosa, por ejemplo: números, caracteres, palabras, nombres, letras, listas e incluso otros conjuntos. 

![imagen de conjuntos](img/conjuntos.png)

Los representantes de los conjuntos en Python son las colecciones **set** (conjunto) y **frozenset** (conjunto congelado). Los conjuntos son colecciones **desordenadas** de elementos **únicos** (no puede haber dos elementos iguales), así que a diferencia de las listas, no podrán contener múltiples ocurrencias del mismo elemento (por ejemplo la misma cadena).

## 6.1. Conjuntos
Para crear un conjunto en Python, vamos a usar la función built-in **set()** o las llaves {}, a la que le pasaremos como argumento una secuencia:

In [None]:
#Para crear un conjunto podemos usar una cadena:
x = set("Esto son los elementos")
print(x) #Los conjuntos no tienen orden!

#O bien una lista
y = set(["Azul", "Negro", "Blanco"])
print(y)


Fíjate lo que ha pasado en el conjunto x: Los elementos se han desordenado y por ejemplo la letra "o" sólo aparece una vez, aunque en la frase original había más de una. Esto es porque la comparación 'o' == 'o' devuelve True, o lo que es lo mismo, los objetos son iguales.
Siguiendo la misma lógica, ¿qué pasaría con las tuplas?

In [None]:
ciudades = set(("Salamanca", "Bilbao", "Barcelona", "Cáceres", "Zamora", "Gijón", "Salamanca")) #usando set()
print(ciudades) # la segunda aparición de Salamanca también es rechazada.
ciudades_bis = {"Salamanca", "Bilbao", "Coruña"} # usando llaves
print(ciudades_bis)

## 6.2. Los conjuntos sólo admiten objetos inmutables
Los conjuntos por defecto no permiten incluir objectos mutables como elementos debido al hecho de que serían muy costosos de mantener en memoria. Si algo puede mutar en cualquier momento, todo el conjunto debería ser reevaluado para comprobar que es consistente. En el caso de listas, y por las razones que vimos en sesiones anteriores, esto sería especialmente complicado.

Esta es la razón por la que no se pueden incluir listas como elementos:

In [None]:
ciudades_2 = set((("Salamanca", "Bilbao"), ("Barcelona", "Madrid", "Zamora")))
print(ciudades_2)
ciudades_3 = set((["Salamanca", "Bilbao"], ["Barcelona", "Madrid", "Zamora"])) #OPPPS!

## 6.3 Operaciones
Como es de esperar, los conjuntos, como el resto de colecciones que hemos visto a lo largo del curso, también soportan operaciones que detallamos a continuación:

## Añadir, quitar, modificar

In [None]:
### 6.3.1 add(elemento)
## Un método que añade un elemento, que tiene que ser inmutable, a un conjunto.
colores = {"rojo", "amarillo", "azul"}
print("colores vale: ", colores)
print("añado 'verde'")
colores.add("verde")
print("colores vale: ", colores)
print("añado 'rojo'")
colores.add("rojo")
print("colores vale: ", colores)

In [None]:
### 6.3.2 clear()
## Elimina todos los elementos del conjunto
ciudades_5 = {"Salamanca", "Zamora", "León", "Palencia"}
ciudades_5.clear()
print(ciudades_5)

In [None]:
### 6.3.3 copy()
## Crea una copia superficial del conjunto.
ciudades_6 = {"Valladolid", "Teruel", "Albacete"}
ciudades_6_copia = ciudades_6.copy()
ciudades_6_copia_bis = ciudades_6
ciudades_6.clear()

##Qué pasa aqui??
print(ciudades_6_copia)
print(ciudades_6_copia_bis)

In [None]:
### 6.3.4 difference()
## Devuelve la diferencia entre dos o mas conjuntos en un nuevo conjunto
x = {"a", "b", "c", "d", "e"}
print("x vale: ", x)
y = {"b", "c"}
print("y vale: ", y)
z = {"c", "d"}
print("z vale: ", z)
print()
print('x - y = ', x.difference(y))
print('y - x = ', x.difference(y))

## O simplemente usando el operador -
print('x - y = ', x - z)

In [None]:
### 6.3.5 difference_update()
## Igual que difference(), salvo que al conjunto que 
## ejecuta este método se le sustraen los elementos de un segundo conjunto, quedando así modificado
## Se puede interpretar como x = x - y (x-=y)
x = {"a", "b", "c", "d", "e"}
print("x vale: ", x)
y = {"b", "c"}
print("y vale: ", y)

x.difference_update(y) #operación in-place
print("x.difference_update(y) = ", x)


In [None]:
### 6.3.6 remove() y discard()
## Para eliminar objetos de un conjunto usaremos estas dos funciones.
## La diferencia entre ambos es que remove() lanza una excepción si el elemento dado no existe en el conjunto!
x = {"a","b","c","d","e"}
print("x vale: ", x)
print('Hago x.remove("a")')
x.remove("a")
print("x vale: ", x)

a = x.pop()
print("x.pop() = ", a)
print("x vale: ", x)

In [None]:
print('x.remove("c")')
x.remove("c") # más rápido pero no comprueba existencia (lanza excepción)
print("x vale: ", x) 

In [None]:
print('x.remove("c")')
x.discard("c") # menos rápido pero más seguro
print("x vale: ", x) 

## Operaciones con conjuntos

In [None]:
### 6.4.5 union() e intersection()
## Devuelven la unión y la intersección de dos conjuntos.
x = {"a","b","c","d","e"}
print("x vale: ", x) 
y = {"c","d","e","f","g"}
print("y vale: ", y)
print("x | y = ", x | y) # o x.union(y)
print("x & y = ", x & y) # o x.intersection(y)

In [None]:
### 6.4.5 isdisjoint(), issubset(), issuperset()
## Devuelven True o False dependiendo de si el conjunto que el conjunto sobre el que se invoca el método es
## disjunto con el conjunto que se pasa como parámetro o es subconjunto o superconjunto del mismo, respectivamente.
x = {"a","b","c","d","e"}
print("x vale: ", x) 
y = {"f", "g"}
print("y vale: ", y) 
z = {"a", "b"}
print("z vale: ", z) 

print('x e y son disjuntos? ' + str(x.isdisjoint(y)))
print('z es un subconjunto de x? ' + str(z.issubset(x)))
print('x es un subconjunto de si mismo? ' + str(x.issubset(x)))
print('x es un superconjunto de si mismo? ' + str(x.issubset(x)))

##Los subconjuntos/superconjuntos propios son aquellos subconjuntos/superconjuntos de un conjunto dado que no son dicho conjunto.
##Para expresar esto en python usaremos los símbolos mayor (>) y menor (<) estrictos.
##Mayor o igual (>=) o menor o igual (<=) son equivalentes a issuperset y issubset respectivamente.

print('x es un subconjunto propio de si mismo? ' + str((x < x)))
print('y es un superconjunto propio de si mismo? ' + str(x > x))



# Ejercicio
Empleando el fichero covid-samples.fasta, calcula, empleando conjuntos, los alfabetos usado en cada una de las secuencias. Después, calcula la intersección entre todas las combinaciones de los alfabetos obtenidos. 
¿Qué secuencias tienen más simbolos en común?