# **Introducción a Python**
# FP08. Conjuntos en Python (set)

Un conjunto (__set__), es una colección __desordenada__ y __mutable__ de elementos __únicos__. Los conjuntos se utilizan para almacenar múltiples elementos sin un orden específico y sin permitir duplicados. En otras palabras, un conjunto solo puede contener elementos únicos.

Características de los conjuntos en Python:

* No mantienen un orden específico de los elementos.
* No permiten elementos duplicados, es decir, cada elemento es único en el conjunto.
* Los conjuntos son mutables, lo que significa que se pueden modificar agregando o eliminando elementos.
Los elementos en un conjunto deben ser inmutables, como cadenas, números o tuplas. No se pueden utilizar listas, diccionarios u otras estructuras como elementos de un conjunto.
* Los conjuntos admiten operaciones matemáticas de conjuntos como unión, intersección y diferencia.

Un conjunto se puede crear utilizando llaves `{}` o utilizando la función `set()`.

## <font color='blue'>**Creando Sets**</font>

In [None]:
# Creamos un set llamado 'x'

x = set()

In [None]:
# Como siempre verificamos el tipo

type(x)

set

In [None]:
# Agreguémosle un elemento
# Son mutables, los podemos cambiar
x.add(1)

In [None]:
# Visualicemos nuestro set.
# No te confundas con las llaves que se usan en los diccionarios
x

{1}

In [None]:
x.add(2)

In [None]:
x

{1, 2}

Ten en cuenta las llaves. ¡Esto no indica un diccionario! Aunque se podría hacer la analogía a que un conjunto como un diccionario con solo llaves (keys).

Sabemos que un conjunto sólo tiene entradas únicas. Entonces, ¿qué sucede cuando intentamos agregar algo que ya está en un conjunto?

In [None]:
# Nota cómo la siguiente sentencia NO colocará otro 1 en el set 'x'
# Eso es porque un conjunto solo se ocupa de elementos únicos!
# Atención: fíjate que no arroja ningún error
x.add(1)

In [None]:
x

{1, 2}

In [None]:
# Podemos añadir un -1 porque es diferente de 1

x.add(-1)

In [None]:
x

{-1, 1, 2}

In [None]:
x.add(1.0)

In [None]:
x

{-1, 1, 2}

In [None]:
# Podemos eliminar un elemento

x.discard(2)

In [None]:
x

{-1, 1}

In [None]:
# Podemos añadir varios elementos
# Fíjate que si añadimos una lista la desempaqueta

x.update([-1, 3, 4, 5])

In [None]:
x

{-1, 1, 3, 4, 5}

In [None]:
# Podemos sacar un elemento con pop()

x.pop()

1

In [None]:
# Qué elemento saca? El primero? El último? Uno aleatorio?

x

{-1, 3, 4, 5}

Reglas del pop en un set

https://docs.python.org/3/library/stdtypes.html#frozenset.pop





<font color='purple' style='bold' size=5>**Experimento** </font>

Al observar el comportamiento aleatorio de .pop() y la naturaleza de irrepetibilidad de los elementos de un set, nos recordó una bolsa de números de un juego como la Lota.


Es por lo anterior, que decidimos hacer un pequeño juego para evaluar si los sets serían una buena estructura de datos para una bolsita de número de Lota, y el método .pop() como el acto de sacar un número de la bolsita con una mínima cantidad de código.

Inicialmemte, como se indica que el elemento eliminado es elegido 'arbitrariamente', asumimos que esto ocurriría al azar. Para nuestra sorpresa esto no fue así.


In [None]:

bolsita = set(range(1,91))

while len(bolsita) > 0:
    print(f"El número es el {bolsita.pop()}")



El número es el 1
El número es el 2
El número es el 3
El número es el 4
El número es el 5
El número es el 6
El número es el 7
El número es el 8
El número es el 9
El número es el 10
El número es el 11
El número es el 12
El número es el 13
El número es el 14
El número es el 15
El número es el 16
El número es el 17
El número es el 18
El número es el 19
El número es el 20
El número es el 21
El número es el 22
El número es el 23
El número es el 24
El número es el 25
El número es el 26
El número es el 27
El número es el 28
El número es el 29
El número es el 30
El número es el 31
El número es el 32
El número es el 33
El número es el 34
El número es el 35
El número es el 36
El número es el 37
El número es el 38
El número es el 39
El número es el 40
El número es el 41
El número es el 42
El número es el 43
El número es el 44
El número es el 45
El número es el 46
El número es el 47
El número es el 48
El número es el 49
El número es el 50
El número es el 51
El número es el 52
El número es el 53
El

¡Podemos observar que los elementos fueron eliminados en orden!

Revisando la [documentación](https://docs.python.org/3/library/stdtypes.html#frozenset.pop) del método, podemos corroborar que el método elimina un elemento 'arbitrariamente', sin embargo al investigar un poco más, pudimos comprender que .pop() [no elimina elementos de forma aleatoria aleatoria cuando se trata de enteros](https://stackoverflow.com/questions/21017188/set-pop-isnt-random), porque los elementos de un set se hashean en un hashmap, y **en el caso de los enteros el *value* de cada elemento es el entero en sí.** Esto no ocurriría por ejemplo si los elementos fueran strings.

Pero queremos jugar Lota.

Entonces instanciaremos una lista y luego revolveremos los valores para finalmente convertirla en set. ¿Funcionará?

In [None]:
import random
bolsita = list(range(1,91))
random.shuffle(bolsita)
print('Lista revuelta', bolsita)
bolsita = set(bolsita)
print('Lista convertida en set', bolsita)

Lista revuelta [82, 25, 23, 3, 30, 27, 79, 53, 80, 37, 39, 56, 22, 60, 11, 36, 81, 20, 65, 84, 73, 44, 76, 90, 17, 48, 38, 67, 7, 72, 35, 55, 4, 32, 28, 34, 62, 52, 47, 8, 21, 59, 51, 89, 74, 87, 49, 75, 85, 15, 78, 33, 19, 12, 83, 31, 2, 54, 16, 10, 69, 64, 6, 13, 29, 88, 45, 9, 14, 24, 1, 77, 42, 68, 58, 57, 66, 71, 86, 50, 63, 61, 43, 41, 5, 46, 40, 70, 26, 18]
Lista convertida en set {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90}


¡Nuevamente se ordenó! El hash sigue siendo el mismo, tomando el valor del int.
Podríamos intentar hacer la lota con listas ya desordenadas, y funcionaría, pero seguiremos insistiendo.
Probemos convirtiendo los valores en str() para ver si hay algún cambio.

In [None]:
bolsita = set(range(1,91))
nueva_bolsita = set()
for i in bolsita:
    nueva_bolsita.add(str(i))

#reasignamos bolsita
bolsita = nueva_bolsita

print(bolsita)


{'50', '47', '79', '24', '11', '62', '15', '60', '90', '72', '48', '80', '36', '86', '59', '71', '87', '3', '69', '64', '8', '28', '58', '78', '85', '89', '4', '7', '54', '23', '68', '17', '51', '66', '63', '56', '75', '29', '77', '74', '9', '88', '20', '25', '37', '55', '1', '40', '76', '57', '52', '81', '30', '42', '46', '2', '34', '73', '41', '45', '16', '18', '35', '10', '19', '82', '84', '21', '43', '38', '39', '33', '83', '5', '6', '13', '31', '70', '32', '49', '53', '22', '67', '26', '27', '65', '61', '12', '44', '14'}


In [None]:
# Intentemos nuevamente
while len(bolsita) > 0:
    print(f"El número es el {bolsita.pop()}")

El número es el 79
El número es el 24
El número es el 11
El número es el 62
El número es el 15
El número es el 60
El número es el 90
El número es el 72
El número es el 48
El número es el 80
El número es el 36
El número es el 86
El número es el 59
El número es el 71
El número es el 87
El número es el 3
El número es el 69
El número es el 64
El número es el 8
El número es el 28
El número es el 58
El número es el 78
El número es el 85
El número es el 89
El número es el 4
El número es el 7
El número es el 54
El número es el 23
El número es el 68
El número es el 17
El número es el 51
El número es el 66
El número es el 63
El número es el 56
El número es el 75
El número es el 29
El número es el 77
El número es el 74
El número es el 9
El número es el 88
El número es el 20
El número es el 25
El número es el 37
El número es el 55
El número es el 1
El número es el 40
El número es el 76
El número es el 57
El número es el 52
El número es el 81
El número es el 30
El número es el 42
El número es el 46

Ahora sí.

In [None]:
bolsita = set(range(1,91))
nueva_bolsita = set()
for i in bolsita:
    nueva_bolsita.add(str(i))

#reasignamos bolsita
bolsita = nueva_bolsita

while len(bolsita) > 0:
    numero = bolsita.pop()
    try:
        if numero == '69':
            print('¡El número bonito!')
        elif numero[-1] == '9':
            print('¡El potito se le mueve!')
        elif numero == '11':
            print('¡Par de canillas!')
        elif numero == '22':
            print('¡Par de patos!')
        print(f"Número {numero}.")
        input('\n\nPresiona una tecla para ver el siguiente número\n')
    except KeyboardInterrupt:
        break # para que no salga error al detener la celda


Número 50.


Presiona una tecla para ver el siguiente número

Número 47.


Presiona una tecla para ver el siguiente número

¡El potito se le mueve!
Número 79.


¡Funciona! En este juego de lota pudimos prescindir de random para generar valores, sin embargo hay que recordar que este juego es pseudo-aleatorio, así que mejor no apostar dinero real.


<font color='purple' size=5 >**Fin experimento** </font>

In [None]:
#saca un elemento aleatorio ya que el set no es ordenado como si lo es una lista

Podemos crear un set a partir de una lista con múltiples elementos repetidos para obtener los elementos únicos. Por ejemplo:

In [None]:
# Creamos una lista 'mylist' con varios elementos repetidos

mylist = [1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3]

In [None]:
# Ahora creamos un set a partir de la lista 'mylist'

set(mylist)

{1, 2, 3}

Podemos crear de forma rápida un conjunto solo con {}

In [None]:
myset = {1, 2, 3}

In [None]:
type(myset)

set

In [None]:
# Pero atención, no puede estar vacío ya que si no, crearíamos una diccionario

myset2 = {}
type(myset2)

dict

In [None]:
# Para crear un set vacío usa el constructor set()

myset3 = set()
type(myset3)

set

In [None]:
# Borramos el contenido con el método clear()

myset.clear()
myset

set()

## <font color='blue'>**Tipos de datos variados**</font>

In [None]:
# set de enteros (int)

my_set4 = {1, 2, 3}
print(my_set4)

# set de tipos variados

my_set5 = {1.0, "Hello", (1, 2, 3)}   # float, string y tuple
print(my_set5)

{1, 2, 3}
{'Hello', 1.0, (1, 2, 3)}


No obstante, un conjunto no puede incluir objetos mutables como listas, diccionarios, e incluso otros conjuntos. Esto ocurre básicamente porque los elementos deben ser *hashables*

In [None]:
# Esta celda dará un error al tratar de crear el set con un elemento no "hasheable"
# Las listas no son hasheables
c = {[1, 2]}

TypeError: unhashable type: 'list'

<div class="alert alert-block alert-warning">
<b>TIP:</b> 'hashable' es una característica de los objetos Python que indica si el objeto tiene un valor hash o no. Si el objeto tiene un valor hash, se puede utilizar como clave para un diccionario o como elemento en un conjunto. Un objeto es hash si tiene un valor hash que no cambia durante toda su vida útil.

Un valor hash es un identificador (normalmente alfanumérico) único del objeto; algo así como su RUT. Se utiliza para almacenarlo y buscarlo de forma eficiente y rápida.
</div>

In [None]:
llave1 = 'papa'
llave2 = 'Papa'
hash_llave1 = hash(llave1)
hash_llave2 = hash(llave2)
print(hash_llave1, hash_llave2)

-815618762216955639 6501936279238941848


## <font color='blue'>**Operaciones matemáticas**</font>

Los objetos `set` también admiten operaciones matemáticas como unión, intersección, diferencia y diferencia simétrica.

In [None]:
a = {1, 2, 3, 4, 5, 6}
b = {4, 5, 6, 7, 8, 9, 10}

In [None]:
# Unión: usa el operador | o el método union()

a | b

{1, 2, 3, 4, 5, 6, 7, 8, 9, 10}

In [None]:
a.union(b)

{1, 2, 3, 4, 5, 6, 7, 8, 9, 10}

In [None]:
# Intersección: usa el operador & o el método intersection()

a & b

{4, 5, 6}

In [None]:
a.intersection(b)

{4, 5, 6}

In [None]:
# Diferencia: usa el operador - o el método difference()

a - b

{1, 2, 3}

In [None]:
a.difference(b)

{1, 2, 3}

In [None]:
b - a

{7, 8, 9, 10}

In [None]:
b.difference(a)

{7, 8, 9, 10}


La __diferencia simétrica__ en conjuntos (sets) de Python se refiere a los elementos que están presentes en uno de los conjuntos, pero no en ambos conjuntos al mismo tiempo. Es decir, es la combinación de los elementos exclusivos de dos conjuntos. Es útil para encontrar elementos únicos y comparar conjuntos.

In [None]:
# Diferencia simétrica: usa el operador ^ o el método symmetric_difference()
a ^ b

{1, 2, 3, 7, 8, 9, 10}

In [None]:
a.symmetric_difference(b)

{1, 2, 3, 7, 8, 9, 10}

## <font color='blue'>**Membresía (Membership)**</font>

In [None]:
a

{1, 2, 3, 4, 5, 6}

In [None]:
print(a)

{1, 2, 3, 4, 5, 6}


In [None]:
print(*a, sep=', ')

1, 2, 3, 4, 5, 6


In [None]:
2 in a

True

In [None]:
# Lo mismo pero usando la función print()

print(2 in a)
print(f'{2 in a}')

True
True


In [None]:
'2' in a

False

In [None]:
# Busquemos un set en otro

c = {2, 3}

Se dice que $C$ es un subconjunto de $A$ cuando todos los elementos de aquél pertenecen también a éste. Python puede determinar esta relación vía el método `issubset()`.

In [None]:
c.issubset(a)

True

Inversamente, se dice que $A$ es un superconjunto de $B$.

In [None]:
a.issuperset(c)

True

## <font color='blue'>__Ejercicios__</font>

### <font color='green'>Actividad 1:</font>
### Crea un set con 5 elementos del tipo float
Crea un set llamado $a$

Tip:
1. Usa el método `set()`
2. Recuerda el uso de floats con punto decimal como 4.3 or 0.123

In [None]:
# Tu código aquí ...
a = set([4.3, 0.123, 7.89, 3.14, 9.99])

# Imprimir el set
print(a)


{0.123, 3.14, 4.3, 7.89, 9.99}


<font color='green'>Fin actividad 1</font>

### <font color='green'>Actividad 2:</font>
### Operaciones sobre conjutos (sets)
En la siguiente celda hay dos conjuntos con los personajes del programa de televisión de Riverdale: $A$ y $B$ <br>
Haz lo siguiente:
* Agregar un nuevo personaje en el conjunto $A$
* Eliminar un personaje de set $B$
* Imprimir la intersección entre $A$ y $B$
* Imprimir la unión entre $A$ y $B$
* Extraer la diferencia simétrica entre $A$ y $B$

In [None]:
A = {'Josie', 'Archie', 'Jughead', 'Cheryl', 'Kevin'}
B = set(['Veronica', 'Betty', 'Cheryl', 'Fred', 'Melody', 'Josie'])

In [None]:
# Tu código aquí ...
# Agregar un nuevo personaje en el conjunto A
A.add('Reggie')

# Eliminar un personaje del conjunto B
B.remove('Melody')

# Imprimir la intersección entre A y B (elementos comunes en ambos conjuntos)
interseccion = A.intersection(B)
print(f"Intersección entre A y B: {interseccion}")

# Imprimir la unión entre A y B (todos los elementos sin repetir)
union = A.union(B)
print(f"Unión entre A y B: {union}")

# Extraer la diferencia simétrica entre A y B (elementos que están en A o en B pero no en ambos)
diferencia_simetrica = A.symmetric_difference(B)
print(f"Diferencia simétrica entre A y B: {diferencia_simetrica}")


Intersección entre A y B: {'Josie', 'Cheryl'}
Unión entre A y B: {'Kevin', 'Betty', 'Cheryl', 'Reggie', 'Josie', 'Archie', 'Jughead', 'Veronica', 'Fred'}
Diferencia simétrica entre A y B: {'Betty', 'Reggie', 'Jughead', 'Veronica', 'Fred', 'Kevin', 'Archie'}


<font color='green'>Fin actividad 2</font>