# Conjuntos

Un conjunto es una colección no ordenada de objetos únicos. Python provee este tipo de datos «por defecto» al igual que otras colecciones más convencionales como las listas, tuplas y diccionarios.

Los conjuntos son ampliamente utilizados en lógica y matemática, y desde el lenguaje podemos sacar provecho de sus propiedades para crear código más eficiente y legible en menos tiempo.

# Creación de un conjunto

Para crear un conjunto especificamos sus elementos entre llaves:

In [1]:
s = {1, 2, 3, 4}

Al igual que otras colecciones, sus miembros pueden ser de diversos tipos:

In [2]:
s = {True, 3.14, None, False, "Hola mundo", (1, 2)}

No obstante, un conjunto no puede incluir objetos mutables como listas, diccionarios, e incluso otros conjuntos.

In [4]:
s = {[1, 2]}

TypeError: unhashable type: 'list'

Python distingue este tipo operación de la creación de un diccionario ya que no incluye dos puntos. Sin embargo, no puede dirimir el siguiente caso:

In [5]:
s = {}

Por defecto, la asignación anterior crea un diccionario. Para generar un conjunto vacío, directamente creamos una instancia de la clase set:

In [6]:
s = set()

De la misma forma podemos obtener un conjunto a partir de cualquier objeto iterable:

In [7]:
s1 = set([1, 2, 3, 4])
s2 = set(range(10))

Un set puede ser convertido a una lista y viceversa. En este último caso, los elementos duplicados son unificados.

In [8]:
list({1, 2, 3, 4})

[1, 2, 3, 4]

In [9]:
set([1, 2, 2, 3, 4])

{1, 2, 3, 4}

# Elementos

Los conjuntos son objetos mutables. Vía los métodos add() y discard() podemos añadir y remover un elemento indicándolo como argumento.

In [10]:
s = {1, 2, 3, 4}
s.add(5)
s.discard(2)

In [11]:
s

{1, 3, 4, 5}

Nótese que si el elemento pasado como argumento a discard() no está dentro del conjunto es simplemente ignorado. En cambio, el método remove() opera de forma similar pero en dicho caso lanza la excepción KeyError.

Para determinar si un elemento pertenece a un conjunto, utilizamos la palabra reservada in.

In [12]:
2 in {1, 2, 3}

True

In [13]:
4 in {1, 2, 3}

False

La función clear() elimina todos los elementos.

In [14]:
s = {1, 2, 3, 4}
s.clear()

In [15]:
s

set()

El método pop() retorna un elemento en forma aleatoria (no podría ser de otra manera ya que los elementos no están ordenados). Así, el siguiente bucle imprime y remueve uno por uno los miembros de un conjunto.

In [16]:
while s:
    print(s.pop())

remove() y pop() lanzan la excepción KeyError cuando un elemento no se encuentra en el conjunto o bien éste está vacío, respectivamente.

Para obtener el número de elementos aplicamos la ya conocida función len():

In [17]:
len({1, 2, 3, 4})

4

# Operaciones principales

Algunas de las propiedades más interesantes de los conjuntos radican en sus operaciones principales: unión, intersección y diferencia.

La unión se realiza con el caracter | y retorna un conjunto que contiene los elementos que se encuentran en al menos uno de los dos conjuntos involucrados en la operación.

In [20]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
a | b

{1, 2, 3, 4, 5, 6}

La intersección opera de forma análoga, pero con el operador &, y retorna un nuevo conjunto con los elementos que se encuentran en ambos.

In [21]:
a & b

{3, 4}

La diferencia, por último, retorna un nuevo conjunto que contiene los elementos de a que no están en b.

In [22]:
a = {1, 2, 3, 4}
b = {2, 3}
a - b

{1, 4}

Dos conjuntos son iguales si y solo si contienen los mismos elementos (a esto se lo conoce como principio de extensionalidad):

In [24]:
{1, 2, 3} == {3, 2, 1}

True

In [25]:
{1, 2, 3} == {4, 5, 6}

False

# Otras operaciones

Se dice que B es un subconjunto de A cuando todos los elementos de aquél pertenecen también a éste. Python puede determinar esta relación vía el método issubset().

In [29]:
a = {1, 2, 3, 4}
b = {2, 3}
b.issubset(a)

True

Inversamente, se dice que A es un superconjunto de B.

In [33]:
a.issuperset(b)

True

La definición de estas dos relaciones nos lleva a concluir que todo conjunto es al mismo tiempo un subconjunto y un superconjunto de sí mismo.

In [31]:
a = {1, 2, 3, 4}
a.issubset(a)

True

In [32]:
a.issuperset(a)

True

La diferencia simétrica retorna un nuevo conjunto el cual contiene los elementos que pertenecen a alguno de los dos conjuntos que participan en la operación pero no a ambos. Podría entenderse como una unión exclusiva.

In [34]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
a.symmetric_difference(b)

{1, 2, 5, 6}

Dada esta definición, se infiere que es indistinto el orden de los objetos:

In [35]:
b.symmetric_difference(a)

{1, 2, 5, 6}

Por último, se dice que un conjunto es disconexo respecto de otro si no comparten elementos entre sí.

In [37]:
a = {1, 2, 3}
b = {3, 4, 5}
c = {5, 6, 7}
a.isdisjoint(b)
# No son disconexos ya que comparten el elemento 3.

False

In [38]:
a.isdisjoint(c)
# Son disconexos.

True

En otras palabras, dos conjuntos son disconexos si su intersección es el conjunto vacío, por lo que puede ilustrarse de la siguiente forma:

In [40]:
def isdisjoint(a, b):
    return a & b == set()

In [41]:
isdisjoint(a, b)

False

In [42]:
isdisjoint(a, c)

True