# Conjuntos en Python

## Programación para Analítica de Datos
## Mtra. Gisel Hernández Chávez

### Contenido principal
+ Características de un conjunto.
+ Diagramas de Venn.
+ Creación de un conjunto. Conjunto vacío.
+ Conjunto mutable, pero sus elementos no pueden serlo.
+ Operaciones dentro de un conjunto.
+ Operaciones entre conjuntos.
+ Ejemplos y ejercicios.

## Conjunto

Colección desordenada de objetos únicos (no duplicados).

+ En Python son una colección mutable que no puede contener objetos mutables. Es por ello que un conjunto puede tener escalares, tuplas y cadenas, pero no puede contener listas, diccionarios o conjuntos.
+ Los usos básicos incluyen pruebas de membresía y eliminación de entradas duplicadas.
+ Los objetos set también admiten operaciones matemáticas como unión, intersección, diferencia y diferencia simétrica.
+ Las llaves {} vacías crean un diccionario, no un conjunto.
+ Las llaves con elementos crean conjuntos de la siguiente forma:

    conjunto1 = {2,3,4,5}
    
+ La función set () se pueden usar para crear conjuntos. 

    conjunto2 = set(2,3,4,5)
		
__RECORDAR:__ Para crear un conjunto vacío, debe usar set (), no {}; este último crea un diccionario vacío.

In [1]:
# Llaves vacías crean un diccionario
a = {}
type(a)

dict

In [2]:
a1 = {2,4,5}
type(a1)

set

In [3]:
d1 = {1:("ICD",2,7)}
type(d1)

dict

In [4]:
# Crear conjunto vacío
a2 = set()
type(a2)

set

## Diagramas de Venn y operaciones de conjunto

![image-2.png](attachment:image-2.png)

In [5]:
# El conjunto no puede contener elementos mutables
a3 = {{2,3},{4,2}}
type(a3)

TypeError: unhashable type: 'set'

In [None]:
# La lista es mutable
a32 = {[2,3],[4,2]}
type(a32)

TypeError: unhashable type: 'list'

In [None]:
# Las tuplas son inmutables
nombres = set((("Python","Perl"), ("Paris", "Berlin", "London")))
nombres


{('Paris', 'Berlin', 'London'), ('Python', 'Perl')}

In [9]:
nombres = set([("Python","Perl"), ("Paris", "Berlin", "London")])
nombres


{('Paris', 'Berlin', 'London'), ('Python', 'Perl')}

## Uso de set() para eliminación de duplicados

In [None]:
# El string es inmutable
a4 = set("Un tutorial de Python")
a4

{' ', 'P', 'U', 'a', 'd', 'e', 'h', 'i', 'l', 'n', 'o', 'r', 't', 'u', 'y'}

In [None]:
# Pasar una lista a la función set()
# Convierte la lista en conjunto
a5 = set(["Perl", "Python", "Java", "Java"])
a5

{'Java', 'Perl', 'Python'}

In [None]:
# Pasar una tupla a la función set()
# Convierte la tupla en conjunto
ciudades = set(("Paris", "Londres", "Berlin","Paris","México"))
ciudades

{'Berlin', 'Londres', 'México', 'Paris'}

In [None]:
# Atributos de set
dir(set)

['__and__',
 '__class__',
 '__class_getitem__',
 '__contains__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__iand__',
 '__init__',
 '__init_subclass__',
 '__ior__',
 '__isub__',
 '__iter__',
 '__ixor__',
 '__le__',
 '__len__',
 '__lt__',
 '__ne__',
 '__new__',
 '__or__',
 '__rand__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__ror__',
 '__rsub__',
 '__rxor__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__sub__',
 '__subclasshook__',
 '__xor__',
 'add',
 'clear',
 'copy',
 'difference',
 'difference_update',
 'discard',
 'intersection',
 'intersection_update',
 'isdisjoint',
 'issubset',
 'issuperset',
 'pop',
 'remove',
 'symmetric_difference',
 'symmetric_difference_update',
 'union',
 'update']

In [None]:
set.isdisjoint?

In [None]:
A = {1,2,3}
B = {4,5}
c = A.isdisjoint(B)
c



True

## Adición de elementos a un conjunto, dado que son mutables

In [None]:
ciudades = set(["Frankfurt", "Basel","Freiburg"])
ciudades.add("Strasbourg")
ciudades

{'Basel', 'Frankfurt', 'Freiburg', 'Strasbourg'}

## Los frozensets son como conjuntos, excepto que son inmutables

+ El caso de uso más obvio de los conjuntos congelados es para declarar objetos de tipo conjunto con elementos únicos sin riesgo de cambiarlos accidentalmente más adelante en el código.

+ Los objetos de tipo Frozenset se pueden usar como claves de diccionario, mientras que los conjuntos no se pueden usar para el mismo propósito. 

+ Dado que los conjuntos congelados se pueden modificar, se pueden usar dentro de conjuntos, mientras que los conjuntos no se pueden insertar en otro conjunto.

In [None]:
ciudades_inm = frozenset(["Frankfurt", "Basel","Freiburg"])
ciudades_inm.add("Strasbourg")
ciudades_inm

AttributeError: 'frozenset' object has no attribute 'add'

## Ejemplo de conjunto de cadenas

In [None]:
# Cada elemento es de tipo str
adjetivos = {"cheap","expensive","inexpensive","economical"}
adjetivos

{'cheap', 'economical', 'expensive', 'inexpensive'}

## Adición de elementos a un conjunto

In [None]:
colores = {"red","green"}
colores.add("yellow")
colores

{'green', 'red', 'yellow'}

In [None]:
# Si ya está el elemento en el conjunto no se produce un error, simplemente lo ignora porque ya está
colores.add("red")
colores

{'green', 'red', 'yellow'}

In [None]:
colores.add("yellow","brown")  # Produce un error porque solo se puede llamar con un argumento
colores

TypeError: set.add() takes exactly one argument (2 given)

In [None]:
try:
    colores.add("yellow","brown")  # Produce un error porque solo se puede llamar con un argumento
    colores
except TypeError:
    print('Error de tipo')

Error de tipo


In [None]:
colores.add(("yellow","brown"))  # el nuevo elemento es una tupla que no existe y la adiciona
colores

{('yellow', 'brown'), 'green', 'red', 'yellow'}

## Eliminación de todos los elementos de un conjunto

In [None]:
ciudades = {"Guanajuato", "Morelia", "Querétaro"}
ciudades.clear()
ciudades

set()

## Creación de una copia superficial (_shallow copy_) 

In [None]:
mas_ciudades = {"Zacatecas","San Luis Potosí","Villa Hermosa"}

ciudades_backup = mas_ciudades.copy() # Retorna copia superficial del set()

# Como los elementos del conjunto no son estructuras anidadas, no hay probllemas con la copia superficial

# Borrar el contenido de una variable no afecta a la otra
mas_ciudades.clear()

ciudades_backup

{'San Luis Potosí', 'Villa Hermosa', 'Zacatecas'}

In [None]:
id(mas_ciudades), id(ciudades_backup) # direcciones diferentes; objetos diferentes

(2084675393344, 2084675394240)

In [None]:
# Observe lo que ocurre cuando se hace una asignación en lugar de usar copy()

mas_ciudades2 = {"La paz","Schaffhausen","St. Gallen"}
ciudades_backup2 = mas_ciudades 
mas_ciudades2.clear()
# Se borra el contenido de una, lo que afecta a la otra variable, por ser una referencia al mismo objeto
ciudades_backup2 

# La asignación solo crea una nueva referencia, o sea, otro nombre para la misma estructura de datos

set()

## Copia profunda

In [None]:
import copy
no_capitales ={('Zacatecas',('Jerez de García Salinas', 'Fresnillo', 'Río Grande', 'Sombrerete')),
              ('Jalisco',('Guadalajara','Zapopan','Tlaquepaque','Tonalá'))}
copia_no_cap = copy.deepcopy(no_capitales)

copia_no_cap

{('Jalisco', ('Guadalajara', 'Zapopan', 'Tlaquepaque', 'Tonalá')),
 ('Zacatecas',
  ('Jerez de García Salinas', 'Fresnillo', 'Río Grande', 'Sombrerete'))}

In [None]:
#dir(set)

In [None]:
next(iter(copia_no_cap))

('Zacatecas',
 ('Jerez de García Salinas', 'Fresnillo', 'Río Grande', 'Sombrerete'))

In [None]:
next(iter(copia_no_cap))[1]

('Jerez de García Salinas', 'Fresnillo', 'Río Grande', 'Sombrerete')

In [None]:
next(iter(copia_no_cap))[1][2]

'Río Grande'

In [None]:
copia_no_cap = copia_no_cap.pop()
copia_no_cap

('Zacatecas',
 ('Jerez de García Salinas', 'Fresnillo', 'Río Grande', 'Sombrerete'))

In [None]:
no_capitales

{('Jalisco', ('Guadalajara', 'Zapopan', 'Tlaquepaque', 'Tonalá')),
 ('Zacatecas',
  ('Jerez de García Salinas', 'Fresnillo', 'Río Grande', 'Sombrerete'))}

## Diferencia entre dos o más conjuntos

+ Retorna la diferencia entre dos o más conjuntos como un nuevo conjunto.

In [None]:

x = {"a","b","c","d","e"}
y = {"b","c"}
z = {"c","d"}
x.difference(y)

{'a', 'd', 'e'}

In [None]:
x.difference(y).difference(z)

{'a', 'e'}

In [None]:
# En lugar de usar el método podemos usar el operador  "-":
x - y

{'a', 'd', 'e'}

In [None]:
x - y - z

{'a', 'e'}

## x.difference_update(y)

+ Elimina todos los elementos de x que están en y. __No retorna un nuevo conjunto__, sino que actualiza al conjunto x.
+ Es una operación "in place"
+ Es lo mismo que  "x = x - y“

In [None]:
x.difference_update(y)
x

{'a', 'd', 'e'}

In [None]:
x = x - y
x

{'a', 'd', 'e'}

## Diferencia simétrica

La diferencia simétrica de dos conjuntos es un conjunto que contiene los elementos que no se comparten por los conjuntos. En otras palabras, son los elementos que están en un conjunto pero no en ambos. 

__Formato general:__
	
	set1.symmetric_difference (set2)
    
![image-2.png](attachment:image-2.png)

In [None]:
x = {"a","b","c","d","e"}
y = {"b","c"}
dif_sim = x.symmetric_difference(y)
dif_sim

{'a', 'd', 'e'}

## Descartar (eliminar) un elemento de un conjunto con discard(elemento)

+ Se eliminará el elemento del set, si es que está contenido en el mismo; de lo contrario no se hace nada.

In [None]:
x = {"a","b","c","d","e"}
x.discard("a")
x

{'b', 'c', 'd', 'e'}

In [None]:
x.discard("z")  # Como "z" no está no se hace nada. No marca error.
x

{'b', 'c', 'd', 'e'}

## Remover un elemento (eliminar), pero levantando un error si no está
+ Trabaja como discard(), pero si el no es miembro del conjunto, se levanta un KeyError.

In [None]:
x = {"a","b","c","d","e"}
x.remove("a")
x

{'b', 'c', 'd', 'e'}

In [None]:
x.remove("z")

KeyError: 'z'

## Unión de dos conjuntos
+ Retorna la unión de dos conjuntos como un nuevo conjunto.
+ Se puede llevar a cabo usando el método union() o abreviar con el operador "|":

In [None]:
x = {"a","b","c","d","e"}
y = {"c","d","e","f","g"}
x.union(y)

{'a', 'b', 'c', 'd', 'e', 'f', 'g'}

In [None]:
# Se puede abreviar con el operador "|":
x | y

{'a', 'b', 'c', 'd', 'e', 'f', 'g'}

## Intersección de dos conjuntos
+ Se devuelve un conjunto con todos los elementos que están contenidos en ambos conjuntos.
+ Se puede usar el método intersection() o abreviar con el operador &

In [None]:
x = {"a","b","c","d","e"}
y = {"c","d","e","f","g"}
x.intersection(y)

{'c', 'd', 'e'}

In [None]:
# Se puede abreviar con el operador ampersand "&":

x = {"a","b","c","d","e"}
y = {"c","d","e","f","g"}
x  & y

{'c', 'd', 'e'}

## Determinar si un conjunto es disjunto
+ Puede usarse el método isdisjoint() que retorna True si dos sets tienen una intersección nula

In [None]:
x = {"a","b","c"}
y = {"c","d","e"}
x.isdisjoint(y)

False

In [None]:
False

x = {"a","b","c"}
y = {"d","e","f"}
x.isdisjoint(y)

True

## Determinar si un conjunto es subconjunto o superconjunto de otro
+ Se puede usar el método x.issubset(y) para determinar si es subconjunto. Retorna True, si x es un subset de y.
+ Se puede usar el método x.issuperset(y) para determinar si es superconjunto. Retorna True, si x es un superset de y.
+ "<=" es una abreviatura de "Subset of"	y  ">="  para  "superset of" 
+ Sea A un subconjunto de B tal que A ≠ B. Entonces se dice que __A es un subconjunto propio de B__, y se denota por A ⊊ B. A su vez, se dice que B es un superconjunto propio de A, B ⊋ A
+ "<" es usado para chequear si un set es un __subconjunto propio__ de un conjunto.
+ ">=" es una abreviatura de  "issuperset of" 
+ ">" se usa para checar si un conjunto es un __superconjunto propio__. 


In [None]:
x = {"a","b","c","d","e"}
y = {"c","d"}
x.issubset(y) # x <= y

False

In [None]:
x1 = {"a","b","c","d","e"}
y1 = {"a","b","c","d","e"}
x1.issubset(y1) # Es True porque es subconjunto, pero no es subconjunto propio

True

In [None]:
y.issubset(x)

True

In [None]:
x < y  # Se pregunta por subconjunto propio

False

In [None]:
x > y # Se pregunta si x es superconjunto propio de y

In [None]:
y < x     # y es un subconjunto propio de x

True

In [None]:
x < x    # un conjunto nunca puede ser un subconjunto propio de sí mismo.

False

In [None]:
x <= x 

True

In [None]:
x = {"a","b","c","d","e"}
y = {"c","d"}
x.issuperset(y)

True

In [None]:
x > y

True

In [None]:
x >= y

True

In [None]:
x >= x

True

In [None]:
x > x

False

In [None]:
x.issuperset(x)

True

## Eliminar elemento arbitrario de un conjunto
+ Se emplea el método pop()
+ Elimina y retornan un elemento arbitrario de un conjunto. Si el conjunto está vacío se produce un error de tipo KeyError

In [None]:
x = {(3,2),"z",8,"d","e"}
x.pop()

(3, 2)

In [None]:
x.pop()

8

## Conjunto por comprensión
+ En lugar de una lista por comprensión se puede crear un conjunto por comprensión
+ Usa llaves en lugar de corchetes

In [None]:
conj1 = {n**2 for n in range(12)}
conj1
# {0, 1, 4, 9, 16, 25, 36, 49, 64, 81, 100, 121}

{0, 1, 4, 9, 16, 25, 36, 49, 64, 81, 100, 121}

In [None]:
# En el siguiente ejemplo se obtiene una salida donde se eliminan los duplicados
# solo hay tres posibles restos de una divisón entre 3: 0,1,2

{a % 3 for a in range(1000)}

{0, 1, 2}

## Ejercicios en clase
1. Cree un conjunto denominado fruit1 que incluya los siguientes elementos: manzanas, naranjas, plátanos y cerezas. Cree otro conjunto llamado fruit2 que incluya los siguientes elementos: naranjas, piñas, guayabas y plátanos. Escribe un código para encontrar la unión de fruit1 y fruit2.
2. Escriba código que cree otro conjunto fruit3 que contenga todos los elementos de fruit1 que no estén en fruit2.
3. Escriba código que cree otro conjunto fruit4 que contenga solo los elementos que se encuentran tanto en fruit1 como en fruit2. 

In [None]:
fruit =

## Establecer operaciones con otras colecciones

Solo podemos llamar a los métodos de operador de conjuntos en conjuntos, pero en realidad podemos pasar cualquier colección que queramos al método. Esto se debe a que Python va a convertir la colección que pasamos a un conjunto antes de realizar la operación.

Por ejemplo:

In [None]:
letters = {"a", "b", "c"}
numbers = [1, 2, 3]
letters_and_numbers = letters.union(numbers)

print(letters_and_numbers)  # {'a', 'c', 1, 2, 3, 'b'}


{1, 2, 3, 'c', 'a', 'b'}
