<a href="https://colab.research.google.com/github/nferrucho/PythonUNAL/blob/main/Copia_de_NBK_3_2_Colecciones_no_ordenadas.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<img src = "https://drive.google.com/uc?export=view&id=15valhk8csdphKsJ6VGL57wAmw-bCsxL-" alt = "Si no puede ver este encabezado le recomendamos que utilice un navegador distinto. Los navegadores probados son Google Chrome, Opera y Microsoft Edge." width = "80%">  </img>

# **Colecciones no ordenadas de datos con _Python_**
---
¡Le damos la bienvenida a la tercera unidad del módulo de **Introducción a la programación con _Python_**!

En este segundo material se discutirá la necesidad de plantear estrategias para la creación, consulta y manejo de estructuras con múltiples datos en los que el orden no importa, y en particular, de las colecciones de datos no ordenadas disponibles por defecto en _Python_.

## **1.  Colecciones no ordenadas**
---

En la mayoría de los casos es suficiente con disponer de nuestros datos de manera ordenada y usar su posición para identificar y acceder a sus elementos. Sin embargo, es frecuente encontrar tareas en los que se necesite una forma distinta de identificación de los elementos de una colección que no corresponda con una posición, o donde no sea importante considerar un orden para los datos.

Por ejemplo, en una aplicación con carrito de compras y opción de búsqueda de productos lo ideal sería poder identificar los productos por características que los identifiquen como su nombre, para acceder rápidamente y actualizar su valor.

</br>

<center>
<img src = "https://drive.google.com/uc?export=view&id=19S5EEvVQZbNO81CFvJ6_tDd6OWabKEQb" alt = "Encabezado MLDS" width = "30%">  </img> </center>


Si bien podría representarse este tipo de colección con una lista, surgen algunos problemas que podrían afectar el desempeño de nuestro programa. Si partimos de un nombre del producto y tenemos que encontrar el elemento correspondiente en una lista, tenemos que revisar **todo el contenido** en el peor de los casos (cuando esté en el último lugar). Es por esto que en computación se han planteado estructuras y algoritmos para permitir el acceso e identificación de elementos a partir de otros tipos de datos y para optimizar algunas operaciones para escenarios concretos.

En este material discutiremos las **colecciones no ordenadas** de _Python_, al igual que sus operaciones y reglas  de escritura.


## **2. Diccionarios**
---

Los colecciones que se han visto hasta ahora (cadenas, listas y tuplas) usan enteros para identificar a sus elementos en forma de **índices**. En estas colecciones los elementos están ubicados en una **posición determinada** y así se accede a sus valores.

Si intentamos usar cualquier otro tipo como índice se provocará un error.



In [None]:
lista = [0, 1, 2]

lista['0']          # Esta evaluación produciría un error.

Para identificar múltiples elementos a partir de otro tipo de valores tenemos que realizar un **mapa** que nos permita conectar un identificador a un valor concreto. En este sentido _Python_ dispone de los **diccionarios**, un tipo de colección especial que puede contener elementos representados a partir del mapeo de **claves** a los **valores** a los que se asocian, tal como en un diccionario como el de la lengua española asocia palabras (claves) a sus significados (valores).


</br>

<center>
<img src = "https://drive.google.com/uc?export=view&id=1vPdyu02zgzLdqFWdCc5Ki1JowrfHo6DK" width = "50%">  </img>
</center>

</br>



Para crear diccionarios en _Python_ usamos una sintaxis especial delimitada por **llaves curvadas** (**`{`** y **`}`**). Dentro de ellas, se expresan parejas, separadas por comas, de **clave y valor**, separadas por el símbolo de dos puntos **`:`** de la siguiente forma:


```python
# Se puede escribir en varias líneas hasta el separador } final.
{
  clave_1 : valor_1,
  clave_2 : valor_2,
  clave_3 : valor_3
}
```

Como ejemplo, crearemos un diccionario para traducir las palabras en inglés al español. Para este diccionario, las claves son cadenas (palabras en Inglés) y los valores también serán cadenas (palabreas en Español).


In [None]:
#@markdown * **Ejecute esta celda para instalar _Python Tutor_.**
!pip3 -q install tutormagic
%load_ext tutormagic

In [None]:
%%tutor -s -h 500

eng2sp = {
    'one': 'uno',
    'two': 'dos',
    'three': 'tres',
}

print(eng2sp)




Los pares **clave-valor** del diccionario están separados por comas (**`,`**) y cada par contiene una clave y un valor separados por dos puntos (**`:`**).



<center>
<img src = "https://drive.google.com/uc?export=view&id=1t2k-jJOpcpSv_dr7lxQP9LU7vdwcsQMo" width = "40%">  </img>
</center>

</br>


Podemos crear un diccionario vacío con un par de llaves curvadas vacías:

In [None]:
d = {}

d

Tanto este como el diccionario anterior tiene tipo **`dict`**, sin importar su contenido.

In [None]:
type(d)

Las claves del diccionario pueden ser de cualquier tipo de dato **inmutable**, que puede estar asociada a cualquier valor de _Python_ **mutable o inmutable**.


Es importante que las claves sean **inmutables** o de lo contrario se generará un error de tipo o **`TypeError`**. Esto se debe a que no se debería intentar identificar un valor con un dato que pueda cambiar más adelante, como una lista o un diccionario pues, entre otras cosas, las **claves de un diccionario son únicas**. De esta manera cuando se acceda a un valor se obtiene siempre el resultado esperado y no hay ambigüedades al realizar una consulta.


Si se identificara algún valor con un clave de valor mutable como una lista, al ser de contenido variable, no sería posible asegurar que dos objetos tienen contenido distinto si en algún punto del programa estos pueden ser modificados.

In [None]:
# Usar llaves mutables genera un error de tipo.
{
    [0, 1] : "0-1"
}

Los valores inmutables más comunes permitidos como llaves son los **números**, las **cadenas de texto** y las **tuplas** con contenido inmutable.

In [None]:
#@markdown * **Ejecute esta celda para instalar _Python Tutor_.**
!pip3 -q install tutormagic
%load_ext tutormagic

In [None]:
%%tutor -s -h 500
diccionario = {
    100: 'Número',
    'abc': 'Cadena',
    (100, 'abc'): 'Tupla'
}

print(diccionario)

Por otro lado, los **valores SÍ pueden ser mutables**. Podemos, por ejemplo, tener un diccionario con listas como valores.

In [None]:
#@markdown * **Ejecute esta celda para instalar _Python Tutor_.**
!pip3 -q install tutormagic
%load_ext tutormagic

In [None]:
%%tutor -s -h 500
diccionario = {
    'A': [0, 1],
    'B': [2, 5],
}

print(diccionario)

### **2.1. Operaciones en diccionarios**
---

Los diccionarios son objetos **mutables**, por lo que una vez tengamos un diccionario con valores podemos realizar distintas operaciones sobre este, que pueden o no modificar su contenido.
La más básica es la operación de **acceso** a los datos. Este se realiza con las llaves cuadradas **`[]`** como si se tratara de una lista, pero con la clave en el lugar donde se indicaría el índice.


In [None]:
inventario = {'manzanas': 430, 'bananos': 312, 'naranjas': 525, 'peras': 217}

inventario['manzanas']

Al igual que en las listas, podemos actualizar el valor almacenado en esa pareja con una asignación y usarlo como cualquier otra expresión:

In [None]:
# Cambiamos el valor asociado a las manzanas
inventario['manzanas'] = 500

inventario

In [None]:
# Accedemos a dos valores y los usamos como expresiones numéricas.
inventario['manzanas'] + inventario['peras']

La función de longitud **`len(colección)`** también funciona en los diccionarios. En este caso, retorna el número de pares clave-valor:

In [None]:
len(inventario)

> **¿Qué pasa si intentamos asignar un valor a una clave que no esté en el diccionario?**

A diferencia de las listas, no es necesario que exista una casilla antes de asignarle una cantidad. De hecho, esta es la forma de **añadir parejas nuevas** a nuestro diccionario.


Por ejemplo, si queremos añadir una fruta nueva, simplemente asignamos un valor a una clave nueva y _Python_ automáticamente aumenta el tamaño y asigna la nueva pareja clave-valor.




In [None]:
inventario['uvas'] = 1000

inventario

> **¿Qué pasa si intentamos acceder a una pareja con una clave que no esté en el diccionario?**

En este caso, la pareja no existe y por tanto no hay ningún válido que retornar. Cuando se intenta una evaluación como esta _Python_ genera un error de clave o **`KeyError`**:

In [None]:
# Intentamos acceder a un elemento que no existe en el diccionario.
inventario['curubas']

De igual manera, podemos utilizar el método **`get`** en el diccionario para obtener un valor. Este retorna **`None`** cuando la llave no existe en el diccionario en vez de generar un error.

In [None]:
curubas = inventario.get('curubas')

print(curubas)

Además de esto, podemos pasar un **valor por defecto** como argumento que será retornado cuando la llave no exista. Por ejemplo, para productos que no están en inventario podemos querer definir que el diccionario retorne una cantidad de $0$ unidades disponibles.

In [None]:
# ¿Cuántas curubas tenemos en el inventario?
inventario.get('curubas', 0)

In [None]:
# Sigue sin existir la pareja 'curuba': 0, es solo una utilidad para evitar errores.
inventario

> **¿Cómo podemos eliminar elementos de un diccionario?**

Para eliminar los elementos de un diccionario tenemos que realizarlo a través de su clave, usando el método **`pop`**, al igual que en las listas. Este retorna el **valor** eliminado.

In [None]:
bananos = inventario.pop('bananos')

In [None]:
bananos

Si lo volvemos a ejecutar producirá un error de clave no existente.

In [None]:
inventario.pop('bananos')

Nuevamente, podemos definir un **valor por defecto** a asignar a la variable en el caso que el elemento no se encuentre en el diccionario.

In [None]:
inventario.pop('bananos', 0)

En este caso se retorna $0$ cuando la clave indicada no se encuentra en el diccionario y no se modifica ninguno de sus elementos. De lo contrario, se retorna el valor que tiene asociado y se elimina del diccionario.

### **2.2. Iterar sobre diccionarios**
---
Al igual que en otras colecciones, podemos comprobar rápidamente si una llave está definida en el diccionario con el operador **`in`**, o usarlo para iterar sobre las claves del diccionario.


In [None]:
#@markdown * **Ejecute esta celda para instalar _Python Tutor_.**
!pip3 -q install tutormagic
%load_ext tutormagic

In [None]:
%%tutor -s -h 500
inventario = {'manzanas': 430, 'naranjas': 525, 'peras': 217}

# in para evaluar pertenencia.
print('manzanas' in inventario)

# in para iterar sobre un objeto.
for producto in inventario:
  print(f'clave:{producto}  valor:{inventario[producto]}')

> **¿Y si quisiéramos saber si un valor específico está asociado a alguna de las llaves o iterar sobre sus valores?**

El comportamiento por defecto cuando se utiliza al operador **`in`**, tanto para verificar la pertenencia como para iterar sobre la colección es usar las **claves** del diccionario.

Se puede considerar que las **claves** y los **valores** de un diccionario son colecciones distintas que están asociadas o conectadas en una misma estructura.

<center>
<img src = "https://drive.google.com/uc?export=view&id=1WoCVts4NULhW7jXKGGVwzpzd8YgrooGG" width = "50%">  </img>
</center>

</br>


_Python_ permite acceder a estas colecciones, y a la colección de parejas **clave-valor** en forma de tupla con los métodos **`keys()`** , **`values()`** y **`items()`**, respectivamente.






In [None]:
inventario = {'manzanas': 430, 'naranjas': 525, 'peras': 217}

In [None]:
inventario.keys()

In [None]:
inventario.items()

In [None]:
inventario.values()


Por ejemplo, podemos verificar si una clave está en el diccionario de forma explícita de la siguiente forma:


In [None]:
# Usando el comportamiento por defecto del operador in en diccionarios.
'curuba' in inventario

In [None]:
# Usando el método .keys()
'curuba' in inventario.keys()

Por otro lado, podríamos querer obtener la suma de cantidades de los artículos del inventario. Para esto podríamos iterar sobre sus valores con el método **`values`**.

In [None]:
#@markdown * **Ejecute esta celda para instalar _Python Tutor_.**
!pip3 -q install tutormagic
%load_ext tutormagic

In [None]:
%%tutor -s -h 500
inventario = {'manzanas': 430, 'bananos': 312, 'naranjas': 525, 'peras': 217}

sum = 0
# Iteramos sobre los valores usando el método ".values"
for cantidad in inventario.values():
  sum += cantidad

print(f"El inventario tiene un total de {sum} artículos")

Finalmente, podemos iterar sobre la pareja clave-valor con el método **`items()`**. En este caso aplica el concepto de **desempaquetado de tuplas** visto en el material anterior, pues las parejas clave-valor son retornadas por este método en forma de tuplas de la forma **`(clave, valor)`**.

In [None]:
#@markdown * **Ejecute esta celda para instalar _Python Tutor_.**
!pip3 -q install tutormagic
%load_ext tutormagic

In [None]:
%%tutor -s -h 500
inventario = {'manzanas': 430, 'bananos': 312, 'naranjas': 525, 'peras': 217}

for producto, cantidad in inventario.items():
  print(f"Total de existencias de {producto}: {cantidad}.")

## **3. Conjuntos (_sets_)**
---

La estructura de datos de los diccionarios nos permite definir un nuevo método de acceso a una colección de datos. En esta sección, discutiremos un tipo de colección especial en la que no es importante acceder a los elementos sino optimizar algunas operaciones como la pertenencia.

Por ejemplo, en un sistema de gestión de usuarios de una institución educativa se puede tener registro de los usuarios distinguiendo por su rol, con una colección para estudiantes, docentes y trabajadores. En este caso, al igual que antes, el orden no importa pues no representa nada para sus elementos. Sin embargo, una operación frecuente que se tiene es verificar si un nombre de usuario corresponde a alguno de estos roles.



En este escenario, solo nos interesa agregar elementos sin que se repitan y determinar si un valor pertenece o no a cada colección. Para sistemas grandes, es importante considerar el tiempo que toma cada tipo de operación. En una lista, para saber si un elemento existe o no, es necesario revisar valor a valor hasta dar con el que corresponde. Sin embargo, si este valor no está en la colección, se tiene que revisar **cada valor**. Además, tenemos que realizar un esfuerzo adicional al agregar elementos, pues tenemos que saber si ya está en la lista para decidir si se agrega o no.


Para casos como este, se recomienda utilizar un **conjunto**, una colección compuesta por elementos únicos (sin repetir), que no está ordenada ni indexada. Este concepto nace de las matemáticas (en particular, de la rama de la [**teoría de conjuntos**](https://es.wikipedia.org/wiki/Teoría_de_conjuntos)) y es el caso más general de colección cuando el orden no es un factor relevante.


</br>
<center>
<img src = "https://drive.google.com/uc?export=view&id=1BevkFM2T7Fp4iv-vP4xmjEpcjwXAfaUO" width = "50%">  </img>
</center>

</br>

En este sentido, se podría decir que las **claves** de un diccionario son un un conjunto de valores, pues no importa el orden de los elementos y sus valores no se pueden repetir.

En _Python_, al igual que los diccionarios y gracias a su estrecha relación, los conjuntos están escritos con llaves curvadas (**`{`** y **`}`**) de la siguiente forma:

```python
# Conjunto de 3 elementos distintos.
{elemento1, elemento2, elemento3}
```


Note que sus reglas de escritura son también similares a las de las listas, pues cada uno de sus elementos es una expresión normal, y se diferencia de la definición de diccionarios por la ausencia de separadores de clave-valor con el símbolo de dos puntos (**`:`**).


Veamos un ejemplo:



In [None]:
#@markdown * **Ejecute esta celda para instalar _Python Tutor_.**
!pip3 -q install tutormagic
%load_ext tutormagic

In [None]:
%%tutor -s -h 300

# Definición de un conjunto a partir de valores iniciales.
conjunto = {"A", "B", "B", "A", "C", "A"}

print(conjunto)

Note que aunque en la definición hay valores repetidos, estos solo son considerados una vez en la colección y son impresos en un orden arbitrario. Este objeto tiene tipo **`set`**, sin importar su contenido.

In [None]:
conjunto = {"A", "B", "B", "A", "C", "A"}

type(conjunto)

Además, podemos usar la función de longitud **`len(conjunto)`** para conocer la cantidad de elementos únicos que tiene el conjunto.

In [None]:
len(conjunto)

> **¿Cómo creamos un conjunto vacío?**

Al compartir separador con los diccionarios, si se escribe una expresión con llaves curvadas sin contenido dentro se generará un **diccionario vacío**. Para crear un conjunto sin elementos, se tiene que usar el constructor **`set(iterable)`** sin argumentos.

In [None]:
# Diccionario vacío. NO es un conjunto vacío.
d = {}

type(d)

In [None]:
# Conjunto vacío con set().
s = set()

type(s)

Al igual que con las llaves del diccionario, un conjunto solo puede contener **valores inmutables**. De esta manera se puede garantizar que el elemento almacenado es único y que su valor no va a cambiar en el resto de la ejecución.


Por esta razón, no podemos usar **listas**, **diccionarios** ni otros **conjuntos** como elementos de un conjunto.

In [None]:
# No se pueden usar conjuntos, listas o diccionarios como elementos de un conjunto.
{{1, 2}, [3, 4], {5 : 6}}

In [None]:
# Conjunto de datos inmutables.
{100, '100', (20, '20', (30, '30'))}

El error retornado es un error de tipo con el siguiente texto. **`TypeError: unhashable type: 'set'`**, que puede traducirse al español como "El tipo de dato 'set' no es _hashable_". La palabra _hashable_ se refiere a la operación de [**hashing**](https://es.wikipedia.org/wiki/Función_hash), un tipo de función que transforma un valor de un tipo determinado en un **valor único**, como un valor numérico, que es usado en los diccionarios y conjuntos de _Python_ para identificar y distinguir los valores de manera rápida. Para distinguir entre los valores tenemos que considerar todo su contenido, por lo que para valores mutables que tienen contenido en cambio constante la función de _hash_ generaría valores distintos en distintos puntos de la ejecución, lo que dificulta esta tarea de identificación.


Con la función **`hash(objeto)`** podemos ver algunos ejemplos de los valores generados por _Python_ en esta operación. Tenga en cuenta que esta función no es muy útil para propósitos generales, pero permite ilustrar por qué solo se permiten algunos tipos como claves de diccionarios o elementos de conjuntos en _Python_.

In [None]:
# Hash de un número entero.
hash(1050)

In [None]:
# Hash de un número flotante.
hash(123.5)

In [None]:
# Hash de una cadena de texto.
hash('Python')

In [None]:
# Hash de una tupla.
hash(('a', 50))

### **3.1. Operaciones en conjuntos**
---

Siguiendo con la definición de un conjunto, solo se pueden realizar ciertas operaciones fundamentales en este tipo de estructuras. Como no existe el orden ni un valor asociado al que queramos acceder, solo podemos determinar si un valor se encuentra o no en el conjunto.


Esto es posible con el operador **`in`**, tal como se haría en listas, pero con una diferencia notable de velocidad mientras mayor sea el tamaño de la colección. Veamos un ejemplo con una lista y un conjunto con $1000000$ elementos.










In [None]:
# Lista con 1000000 cadenas únicas.
lista = [ f'{a:6} unidades' for a in range(1000000)]

len(lista)

In [None]:
# Lista con 1000000 cadenas únicas.
conjunto = set(lista)

len(conjunto)

Para ver la diferencia en el tiempo de la consulta podemos utilizar el comando de celda **`%%timeit`**. Este es un comando especial disponible en los _Jupyter Notebooks_ que nos permite conocer el tiempo que se toma en ejecutar una celda de código.

In [None]:
%%timeit
'999999 unidades' in lista

La operación anterior toma cerca de $20$ milisegundos (puede variar con relación a la máquina usada).  Estos son aproximadamente $0.020$ segundos por ejecución.

In [None]:
%%timeit
'999999 unidades' in conjunto

Si se utiliza un conjunto, la operación toma cerca de $65$ **nanosegundos**. Estos son aproximadamente $0.000000065$ segundos, casi un millón de veces menos que al realizarlo en una lista. Además, la operación es optimizada por _Python_ cuando se realiza múltiples veces.


> **Nota:** estos resultados fueron obtenidos en un entorno de ejecución de _Google Colaboratory_. Lo invitamos a que realice las mismas pruebas y determine la diferencia con su propio entorno y evidencie la mejora.


Esta diferencia es mayor cuando el tamaño de la colección es grande, y cuando se realizan muchas operaciones de este tipo. Si una tarea no tiene este tipo de condiciones, se puede utilizar una lista sin un impacto mayor en el rendimiento.

In [None]:
%%timeit
# Para problemas con menos datos y menos operaciones no existe tanta diferencia.
'a' in ['a', 'b', 'c']

In [None]:
%%timeit
# El uso de conjuntos no aporta tanta mejora en ciertos problemas.
'a' in {'a', 'b', 'c'}

También podemos evaluar si un elemento **NO** pertenece a un conjunto añadiendo el operador **`not`** antes del operador **`in`**. Veamos un ejemplo:

In [None]:
'Python' not in conjunto

> **¿Y cómo podemos cambiar el contenido del conjunto?**

Para añadir nuevos elementos a un conjunto podemos utilizar la función **`add(elemento)`**, que recibe un valor inmutable y lo agrega al conjunto.

In [None]:
# Creamos un conjunto vacío y le añadimos elementos.
paises = set()

paises.add('Colombia')
paises.add('Brasil')
paises.add('Venezuela')
paises.add('Perú')

paises

Si intentamos añadir algún valor que ya esté en el conjunto, la operación termina sin retornar ningún error ni modificar el conjunto.

In [None]:
# Añadimos un elemento.
paises.add('Argentina')

paises

In [None]:
# Intentamos añadir un elemento repetido.
paises.add('Colombia')

paises

Por su parte, si queremos eliminar elementos del conjunto podemos usar la función **`remove(elemento)`** o la función **`discard(elemento)`**. La diferencia es que **`remove`** genera un error si el elemento no existe, mientras que **`discard`** solo lo elimina si está presente y no hace nada en caso contrario.

In [None]:
paises.remove('Brasil')

paises

In [None]:
# El método 'remove' genera un error si el elemento no pertenece al conjunto.
paises.remove('Brasil')

In [None]:
paises.discard('Venezuela')

paises

In [None]:
# El método 'discard' no genera error si el elemento no pertenece.
paises.discard('Venezuela')

paises

Por otro lado, podemos eliminar un elemento arbitrario con el método **`pop`**. El elemento retornado depende de la implementación de _hash_ y **no es aleatorio**, simplemente es cualquiera de los elementos ubicado convenientemente para eliminarse.

In [None]:
eliminado = paises.pop()

eliminado

Podemos vaciar el conjunto con el método **`clear`**, al igual que en diccionarios y listas.

In [None]:
# Vaciamos el conjunto.
paises.clear()

Tenga en cuenta que si se ejecuta la función **`pop`** en un conjunto vacío se producirá un error, pues no se tiene nada que retornar.

In [None]:
# Si el conjunto no tiene elementos, se producirá un error.
paises.pop()

### **3.2. Operadores de conjuntos**
---
Los conjuntos de _Python_ son una representación computacional de un objeto matemático muy importante, del cual se desprenden múltiples propiedades y operaciones permitidas, estudiadas en el rama del **álgebra de conjuntos**.


En _Python_, podemos apoyarnos en el uso de múltiples operadores básicos que permiten ejecutar algunas de estas operaciones. En esta sección no se pretende profundizar en el transfondo matemático de dichas operaciones, sino realizar una descripción general y presentar de manera práctica su utilidad.






#### **3.2.1. Operaciones relacionales**
---

En primer lugar vamos a considerar el uso de los **operadores relacionales básicos** utilizados previamente en objetos numéricos y de texto. En el caso de los conjuntos, estos permiten determinar la **inclusión** de un conjunto dentro de otro.


En _Python_ se pueden usar los operadores relacionales para evaluar la relación de inclusión de dos conjuntos. Por ejemplo, para determinar si dos conjuntos son iguales (es decir, que tienen los mismos elementos), podemos usar el operador de igualdad **`==`**.


<center>
<img src = "https://drive.google.com/uc?export=view&id=1649gw5ZolXzXTOM0J1R5Zw0t26b0uGQ7" width = "50%">  </img>
</center>

</br>



In [None]:
# Los conjuntos tienen los mismos elementos.
{1, 2, 2, 1} == {2, 1}

De igual manera, el operador de desigualdad **`!=`** permite evaluar cuando por lo menos uno de los elementos no está en ambos conjuntos.

<center>
<img src = "https://drive.google.com/uc?export=view&id=1k3Tb-S9o2YxpzJ-RugFTOOGLm4XPwO6j" width = "50%">  </img>
</center>

</br>


In [None]:
# Los conjuntos son distintos.
{1, 2, 2, 1} != {2, 1, 3}

Ahora considere el conjunto de paises de américa latina. Este está **incluido** en el conjunto de países del mundo, pero no al contrario.

* Todos los países de américa latina son también paises del mundo.
* No todos los países del mundo son también países de américa latina. Por ejemplo, Alemania o Japón son países del mundo pero no son países de américa latina.

</br>
<center>
<img src = "https://drive.google.com/uc?export=view&id=1VHHcOLIiSfzW2ivkQON73mmSvkgEhX09" width = "50%">  </img>
</center>

</br>


Esta es la relación de inclusión entre conjuntos. Se puede decir que el conjunto $A$ (países de américa latina) es un **subconjunto** de $B$ (países del mundo). Y a su vez, se suele decir que $B$ es un **superconjunto** de $A$.
Un conjunto es subconjunto del otro si este último tiene todos sus elementos.

</br>
<center>
<img src = "https://drive.google.com/uc?export=view&id=1Oryc3io92UeSbog1FtSishl1elrZH2Vj" width = "80%">  </img>
</center>

</br>


> **Nota:** un conjunto es tanto **subconjunto** como **superconjunto** de sí mismo, debido a que la condición de contención de todos los elementos se cumple en ambos casos.





Para saber si un conjunto **`a`** es **subconjunto** de un conjunto **`b`** tenemos el operador **`<=`**, que determina si el primer conjunto es subconjunto del segundo.

In [None]:
a = {0, 1, 2}
b = {0, 1, 2, 3}

a <= b    # ¿a es subconjunto de b?

De manera contraria, si queremos saber si **`a`** es **superconjunto** de **`b`** podemos utilizar el operador **`>=`**:

In [None]:
a = {0, 1, 2}
b = {0, 1, 2, 3}

a >= b   # ¿a es superconjunto de b?

Dado que un conjunto es al mismo tiempo **subconjunto y superconjunto de sí mismo**, está expresión también es verdadera cuando los valores son iguales.

</br>
<center>
<img src = "https://drive.google.com/uc?export=view&id=1ApmIVsRhhyAiV-Iq1mF_vNXwd4E1pogc" width = "60%">  </img>
</center>

</br>


In [None]:
a = {0, 1, 2}
b = {2, 0, 1}

print(a == b)    # Los conjuntos tienen los mismos elementos.
print(a <= b)    # B tiene todos los elementos de A.
print(a >= b)    # A tiene todos los elementos de B.

Si queremos excluir en nuestra comparacion el caso en que los conjuntos iguales estaremos verificando si uno de los conjuntos es  **subconjunto o superconjunto propio** del otro.


</br>
<center>
<img src = "https://drive.google.com/uc?export=view&id=1e1Esr5gN-L2Qf3K1-8BM58WAbVL3aJMb" width = "70%">  </img>
</center>

</br>


Para realizar estas evaluaciones, utilizamos los operadores **`<`** en el caso de los subconjuntos y **`>`** en el caso de los superconjuntos.

In [None]:
a = {10, 20}
b = {10, 20, 30}


print(a < b)   # ¿a es subconjunto propio de b?
print(a > b)   # ¿a es superconjunto propio de b?

In [None]:
# Ya no se consideran los casos en que ambos conjuntos son iguales.
print(a <= a)   # Un conjunto es subconjunto y superconjunto de sí mismo.
print(a < a)    # Un conjunto NO es subconjunto ni superconjunto propio de sí mismo.

Para finalizar, presentamos una tabla de resumen del uso de los $6$ operadores relacionales para la evaluación de la relación de inclusión entre conjuntos, con su descripción, operador en el lenguaje _Python_ y si le interesa indagar más en la teoría de conjuntos, su equivalente en notación matemática.

</br>

| **Símbolos del operador** | **Operación representada** | **Escritura** | **Notación** | **Descripción** |
| --- | --- | --- | --- | --- |
| **`in`** | $x$ pertenece al conjunto $B$ | **`x in B`** | $x \in B$ | $x$ es un elemento de $A$.|
| **`not in`** | $x$ no pertenece al conjunto $B$ | **`x not in B`** | $x \notin B$ | $x$ no es un elemento de $A$.|
| **`==`** | $A$ es igual que $B$ | **`A == B`** | $A = B$ | $A$ y $B$ tienen exactamente los mismos elementos.|
| **`!=`** | $A$ no es igual que $B$ | **`A != B`** | $A \ne B$ | Por lo menos un elemento de $A$ o de $B$ no está en el otro. |
| **`>=`**  | $A$ es un superconjunto de $B$   | **`A >= B`** | $A \supseteq B$ | Todos los elementos de $B$ están también en $A$. |
| **`<=`**  | $A$ es un subconjunto de $B$ | **`A <= B`** | $A \subseteq B$ | Todos los elementos de $A$ están también en $B$.|
| **`>`**  | $A$ es un superconjunto propio de $B$ | **`A > B`** |$A \supset B$ | Los conjuntos son distintos y todos los elementos de $B$ están también en $A$. |
| **`<`**  | $A$ es un subconjunto propio de $B$ | **`A < B`** | $A \subset B$ | Los conjuntos son distintos y todos los elementos de $A$ están también en $B$. |

#### **3.2.2. Álgebra de conjuntos**
---

Además de los operadores utilizados para la comparación, existen otras operaciones que consisten en la creación de nuevos conjuntos. Estas operaciones corresponden a las operaciones del **álgebra de conjuntos**, que proviene de las matemáticas.

Por ejemplo, imagine un sistema de gestión de usuarios de una institución educativa, en la que se tiene un conjunto de nombres de usuario para estudiantes y un conjunto para trabajadores. Dado que la institución permite a los estudiantes trabajar mientras continuan con sus estudios.

Para representar este escenario, podemos usar un [**diagrama de Venn**](https://es.wikipedia.org/wiki/Diagrama_de_Venn), un tipo de figura en la que representamos a los conjuntos con círculos y solapar los elementos que están ubicados en ambos conjuntos.


<center>
<img src = "https://drive.google.com/uc?export=view&id=1abvaweWP2AmMkUz8ZsA6goGdj2lfCbiY" width = "60%">  </img>
</center>

</br>

En el álgebra de conjuntos se consideran operaciones para generar conjuntos con los elementos ubicados en áreas específicas de este diagrama.


Primero, considere que se quiere realizar un reporte de **todos** los usuarios, tanto estudiantes como trabajadores, sin repetir un reporte. En este caso, queremos generar el conjunto de la **unión** de dos conjuntos (escrita en matemáticas como $A \cup B$), representado en el diagrama por el área sombreada:


<center>
<img src = "https://drive.google.com/uc?export=view&id=13HQVDpqX3OY0gWDpUXCqNO6sA9KZzlNz" width = "40%">  </img>
</center>

</br>


Para obtener la **unión** de dos conjuntos en _Python_, podemos utilizar el operador **`|`**. Veamos un ejemplo:





In [None]:
#@markdown * **Ejecute esta celda para instalar _Python Tutor_.**
!pip3 -q install tutormagic
%load_ext tutormagic

In [None]:
%%tutor -s -h 300
estudiantes = {'Andrea', 'Beto', 'Carlos', 'Daniela', 'Elena'}

trabajadores = {'Andrea', 'Elena', 'Ignacio', 'Olga', 'Uriel'}

union = estudiantes | trabajadores

print(union)

En algún punto, se decide realizar un proceso especial para los estudiantes que han estado vinculados también como trabajadores, es decir, los usuarios que están en ambos conjuntos. Esta operación corresponde a generar el conjunto de **intersección** de dos conjuntos (escrita en matemáticas como $A \cap B$), representado en el diagrama por el área sombreada:

<center>
<img src = "https://drive.google.com/uc?export=view&id=1uvQf0lGr91GsKeu2pQ20qKnYsEamJ11_" width = "40%">  </img>
</center>

</br>

Para obtener la **intersección** de dos conjuntos en _Python_ podemos utilizar el operador **`&`**. Veamos un ejemplo:

In [None]:
#@markdown * **Ejecute esta celda para instalar _Python Tutor_.**
!pip3 -q install tutormagic
%load_ext tutormagic

In [None]:
%%tutor -s -h 300
estudiantes = {'Andrea', 'Beto', 'Carlos', 'Daniela', 'Elena'}

trabajadores = {'Andrea', 'Elena', 'Ignacio', 'Olga', 'Uriel'}

interseccion = estudiantes & trabajadores

print(interseccion)

La institución decide ofrecer convocatorias para los estudiantes que no estén ya vinculados como trabajadores, es decir, los que están en el conjunto de estudiantes pero no en el de trabajadores. Esta operación corresponde a generar el conjunto de **diferencia** entre dos conjuntos (escrita en matemáticas como $A - B$), representa en el diagrama por el área sombreada.


<center>
<img src = "https://drive.google.com/uc?export=view&id=1r-Q8IF6Zbsqw3_8LdoIpSblQH-cjARnd" width = "40%">  </img>
</center>

</br>

Para obtener la **diferencia** de dos conjuntos en _Python_ podemos utilizar el operador **`-`**. Veamos un ejemplo:

In [None]:
#@markdown * **Ejecute esta celda para instalar _Python Tutor_.**
!pip3 -q install tutormagic
%load_ext tutormagic

In [None]:
%%tutor -s -h 300
estudiantes = {'Andrea', 'Beto', 'Carlos', 'Daniela', 'Elena'}

trabajadores = {'Andrea', 'Elena', 'Ignacio', 'Olga', 'Uriel'}

diferencia = estudiantes - trabajadores

print(diferencia)

Finalmente, se requería enviar un correo con instrucciones para un trámite específico que solo era válido para aquellos usuarios que solo tenían un rol, es decir, que no estaban al tiempo en ambos conjuntos. Esta operación corresponde a generar el conjunto de **diferencia simétrica** entre dos conjuntos (escrita en matemáticas como $A \bigtriangleup B$), representada en el diagrama por el área sombreada.


<center>
<img src = "https://drive.google.com/uc?export=view&id=1fKqSk5MIZPrlHgWoJw6rnM3VA9dF-lPG" width = "40%">  </img>
</center>

</br>

Para obtener la **diferencia simétrica** de dos conjuntos en _Python_ podemos utilizar el operador **`^`**. Veamos un ejemplo:


In [None]:
#@markdown * **Ejecute esta celda para instalar _Python Tutor_.**
!pip3 -q install tutormagic
%load_ext tutormagic

In [None]:
%%tutor -s -h 300
estudiantes = {'Andrea', 'Beto', 'Carlos', 'Daniela', 'Elena'}

trabajadores = {'Andrea', 'Elena', 'Ignacio', 'Olga', 'Uriel'}

diferencia_sim = estudiantes ^ trabajadores

print(diferencia_sim)

En la siguiente tabla disponemos de los $4$ operadores de álgebra de conjuntos descritos en esta sección, con sus operadores, descripción y equivalente en notación matemática.

</br>

| **Símbolos del operador** | **Operación representada** | **Escritura** | **Notación** | **Descripción** |
| --- | --- | --- | --- | --- |
| **`&`** | Intersección de $A$ y $B$ | **`A & B`** | $A \cap B$ | Conjunto de elementos que pertenecen a $A$ y también pertenecen a $B$. |
| **`\|`** | Unión de $A$ y $B$| **`A \| B`** | $A \cup B$ | Conjunto de elementos que pertenecen a $A$ o pertenecen a $B$. |
| **`-`**  | Diferencia de $A$ y $B$   | **`A - B`** | $A - B$ | Conjunto de elementos que pertenecen a $A$ pero no pertenecen a $B$. |
| **`^`**  | Diferencia simétrica de $A$ y $B$ | **`A ^ B`** | $A \bigtriangleup B$ | Conjunto de elementos que pertenecen a $A$ o pertenecen a $B$ pero no a los dos.|
</br>

Podemos expandir nuevamente la tabla de precedencia de operadores. Estos operadores comparten su posición en la tabla con sus equivalente en símbolos para otros tipos de datos.

| Operador | Asociatividad | Descripción |
| --- | --- | --- |
| **`(expresión)`** |  Izquierda a derecha | Expresión en paréntesis. |
|  __`**`__  | Derecha a izquierda | Exponenciación. |
| **`-x`**, **`+x`** | Izquierda a derecha | Positivo y negativo. |
| **`*`**, **`/`**, **`%`** , **`//`**|Izquierda a derecha |  Multiplicación, división, módulo y división piso. |
| **`+`**, **`-`**| **Izquierda a derecha** | **Adición, substracción y diferencia de conjuntos.** |
| **`==`**, **`!=`**, **`>`**,**`<`**, **`>=`**, **`<=`**| **Izquierda a derecha** | **Operadores relacionales y de inclusión de conjuntos.** |
| **`&`** |  **Izquierda a derecha** | **Unión de conjuntos** |
| **`^`** |  **Izquierda a derecha** | **Unión de conjuntos** |
| **`\|`** |  **Izquierda a derecha**| **Unión de conjuntos**. |
| **`not`** |  Izquierda a derecha | Negación lógica. |
| **`and`** |  Izquierda a derecha | Disyunción lógica. |
| **`or`** |  Izquierda a derecha | Conjunción lógica. |
| **`=`**| Derecha a izquierda | Asignación. |

</br>




## **4. Comprensión de conjuntos y diccionarios (Opcional)**
---

Al igual que en las listas, _Python_ permite la definición de expresiones que retornan diccionarios o conjuntos a partir de la iteración de objetos y evaluación de condiciones. Recuerde que estas listas por comprensión están compuestas por:

* Una **expresión** en la que se define la operación que se realiza sobre cada valor.
* Una **iteración** en la que se define de dónde provienen los valores
* Una **condición** en la que se define los requisitos lógicos necesarios para incluir un valor en la colección creada.









In [None]:
# Lista con:
  # Expresión: valor ** 2
  # Iteración: for valor in range(20)
  # Condición: if valor < 5
[valor ** 2 for valor in range(20) if valor < 5]


En esta sección veremos los detalles que se deben considerar a la hora de crear otros tipos de colecciones por comprensión.

### **4.1. Comprensión de diccionarios**
---
_Python_ permite crear diccionarios complejos en una sola expresión con la sintaxis de **diccionarios por comprensión**. Estos se escriben de la siguiente manera:

```python
{ clave: valor for valor in iterable if condición }
```

Note que lo único que cambia con respecto a las listas por comprensión es el uso del separador asociado a los diccionarios de llaves curvadas (**`{}`**) y el uso del símbolo de dos puntos (**`:`**) en la expresión para diferenciar la clave del valor.

Veamos un ejemplo, en el que asociamos una cadena con la cantidad de caracteres que tiene:

In [None]:
#@markdown * **Ejecute esta celda para instalar _Python Tutor_.**
!pip3 -q install tutormagic
%load_ext tutormagic

In [None]:
%%tutor -s -h 500
cadenas = ['Listas', 'Tuplas', 'Diccionarios', 'Cadenas', 'Números']

# Usando un ciclo for normal.
diccionario = {}
for cadena in cadenas:
  if 'e' not in cadena:
    diccionario[cadena] = len(cadena)

# Usando comprensión de diccionarios.
diccionario2 = {cadena: len(cadena) for cadena in cadenas if 'e' not in cadena}

De igual manera, podemos escribir iteraciones consecutivas para definir **ciclos anidados**. Esto es clave en el uso de diccionarios, pues comunmente una de las iteraciones corresponde a los valores usados como la clave y otro a los valores usados como su valor asociado.

In [None]:
#@markdown * **Ejecute esta celda para instalar _Python Tutor_.**
!pip3 -q install tutormagic
%load_ext tutormagic

In [None]:
%%tutor -s -h 500
claves =  ['A', 'B', 'C']
valores = ['a', 'b', 'c']

# Usando un ciclo for normal.
diccionario = {}
for clave in claves:
  for valor in valores:
    if clave.lower() != valor:
      diccionario[clave] = valor

# Usando comprensión de diccionarios.
diccionario2 = {clave: valor for clave in claves for valor in valores if clave.lower() != valor}

Como puede notar en el ejemplo anterior, a diferencia de las listas por comprensión, si en alguno de los ciclos se repite alguna clave, el último valor encontrado reemplaza a cualquier valor asociado previamente a su clave.

Tenga esto en mente al definir diccionarios con este tipo de expresión.

### **4.2. Conjuntos por comprensión**
---
_Python_ permite la creación de conjuntos a partir de expresiones, iteradores y condiciones con la sintaxis de **comprensión de conjuntos**. Esta es casi idéntica a la comprensión de listas, pero con el uso del separador de llaves curvadas (**`{`** y **`}`**).

```python
{ expresión for elemento in iterador if condición }
```

Este tipo de expresión se distingue de los diccionarios por comprensión por la ausencia del separador de dos puntos (**`:`**) en sus expresiones.

Veamos un ejemplo:

In [None]:
{x for x in range(10) if x < 5}

Este tipo de expresión es recomendada cuando queremos obtener valores únicos de una colección distinta. Por ejemplo, podemos tomar una cadena, y generar un conjunto de los caracteres sin repetición en minúsculas de la misma.

In [None]:
# Conjunto para obtener los caracteres usados en una cadena.
cadena = 'Introducción a la programación con Python'

{ x.lower() for x in cadena if x.isalpha() }

In [None]:
#@markdown * **Ejecute esta celda para instalar _Python Tutor_.**
!pip3 -q install tutormagic
%load_ext tutormagic

In [None]:
%%tutor -s -h 500
# Creación de conjuntos con ciclos, condiciones y operaciones 'add'.
conjunto = set()

for x in range(1, 30, 3):
  if x % 4 == 0:
    conjunto.add( x + x / 2 )
print(conjunto)

# Creación de conjuntos por comprensión.
conjunto_comp = { x + x / 2 for x in range(1, 30, 3) if x % 4 == 0 }

print(conjunto_comp)

Esta sintaxis nos permite generar conjuntos a partir de la operación entre conjuntos creados por comprensión. Veamos un ejemplo, en el que se realiza la diferencia de dos conjuntos numéricos.

In [None]:
#@markdown * **Ejecute esta celda para instalar _Python Tutor_.**
!pip3 -q install tutormagic
%load_ext tutormagic

In [None]:
%%tutor -s -h 500
# Múltiplos de 2.
mult2 = { x for x in range(0, 50, 2)}

# Múltiplos de 4.
mult4 = { x for x in range(0, 50, 4)}

# Múltiplos de 2 que no son múltiplos de 4.
mult2no4 = mult2 - mult4
mult2no4

## **Referencias**
---
Este material fue tomado y adaptado del libro _How to Think Like a Computer Scientist: Learning with Python 3_, capítulo 11, 20 (versión en inglés) y  10 (versión en español).

 > _Copyright (C) Brad Miller, David Ranum, Jeffrey Elkner, Peter Wentworth, Allen B. Downey, Chris
Meyers, and Dario Mitchell. Permission is granted to copy, distribute
and/or modify this document under the terms of the GNU Free Documentation
License, Version 1.3 or any later version published by the Free Software
Foundation; with Invariant Sections being Forward, Prefaces, and
Contributor List, no Front-Cover Texts, and no Back-Cover Texts. A copy of
the license is included in the section entitled “GNU Free Documentation
License”_

*   [P. Wentworth, J. Elkner, A.B. Downey, C. Meyers - How to Think Like a Computer
Scientist: Learning with Python 3
Documentation (3rd Edition)](http://www.ict.ru.ac.za/Resources/cspw/thinkcspy3/thinkcspy3.pdf)
*   [How to Think Like a Computer Scientist: Interactive Edition](http://interactivepython.org/courselib/static/thinkcspy/index.html)
*   [Aprenda a Pensar Como un Programador
con Python
 (español)](https://argentinaenpython.com/quiero-aprender-python/aprenda-a-pensar-como-un-programador-con-python.pdf)


## **Recursos adicionales**
---

En esta sección encontrará material adicional para reforzar los temas y conceptos discutidos:

* [*Python* 3: documentación oficial.](https://docs.python.org/3/)
* [_Python_ - Tutorial de _Python_ (Español)](https://docs.python.org/es/3.7/tutorial/)


## **Créditos**
---

* **Profesores:**
  * [Felipe Restrepo Calle, PhD](https://dis.unal.edu.co/~ferestrepoca/)
  * [Fabio Augusto González, PhD](https://dis.unal.edu.co/~fgonza/)
  * [Jorge Eliecer Camargo, PhD](https://dis.unal.edu.co/~jecamargom/)
* **Asistentes docentes:**
  - Alberto Nicolai Romero Martínez
  - Edder Hernández Forero

**Universidad Nacional de Colombia** - *Facultad de Ingeniería*