# Sets
**Autores**: Rogelio Mazaeda, Félix Miguel Trespaderne.   

## Contenidos
[Introducción](#Introducción)<br>
[Sets](#Sets)<br>
[Modificando dinámicamente los sets_](#Modificando_sets)<br>
[El _set_ como colección _iterable_](#Iterando_sets)<br>
[Métodos de la clase _set_ y funciones útiles](#Funciones_metodos_sets)<br>
[Operaciones matemáticas de conjuntos con _sets_](#Operaciones_sets)<br>
[Ejemplo con comentario sobre eficiencia de _Sets_](#Ejemplos_sets)<br>

***
<a id='Introducción'></a>

## Introducción.

El formalismo de la teoría de conjuntos es muy utilizado en matemáticas. Todos hemos estado expuestos, en nuestra educación previa a muchos de sus conceptos básicos. 

Evitando ser excesivamente formales, un **conjunto** en matemáticas, permite referirnos como un todo a una multitud de elementos diversos.

Un **conjunto** puede estar vacío. Puede estar compuesto a su vez por otros conjuntos y sobre ellos se pueden plantear una serie de operaciones como la **unión**, la **intersección**, la **diferencia** entre otras.

La colección **Set** de Python trata de implementar algunos de los conceptos de su referente matemático, como veremos en las secciones posteriores.

***
<a id='Sets'></a>

## Sets

Los **Sets** de Python son colecciones que tiene las siguientes características:

- La colección es **mutable** pero los elementos que contenidos tiene que ser **inmutables**.
- Los elementos no pueden aparecer repetidos.
- Es **iterable** y **no secuencial**

Se pueden crear **Sets** especificando los elmentos que lo conforman con la sintaxis:

```python
{elem1, elem2, elem3, ...}
```
Donde se utilizan el signo de las llaves ```{}``` al igual que en la definición de **diccionarios**, aunque debe observar que los elementos se describen de forma diferente.

In [5]:
digitos = {'1', '2', '3', '4', '5', '6', '7', '8', '9'}

Otra forma de crear **Sets** es utilizando la función ```set``` a la que se le pasa como argumento algún otro _iterable_.

Ejemplo:
```python
lista_num = [1, 2, 3, 4, 3]
set_num = set(lista_num)
set_letras = set("Las letras de esta cadena formaran el set pero sin repeticiones")
```

In [10]:
lista_num = [1, 2, 3, 4, 3]
set_num = set(lista_num)
set_letras = set("Las letras de esta cadena formaran el set pero sin repeticiones")

print(set_num)
print(set_letras)

{1, 2, 3, 4}
{' ', 'L', 's', 'r', 'l', 'n', 'f', 'o', 'i', 'd', 'c', 't', 'm', 'p', 'a', 'e'}


Es importante entender que los elementos del **set** no pueden aparecer repetidos. Aunque tanto la lista como la cadena que sirve como fuente para crear el **set** tienen elementos repetidos, el **set** sólo almacena una instancia de cada elemento.

Observe además que la función ```print()``` está _sobrecargada_ para poder sacar por pantalla objetos de tipo **set**.

En la medida en que el **set** es una colección **mutable**, se tiene que tener en cuenta las implicaciones ya vistas en el caso de las **listas** y los **diccionarios** en lo relativo a la creación de *alias*, la *copia superficial*.

Esto es:

```python
a = {1,2,3,4}
b = a
```

En lo anterior, ```b``` es simplemente un alias de ```a```. Cualquier modificación de una variable o de la otra que ocurra después de la asignación, modifica el dato común que es accedido a través de cualquiera de ellas.

Si se quiere obtener otro **set** que inicialmente contenga los mismos elementos que otro, se utilizará el método ```.copy()``` del conjunto fuente, como se indica en el ejemplo. 

In [23]:
a = {1,2,3,4}
b = a.copy()
b.add(10)
print(a,b)

{1, 2, 3, 4} {1, 2, 3, 4, 10}


***
<a id='Modificando_sets'></a>

## Modificando _sets_ dinámicamente

Al ser una colección mutable, se pueden añadir y borrar elementos del **set**.

```python
s = set()
s.add(1)
s.add('cad')
```
En el fragmento de código se crea inicialmente un **set** vacío. Observe que no se puede utilizar ```s={}``` porque resultaría ambiguo al confundirse con la sentencia que crea **diccionario** vacío.
Posteriormente, se utiliza el método ```.add()``` para añadir un elemento entero y a continuación otro de tipo _string_. 


In [11]:
s = set()
s.add(1)
s.add('cad')
print(s)

{1, 'cad'}


Para borrar elementos de un **set** se tiene:

- Método ```.clear()``` borra todos los elementos.
- Método ```.discard(elem)``` borra elemento ```elem``` si existe. Si no existe, no ocurre nada.
- Método ```.remove(elem)``` elimina elemento ```elem``` si existe. Si no existe: se lanza excepción ```KeyError```.
- Método ```.pop()``` saca y devuelve elemento arbitrario. Si el **set** está vacío: lanza excepción ```KeyError```.

In [13]:
s = {1,2,3,4,5}

s.discard(9)
s.discard(4)
a = s.pop()

print('Elemento sacado con pop', a, 'set que queda', s)

Elemento sacado con pop 1 set que queda {2, 3, 5}


***
<a id='Iterando_sets'></a>

## El _set_ como colección _iterable_

El **set** es una colección iterable. De manera que se puede utilizar en aquellas construcciones que espera este tipo de elementos, como por ejemplo bucles **for**.

In [16]:
vocales = set('aeiou')
cons_preferidas = set('pm')

for consonante in cons_preferidas:
    for vocal in vocales:
        print(consonante + vocal)

pi
pe
pu
pa
po
mi
me
mu
ma
mo


***
<a id='Funciones_métodos_sets'></a>

## Métodos de la clase _set_ y funciones útiles

Existen funciones _built in_ de Python que están _sobrecargadas_ para trabajar con **set** de la misma forma que cualquier otro **iterable**. 

Por ejemplo:

- ```sum()```: Suma todos los elementos (en caso de que la suma este definida para esos elementos)
- ```len()```: Devuelve un entero con el número de elementos.
- ```min(),max()```: Devuelven el mínimo y el máximo respectivamente de los elementos en el **set**.
- ```sorted()```: Devuelve una **lista** con los elementos del **set** ordenados.
- ```list(), tuple(), enumerate()```: Devuelve una **lista**, una **tupla** o un **enumerado** respectivamente con los datos del **set** que se le pasa como parámetro.



In [20]:
s = set(range(6))
print(list(enumerate(s)))

[(0, 0), (1, 1), (2, 2), (3, 3), (4, 4), (5, 5)]


***
<a id='operaciones_set'></a>

## Operaciones matemáticas de conjuntos con _sets_

La característica distintiva y la utilidad mayor de los _sets_ se obtiene precisamente de su capacidad para representar el comportamiento del los **conjuntos matemáticos**.

Las operaciones más importantes en este sentido son:

- Determinación de si un **elemento** o, en general, un **sub_conjunto** pertenecen o no al **Set**
- Obtención del **Set** que resulta de la **unión** de dos sets.
- Obtención del **Set** que es la **diferencia** entre un set y otro.
- Obtención del **Set** que resulta de la **intersección** de dos sets.

En lo que sigue, vemos en detalle cada una de estas operaciones.

### Pertenencia de un elemento o sub-conjunto a otro

Las operaciones de está sub-sección dan como resultado un valor lógico. Para el caso de la pertenencia o no de un elemento a un conjunto, se tendría que el resultado sería ```True``` si:

$$
\begin{align}
\\a \in A & & \text{(a es un elemento de A)} & & \text{Python:      a in A}\\
\\b \in A & & \text{(b no es un elemento de A)} & & \text{Python:      b not in A}\\
\end{align}
$$

Por su parte, para determinar si un conjunto es un sub-conjunto de otro.

$$
\begin{align}
\\B \subseteq A & & \text{(B es sub_conjunto de A)} & & \text{En Python: B.issubset(A)}\\
\end{align}
$$

Por el contrario, la determinación de si A incluye a B, podría ser:

$$
\begin{align}
\\A \supseteq B & & \text{(A es un super_conjunto de B)} & & \text{En Python: A.issuperset(B)}\\
\end{align}
$$

Nótese que se puede utilizar el operador de pregunta por igualdad (```==```) para decidir si dos **Sets** tienen los mismos elementos (sin considerar el orden, por supuesto).

Dos conjuntos son **disjuntos** si no tiene elementos en común, esto es si su intersección es el conjunto vacío. En Python el método ```.isdisjoint()``` devuelve un valor lógico indicando el grado de "verdad" de esa proposición.

In [4]:
a = {1, 2, 3}
b = {3, 2}
print(a.issubset(b))
print(a.issuperset(b))
print(b.isdisjoint(a))

False
True
False


### Unión, intersección y diferencia de conjuntos

![Sets.jpg](attachment:Sets.jpg)

Estas operaciones sobre conjuntos dan como resultado otro conjunto.

El conjunto **unión** contiene todos los elementos de sus conjuntos operandos:

$$
\begin{align}
\\C = A \cup B &  && \text{} & & \text{En Python: C = A.union(B)}\\
\end{align}
$$

El conjunto **intersección** contiene que pertenecen _simultáneamente_ a ambos conjuntos:

$$
\begin{align}
\\C = A \cap B &  && \text{} & & \text{En Python: C = A.intersection(B)}\\
\end{align}
$$

Tanto la unión como la intersección son operaciones simétricas. Ej: ```a.union(b) == b.union(a)```.
La diferencia, sin embargo, no es simétrica: el conjunto **diferencia** contiene todos los elementos del primer operando que no están en el segundo.


$$
\begin{align}
\\C = A - B &  && \text{} & & \text{En Python: C = A.difference(B)}\\
\end{align}
$$

Una operación relacionada con la anterior es la que actualiza los elementos de A, eliminado aquellos que están en B, es:

$$
\begin{align}
\\A = A - B & && \text{} & & \text{En Python: A.difference_update(B)}\\
\end{align}
$$


***
<a id='Ejemplos_set'></a>

## Ejemplo sencillo

Los **sets** de Python pueden ser muy útiles a la hora de ofrecer soluciones inesperadamente simples a problemas que de otra forma requerirían un mayor esfuerzo. Los **sets** constituyen un recurso de alto nivel de abstracción que el lenguaje pone a disposición del programador.

Una mayor **abstracción**, al evitar tener que prestar atención a los detalles, permite una mayor productividad en la tarea de programación.

Pero no todas son ventajas. Una mayor **abstracción** muchas veces implica un mayor **coste computacional** al implicar la interposición de **capas** de _software_ entre la descripción abstracta del problema general y la solución particular de cada caso.

La buena noticia es que los **sets** de Python tiene un coste computacional muy bajo. Al igual que los **diccionarios**, los **sets** son implementados como _memorias asociativas_ o _tablas hash_ muy eficientes.

Lo anterior implica que podemos utilizar los **sets** como elementos auxiliares sin "preocuparnos" excesivamente.

In [7]:
# Función que recibe lista y devuelve otra sin elementos repetidos
def elimina_rep(lista_repetidos):
    lista_sin_repetidos = []
    chequea_repetidos = set()
    for elem in lista_repetidos:
        if elem not in chequea_repetidos:
            lista_sin_repetidos.append(elem)
            chequea_repetidos.add(elem)
    return lista_sin_repetidos

# Programa principal

lista = [1, 2, 1, 4, 3, -2, 1,3, 2, 2, 9]
print(elimina_rep(lista))       

[1, 2, 4, 3, -2, 9]


La función en el ejemplo anterior recibe una lista, que puede tener o no elementos repetidos, y devuelve otra que contiene los elementos de la lista original pero representados solamente una vez.

Observe el uso de un **set** auxiliar que sirve únicamente el propósito de "memorizar" los elementos que ya han "aparecido" previamente en la lista para evitar copiarlos en la lista de salida.