# Diccionarios y conjuntos

## Índice de contenidos
* [1. Diccionarios](#sec_diccionarios)
 * [1.1. Inicialización de diccionarios](#sec_inicializacion)
 * [1.2. Operaciones con diccionarios](#sec_operaciones)
 * [1.3. Recorrido de diccionarios](#sec_recorrido)
 * [1.4. Definición de diccionarios por comprensión](#sec_definicion)
* [2. Conjuntos](#sec_conjuntos)
 * [2.1. Operaciones sobre conjuntos](#sec_operaciones_conjuntos)
 * [2.2. Operaciones entre conjuntos](#sec_operaciones_entre_conjuntos)

## 1. Diccionarios <a name="sec_diccionarios"/>

Los **diccionarios** son un tipo contenedor, como lo son las listas o las tuplas. La principal característica que los diferencia de otros tipos contenedor es que los valores contenidos en un diccionario están *indexados* mediante claves. Esto significa que para acceder a un valor contenido en un diccionario, debemos conocer la clave correspondiente, de manera parecida a como para acceder a un elemento concreto de una lista o una tupla necesitamos conocer la posición que ocupa dicho elemento.

A diferencia de las listas y las tuplas, en las que las posiciones que ocupan los elementos están implícitas en la propia definición de la lista, en los diccionarios debemos especificar explícitamente una clave para cada elemento.

Veamos algunos ejemplos de inicialización y acceso a elementos de un diccionario, comparándolo con una tupla:

In [None]:
datos_personales_tupla = ("Miguel", "González Buendía", 24, 1.75, 72.3)
# Acceso al elemento indexado en la posición 0
print(datos_personales_tupla[0])

datos_personales_diccionario = {"nombre": "Miguel", "apellidos": "González Buendía", "edad": 24, "altura": 1.75, "peso": 72.3}
# Acceso al elemento indexado con la clave "nombre"
print(datos_personales_diccionario["nombre"])

Tal como se ve en el ejemplo, los diccionarios son una alternativa al uso de tuplas para representar información heterogénea sobre algún tipo de entidad. La ventaja fundamental es que mientras la tupla nos obliga a recordar la posición que ocupa cada uno de los datos de la entidad, para poder utilizarla en el resto del código, el acceso a los datos a través del diccionario se hace mediante claves que son más fáciles de recordar, repercutiendo en un código más legible. 

Los diccionarios son **mutables**, lo que significa que podemos añadir o eliminar parejas clave-valor, como veremos más adelante. Los valores pueden ser de cualquier tipo; sin embargo, **las claves deben ser obligatoriamente de algún tipo inmutable**. Lo más frecuente es que sean cadenas o números, o bien tuplas formadas por cadenas y/o números. 

## 1.1. Inicialización de diccionarios <a name="sec_inicializacion"/>

Existen múltiples opciones para inicializar un diccionario. A continuación se muestran distintos ejemplos:

In [None]:
# 1. Diccionario vacío, mediante función dict
diccionario = dict()  
print("1:", diccionario)

# 2. Diccionario vacío, mediante llaves
diccionario = {}      # Diccionario vacío
print("2:", diccionario)

# 3. Mediante una secuencia de tuplas, de dos elementos cada tupla (cada tupla representa una pareja clave-valor)
diccionario = dict([("clave1", "valor1"), ("clave2", "valor2"), ("clave3", "valor3")])
print("3:", diccionario)

# 4. También podemos pasar cada pareja clave-valor como un parámetro por nombre a la función dict.
# En este caso, las claves siempre serán cadenas
diccionario = dict(clave1 = "valor1", clave2 = "valor2", clave3 = "valor3")
print("4:", diccionario)

# 5. Si tenemos las claves y las tuplas en dos secuencias, podemos usar zip
claves = ["clave1", "clave2", "clave3"]
valores = ["valor1", "valor2", "valor3"]
diccionario = dict(zip(claves, valores))
print("5:", diccionario)

# 6. Mediante las llaves, podemos especificar una serie de parejas clave-valor
# Esta es quizás la opción más frecuente cuando se quiere inicializar un diccionario con unos valores conocidos.
diccionario = {"clave1": "valor1", "clave2": "valor2", "clave3": "valor3"}
print("6:", diccionario)


Aunque al mostrar los diccionarios las claves y valores asociados aparecen en el mismo orden en que fueron escritos al inicializar el diccionario, dichas parejas clave-valor no tienen un orden determinado dentro del diccionario. Por tanto, **dos diccionarios serán iguales si tienen las mismas parejas**, independientemente del orden en que fueran insertadas en el diccionario:

In [None]:
diccionario2 = {"clave2": "valor2", "clave3": "valor3", "clave1": "valor1"}
print("¿Son iguales diccionario y diccionario2?", diccionario==diccionario2)

En los ejemplos anteriores tanto las claves como los valores son de tipo cadena. Por supuesto, podemos usar otros tipos, tanto para las claves como para los valores (recordando que los tipos de las claves deben ser inmutables, como señalamos antes). Es frecuente que los valores sean a su vez de algún tipo contenedor. Por ejemplo:
```python
# Glosario de un libro, indicando las páginas en las que aparecen distintos conceptos
# Las claves son de tipo cadena y los valores de tipo lista
glosario = {'programación estructurada': [14,15,18,24,85,86], 'funciones': [2,3,4,8,9,10,11,14,15,18], ...}
```

## 1.2. Operaciones con diccionarios <a name="sec_operaciones"/>

Repasaremos en esta sección las operaciones más comunes con diccionarios.

Para **acceder a un valor a partir de una clave**, podemos utilizar los corchetes (de forma parecida a como accedemos a los elementos de una lista) o el método get:

In [None]:
diccionario = {"clave1": "valor1", "clave2": "valor2", "clave3": "valor3"}

# 1. Acceso a un valor a partir de una clave mediante corchetes o mediante método get
print("1. El valor asociado a clave1 es", diccionario["clave1"])
print("1. El valor asociado a clave1 es", diccionario.get("clave1"))


# 2. Si utilizo en los corchetes una clave que no existe en el diccionario, se produce un error
# Descomenta la instrucción de abajo si quieres comprobarlo
# print("2. El valor asociado a clave4 es", diccionario["clave4"])

# 3. Sin embargo, si utilizo el método get con una clave no existente, obtengo un valor por defecto (None):
print("3. El valor asociado a clave4 es", diccionario.get("clave4"))

# 4. Podemos cambiar el valor por defecto que devuelve get cuando no encuentra una clave, mediante un segundo parámetro:
print("4. El valor asociado a clave4 es", diccionario.get("clave4","noexiste"))

---
Para **añadir una nueva pareja clave-valor** o **modificar el valor para una clave ya existente** podemos usar una instrucción de asignación, junto con el operador de acceso anterior (los corchetes):

In [None]:
# Inserción de una nueva pareja
diccionario["clave4"] = "valor4"

# Modificación del valor para una clave existente
diccionario["clave1"] = "valor1_modificado"

print(diccionario)

---
Si queremos **volcar toda la información contenida en un diccionario en otro diccionario**, usaremos el método *update*. Debemos tener en cuenta que al hacer esto puede que estemos sobrescribiendo los valores asociados a algunas claves del diccionario que estamos actualizando; esto ocurrirá cuando en el diccionario que estamos volcando haya claves iguales a las claves del diccionario que estamos actualizando:

In [None]:
diccionario2 = {"clave4": "valor4_modificado", "clave5": "valor5", "clave6": "valor6"}

diccionario.update(diccionario2)
print(diccionario)

---
Si usamos la función predefinida *len* sobre un diccionario, **obtenemos el número de parejas clave-valor que contiene el diccionario**:

In [None]:
print("Número de items que tiene el diccionario:", len(diccionario))

---
Para **eliminar una pareja clave-valor**, utilizamos la instrucción *del*:

In [None]:
# Borrado de una pareja clave-valor
del diccionario["clave4"]
print(diccionario)

# Si intento borrar una clave inexistente, obtengo un error
del diccionario["clave4"]

Podemos **borrar todo el contenido de un diccionario**, mediante el método clear:

In [None]:
diccionario.clear()
print(diccionario)

---
En ocasiones necesitaremos realizar alguna tarea utilizando únicamente las claves o los valores de un diccionario. Para **obtener todas las claves o los valores** de un diccionario usaremos los métodos *keys* y *values*:

In [None]:
diccionario = {"clave1": "valor1", "clave2": "valor2", "clave3": "valor3"}
print(diccionario.keys())
print(diccionario.values())

 Las claves o los valores se obtienen encapsulados en un objeto especial. Lo único que debemos saber de estos objetos es que son iterables, es decir, que podemos recorrerlos en un bucle *for* (lo veremos más adelante), o utilizarlos para inicializar una lista, por ejemplo. 

También podemos **obtener las parejas clave-valor**, en forma de tuplas, mediante el método *items*:

In [None]:
print(diccionario.items())

---
Para acabar con las operaciones básicas, podemos consultar la pertenencia de una clave a un diccionario mediante el operador *in*, que puede aparecer combinado con el operador *not*:

In [None]:
if "clave1" in diccionario:
    print("Existe clave1")

if "clave4" not in diccionario:
    print("No existe clave4")

## 1.3. Recorrido de diccionarios <a name="sec_recorrido"/>

Si utilizamos un diccionario en una instrucción ```for ... in ...```, obtendremos en cada iteración una clave del diccionario:

In [None]:
for clave in diccionario:
    print(clave)

Si queremos acceder en cada paso del bucle también al valor correspondiente, podemos hacerlo así:

In [None]:
for clave in diccionario:
    valor = diccionario[clave]
    print(clave, valor)

O usando el método *items*, lo cual queda quizás más compacto y legible:

In [None]:
for clave, valor in diccionario.items():
    print(clave, valor)

Si no necesitamos la información de las claves para el tratamiento que estamos implementando, es posible iterar únicamente sobre los valores:

In [None]:
for valor in diccionario.values():
    print(valor)

## 1.4. Definición de diccionarios por comprensión <a name="sec_definicion"/>

Al igual que con las listas, es posible definir un diccionario por comprensión. La sintaxis es parecida a la de la definición de listas por comprensión, con dos diferencias:
* Se usan las llaves en lugar de los corchetes.
* En donde escribíamos la expresión generadora, ahora debemos escribir dos expresiones, separadas por dos puntos. La primera de ellas indica cómo se generan las claves, y la segunda cómo se generan los valores. 

En el siguiente ejemplo construimos un diccionario a partir de una lista de nombres. Las claves serán cada uno de los nombres de la lista, y el valor asociado será la posición que ocupa ese nombre en la lista, empezando en 1:

In [None]:
nombres = ["Miguel", "Ana", "José María", "Guillermo", "María", "Luisa"]
ranking = {nombre: nombres.index(nombre) + 1 for nombre in nombres}

print(ranking)

Este otro ejemplo muestra cómo construir un diccionario que almacene la frecuencia de aparición de cada carácter de un texto de entrada:

In [None]:
texto = "este es un pequeño texto para probar la siguiente definición por comprensión"
frecuencias_caracteres = {caracter: texto.count(caracter) for caracter in sorted(texto) if caracter!=" "}
print(frecuencias_caracteres)

Un último ejemplo, en el que a partir de un texto construimos un diccionario con las palabras indexadas por sus iniciales:

In [None]:
texto = "este es un pequeño texto para probar la siguiente definición por comprensión"
iniciales = [palabra[0] for palabra in texto.split()]
palabras_por_iniciales = {inicial: [palabra for palabra in texto.split() 
                                    if palabra[0]==inicial] 
                          for inicial in sorted(iniciales)}
print(palabras_por_iniciales)

# 2. Conjuntos <a name="sec_conjuntos"/>

Los conjuntos son el último tipo contenedor que estudiaremos en la asignatura. Sus principales características son:
* Son **mutables**.
* **No admiten duplicados**. Si insertamos un nuevo elemento que ya existía en el conjunto, simplemente no se añade.
* **Los elementos no tienen una posición asociada**, como si tenían en las listas o en las tuplas. Por tanto, podemos recorrer los elementos de un conjunto, o preguntar si contiene a un elemento determinado, pero no acceder a una posición concreta.

## 2.1. Operaciones sobre conjuntos <a name="sec_operaciones_conjuntos"/>
Para inicializar un conjunto, podemos hacerlo usando las llaves, o la función *set*:

In [None]:
# 1. Inicializar un conjunto vacío
# NO SE PUEDEN USAR LAS LLAVES, puesto que entonces Python entiende que estamos inicializando un diccionario.
conjunto = set()
print("1. Conjunto vacío:", conjunto)

# 2. Inicializar un conjunto explícitamente
conjunto = {1, 2, 3}
print("2. Conjunto explícito:", conjunto)

# 3. Inicializar un conjunto a partir de los elementos de una secuencia
lista = [1, 5, 5, 2, 2, 4, 3, -4, -1]
conjunto = set(lista)
print("3. Conjunto a partir de secuencia:", conjunto)

Observa que en el ejemplo anterior al inicializar un conjunto a partir de una secuencia se eliminan los duplicados. Precisamente este es **uno de los usos más habituales de los conjuntos: obtener los valores distintos contenidos en una secuencia**. 


Los conjuntos **son iterables** mediante un *for*. A diferencia de las listas, no podemos saber en qué orden se recorrerán sus elementos:

In [None]:
for elemento in conjunto:
    print(elemento)

También podemos utilizar el **operador de pertenencia** *in*, para preguntar por la pertenencia de un elemento al conjunto. Aunque esto es algo que podíamos hacer con las listas, en el caso de los conjuntos la operación es mucho más eficiente. Por tanto, si en un algoritmo se realizan una gran cantidad de operaciones de pertenencia, puede ser apropiado volcar los elementos en un conjunto en lugar de en una lista.

Vamos a comprobarlo experimentalmente:

In [None]:
# Importamos este módulo para hacer mediciones del tiempo de ejecución
import time
import random

lista_numeros = list(range(1000)) # Creamos una lista con los números del 0 al 999

inicio = time.time()
for i in range(1000000):
    numero = random.randint(0,1000)  # Generamos un número aleatorio
    if numero in lista_numeros:  # Ejecutamos operación de pertenencia sobre la lista
        pass
fin = time.time()
print("Tiempo de ejecución con lista:", fin - inicio, "segundos.")

conjunto_numeros = set(lista_numeros)
inicio = time.time()
for i in range(1000000):
    numero = random.randint(0,1000) # Generamos un número aleatorio
    if numero in conjunto_numeros:  # Ejecutamos operación de pertenencia sobre el conjunto
        pass
fin = time.time()
print("Tiempo de ejecución con conjunto:", fin - inicio, "segundos.")

## 2.2. Operaciones entre conjuntos <a name="sec_operaciones_entre_conjuntos"/>
Todas las operaciones matemáticas entre conjuntos están implementadas en Python mediante operadores. En concreto, podemos hacer:
* **[Unión de conjuntos](http://www.google.es/search?q=union+de+conjuntos)**, mediante el operador *|*.
* **[Intersección de conjuntos](http://www.google.es/search?q=interseccion+de+conjuntos)**, mediante el operador *&*.
* **[Diferencia de conjuntos](http://www.google.es/search?q=diferencia+de+conjuntos)**, mediante el operador *-*.
* **[Diferencia simétrica de conjuntos](http://www.google.es/search?q=diferencia+simetrica+de+conjuntos)**, mediante el operador *^*. 

Puedes experimentar cómo funcionan estas operaciones en el siguiente ejemplo, modificando los elementos de los conjuntos iniciales:

In [None]:
a = {1, 2, 3, 4, 5}
b = {4, 5, 6, 7, 8}

print("Unión:", a | b)
print("Intersección:", a & b)
print("Diferencia:", a - b)
print("Diferencia simétrica:", a ^ b)

También es posible interpelar a Python acerca de si un conjunto es un subconjunto de otro, con el operador <= (o con el operador <, para preguntar si es un subconjunto propio). Igualmente podemos usar los operadores > y >= para averigüar si un conjunto es un superconjunto (propio) de otro:

In [None]:
a = {1, 2, 3, 4, 5, 6}
b = {1, 2, 3}

print("¿Es b un subconjunto de a?", b <= a)
print("¿Es a un subconjunto de sí mismo?", a <= a)
print("¿Es a un subconjunto propio de sí mismo?", a < a)

### ¡Prueba tú!

Los operadores <, <=, > y >= también se pueden usar entre listas. Haz pruebas y trata de explicar cómo funcionan estos operadores cuando trabajan con listas:

In [None]:
lista1 = [1,2,3,4]
lista2 = [1,2]
lista3 = [3,4]
lista4 = []

print(lista2 < lista1)

# Añade más pruebas:


Además de las operaciones propias de conjuntos, también pueden usarse algunas de las operaciones para secuencias que vimos en el notebook 5 (a pesar de que los conjuntos **no** son secuencias):

In [None]:
print("Tamaño del conjunto a:", len(a))
print("Suma de elementos de a:", sum(a))
print("Mínimo de a:", min(a))
print("Máximo de a:", max(a))
print("Elementos de a, ordenados:", sorted(a))