In [1]:
from IPython.display import HTML
from pathlib import Path

css_rules = Path('../custom.css').read_text()
HTML('<style>' + css_rules + '</style>')

# Diccionarios y conjuntos

![Dictionary](img/dictionary.png)

> Icons made by <a href="https://www.flaticon.com/authors/eucalyp" title="Eucalyp">Eucalyp</a> from <a href="https://www.flaticon.com/" title="Flaticon"> www.flaticon.com</a>

## 📕 Diccionarios

Un **diccionario** es similar a una lista pero el orden de los elementos no importa y no son seleccionados mediante un desplazamiento.

Se utiliza una **clave** única para asociar con cada **valor**. Esta clave a menudo es una *cadena de texto* pero en realidad puede ser cualquier *tipo inmutable* de Python: booleano, entero, flotante, tupla (y algunos otros).

Los diccionarios son *mutables* con lo que se pueden añadir, borrar y modificar sus elementos *clave-valor*.

> En otros lenguajes de programación los diccionarios se les conoce como arrays asociativos, hashes o hashmaps.

### Crear diccionarios con `{}`

Para crear un diccionario basta con usar llaves `{}` rodeando pares `clave: valor` separados por comas. El diccionario más simple es el vacío:

In [2]:
empty_dict = {}
empty_dict

{}

Veamos un diccionario que sí incorpora claves y valores:

In [3]:
rae = {
    'inteligencia': 'Capacidad de entender o comprender',
    'artificial': 'Producido por el ingenio humano'
}

In [4]:
rae

{'inteligencia': 'Capacidad de entender o comprender',
 'artificial': 'Producido por el ingenio humano'}

### Crear diccionarios con `dict()`

También es posible utilizar la función `dict()` para crear dicionarios y no tener que utilizar llaves y comillas:

**Versión clásica**

In [5]:
passenger = {'name': 'Guido', 'surname': 'Van Rossum', 'job': 'Python creator'}
passenger

{'name': 'Guido', 'surname': 'Van Rossum', 'job': 'Python creator'}

**Versión usando `dict()`**

In [6]:
passenger = dict(name='Guido', surname='Van Rossum', job='Python creator')
passenger

{'name': 'Guido', 'surname': 'Van Rossum', 'job': 'Python creator'}

Una *limitación* del uso de `dict()` para construir diccionarios es que los nombres de las *claves* (*argumentos*) deben ser nombres legales de variables (sin espacios ni palabras reservadas):

**Versión clásica**

In [7]:
passenger = {'name': 'Guido Van Rossum', 'date of birth': '31/01/1956'}
passenger

{'name': 'Guido Van Rossum', 'date of birth': '31/01/1956'}

**Versión usando `dict()`**

In [8]:
passenger = dict(name='Guido Van Rossum', date of birth='31/01/1956')
passenger

SyntaxError: invalid syntax (<ipython-input-8-353d8be6ebb7>, line 1)

### Convertir con `dict()`

La función `dict()` también se puede utilizar para **convertir secuencias** de dos valores en un diccionario:

In [9]:
# list of lists
lol = [['a', 'b'], ['c', 'd'], ['e', 'f']]
dict(lol)

{'a': 'b', 'c': 'd', 'e': 'f'}

In [10]:
# tuple of list
tol = (['a', 'b'], ['c', 'd'], ['e', 'f'])
dict(tol)

{'a': 'b', 'c': 'd', 'e': 'f'}

In [11]:
# list of strings
los = ['ab', 'cd', 'ef']
dict(los)

{'a': 'b', 'c': 'd', 'e': 'f'}

### `{}` vs `dict()`

Normalmente se recomienda el uso de `{}` frente a `dict()` para la creación de un diccionario vacío. Existe una *considerable* diferencia en tiempo de ejecución:

In [12]:
# Módulo para medir tiempos de ejecución
import timeit

In [13]:
cbrackets_time = timeit.timeit('{}')
dict_time = timeit.timeit('dict()')

In [14]:
cbrackets_time

0.036228595000000086

In [15]:
dict_time

0.18094844399999988

In [16]:
dict_time / cbrackets_time

4.994630456963607

> El uso de `{}` es casi 6 veces más rápido que `dict()`

### Añadir o modificar un elemento utilizando la clave

Añadir un elemento a un diccionario es sencillo. Sólo es necesario hacer referencia a la clave y asignarle un valor:

- Si la clave ya existía en el diccionario, se reemplaza el valor existente por el nuevo.
- Si la clave es nueva, se añade al diccionario con su valor.

Al contrario que en las listas, no hay que preocuparse por las excepciones fuera de rango durante la asignación de elementos al diccionario.

In [17]:
it_books = {
    'Python': 'Learning Python',
    'Javascript': 'Eloquent Javascript',
    'Perl': 'Perl Cookbook'
}

Supongamos que adquirimos un nuevo libro de *C++*:

In [18]:
it_books['C++'] = 'Thinking in C++'
it_books

{'Python': 'Learning Python',
 'Javascript': 'Eloquent Javascript',
 'Perl': 'Perl Cookbook',
 'C++': 'Thinking in C++'}

Supongamos ahora que adquirimos un nuevo libro de *Python*:

In [19]:
# Hemos adquirido otro nuevo libro!
it_books['Python'] = 'Fluent Python'
it_books

{'Python': 'Fluent Python',
 'Javascript': 'Eloquent Javascript',
 'Perl': 'Perl Cookbook',
 'C++': 'Thinking in C++'}

> Dado que las **claves** de los diccionarios son **únicas**, al añadir el nuevo libro de Python hemos actualizado el ya existente.

### Acceder a un elemento de un diccionario

Para acceder a los elementos de un diccionario basta con escribir la **clave** entre corchetes:

In [20]:
it_books['Perl']

'Perl Cookbook'

Cuando la clave no está presente en el diccionario, obtenemos una *excepción*:

In [21]:
it_books['Rust']

KeyError: 'Rust'

Existen dos mecanismos para evitar el error en el acceso a una clave (potencialmente inexistente):

**Operador `in`**

In [22]:
'Rust' in it_books

False

**Método `get()`**

In [23]:
it_books.get('Python')  # si la clave existe, devuelve su valor

'Fluent Python'

In [24]:
it_books.get('Rust')  # si la clave no existe, devuelve None

In [25]:
it_books.get('Rust', 'Checkout Stack Overflow!')  # valor por defecto

'Checkout Stack Overflow!'

### 🎯 Ejercicio

Construya un diccionario partiendo de una cadena de texto con el siguiente formato:

`<city>:<population>;<city>:<population>;<city>:<population>;....`

> Las claves serán las ciudades y los valores serán los habitantes (como enteros).

**Ejmplo:**

➡️ `Tokyo:38_140_000;Delhi:26_454_000;Shanghai:24_484_000;Mumbai:21_357_000;São Paulo:21_297_000`

⬅️ `{'Tokyo': 38140000, 'Delhi': 26454000, 'Shanghai': 24484000, 'Mumbai': 21357000, 'São Paulo': 21297000}`

<hr>

**📎 Posible solución:** [solutions/cities.py](solutions/cities.py)

In [26]:
# Escriba aquí su solución

In [27]:
# %load "solutions/cities.py"

### Obtener todas las claves de un diccionario

Podemos utilizar el método `keys()` para obtener todas las claves de un dccionario:

In [28]:
it_books.keys()

dict_keys(['Python', 'Javascript', 'Perl', 'C++'])

Como se puede observar, el método devuelve `dict_keys` que es un *iterable* sobre las claves del diccionario. Esto es útil para diccionarios muy extensos ya que se usa mucha menos memoria y tiempo de cómputo al no crear explícitamente la lista de claves.

Podemos obtener explícitamente la lista de claves haciendo uso de la función `list()`:

In [29]:
list(it_books.keys())

['Python', 'Javascript', 'Perl', 'C++']

### Obtener todos los valores de un diccionario

In [30]:
list(it_books.values())

['Fluent Python', 'Eloquent Javascript', 'Perl Cookbook', 'Thinking in C++']

### Obtener todos los pares clave-valor de un diccionario

In [31]:
list(it_books.items())

[('Python', 'Fluent Python'),
 ('Javascript', 'Eloquent Javascript'),
 ('Perl', 'Perl Cookbook'),
 ('C++', 'Thinking in C++')]

> Cada clave-valor se retorna como una **tupla**.

### Obtener la longitud de un diccionario

In [32]:
len(it_books)

4

### Iterar sobre diccionarios

In [33]:
# Iterando sobre claves

for language in it_books:  # equivale a it_books.keys()
    print(language)

Python
Javascript
Perl
C++


In [34]:
# Iterando sobre valores

for book in it_books.values():
    print(book)

Fluent Python
Eloquent Javascript
Perl Cookbook
Thinking in C++


In [35]:
# Iterando sobre clave-valor

for language, book in it_books.items():
    print(f'{language}: {book}')

Python: Fluent Python
Javascript: Eloquent Javascript
Perl: Perl Cookbook
C++: Thinking in C++


### 🎯 Ejercicio

Dado el diccionario de ciudades y poblaciones ya visto, y suponiendo que estas ciudades son las únicas que existen en el planeta, calcule el porcentaje de población relativo de cada una de ellas con respecto al total.

**Ejemplo**:

➡️ `{'Tokyo': 38140000, 'Delhi': 26454000, 'Shanghai': 24484000, 'Mumbai': 21357000, 'São Paulo': 21297000}`

⬅️ `{'Tokyo': 28.952722193544467, 'Delhi': 20.081680988673973, 'Shanghai': 18.58622050830474, 'Mumbai': 16.212461664591746, 'São Paulo': 16.16691464488507}`

<hr>

**📎 Posible solución:** [solutions/population.py](solutions/population.py)

In [36]:
# Escriba aquí su solución

In [37]:
# %load "solutions/population.py"

### Combinar diccionarios con `**`

Desde *Python 3.5* existe una nueva forma de *mezclar* (combinar) diccionarios usando el operador `**`:

In [38]:
it_books1 = {'Python': 'Learning Python', 'C++': 'Thinking in C++'}
it_books2 = {'Rust': 'Programming Rust', 'Python': 'Fluent Python'}

In [39]:
{**it_books1, **it_books2}

{'Python': 'Fluent Python',
 'C++': 'Thinking in C++',
 'Rust': 'Programming Rust'}

> Nótese que para las claves comunes se mantiene el valor del último diccionario especificado.

In [40]:
# Podemos incluir más de 2 diccionarios en la combinación
it_books3 = {'Javascript': 'Eloquent Javascript', 'Rust': 'Rust in action'}
{**it_books1, **it_books2, **it_books3}

{'Python': 'Fluent Python',
 'C++': 'Thinking in C++',
 'Rust': 'Rust in action',
 'Javascript': 'Eloquent Javascript'}

### Combinar diccionarios con `update()`

Otra de las vías que nos ofrece Python para combinar diccionarios es utilizar el método `update()`:

In [41]:
it_books1 = {'Python': 'Learning Python', 'C++': 'Thinking in C++'}
it_books2 = {'Rust': 'Programming Rust', 'Python': 'Fluent Python'}

In [42]:
it_books1.update(it_books2)

In [43]:
it_books1

{'Python': 'Fluent Python',
 'C++': 'Thinking in C++',
 'Rust': 'Programming Rust'}

> Nótese que el método `update()` modifica el propio diccionario desde el que se invoca y véase la actualización de las claves homóninas (al igual que con el operador `**`).

### Borrar un elemento de un diccionario

Para borrar un elemento de un diccionario podemos usar la sentencia `del` indicando la clave en cuestión:

In [44]:
it_books

{'Python': 'Fluent Python',
 'Javascript': 'Eloquent Javascript',
 'Perl': 'Perl Cookbook',
 'C++': 'Thinking in C++'}

In [45]:
del it_books['Javascript']

In [46]:
it_books

{'Python': 'Fluent Python', 'Perl': 'Perl Cookbook', 'C++': 'Thinking in C++'}

### Borrar un elemento con extracción

Python ofrece el método `pop()` que combina `get()` y `del`. Si la clave que buscamos existe, nos devuelve el valor correspondiente y borra la clave. Si la clave no existe eleva una excepción:

In [47]:
len(it_books)

3

In [48]:
it_books.pop('C++')

'Thinking in C++'

In [49]:
len(it_books)

2

In [50]:
it_books.pop('Kotlin')

KeyError: 'Kotlin'

### Borrar todos los elementos de un diccionario

Podemos borrar todos los elementos de un diccionario utilizando la función `clear()`:

In [51]:
it_books

{'Python': 'Fluent Python', 'Perl': 'Perl Cookbook'}

In [52]:
it_books.clear()

In [53]:
it_books

{}

> Otra manera de borrar todos los elementos de una variable es asignar un diccionario vacío `{}`

### Comprobar si una clave existe en el diccionario

El operador `in` lo podemos utilizar para comprobar si una clave existe en un diccionario:

In [54]:
it_books = {
    'Python': 'Learning Python',
    'Javascript': 'Eloquent Javascript',
    'Perl': 'Perl Cookbook'
}

In [55]:
'Python' in it_books

True

In [56]:
'Scala' in it_books

False

### 🎯 Ejercicio

Cuente el número de veces que se repite cada letra en una cadena de texto dada:

**Ejemplo:**

➡️ `supercalifragilisticexpialidocious`

⬅️ `{'a': 2, 'c': 2, 'e': 1, 'd': 0, 'g': 0, 'f': 0, 'i': 6, 'l': 2, 'o': 1, 'p': 1, 's': 2, 'r': 1, 'u': 1, 't': 0, 'x': 0}`

<hr>

**📎 Posible solución:** [solutions/counter.py](solutions/counter.py)

In [57]:
# Escriba aquí su solución

In [58]:
# %load "solutions/counter.py"

### Modificación de listas copiadas (referencias)

Al igual que ocurría con las listas, si hacemos un cambio en un diccionario, se verá reflejado en todos los nombres que hagan referencia al mismo:

In [59]:
it_books1 = {
    'Python': 'Learning Python',
    'Javascript': 'Eloquent Javascript',
    'Perl': 'Perl Cookbook'
}

In [60]:
it_books2 = it_books1

In [61]:
it_books1['Scala'] = 'Scala for the impatient'

In [62]:
it_books2  # cambio en esta referencia

{'Python': 'Learning Python',
 'Javascript': 'Eloquent Javascript',
 'Perl': 'Perl Cookbook',
 'Scala': 'Scala for the impatient'}

### Copiar diccionarios

Para evitar *modificaciones indeseadas* cuando igualamos un diccionario a otro, podemos hacer uso de la función `copy()`:

In [63]:
it_books1 = {
    'Python': 'Learning Python',
    'Javascript': 'Eloquent Javascript',
    'Perl': 'Perl Cookbook'
}

In [64]:
it_books2 = it_books1.copy()

In [65]:
it_books1['Scala'] = 'Scala for the impatient'

In [66]:
it_books2  # permanece sin cambios

{'Python': 'Learning Python',
 'Javascript': 'Eloquent Javascript',
 'Perl': 'Perl Cookbook'}

### Copiado profundo de diccionarios

Cuando nuestro diccionario incluye en sus valores otras estructuras de datos complejas, no nos vale con utilizar `copy()` para crear copias totalmente independientes. En este caso podemos hacer uso de la función `deepcopy()` dentro del módulo `copy` de la librería estándar:

In [67]:
it_books1 = {
    'Python': ['Learning Python', 'Fluent Python'],  # valor como lista
    'Javascript': 'Eloquent Javascript',
    'Perl': 'Perl Cookbook'
}

In [68]:
it_books2 = it_books1.copy()

In [69]:
it_books1['Python'][1] = 'Not so fluent Python!'

In [70]:
it_books2  # cambio en esta referencia

{'Python': ['Learning Python', 'Not so fluent Python!'],
 'Javascript': 'Eloquent Javascript',
 'Perl': 'Perl Cookbook'}

Vamos a realizar ahora la copia utilizando la función `deepcopy()`:

In [71]:
it_books1 = {
    'Python': ['Learning Python', 'Fluent Python'],  # valor como lista
    'Javascript': 'Eloquent Javascript',
    'Perl': 'Perl Cookbook'
}

In [72]:
import copy

it_books2 = copy.deepcopy(it_books1)

In [73]:
it_books1['Python'][1] = 'Not so fluent Python!'

In [74]:
it_books2  # permanece sin cambios

{'Python': ['Learning Python', 'Fluent Python'],
 'Javascript': 'Eloquent Javascript',
 'Perl': 'Perl Cookbook'}

### Comparar diccionarios

Como en el caso de las tuplas y las listas, podemos comparar diccionarios utilizando los operadores `==` y `!=`:

In [75]:
a = {1: 1, 2: 2, 3: 3}
b = {3: 3, 1: 1, 2: 2}

In [76]:
a == b

True

> Nótese que el orden de los elementos no influye en la comparación.

In [77]:
a <= b  # otros operadores no son aplicables

TypeError: '<=' not supported between instances of 'dict' and 'dict'

### Diccionarios por comprensión

De forma análoga a como se escriben las listas por comprensión, podemos aplicar este método a los *diccionarios por comprensión*:

In [78]:
word = 'letters'

In [79]:
letter_counts = {letter: word.count(letter) for letter in word}

In [80]:
for letter, count in letter_counts.items():
    print(letter, count)

l 1
e 2
t 2
r 1
s 1


> Una mejora de esta comprensión sería usar un conjunto para evitar contar letras repetidas:  
`{letter: word.count(letter) for letter in set(word)}`

También podemos incorporar *condiciones* en un diccionario por comprensión:

In [81]:
vowels = 'aeiou'
word = 'onomatopoeia'

In [82]:
vowel_counts = {letter: word.count(letter)
                for letter in set(word)
                if letter in vowels}

In [83]:
for vowel, count in vowel_counts.items():
    print(vowel, count)

i 1
o 4
e 1
a 2


> Se puede consultar el [PEP-274](https://www.python.org/dev/peps/pep-0274/) para ver más ejemplos sobre diccionarios por comprensión.

## 🍇 Conjuntos

Se podría pensar en un **conjunto** como en un diccionario al que le hemos quitado los valores y nos hemos quedado con las *claves*. Los elementos de un conjunto son **únicos**.

La [teoría de conjuntos](https://es.wikipedia.org/wiki/Teor%C3%ADa_de_conjuntos) es muy conocida en el mundo de las matemáticas y se aplica también a su implementación en Python.

![Venn Diagram](img/venn-diagrams.png)

> Image by [TEXample.net](http://www.texample.net/tikz/examples/set-operations-illustrated-with-venn-diagrams/)

### Crear un conjunto

Para crear un *conjunto vacío* sólo existe la opción de utilizar la función `set()`:

In [84]:
empty_set = set()
empty_set

set()

Para crear un *conjunto con valores iniciales* debemos separar sus valores por comas y rodearlos de llaves `{}`:

In [85]:
even_numbers = {0, 2, 4, 6, 8}

> Nótese que el conjunto vacío no se puede denotar por `{}` ya que está reservado para los diccionarios. De hecho cuando Python nos muestra el contenido de un conjunto vacío lo hace como `set()`

### Convertir con `set()`

Podemos crear un conjunto desde una cadena de texto, una lista, una tupla o un diccionario descartando todos sus valores duplicados:

In [86]:
set('letters')

{'e', 'l', 'r', 's', 't'}

In [87]:
set([1, 1, 4, 7, 8, 8, 10, 11])

{1, 4, 7, 8, 10, 11}

In [88]:
set(('Adenine', 'Thymine', 'Thymine', 'Guanine', 'Adenine', 'Cytosine'))

{'Adenine', 'Cytosine', 'Guanine', 'Thymine'}

In [89]:
set({'apple': 'red', 'banana': 'yellow', 'kiwi': 'green'})

{'apple', 'banana', 'kiwi'}

### Obtener la longitud de un conjunto

In [90]:
fibonacci = set((0, 1, 1, 2, 3, 5, 8, 13, 21))
len(fibonacci)

8

### Añadir un elemento a un conjunto

In [91]:
fibonacci.add(34)
fibonacci

{0, 1, 2, 3, 5, 8, 13, 21, 34}

### Borrar un elemento de un conjunto

In [92]:
fibonacci.remove(34)
fibonacci

{0, 1, 2, 3, 5, 8, 13, 21}

### Iterar sobre un conjunto

In [93]:
for number in fibonacci:
    print(number)

0
1
2
3
5
8
13
21


### Comprobar si un valor pertenece a un conjunto

In [94]:
4 in fibonacci

False

In [95]:
5 in fibonacci

True

### Combinaciones entre conjuntos

Vamos a partir de dos conjuntos $A = \{1, 2\}$ y $B = \{2, 3\}$ para ejemplificar las distintas combinaciones que se puedan hacer entre ellos:

In [96]:
A = {1, 2}
B = {2, 3}

![Venn Diagram](img/venn-diagrams.png)

**Intersección**: $A \cap B$  
(*elementos que están a la vez en A y en B*)

In [97]:
A & B

{2}

In [98]:
A.intersection(B)

{2}

**Unión**: $A \cup B$  
(*elementos que están tanto en A como en B*)

In [99]:
A | B

{1, 2, 3}

In [100]:
A.union(B)

{1, 2, 3}

**Diferencia**: $A - B$  
(*elementos que están A y no están en B*)

In [101]:
A - B

{1}

In [102]:
A.difference(B)

{1}

**Diferencia simétrica** ("o" exclusivo): $\overline{A \cap B}$  
(*elementos están en A o en B pero no en ambos conjuntos*)

In [103]:
A ^ B

{1, 3}

In [104]:
A.symmetric_difference(B)

{1, 3}

### Comparaciones entre conjuntos

**Subconjunto**: $A \subseteq B$  
(*todos los elementos de A están en B*)

In [105]:
A <= B

False

In [106]:
A.issubset(B)

False

**Subconjunto propio**: $A \subset B$  
(*todos los elementos de A están en B, pero nunca son iguales*)

In [107]:
A < B

False

**Superconjunto**: $A \supseteq B$  
(*todos los elementos de B están en A*)

In [108]:
A >= B

False

In [109]:
A.issuperset(B)

False

**Superconjunto propio**: $A \supset B$  
(*todos los elementos de B están en A, pero nunca son iguales*)

In [110]:
A > B

False

### Conjuntos por comprensión

Los conjuntos, al igual que las listas y los diccionarios, también se pueden crear por *comprensión*:

In [111]:
# Múltiplos de 3 del 0 al 20

m3 = {number for number in range(0, 20) if number % 3 == 0}

In [112]:
for number in m3:
    print(number)

0
3
6
9
12
15
18


### Conjuntos inmutables

Python ofrece la posibilidad de crear *conjuntos inmutables* haciendo uso de la función `frozenset()` que recibe cualquier *iterable* como argumento:

In [113]:
fs = frozenset([3, 2, 1])

In [114]:
fs

frozenset({1, 2, 3})

Veamos qué ocurre si quiero modificar el conjunto:

In [115]:
fs.add(4)

AttributeError: 'frozenset' object has no attribute 'add'

### 🎯 Ejercicio

Dada una tupla de duplas (*2 valores*), cree dos conjuntos:

- Uno de ellos con los primeros valores de cada dupla.
- El otro con los segundos valores de cada dupla.

Obtenga la intersección de ambos conjuntos.

**Ejemplo:**

➡️ `((4, 3), (3, 2), (7, 4), (8, 2), (9, 1))`

⬅️ `{3, 4}`

<hr>

**📎 Posible solución:** [solutions/tupleset.py](solutions/tupleset.py)

In [116]:
# Escriba aquí su solución

In [117]:
# %load "solutions/tupleset.py"

## 🐍 Tutoriales de Real Python

- [Using the Python defaultdict Type for Handling Missing Keys](https://realpython.com/python-defaultdict/)
- [Sets in Python](https://realpython.com/courses/sets-python/)
- [Python Dictionary Iteration: Advanced Tips & Tricks](https://realpython.com/courses/python-dictionary-iteration/)
- [Python KeyError Exceptions and How to Handle Them](https://realpython.com/courses/python-keyerror/)
- [Dictionaries in Python](https://realpython.com/courses/dictionaries-python/)
- [How to Iterate Through a Dictionary in Python](https://realpython.com/iterate-through-dictionary-python/)
- [Shallow vs Deep Copying of Python Objects](https://realpython.com/copying-python-objects/)