# Fundamentos de Programación
# Diccionarios y conjuntos
**Autor**: Fermín Cruz   **Revisor**: Carlos G. Vallejo, Mariano González, José A. Troyano, Fernando Enríquez.  **Última modificación:** 24 de octubre de 2023

## Índice de contenidos
* [1. Conjuntos](#sec_conjuntos)
  * [1.1. Operaciones sobre conjuntos](#sec_operaciones_conjuntos)
  * [1.2. Operaciones entre conjuntos](#sec_operaciones_entre_conjuntos)
* [2. Diccionarios](#sec_diccionarios)
  * [2.1. Inicialización de diccionarios](#sec_inicializacion)
  * [2.2. Operaciones con diccionarios](#sec_operaciones)
  * [2.3. Recorrido de diccionarios](#sec_recorrido)
  * [2.4. Definición de diccionarios por comprensión](#sec_definicion)
  * [2.5. El tipo _Counter_](#sec_counter)
  * [2.6. El tipo _defaultdict_](#sec_defaultdict)

# 1. Conjuntos <a id="sec_conjuntos"/>

Los conjuntos son un tipo de contenedor, igual que lo son las listas o las tuplas, pero con importantes diferencias. Sus principales características son:
* Son **mutables**.
* **No admiten duplicados**. Si insertamos un nuevo elemento que ya existía en el conjunto, simplemente no se añade.
* **Los elementos no tienen una posición asociada**, como si tenían en las listas o en las tuplas. Por tanto, podemos recorrer los elementos de un conjunto, o preguntar si contiene a un elemento determinado, pero no acceder a una posición concreta.

Además, una propiedad muy interesante de los conjuntos es que su operación de pertenencia (es decir, el operador `in` usado sobre conjuntos) es mucho más eficiente que el de las listas. Esta es la razón para usar conjuntos en lugar de listas en algunas ocasiones, cuando la principal utilidad que le vamos a dar al conjunto es preguntarle muchas veces a lo largo de la ejecución de algún algoritmo si contiene o no a determinados elementos.

## 1.1. Operaciones sobre conjuntos <a id="sec_operaciones_conjuntos"/>

Para inicializar un conjunto, podemos hacerlo usando las llaves, o la función `set()`:

In [1]:
# 1. Inicializar un conjunto vacío
# NO SE PUEDEN USAR LAS LLAVES, puesto que entonces Python entiende que estamos inicializando un diccionario.
conjunto = set()
print("1. Conjunto vacío:", conjunto)

# 2. Inicializar un conjunto explícitamente
conjunto = {1, 2, 3}
print("2. Conjunto explícito:", conjunto)

# 3. Inicializar un conjunto a partir de los elementos de una secuencia
lista = [1, 5, 5, 2, 2, 4, 3, -4, -1]
conjunto = set(lista)
print("3. Conjunto a partir de secuencia:", conjunto)

1. Conjunto vacío: set()
2. Conjunto explícito: {1, 2, 3}
3. Conjunto a partir de secuencia: {1, 2, 3, 4, 5, -4, -1}


Observa que en el ejemplo anterior al inicializar un conjunto a partir de una secuencia se eliminan los duplicados. Precisamente este es **uno de los usos más habituales de los conjuntos: obtener los valores distintos contenidos en una secuencia**. 

Los conjuntos también se puede definir por **comprensión**, como vimos para las listas. La única diferencia es que usaremos las llaves en lugar de los corchetes. Por ejemplo, podemos definir el conjunto de los elementos pares de la variable `lista` así:

In [2]:
conjunto_pares = {e for e in lista if e % 2 == 0}
print(conjunto_pares)

{2, 4, -4}



Los conjuntos **son iterables** mediante un `for`. A diferencia de las listas, no podemos saber en qué orden se recorrerán sus elementos:

In [3]:
for elemento in conjunto:
    print(elemento)

1
2
3
4
5
-4
-1


También podemos utilizar el **operador de pertenencia** `in` para preguntar por la pertenencia de un elemento al conjunto. Aunque esto es algo que podíamos hacer con las listas, en el caso de los conjuntos la operación es mucho más eficiente. Por tanto, si en un algoritmo se realizan una gran cantidad de operaciones de pertenencia, puede ser apropiado volcar los elementos en un conjunto en lugar de en una lista.

Vamos a comprobarlo experimentalmente:

In [4]:
# Importamos este módulo para hacer mediciones del tiempo de ejecución
import time
import random

# Creamos una lista con los números del 0 al 9999
lista_numeros = list(range(10000)) 

# Guardamos una marca de tiempo del momento
# en que comienza la ejecución del siguiente
# bucle
inicio = time.time()

# Repetimos un millón de veces
# la operación de pertenencia
# sobre una lista
for i in range(1000000):
    numero = random.randint(0,20000)  # Generamos un número aleatorio
    if numero in lista_numeros:  # Ejecutamos operación de pertenencia sobre la lista
        pass  # No hacemos nada, sólo queremos medir cuánto tarda la operación in

# Obtenemos otra marca de tiempo del momento
# en que finaliza el bucle
fin = time.time()

# Restando ambas marcas de tiempo, sabemos el tiempo
# que ha tardado en ejecutarse el bucle anterior
print("Tiempo de ejecución con lista:", fin - inicio, "segundos.")

# Ahora repetimos el mismo procedimiento, pero usaremos
# un conjunto en lugar de una lista
conjunto_numeros = set(lista_numeros)
inicio = time.time()
for i in range(1000000):
    numero = random.randint(0,1000) # Generamos un número aleatorio
    if numero in conjunto_numeros:  # Ejecutamos operación de pertenencia sobre el conjunto
        pass
fin = time.time()
print("Tiempo de ejecución con conjunto:", fin - inicio, "segundos.")

Tiempo de ejecución con lista: 57.3266077041626 segundos.
Tiempo de ejecución con conjunto: 0.6118474006652832 segundos.


## 1.2. Operaciones entre conjuntos <a id="sec_operaciones_entre_conjuntos"/>

Todas las operaciones matemáticas entre conjuntos están implementadas en Python mediante operadores. En concreto, podemos hacer:
* **[Unión de conjuntos](http://www.google.es/search?q=union+de+conjuntos)**, mediante el operador `|`.
* **[Intersección de conjuntos](http://www.google.es/search?q=interseccion+de+conjuntos)**, mediante el operador `&`.
* **[Diferencia de conjuntos](http://www.google.es/search?q=diferencia+de+conjuntos)**, mediante el operador `-`.
* **[Diferencia simétrica de conjuntos](http://www.google.es/search?q=diferencia+simetrica+de+conjuntos)**, mediante el operador `^`. 

Puedes experimentar cómo funcionan estas operaciones en el siguiente ejemplo, modificando los elementos de los conjuntos iniciales:

In [5]:
a = {1, 2, 3, 4, 5}
b = {4, 5, 6, 7, 8}

print("Unión:", a | b)
print("Intersección:", a & b)
print("Diferencia:", a - b)
print("Diferencia simétrica:", a ^ b)

Unión: {1, 2, 3, 4, 5, 6, 7, 8}
Intersección: {4, 5}
Diferencia: {1, 2, 3}
Diferencia simétrica: {1, 2, 3, 6, 7, 8}


Aunque también podemos utilizar métodos para realizar las mismas operaciones. Observa el siguiente código:

In [6]:
a = {1, 2, 3, 4, 5}
b = {4, 5, 6, 7, 8}

print("Unión:", a.union(b))
print("Intersección:", a.intersection(b))
print("Diferencia:", a.difference(b))
print("Diferencia simétrica:", a.symmetric_difference(b))

Unión: {1, 2, 3, 4, 5, 6, 7, 8}
Intersección: {4, 5}
Diferencia: {1, 2, 3}
Diferencia simétrica: {1, 2, 3, 6, 7, 8}


También es posible interpelar a Python acerca de si un conjunto es un subconjunto de otro, con el operador `<=` (o con el operador `<`, para preguntar si es un subconjunto propio). Igualmente podemos usar los operadores `>` y `>=` para averigüar si un conjunto es un superconjunto o un superconjunto propio de otro:

In [7]:
a = {1, 2, 3, 4, 5, 6,-7}
b = {1, 2, 3}

print("¿Es a un subconjunto de b?", a <= b)
print("¿Es b un subconjunto de a?", b <= a)
print("¿Es a un subconjunto de sí mismo?", a <= a)
print("¿Es a un subconjunto propio de sí mismo?", a < b)

¿Es a un subconjunto de b? False
¿Es b un subconjunto de a? True
¿Es a un subconjunto de sí mismo? True
¿Es a un subconjunto propio de sí mismo? False


### ¡Prueba tú!

Los operadores `<`, `<=`, `>` y `>=` también se pueden usar entre listas. Haz pruebas y trata de explicar cómo funcionan estos operadores cuando trabajan con listas:

In [8]:
lista1 = [1,2,3,4]
lista2 = [1,2]
lista3 = [3,4]
lista4 = []

print(lista2 < lista1)
print(lista2 >= lista1)

# Añade más pruebas:


True
False


---

Además de las operaciones propias de conjuntos, también pueden usarse algunas de las operaciones para secuencias que vimos en el notebook sobre secuencias (a pesar de que los conjuntos **no** son secuencias):

In [9]:
print("Tamaño del conjunto a:", len(a))
print("Suma de elementos de a:", sum(a))
print("Mínimo de a:", min(a))
print("Máximo de a:", max(a))
print("Elementos de a, ordenados:", sorted(a)) # sorted devuelve siempre una lista, aunque le pasemos un conjunto

Tamaño del conjunto a: 7
Suma de elementos de a: 14
Mínimo de a: -7
Máximo de a: 6
Elementos de a, ordenados: [-7, 1, 2, 3, 4, 5, 6]


## 2. Diccionarios <a id="sec_diccionarios"/>

Los **diccionarios** son un tipo contenedor, como lo son las listas o las tuplas. La principal característica que los diferencia de otros tipos contenedor es que los valores contenidos en un diccionario están *indexados* mediante claves. Esto significa que para acceder a un valor contenido en un diccionario, debemos conocer la clave correspondiente, de manera parecida a como para acceder a un elemento concreto de una lista o una tupla necesitamos conocer la posición que ocupa dicho elemento.

A diferencia de las listas y las tuplas, en las que las posiciones que ocupan los elementos están implícitas en la propia definición de la lista, en los diccionarios debemos especificar explícitamente una clave para cada elemento.

Veamos algunos ejemplos de inicialización y acceso a elementos de un diccionario, comparándolo con una tupla:

In [10]:
datos_personales_tupla = ("Miguel", "González Buendía", 24, 1.75, 72.3)
# Acceso al elemento indexado en la posición 0
print(datos_personales_tupla[0])

datos_personales_diccionario = {"nombre": "Miguel", "apellidos": "González Buendía", "edad": 24, "altura": 1.75, "peso": 72.3}
# Acceso al elemento indexado con la clave "nombre"
print(datos_personales_diccionario["nombre"])

Miguel
Miguel


Tal como se ve en el ejemplo, los diccionarios son una alternativa al uso de tuplas para representar información heterogénea sobre algún tipo de entidad. Pero son mucho más potentes que eso, porque tienen importantes diferencias:

* Los diccionarios son **mutables**, lo que significa que podemos añadir o eliminar parejas clave-valor en cualquier momento.
* Los valores pueden ser de cualquier tipo. Incluso pueden ser listas u otros diccionarios.
* Sin embargo, **las claves deben ser obligatoriamente de algún tipo inmutable**. Lo más frecuente es que sean cadenas, números o fechas, o bien tuplas formadas por estos tipos. 

Es frecuente visualizar los diccionarios como una tabla de dos columnas, donde representamos las claves y los valores asociados a dichas claves:

|clave | valor |
|------|-------|
| "nombre" | "Miguel" |
| "apellidos" | "González Buendía" |
| "edad" | 24 |
| "altura" | 1.75 |
| "peso" | 72.3 |

## 2.1. Inicialización de diccionarios <a id="sec_inicializacion"/>

Existen múltiples opciones para inicializar un diccionario. A continuación se muestran distintos ejemplos:

In [11]:
# 1. Diccionario vacío, mediante función dict
diccionario = dict()  
print("1:", diccionario)

# 2. Diccionario vacío, mediante llaves
diccionario = {}      # Diccionario vacío
print("2:", diccionario)

# 3. Mediante una secuencia de tuplas, de dos elementos cada tupla (cada tupla representa una pareja clave-valor)
diccionario = dict([("clave1", "valor1"), ("clave2", "valor2"), ("clave3", "valor3")])
print("3:", diccionario)

# 4. También podemos pasar cada pareja clave-valor como un parámetro por nombre a la función dict.
# En este caso, las claves siempre serán cadenas
diccionario = dict(clave1 = "valor1", clave2 = "valor2", clave3 = "valor3")
print("4:", diccionario)

# 5. Si tenemos las claves y las tuplas en dos secuencias, podemos usar zip
claves = ["clave1", "clave2", "clave3"]
valores = ["valor1", "valor2", "valor3"]
diccionario = dict(zip(claves, valores))
print("5:", diccionario)

# 6. Mediante las llaves, podemos especificar una serie de parejas clave-valor
# Esta es quizás la opción más frecuente cuando se quiere inicializar un diccionario con unos valores conocidos.
diccionario = {"clave1": "valor1", "clave2": "valor2", "clave3": "valor3"}
print("6:", diccionario)


1: {}
2: {}
3: {'clave1': 'valor1', 'clave2': 'valor2', 'clave3': 'valor3'}
4: {'clave1': 'valor1', 'clave2': 'valor2', 'clave3': 'valor3'}
5: {'clave1': 'valor1', 'clave2': 'valor2', 'clave3': 'valor3'}
6: {'clave1': 'valor1', 'clave2': 'valor2', 'clave3': 'valor3'}


Aunque al mostrar los diccionarios las claves y valores asociados aparecen en el mismo orden en que fueron escritos al inicializar el diccionario, dichas parejas clave-valor (también llamadas **items**) no tienen un orden determinado dentro del diccionario. Por tanto, **dos diccionarios serán iguales si tienen las mismas parejas**, independientemente del orden en que fueran insertadas en el diccionario:

In [12]:
diccionario2 = {"clave2": "valor2", "clave3": "valor3", "clave1": "valor1"}
print("¿Son iguales diccionario y diccionario2?", diccionario==diccionario2)

¿Son iguales diccionario y diccionario2? True


En los ejemplos anteriores tanto las claves como los valores son de tipo cadena. Por supuesto, podemos usar otros tipos, tanto para las claves como para los valores (recordando que los tipos de las claves deben ser inmutables, como señalamos antes). Es frecuente que los valores sean a su vez de algún tipo contenedor. Por ejemplo:
```python
# Glosario de un libro, indicando las páginas en las que aparecen distintos conceptos
# Las claves son de tipo cadena y los valores de tipo lista
glosario = {'programación estructurada': [14,15,18,24,85,86], 'funciones': [2,3,4,8,9,10,11,14,15,18], ...}
```

## 2.2. Operaciones con diccionarios <a id="sec_operaciones"/>

Repasaremos en esta sección las operaciones más comunes con diccionarios.

Para **acceder a un valor a partir de una clave**, podemos utilizar los corchetes (de forma parecida a como accedemos a los elementos de una lista) o el método get:

In [13]:
diccionario = {"clave1": "valor1", "clave2": "valor2", "clave3": "valor3"}

# 1. Acceso a un valor a partir de una clave mediante corchetes o mediante método get
print("1. El valor asociado a clave1 es", diccionario["clave1"])
print("1. El valor asociado a clave1 es", diccionario.get("clave1"))


# 2. Si utilizo en los corchetes una clave que no existe en el diccionario, se produce un error
# Descomenta la instrucción de abajo si quieres comprobarlo
# print("2. El valor asociado a clave4 es", diccionario["clave4"])

# 3. Sin embargo, si utilizo el método get con una clave no existente, obtengo un valor por defecto (None):
print("3. El valor asociado a clave4 es", diccionario.get("clave4"))

# 4. Podemos cambiar el valor por defecto que devuelve get cuando no encuentra una clave, mediante un segundo parámetro:
print("4. El valor asociado a clave4 es", diccionario.get("clave4","noexiste"))

1. El valor asociado a clave1 es valor1
1. El valor asociado a clave1 es valor1
3. El valor asociado a clave4 es None
4. El valor asociado a clave4 es noexiste


---
Para **añadir una nueva pareja clave-valor** o **modificar el valor para una clave ya existente** podemos usar una instrucción de asignación, junto con el operador de acceso anterior (los corchetes):

In [14]:
# Inserción de una nueva pareja
diccionario["clave4"] = "valor4"

# Modificación del valor para una clave existente
diccionario["clave1"] = "valor1_modificado"

print(diccionario)

{'clave1': 'valor1_modificado', 'clave2': 'valor2', 'clave3': 'valor3', 'clave4': 'valor4'}


---
Si queremos **volcar toda la información contenida en un diccionario en otro diccionario**, usaremos el método *update*. Debemos tener en cuenta que al hacer esto puede que estemos sobrescribiendo los valores asociados a algunas claves del diccionario que estamos actualizando; esto ocurrirá cuando en el diccionario que estamos volcando haya claves iguales a las claves del diccionario que estamos actualizando:

In [15]:
diccionario2 = {"clave4": "valor4_modificado", "clave5": "valor5", "clave6": "valor6"}

diccionario.update(diccionario2)
print(diccionario)

{'clave1': 'valor1_modificado', 'clave2': 'valor2', 'clave3': 'valor3', 'clave4': 'valor4_modificado', 'clave5': 'valor5', 'clave6': 'valor6'}


---
Si usamos la función predefinida *len* sobre un diccionario, **obtenemos el número de parejas clave-valor que contiene el diccionario**:

In [16]:
print("Número de items que tiene el diccionario:", len(diccionario))

Número de items que tiene el diccionario: 6


---
Para **eliminar una pareja clave-valor**, utilizamos la instrucción *del*:

In [17]:
# Borrado de una pareja clave-valor
del diccionario["clave4"]
print(diccionario)

# Si intento borrar una clave inexistente, obtengo un error
del diccionario["clave4"]

{'clave1': 'valor1_modificado', 'clave2': 'valor2', 'clave3': 'valor3', 'clave5': 'valor5', 'clave6': 'valor6'}


KeyError: 'clave4'

Podemos **borrar todo el contenido de un diccionario**, mediante el método clear:

In [None]:
diccionario.clear()
print(diccionario)

---
En ocasiones necesitaremos realizar alguna tarea utilizando únicamente las claves o los valores de un diccionario. Para **obtener todas las claves o los valores** de un diccionario usaremos los métodos `keys` y `values`:

In [None]:
diccionario = {"clave1": "valor1", "clave2": "valor2", "clave3": "valor3"}
print(diccionario.keys())
print(diccionario.values())

 Las claves o los valores se obtienen encapsulados en un objeto especial. Lo único que debemos saber de estos objetos es que son iterables, es decir, que podemos recorrerlos en un bucle *for* (lo veremos más adelante), o utilizarlos para inicializar una lista, por ejemplo:

In [None]:
print(list(diccionario.keys()))

También podemos **obtener las parejas clave-valor o items**, en forma de tuplas, mediante el método `items`:

In [None]:
print(diccionario.items())

---
Para acabar con las operaciones básicas, podemos consultar la pertenencia de una clave a un diccionario mediante el operador *in*, que puede aparecer combinado con el operador *not*:

In [None]:
if "clave1" in diccionario:
    print("Existe clave1")

if "clave4" not in diccionario:
    print("No existe clave4")

## 2.3. Recorrido de diccionarios <a id="sec_recorrido"/>

Si utilizamos un diccionario en una instrucción ```for ... in ...```, obtendremos en cada iteración una clave del diccionario:

In [None]:
for clave in diccionario:
    print(clave)

Si queremos acceder en cada paso del bucle también al valor correspondiente, podemos hacerlo así:

In [None]:
for clave in diccionario:
    valor = diccionario[clave]
    print(clave, valor)

O usando el método *items*, lo cual queda más compacto y legible:

In [None]:
for clave, valor in diccionario.items():
    print(clave, valor)

Si no necesitamos la información de las claves para el tratamiento que estamos implementando, es posible iterar únicamente sobre los valores:

In [None]:
for valor in diccionario.values():
    print(valor)

## 2.4. Definición de diccionarios por comprensión <a id="sec_definicion"/>

Al igual que con las listas, es posible definir un diccionario por comprensión. La sintaxis es parecida a la de la definición de listas por comprensión, con dos diferencias:
* Se usan las llaves en lugar de los corchetes.
* En donde escribíamos la expresión generadora, ahora debemos escribir dos expresiones, separadas por dos puntos. La primera de ellas indica cómo se generan las claves, y la segunda cómo se generan los valores. 

En el siguiente ejemplo construimos un diccionario a partir de una lista de nombres. Las claves serán cada uno de los nombres de la lista, y el valor asociado será la posición que ocupa ese nombre en la lista, empezando en 1:

In [None]:
nombres = ["Miguel", "Ana", "José María", "Guillermo", "María", "Luisa"]
ranking = {nombre: nombres.index(nombre) + 1 for nombre in nombres}

print(ranking)

{'Miguel': 1, 'Ana': 2, 'José María': 3, 'Guillermo': 4, 'María': 5, 'Luisa': 6}


Este otro ejemplo muestra cómo construir un diccionario que almacene la frecuencia de aparición de cada carácter de un texto de entrada:

In [None]:
texto = "este es un pequeño texto para probar la siguiente definición por comprensión"
# Iteramos sobre set(texto) para no repetir los cálculos varias veces para la misma letra
frecuencias_caracteres = {caracter: texto.count(caracter) for caracter in set(texto) if caracter!=" "}
print(frecuencias_caracteres)

{'t': 4, 'ó': 2, 'o': 5, 'm': 1, 'r': 5, 'e': 10, 'g': 1, 'n': 6, 'q': 1, 'i': 6, 'd': 1, 'c': 2, 'u': 3, 'p': 5, 's': 4, 'ñ': 1, 'a': 4, 'l': 1, 'x': 1, 'b': 1, 'f': 1}


Un último ejemplo, en el que a partir de un texto construimos un diccionario con las palabras indexadas por sus iniciales:

In [None]:
texto = "este es un pequeño texto para probar la siguiente definición por comprensión"
iniciales = {palabra[0] for palabra in texto.split()}
palabras_por_iniciales = {inicial: [palabra for palabra in texto.split() 
                                    if palabra[0]==inicial] 
                          for inicial in iniciales}
print(palabras_por_iniciales)

## 2.5. El tipo _Counter_ <a id="sec_counter"/>

El tipo ```Counter``` es una especialización del tipo diccionario ```dict```, en la que los valores siempre son de tipo entero. Están pensados para representar conteos. 

Supongamos que queremos saber cuántas veces aparecen en una lista cada uno de los elementos que la componen. Este problema se puede resolver con un diccionario, en el que las claves serán los distintos elementos que aparecen en la lista y los valores serán dichos conteos. Dicho diccionario puede crearse de esta forma:

In [None]:
lista = [1, 6, 6, 3, 5, 9, 6, 6, 1, 2, 2, 0, 9, 4, 0]
contador = {}
for elemento in lista:
    contador[elemento] = contador.get(elemento, 0) + 1
print(contador)

# Puedo acceder al conteo de un elemento concreto preguntándole al contador por esa clave
print("¿Cuántas veces aparece el 6?:", contador[6], "veces.")

# Cuidado con preguntar por un elemento que no existía en la lista original
print("¿Cuántas veces aparece el 7?:", contador[7], "veces.")

{1: 2, 6: 4, 3: 1, 5: 1, 9: 2, 2: 2, 0: 2, 4: 1}
¿Cuántas veces aparece el 6?: 4 veces.


KeyError: 7

Este problema aparece frecuentemente de una forma u otra como paso intermedio para resolver muchos algoritmos. Es por ello que ya viene resuelto por el tipo ```Counter```. Observa cómo se utiliza:

In [None]:
from collections import Counter

contador = Counter(lista)
print(contador)

# Puedo acceder al conteo de un valor concreto preguntándole al contador por esa clave
print("¿Cuántas veces aparece el 6?:", contador[6], "veces.")

# A diferencia de los diccionarios, si pregunto por una clave que no existe no obtengo KeyError,
# sino que me devuelve el valor 0
print("¿Cuántas veces aparece el 7?:", contador[7], "veces.")

Counter({6: 4, 1: 2, 9: 2, 2: 2, 0: 2, 3: 1, 5: 1, 4: 1})
¿Cuántas veces aparece el 6?: 4 veces.
¿Cuántas veces aparece el 7?: 0 veces.


Además de ser mucho más sencilla su inicialización, pues se encarga de implementar el algoritmo de conteo, y de permitir la consulta de elementos no observados (devolviéndonos cero en dichos casos), también nos permite actualizar los conteos de manera sencilla. Una opción es actualzar los conteos a partir de nuevas observaciones de elementos:

In [None]:
# Contador vacío
contador = Counter()

# Actualiza los valores del contador a partir de una lista
# (acumula los nuevos conteos)
contador.update(lista)
print(contador)
contador.update([7,8,9])
print(contador)

NameError: name 'Counter' is not defined

Otra opción es actualizar los conteos a partir de otro diccionario con conteos. Fíjate en que no es necesario que este otro diccionario sea un ```Counter```, sino que puede ser un diccionario normal, siempre y cuando cumpla que sus valores sean de tipo entero:

In [None]:
votos_almeria = {'PP':27544, 'PSOE':20435}
votos_sevilla = {'PP':23544, 'PSOE':29435}

contador = Counter(votos_almeria)
contador.update(votos_sevilla)
print(contador)

Counter({'PP': 51088, 'PSOE': 49870})


El código anterior en realidad está "sumando" los conteos expresados en los diccionarios *votos_almeria* y *votos_sevilla*. El tipo ```Counter```también nos permite usar el operador + para realizar la misma tarea:

In [None]:
contador1 = Counter(votos_almeria)
contador2 = Counter(votos_sevilla)
print(contador1+contador2)

Counter({'PP': 51088, 'PSOE': 49870})


La diferencia es que ahora se obtiene un nuevo objeto ```Counter```, cada vez que se realiza la operación +. Por tanto, si necesitamos acumular muchos contadores en un solo, siempre será más eficiente utilizar el método *update*.

El método *most_common* de ```Counter``` devuelve los elementos más frecuentes junto con sus conteos. En el siguiente ejemplo se obtienen las 10 palabras más frecuentes del texto de Alicia en el País de las Maravillas.

In [None]:
import re

with open('alicia.txt', encoding='utf-8') as f:
    texto = f.read()
    contador_palabras = Counter(re.findall(r"\w+",texto))
    print("Los cinco palabras más comunes:",contador_palabras.most_common(10))

Los cinco palabras más comunes: [('de', 1053), ('que', 956), ('la', 893), ('y', 718), ('a', 692), ('el', 683), ('se', 447), ('en', 447), ('Alicia', 431), ('no', 379)]


## 2.6. El tipo _defaultdict_ <a id="sec_defaultdict"/>

En algunas ocasiones, cuando construimos diccionarios que agrupan elementos en colecciones, o que realizan sumas u otros cálculos para grupos de elementos con una misma clave, puede sernos útil el tipo ``defaultdict``. Se trata de una especialización de los diccionarios que se comporta de una forma peculiar cuando se accede a una clave que no existe: en lugar de producirse un error, ``defaultdict`` añade la clave en cuestión al diccionario, asociándole un valor inicial predefinido y devolviendo dicho valor.

La utilidad de esto se ve mejor con un ejemplo. Supongamos que queremos agrupar los nombres de una lista en un diccionario, usando como clave las iniciales de los nombres. Construiremos un diccionario en el que las claves serán cadenas (iniciales) y los valores serán listas de cadenas (los nombres correspondientes a cada inicial):

In [None]:
nombres = ["Miguel", "Ana", "José María", "Guillermo", "María", "Luisa", "Alicia", "Manuel"]

# Agrupemos los nombres anteriores según la inicial
nombres_por_inicial = {}
for nombre in nombres:
    inicial = nombre[0]
    # Si la inicial aún no es una clave del diccionario,
    # añadimos al diccionario una lista vacía.
    # Si no lo hiciéramos, la instrucción de más abajo
    # daría un error al tratar de acceder al valor 
    # asociado a dicha clave.
    if inicial not in nombres_por_inicial:
        nombres_por_inicial[inicial] = []
    
    nombres_por_inicial[inicial].append(nombre)

nombres_por_inicial

{'M': ['Miguel', 'María', 'Manuel'],
 'A': ['Ana', 'Alicia'],
 'J': ['José María'],
 'G': ['Guillermo'],
 'L': ['Luisa']}

Veamos cómo quedaría el mismo código usando ``defaultdict``. Observa que desaparece la instrucción if y la inicialización del valor de la clave con la lista vacía:

In [None]:
from collections import defaultdict

# Al crear defaultdict, le indicamos de qué tipo serán los valores 
#del diccionario
nombres_por_inicial = defaultdict(list)
for nombre in nombres:
    inicial = nombre[0]    
    nombres_por_inicial[inicial].append(nombre)
    
nombres_por_inicial

También podemos usar ``defaultdict`` cuando necesitemos construir un diccionario que acumule sumas. Por ejemplo, supongamos que queremos obtener un diccionario con la suma de las cantidades gastadas por cada persona, a partir de una lista en la que tenemos cada uno de los gastos registrados:

In [None]:
gastos = [("Miguel", 12), ("Ana", 16), ("José", 18.5), ("Miguel", 5.95), ("José", 7.6), ("Miguel", 31)]

gastos_por_persona = defaultdict(float)
for nombre, gasto in gastos:
    gastos_por_persona[nombre] += gasto
    
gastos_por_persona