# Operaciones con diccionarios
**Autor**: Mariano González. **Última modificación:** 17/11/2023

![Image](imagenes/Rios_y_Picos.png)

Vamos a repasar algunas de las operaciones típicas que podemos hacer con diccionarios. Para ello, consideremos la siguiente lista de ríos (fuente: [Wikipedia](https://es.wikipedia.org/wiki/Anexo:R%C3%ADos_m%C3%A1s_largos_de_la_Tierra)). Usaremos namedtuple para poder llamar a cada elemento de la tupla por su nombre.

In [None]:
from collections import namedtuple, Counter

Rio = namedtuple("Rio", "nombre longitud continente")
rios = [Rio("Amazonas", 7062, "América del Sur"), Rio("Nilo", 6853, "África"),
        Rio("Yangtsé", 6300, "Asia"), Rio("Misisipi", 6275, "América del Norte"),
        Rio("Amarillo", 5464, "Asia"), Rio("Mekong", 4880, "Asia"),
        Rio("Congo", 4700, "África"), Rio("Danubio", 2850, "Europa")]

Sobre esta lista realizaremos las siguientes operaciones:

A) Operaciones que construyen un diccionario:
   1. Los valores del diccionario son listas o conjuntos cuyos elementos son las tuplas, o uno o varios campos de las tuplas, que contienen cada clave. En el caso de una lista, puede estar ordenada y recortada.
   2. Los valores del diccionario representan contadores, sumas, medias, porcentajes, máximos o mínimos:
      - a) **Contador**: número de tuplas de la lista que contienen cada clave.
      - b) **Suma**: suma de los valores de un campo, o de una propiedad calculada a partir de un campo, de las tuplas que contienen cada clave.
      - c) **Media**: media de los valores de un campo, o de una propiedad calculada a partir de un campo, de las tuplas que contienen cada clave.
      - d) **Porcentaje**: porcentaje de apariciones de cada clave en la lista de tuplas respecto al número total de tuplas.
      - e) **Máximo/mínimos**: máximo/mínimo del valor de un campo, o de una propiedad calculada a partir de un campo, de las tuplas que contienen cada clave.

B) Operaciones que calculan un resultado a partir de un diccionario intermedio:
   1. Máximo (mínimo): clave a la que le corresponde un mayor (menor) valor en el diccionario.
   2. Lista de claves ordenadas respecto a sus valores en el diccionario.

C) Cálculo de un diccionario inverso

## A) Operaciones que construyen un diccionario

### 1. Diccionario con valores de un tipo contenedor

En estos diccionarios, los valores son listas, conjuntos o incluso diccionarios. Por ejemplo, vamos a crear un diccionario que relacione los continentes con los ríos que están en ese continente. Para ello se recorre la lista de ríos. Para cada río se obtiene el continente, que será la clave del diccionario. A continuación se pueden dar dos casos, según la clave se encuentre o no en el diccionario. Si no se encuentra, se crea una nueva pareja del diccionario con el continente y el río; si ya se encuentra, se añade el nuevo río a la lista de ríos que ya están asociados a ese continente. El código quedaría así:

In [None]:
rios_por_continente = dict()
for r in rios:
    continente = r.continente
    if continente in rios_por_continente:
        rios_por_continente[continente].append(r)
    else:
        rios_por_continente[continente] = [r]

print(rios_por_continente)

![Image](imagenes/A1a.png)

Los elementos de las listas no tienen por qué ser las tuplas de la lista original. Pueden ser una parte de la tupla o incluso un solo elemento de ella. Por ejemplo, el siguiente diccionario relaciona cada continente con los nombres de los ríos de ese continente:

In [None]:
nombres_rios_por_continente = dict()
for r in rios:
    continente = r.continente
    if continente in nombres_rios_por_continente:
        nombres_rios_por_continente[continente].append(r.nombre)
    else:
        nombres_rios_por_continente[continente] = [r.nombre]

print(nombres_rios_por_continente)

![Image](imagenes/A1b.png)

En ocasiones puede interesarnos que la lista de valores esté ordenada, e incluso recortada. Por ejemplo, queremos relacionar cada continente con los nombres de los N ríos más largos del continente, ordenados de mayor a menor longitud.

Para ello, vamos a crear un nuevo diccionario a partir del diccionario `rios_por_continente`. Recorremos el diccionario y, para cada continente, obtenemos su lista de ríos, la ordenamos, la recortamos a N valores y nos quedamos con el nombre, y luego la almacenamos en el nuevo diccionario.

In [None]:
nombres_rios_mas_largos_por_continente = dict()
n = 2
for continente, lista_rios in rios_por_continente.items():
    rios_mas_largos = sorted(lista_rios, key=lambda r:r.longitud, reverse=True)[:n]
    nombres_rios_mas_largos = [r.nombre for r in rios_mas_largos]
    nombres_rios_mas_largos_por_continente[continente] = nombres_rios_mas_largos
    
print(nombres_rios_mas_largos_por_continente)

![Image](imagenes/A1c.png)

### 2. Diccionarios con valores que representan contadores, sumas, medias, porcentajes, máximos o mínimos

Estos diccionarios se utilizan para realizar cálculos sobre los valores de un campo de la tupla. Por ejemplo, el número de veces que se repite cada valor de un campo de la tupla, o la media de los valores de un campo numérico de la tupla.

### a) Diccionarios contadores

La aplicación más típica de estos diccionarios es contar el número de veces que aparece cada valor diferente de un campo determinado de la tupla. Por ejemplo, vamos a crear un diccionario que relacione los continentes con el número de ríos que hay en cada continente. Para ello recorremos los ríos y obtenemos el continente, que será la clave. Si el continente no existe en el diccionario, se inicializa el número de ríos del continente con el valor 1, y si ya existe se incrementa el número de ríos del continente en 1.

In [None]:
numero_rios_por_continente = dict()
for r in rios:
    continente = r.continente
    if continente in numero_rios_por_continente:
        numero_rios_por_continente[continente] += 1
    else:
        numero_rios_por_continente[continente] = 1

print(numero_rios_por_continente)

![Image](imagenes/A2a.png)

Podemos simplificar este código usando la función *get* con un segundo parámetro, que será el valor asociado a la clave si esta no se encuentra en el diccionario. Esto nos permite eliminar la estructura selectiva *if* dentro del bucle:

In [None]:
numero_rios_por_continente = dict()
for r in rios:
    numero_rios_por_continente[r.continente] = numero_rios_por_continente.get(r.continente, 0) + 1

print(numero_rios_por_continente)

Aún podemos hacerlo de una forma más simple si utilizamos el tipo **Counter**, definido en el módulo *collections* de Python. Veamos cómo funciona con un ejemplo sencillo:

In [None]:
nombres = ["Ana", "Luis", "Juan", "Eva", "Ana", "Antonio", "Luis", "Ana", "Juan"]
frecuencia_nombres = Counter(nombres)
print(frecuencia_nombres)
print(dict(frecuencia_nombres))

Como se aprecia, lo que hace *Counter* es 'contar' el número de veces que aparece cada elemento en la lista y crear un diccionario con estos contadores. Si volvemos al caso de los ríos, podemos obtener el mismo diccionario aplicando *Counter* a una lista en la cual aparezcan los nombres de los continentes:

In [None]:
numero_rios_por_continente = Counter(r.continente for r in rios)
print(numero_rios_por_continente)

### b) Diccionarios con valores que representan sumas

Aparte de estos diccionarios contadores, podemos tener diccionarios en los que los valores representen sumas de propiedades numéricas. Por ejemplo, un diccionario que relacione cada continente con la suma de las longitudes de todos los ríos del continente.

In [None]:
longitud_total_por_continente = dict()
for r in rios:
    continente = r.continente
    if continente in longitud_total_por_continente:
        longitud_total_por_continente[continente] += r.longitud
    else:
        longitud_total_por_continente[continente] = r.longitud

print(longitud_total_por_continente)

![Image](imagenes/A2b.png)

### c) Diccionarios con valores que representan medias

También podemos construir diccionarios cuyos valores representen valores medios de propiedades numéricas. Por ejemplo, un diccionario que relacione cada continente con la longitud media de los ríos del continente. Para ello, recorremos el diccionario de sumas y dividimos la suma de las longitudes de los ríos de cada continente entre el número de ríos del continente, dato que tenemos en el diccionario contador.

In [None]:
longitud_media_por_continente = dict()
for continente, longitud_total in longitud_total_por_continente.items():
    numero_rios_continente = numero_rios_por_continente[continente]
    longitud_media_por_continente[continente] = longitud_total / numero_rios_continente
    
print(longitud_media_por_continente)

![Image](imagenes/A2c.png)

### d) Diccionarios con valores que representan máximos o mínimos

En este caso, nos interesa que los valores del diccionario sean máximos y mínimos sobre los valores de un campo de la tupla. Por ejemplo, veamos cómo crear un diccionario que relacione cada continente con el río más largo del continente.

Para ello partimos del diccionario creado más arriba que relaciona los continentes con la lista de ríos del continente. Recorremos este diccionario, calculando para cada continente cuál de los ríos de ese continente tiene mayor longitud, y añadimos la pareja formada por el continente y el nombre de este río a un nuevo diccionario que vamos construyendo:

In [None]:
rio_mas_largo_por_continente = dict()
for continente, lista_rios in rios_por_continente.items():
    rio_mas_largo = max(lista_rios, key=lambda r:r.longitud)
    rio_mas_largo_por_continente[continente] = rio_mas_largo.nombre
    
print(rio_mas_largo_por_continente)

![Image](imagenes/A2d.png)

### e) Diccionarios con valores que representan porcentajes

Veamos, por último, el caso de un diccionario que relacione cada continente con el porcentaje del total de ríos que se encuentran en ese continente.

Para ello partimos del diccionario que relaciona cada continente con el número de ríos del continente. Recorremos este diccionario y, para cada continente, dividimos su número de ríos entre el número total de ríos, que habremos calculado previamente.

In [None]:
porcentaje_rios_por_continente = dict()
numero_total_rios = len(rios)

for continente, numero_rios_continente in numero_rios_por_continente.items():
    porcentaje_rios_por_continente[continente] = numero_rios_continente / numero_total_rios * 100
    
print(porcentaje_rios_por_continente)

![Image](imagenes/A2e.png)

## B) Operaciones que calculan un resultado a partir de un diccionario intermedio

En ocasiones, la creación del diccionario es un paso intermedio para hacer un cálculo posterior, como puede ser obtener un máximo o un mínimo, o una lista de valores ordenada y recortada.

### 1. Obtener un máximo o mínimo a partir de un diccionario

Supongamos que queremos obtener el continente con un mayor número de ríos. Resulta fácil calcularlo si disponemos del diccionario que relaciona cada continente con el número de ríos que hay en el continente. Aplicamos la función *max* a este diccionario, indicando mediante el parámetro *key* que queremos calcular el máximo según el valor del diccionario, y no la clave. Lo hacemos así:

In [None]:
continente = max(numero_rios_por_continente, key=numero_rios_por_continente.get)
print(continente)

![Image](imagenes/B1.png)

De esta forma obtenemos el nombre del continente. Si queremos obtener también el número de ríos, aplicamos la función *max* a las parejas del diccionario obtenidas mediante la función *items*, indicando que queremos calcular el máximo según el segundo elemento de la pareja:

In [None]:
continente = max(numero_rios_por_continente.items(), key=lambda r:r[1])
print(continente)

### 2. Obtener una lista de claves ordenadas respecto a sus valores

Supongamos ahora que queremos obtener los N continentes con mayor número de ríos, ordenados de mayor a menor número. Lo podemos hacer igualmente a partir del diccionario que relaciona cada continente con su número de ríos, aplicando en este caso la función *sorted* para crear una lista con las claves del diccionario ordenadas según sus valores:

In [None]:
n = 2
continentes = sorted(numero_rios_por_continente, key=numero_rios_por_continente.get, reverse=True)
print(continentes[:n])

![Image](imagenes/B2.png)

Si queremos obtener una lista con el nombre del continente y su número de ríos, aplicamos la función *sorted* a las parejas del diccionario, indicando que queremos ordenar según el segundo elemento de la pareja:

In [None]:
n = 2
continentes = sorted(numero_rios_por_continente.items(), key=lambda t:t[1], reverse=True)[:n]
print(continentes)

## C) Cálculo de un diccionario inverso

A veces nos interesa obtener un diccionario a partir de otro, de forma que las claves pasen a ser los valores y los valores pasen a ser las claves. Es lo que se conoce como un diccionario inverso. Por ejemplo, a partir de un diccionario que relaciona cada continente con el número de ríos que hay en el continente, vamos a obtener un diccionario inverso que relaciona cada número con los continentes que tienen ese número de ríos. Para ello recorremos el diccionario original, y para cada pareja creamos otra pareja en el diccionario nuevo, en el que se intercambian la clave y el valor:

In [None]:
continentes_por_numero_rios = dict()

for continente, numero_rios in numero_rios_por_continente.items():
    continentes_por_numero_rios[numero_rios] = continente

print(continentes_por_numero_rios)

![Image](imagenes/Inverso1.png)

Este algoritmo tiene un problema: como hay varios continentes con el mismo número de ríos (es el caso de Europa, América del Norte y América del Sur), y las claves no pueden repetirse, solo aparece uno de los continentes asociado a ese valor de la clave, y perdemos los otros continentes.

¿Qué podemos hacer para evitarlo? Puesto que puede haber más de un valor con la misma clave (es decir, más de un continente con el mismo número de ríos), lo que hacemos es asociar a cada clave (número de ríos) una lista de valores (nombres de continentes con ese número de ríos). El algoritmo quedaría entonces así:

In [None]:
continentes_por_numero_rios = dict()

for continente, numero_rios in numero_rios_por_continente.items():
    if numero_rios in continentes_por_numero_rios:
        continentes_por_numero_rios[numero_rios].append(continente)
    else:
        continentes_por_numero_rios[numero_rios] = [continente]            

print(continentes_por_numero_rios)

![Image](imagenes/Inverso2.png)

## Ejercicio

Ahora te toca a ti poner en práctica las ideas anteriores. Para ello trabajarás con la siguiente lista:

In [None]:
Pico = namedtuple("Pico", "nombre altitud provincia")
picos = [Pico("Mulhacén", 3479, "Granada"), Pico("Torreón", 1648, "Cádiz"),
         Pico("Peña Santa", 2596, "León"), Pico("Naranjo", 2519, "Asturias"),
         Pico("Alcazaba", 3371, "Granada"), Pico("Veleta", 3396, "Granada"),
         Pico("Torrecilla", 1919, "Málaga"), Pico("Llambrión", 2647, "León"),
         Pico("Teide", 3718, "Santa Cruz de Tenerife"), Pico("Aljibe", 1091, "Cádiz"),
         Pico("Aneto", 3404, "Granada"), Pico("Peña Ubiña", 2417, "León")]

Realiza las siguientes operaciones sobre esta lista:

### 1. Obtener un diccionario que relacione cada provincia con los picos de dicha provincia
Resultado esperado: {'Granada': [Pico(nombre='Mulhacén', altitud=3479, provincia='Granada'), Pico(nombre='Alcazaba', altitud=3371, provincia='Granada'), Pico(nombre='Veleta', altitud=3396, provincia='Granada'), Pico(nombre='Aneto', altitud=3404, provincia='Granada')], 'Cádiz': [Pico(nombre='Torreón', altitud=1648, provincia='Cádiz'), Pico(nombre='Aljibe', altitud=1091, provincia='Cádiz')], 'León': [Pico(nombre='Peña Santa', altitud=2596, provincia='León'), Pico(nombre='Llambrión', altitud=2647, provincia='León'), Pico(nombre='Peña Ubiña', altitud=2417, provincia='León')], 'Asturias': [Pico(nombre='Naranjo', altitud=2519, provincia='Asturias')], 'Málaga': [Pico(nombre='Torrecilla', altitud=1919, provincia='Málaga')], 'Santa Cruz de Tenerife': [Pico(nombre='Teide', altitud=3718, provincia='Santa Cruz de Tenerife')]}

### 2. Obtener un diccionario que relacione cada provincia con las altitudes de los 3 picos de mayor altitud de la provincia, de mayor a menor altitud
Resultado esperado: {'Granada': [3479, 3404, 3396], 'Cádiz': [1648, 1091], 'León': [2647, 2596, 2417], 'Asturias': [2519], 'Málaga': [1919], 'Santa Cruz de Tenerife': [3718]}

### 3. Obtener un diccionario que relacione cada provincia con el número de picos de dicha provincia
Resultado esperado: {'Granada': 4, 'Cádiz': 2, 'León': 3, 'Asturias': 1, 'Málaga': 1, 'Santa Cruz de Tenerife': 1}

### 4. Obtener el número de picos por provincia, usando el tipo Counter
Resultado esperado: Counter({'Granada': 4, 'León': 3, 'Cádiz': 2, 'Asturias': 1, 'Málaga': 1, 'Santa Cruz de Tenerife': 1})

### 5. Obtener un diccionario que relacione cada provincia con la suma de altitudes de los picos de dicha provincia
Resultado esperado: {'Granada': 13650, 'Cádiz': 2739, 'León': 7660, 'Asturias': 2519, 'Málaga': 1919, 'Santa Cruz de Tenerife': 3718}

### 6. Obtener un diccionario que relacione cada provincia con la altitud media de los picos de dicha provincia
Resultado esperado: {'Granada': 3412.5, 'Cádiz': 1369.5, 'León': 2553.3333333333335, 'Asturias': 2519.0, 'Málaga': 1919.0, 'Santa Cruz de Tenerife': 3718.0}

### 7. Obtener un diccionario que relacione cada provincia con el pico de mayor altitud de la provincia
Resultado esperado: {'Granada': Pico(nombre='Mulhacén', altitud=3479, provincia='Granada'), 'Cádiz': Pico(nombre='Torreón', altitud=1648, provincia='Cádiz'), 'León': Pico(nombre='Llambrión', altitud=2647, provincia='León'), 'Asturias': Pico(nombre='Naranjo', altitud=2519, provincia='Asturias'), 'Málaga': Pico(nombre='Torrecilla', altitud=1919, provincia='Málaga'), 'Santa Cruz de Tenerife': Pico(nombre='Teide', altitud=3718, provincia='Santa Cruz de Tenerife')}

### 8. Obtener un diccionario que relacione cada provincia con el porcentaje de picos de la provincia respecto al número total de picos
Resultado esperado: {'Granada': 33.33333333333333, 'Cádiz': 16.666666666666664, 'León': 25.0, 'Asturias': 8.333333333333332, 'Málaga': 8.333333333333332, 'Santa Cruz de Tenerife': 8.333333333333332}

### 9. Obtener la provincia con mayor número de picos
Resultado esperado: ('Granada', 4)

### 10. Obtener las dos provincias con mayor número de picos, ordenadas de mayor a menor número de picos
Resultado esperado: [('Granada', 4), ('León', 3)]

### 11. Obtener un diccionario que relacione número de picos con provincias, a partir de otro que relaciona cada provincia con su número de picos
Resultado esperado: {4: ['Granada'], 2: ['Cádiz'], 3: ['León'], 1: ['Asturias', 'Málaga', 'Santa Cruz de Tenerife']}