# Unidad 11 - Diccionarios

## Necesidad de los diccionarios

Supongamos que queremos representar en Python el menú de una cafetería:

| Bebida         | Precio |
|----------------|--------|
| Americano      | 3000   |
| Iced Americano | 3500   |
| Cappuccino     | 4000   |
| Cafe Latte     | 4500   |
| Espresso       | 3600   |


Como vimos en la unidad anterior, debemos evitar el uso de variables disgregadas para representar cada valor (`cafe_1`, `precio_1`, ...). Es preferible utilizar una estructura de datos o colección que represente todo el menú de forma global. Una posibilidad es utilizar dos listas:

In [1]:
cafes =   ["Americano", "Iced Americano", "Capuccino", "Cafe Latte", "Espresso"]
precios = [ 3000,        3500,             4000,        4500,         3600]

Esta solución presenta varios problemas:
- hay que mantener ambas listas _"sincronizadas"_: por ejemplo, si añadimos un café en la tercera posición de `cafes`, debemos añadir su precio exactamente en la tercera posición de `precios`
- hay que recorrer la lista `cafes` para saber el precio de un café: debemos localizar la posición del café y consultar dicha posición en la lista `precios`; esto tiene un coste lineal $O(n)$

Necesitamos una estructura de datos o colección que:
- nos libere de la necesidad de mantener la _"sincronización"_
- nos permita consultar de forma cómoda y eficiente el precio de un café

Tal estructura se llama **diccionario**, a veces también recibe los nombres de **aplicación**, **asociación** o **memoria asociativa**.

**Nota:** En algunos lenguajes (por ejemplo, Java) esta estructura se llama **map**.

## Definición de diccionario

Un **diccionario** es un conjunto de pares. Cada par tiene dos componentes: al primero lo llamamos **clave** y al segundo **valor**. Los pares suelen representarse como $k:v$, donde $k$ es la clave y $v$ es el valor.

No todo conjunto de pares $k:v$ es un diccionario válido: es necesario que **las claves no estén repetidas**. Por ejemplo, el siguiente conjunto de pares es un diccionario:

$$
\{ 1:10,\ 2:20,\ 3:30 \} 
$$

pero el siguiente conjunto de pares no es un dicionario, pues repite la clave $1$:

$$
\{ 1:10,\ 2:20,\ 1:40,\ 3:30 \} 
$$

Observa que los valores sí pueden estar repetidos:

$$
\{ 1:10,\ 2:20,\ 3:30,\ 4:10,\ 5:20,\ 6:30 \} 
$$

Si un diccionario contiene el par $k:v$, se dice que la clave $k$ tiene **asociado** el valor $v$. Por ejemplo, en el diccionario:

$$
\{ 1:10,\ 2:20,\ 3:30 \} 
$$

la clave $2$ tiene asociado el valor $20$. Como no puede haber claves repetidas, una clave puede tener asociado **como mucho un valor**. Esta característica es importante: dada una clave, podemos determinar el único valor que le corresponde.

Podemos representar el menú de la cafetería por el siguiente diccionario:

$$
\{ \mathrm{Americano}:30000,\ \mathrm{Iced\ Americano}:3500,\ 
   \mathrm{Cappuccino}:4000,\ \mathrm{Caffe\ Latte}:4500,\
   \mathrm{Espresso}:3600 \} 
$$

de manera que cada tipo de café (clave) tenga asociado su precio (valor).

## El tipo diccionario

El tipo diccionario es una colección o estructura de datos Python que permite asociar claves y valores, y acceder a los valores a través de las claves. Para determinar el valor que corresponde a una clave, es necesario que las claves no se repitan.

Un literal de diccionario tiene la siguiente sintaxis:

```python
      {k_0:v_0, k_1:v_1, k_2:v_2  ..., k_n:v_n}
```

Es decir, aparecen los pares `clave:valor` que contiene el diccionario, separados por comas y encerrados entre llaves:

In [2]:
edades = { "juan" : 12, "sonia" : 16, "luis" : 14, "elena" : 12 }
edades

{'juan': 12, 'sonia': 16, 'luis': 14, 'elena': 12}

Podemos crear un diccionario vacío:

In [3]:
diccionario_vacio = {}
diccionario_vacio

{}

El tipo de las claves está limitado: las claves deben ser de tipos inmutables (`int` ,`float`, `str`,...). El tipo de los valores no está limitado:

In [4]:
valido = { 3.1416 : "pi", 5 : "cinco", "uno" : "one", True : "cierto", "primos" : [2,3,5,7] }
valido

{3.1416: 'pi',
 5: 'cinco',
 'uno': 'one',
 True: 'cierto',
 'primos': [2, 3, 5, 7]}

Observa que podemos usar listas como valores, pero no como claves (las listas son mutables):

In [5]:
no_valido = { 1 : "one", [2,3,5,7] : "primos" }

TypeError: unhashable type: 'list'

El tipo de los diccionarios se llama `dict`, y no refleja ni los tipos de las claves ni los tipos de los valores:

In [6]:
print(type(edades))
print(type(valido))

<class 'dict'>
<class 'dict'>


### Indexación de diccionarios

Una característica esencial de los diccionarios es que, dada una clave, podemos determinar el único valor que tiene asociado. Para ello, utilizamos la indexación por clave (similar a la indexación por posición en listas y otras secuencias):

```python
   diccionario[clave]
```

In [7]:
print(edades)
edades["elena"]

{'juan': 12, 'sonia': 16, 'luis': 14, 'elena': 12}


12

In [8]:
print(valido)
valido["PRIMOS".lower()]

{3.1416: 'pi', 5: 'cinco', 'uno': 'one', True: 'cierto', 'primos': [2, 3, 5, 7]}


[2, 3, 5, 7]

Si usamos una clave que no está presente en el `diccionario`; obtendremos un error de indexación `KeyError`:

In [9]:
edades["nuria"]

KeyError: 'nuria'

## Los diccionarios son mutables

Al igual que las listas, los diccionarios son mutables. Podemos añadir nuevos pares `k:v`, o bien modificar el valor asociado a una clave `k`. La sintaxis es similar a la que empleamos con las listas:

```python
   diccionario[clave] = valor
```

La anterior sentencia tiene uno de los siguientes efectos:
- si la `clave` no está presente en el `diccionario`, se añade el par `clave:valor`
- si la `clave` está presente en el `diccionario`, se modifica el `valor` asociado

In [10]:
print(edades)
edades["sonia"] = 11
edades

{'juan': 12, 'sonia': 16, 'luis': 14, 'elena': 12}


{'juan': 12, 'sonia': 11, 'luis': 14, 'elena': 12}

In [11]:
print(edades)
edades["juan"] = edades["juan"] + 1
edades

{'juan': 12, 'sonia': 11, 'luis': 14, 'elena': 12}


{'juan': 13, 'sonia': 11, 'luis': 14, 'elena': 12}

In [41]:
print(edades)
edades["manuel"] = 17
edades["patricia"] = 19
edades

{'juan': 13, 'sonia': 11, 'luis': 14, 'elena': 12}


{'juan': 13,
 'sonia': 11,
 'luis': 14,
 'elena': 12,
 'manuel': 17,
 'patricia': 19}

## Eliminación de claves en diccionarios

Para eliminar un par `clave:valor` del diccionario, debemos utilizar la sentencia `del`:

```python
   del diccionario[clave]
```

Si la `clave` está en el `diccionario`, se elimina el par `clave:valor`, de lo contrario obtenemos un `KeyError`:

In [12]:
print(edades)
del edades["manuel"]
edades

{'juan': 13, 'sonia': 11, 'luis': 14, 'elena': 12}


KeyError: 'manuel'

In [13]:
print(edades)
del edades["maria"]

{'juan': 13, 'sonia': 11, 'luis': 14, 'elena': 12}


KeyError: 'maria'

**Nota:** La sentencia `del` (de _delete_) puede utilizarse también para eliminar elementos de listas (por posición) o, incluso, para borrar variable completas.

In [14]:
lista = list(range(6))
print(lista)
del lista[3] #elimina el 3
lista

[0, 1, 2, 3, 4, 5]


[0, 1, 2, 4, 5]

In [15]:
nueva_variable = "nueva"
nueva_variable

'nueva'

In [16]:
del nueva_variable
nueva_variable

NameError: name 'nueva_variable' is not defined

## Operadores y funciones sobre diccionarios

Los diccionarios soportan lo siguientes operadores:

| Operador     | Significado   |
|--------------|---------------|
|    `d[k]`    | indexación    |
|  `k in s`    | pertenencia   |
| `k not in s` | no pertenencia|
|  `d1 == d2`  | igualdad      |
|  `d1 != d2`  | desigualdad   |

Además, los diccionarios soportan la función `len()`.

In [17]:
print(edades)
print("sonia" in edades)
print("marina" in edades)
print("cristina" not in edades)

{'juan': 13, 'sonia': 11, 'luis': 14, 'elena': 12}
True
False
True


In [18]:
edades != edades

False

Al comparar los diccionarios, el orden en que aparecen los pares no es relevante (son un _conjunto_ de pares):

In [19]:
{"mes" : "junio", "dia": 29} == {"dia": 29, "mes" : "junio"}

True

In [21]:
len(edades)

4

## Métodos sobre diccionarios

Los diccionarios soportan, entre otros, los siguientes métodos:

| Método      | Significado                                               |
|-------------|---------------------------------------|
| `d.clear()` | borra todos los pares del diccionario |
| `d.pop(k)`  | elimina la clave `k` `i` de `d`       |


In [22]:
english_spanish = {"one": "uno", "two": "dos", "three": "tres", 
                   "four": "cuatro", "five": "cinco"}

print(english_spanish)
print(english_spanish.pop("three"))
print(english_spanish)

{'one': 'uno', 'two': 'dos', 'three': 'tres', 'four': 'cuatro', 'five': 'cinco'}
tres
{'one': 'uno', 'two': 'dos', 'four': 'cuatro', 'five': 'cinco'}


In [23]:
print(english_spanish)
english_spanish.clear()
print(english_spanish)

{'one': 'uno', 'two': 'dos', 'four': 'cuatro', 'five': 'cinco'}
{}


## Iteración básica sobre diccionarios

Podemos usar un diccionario como fuente de datos en un bucle `for`. En tal caso, la variable de control tomará sucesivamente los valores de las claves del diccionario:

In [24]:
print(edades)
print()

for nombre in edades:
    print("{:5} tiene {:2d} años".format(nombre, edades[nombre]))

{'juan': 13, 'sonia': 11, 'luis': 14, 'elena': 12}

juan  tiene 13 años
sonia tiene 11 años
luis  tiene 14 años
elena tiene 12 años


## Formato JSON para intercambio de datos

JSON (JavaScript Object Notation) es una notación que permite representar textualmente un valor estructurado. La representación del valor es universal, independiente del lenguaje de programación, sistema operativo o arquitectura. Esto permite transmitir información entre diferentes sistemas conectados a la Web.

El siguiente es un valor estructurado representado en formato JSON:

```
{
"Name" : "David Doe",
"Age" : 25,
"Hobby": ["basketball", "python programming"],
"Family" : {"father" : "John Doe",
            "mother" : "Mary Doe"
           },
"Married": true 
}
```

## JSON en Python

Para poder trabajar con datos en formato JSON debemos importar el módulo `json`:

In [25]:
import json

El método `loads(json_str)` devuelve un diccionario Python creado a partir de una cadena `json_str` que contiene
un dato estructurado en formato JSON:

In [26]:
cadena_json = '{"Name": "David Doe", "Age": 25, "Hobby": ["basketball", "python programming"],\
"Family": {"father": "John Doe", "mother": "Mary Doe"}, "Married": true }'

diccionario_python = json.loads(cadena_json)

print(type(diccionario_python))
print(diccionario_python)

<class 'dict'>
{'Name': 'David Doe', 'Age': 25, 'Hobby': ['basketball', 'python programming'], 'Family': {'father': 'John Doe', 'mother': 'Mary Doe'}, 'Married': True}


In [27]:
diccionario_python["Age"] = 50
diccionario_python["Married"] = False
print(diccionario_python)
print(diccionario_python["Hobby"][1])
print(diccionario_python["Family"]["mother"])
print(diccionario_python["Family"]["mother"][0])

{'Name': 'David Doe', 'Age': 50, 'Hobby': ['basketball', 'python programming'], 'Family': {'father': 'John Doe', 'mother': 'Mary Doe'}, 'Married': False}
python programming
Mary Doe
M


El método `json.dump(python_dic, filename, indent='\t')` almacena un diccionario Python en el fichero `filename`, utilizando tabuladores (`\t`) para sangrar el documento JSON. El fichero `filename` tiene que haber sido abierto (`open`) en modo escritura (`w`) previamente (lo estudiaremos en la Unidad 13).

In [None]:
with open("datos.json", 'w') as file:  # abre el fichero "datos.json" en modo escritura ('w')
    json.dump(diccionario_python, file, indent='    ')

La sentencia anterior debe haber creado el fichero `datos.json` en el directorio actual. Puedes abrir el fichero desde Jupyter para ver su contenido.

## El método `format`

Ya hemos visto que el método `format` permite asociar un formato a cada valor que queremos mostrar por pantalla:

In [28]:
pi = 3.141592653589793
print("{:6.4f}".format(pi)) #F ES FLOAT Y 4 SON LOS DECIMALES

3.1416


Hasta ahora hemos emparejado cada especificación de formato `{}` con el correspondiente dato facilitado en los argumentos de `format`:

In [29]:
print("I like {} and {}".format("python", "java")) #para meter palabras entre medias

I like python and java


Es posible indicar en cada especificación de formato a qué argumento se refiere; basta indicar la posición del argumento (se numeran desde cero):

In [30]:
print("I like {0} and {1}".format("python", "java"))
print("I like {1} and {0}".format("python", "java"))

I like python and java
I like java and python


Este índice de argumento se puede combinar con la especificación de formato propiamente dicha:

In [32]:
print("pi con dos decimales es {0:4.2f}, y con 6 decimales es {0:8.6f}".format(pi))

pi con dos decimales es 3.14, y con 6 decimales es 3.141593


## Solución del primer ejercicio de paper coding (128)

In [33]:
capital_dic = { "Korea" : "Seoul", 
                "China" : "Beijing", 
                "USA" : "Washington DC" }

capital_dic["Korea"]

'Seoul'

## Solución del segundo ejercicio de paper coding (129)

In [34]:
fruits_dic = {
    'apple': 5000,
    'banana': 4000,
    'grape': 5300,
    'melon': 6500,
}

for i, j in fruits_dic.items():  #es como hacer dos for
    print(f"The price of {i} is {j} KRW") #la f de delante es un formato para no tener que ir poniendo , para i y j

The price of apple is 5000 KRW
The price of banana is 4000 KRW
The price of grape is 5300 KRW
The price of melon is 6500 KRW


In [35]:
#otra opción    
fruits_dic = {"apple" : 5000 , "banana" : 4000 , "grape" : 5300 , "melon" : 6500}

for fruta in fruits_dic:
    print("key: {:8}".format(fruta), end = "\t")
print()

for fruta in fruits_dic:
     print("value: {:4}".format(fruits_dic[fruta]), end = "\t")

key: apple   	key: banana  	key: grape   	key: melon   	
value: 5000	value: 4000	value: 5300	value: 6500	

## Solución del ejercicio de pair programming (147)

In [36]:
fruits_dic = {"apple" : 6000 , "melon" : 3000 , "banana" : 5000 , "orange" : 4000 }
list_keys = list(fruits_dic)
print("dict_keys(", list_keys, ")", sep = "")

lista_busqueda = ["apple", "mango"]

for busqueda in lista_busqueda:
    if busqueda in fruits_dic:
        print(busqueda, "está en fruits_dic")
    else:
         print(busqueda, "no está en fruits_dic")

dict_keys(['apple', 'melon', 'banana', 'orange'])
apple está en fruits_dic
mango no está en fruits_dic


## Ejercicio extra

Dada una cadena, calcula una tabla de frecuencias absolutas de sus caracteres; es decir, una tabla que indique cuántas veces aparece cada carácter en la cadena.

**Sugerencia:** Utiliza un diccionario para representar la tabla de frecuencias. Las claves del diccionario serán los caracteres y los valores un entero positivo con el número de apariciones (por ejemplo, `"a":5` significa que la `a` aparece 5 veces en la cadena).

In [37]:
# cadena = "hola que tal como estas"
cadena = "aaabbbc aabdz"

# Hay que hacer un diccionario para guardar las letras y la frecuencia con {}
# Creamos un diccionario vacio en el que van a ir las letras: el numero de veces
# que aparece cada letra

frecuencia = {}

# tabla de frecuencias absolutas
# creamos un bucle para ir recorriendo la cadena
# Vamos guardando con el for los datos en el diccionario

for i in cadena:
    if i in frecuencia:
        # si el valor i (cada una de las letras de cadena) 
        # ya esta guardado en la cadena añade un valor
        frecuencia[i] = frecuencia[i] + 1
    else:
        #si no esta guardado el valor se queda a uno
        frecuencia[i] = 1

print(frecuencia)

{'a': 5, 'b': 4, 'c': 1, ' ': 1, 'd': 1, 'z': 1}


In [39]:
cadena = input("Ponga una cadena: ")

tabla_frecuencias_abs = {}

for caracter in cadena:
    if not caracter in tabla_frecuencias_abs:
        tabla_frecuencias_abs[caracter] = 1
    else:
        tabla_frecuencias_abs[caracter] += 1
    
print(tabla_frecuencias_abs)

Ponga una cadena: 2,4,6,8
{'2': 1, ',': 3, '4': 1, '6': 1, '8': 1}


## Solución del mission problem (95)

In [40]:
menu = {"Americano" : 3000, 
        "Iced Americano" : 3500, 
        "Capuccino" : 4000, 
        "Cafe Latte" : 4500, 
        "Espresso" : 3600}

print("Welcome to David's cafeteria")
choice = ""
while choice not in menu:

    print("\n{:10}\t{}".format("Cafe", "Price"))
    for cafe in menu:
        print("{:10}\t{}".format(cafe, menu[cafe]))
    
    choice = input("please, enter your choice: ")
    
    if choice not in menu:
        print("Sorry, we do not serve", choice)

# choice in menu
        
print("You selected", choice, "Good choice!")
print("Pease insert", menu[choice], "wons and enjoy")

Welcome to David's cafeteria

Cafe      	Price
Americano 	3000
Iced Americano	3500
Capuccino 	4000
Cafe Latte	4500
Espresso  	3600
please, enter your choice: 6
Sorry, we do not serve 6

Cafe      	Price
Americano 	3000
Iced Americano	3500
Capuccino 	4000
Cafe Latte	4500
Espresso  	3600


KeyboardInterrupt: Interrupted by user