# Unidad 11 - Diccionarios

## Necesidad de los diccionarios

Supongamos que queremos representar en Python el menú de una cafetería:

| Bebida         | Precio |
|----------------|--------|
| Americano      | 3000   |
| Iced Americano | 3500   |
| Cappuccino     | 4000   |
| Cafe Latte     | 4500   |
| Espresso       | 3600   |


Como vimos en la unidad anterior, debemos evitar el uso de variables disgregadas para representar cada valor (`cafe_1`, `precio_1`, ...). Es preferible utilizar una estructura de datos o colección que represente todo el menú de forma global. Una posibilidad es utilizar dos listas:

In [None]:
cafes =   ["Americano", "Iced Americano", "Capuccino", "Cafe Latte", "Espresso"]
precios = [ 3000,        3500,             4000,        4500,         3600]

Esta solución presenta varios problemas:
- hay que mantener ambas listas _"sincronizadas"_: por ejemplo, si añadimos un café en la tercera posición de `cafes`, debemos añadir su precio exactamente en la tercera posición de `precios`
- hay que recorrer la lista `cafes` para saber el precio de un café: debemos localizar la posición del café y consultar dicha posición en la lista `precios`; esto tiene un coste lineal $O(n)$

Necesitamos una estructura de datos o colección que:
- nos libere de la necesidad de mantener la _"sincronización"_
- nos permita consultar de forma cómoda y eficiente el precio de un café

Tal estructura se llama **diccionario**, a veces también recibe los nombres de **aplicación**, **asociación** o **memoria asociativa**.

**Nota:** En algunos lenguajes (por ejemplo, Java) esta estructura se llama **map**.

## Definición de diccionario

Un **diccionario** es un conjunto de pares. Cada par tiene dos componentes: al primero lo llamamos **clave** y al segundo **valor**. Los pares suelen representarse como $k:v$, donde $k$ es la clave y $v$ es el valor.

No todo conjunto de pares $k:v$ es un diccionario válido: es necesario que **las claves no estén repetidas**. Por ejemplo, el siguiente conjunto de pares es un diccionario:

$$
\{ 1:10,\ 2:20,\ 3:30 \} 
$$

pero el siguiente conjunto de pares no es un dicionario, pues repite la clave $1$:

$$
\{ 1:10,\ 2:20,\ 1:40,\ 3:30 \} 
$$

Observa que los valores sí pueden estar repetidos:

$$
\{ 1:10,\ 2:20,\ 3:30,\ 4:10,\ 5:20,\ 6:30 \} 
$$

Si un diccionario contiene el par $k:v$, se dice que la clave $k$ tiene **asociado** el valor $v$. Por ejemplo, en el diccionario:

$$
\{ 1:10,\ 2:20,\ 3:30 \} 
$$

la clave $2$ tiene asociado el valor $20$. Como no puede haber claves repetidas, una clave puede tener asociado **como mucho un valor**. Esta característica es importante: dada una clave, podemos determinar el único valor que le corresponde.

Podemos representar el menú de la cafetería por el siguiente diccionario:

$$
\{ \mathrm{Americano}:30000,\ \mathrm{Iced\ Americano}:3500,\ 
   \mathrm{Cappuccino}:4000,\ \mathrm{Caffe\ Latte}:4500,\
   \mathrm{Espresso}:3600 \} 
$$

de manera que cada tipo de café (clave) tenga asociado su precio (valor).

## El tipo diccionario

El tipo diccionario es una colección o estructura de datos Python que permite asociar claves y valores, y acceder a los valores a través de las claves. Para determinar el valor que corresponde a una clave, es necesario que las claves no se repitan.

Un literal de diccionario tiene la siguiente sintaxis:

```python
      {k_0:v_0, k_1:v_1, k_2:v_2  ..., k_n:v_n}
```

Es decir, aparecen los pares `clave:valor` que contiene el diccionario, separados por comas y encerrados entre llaves:

In [1]:
edades = { "juan" : 12, "sonia" : 16, "luis" : 14, "elena" : 12 }
edades

{'juan': 12, 'sonia': 16, 'luis': 14, 'elena': 12}

Podemos crear un diccionario vacío:

In [2]:
diccionario_vacio = {}
diccionario_vacio

{}

El tipo de las claves está limitado: las claves deben ser de tipos inmutables (`int` ,`float`, `str`,...). El tipo de los valores no está limitado:

In [3]:
valido = { 3.1416 : "pi", 5 : "cinco", "uno" : "one", True : "cierto", "primos" : [2,3,5,7] }
valido

{3.1416: 'pi',
 5: 'cinco',
 'uno': 'one',
 True: 'cierto',
 'primos': [2, 3, 5, 7]}

Observa que podemos usar listas como valores, pero no como claves (las listas son mutables):

In [4]:
no_valido = { 1 : "one", [2,3,5,7] : "primos" }

TypeError: unhashable type: 'list'

El tipo de los diccionarios se llama `dict`, y no refleja ni los tipos de las claves ni los tipos de los valores:

In [5]:
print(type(edades))
print(type(valido))

<class 'dict'>
<class 'dict'>


### Indexación de diccionarios

Una característica esencial de los diccionarios es que, dada una clave, podemos determinar el único valor que tiene asociado. Para ello, utilizamos la indexación por clave (similar a la indexación por posición en listas y otras secuencias):

```python
   diccionario[clave]
```

In [6]:
print(edades)
edades["elena"]

{'juan': 12, 'sonia': 16, 'luis': 14, 'elena': 12}


12

Si usamos una clave que no está presente en el `diccionario`; obtendremos un error de indexación `KeyError`:

In [7]:
edades["nuria"]

KeyError: 'nuria'

## Los diccionarios son mutables

Al igual que las listas, los diccionarios son mutables. Podemos añadir nuevos pares `k:v`, o bien modificar el valor asociado a una clave `k`. La sintaxis es similar a la que empleamos con las listas:

```python
   diccionario[clave] = valor
```

La anterior sentencia tiene uno de los siguientes efectos:
- si la `clave` no está presente en el `diccionario`, se añade el par `clave:valor`
- si la `clave` está presente en el `diccionario`, se modifica el `valor` asociado

In [8]:
print(edades)
edades["sonia"] = 11
edades

{'juan': 12, 'sonia': 16, 'luis': 14, 'elena': 12}


{'juan': 12, 'sonia': 11, 'luis': 14, 'elena': 12}

In [9]:
print(edades)
edades["juan"] = edades["juan"] + 1
edades

{'juan': 12, 'sonia': 11, 'luis': 14, 'elena': 12}


{'juan': 13, 'sonia': 11, 'luis': 14, 'elena': 12}

In [14]:
print(edades)
edades["manuel"] = 17
edades["patricia"] = 19
edades

{'juan': 13, 'sonia': 11, 'luis': 14, 'elena': 12, 'patricia': 19}


{'juan': 13,
 'sonia': 11,
 'luis': 14,
 'elena': 12,
 'patricia': 19,
 'manuel': 17}

## Eliminación de claves en diccionarios

Para eliminar un par `clave:valor` del diccionario, debemos utilizar la sentencia `del`:

```python
   del diccionario[clave]
```

Si la `clave` está en el `diccionario`, se elimina el par `clave:valor`, de lo contrario obtenemos un `KeyError`:

In [15]:
print(edades)
del edades["manuel"]
edades

{'juan': 13, 'sonia': 11, 'luis': 14, 'elena': 12, 'patricia': 19, 'manuel': 17}


{'juan': 13, 'sonia': 11, 'luis': 14, 'elena': 12, 'patricia': 19}

In [16]:
print(edades)
del edades["maria"]

{'juan': 13, 'sonia': 11, 'luis': 14, 'elena': 12, 'patricia': 19}


KeyError: 'maria'

**Nota:** La sentencia `del` (de _delete_) puede utilizarse también para eliminar elementos de listas (por posición) o, incluso, para borrar variable completas.

In [17]:
lista = list(range(6))
print(lista)
del lista[3]
lista

[0, 1, 2, 3, 4, 5]


[0, 1, 2, 4, 5]

In [18]:
nueva_variable = "nueva"
nueva_variable

'nueva'

In [19]:
del nueva_variable
nueva_variable

NameError: name 'nueva_variable' is not defined

## Operadores y funciones sobre diccionarios

Los diccionarios soportan lo siguientes operadores:

| Operador     | Significado   |
|--------------|---------------|
|    `d[k]`    | indexación    |
|  `k in s`    | pertenencia   |
| `k not in s` | no pertenencia|
|  `d1 == d2`  | igualdad      |
|  `d1 != d2`  | desigualdad   |

Además, los diccionarios soportan la función `len()`.

In [20]:
print(edades)
print("sonia" in edades)
print("marina" in edades)
print("cristina" not in edades)

{'juan': 13, 'sonia': 11, 'luis': 14, 'elena': 12, 'patricia': 19}
True
False
True


In [21]:
edades != edades

False

Al comparar los diccionarios, el orden en que aparecen los pares no es relevante (son un _conjunto_ de pares):

In [22]:
{"mes" : "junio", "dia": 29} == {"dia": 29, "mes" : "junio"}

True

In [23]:
len(edades)

5

## Métodos sobre diccionarios

Los diccionarios soportan, entre otros, los siguientes métodos:

| Método      | Significado                                               |
|-------------|---------------------------------------|
| `d.clear()` | borra todos los pares del diccionario |
| `d.pop(k)`  | elimina la clave `k` `i` de `d`       |


In [24]:
english_spanish = {"one": "uno", "two": "dos", "three": "tres", 
                   "four": "cuatro", "five": "cinco"}
print(english_spanish)
print(english_spanish.pop("three"))
print(english_spanish)

{'one': 'uno', 'two': 'dos', 'three': 'tres', 'four': 'cuatro', 'five': 'cinco'}
tres
{'one': 'uno', 'two': 'dos', 'four': 'cuatro', 'five': 'cinco'}


In [25]:
print(english_spanish)
english_spanish.clear()
print(english_spanish)

{'one': 'uno', 'two': 'dos', 'four': 'cuatro', 'five': 'cinco'}
{}


## Iteración básica sobre diccionarios

Podemos usar un diccionario como fuente de datos en un bucle `for`. En tal caso, la variable de control tomará sucesivamente los valores de las claves del diccionario:

In [27]:
print(edades)
print()

for nombre in edades:
    print("{:8} tiene {:2d} años".format(nombre, edades[nombre]))

{'juan': 13, 'sonia': 11, 'luis': 14, 'elena': 12, 'patricia': 19}

juan     tiene 13 años
sonia    tiene 11 años
luis     tiene 14 años
elena    tiene 12 años
patricia tiene 19 años


## Formato JSON para intercambio de datos

JSON (JavaScript Object Notation) es una notación que permite representar textualmente un valor estructurado. La representación del valor es universal, independiente del lenguaje de programación, sistema operativo o arquitectura. Esto permite transmitir información entre diferentes sistemas conectados a la Web.

El siguiente es un valor estructurado representado en formato JSON:

```
{
"Name" : "David Doe",
"Age" : 25,
"Hobby": ["basketball", "python programming"],
"Family" : {"father" : "John Doe",
            "mother" : "Mary Doe"
           },
"Married": true 
}
```

## JSON en Python

Para poder trabajar con datos en formato JSON debemos importar el módulo `json`:

In [28]:
import json

El método `loads(json_str)` devuelve un diccionario Python creado a partir de una cadena `json_str` que contiene
un dato estructurado en formato JSON:

In [29]:
cadena_json =  '{"Name": "David Doe", "Age": 25, "Hobby": ["basketball", "python programming"],\
"Family": {"father": "John Doe", "mother": "Mary Doe"}, "Married": true }'

diccionario_python = json.loads(cadena_json)

print(type(diccionario_python))
print(diccionario_python)

<class 'dict'>
{'Name': 'David Doe', 'Age': 25, 'Hobby': ['basketball', 'python programming'], 'Family': {'father': 'John Doe', 'mother': 'Mary Doe'}, 'Married': True}


In [41]:
diccionario_python["Age"] = 50
diccionario_python["Married"] = False
print(diccionario_python)
print(diccionario_python["Hobby"][1])
print(diccionario_python["Family"]["mother"][0])

{'Name': 'David Doe', 'Age': 50, 'Hobby': ['basketball', 'python programming'], 'Family': {'father': 'John Doe', 'mother': 'Mary Doe'}, 'Married': False}
python programming
M


El método `json.dump(python_dic, filename, indent='\t')` almacena un diccionario Python en el fichero `filename`, utilizando tabuladores (`\t`) para sangrar el documento JSON. El fichero `filename` tiene que haber sido abierto (`open`) en modo escritura (`w`) previamente (lo estudiaremos en la Unidad 13).

In [35]:
with open("datos.json", 'w') as file:  # abre el fichero "datos.json" en modo escritura ('w')
    json.dump(diccionario_python, file, indent='\t')

La sentencia anterior debe haber creado el fichero `datos.json` en el directorio actual. Puedes abrir el fichero desde Jupyter para ver su contenido.

## El método `format`

Ya hemos visto que el método `format` permite asociar un formato a cada valor que queremos mostrar por pantalla:

In [42]:
pi = 3.141592653589793
print("{:6.4f}".format(pi))

3.1416


Hasta ahora hemos emparejado cada especificación de formato `{}` con el correspondiente dato facilitado en los argumentos de `format`:

In [43]:
print("I like {} and {}".format("python", "java"))

I like python and java


Es posible indicar en cada especificación de formato a qué argumento se refiere; basta indicar la posición del argumento (se numeran desde cero). Nótese que aquí no funciona la indexación negativa. 

In [44]:
print("I like {0} and {1}".format("python", "java"))
print("I like {1} and {0}".format("python", "java"))

I like python and java
I like java and python


Este índice de argumento se puede combinar con la especificación de formato propiamente dicha:

In [45]:
print("pi con dos decimales es {0:4.2f}, y con 6 decimales es {0:8.6f}".format(pi))

pi con dos decimales es 3.14, y con 6 decimales es 3.141593


## Solución del primer ejercicio de paper coding (128)
Create the capital_dic dictionary with the following string key-value items. Then, use the capital_dic to write results regarding Korea in the following dictionary items. 

key: Korea
value: Seoul
key: China
value: Beijing
key: USA
value: Washington DC

In [48]:
capital_dic = {"Korea":"Seoul", "China":"Beijing", "USA":"Washington DC"}

print(capital_dic["Korea"])

Seoul


## Solución del segundo ejercicio de paper coding (129)

Create the fruits_dic dictionary that has elements of the following key-value items. Then, use this dictionary to print the price of each fruit as shown below:
Apple: 5000 KRW
Banana: 4000 KRW
Grape: 5300 KRW
Melon: 6500 KRW

In [52]:
fruits_dic = {"Apple":5000, "Banana":4000, "Grape":5300, "Melon":6500}

for fruta in fruits_dic:
    print("The price of a", fruta, "is", fruits_dic[fruta], "KRW")

The price of a Apple is 5000 KRW
The price of a Banana is 4000 KRW
The price of a Grape is 5300 KRW
The price of a Melon is 6500 KRW


## Solución del ejercicio de pair programming (147)

Create the fruits_dic dictionary consists of key-value pairs including apple 6000, melon 3000, banana 5000, orange 4000. Then, print all of the key in the fruits_dic as list type and examine if the apple and mango keys are found in the fruits_dic and prints as follows:
- dicts_keys
- apple is in fruits_dic
- mango is not in fruits_dic

In [54]:
fruits_dic = {"Apple":6000, "Melon":3000, "Banana":5000, "Orange":4000}

print(list(fruits_dic))

# Búsqueda de Apple
if "Apple" in fruits_dic:
    print("Apple is in fruits_dic")
else:
    print("Apple is not in fruits_dic")

# Búsqueda de Mango
if "Mango" in fruits_dic:
    print("Mango is in fruits_dic")
else:
    print("Mango is not in fruits_dic")

['Apple', 'Melon', 'Banana', 'Orange']
Apple is in fruits_dic
Mango is not in fruits_dic


In [None]:
fruits_dic = {"Apple":6000, "Melon":3000, "Banana":5000, "Orange":4000}

print(list(fruits_dic))

fruta = input("Ponga una fruta: ")

if fruta in fruits_dic:
    print(fruta, "is in fruits_dic")
else:
    print(fruta, "is not in fruits_dic")

## Ejercicio extra

Dada una cadena, construir una tabla de frecuencias absolutas, es decir, contar cuántas veces aparece cada dato (cada carácter en la cadena). La tabla de frecuencias absolutas se debe construir de tipo diccionario. 

In [1]:
cadena = input("Ponga una cadena: ")

tabla_frecuencias_abs = {}

for caracter in cadena:
    if caracter not in tabla_frecuencias_abs:
        tabla_frecuencias_abs[caracter] = 0
    tabla_frecuencias_abs[caracter] += 1
    
print(tabla_frecuencias_abs)

Ponga una cadena: esto es una prueba
{'e': 3, 's': 2, 't': 1, 'o': 1, ' ': 3, 'u': 2, 'n': 1, 'a': 2, 'p': 1, 'r': 1, 'b': 1}


## Solución del mission problem (95)

In [47]:
menu = {"Americano" : 3000, "Iced Americano" : 3500, "Capuccino" : 4000, "Cafe Latte" : 4500, "Espresso" : 3600}

print("Welcome to David's cafeteria")
choice = ""
while choice not in menu:

    print("\n{:10}\t{}".format("Cafe", "Price"))
    for cafe in menu:
        print("{:10}\t{}".format(cafe, menu[cafe]))
    
    choice = input("please, enter your choice; ")
    
    if choice not in menu:
        print("Sorry, we do not serve", choice)

print("You selected", choice, "Good choice!")
print("Pease insert", menu[choice], "wons and enjoy")

Welcome to David's cafeteria

Cafe      	Price
Americano 	3000
Iced Americano	3500
Capuccino 	4000
Cafe Latte	4500
Espresso  	3600
please, enter your choice; americano
Sorry, we do not serve americano

Cafe      	Price
Americano 	3000
Iced Americano	3500
Capuccino 	4000
Cafe Latte	4500
Espresso  	3600
please, enter your choice; Americano
You selected Americano Good choice!
Pease insert 3000 wons and enjoy
