# Cuaderno 7: Diccionarios

Un diccionario es un tipo de datos que consiste de una colección no ordenada de pares de *claves* y *valores*. Cada clave sirve para identificar al valor correspondiente.
 
### Aspectos básicos

Para definir un diccionario, se enumeran los pares clave-valor separados por comas y encerrados entre llaves. Las componentes *clave* y *valor* dentro de cada par se separan por dos puntos.

In [1]:
D = {'nombre' : 'pablo', 'ciudad' : 'Quito', 'edad' : 43}
print(D)

{'nombre': 'pablo', 'ciudad': 'Quito', 'edad': 43}


Para acceder a los valores de un diccionario, se utiliza la clave entre corchetes, tal como si se tratara de un índice.

In [2]:
print (D)
print(D['ciudad'])
print(D['edad'])

{'nombre': 'pablo', 'ciudad': 'Quito', 'edad': 43}
Quito
43


En un diccionario cada clave debe ser única. Si se escriben elementos con claves duplicadas, se almacena únicamente el valor del último elemento.

In [3]:
D = {'nombre' : 'pablo', 'ciudad' : 'Quito', 'edad':30, 'edad' : 43, 3 : 'valor', (1,2) : -5}
print(D)
print(D['nombre'])
print(D['edad'])
print(D[3])
print(D[1,2])
D[1,2] = 4
print(D)
print(D[1,2])
D[1,1] = -4
print (D)
print(D[1,1])


{'nombre': 'pablo', 'ciudad': 'Quito', 'edad': 43, 3: 'valor', (1, 2): -5}
pablo
43
valor
-5
{'nombre': 'pablo', 'ciudad': 'Quito', 'edad': 43, 3: 'valor', (1, 2): 4}
4
{'nombre': 'pablo', 'ciudad': 'Quito', 'edad': 43, 3: 'valor', (1, 2): 4, (1, 1): -4}
-4


El intento de acceder al valor asociado a una clave que no ha sido definida produce un error del tipo **KeyError**:

In [4]:
# no se ha definido ningún elemento que tenga como clave 4
print(D[4])

KeyError: 4

Los valores de un diccionario pueden ser de cualquier tipo.

In [5]:
registro = { 'nombres' : {'nombre' : 'Pablo', 'apellido' : 'Perez'},#tipo diccionario
             'titulos' : ['Ing', 'MSc'], #tipo lista
             'edad' : 32} 
print(registro)

{'nombres': {'nombre': 'Pablo', 'apellido': 'Perez'}, 'titulos': ['Ing', 'MSc'], 'edad': 32}


Pero las claves deben ser de tipos de datos *inmutables* (números, cadenas de caracteres o tuplas).

In [6]:
D1 = { 'nombre' : 'carlos',
      ['genero','NumHijos'] : ['masculino', 3], #clave tipo lista
      'ciudad' : 'Guayaquil', 'edad' : 50} 

TypeError: unhashable type: 'list'

En el ejemplo anterior, es válido usar una tupla de cadenas de caracteres en lugar de una lista para la clave del segundo elemento.

In [7]:
D1 = { 'nombre' : 'carlos',
      ('genero','NumHijos') : ('masculino', 3),
      'ciudad' : 'Guayaquil', 
      'edad' : 50}
print (D1)

{'nombre': 'carlos', ('genero', 'NumHijos'): ('masculino', 3), 'ciudad': 'Guayaquil', 'edad': 50}


Un diccionario no es inmutable.

In [8]:
print (D1)
D1['nombre'] = ['juan','pablo']
print(D1)
D1['pais'] = 'Ecuador'
print(D1)

{'nombre': 'carlos', ('genero', 'NumHijos'): ('masculino', 3), 'ciudad': 'Guayaquil', 'edad': 50}
{'nombre': ['juan', 'pablo'], ('genero', 'NumHijos'): ('masculino', 3), 'ciudad': 'Guayaquil', 'edad': 50}
{'nombre': ['juan', 'pablo'], ('genero', 'NumHijos'): ('masculino', 3), 'ciudad': 'Guayaquil', 'edad': 50, 'pais': 'Ecuador'}


Los valores de un diccionario pueden ser listas o incluso otros diccionarios. En este caso, es posible emplear múltiples claves para acceder a los elementos internos, de manera similar a como se utilizan índices múltiples en las listas multidimensionales.

In [9]:
print(registro)
print(registro['nombres']['apellido']) # acceso de un valor de tipo diccionario

print(registro['titulos'][1]) # acceso de un valor de tipo lista

{'nombres': {'nombre': 'Pablo', 'apellido': 'Perez'}, 'titulos': ['Ing', 'MSc'], 'edad': 32}
Perez
MSc


Los corchetes pueden usarse para asignar un *nuevo* valor a una *nueva* clave. Esto tiene como efecto que un nuevo elemento sea agregado al diccionario.

In [10]:
D['peso'] = 80
D['sector'] = 'La Prensa'
print (D)

{'nombre': 'pablo', 'ciudad': 'Quito', 'edad': 43, 3: 'valor', (1, 2): 4, (1, 1): -4, 'peso': 80, 'sector': 'La Prensa'}


**No** debe confundirse a la clave de un diccionario con el índice de posición en listas y tuplas. Recordar que un diccionario no es ordenado.  

In [11]:
D[0] = 'campo0'
D[(1,2)] = 'campo<1,2>'
print (D)
print (D[(1,1)])

{'nombre': 'pablo', 'ciudad': 'Quito', 'edad': 43, 3: 'valor', (1, 2): 'campo<1,2>', (1, 1): -4, 'peso': 80, 'sector': 'La Prensa', 0: 'campo0'}
-4


### Iterando sobre diccionarios

Los diccionarios son estructuras de datos iterables. El operador `in` itera por defecto sobre una lista que contiene las claves del diccionario; a través de las claves pueden obtenerse los valores correspondientes:

In [12]:
# iterar sobre las claves
print(registro)
print('--- Contenido del diccionario ---')
print('Clave\t\t\tValor')
print('-----\t\t\t-----')
for i in registro:
    print('{}\t\t\t{}'.format(i, registro[i]))


{'nombres': {'nombre': 'Pablo', 'apellido': 'Perez'}, 'titulos': ['Ing', 'MSc'], 'edad': 32}
--- Contenido del diccionario ---
Clave			Valor
-----			-----
nombres			{'nombre': 'Pablo', 'apellido': 'Perez'}
titulos			['Ing', 'MSc']
edad			32


La función `sorted` retorna la lista de claves de un diccionario, luego de ordenarla:

In [13]:
print(sorted(registro))

['edad', 'nombres', 'titulos']


Usando la función `sorted` es posible iterar sobre la lista de claves ordenada:

In [14]:
# iterar sobre las claves ordenadas
print(registro)
print('--- Contenido del diccionario ---')
print('Clave\t\t\tValor')
print('-----\t\t\t-----')
for i in sorted(registro):
    print('{}\t\t\t{}'.format(i, registro[i]))


{'nombres': {'nombre': 'Pablo', 'apellido': 'Perez'}, 'titulos': ['Ing', 'MSc'], 'edad': 32}
--- Contenido del diccionario ---
Clave			Valor
-----			-----
edad			32
nombres			{'nombre': 'Pablo', 'apellido': 'Perez'}
titulos			['Ing', 'MSc']


La lista de claves puede obtenerse también de manera explícita llamando al método `keys()`.

In [26]:
print(registro.keys())

dict_keys(['nombres', 'titulos', 'edad'])


También es posible iterar directamente sobre los valores de un diccionario empleando el método `values`:

In [28]:
# iterar sobre los valores
print(registro.values())
for val in registro.values():
    print(val)

dict_values([{'nombre': 'Pablo', 'apellido': 'Perez'}, ['Ing', 'MSc'], 32])
{'nombre': 'Pablo', 'apellido': 'Perez'}
['Ing', 'MSc']
32


Por último, el método `items` permite iterar tanto sobre las claves como sobre los valores correspondientes. Observar que al usar este método, se recupera una tupla de longitud 2 (es decir, un par ordenado), cuyos elementos son asignados a dos variables distintas. Esta técnica es usual en Python y se conoce como **unpacking**.

In [29]:
# iterar sobre claves y valores
# recuperar parejas clave-valor en las variables k y val
for k, val in registro.items():
    print('Clave: {}'.format(k))
    print('Valor: {}'.format(val))

Clave: nombres
Valor: {'nombre': 'Pablo', 'apellido': 'Perez'}
Clave: titulos
Valor: ['Ing', 'MSc']
Clave: edad
Valor: 32


El operador `in` se usa para consultar si una clave, valor, o pareja clave-valor pertenece a un diccionario. Devuelve `True` o `False`, según sea el caso.

In [35]:
print(registro)
# consultar si 'titulos' es una clave de registro
print('titulos' in registro)
print('titulos' in registro.keys())
# consultar si 32 es un valor de registro
print(32 in registro.values())
# consultar si 32 es el valor asociado a la clave 'edad' de registro
print(('titulos', ['Ing', 'MSc']) in registro.items())

{'nombres': {'nombre': 'Pablo', 'apellido': 'Perez'}, 'titulos': ['Ing', 'MSc'], 'edad': 32}
True
True
True
True


Puede usarse `not` para invertir el resultado del operador anterior.

In [36]:
print('ciudad' not in registro)

True


### Formas alternativas para la creación de diccionarios


La función `dict()` crea un diccionario a partir de asignaciones de valores a claves. Cada parámetro de esta función asigna un valor a una clave empleando el símbolo `=`. 

In [38]:
D2 = dict(nombre = 'pablo', ciudad = 'Quito', edad = 43) # declaracion de un diccionario
print(D2)
print(D2['nombre'])

{'nombre': 'pablo', 'ciudad': 'Quito', 'edad': 43}
pablo


La función `zip(it1, it2)` recibe como parámetros dos iterables (cadenas, listas o tuplas) `it1` e `it2` con el mismo número de elementos, y devuelve una lista de tuplas. Cada tupla de esta lista contiene dos elementos, correspondientes a los elementos respectivos de `it1` e `it2`. Esta lista de tuplas puede ser convertida en un diccionario empleando la función `dict`.

In [42]:
# crear una lista de parejas
L = zip(('nombre', 'ciudad', 'edad', (1,2)),['pablo', 'Quito', 45, [3,1]])
# convertir la lista de parejas en un diccionario
D3 = dict(L)
print(D3)

{'nombre': 'pablo', 'ciudad': 'Quito', 'edad': 45, (1, 2): [3, 1]}


### Otras funciones, métodos y operadores

Si un valor de un diccionario es de tipo lista, es posible utilizar sobre el mismo todas las funciones y métodos vistos en el Cuaderno 3.

In [44]:
print(registro)

registro['titulos'].append('Dr')
print(registro)

print(registro['titulos'].pop())
print(registro)

{'nombres': {'nombre': 'Pablo', 'apellido': 'Perez'}, 'titulos': ['Ing', 'MSc'], 'edad': 32}
{'nombres': {'nombre': 'Pablo', 'apellido': 'Perez'}, 'titulos': ['Ing', 'MSc', 'Dr'], 'edad': 32}
Dr
{'nombres': {'nombre': 'Pablo', 'apellido': 'Perez'}, 'titulos': ['Ing', 'MSc'], 'edad': 32}


Los operadores `+` y `∗` no pueden aplicarse directamente sobre diccionarios.

In [45]:
print ( D + D1 )

TypeError: unsupported operand type(s) for +: 'dict' and 'dict'

In [46]:
print ( D * 2 )

TypeError: unsupported operand type(s) for *: 'dict' and 'int'

Sin embargo, estos operadores pueden aplicarse sobre los valores individuales de un diccionario.

In [47]:
print(D)
print(D1)
print(D['ciudad'] + D1['ciudad'])
print(D['edad']*2)
print('El nombre del registrado es {}, vive en la ciudad de {} y tiene una edad de {}.'.format(D['nombre'], 
            D['ciudad'], D['edad'])) # una instruccion puede ocupar varias lineas

{'nombre': 'pablo', 'ciudad': 'Quito', 'edad': 43, 3: 'valor', (1, 2): 'campo<1,2>', (1, 1): -4, 'peso': 80, 'sector': 'La Prensa', 0: 'campo0'}
{'nombre': ['juan', 'pablo'], ('genero', 'NumHijos'): ('masculino', 3), 'ciudad': 'Guayaquil', 'edad': 50, 'pais': 'Ecuador'}
QuitoGuayaquil
86
El nombre del registrado es pablo, vive en la ciudad de Quito y tiene una edad de 43.


Como se indicó antes, la función `sorted(D)` devuelve la lista *ordenada* de las claves que pertenecen al diccionario `D`.

In [15]:
print(sorted(registro))

['edad', 'nombres', 'titulos']


El método `D.get(<clave>)` devuelve el valor asociado a una `<clave>` del diccionario `D`. Cuando la clave está definida en el diccionario, este método tiene un efecto similar al uso de los corchetes. 

In [48]:
print(registro)
print(registro.get('titulos'))
print(registro['titulos'])

{'nombres': {'nombre': 'Pablo', 'apellido': 'Perez'}, 'titulos': ['Ing', 'MSc'], 'edad': 32}
['Ing', 'MSc']
['Ing', 'MSc']


Sin embargo, cuando se aplica sobre una clave no definida, el método `D.get(<clave>)` devuelve el valor `None`, mientras que el uso de corchetes genera un error.

In [53]:
print(registro.get('ciudad'))
print(registro['ciudad'])


Cuenca
Cuenca


In [54]:
# registro['ciudad']= 'Cuenca'
if registro.get('ciudad')==None:
    print('No existe valor asociado a la clave ciudad')
else:
    print('El valor asociado a ciudad es {}'.format(registro['ciudad']))

El valor asociado a ciudad es Cuenca


El método `D.get(<clave>, <valor>)` también admite un segundo parámetro que especifica el valor a retornar si `<clave>` no pertenece al diccionario.

In [55]:
print(registro)
print(registro.get('ciudad'))
print(registro.get('ciudad', 'sin ciudad'))
print(registro.get('peso', 0))
print(registro.get('edad', 0))

{'nombres': {'nombre': 'Pablo', 'apellido': 'Perez'}, 'titulos': ['Ing', 'MSc'], 'edad': 32, 'ciudad': 'Cuenca'}
Cuenca
Cuenca
0
32


El último uso del método `get` es equivalente a una asignación condicional.

In [58]:
valor = registro['ciudad'] if 'ciudad' in registro else 'sin ciudad'
print(valor)

valor= registro.get('ciudad', 'sin ciudad')
print(valor)

sin ciudad
sin ciudad
