Los diccionarios guardan un mapeo entre un conjunto de llaves y un conjunto de valores:
- Las llaves tienen que ser de tipos inmutables
- Los valores pueden ser de cualquier tipo
- Un mismo diccionario puede guardar llaves y valores de diferentes tipos simultáneamente
- Se puede definir, modificar, ver, buscar o eliminar pares llave-valor en un diccionario
- Los diccionarios de Python se implementan como tablas hash o arreglos asociativos.

In [1]:
# Un ejemplo
d = {"user": "Pedro", "edad": 23, "esMasculino": True}
print(d['user'])

Pedro


In [4]:
# Cada llave tiene que estar asociada a un solo valor. Una repetición actualiza el valor
w = {"user": "Pedro", "user": 23}
print(w)

{'user': 23}


In [5]:
d['edad'] = 34
print(d)

{'user': 'Pedro', 'edad': 34, 'esMasculino': True}


In [6]:
# Si la llave no aparece, da error
d['sexo']

KeyError: 'sexo'

Los diccionarios no son sequencias, ya que no existe un orden de los elementos

In [7]:
# Los elementos se pueden eliminar del diccionario
print(d)
del d['edad']
print(d)

{'user': 'Pedro', 'edad': 34, 'esMasculino': True}
{'user': 'Pedro', 'esMasculino': True}


In [8]:
# El método clear() elimina todo el contenido del diccionario
d.clear()
print(d)

{}


In [9]:
# Accediendo de forma cómoda a los elementos de un diccionario
d = {"user": "Pedro", "edad": 23, "esMasculino": True}
print(d.keys())
print(d.values())
print(d.items())

dict_keys(['user', 'edad', 'esMasculino'])
dict_values(['Pedro', 23, True])
dict_items([('user', 'Pedro'), ('edad', 23), ('esMasculino', True)])


Ahora resolveremos un problema utilizando diccionarios. El problema es contar la cantidad de veces que aparece cada palabra en un texto, seguido por algún preprocesamiento

In [30]:
text='''
Sol solecito
Calientame un poquito,
Por hoy por mañana
Por hoy por mañana
Por toda la semana
Luna lunera cascabelera
Cinco pollitos y una ternera
Cinco pollitos y una ternera
Cinco pollitos y una ternera
Cinco pollitos y una ternera
Caracol, caracol
A la una sale el sol
'''

In [31]:
# algo de preprocesamiento
text_words = [t.lower() for t in text.split()]

In [32]:
# Código básico
freq = {}
for t in text_words:
    if t in freq:
        freq[t] += 1
    else:
        freq[t] = 1
print(freq)

{'sol': 2, 'solecito': 1, 'calientame': 1, 'un': 1, 'poquito,': 1, 'por': 5, 'hoy': 2, 'mañana': 2, 'toda': 1, 'la': 2, 'semana': 1, 'luna': 1, 'lunera': 1, 'cascabelera': 1, 'cinco': 4, 'pollitos': 4, 'y': 4, 'una': 5, 'ternera': 4, 'caracol,': 1, 'caracol': 1, 'a': 1, 'sale': 1, 'el': 1}


In [33]:
# Usando get()
freq = {}
for t in text_words:
    freq[t] = 1 + freq.get(t, 0)
print(freq)

{'sol': 2, 'solecito': 1, 'calientame': 1, 'un': 1, 'poquito,': 1, 'por': 5, 'hoy': 2, 'mañana': 2, 'toda': 1, 'la': 2, 'semana': 1, 'luna': 1, 'lunera': 1, 'cascabelera': 1, 'cinco': 4, 'pollitos': 4, 'y': 4, 'una': 5, 'ternera': 4, 'caracol,': 1, 'caracol': 1, 'a': 1, 'sale': 1, 'el': 1}


In [34]:
# Mostrar resultados ordenados 
freq = {}
for t in text_words:
    freq[t] = 1 + freq.get(t, 0)
for w in sorted(freq.keys()):
    if freq[w] > 1:
        print(w, freq[w])

cinco 4
hoy 2
la 2
mañana 2
pollitos 4
por 5
sol 2
ternera 4
una 5
y 4


In [38]:
# Recordemos, las llaves TIENEN que ser inmutables
d = {}
d[2] = "lolo"  # enteros, flotantes, booleanos, OK
d[4.56] = True
d[True] = 2, 3, 5
d[(2, 3, 4)] = 3.14159  # Tuplas, ok
d

{(2, 3, 4): 3.14159, 2: 'lolo', 4.56: True, True: (2, 3, 5)}

In [41]:
# Las listas son MUTABLES
d[[2, 3]] = "LOLO"

TypeError: unhashable type: 'list'