## Limitaciones en los tipos de clave para dict y set

In [1]:
lista = [1,2,3]
diccionario = {}

diccionario[lista] = 2

TypeError: unhashable type: 'list'

In [2]:
hash(lista)

TypeError: unhashable type: 'list'

In [3]:
diccionario[2,3] = 4

diccionario

{(2, 3): 4}

### Tampoco podemos utilizar como claves los conjuntos

In [14]:
d = {}
cjt = {1,2,3}

In [15]:
cjt

{1, 2, 3}

In [16]:
hash(cjt)

TypeError: unhashable type: 'set'

In [17]:
d[cjt] = 5

TypeError: unhashable type: 'set'

In [23]:
cjt

{1, 2, 3}

In [18]:
tuple(cjt)

(1, 2, 3)

In [24]:
(1,2,3) == (3,2,1)

False

In [25]:
{1,2,3} == {3,2,1}

True

In [26]:
tuple(sorted(cjt))

(1, 2, 3)

#### Ejercicio

Nos dan unas líneas de texto. Queremos sacar el cjt de palabras de cada línea y contar los conjuntos diferentes.

In [27]:
lineas = """\
casa casa perro gato
gato gato gato
perro gato
gato perro perro
casa gato
gato casa casa\
"""

In [36]:
distintos = set()
for linea in lineas.split('\n'):
    cjt_palabras = set(linea.split())
    print("Línea:",linea, cjt_palabras)
    distintos.add(tuple(sorted(cjt_palabras)))
len(distintos)

Línea: casa casa perro gato {'perro', 'casa', 'gato'}
Línea: gato gato gato {'gato'}
Línea: perro gato {'perro', 'gato'}
Línea: gato perro perro {'gato', 'perro'}
Línea: casa gato {'gato', 'casa'}
Línea: gato casa casa {'gato', 'casa'}


4

### Ejemplo ventajas diccionario/conjunto frente a lista

Dada una lista con números enteros, crear otra lista donde solamente aparezcan los números que no han aparecido ya.

Por ejemplo, dada la lista `[1,2,3,2,5,1,4,2]` devolverá `[1,2,3,5,4]`

In [4]:
import random

In [6]:
def sin_repetidos(lista):
    resul = []
    for elem in lista:
        if elem not in resul:
            resul.append(elem)
    return resul

In [7]:
sin_repetidos([1,2,3,2,5,1,4,2])

[1, 2, 3, 5, 4]

In [9]:
lista = [random.randrange(100_000) for i in range(100_000)]

In [10]:
%timeit sin_repetidos(lista)

31.1 s ± 235 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [11]:
def sin_repetidos_cjt(lista): # versión con un conjunto auxiliar
    cjt = set()
    resul = []
    for elem in lista:
        if elem not in cjt:
            resul.append(elem)
            cjt.add(elem)
    return resul

In [12]:
sin_repetidos_cjt([1,2,3,2,5,1,4,2])

[1, 2, 3, 5, 4]

In [13]:
%timeit sin_repetidos_cjt(lista)

13.2 ms ± 162 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
