<a href="https://colab.research.google.com/github/ernxtorios/python-challenges/blob/main/eliminar_duplicados.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>



> # ¿Necesita eliminar elementos duplicados en una lista?



In [None]:
my_items = ["duck", "mouse", "duck", "computer"]

Si no te importa mantener el orden de tus elementos, puedes usar el constructor de conjuntos integrado:

In [None]:
unique_items = set(my_items)
unique_items

{'computer', 'duck', 'mouse'}

Si te importa mantener el orden de tus elementos, puedes usar el método fromkeys de la clase dict junto con el constructor de lista incorporado:

In [None]:
unique_items = list(dict.fromkeys(my_items))
unique_items

['duck', 'mouse', 'computer']

Tenga en cuenta que estas dos técnicas sólo funcionan con números, cadenas u otros objetos con hashes.

Fuente: https://www.pythonmorsels.com/deduplicate-lists/?utm_source=drip&utm_medium=email&utm_campaign=weekly+email+-+2025-04-16&utm_content=Weekly+Python+tip%3A+use+sets+for+de-duplication

## Ejercicio

¿Necesita eliminar duplicados de una lista de elementos?

In [None]:
all_colors = ["blue", "purple", "green", "red", "green", "pink", "blue"]

## ¿Cómo se puede hacer esto en Python?

Veamos dos enfoques para la deduplicación: uno cuando no nos importa el orden de los elementos y otro cuando sí.

## Usar un conjunto para desduplicar
Puede usar el constructor de conjuntos integrado para desduplicar los elementos de una lista (o de cualquier iterable):

In [None]:
unique_colors = set(all_colors)
unique_colors

{'blue', 'green', 'pink', 'purple', 'red'}

Esto solo funciona con listas de valores hash, pero incluye bastantes valores: cadenas, números y la mayoría de las tuplas son hashables en Python.

Quizás hayas notado que el orden de los elementos originales se perdió al convertirlos en un conjunto:

In [None]:
print(all_colors)

print(unique_colors)

['blue', 'purple', 'green', 'red', 'green', 'pink', 'blue']
{'blue', 'purple', 'green', 'red', 'pink'}


Incluso si volvemos a convertir los elementos a una lista, ese orden original no se mantendrá:

In [None]:
unique_colors = list(set(all_colors))
unique_colors

['blue', 'purple', 'green', 'red', 'pink']

## Desduplicación sin perder el orden
Para desduplicar manteniendo el orden relativo de los elementos, podemos usar dict.fromkeys

In [None]:
unique_colors = dict.fromkeys(all_colors)
unique_colors

{'blue': None, 'purple': None, 'green': None, 'red': None, 'pink': None}

La clase dict de Python tiene un método de clase `fromkeys` que acepta un iterable y crea un nuevo diccionario cuyas claves son los elementos del iterable dado.

Como los diccionarios no pueden tener claves duplicadas, esto también desduplica los elementos dados. Los diccionarios también mantienen el orden de sus elementos (a partir de Python 3.6), por lo que el diccionario resultante tendrá sus claves ordenadas según la primera vez que se vio cada valor.

Bien, ya tenemos un diccionario, pero ¿cómo podemos usarlo?

Bueno, los diccionarios tienen un método `keys` que podemos usar para obtener un iterable solo con las claves:

In [None]:
unique_colors = dict.fromkeys(all_colors).keys()
unique_colors

dict_keys(['blue', 'purple', 'green', 'red', 'pink'])

E incluso podríamos convertir esas claves en una lista:

In [None]:
unique_colors = list(dict.fromkeys(all_colors).keys())
unique_colors

['blue', 'purple', 'green', 'red', 'pink']

Pero los diccionarios también son iterables (recorrer un diccionario proporciona las claves), por lo que podríamos simplemente pasar el diccionario al constructor de lista incorporado:

In [None]:
unique_colors = list(dict.fromkeys(all_colors))
unique_colors

['blue', 'purple', 'green', 'red', 'pink']

Puede parecer un poco extraño, pero funciona.

Si prefieres ser más explícito llamando al método keys, puedes hacerlo. No tengo una preferencia clara entre estos dos enfoques: ser explícito es bueno, pero también lo es la brevedad.

Una última cosa a tener en cuenta: si solo necesitas iterar sobre los elementos únicos inmediatamente, no es necesario volver a convertirlos a una lista. Esto funciona bien:

In [None]:
for color in dict.fromkeys(all_colors):
    print(color)

blue
purple
green
red
pink


Esto funciona porque todas las formas de iteración son las mismas en Python: ya sea que uses el constructor de lista, un bucle for o una comprensión de lista, todo funciona de la misma manera.

## Evite usar listas para desduplicar
Quizás se pregunte si una lista y un bucle for funcionarían bien para desduplicar.

In [None]:
unique_colors = []
for color in all_colors:
    if color not in unique_colors:
        unique_colors.append(color)

unique_colors

['blue', 'purple', 'green', 'red', 'pink']

Esto funciona, pero si tiene muchos valores para deduplicar, podría ser muy lento, ya que el operador in en listas es considerablemente más lento que en conjuntos. Observe las comprobaciones de contención de listas para obtener más información.