In [1]:
# 1_10_从序列中一重重复项且保持元素间顺序不变
# 1. 如果序列中的值是可哈希(hashable) 的，可以通过稽核和生成器轻松解决
# 【若一个对象是可哈希的，则在它的生存周期内必须是不可变的，它需要有一个__hash__()方法。证书、浮点数、字符串、元组都是不可变的】
def dequpe(items):
    seen = set()
    for item in items:
        if item not in seen:
            yield item
            seen.add(item)

In [2]:
a = [1,5,2,1,9,1,5,10]

In [3]:
list(dequpe(a))

[1, 5, 2, 9, 10]

In [4]:
# 只有当序列中的元素时可哈希的时候才能这么做。

In [10]:
# 如果想在不可哈希的对象(如列表)序列中去除重复项，需要修改
# 这里的参数 key 作用是指定一个函数用来将序列中的元素转换为可哈希的类型
def dedupe(items, key=None):
    seen = set()
    for item in items:
        val = item if key is None else key(item)
        if val not in seen:
            yield item
            seen.add(val)

In [11]:
a = [{'x':1,'y':2}, {'x':1, 'y':3}, {'x':1,'y':2}, {'x':2, 'y':4}]

In [12]:
list(dedupe(a, key=lambda d: (d['x'],d['y'])))

[{'x': 1, 'y': 2}, {'x': 1, 'y': 3}, {'x': 2, 'y': 4}]

In [13]:
# 如果想要的只是去重，那么通常足够简单的方法就是构建一个集合 set()
# 注意：这种方法不能保证元素间的顺序不变