##### 问题:
我们想去除序列中出现的重复元素，但仍然保持剩下的元素顺序不变。

##### 解决方案:
如果序列中的值是可哈希（hashable）的(可哈希的对象，才可以作为集合的元素，以及字典的键。)，那么这个问题可以通过使用集合和生成器轻松解决。

哈希:列表、集合、字典的 __hash__ 成员函数都是None，因此它们都不能成为字典的元素，或者字典的键。值为整数的变量、小数、字符串和元组，都有__hash__成员函数，因此它们都是可哈希的，可以作为字典的键或集合的元素。整数常量没有__hash__成员函数。对于整数常量x，hash(x)的值就是x，因此整数常量也可以作为集合的元素或字典的键。

In [None]:
def k(items):
    seen=set()
    for item in items:
        if item not in seen:
            yield item
            seen.add(item)

if __name__ == "__main__":
    a = [1, 5, 2, 1, 9, 1, 5, 10] 
    list = (k(a))
    for i in list:
        print(i,end=" ")

只有当序列中的元素是可哈希的时候才能这么做。如果想在不可哈希的对象（比如列
表）序列中去除重复项，需要对上述代码稍作修改：

In [3]:
#运行下面代码的时候重启一下python
def dedupe(items, key=None):
    seen = set()
    for item in items:
        val = item if key is None else key(item)#不理解
        if val not in seen:
            yield item
            seen.add(val) 
if __name__ == "__main__":
    a = [ {'x':1, 'y':2}, {'x':1, 'y':3}, {'x':1, 'y':2}, {'x':2, 'y':4}] 
    print(list(dedupe(a, key=lambda d: (d['x'],d['y']))) )#(我理解的是和max或者min里的key的用法一样)
    print()
    print(list(dedupe(a, key=lambda d: d['x'])) )

[{'x': 1, 'y': 2}, {'x': 1, 'y': 3}, {'x': 2, 'y': 4}]

[{'x': 1, 'y': 2}, {'x': 2, 'y': 4}]


这里参数 key 的作用是指定一个函数用来将序列中的元素转换为可哈希的类型，这么
做的目的是为了检测重复项。

（我理解的是和max或者min里的key的用法一样）

如果想要做的只是去除重复项，那么通常足够简单的办法就是构建一个集合。

In [None]:
a=[1, 5, 2, 1, 9, 1, 5, 10]
print(set(a))


但是这种方法不能保证元素间的顺序不变，因此得到的结果会被打乱。前面展示的解决方案可避免出现这个问题。

本节中对生成器的使用反映出一个事实，那就是我们可能会希望这个函数尽可能的通
用—不必绑定在只能对列表进行处理。

比如，如果想读一个文件，去除其中重复的文本行，可以只需这样处理：


In [None]:
#with open(somefile,'r') as f:
    # for line in dedupe(f): 

我们的 dedupe()函数也模仿了内置函数 sorted()、min()以及 max()对 key 函数的使用方
式。