## 去除序列中的重复元素，但仍保持剩下的元素顺序不变。

In [1]:
# 构建集合 set()可以去重，但是不能保证元素顺序。
l = [1,2,3,4,4,5,2,1,6]
set(l)

{1, 2, 3, 4, 5, 6}

In [8]:
# 元素可哈希 int float bool tuple
def deque(items):
    seen = set()
    for item in items:
        if item not in seen:
            yield item
            seen.add(item)
list(deque([1,2,3,4,5,5,5,1]))

[1, 2, 3, 4, 5]

In [9]:
list(deque([[1,2],[2,3],[1,2]]))

TypeError: unhashable type: 'list'

In [11]:
# 元素可哈希 list set dict
def deque2(items,key=None):
    seen = set()
    for item in items:
        val = item if key==None else key(item) # 利用key函数把不可哈希 转换成可哈希元素
        if val not in seen:
            yield item
            seen.add(val) # 集合的值和字典的键 都必须为可哈希值 所以通过key转换
unhash_list = [[1,2],[2,3],[1,2]]
list(deque2(unhash_list,key=lambda item:(item[0],item[1])))

[[1, 2], [2, 3]]

In [14]:
# 第六行已经有去重功能 所以第三行set()去重没有意义 可以用list替代，列表可以存放可哈希和不可哈希元素
def deque3(items):
    seen = list()
    for item in items:
        if item not in seen:
            yield item
            seen.append(item)
unhash_list = [[1,2],[2,3],[1,2]]
list(deque3(unhash_list))

[[1, 2], [2, 3]]

## int, float, bool, str, tuple 为不可变数据类型，可哈希
## list, set, dict 为可变数据类型，不可哈希
## set里的元素，dict的键必须是不可哈希的 也就是不能是list，set，dict

In [None]:
# 可哈希数据类型，值和内存地址一一相对
a = 2
print(id(a),a)
a+=1
print(id(a),a) # 值改变了 内存地址也改变 内存地址和值相关
b = 2
print(id(b),b)# 和最开始的a值都为2，内存地址也一致
c = 3
print(id(c),c)


4461574688 2
4461574720 3
4461574688 2
4461574720 3


In [None]:
# 不可哈希数据类型，值和内存地址无关
a = [1, 2, 3]
print(id(a), a)
a.append(4)
print(id(a), a)  # 值改变了 内存地址不变 内存地址和对象相关
b = [1, 2, 3,4]
print(id(b),b)  # 相同的值 内存地址不同

140206048491584 [1, 2, 3]
140206048491584 [1, 2, 3, 4]
140206049279872 [1, 2, 3, 4]


In [None]:
a = {1,2,3,4}

In [None]:
a = {[1,2],[2,3],[3,4]}

TypeError: unhashable type: 'list'

In [None]:
{{1:'a',2:'b'},{3:'a',4:'b'}}

TypeError: unhashable type: 'dict'

In [None]:
{[1,2]:3,[1]:5}

TypeError: unhashable type: 'list'

In [None]:
[{1},{2,3}]

[{1}, {2, 3}]

In [None]:
{1:'a',2:'b',1:'c'} # 字典的键也可以去重

{1: 'c', 2: 'b'}