### 写在前面
> 学过了前面的数据类型-字典，在我的理解里，集合就是一个只有键，没有值的字典。

### 集合的定义

In [1]:
# 不重复，无序，和字典一样，大括号{}括起来
basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
print(basket)

{'banana', 'pear', 'apple', 'orange'}


In [6]:
# 使用set方法创建
s1 = set("qiwsir")
print(s1)

s2 = set([123,"google","face","book","facebook","book"])
print(s2)

{'r', 'q', 'i', 's', 'w'}
{'face', 123, 'book', 'facebook', 'google'}


In [7]:
# 不支持列表作为集合元素
s3 = set([123,[1,2]])

TypeError: unhashable type: 'list'

In [9]:
# 不支持字典作为集合元素
s4 = set([123,{1:'abc', 2:'def'}])

TypeError: unhashable type: 'dict'

**注：set(< iter >)，<iter>包括包括列表，字典，元组，字符串。**

In [11]:
# 注意上面两种定义方式的差别
print({'foo'})
print(set('foo'))

{'foo'}
{'f', 'o'}


In [13]:
# 定义一个空集合，只能使用set()
print(set(), type(set()))
print({}, type({}))

set() <class 'set'>
{} <class 'dict'>


### 集合上的操作
虽然，集合没有索引、切片这些操作，但是，Python提供了另外的一些操作，这些操作基本上都是模仿数学集合上定义上的操作。

In [19]:
# 并集操作
x1 = {'foo', 'bar', 'baz'}
x2 = {'baz', 'qux', 'quux'}

# union 
print(x1.union(x2), x1 | x2)


{'quux', 'baz', 'foo', 'qux', 'bar'} {'quux', 'baz', 'foo', 'qux', 'bar'}


In [20]:
# |和union的差别
# |的两端需要都是集合，本例右端是元组，所以会报错。
x1 | ('baz', 'qux', 'quux')

TypeError: unsupported operand type(s) for |: 'set' and 'tuple'

In [21]:
# union先将可以迭代的参数，转换成集合，然后再执行union操作。
x1.union(('baz', 'qux', 'quux'))

{'bar', 'baz', 'foo', 'quux', 'qux'}

标准语法：
x1.union(x2[, x3 ...])
x1 | x2 [| x3 ...]

In [22]:
# 交集操作
# intersection和&
x1 = { 'foo','bar','baz' } 
x2 = { 'baz', 'qux', 'quux'}

print(x1.intersection(x2))
print(x1 & x2)

{'baz'}
{'baz'}


标准语法：
x1.intersection(x2[, x3 ...])
x1 & x2 [& x3 ...]

In [23]:
# 差值操作
# difference 和 -
x1 = { 'foo','bar','baz' } 
x2 = { 'baz', 'qux', 'quux'}

print(x1.difference(x2))
print(x1 - x2)

{'foo', 'bar'}
{'foo', 'bar'}


标准语法：
x1.difference(x2[, x3 ...])
x1 - x2 [- x3 ...]

In [26]:
# 对称差集
# symmetric_difference和^
x1 = { 'foo','bar','baz' } 
x2 = { 'baz', 'qux', 'quux'}

print(x1.symmetric_difference(x2))
print(x1 ^ x2)
# 等价于
print((x1 - x2) | (x2 - x1))

{'quux', 'foo', 'qux', 'bar'}
{'quux', 'foo', 'qux', 'bar'}
{'quux', 'foo', 'qux', 'bar'}


标准语法：
x1.symmetric_difference(x2)
x1 ^ x2 [^ x3 ...]

注：symmetric_difference不支持多值操作。

In [28]:
# isdisjoint
# 确定两个集合是否具有任何共同的元素。
x1 = { 'foo','bar','baz' } 
x2 = { 'baz', 'qux', 'quux'}

# 如果没有共同的元素，则返回真
print(x1.isdisjoint(x2))
print(x1.isdisjoint(x2-{'baz'}))

False
True


In [30]:
# issubset 和 <=(<)
# 确定一个集合是否是另一个集合的子集
x1 = { 'foo','bar','baz' } 
x2 = { 'baz', 'qux', 'quux'}

print(x1.issubset(x2))
print((x2-{'qux','quux'}).issubset(x1))

False
True


同issubset类似，还有issuperset和 >=(>)的操作方法。

### 集合的修改

虽然集合中包含的元素必须是不可变类型，但可以修改集合本身。与上述操作类似，可以使用多种运算符和方法来更改集合的内容。

上面列出的每个并集，交集，差异和对称差异运算符都有一个可用于修改集合的扩充赋值形式。对于每个，也有相应的方法。

In [36]:
# update 和 |=
x1 = { 'foo','bar','baz' } 
x2 = { 'baz', 'qux', 'quux'}

x1 |= x2
print(x1)

x1 = { 'foo','bar','baz' } 
x1.update(x2)
print(x1)

{'quux', 'baz', 'foo', 'qux', 'bar'}
{'quux', 'baz', 'foo', 'qux', 'bar'}


In [38]:
# intersection_update 和 &=
x1 = { 'foo','bar','baz' } 
x2 = { 'baz', 'qux', 'quux'}

x1 &= x2
print(x1)

x1 = { 'foo','bar','baz' } 
x1.intersection_update(x2)
print(x1)

{'baz'}
{'baz'}


In [41]:
# symmetric_difference_update 和 ^=
x1 = { 'foo','bar','baz' } 
x2 = { 'baz', 'qux', 'quux'}

x1 ^= x2
print(x1)

x1 = { 'foo','bar','baz' }
x1.symmetric_difference_update(x2)
print(x1)

{'quux', 'foo', 'qux', 'bar'}
{'quux', 'foo', 'qux', 'bar'}


### 其他修改集合的方法

In [42]:
# x.add(<elem>)
x = {'foo', 'bar', 'baz'}
x.add('qux')

print(x)

{'foo', 'qux', 'baz', 'bar'}


In [44]:
# x.remove(<elem>)
x = {'foo', 'qux', 'baz', 'bar'}
x.remove('qux')

print(x)

# 如果要移除的对象不在，则引发异常
x.remove('aaa')

{'foo', 'bar', 'baz'}


KeyError: 'aaa'

x.discard(<elem>)的功能同remove，只不过如果要移除的对象不在集合中，不报错。

In [50]:
# x.pop()
# 从集合中随机删除元素
x = {'foo', 'qux', 'baz', 'bar'}
e1 = x.pop()
print(e1, x)

e2 = x.pop()
print(e2, x)

e3 = x.pop()
print(e3, x)

e4 = x.pop()
print(e4, x)

e5 = x.pop()
print(e5, x)

foo {'bar', 'baz', 'qux'}
bar {'baz', 'qux'}
baz {'qux'}
qux set()


KeyError: 'pop from an empty set'

In [51]:
# 文档介绍的很清楚，但是我实际操作，pop的总是从前往后（从左往右）pop值出来
help(set.pop)

Help on method_descriptor:

pop(...)
    Remove and return an arbitrary set element.
    Raises KeyError if the set is empty.

