# 集合

之前看到的列表和字符串都是一种有序序列，而集合是一种无序的序列。

因为集合是无序的，所以当集合中存在两个同样的元素的时候，Python只会保存其中的一个（唯一性）；同时为了确保其中不包含同样的元素，集合中放入的元素只能是不可变的对象（确定性）。

## 集合生成

可以用`set()`函数来显示的生成空集合：

In [3]:
a = set()

In [4]:
type(a)

set

也可以使用一个列表来初始化一个集合：

In [17]:
a = set([1, 2, 3, 1])  # 等价于 a = {1, 2, 3, 1}

In [18]:
a, type(a)

({1, 2, 3}, set)

集合会自动去除重复元素 1。

集合中的元素是用大括号{}包含起来的，这意味着可以用{}的形式来创建集合：

In [8]:
a = {1, 2, 3, 1}

In [9]:
a

{1, 2, 3}

创建空集合的时候只能用`set()`函数来创建，因为在Python中`{}`创建的是一个空的字典：

In [10]:
s = {}

In [11]:
type(s)

dict

## 集合操作

In [19]:
a = {1, 2, 3, 4}

In [20]:
b = {3, 4, 5, 6}

两个集合的并，返回包含两个集合所有元素的集合（去除重复）。可以用方法 `a.union(b)` 或者操作 `a | b` 实现：

In [21]:
a.union(b)

{1, 2, 3, 4, 5, 6}

In [22]:
a | b

{1, 2, 3, 4, 5, 6}

两个集合的交，返回包含两个集合共有元素的集合。可以用方法 `a.intersection(b)` 或者操作 `a & b` 实现：

In [24]:
a.intersection(b)

{3, 4}

In [25]:
a & b

{3, 4}

In [26]:
b & a

{3, 4}

a 和 b 的差集，返回只在 a 不在 b 的元素组成的集合。可以用方法 `a.difference(b)` 或者操作 `a - b` 实现:

In [27]:
a - b

{1, 2}

In [28]:
b - a

{5, 6}

In [30]:
a.difference(b)

{1, 2}

In [31]:
b.difference(a)

{5, 6}

a 和b 的对称差集，返回在 a 或在 b 中，但是不同时在 a 和 b 中的元素组成的集合。可以用方法 `a.symmetric_difference(b)` 或者操作 `a ^ b` 实现（异或操作符）：

In [32]:
a.symmetric_difference(b)

{1, 2, 5, 6}

In [33]:
b.symmetric_difference(a)

{1, 2, 5, 6}

In [34]:
b ^ a

{1, 2, 5, 6}

In [35]:
a ^ b

{1, 2, 5, 6}

## 包含关系

In [36]:
a = {1, 2, 3}

In [37]:
b = {1, 2}

`.issubset()` 方法或者`b <= a`判断子集：

In [38]:
b.issubset(a)

True

In [39]:
b <= a

True

与之对应，也可以用`.issuperset()`方法或者`a >= b`来判断：

In [40]:
a.issuperset(b)

True

In [41]:
a >= b

True

操作符可以用来判断真子集：

In [43]:
b > a

False

In [44]:
a > b

True

## 集合方法

`.add()`方法添加单个元素：

In [45]:
t = {1, 2, 3}

In [46]:
t.add(5)

In [47]:
t

{1, 2, 3, 5}

如果添加的是已有元素，集合不改变：

In [48]:
t.add(3)

In [49]:
t

{1, 2, 3, 5}

`.update()`方法更新多个元素：

In [50]:
t.update([5, 6, 7])

In [51]:
t

{1, 2, 3, 5, 6, 7}

## 不可变集合

对应于元组与列表的关系，对于集合，Python提供了一种叫做不可变集合的数据结构。

不可变集合使用frozenset()函数来进行创建：

In [52]:
s = frozenset([1, 2, 3, 'a', 1])

In [53]:
s

frozenset({1, 2, 3, 'a'})

In [61]:
s.add(5)  # 不可变集合创建后就不能修改

AttributeError: 'frozenset' object has no attribute 'add'

与集合不同的是，不可变集合一旦创建就不可以改变。

不可变集合的一个主要应用是用来作为字典的键。例如，用一个字典来记录两个城市之间的距离：

In [54]:
flight_distance = {}
city_pair = frozenset(['Los Angeles', 'New York'])
flight_distance[city_pair] = 2498
flight_distance[frozenset(['Austin', 'Los Angeles'])] = 1233
flight_distance[frozenset(['Austin', 'New York'])] = 1515
flight_distance

{frozenset({'Los Angeles', 'New York'}): 2498,
 frozenset({'Austin', 'Los Angeles'}): 1233,
 frozenset({'Austin', 'New York'}): 1515}

由于集合不分顺序，所以不同顺序不会影响查阅结果：

In [55]:
flight_distance[frozenset(['New York','Austin'])]

1515

In [56]:
flight_distance[frozenset(['Austin','New York'])]

1515

In [58]:
flight_distance[frozenset(['Austin','New York'])] = 2000
flight_distance[frozenset(['Austin','New York'])]

2000