# 集合（Set）

数学中的集合同: 无序，不存在相同元素。

## 集合生成

In [1]:
s = set()
type(s)

set

In [2]:
a = set([1, 2, 3, 1])
a

{1, 2, 3}

集合自动去除重复元素。

In [None]:
a = {1, 2, 3, 1, 1 }
a

{1, 2, 3}

无序, 不能索引

In [None]:
a = {1, 2, 3}
a[1]

TypeError: 'set' object is not subscriptable

In [None]:
a = {1, 2, 3}
for mb in a:
    print(mb)

1
2
3


## 集合操作

假设有这样两个集合：

In [None]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}

### 并

两个集合的并，返回包含两个集合所有元素的集合（去除重复）。

可以用方法 `a.union(b)` 或者操作 `a | b` 实现。

In [None]:
a.union(b)

{1, 2, 3, 4, 5, 6}

In [None]:
b.union(a)

{1, 2, 3, 4, 5, 6}

In [None]:
print(a)
print(b)
print(a | b)

{1, 2, 3, 4}
{3, 4, 5, 6}
{1, 2, 3, 4, 5, 6}


### 交

两个集合的交，返回包含两个集合共有元素的集合。

可以用方法 `a.intersection(b)` 或者操作 `a & b` 实现。

In [None]:
a.intersection(b)

{3, 4}

In [None]:
b.intersection(a)

{3, 4}

In [None]:
a & b

{3, 4}

### 差

`a` 和 `b` 的差集，返回只在 `a` 不在 `b` 的元素组成的集合。

可以用方法 `a.difference(b)` 或者操作 `a - b` 实现。

In [None]:
a.difference(b)

{1, 2}

In [None]:
a - b

{1, 2}

注意，`a - b` 与 `b - a`并不一样，`b - a` 返回的是返回 b 不在 a 的元素组成的集合：

In [None]:
b.difference(a)

{5, 6}

In [None]:
b - a 

{5, 6}

### 对称差

`a` 和`b` 的对称差集，返回在 `a` 或在 `b` 中，但是不同时在 `a` 和 `b` 中的元素组成的集合。

可以用方法 `a.symmetric_difference(b)` 或者操作 `a ^ b` 实现（异或操作符）。

In [None]:
a.symmetric_difference(b)

{1, 2, 5, 6}

In [None]:
b.symmetric_difference(a)

{1, 2, 5, 6}

In [None]:
a ^ b

{1, 2, 5, 6}

### 包含关系

假设现在有这样两个集合：

In [None]:
a = {1, 2, 3}
b = {1, 2}

要判断 `b` 是不是 `a` 的子集，可以用 `b.issubset(a)` 方法，或者更简单的用操作 `b <= a` ：

In [None]:
b.issubset(a)

True

In [None]:
b <= a

True

与之对应，也可以用 `a.issuperset(b)` 或者 `a >= b` 来判断：

In [None]:
a.issuperset(b)

True

In [None]:
a >= b

True

方法只能用来测试子集，但是操作符可以用来判断真子集：

In [None]:
a <= a

True

自己不是自己的真子集：

In [None]:
a < a

False

## 集合方法

### `add` 方法

跟列表的 `append` 方法类似，用来向集合添加单个元素。

    s.add(a)

将元素 `a` 加入集合 `s` 中。

In [None]:
t = {1, 2, 3}
t.add(5)
t

{1, 2, 3, 5}

如果添加的是已有元素，集合不改变：

In [None]:
t.add(3)
t

{1, 2, 3, 5}

### `update` 方法

跟列表的`extend`方法类似，用来向集合添加多个元素。

    s.update(seq)

将`seq`中的元素添加到`s`中。

In [None]:
t.update([5, 6, 7])
t

{1, 2, 3, 5, 6, 7}

### `remove` 方法

    s.remove(ob)

从集合`s`中移除元素`ob`，如果不存在会报错。

In [None]:
t.remove(1)
t

{2, 3, 5, 6, 7}

In [None]:
t.remove(10)

KeyError: 10

### pop方法

由于集合没有顺序，不能像列表一样按照位置弹出元素，所以`pop` 方法删除并返回显示的第一个元素。

In [None]:
t.pop()

2

In [None]:
t

{3, 5, 6, 7}

In [None]:
t.pop()

3

删除空集元素会报错

In [None]:
s = set()
# 报错
s.pop()

KeyError: 'pop from an empty set'

### discard 方法

作用与 `remove` 一样，但是当元素在集合中不存在的时候不会报错。

In [None]:
t.discard(3)

In [None]:
t

{5, 6, 7}

不存在的元素不会报错：

In [None]:
t.discard(20)

In [None]:
t

{5, 6, 7}

### difference_update方法

    a.difference_update(b)

从a中去除所有属于b的元素：

In [1]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
a.difference_update(b)
print(a)

{1, 2}


## 不可变集合

### 生成

In [3]:
s = frozenset([1, 2, 3, 'a', 1])
s

frozenset({1, 2, 3, 'a'})

### 特点

一旦创建就不可以改变, 这样可以用集合来做字典里的键.

比如我们要建立一个两城市间距离的字典, 应以两城市名为键, 距离为键值.

In [5]:
flight_distance = dict() # 字典
flight_distance[frozenset(['Los Angeles', 'New York'])] = 2498
flight_distance[frozenset(['Austin', 'Los Angeles'])] = 1233
flight_distance[frozenset(['Austin', 'New York'])] = 1515
flight_distance

{frozenset({'Los Angeles', 'New York'}): 2498,
 frozenset({'Austin', 'Los Angeles'}): 1233,
 frozenset({'Austin', 'New York'}): 1515}

集合是无序, 下面两种查法都对

In [6]:
flight_distance[frozenset(['New York','Austin'])]

1515

In [7]:
flight_distance[frozenset(['Austin','New York'])]

1515

如果采用有序结构,再只能是不可变的数字,字符串和元组类型.

In [10]:
ticket_price = dict() # 字典
ticket_price[('New York', 'Seattle')] = 100
ticket_price[('Austin', 'New York')] = 200
ticket_price[('New York', 'Austin')] = 400

 对应的不能是距离而是两地的机票价格, 因为来回的机票是不同的记录

In [11]:
print(ticket_price[('Austin', 'New York')])
print(ticket_price[('New York', 'Austin')])

200
400
