# 集合

之前看到的列表和字符串都是一种有序序列,而集合set是一种无序的序列.  
因为集合是无序的,所以当集合中存在两个同样的元素的时候,Python只会保护其中的一个(唯一性);同时为了确保其中不包含同样的元素,集合中放入的元素只能是不可变的对象(确定性).

## 集合生成

可以用set()函数来显示生成的空集合:

In [1]:
a = set()
type(a)

set

也可以使用一个列表来初始化一个集合:

In [2]:
a = set([1, 2, 3, 1])
a

{1, 2, 3}

In [3]:
type(a)

set

集合会自动去除重复元素1.

可以看到,集合中的元素是用大括号{}包含起来的,这意味着可以用{}的形式来创建集合:

In [4]:
a = {1, 2, 3, 1}
a

{1, 2, 3}

但是创建空集合的时候只能用set来创建,因为在Python中{}创建的是一个空的字典;

In [5]:
s = {}
type(s)

dict

## 集合操作

假设有这样两个集合:

In [6]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}

### 并

两个集合的并,返回包含两个集合所有元素的集合(去除重复).  
可以用方法a.union(b) 或者操作a | b实现.

In [7]:
a.union(b)

{1, 2, 3, 4, 5, 6}

In [8]:
b.union(a)

{1, 2, 3, 4, 5, 6}

In [9]:
a | b

{1, 2, 3, 4, 5, 6}

### 交

两个集合的交,返回包含两个集合共有元素的集合.  
可以用方法a.intersection(b)或者操作a & b实现.

In [10]:
a.intersection(b)

{3, 4}

In [11]:
b.intersection(a)

{3, 4}

In [12]:
a & b

{3, 4}

In [13]:
print (a & b)

set([3, 4])


注意:一般使用print打印set的结果与表示方法并不一致.

### 差

a 和 b 差集,返回只在a 不在b的元素组成的集合.  
可以用方法a.difference(b)或者操作a -b实现.

In [14]:
a.difference(b)

{1, 2}

In [15]:
a - b

{1, 2}

注意,a - b与b - a并不一样,b - a返回的是返回b不在a的元素组成的集合:

In [16]:
b.difference(a)

{5, 6}

In [17]:
b - a

{5, 6}

### 对称差

a和b的对称差集,返回在a或在b中,但是不同时在a和b中的元素组成的集合  
可以用方法a.symmetric_difference(b)或者操作a ^ b实现(异或操作符).

In [18]:
a.symmetric_difference(b)

{1, 2, 5, 6}

In [19]:
b.symmetric_difference(a)

{1, 2, 5, 6}

In [20]:
a ^ b

{1, 2, 5, 6}

### 包含关系

假设现在有这样两个集合:

In [21]:
a = {1, 2, 3}
b = {1, 2}

要判断b是不是a的子集,可以用b.issubset(a)方法,或者更简单的用操作b <= a:

In [22]:
b.issubset(a)

True

In [23]:
b <= a

True

与之对应,也可以用a.issupersub(b)或者a >= b来判断:

In [24]:
a.issuperset(b)

True

In [25]:
a >= b

True

方法只能用来测试子集,但是操作符可以用来判断真子集:

In [26]:
a <= a

True

自己不是自己的真子集:

In [27]:
a < a

False

## 集合方法

### add方法向集合添加单个元素

跟列表的append方法类似,用来向集合添加单个元素.

    s.add(a)

将元素a加入集合s中.

In [28]:
t = {1, 2, 3}
t.add(5)
t

{1, 2, 3, 5}

如果添加的是已有元素,集合不改变:

In [29]:
t.add(3)
t

{1, 2, 3, 5}

### update方法向集合添加多个元素

跟列表的extend方法类似,用来向集合添加多个元素.

    s.update(seq)

将seq中的元素添加到s中.

In [30]:
t.update([5, 6, 7])
t

{1, 2, 3, 5, 6, 7}

### remove方法移除单个元素

    s.remove(ob)

从集合s中移除元素ob,如果不存在会报错.

In [31]:
t.remove(1)

In [32]:
t

{2, 3, 5, 6, 7}

In [33]:
t.remove(10)

KeyError: 10

### pop方法弹出元素

由于集合没有顺序,不能像列表一样按照位置弹出元素,所以pop方法删除并返回任意一个元素,如果没有则报错

In [34]:
t.pop()

2

In [35]:
print t

set([3, 5, 6, 7])


In [36]:
s = set()
s.pop()

KeyError: 'pop from an empty set'

### discard方法

作用于remove一样,但是当元素在集合中不存在的时候不会报错.

In [37]:
t.discard(3)
t

{5, 6, 7}

不存在的元素不会报错:

In [38]:
t.discard(20)
t

{5, 6, 7}

### difference_update方法

    a.difference_update(b)

从a 中去除所有属于b的元素:

In [39]:
a.difference_update(b)
a

{3}