<h1>08-python中的集合(set)<span class="tocSkip"></span></h1>
<div class="toc"><ul class="toc-item"><li><span><a href="#创建集合" data-toc-modified-id="创建集合-1"><span class="toc-item-num">1&nbsp;&nbsp;</span>创建集合</a></span></li><li><span><a href="#访问集合元素" data-toc-modified-id="访问集合元素-2"><span class="toc-item-num">2&nbsp;&nbsp;</span>访问集合元素</a></span></li><li><span><a href="#集合添加元素" data-toc-modified-id="集合添加元素-3"><span class="toc-item-num">3&nbsp;&nbsp;</span>集合添加元素</a></span></li><li><span><a href="#删除集合和元素" data-toc-modified-id="删除集合和元素-4"><span class="toc-item-num">4&nbsp;&nbsp;</span>删除集合和元素</a></span></li><li><span><a href="#集合常见方法" data-toc-modified-id="集合常见方法-5"><span class="toc-item-num">5&nbsp;&nbsp;</span>集合常见方法</a></span></li><li><span><a href="#frozenset集合（set集合的不可变版本）" data-toc-modified-id="frozenset集合（set集合的不可变版本）-6"><span class="toc-item-num">6&nbsp;&nbsp;</span>frozenset集合（set集合的不可变版本）</a></span></li></ul></div>

集合（set）是一个无序的不重复元素序列。

可以使用大括号 { } 或者 set() 函数创建集合，**注意：创建一个空集合必须用 set() 而不是 { }，因为 { } 是用来创建一个空字典。**

## 创建集合

**1) 使用 {} 创建**

在 Python 中，创建 set 集合可以像列表、元素和字典一样，直接将集合赋值给变量，从而实现创建集合的目的，其语法格式如下：

`setname = {element1,element2,...,elementn}`

In [1]:
complang = {'c','java','python','go','rust','c'}   # 集合有去重功能
complang

{'c', 'go', 'java', 'python', 'rust'}

In [2]:
complang = {'c','java','python','go','rust','c'}   # 判断元素是否在集合
'java' in complang
#'shell' in complang

True

In [3]:
# 集合运算

a = set('1234567890')    
b = set('abc123')
result1 = a - b     # a - b 是差集
result2 = a | b     # a | b 是并集
result3 = a & b     # a & b 是交集
result4 = a ^ b     # a ^ b 是对称差集

print(result1)
print(result2)
print(result3)
print(result4)

{'4', '7', '0', '6', '9', '5', '8'}
{'4', '9', '3', 'c', 'b', '7', '1', '2', '0', 'a', '6', '8', '5'}
{'3', '1', '2'}
{'6', '8', 'b', '5', '4', 'c', '7', '0', 'a', '9'}


In [4]:
# 集合操作
complang = set('c','java','python','go','rust')

TypeError: set expected at most 1 argument, got 5

**2) set()函数创建集合**

set() 函数为 Python 的内置函数，其功能是将字符串、列表、元组、range 对象等可迭代对象转换成集合。该函数的语法格式如下：

`setname = set(iteration)`

In [5]:
set1 = set('www.baidu.com')
set2 = set([1,2,3,4,5,6])
set3 = set(('a','b','c'))

print("set1:",set1)
print('set2:',set2)
print('set3:',set3)

set1: {'c', 'm', 'w', 'a', '.', 'u', 'o', 'd', 'b', 'i'}
set2: {1, 2, 3, 4, 5, 6}
set3: {'b', 'c', 'a'}


## 访问集合元素

由于集合中的元素是无序的，因此无法向列表那样使用下标访问元素。Python 中，访问集合元素最常用的方法是使用循环结构，将集合中的数据逐一读取出来。

In [6]:
set4 = set(1,'a',[1,2,3],('a','b','c'))
for i in set4:
    print(i,end='\n')      

# 报错原因： set()函数可以创建一个无序不重复的元素集，这个函数至多可以传一个参数；而实例中传了四个参数，所以会报错

# 解决办法
#（1）set()函数直接传一个字符串
#（2）还可以直接传一个列表

TypeError: set expected at most 1 argument, got 4

In [7]:
set5 = {1,'a',('a','b','c')}
for i in set5:
    print(i,end='\n')

1
('a', 'b', 'c')
a


## 集合添加元素

使用 add() 方法添加的元素，只能是数字、字符串、元组或者布尔类型（True 和 False）值，不能添加列表、字典、集合这类可变的数据，否则 Python 解释器会报 TypeError 错误。

In [8]:
a = {1,2,3}
a.add(('a','b'))
print(a)

a.add([4,5,6])   # 报错
print(a)

{('a', 'b'), 1, 2, 3}


TypeError: unhashable type: 'list'

## 删除集合和元素

**删除集合**

In [9]:
a = {1,'a',('a','b','c')}
del a
print(a)

NameError: name 'a' is not defined

**删除集合内元素**

删除现有 set 集合中的指定元素，可以使用 remove() 方法

In [10]:
a = {1,'a',('a','b','c')}
print(a)
a.remove(1)
print(a)

a.remove(1)   # 报错：由于集合中的元素 1 已被删除，因此当再次尝试使用 remove() 方法删除时，会引发 KeyError 错误。
print(a)

{1, ('a', 'b', 'c'), 'a'}
{('a', 'b', 'c'), 'a'}


KeyError: 1

如果我们不想在删除失败时令解释器提示 KeyError 错误，还可以使用 discard() 方法，此方法和 remove() 方法的用法完全相同，唯一的区别就是，当删除集合中元素失败时，此方法不会抛出任何错误。

In [11]:
a = {1,'a',('a','b','c')}
print(a)
a.discard(1)
print(a)

a.discard(1)   # 报错：由于集合中的元素 1 已被删除，因此当再次尝试使用 remove() 方法删除时，会引发 KeyError 错误。
print(a)

{1, ('a', 'b', 'c'), 'a'}
{('a', 'b', 'c'), 'a'}
{('a', 'b', 'c'), 'a'}


## 集合常见方法

In [12]:
dir(set)

['__and__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__iand__',
 '__init__',
 '__init_subclass__',
 '__ior__',
 '__isub__',
 '__iter__',
 '__ixor__',
 '__le__',
 '__len__',
 '__lt__',
 '__ne__',
 '__new__',
 '__or__',
 '__rand__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__ror__',
 '__rsub__',
 '__rxor__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__sub__',
 '__subclasshook__',
 '__xor__',
 'add',
 'clear',
 'copy',
 'difference',
 'difference_update',
 'discard',
 'intersection',
 'intersection_update',
 'isdisjoint',
 'issubset',
 'issuperset',
 'pop',
 'remove',
 'symmetric_difference',
 'symmetric_difference_update',
 'union',
 'update']

| 方法名                        | 语法格式                               | 功能                                                         | 实例                                                         |
| ----------------------------- | -------------------------------------- | ------------------------------------------------------------ | ------------------------------------------------------------ |
| add()                         | set1.add()                             | 向 set1 集合中添加数字、字符串、元组或者布尔类型             | >>> set1 = {1,2,3} >>> set1.add((1,2)) >>> set1 {(1, 2), 1, 2, 3} |
| clear()                       | set1.clear()                           | 清空 set1 集合中所有元素                                     | >>> set1 = {1,2,3} >>> set1.clear() >>> set1 set()  set()才表示空集合，{}表示的是空字典 |
| copy()                        | set2 = set1.copy()                     | 拷贝 set1 集合给 set2                                        | >>> set1 = {1,2,3} >>> set2 = set1.copy() >>> set1.add(4) >>> set1 {1, 2, 3, 4} >>> set1 {1, 2, 3} |
| difference()                  | set3 = set1.difference(set2)           | 将 set1 中有而 set2 没有的元素给 set3                        | >>> set1 = {1,2,3} >>> set2 = {3,4} >>> set3 = set1.difference(set2) >>> set3 {1, 2} |
| difference_update()           | set1.difference_update(set2)           | 从 set1 中删除与 set2 相同的元素                             | >>> set1 = {1,2,3} >>> set2 = {3,4} >>> set1.difference_update(set2) >>> set1 {1, 2} |
| discard()                     | set1.discard(elem)                     | 删除 set1 中的 elem 元素                                     | >>> set1 = {1,2,3} >>> set1.discard(2) >>> set1 {1, 3} >>> set1.discard(4) {1, 3} |
| intersection()                | set3 = set1.intersection(set2)         | 取 set1 和 set2 的交集给 set3                                | >>> set1 = {1,2,3} >>> set2 = {3,4} >>> set3 = set1.intersection(set2) >>> set3 {3} |
| intersection_update()         | set1.intersection_update(set2)         | 取 set1和 set2 的交集，并更新给 set1                         | >>> set1 = {1,2,3} >>> set2 = {3,4} >>> set1.intersection_update(set2) >>> set1 {3} |
| isdisjoint()                  | set1.isdisjoint(set2)                  | 判断 set1 和 set2 是否没有交集，有交集返回 False；没有交集返回 True | >>> set1 = {1,2,3} >>> set2 = {3,4} >>> set1.isdisjoint(set2) False |
| issubset()                    | set1.issubset(set2)                    | 判断 set1 是否是 set2 的子集                                 | >>> set1 = {1,2,3} >>> set2 = {1,2} >>> set1.issubset(set2) False |
| issuperset()                  | set1.issuperset(set2)                  | 判断 set2 是否是 set1 的子集                                 | >>> set1 = {1,2,3} >>> set2 = {1,2} >>> set1.issuperset(set2) True |
| pop()                         | a = set1.pop()                         | 取 set1 中一个元素，并赋值给 a                               | >>> set1 = {1,2,3} >>> a = set1.pop() >>> set1 {2,3} >>> a 1 |
| remove()                      | set1.remove(elem)                      | 移除 set1 中的 elem 元素                                     | >>> set1 = {1,2,3} >>> set1.remove(2) >>> set1 {1, 3} >>> set1.remove(4) Traceback (most recent call last):  File "<pyshell#90>", line 1, in <module>   set1.remove(4) KeyError: 4 |
| symmetric_difference()        | set3 = set1.symmetric_difference(set2) | 取 set1 和 set2 中互不相同的元素，给 set3                    | >>> set1 = {1,2,3} >>> set2 = {3,4} >>> set3 = set1.symmetric_difference(set2) >>> set3 {1, 2, 4} |
| symmetric_difference_update() | set1.symmetric_difference_update(set2) | 取 set1 和 set2 中互不相同的元素，并更新给 set1              | >>> set1 = {1,2,3} >>> set2 = {3,4} >>> set1.symmetric_difference_update(set2) >>> set1 {1, 2, 4} |
| union()                       | set3 = set1.union(set2)                | 取 set1 和 set2 的并集，赋给 set3                            | >>> set1 = {1,2,3} >>> set2 = {3,4} >>> set3=set1.union(set2) >>> set3 {1, 2, 3, 4} |
| update()                      | set1.update(elem)                      | 添加列表或集合中的元素到 set1                                | >>> set1 = {1,2,3} >>> set1.update([3,4]) >>> set1 {1,2,3,4} |

## frozenset集合（set集合的不可变版本）

set 集合是可变序列，程序可以改变序列中的元素；frozenset 集合是不可变序列，程序不能改变序列中的元素。set 集合中所有能改变集合本身的方法，比如 remove()、discard()、add() 等，frozenset 都不支持；set 集合中不改变集合本身的方法，fronzenset 都支持。

In [13]:
dir(frozenset)

['__and__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__ne__',
 '__new__',
 '__or__',
 '__rand__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__ror__',
 '__rsub__',
 '__rxor__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__sub__',
 '__subclasshook__',
 '__xor__',
 'copy',
 'difference',
 'intersection',
 'isdisjoint',
 'issubset',
 'issuperset',
 'symmetric_difference',
 'union']

两种情况下可以使用 fronzenset：

当集合的元素不需要改变时，我们可以使用 fronzenset 替代 set，这样更加安全。

有时候程序要求必须是不可变对象，这个时候也要使用 fronzenset 替代 set。比如，字典（dict）的键（key）就要求是不可变对象。

In [14]:
s = {'java','shell','c++'}
fs = frozenset(['python','ruby'])
s_sub = {'PHP', 'C#'}

# 向set集合中添加frozenset
s.add(fs)
print('s =', s)

# 向为set集合添加子set集合
s.add(s_sub)
print('s =', s)

s = {'c++', 'shell', frozenset({'ruby', 'python'}), 'java'}


TypeError: unhashable type: 'set'