# 集合（Set）
- 与数学中集合的概念一致
- 无序性：元素是无序的（不能当做一个有序数据用）
- 唯一性：不会包含重复元素
- 集合的创建方法：
    - 通过set关键字
    - 使用大括号创建
    - 使用集合解析式创建
- 参考：
    - [Python set() 函数](https://www.runoob.com/python/python-func-set.html)

In [8]:
# 集合的定义

# 1.通过set关键字创建
sa = set()
print(sa)

li = [1,5,2,3,85,4,21,66,41,2,1,5,3,2]
sb = set(li)
print(sb) # 输出结果无重复元素

# 2.使用大括号创建
sc = {1,5,2,3,85,4,21,66,41,2,1,5,3,2}
print(sc)

set()
{1, 2, 3, 4, 5, 66, 41, 85, 21}
{1, 2, 3, 4, 5, 66, 41, 85, 21}


## 集合解析式
- 能够自动实现去重
- 语法：{expression for i in iterable}

In [1]:
# 使用集合解析式创建集合，并自动去重
x = ['a', 'b', 'c', 'a', 'v', 'v']

y = {i for i in x}
print(y)

{'a', 'b', 'c', 'v'}


## 对set的操作
- in操作，用来判断某个元素是否在该集合中
- set的遍历操作

In [16]:
# in操作，用来判断某个元素是否在该集合中
if 2 in sc:
    print("2了")

2了


In [17]:
# set的遍历
# 方法一
for i in sc:
    print(i)

1
2
3
4
5
66
41
85
21


In [18]:
# 方法二
# 集合内各tuple中元素个数必须一致，否则报错
sa = {(1,2,3),("I", "love", "BingBing"),(456,1,87)}

for i,j,k in sa:
    print(i,j,k)

I love BingBing
456 1 87
1 2 3


## 集合的生成式
- 无条件格式：sb = {i for i in sa}
- 条件格式：sb = {i for i in sa if 条件表达式}

In [22]:
# 集合的生成式

sa = {0,1,2,3,4,5,6,7,8,9,10}

# 利用sa生成一个sb
sb = {i for i in sa}
print(sb)

sc = {i for i in sa if i % 2 == 0}
print(sc)

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
{0, 2, 4, 6, 8, 10}


In [25]:
# 1.单层for循环
# 把sa里每个元素平方，并生成一个新的集合
sd = {i**2 for i in sa}
print(sd)

# 2.双层for循环
se = {m*n for m in sa for n in sa}
print(se)

{0, 1, 64, 4, 36, 100, 9, 16, 49, 81, 25}
{0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 15, 16, 18, 20, 21, 24, 25, 27, 28, 30, 32, 35, 36, 40, 42, 45, 48, 49, 50, 54, 56, 60, 63, 64, 70, 72, 80, 81, 90, 100}
43


## 集合的内置函数
- len：取长度（或元素个数）
- max / min：取元素中的最大最小值
- add：向集合中添加元素
- clera：清空
- 删除操作函数：
    - remove：要删除的值不在集合中，则报错
    - discard：要删除的值不在集合中也不会报错
- pop：弹出集合的一个内容，删除的内容随机，不推荐用
- 数学操作函数：
    - sa.intersection(sb)：求sa与sb的交集
    - sa.difference(sb)：求sa与sb的差集，也可用 sa - sb 来表示
    - sa.union(sb)：求sa与sb的并集，与求差集不同，不能用“+”来表示

In [37]:
# 集合的内置函数

# len函数
print(len(se))

# add函数
sa = {0,1,2,3,4,5,6,7,8,9,10}
print(sa)
print(sa.add(55)) # 此处输出结果为何不是sa，而是None？
print(sa)

# 因为add函数只进行操作，是没有返回值的
sb = sa.add(55)
print(sb)

43
{0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
None
{0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 55}
None


In [54]:
# 删除操作
# remove和discard的区别
sa = {0,1,2,3,4,5,6,7,8,9,10}
print(sa)

sa.remove(5)
print(sa)

# 若remove要删除的值不在集合中，则报错
sa.remove(5)

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
{0, 1, 2, 3, 4, 6, 7, 8, 9, 10}


KeyError: 5

In [39]:
sa = {0,1,2,3,4,5,6,7,8,9,10}
print(sa)

sa.discard(7)
print(sa)

# 而discard要删除的值不在集合中也不会报错
sa.discard(7)
print(sa)

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
{0, 1, 2, 3, 4, 5, 6, 8, 9, 10}
{0, 1, 2, 3, 4, 5, 6, 8, 9, 10}


In [59]:
# pop弹出集合的一个内容，若集合为空，则报错
# 删除的内容无规律，随机
sa = {0,1,2,3,4,5,6,7,8,9,10}
print(sa)
# 可能默认删除左端第一个元素
sa.pop()
print(sa)

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
{1, 2, 3, 4, 5, 6, 7, 8, 9, 10}


In [60]:
# 集合的数学操作
sa = {1,2,3,4,5,6}
sb = {4,5,6,7,8,9}

# intersection：交集
print(sa.intersection(sb))

# difference：差集
print(sa.difference(sb))
print(sb.difference(sa))
#差集的另一种表示
print(sa - sb)

# union：并集
print(sa.union(sb))

{4, 5, 6}
{1, 2, 3}
{8, 9, 7}
{1, 2, 3}
{1, 2, 3, 4, 5, 6, 7, 8, 9}


## 冰冻集合（Frozenset）
- 不允许修改的集合

In [62]:
# 案列
print(sa)

sb = frozenset(sa)
print(sb)

{1, 2, 3, 4, 5, 6}
frozenset({1, 2, 3, 4, 5, 6})
