# 集合 set
- 集合是高中数学中的一个概念
- 一堆确定的无序的唯一的数据，集合中每个数据称为一个元素
- 集合的特征
    - 集合内数据无序，所以没有索引或者下标的概念，也无法分片
    - 集合内部数据元素具有唯一性，可以用来排除重复数据,数据量大的话用另外的方法排重比较好
    - 集合内的数据，str,int,float,tuple,等都可，即只能放可哈希的数据
    

# 可哈希不可哈希？
- 可哈希的数据类型，即不可改变的数据结构，如字符串string，元组tuple，对象集objects
- 不可哈希的数据类型，即数据结构可以改变，如字典dict，列表list，集合set
- 哈希：它是一个将大体量数据转化为很小数据的过程，甚至可以仅仅是一个数字，以便我们可以用在固定的时间复杂度下查询它，所以，哈希对高效的算法和数据结构很重要。

In [2]:
# 集合的定义
s = set()
print(type(s))
print(s)

<class 'set'>
set()


In [7]:
# 如果只用空大括号定义，则定义的是一个dict类型
d = {}
print(type(d))
print(d)

# 大括号里面如果有数值，则定义的是集合
s = {1,2,3,4,5}
print(type(s))
print(s)

<class 'dict'>
{}
<class 'set'>
{1, 2, 3, 4, 5}


In [9]:
# 集合可以排重
s = {1,2,3,4,4,5,6,6,7}
print(s)

{1, 2, 3, 4, 5, 6, 7}


# 集合的操作
- 成员检测：in, not in

# 集合的遍历

In [12]:
# 集合的遍历
s = {4,2,"A","C"}
for i in s:
    print(i,end=" ")
# 输出结果反映了集合的无序性

2 C 4 A 

In [16]:
# 带有元组的集合遍历
s = {(1,2,3),("I","like","python"),(4,5,6)}
for k,m,n in s:
    print(k,"--",m,"--",n)

#集合里面套集合的不可如上遍历
s = {(1,2,3),("I","like","python"),{4,5,6}} # 这里面，{4,5,6}是不可哈希的
for k,m,n in s:
    print(k,"--",m,"--",n)

4 -- 5 -- 6
I -- like -- python
1 -- 2 -- 3


TypeError: unhashable type: 'set'

# 集合的内涵

In [18]:
# 普通集合内涵
# 以下集合自动去重
s = {1,2,3,4,4,5,6,6,7}
print(s)

# 普通集合内涵
ss = {i for i in s}
print(ss)

{1, 2, 3, 4, 5, 6, 7}
{1, 2, 3, 4, 5, 6, 7}


In [21]:
# 带条件的集合内涵
ss = {i for i in s if i%2==0} # 其实就是类似于列表生成式
print(ss)

{2, 4, 6}


In [26]:
# 多循环的集合内涵
s1 = {1,2,3,4}
s2 ={"A","B","C","D"}
s = {m*n for m in s1 for n in s2 if m<3}
print(s)

{'BB', 'A', 'C', 'B', 'CC', 'DD', 'AA', 'D'}


# 集合相关的函数
- len, max, min: 使用跟其他数据结构的一样
- 特有的函数：
    - add: 向集合内添加元素
    - remove,discard: 删除
    - copy：拷贝
    - clear：原址清空数据
    - pop：看起来像是随机删除一个元素
    - 集合的交差并补
- 集合可以相减，但不可相加


In [3]:
# add
s ={1}
s.add("A")
print(s)

{'A', 1}


In [5]:
# clear,结果表明clear只是原地清空数据
s = {1,2,3,4}
print(s)
print((id(s)))
s.clear()
print(s)
print(id(s))

{1, 2, 3, 4}
74492168
set()
74492168


In [7]:
# copy：拷贝
s = {1,2,3,4}
print(id(s))
s1 = s.copy()
print(id(s1))

74491944
74492168


In [11]:
# remove,移除指定的值，如果要删除的值不在set中，会报错
s = {1,2,3,4}
print(s)
s.remove(4)
print(s)
s.remove(100)
print(s)

{1, 2, 3, 4}
{1, 2, 3}


KeyError: 100

In [12]:
# discard: 移除集合中指定的值，跟remove类似，但如果要删除的值不在set中，也不会报错
s = {1,2,3,4}
print(s)
s.discard(4)
print(s)
s.discard(100)
print(s)

{1, 2, 3, 4}
{1, 2, 3}
{1, 2, 3}


In [20]:
# pop 随机移除一个元素，其实可能存在某种内部规律
s = {4,2,3,4,5}
s1 = s.pop()
print(s1)
print(s)

2
{3, 4, 5}


In [25]:
# 集合的交差并补
# intersection: 交集
# difference：差集
# union：并集
# issubset：检查一个集合是否为另一个子集
# issuperset：检查一个集合是否是另一个集合的超集,
#   如果一个集合包含另一个集合，则这个集合称为另一个集合的超集，而另一个集合称为这个集合的子集
s1 = {1,2,3,4,5,6}
s2 = {5,6,7,8,9}

s_1 = s1.intersection(s2)
print(s_1)
s_2 = s1.difference(s2)
print(s_2)
s_3 = s1.issubset(s2)
print(s_3)
s_4 = s1.issuperset(s2)
print(s_4)
s_6 = s1.union(s2)
print(s_6)

s2 = {2,3}
s_5 = s1.issuperset(s2)
print(s_5)

{5, 6}
{1, 2, 3, 4}
False
False
{1, 2, 3, 4, 5, 6, 7, 8, 9}
True


In [26]:
# 集合的数学操作
s1 = {1,2,3,4,5,6}
s2 = {5,6,7,8,9}
s_1 = s1-s2
print(s_1)

s_2 = s1+s2  # 两个集合不可相加
print(s_2)


{1, 2, 3, 4}


TypeError: unsupported operand type(s) for +: 'set' and 'set'

# frozen set: 冰冻集合
- 冰冻集合就是不可以进行任何修改的集合
- frozenset是一种特殊的集合，所以集合可以的操作，除了修改，都可以进行

In [29]:
# 创建冰冻集合
s = frozenset()
print(s)
print(type(s))

frozenset()
<class 'frozenset'>
