## 集合运算

### 交集

集合论中，设A, B 两个集合，由所有属于集合A 且 属于集合B的元素所组成的集合，叫做集合A 与集合B 的交集(intersection)

In [1]:
s1 = {1, 2, 3}
s2 = {2, 3, 4}

In [6]:
s1.intersection(s2) # 返回结果集，原地不做修改的函数 , 交集是有一个有交换率的

{2, 3}

In [3]:
s1

{1, 2, 3}

In [4]:
s2

{2, 3, 4}

In [5]:
s2.intersection(s1)

{2, 3}

In [7]:
s1.intersection_update(s2) # 原地修改，并返回None

In [8]:
s1

{2, 3}

In [9]:
s2

{2, 3, 4}

In [12]:
s1 = {1, 2, 3}

In [13]:
s2

{2, 3, 4}

In [16]:
s1 & s2 # 交集运算重载符

{2, 3}

In [17]:
s2 & s1

{2, 3}

### 差集

集合A 和集合B ，当集合C 的元素仅仅存在于A中，但不存在于B中，并且A中存在、B中不存在的元素，全部存在C中，那么C是A的差集

In [19]:
s1

{1, 2, 3}

In [20]:
s2

{2, 3, 4}

In [21]:
s1.difference(s2)

{1}

In [22]:
s2.difference(s1)

{4}

差集 是不具备交换率的

In [23]:
s1.difference_update(s2)

In [24]:
s1

{1}

In [25]:
s1 = {1, 2, 3}

In [26]:
s1 - s2 # - 是差集的运算重载符

{1}

In [27]:
s2 - s1

{4}

### 对称差集

集合A 与  集合B：一个元素，要么在集合A中，要么在集合B中

In [28]:
s1

{1, 2, 3}

In [29]:
s2

{2, 3, 4}

In [30]:
s1.symmetric_difference(s2)

{1, 4}

In [31]:
s2.symmetric_difference(s1)

{1, 4}

对称差集也是巨有交换率的

In [32]:
s1.symmetric_difference_update(s2)

In [33]:
s1

{1, 4}

In [34]:
s2

{2, 3, 4}

In [35]:
s1.symmetric_difference_update(s2)

In [36]:
s1

{1, 2, 3}

In [37]:
s1

{1, 2, 3}

In [38]:
s2

{2, 3, 4}

In [39]:
s1 ^ s2

{1, 4}

### 并集

若A 和 B， 则A和B 并集是所有A的元素 和所有B的元素 而没有其他元素的集合。

In [41]:
s1.union(s2)

{1, 2, 3, 4}

In [42]:
s1

{1, 2, 3}

In [43]:
s2

{2, 3, 4}

In [44]:
s2.union(s1)

{1, 2, 3, 4}

并集也具有交换率

In [45]:
s1.update(s2)

In [46]:
s1

{1, 2, 3, 4}

In [47]:
s1

{1, 2, 3, 4}

In [48]:
s1 = {1, 2, 3}

In [49]:
s2

{2, 3, 4}

In [50]:
s1.update(s2)

In [51]:
s1

{1, 2, 3, 4}

In [52]:
s1 + s2

TypeError: unsupported operand type(s) for +: 'set' and 'set'

In [53]:
s1 | s2

{1, 2, 3, 4}

In [54]:
s1

{1, 2, 3, 4}

In [55]:
s1 = {1, 2, 3}

In [57]:
s1 | s2 # | 是并集的运算重载符

{1, 2, 3, 4}

### 补集

补集一般指绝对补集，设S 是一个集合，A 是S 的一个子集，由S中所有不属于A的元素 组成的集合 叫做子集A 在S中的绝对补集（简称补集或 余集）

在程序语言中，没有补集运算

因为在程序中，无法定义出绝对全集，所以无法求出绝对补集

#### 同或 和 异或的概念

5 xor 2 = ?

5: 0101

2: 0010

  0111
  
= 7

In [58]:
a = 9
b = 11

In [59]:
a, b = b ,a

In [60]:
a

11

In [61]:
b

9

In [62]:
a, b = b, a

In [63]:
a = a^ b

In [64]:
a

2

In [65]:
bin(9)

'0b1001'

In [66]:
bin(11)

'0b1011'

In [67]:
# 0010 = 2


In [68]:
b = b^ a

In [69]:
b

9

In [70]:
a

2

In [71]:
a = a ^ b

In [72]:
a

11

In [74]:
a = a ^ b
b = b ^ a
a = a ^ b

In [75]:
a

11

In [76]:
b

9

### 集合相关的判断

In [77]:
s1 = {1, 2, 3, 4}
s2 = {2, 3}

如果一个集合S2， 每一个元素都在集合S1 中， 且集合S1 可能包含S2 中没i有的元素，则集合S1 就是S2的一个超集， S2 就是S1 的一个子集

In [78]:
s2.issubset(s1)

True

In [79]:
s1.issubset(s2)

False

In [80]:
s1.issuperset(s2)

True

In [81]:
s2.issuperset(s1)

False

In [82]:
def _issubset(s1, s2):
    for x in s1:
        if x not in s2:
            return False
    return True

In [83]:
s1

{1, 2, 3, 4}

In [84]:
s2

{2, 3}

In [85]:
_issubset(s1, s2)

False

In [86]:
_issubset(s2, s1)

True

In [87]:
def _issuperset(s1, s2):
    for x in s2:
        if x not in s1:
            return False
    return True

In [88]:
_issuperset(s1, s2)

True

In [89]:
s1

{1, 2, 3, 4}

In [90]:
s2

{2, 3}

In [91]:
s1.isdisjoint(s2)

False

In [92]:
s3 = {1, 2}

In [93]:
s4 = {3, 4}

In [94]:
s3.isdisjoint(s4)

True

isdisjoint 判断2个集合 是否有交集，如果有交集 返回False， 如果没有交集 返回True

### 集合的应用

- 去重
- 运算快

有一个API, 需要通过权限认证，并且 需要有一定得权限才可以访问

例如： 要求满足权限A,B,C 中任意一项， 有一个用户具有权限B, C, D 那么此用户是否有权限访问API呢？

如何判断？

In [95]:
s1 = {'A', 'B', 'C'}
s2 = {'B', 'C', 'D'}

In [96]:
if not s1.isdisjoint(s2):
    print('get api success')

get api success


有一个任务列表， 存储全部的人物，有一个列表，存储已经完成的任务，找出未完成的任务

怎么办？

### 集合的限制

- list
- tuple
- bytes
- bytearray
- str
- set

In [98]:
s1.add(3)

In [99]:
s1

{'C', 'A', 'B', 3}

In [100]:
s1

{'C', 'A', 'B', 3}

In [101]:
s1.add(3)

In [102]:
s1

{'C', 'A', 'B', 3}

In [103]:
{1, 2, 3}

{1, 2, 3}

In [104]:
{1, 'a'}

{1, 'a'}

In [105]:
{'a', 'b'}

{'a', 'b'}

In [106]:
{[1, 2, 3], [2, 3, 4]}

TypeError: unhashable type: 'list'

In [107]:
{bytearray(b'abc')}

TypeError: unhashable type: 'bytearray'

In [108]:
{{3}}

TypeError: unhashable type: 'set'

In [109]:
{(1, 2)}

{(1, 2)}

In [110]:
{b'abc'}

{b'abc'}

**集合元素 必须可hash**

In [111]:
hash(b'abc')

3207415984564917395

In [112]:
hash(1)

1

In [113]:
hash('a')

-6272950950161308399

In [114]:
hash([1,2])

TypeError: unhashable type: 'list'

In [115]:
hash({1, 2})

TypeError: unhashable type: 'set'

In [116]:
hash(bytearray(b'abc'))

TypeError: unhashable type: 'bytearray'

In [117]:
a = 1

In [119]:
a.__hash__()

1

In [120]:
help(hash)

Help on built-in function hash in module builtins:

hash(obj, /)
    Return the hash value for the given object.
    
    Two objects that compare equal must also have the same hash value, but the
    reverse is not necessarily true.



In [121]:
l = [1,2]

In [122]:
l.__hash__()

TypeError: 'NoneType' object is not callable