# 集合 set

集合 ( set ) 就像是「只有鍵，沒有值」的字典，一個集合裡所有的鍵都不會重複，因為集合不會包含重複的資料的特性，常用來進行去除重複的字元、或判斷元素間是否有交集、聯集或差集之類的關聯性。

## 建立集合 

集合由「數字、字串或布林」所組成，同一個集合裡的項目，可以是不同的型別，建立集合有兩種方式：

* <font color=#FF6600>set()</font>

使用 set() 可以建立空集合，或將串列、tuple、字串或字典轉換為集合，使用的方法為「set(要變成集合的元素)」。

`如果建立時出現重複的項目，只會保留一個，如果是字典，只會保留鍵，如果是布林，True 等同 1，False 等同 0。`

In [9]:
a = set()
b = set([1,2,3,4,5,1,2,3,4,5])
c = set({'x':1,'y':2,'z':3})
d = set('hello')
print(a)   # set()
print(b)   # {1, 2, 3, 4, 5}  只留下不重複的部分
print(c)   # {'x', 'y', 'z'}  如果是字典，只保留鍵
print(d)   # {'l', 'o', 'h', 'e'}  只留下不重複的部分

set()
{1, 2, 3, 4, 5}
{'y', 'x', 'z'}
{'h', 'l', 'o', 'e'}


* <font color=#FF6600>set()</font>

如果不是空集合，可以使用「{項目}」建立集合 ( 單純寫大括號，會變成「空字典」 )。

In [10]:
a = {0,1,2,3,'a','b',False}
print(a)  # {0, 1, 2, 3, 'a', 'b'}  False 等同於 0，所以只保留 0

{0, 1, 2, 3, 'a', 'b'}


## add() 加入項目

使用「集合.add(項目)」可以將某個項目加入集合中，下面的程式會將 x 和 y 兩個文字加入 a 集合。

In [11]:
a = {0,1,2,3,4,5}
a.add('x')
a.add('y')
print(a)   # {0, 1, 2, 3, 4, 5, 'x', 'y'}

{0, 1, 2, 3, 4, 5, 'x', 'y'}


## 移除項目

有兩種方法可以移除集合裡的某個項目：

* <font color=#FF6600>remove()</font>

使用「集合.remove(項目)」，可以將指定的項目移除，不過如果該項目不存在，就會執行錯誤。

In [12]:
a = {0,1,2,3,'x','y','z'}
a.remove('x')
print(a)   # {0, 1, 2, 3, 'y', 'z'}

{0, 1, 2, 3, 'y', 'z'}


* <font color=#FF6600>discard()</font>

如果不希望在移除項目時發生執行錯誤的狀況，可以使用「集合.discard(項目)」，將指定項目移除

In [13]:
a = {0,1,2,3,'x','y','z'}
a.discard('x')
a.discard('a')   # 不會發生錯誤
print(a)         # {0, 1, 2, 3, 'y', 'z'}

{0, 1, 2, 3, 'y', 'z'}


## 交集、聯集、差集、對稱差集

集合有四種運算型態，分別是「交集、聯集、差集、對稱差集」，透過下圖可以了解四種運算型態。

![image.png](attachment:image.png)

使用集合運算有兩種方法，一種是使用特定的方法，另外一種則是使用「符號」( 集合運算子 )

|集合	|方法	|運算子|
| - | - | - |
|交集	|a.intersection(b)	|a&b|
|聯集	|a.union(b)	|a｜b|
|差集	|a.difference(b)	|a-b|
|對稱差集	|a.symmetric_difference(b)	|a^b|

下方的程式，會呈現進行 a 對 b 進行集合運算後的結果。

In [14]:
a = {1,2,3,4,5}
b = {3,4,5,6,7}

# 交集
print(a.intersection(b))   # {3, 4, 5}
print(a&b)                 # {3, 4, 5}
# 聯集
print(a.union(b))          # {1, 2, 3, 4, 5, 6, 7}
print(a|b)                 # {1, 2, 3, 4, 5, 6, 7}
# 差集
print(a.difference(b))     # {1, 2}
print(a-b)                 # {1, 2}
# 對稱差集
print(a.symmetric_difference(b))  # {1, 2, 6, 7}
print(a^b)                        # {1, 2, 6, 7}

{3, 4, 5}
{3, 4, 5}
{1, 2, 3, 4, 5, 6, 7}
{1, 2, 3, 4, 5, 6, 7}
{1, 2}
{1, 2}
{1, 2, 6, 7}
{1, 2, 6, 7}


## 子集合、超集合 

假設有 A、B 兩個集合，超集合和子集合的關係可以參考下圖：

|集合	| 說明	|
| - | - | 
|超集合	|A 完全包含 B，A 和 B 所包含的元素可能完全相同|
|真超集合	|A 完全包含 B，且具有 B 沒有的的元素|
|子集合	|B 完全被 A 包含，A 和 B 所包含的元素可能完全相同|
|真子集合	|B 完全被 A 包含，且 A 具有 B 沒有的的元素|

![image.png](attachment:image.png)

下面的程式列出四個集合，使用「大於、小於、等於」可以呈現彼此的關係，從印出的結果可以看到各個集合之間的關係。

In [15]:
a = {1,2,3,4,5,6,7}
b = {3,4,5,6,7}
c = {1,2,3,4,5,6,7}
d = {6,7,8,9}

print(a <= a)   # True 自己是自己的子集合
print(b <= a)   # True b 是 a 的子集合
print(b < a)    # True b 也是 a 的真子集合 ( 因爲沒有等於，完全包含 )
print(c <= a)   # True c 是 a 的子集合
print(a <= c)   # True a 也是 c 的子集合
print(d < a)    # False d 和 a 沒有子集合或超集合關係

True
True
True
True
True
False


此外，使用「b.issubset(a)」方法可以檢測 b 是否為 a 的子集合、「a.issuperset(b)」方法可以檢測 a 是否為 b 的超集合。

In [16]:
a = {1,2,3,4,5,6,7}
b = {3,4,5,6,7}
c = {1,2,3,4,5,6,7}
d = {6,7,8,9}

print(b.issubset(a))     # True b 是 a 的子集合
print(a.issuperset(b))   # True a 是 b 的超集合
print(c.issubset(a))     # True c 是 a 的子集合
print(d.issubset(a))     # Fasle d 不是 a 的子集合

True
True
True
False


## len() 取得長度

使用「len(集合)」可以回傳某個集合的長度 ( 有幾個元素 )。

In [17]:
a = {1,2,3,4,5,6,7}
print(len(a))   # 7

7


## in 檢查是否存在

使用「元素 in 集合」可以檢查集合中是否存在某個元素，如果存在就是 True，不存在就是 False ( 使用「元素 not in 集合」可以判斷不存在 )。

In [18]:
a = {'a','b','c','d',1,2,3}
print('b' in a)    # True
print(2 in a)      # True
print(99 in a)     # False

True
True
False
