# Set 数组

* 集合（set）是一个无序的不重复元素序列。
    * 输入顺序和实际存储数据可能不一样
* 可以使用大括号 { } 或者 set(可迭代obj) 函数创建集合
    * 注意：创建一个空集合必须用 set() 而不是 { }，因为 { } 是用来创建一个空字典。
* set里不能包含有可变对象: list set dict... 但可以涵盖不同数据类型

In [None]:
parame = {value01,value02,...}
# 或者
set(value)

In [67]:
a = {1,2,3}
a

{1, 2, 3}

In [69]:
b = set()
print(type(b))
c = {} # 默认是dictionary
print(type(c))

<class 'set'>
<class 'dict'>


In [86]:
# 输入顺序和实际存储数据可能不一样

d = set([19,3,-4,5])
print(d)
d # {-4, 3, 5, 19}

{3, 19, -4, 5}


{-4, 3, 5, 19}

In [85]:
# 集合（set）是一个无序的不重复元素序列
f = {1,1,1,2,3,2,2,2,3,2,2,2,4}
f

{1, 2, 3, 4}

In [106]:
# set里不能包含有可变对象: list set dict... 但可以涵盖不同数据类型
g = {1,True,"stu",(1,2.0),[1,2],{"a"}}

TypeError: unhashable type: 'list'

In [107]:
# set里不能包含有可变对象: list set dict... 但可以涵盖不同数据类型
g = {1,True,"stu",(1,2.0),(1,2),{"a"}}
g

TypeError: unhashable type: 'set'

## 课外学习，frozenset （不重要）

## 1. 集合运算

In [76]:
# set(可迭代obj)
g = set("ffgjabcdefghidjkadflahdf")
g

{'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l'}

In [77]:
h = set('dhjkfdahskfjhaskdfhaoiquweoiqwu')
h

{'a', 'd', 'e', 'f', 'h', 'i', 'j', 'k', 'o', 'q', 's', 'u', 'w'}

### 差集 difference
set.difference()

In [94]:
g - h # g - gh
g.difference(h)

{(1, 2.0), 1, 'stu'}

In [92]:
h.difference(g) # h - gh

{'a', 'd', 'e', 'f', 'h', 'i', 'j', 'k', 'o', 'q', 's', 'u', 'w'}

### 并集 union

In [97]:
h | g # a 并 b
h.union(g)

{(1, 2.0),
 1,
 'a',
 'd',
 'e',
 'f',
 'h',
 'i',
 'j',
 'k',
 'o',
 'q',
 's',
 'stu',
 'u',
 'w'}

### 交集 intersection

In [103]:
h & g # a 交 b
h.intersection(g)

set()

### 对称差集 symmetric_difference

In [104]:
h ^ g# 不同时包含于a和b的元素 a交b - a并b
h.symmetric_difference(g)

{(1, 2.0),
 1,
 'a',
 'd',
 'e',
 'f',
 'h',
 'i',
 'j',
 'k',
 'o',
 'q',
 's',
 'stu',
 'u',
 'w'}

## 2. 访问set

* 因为set无序，所有index和slicing 都不能使用
* 只能通过for loop遍历 （没什么意义）
* 使用场景：数据量很大，想要判断某个元素是否在其中 -> set

In [90]:
4 in a

False

## 3. set的method

* add()	为集合添加元素
* clear()	移除集合中的所有元素
* copy()	拷贝一个集合
* difference()	返回多个集合的差集
* difference_update()	移除集合中的元素，该元素在指定的集合也存在。
* discard()	删除集合中指定的元素
* intersection()	返回集合的交集
* intersection_update()	返回集合的交集。
* isdisjoint()	判断两个集合是否包含相同的元素，如果没有返回 True，否则返回 False。
* issubset()	判断指定集合是否为该方法参数集合的子集。
* issuperset()	判断该方法的参数集合是否为指定集合的子集
* pop()	随机移除元素
* remove()	移除指定元素
* symmetric_difference()	返回两个集合中不重复的元素集合。
* symmetric_difference_update()	移除当前集合中在另外一个指定集合相同的元素，并将另外一个指定集合中不同的元素插入到当前集合中。
* union()	返回两个集合的并集
* update()	给集合添加元素

### 1. 添加
* `set.add()` 添加一个元素
* `set.update()`

In [110]:
set1 = set(("google","runoob","taobao"))

In [111]:
set1.add("facebook")
print(set1)

{'facebook', 'taobao', 'google', 'runoob'}


In [114]:
set1 = set(("google","runoob","taobao"))
set1.update("facebook",{1,3},{"facebook"})# 添加多个元素
print(set1)

{1, 3, 'facebook', 'k', 'c', 'runoob', 'e', 'o', 'a', 'f', 'b', 'taobao', 'google'}


### 2. 删除
* `set.discard()` 如果元素不在set里，不报错
* `set.remove()` 如果元素不在set里，报错
* `set.pop()`随机删除一个元素

In [117]:
set1.discard(1) # TypeError: set.discard() takes exactly one argument (2 given)

In [119]:
set1.remove(3) # TypeError: set.remove() takes exactly one argument (2 given)

In [120]:
print(set1)
set1.pop()
print(set1)

{'facebook', 'k', 'c', 'runoob', 'e', 'o', 'a', 'f', 'b', 'taobao', 'google'}
{'k', 'c', 'runoob', 'e', 'o', 'a', 'f', 'b', 'taobao', 'google'}


### 3. 计算集合元素个数

In [121]:
len(set1)

10

### 4. 清空

In [126]:
print(set1)
set1.clear()
print(set1)

set()
set()


### 5. 判断元素是否在set中

In [127]:
1 in a

True