# 0. 导入
**字符串、列表、元组**均是序列类型，其中的元素均是**有序**排列。  
其他容器对象：集合(set)、字典(dict)。

**集合:**  
集合内的元素
- **不可重复**  
- **无序排列**
    
**字典:**  
- 存储了**键-值**对。  
- 通过键**快速查找**值。 

# 1. 集合(set)
## 1.1 集合概述
包含0个或多个数据元素的无序组合，且元素不可重复。

集合内元素用**{}**括起来。

In [17]:
city = {"xiamen", "beijing", 361000, "lasa", "wuxi"}
print(city)

{'wuxi', 361000, 'beijing', 'xiamen', 'lasa'}


集合内元素无序，所以打印出来的元素顺序与定义时不一致。

**集合主要用途:**
1. 成员检测
2. 消除重复元素
3. 集合的并集、交集、叉集等数学运算

In [18]:
city = {"xiamen", "beijing", 361000, "xiamen", 361000}
print(city, "集合内元素个数：", len(s))
print("shang" in s)

{361000, 'beijing', 'xiamen'} 集合内元素个数： 5
False


## 1.2 集合(set)常见用法
使用列表(list)创建集合，并去除了重复元素。  
然后使用`in`与`not in`判断指定值是否在集合中。  
最后使用`remove`方法删除set中指定元素。

In [3]:
namelist = ["zhang","wang","zhao","li","wang","chen"]
nameset = set(namelist)
for e in nameset:       #遍历nameset
    print(e, end = " ")
print()
print("namelist中元素个数为{}".format(len(namelist)))
print("nameset 中元素个数为{},内容为{}".format(len(nameset),namelist))
print("'zhang'  在nameset中吗?", "zhang" in nameset)
print("'zhang'不在nameset中吗?", "zhang" not in nameset)
print("'张'在nameset中吗?", "王" in nameset)
nameset.remove("zhang")
print("删除'zhang'后nameset的长度{}，内容{}".format(len(nameset),nameset))

zhao wang zhang li chen 
namelist中元素个数为6
nameset 中元素个数为5,内容为['zhang', 'wang', 'zhao', 'li', 'wang', 'chen']
'zhang'  在nameset中吗? True
'zhang'不在nameset中吗? False
'张'在nameset中吗? False
删除'zhang'后nameset的长度4，内容{'zhao', 'wang', 'li', 'chen'}


**集合的并交叉运算**

In [9]:
xset = set([1,2,3,5,6,7,8,10]) #创建set
yset = set([1,4,5,7,9,10])
print("并集为:",xset|yset)   
print("交集为:",xset & yset)
print("在xset但不在yset的元素:", xset - yset)
print("在xset或yset，但不在他们的较集中的元素:", xset^yset)

并集为: {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
交集为: {1, 10, 5, 7}
在xset但不在yset的元素: {8, 2, 3, 6}
在xset或yset，但不在他们的较集中的元素: {2, 3, 4, 6, 8, 9}


## 1.3 集合的建立与遍历
### 1.3.1 集合的建立
可使用set()函数或{}进行创建。

**1.使用{}可以直接创建**  
元素之间用**,**分隔。

In [18]:
xset = {3,1,2,1,2,3}
yset = {'a','b',1,2,'a'b}
print(xset, yset) #{1, 2, 3} {'b', 1, 2, 'a'}

{1, 2, 3} {'b', 1, 2, 'a'}


**注意：**不能使用**{}**代表空集合，因为其代表空字典。  
需使用set()函数创建空集合。

In [20]:
print(type({}))

<class 'dict'>


**2.set()函数接受任何可迭代(iterable)对象(str, list, tuple, range等)**

In [22]:
xset = set("abca")
yset = set([1,2,3])
print(xset,yset) # {'b', 'c', 'a'} {1, 2, 3}
zset = set(("x","y","z"))
rset = set(range(5))
print(zset,rset) # {'z', 'x', 'y'} {0, 1, 2, 3, 4}
emptyset = set() # 创建空字典
print(type(emptyset), len(emptyset))

{'b', 'c', 'a'} {1, 2, 3}
{'z', 'x', 'y'} {0, 1, 2, 3, 4}
<class 'set'> 0


**小技巧：**如何判定一个对象是否是可迭代的？
使用collections模块中的Iterable类型判断

In [16]:
from collections import Iterable
print(isinstance(("abc"), Iterable))
print(isinstance((range(5)), Iterable))
print(isinstance(3.14, Iterable))

True
True
False


**3.使用集合推导式创建**

In [42]:
xset = {x**2 for x in range(10) if x % 2 == 0}
print(type(xset),xset)

<class 'set'> {0, 64, 4, 36, 16}


### 1.3.2 集合的遍历

集合是可迭代对象，因此可直接使用for循环进行遍历。  

In [35]:
nameset = set(["zhang","wang","zhao","li","wang","chen"])
for e in nameset:       #遍历nameset
    print(e, end = " ")

zhang li chen wang zhao 

使用**迭代器**进行遍历。

In [34]:
cityiterator = iter(nameset)
for i in range(len(nameset)):
    print(next(cityiterator), end = " ")

zhang li chen wang zhao 

**注意：**集合中的元素是无序排列的。
因此将上述遍历代码存于文件，并多次运行，返回的结果可能不一致。如下图所示：  
![set内元素无序排列](set内元素无序排列.png)

## 1.4 集合常见方法

可以将集合的方法按照**增、删、查、其他**进行分类。如下表所示。  

**注:** s为所要操作的集合： 
<escape>
<table>
  <tr>
    <th>类别</th>
    <th>方法</th>
    <th>说明</th>
  </tr>
  <tr>
    <td rowspan="2">增</td>
    <td>s.add(x)</td>
    <td>如果数据项x不在集合s中，将x加入s</td>
  </tr>
  <tr>
    <td>s.update(xset)</td>
    <td>在s中添加来自xset中的元素</td>
  </tr>
  <tr>
    <td rowspan="4">删</td>
    <td>s.remove(x)</td>
    <td>如x在集合s中，则移除；否则，引发KeyError异常</td>
  </tr>
  <tr>
    <td>s.discard(x)</td>
    <td>如果x在集合s中，移除该元素；如果x不存在，不报错</td>
  </tr>
  <tr>
    <td>s.pop()</td>
    <td>随机返回集合s中的一个元素，如集合为空，引发KeyError异常</td>
  </tr>
  <tr>
    <td>s.clear()</td>
    <td>移除S中所有数据项</td>
  </tr>
  <tr>
    <td rowspan="2">查</td>
    <td>x in S</td>
    <td>如果x是S的元素，返回True，否则返回False</td>
  </tr>
  <tr>
    <td>x not in S</td>
    <td>如果x不是S的元素，返回True，否则返回False</td>
  </tr>
  <tr>
    <td rowspan="3">其他</td>
    <td>len(s)</td>
    <td>返回集合s元素个数</td>
  </tr>
  <tr>
    <td>s.copy()</td>
    <td>返回集合S的一个浅拷贝</td>
  </tr>
  <tr>
    <td>isdisjoint, issubset, issuperset</td>
    <td>判断两个集合之间的关系的方法</td>
  </tr>
</table>
</escape>

**判断两个集合之间的关系的方法或运算符：** 

方法或运算符|说明
-|-
s.isdisjoint(xset)|如果集合s中没有与xset中有共同的元素返回`True`
s.issubset(xset)|如果s是xset的子集返回`True`
s <= xset|判断s是否xset的子集
s < xset|判断s是否xset的**真子集**
s.issuperset(xset)|判断s是否是xset的超集
s >= xset|判断xset是否是s的子集
s > xset|判断xset是否是s的**真子集**

In [24]:
xset = {1,2,3}
yset = {1,2,3,4,5}
zset = {4,5,6}
print(xset.isdisjoint(zset))    #True
print(xset.issubset(yset))      #True
print(yset.issuperset(xset))    #True
print(xset<=yset, xset<{1,2,3}) #True, False
print(yset>=xset, xset>{1,2,3}) #True, False

True
True
True
True False
True False


## 1.5 集合的数学运算
集合支持并集(**|**)、交集(**&**)、差集(**-**)、对称差集(**^**)等数学运算。  
集中集合运算的含义如下图所示：

![集合的数学运算](集合的数学运算.png)


In [8]:
A = {1,3,5,6,7,9,10}
B = {1,2,3,4,8,9,10}
print("个数:", len(A|B), "A|B:",A|B)
print("A&B", A&B) 
print("A-B", A-B)
print("A^B", A^B)

个数: 10 A|B: {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
A&B {1, 10, 3, 9}
A-B {5, 6, 7}
A^B {2, 4, 5, 6, 7, 8}


并集(**|**)、交集(**&**)、差集(**-**)、对称差集(**^**)是运算符版本的集合运算。  
其对对应的非运算符版本的集合运算分别是`union, intersection, difference, symmetric_difference`。

In [12]:
A = {1,3,5,6,7,9,10}
B = {1,2,3,4,8,9,10}
print(A.union(B))
print(A.intersection(B))
print(A.difference(B))
print(A.symmetric_difference(B))

{1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
{1, 10, 3, 9}
{5, 6, 7}
{2, 4, 5, 6, 7, 8}


**注意：**不管是运算符或者非运算符版本的集合运算都不会改变原来的集合。

## 1.6 集合的应用
### 1.6.1 任务随机分配
假设有A、B、C、D四项任务需要完成。现在有一份成员名单，名单上有n个成员，每个成员都可以做这4项任务。  
希望编写一个算法，每回从名单随机抽取一个成员分配某个任务，并将该成员标注为已分配，下回抽取就不会再  
抽到该成员。且分配过程中**不能删除名单中的成员**。 希望整个分配过程尽量保证每个任务分配到的人数基本一致。  
请编写程序打印出每个任务分配到的成员情况。

In [49]:
import random
tasks = ["A", "B", "C", "D"]
members = list(range(34))
result = [[], [], [], []]
mset = set()
for i in range(len(members)):
    while(True):
        i = random.randint(0, len(members)-1)
        p = members[i]
        if p not in mset:
            break
    mset.add(p)
    result[i%4].append(p) 
for i in range(len(result)):
    print("任务{}分配了{}个人，他们是{}".format(tasks[i],len(result[i]), result[i]))
isdisjoint = False  #假设他们有交集
for i in range(len(result)):
    for j in range(i+1,len(result)):
        isJoint = set(result[i]).isdisjoint(result[j])
print("没有交集" if isJoint else "有交集")

任务A分配了9个人，他们是[12, 32, 0, 20, 24, 4, 28, 16, 8]
任务B分配了9个人，他们是[33, 21, 29, 25, 17, 13, 1, 9, 5]
任务C分配了8个人，他们是[26, 10, 22, 14, 2, 18, 6, 30]
任务D分配了8个人，他们是[27, 31, 7, 19, 11, 23, 15, 3]
没有交集


### 1.6.2 中文分词
给定一段中文查看

# 2. 字典(dict)
## 2.1 字典概述

## 常见用法
创建、查找、键成员判断、删除。  
查看键值、按顺序查查看键值。

In [7]:
#创建字典
namedict = {"张":"zhang", "王":"wang", "赵":"zhao", "李":"li", "陈":"chen"}
#字典查找
print("张对应的拼音为:",namedict["张"])
namedict["张"] = "ZHANG" #更新
print("字典内容:", namedict, "键个数:", len(namedict))
#删除键
del namedict["赵"]
print("删除后'赵'后字典内容:", namedict, "键个数:", len(namedict))
#成员判断
name = "陈"
if name in namedict:
    namedict[name] = "CHEN"
print("字典内容:", namedict)

张对应的拼音为: zhang
字典内容: {'张': 'ZHANG', '王': 'wang', '赵': 'zhao', '李': 'li', '陈': 'chen'} 键个数: 5
删除后'赵'后字典内容: {'张': 'ZHANG', '王': 'wang', '李': 'li', '陈': 'chen'} 键个数: 4
字典内容: {'张': 'ZHANG', '王': 'wang', '李': 'li', '陈': 'CHEN'}
