# 组合数据类型（Structured Data Types)  

前面的部分我们讲了基本数据类型：int、float、bool、NoneType，它们的共同特点是数据没有内部结构，不可分割，或称为“原子性”；而 str 类型是字符的序列，具有内部数据结构，因此 str 属于组合数据类型。本节内容将要继续学习 Python 中内置的其他四个组合数据类型，按照它们内部结构可以分为三种大的类型，分别是：序列型、映射型以及集合型。

1) **序列型（sequence)**:（列表(list)、元组(tuple)、字符串(str))  
2) **映射类型 (mappings)**:（字典(dict))  
3) **集合类型**:（集合(set)）

## 1. 序列型  —— 列表（list）

序列（sequence）型，指的是序列中的数据按一定顺序排列，可通过每个数据所在位置的编号（称为索引）访问它们。

In [1]:
set([1,2,3])

{1, 2, 3}

```课堂案例```

<img src="resource/灰鲸鱼数量表.jpg" style="zoom:80%">
<center>灰鲸鱼数量表</center>

倘若我们使用14个不同的变量来表示这14天每天对应的灰鲸鱼，那么在内存中是这样存储的：  
<img src="resource/灰鲸鱼变量法表示.jpg" style="zoom:100%">
<center>使用14个不同的变量表示</center>  
如果是一年365天的灰鲸鱼数量，使用365个变量来表示，代码维护麻烦（程序员不可能记住365个变量都在什么地方定义、当前表示的数据值等），因此我们使用一个列表来表示

In [2]:
whales = [5,4,7,3,2,3,2,6,4,2,1,7,1,3]
whales.append(10)
print(whales)

[5, 4, 7, 3, 2, 3, 2, 6, 4, 2, 1, 7, 1, 3, 10]


<img src="resource/灰鲸鱼列表表示.jpg" style="zoom:100%">
<center>whales列表在内存中的表示形式</center>  

### 1.1 列表的创建方式

<img src='resource\列表的创建.jpg' style='zoom:60%'>

* 1) 直接使用 \[\] 将列表元素括起来。  

就像单引号或双引号是字符串的标记一样，\[\] 是列表的标记，列表中的每一个数据叫做它的一个元素，使用逗号隔开。

In [3]:
weekdays = ['Mon','Tue','Wed','Thurs','Fri','Sat','Sun']
weekdays

['Mon', 'Tue', 'Wed', 'Thurs', 'Fri', 'Sat', 'Sun']

可以通过 len() 函数获取列表的长度（列表中元素的个数）。

In [4]:
len(weekdays)

7

空列表

In [5]:
empty_list = []
print(empty_list,len(empty_list))

[] 0


<font color='darkred'>字符串要求每一个元素必须是一个字符，但是列表的元素可以是任何数据类型，包括列表。

```课堂练习```  

假设有学生小明的姓名，年龄（19岁），性别（男），以及 Python、高数、英语的成绩（90，80，70）。请使用合理的数据类型，创建一个列表数据对象表示以上信息。

In [1]:
xiaoming = ["小明", 19, "男", "python = 90", "高数 = 80", "英语 = 70"]

* 2） 使用 list() 函数将传入的参数转成列表对象  

**注意**，传入的必须是一个**可迭代对象**，例如：str、tuple、dict、set、range等。

In [7]:
letters = list('hellopython') # list()的参数是一个可迭代对象
letters

['h', 'e', 'l', 'l', 'o', 'p', 'y', 't', 'h', 'o', 'n']

In [8]:
list(5) # 5 是 int 型数据，并不是可迭代对象，因此不能使用list函数转为列表对象。

TypeError: 'int' object is not iterable

```课堂练习```  

创建一个列表，列表元素为 1 到 100 这100个数字。

In [3]:
a = [i for i in range(1, 101)]
print(a)

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100]


### 1.2 列表的索引、切片和遍历

和字符串一样

In [10]:
whales

[5, 4, 7, 3, 2, 3, 2, 6, 4, 2, 1, 7, 1, 3, 10]

```课堂练习```  

获取第一周的鲸鱼数并打印显示。

In [11]:
for i in range(7):
    print('第{}天观察到的鲸鱼数量为{}'.format(
    i+1, whales[i]))

第1天观察到的鲸鱼数量为5
第2天观察到的鲸鱼数量为4
第3天观察到的鲸鱼数量为7
第4天观察到的鲸鱼数量为3
第5天观察到的鲸鱼数量为2
第6天观察到的鲸鱼数量为3
第7天观察到的鲸鱼数量为2


### 1.3 列表的修改  

<font color='darkred'>**列表对象是可变对象（mutable）**

In [12]:
# 惰性气体的名单
nobles = ['helium','none','argon','krypton','xenon','radon']
print(id(nobles))

2657652767680


In [13]:
nobles[1] = 'neon'
print(nobles,id(nobles),sep='\n')

['helium', 'neon', 'argon', 'krypton', 'xenon', 'radon']
2657652767680


<img src="resource/惰性气体更改前.jpg" style="zoom:100%">
<center>原始列表（修改前）内存中的存储方式</center>  

In [14]:
id(nobles)

2657652767680

In [15]:
nobles[1] = 'neon'
nobles

['helium', 'neon', 'argon', 'krypton', 'xenon', 'radon']

In [16]:
id(nobles)

2657652767680

<img src="resource/惰性气体更改后.jpg" style="zoom:100%">
<center>列表修改后内存中的存储方式</center>  

In [17]:
a = 5
print(id(a))
a = 300
print(id(a))

140728370866192
2657652855728


<font color='darkred'>列表是可修改（mutable）的数据对象，与之相比，字符串、元组、基本数据类型都是不可修改（immutable）的数据对象。

### 1.4 列表的常用操作

1） 常用函数

<img src="resource/列表的常用函数.jpg" style="zoom:80%">
<center>常用函数(事实上并不是列表的专用函数，其他组合数据类型有的也可以用)</center>  

In [18]:
whales

[5, 4, 7, 3, 2, 3, 2, 6, 4, 2, 1, 7, 1, 3, 10]

In [19]:
max(whales)

10

In [20]:
min(whales)

1

In [21]:
sum(whales)

60

In [22]:
sorted(whales,reverse=True)

[10, 7, 7, 6, 5, 4, 4, 3, 3, 3, 2, 2, 2, 1, 1]

In [23]:
whales

[5, 4, 7, 3, 2, 3, 2, 6, 4, 2, 1, 7, 1, 3, 10]

* sorted函数中的 key 关键字参数

In [24]:
help(sorted)

Help on built-in function sorted in module builtins:

sorted(iterable, /, *, key=None, reverse=False)
    Return a new list containing all items from the iterable in ascending order.
    
    A custom key function can be supplied to customize the sort order, and the
    reverse flag can be set to request the result in descending order.



In [25]:
fruit = ['banana','apple','grapes','oranges','lemon']

In [26]:
sorted(fruit)

['apple', 'banana', 'grapes', 'lemon', 'oranges']

In [27]:
sorted(fruit,key=len)

['apple', 'lemon', 'banana', 'grapes', 'oranges']

2） 列表的常用方法

<img src="resource/列表的常用方法.jpg" style="zoom:80%">
<center>列表的常用方法</center>  

<center>
    <font color='red',size=5>以上方法中的大部分修改了原始列表对象，用的时候要千万注意！</font>
</center>

### <font color='darkred'>1.5 列表操作的注意点</font>

#### 1.5.1 增加列表长度的方法 +   append  extend的区别  

In [28]:
lst = [1,2,3]
lst.append(4)
print(lst)

[1, 2, 3, 4]


In [29]:
# 两个列表相加可返回一个新的列表，两个列表本身都没有被修改
lst1 = [1,2,3]
lst2 = [4,5,6]

In [30]:
lst1 + lst2

[1, 2, 3, 4, 5, 6]

In [31]:
lst1 + lst2 + [7]

[1, 2, 3, 4, 5, 6, 7]

In [32]:
lst1

[1, 2, 3]

In [33]:
lst1 * 5

[1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3]

In [34]:
# append方法：添加一个元素至列表的末尾
lst1.append(4)
lst1

[1, 2, 3, 4]

In [35]:
lst1.append(lst2)
lst1

[1, 2, 3, 4, [4, 5, 6]]

In [36]:
#extend方法：合并两个列表
lst1.extend(lst2)
lst1

[1, 2, 3, 4, [4, 5, 6], 4, 5, 6]

In [37]:
lst1.extend('hello')

In [38]:
lst1

[1, 2, 3, 4, [4, 5, 6], 4, 5, 6, 'h', 'e', 'l', 'l', 'o']

#### 1.5.2 浅拷贝

当列表中的元素为不可修改（immutable）数据类型时，我们可以使用**切片**或者**copy()方法**对列表进行复制，这两种方法也被称作——**浅拷贝**。

In [5]:
a = 'abc'
b = a
a = 'efg'
b
a

'efg'

In [40]:
lst1 = [1,2,3]
lst2 = lst1
lst2

[1, 2, 3]

In [41]:
lst1[0] = 100
lst1

[100, 2, 3]

In [42]:
lst2

[100, 2, 3]

此种引用只是给列表对象[1,2,3]起了个新名字，这样列表就有两个名字了，lst1和lst2；这样的操作在编程中很危险，当我们使用lst1这个名字去修改列表对象的时候，lst2也被修改了。我们可以**使用切片将lst1的元素以列表的形式赋给lst2**。

In [43]:
lst1 = [1,2,3]
lst2 = lst1[:]

In [44]:
lst1[0] = 100

In [45]:
lst1

[100, 2, 3]

In [46]:
lst2

[1, 2, 3]

或者使用列表的**copy()**方法。

In [47]:
lst3 = lst1.copy()

In [48]:
lst3

[100, 2, 3]

In [49]:
lst1.clear() # 删除列表 lst1 中的所有元素

In [50]:
lst1

[]

In [51]:
lst3

[100, 2, 3]

#### 1.5.3 深拷贝  

如果列表中包含可变数据对象（例如列表）作为其元素，即当前列表为一个**嵌套列表**时，使用浅拷贝并不能保证嵌套列表的安全性（同时通过多个变量修改），对于嵌套列表，我们推荐使用 copy 模块下的 deepcopy() 方法，完整复制列表及其内部的列表，这种方法被称作**深拷贝**。

In [52]:
life = [['Canada',76.5],
        ['United Sates',75.5],['Mexico',72.8]]
life

[['Canada', 76.5], ['United Sates', 75.5], ['Mexico', 72.8]]

In [53]:
life[1]

['United Sates', 75.5]

In [54]:
life[2][0]

'Mexico'

In [55]:
life1 = life[:]
life1[1][1] = 70
life1

[['Canada', 76.5], ['United Sates', 70], ['Mexico', 72.8]]

In [56]:
life

[['Canada', 76.5], ['United Sates', 70], ['Mexico', 72.8]]

In [57]:
from copy import deepcopy

life = [['Canada',76.5],['United Sates',75.5],['Mexico',72.8]]
life2 = deepcopy(life)
life2[1][1] = 60
life2

[['Canada', 76.5], ['United Sates', 60], ['Mexico', 72.8]]

In [58]:
life

[['Canada', 76.5], ['United Sates', 75.5], ['Mexico', 72.8]]

```课堂练习```  

实现一个函数remove_dups，其功能为输出去重后的原始列表的元素。（**提示**：列表内元素的遍历可以使用 for 变量名 in 列表名 的格式）

In [1]:
def remove_dups(alist):
    seen = []
    for element in alist:
        if element not in seen:
            seen.append(element)
    return seen

remove_dups([1,2,1,3,5])

[1, 2, 3, 5]

```课堂练习```   

实现一个函数remove_symbol(alist, symbol), symbol的可能值为'+'或者'-'，根据symbol值，删去原始列表中的正数或者负数。

In [6]:
def remove_symbol(alist, symbol):
    if symbol == '+':
        for element in alist[::]:
            if element > 0:
                alist.remove(element)
    if symbol == '-':
        for element in alist[::]:
            if element < 0:
                alist.remove(element)
    return alist

lst = [1,1,-6,3,-8]
remove_symbol(lst,'+')
lst     

[-6, -8]

```结果分析```  

全局变量 alist 的值在函数内部修改了！这是因为列表是可变数据类型，alist是可变数据对象，这意味着**全局变量 alist 可以在函数内部修改**。一般来说，除非程序要求，我们要避免这种情况。

```课堂练习```  

根据前面讲过的知识点，如何修改remove_symbol函数使得不会在函数内部修改全局变量列表。

In [9]:
def remove_symbol(alist, symbol):
    list2=alist[:]
    if symbol == '+':
        for element in list2[::]:
            if element > 0:
                list2.remove(element)
    if symbol == '-':
        for element in list2[::]:
            if element < 0:
                list2.remove(element)
    return list2

lst = [1,1,-6,3,-8]
lst = remove_symbol(lst,'+')
print(lst)    

[-6, -8]


## 2. 序列型——元组（tuples）  

元组是另一种序列型数据类型，和列表相同，元组允许多种数据类型作为它的元素；但是，元组是**不可修改**的数据类型，这一点和字符串相似。

### 2.1 元组的创建  

1） 元组以圆括号为标志，元素之间用逗号隔开。

In [66]:
bases = ('A','C','G','T') #腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶
type(bases)

tuple

**注意**：只含有一个元素的元组，书写的时候后面要加逗号

In [67]:
a = (8,)
a

(8,)

In [68]:
type(a)

tuple

In [69]:
b = (8) # 不加逗号则会被认为是int。
type(b)

int

空元组的创建  

空元组没有意义，一般是用不到的。（空列表可以添加元素，但元组不能修改，因此不支持添加元素的操作。）

In [70]:
empty_tuple = ()
type(empty_tuple)

tuple

2） tuple() 函数创建元组。输入参数必须是一个可迭代对象。

In [71]:
letters = tuple('abcdefghijklmnopqrstuvwxyz')

In [72]:
letters

('a',
 'b',
 'c',
 'd',
 'e',
 'f',
 'g',
 'h',
 'i',
 'j',
 'k',
 'l',
 'm',
 'n',
 'o',
 'p',
 'q',
 'r',
 's',
 't',
 'u',
 'v',
 'w',
 'x',
 'y',
 'z')

In [73]:
tuple(range(0,101))

(0,
 1,
 2,
 3,
 4,
 5,
 6,
 7,
 8,
 9,
 10,
 11,
 12,
 13,
 14,
 15,
 16,
 17,
 18,
 19,
 20,
 21,
 22,
 23,
 24,
 25,
 26,
 27,
 28,
 29,
 30,
 31,
 32,
 33,
 34,
 35,
 36,
 37,
 38,
 39,
 40,
 41,
 42,
 43,
 44,
 45,
 46,
 47,
 48,
 49,
 50,
 51,
 52,
 53,
 54,
 55,
 56,
 57,
 58,
 59,
 60,
 61,
 62,
 63,
 64,
 65,
 66,
 67,
 68,
 69,
 70,
 71,
 72,
 73,
 74,
 75,
 76,
 77,
 78,
 79,
 80,
 81,
 82,
 83,
 84,
 85,
 86,
 87,
 88,
 89,
 90,
 91,
 92,
 93,
 94,
 95,
 96,
 97,
 98,
 99,
 100)

### 2.2 元组的使用

* 1） 和字符串一样，元组是不可修改的数据类型

In [74]:
letters = tuple('abcdefghigklmnopqrstuvwxyz')
letters[0] = 'A'

TypeError: 'tuple' object does not support item assignment

* 2) 元组支持除了增、删、改之外的序列操作  

比如：拼接、索引、切片、求长度、遍历等。

In [75]:
tup1 = tuple('hellopython')
tup1

('h', 'e', 'l', 'l', 'o', 'p', 'y', 't', 'h', 'o', 'n')

In [76]:
len(tup1)

11

In [77]:
max(tup1)

'y'

In [78]:
min(tup1)

'e'

In [79]:
tup2 = tuple(range(len(tup1)))
tup2

(0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10)

### 序列型数据类型的总结  

|名称|标记|特点|作用|  
|--|--|--|--|
|字符串（str）|成对的引号|不可修改，元素必须为字符|表示文本数据|  
|列表（list）|成对的方括号|可修改，元素可以是任意类型|表示需要增删改查的批量数据|  
|元组（tuple）|成对的圆括号|不可修改，元素可以是任意类型|表示不需要增删改，仅需要查询的批量数据|  


* 序列型数据类型可以采用解包赋值

In [80]:
a,b,c= 'xyz' # 字符串进行解包赋值
print(a,b,c)

x y z


In [81]:
a,b,c = [1,2,3] # 列表进行解包赋值
print(a,b,c)

1 2 3


In [82]:
a,b,c = 1,2,3 # 元组进行解包赋值
print(a,b,c)

1 2 3


```课堂练习```  

实现一个函数 calculate_score(score1, score2, score3, score4, score5), 统计5位导师打分的平均分（score1 ~ score5 分别代表5位导师所打的分数），请去掉一个最高分，去掉一个最低分，输出剩余分数的平均值并保留两位小数。

In [83]:
def calculate_score(s1,s2,s3,s4,s5):
    scores = [s1,s2,s3,s4,s5]
    min_s, mid1,mid2,mid3, max_s = sorted(scores)
    return round((mid1 + mid2 + mid3)/3,2)

ans = calculate_score(100,81,82,93,94)
print(ans)

89.67


```课堂练习```  

请改进函数 calculate_score, 不论有多少导师打分，其结果均为去掉最高最低分后求剩余分数的平均分。  
（**提示**：**<font color='darkred'>\*变量名**可以指代任意多的变量。  
>例如：  
\>>> start,*middle,end = 1,2,3,4,5,6,7,8   
\>>> middle  
[2, 3, 4, 5, 6, 7]
）

In [19]:
def calculate_score2(*s):
    min_s, *mid, max_s = sorted(s)
    return round(sum(mid)/len(mid),2)

ans = calculate_score2(100,10,90,80)
print(ans)

85.0


```课堂练习```  

实现一个函数 find_long_short(sentence)，其功能为输入一个英文句子，输出句子中最长和最短的单词。

In [24]:
def find_long_short(sentence):
    words = sentence.split()
    short,*_, long = sorted(words,key=len)
    return long, short

In [25]:
sentence = 'Programming is so fun dogde'
long, short = find_long_short(sentence)
print('最长单词{}的长度为{}，\t最短单词{}的长度为{}'.format(
    long,len(long),short,len(short)))

最长单词Programming的长度为11，	最短单词is的长度为2


## 3. 映射类型——字典（dict）  

Python 语言中，字典（dict）作为组合数据类型是极其有用且具有 Pythonic 风格的。有的问题，使用列表和元组存储和操作数据不够方便，我们应当考虑用字典来解决问题。

### 3.1 字典的创建

字典的元素为键值对（key-value pair）  

<font size=4>{ key<sub>1</sub>:value<sub>1</sub>, key<sub>2</sub>:value<sub>2</sub>, ... , key<sub>n</sub>:value<sub>n</sub> }  </font>
    
<font color='darkred'>其中 键 在字典中是独一无二的，即字典中不可有重复的键。

* 1） 直接使用花括号将字典的键值对括起来

In [26]:
name_to_score = {'张三':60,'赵四':50}
name_to_score

{'张三': 60, '赵四': 50}

In [27]:
empty_dict = {} # 空字典
type(empty_dict)

dict

* 2） 使用函数 dict() 创建字典 

In [89]:
a = dict(one=1, two=2, three=3) # 必须符合变量名规则
a

{'one': 1, 'two': 2, 'three': 3}

In [90]:
d = dict([ ('one', 1),('two', 2), ('three', 3)])
d

{'one': 1, 'two': 2, 'three': 3}

In [91]:
e = dict(( ('one', 1),('two', 2), ('three', 3)))
e

{'one': 1, 'two': 2, 'three': 3}

```思考```  

以上两种使用 dict() 创建字典的方式，对传入参数有什么要求？

### 3.2 字典的基本操作

<img src="resource/字典的常用方法.jpg" style="zoom:80%">
<center>字典的常用方法</center> 

* **查**

1) 通过 <font size=4>字典\[key\] </font>获取字典中 key 所对应的 value

In [28]:
name_to_score

{'张三': 60, '赵四': 50}

In [29]:
print(name_to_score['刘能'])

KeyError: '刘能'

2) 通过 <font size=4>字典.get(key)</font> 获取字典中 key 所对应的 value

In [31]:
print(name_to_score.get('刘能'))

None


In [30]:
print(name_to_score.get('刘能',-1))

-1


```思考```  

以上两种方式有什么不同？

In [98]:
print(name_to_score.get('luoxiang','not exist')) # 当 key = 'luoxiang' 不存在时，返回‘not exist’

not exist


* **改**

通过 <font size=4>字典\[key\] = 新值 </font>更改字典中 key 所对应的值为 新值。

In [32]:
print(name_to_score)
name_to_score['张三'] = 90
print(name_to_score)

{'张三': 60, '赵四': 50}
{'张三': 90, '赵四': 50}


* **增**

1) 直接通过 <font size = 4>字典\[键\] = 值 </font> 向字典添加一组新的键值对。

In [33]:
print(name_to_score)
name_to_score['罗翔'] = 90
print(name_to_score)

{'张三': 90, '赵四': 50}
{'张三': 90, '赵四': 50, '罗翔': 90}


2） 通过 <font size=4>字典.setdefault(新的键值，值) </font>向字典添加一组新的键值对。

In [35]:
print(name_to_score)
name_to_score.setdefault('苏X',100)
print(name_to_score)

{'张三': 90, '赵四': 50, '罗翔': 90, '苏X': 100}
{'张三': 90, '赵四': 50, '罗翔': 90, '苏X': 100}


3）通过 <font size=3>字典.update(另一个字典)</font> 将另一个字典中的所有键值对添加到原来的字典中。

In [36]:
d = {'xiaohong':60, 'xiaohua':80}
print(name_to_score)
name_to_score.update(d)
print(name_to_score)

{'张三': 90, '赵四': 50, '罗翔': 90, '苏X': 100}
{'张三': 90, '赵四': 50, '罗翔': 90, '苏X': 100, 'xiaohong': 60, 'xiaohua': 80}


```思考```  

假如两个字典之间包含相同的 key， update 方法有怎样的结果？

* **删**  

请自己研究。

* **遍历**

In [37]:
for name in name_to_score:
    print(name,name_to_score[name])

张三 90
赵四 50
罗翔 90
苏X 100
xiaohong 60
xiaohua 80


In [38]:
name_to_score.items()

dict_items([('张三', 90), ('赵四', 50), ('罗翔', 90), ('苏X', 100), ('xiaohong', 60), ('xiaohua', 80)])

In [39]:
for name,score in name_to_score.items():
    print(name, score)

张三 90
赵四 50
罗翔 90
苏X 100
xiaohong 60
xiaohua 80


In [40]:
name_to_score.values()

dict_values([90, 50, 90, 100, 60, 80])

In [41]:
for score in name_to_score.values():
    print(score)

90
50
90
100
60
80


In [42]:
name_to_score.keys()

dict_keys(['张三', '赵四', '罗翔', '苏X', 'xiaohong', 'xiaohua'])

### 3.3 字典的排序

In [43]:
# 根据键排序
sorted(name_to_score)

['xiaohong', 'xiaohua', '张三', '罗翔', '苏X', '赵四']

In [44]:
sorted(name_to_score,key=len)

['张三', '赵四', '罗翔', '苏X', 'xiaohua', 'xiaohong']

In [45]:
name_to_score.items()

dict_items([('张三', 90), ('赵四', 50), ('罗翔', 90), ('苏X', 100), ('xiaohong', 60), ('xiaohua', 80)])

In [10]:
# 根据值排序
sorted(name_to_score.items(),key=lambda x:len(x[0]))

NameError: name 'name_to_score' is not defined

In [47]:
sorted(name_to_score.values())

[50, 60, 80, 90, 90, 100]

**```匿名函数 lambda```**  

Python 中允许我们使用 lambda 语法格式定义一个匿名函数。所谓匿名函数，即不需要函数名的函数。lambda 具体的使用规则为：  

lambda 形参 ： 输出

In [48]:
def add(x, y):
    return x + y

print(add(5,6))

11


In [49]:
add1 = lambda x,y : x + y # 不建议大家给 lambda 函数起名字。因为 lambda 函数本身的目的在于匿名。
print(add1(5,6))

11


In [50]:
ans = (lambda x,y,z:x + y + z)(5,6,7)
print(ans)

18


In [51]:
res = (lambda x,y,z:x + y + z)(1,2,3)
res

6

**注意**：  

字典是一个可变数据类型。字典中的键值对，值可以是可变数据对象，但字典的键必须是不可变数据对象。

In [65]:
adict = {[1,2,3]:'abc'}

TypeError: unhashable type: 'list'

## 4. 集合类型——集合（set）  

* 无序性  
* 不重复

### 4.1 集合的创建

1) 使用成对的花括号将集合内的元素用逗号分隔开。

In [118]:
vowels = {'a','e','i','o','u'}
vowels

{'a', 'e', 'i', 'o', 'u'}

In [119]:
vowels = {'a','e','i','o','u','a','e','i','o','u','a','e','i','o','u'}

In [120]:
vowels

{'a', 'e', 'i', 'o', 'u'}

In [121]:
{'a','e','i','o','u'} == {'a','e','i','o','u','a','e','i','o','u','a','e','i','o','u'}

True

In [122]:
{1,2,3} == {3,2,1}

True

In [123]:
type({'a','e','i','o','u','a','e','i','o','u','a','e','i','o','u'})

set

2） 使用 set() 创建一个集合。（传入参数必须为一个可迭代对象）

In [124]:
set_a = set([1,2,3,4,2])

In [125]:
set_a

{1, 2, 3, 4}

3）空集合只能通过 set() 创建。

In [126]:
type({})

dict

In [127]:
len(set())

0

### 4.2 集合操作

<img src="resource/集合的常用方法.jpg" style="zoom:80%">
<center>集合的常用方法</center> 

<img src="resource/集合简化操作符.jpg" style="zoom:80%">
<center>集合的简化操作符</center> 

In [128]:
set1 = set('helloworld')
set2 = set('hellopython')

In [129]:
set1

{'d', 'e', 'h', 'l', 'o', 'r', 'w'}

In [130]:
set2

{'e', 'h', 'l', 'n', 'o', 'p', 't', 'y'}

In [131]:
for s in set2:
    print(s)

p
y
h
l
t
n
o
e


* 交集 intersection

In [132]:
set1 & set2

{'e', 'h', 'l', 'o'}

* 并集 union

In [133]:
set1 | set2

{'d', 'e', 'h', 'l', 'n', 'o', 'p', 'r', 't', 'w', 'y'}

* 差集（difference，差集是有方向的）

In [134]:
set1 - set2

{'d', 'r', 'w'}

In [135]:
set2 - set1

{'n', 'p', 't', 'y'}

* 对称差集 （symmetric-difference）

In [136]:
set1 ^ set2

{'d', 'n', 'p', 'r', 't', 'w', 'y'}

* 子集（issubset）

In [137]:
set1.issubset(set('abcdefghijklmnopqrstuvwxyz'))

True

* 父集（issuperset）

In [138]:
set2.issuperset(set('python'))

True

In [139]:
set1.add('1')
set1

{'1', 'd', 'e', 'h', 'l', 'o', 'r', 'w'}

**注意**：  

集合是可变数据对象。集合中不允许不可变数据对象作为其元素。

In [64]:
set_a = {[1,2,3]}

TypeError: unhashable type: 'list'

**总结**：

可变数据对象：列表、集合、字典；  
不可变数据对象：int、float、str、tuple、自定义的类