## 集合

集合与列表相似，都可以用来存储多个元素。不同于列表的是，集合中的元素**彼此不能相同**并且**不按照任何特定的顺序放置**。

可以将若干个元素用一对花括号**`{}`** 括起来以创建一个集合。集合内的元素同样使用**逗号**分隔。一个集合也可以包含**不同类型**的元素。

Python使用内置类`set`来定义集合。使用`set`函数可以将**列表**、**元组**、**字符串**等类型**转换为集合**。

由于集合的元素是**无序**的，**不能使用下标**来访问集合中的元素。但是集合**可以使用for…in循环**来遍历其中的所有元素。**使用`in`或`not in`运算符**可以判断一个元素是否在一个集合中。

`len`函数同样**适用于**集合。可以使用len函数求集合的大小，使用`max`函数求集合最大元素，使用`sum`函数求集合内所有元素的和。

In [139]:
# 可以包含任何类型元素，用花括号定义，用逗号分割
set_1 = {False , 3, -6, 88.9, False , 3, -6, 88.9, -3222.1, 1, None, 2, 1, 4, 'Good'}

In [140]:
# 集合中元素不相同，不按照任何特定顺序存放
set_1

{-3222.1, -6, 1, 2, 3, 4, 88.9, False, 'Good', None}

In [141]:
str_8 = 'every night in my dreams i see you i feel you'

In [142]:
list_8 = str_8.split()

In [143]:
list_8

['every', 'night', 'in', 'my', 'dreams', 'i', 'see', 'you', 'i', 'feel', 'you']

In [144]:
# 把列表转换为集合
set_8 = set(list_8)

In [145]:
# 集合中元素不相同，只有一个i，只有一个you
set_8

{'dreams', 'every', 'feel', 'i', 'in', 'my', 'night', 'see', 'you'}

In [146]:
# 把字符串转化为集合
set(str_8)

{' ',
 'a',
 'd',
 'e',
 'f',
 'g',
 'h',
 'i',
 'l',
 'm',
 'n',
 'o',
 'r',
 's',
 't',
 'u',
 'v',
 'y'}

In [147]:
tuple(list_8)

('every', 'night', 'in', 'my', 'dreams', 'i', 'see', 'you', 'i', 'feel', 'you')

In [148]:
tuple_8 = tuple(list_8)

In [149]:
# 把元组转换为集合
set(tuple_8)

{'dreams', 'every', 'feel', 'i', 'in', 'my', 'night', 'see', 'you'}

In [150]:
set_8

{'dreams', 'every', 'feel', 'i', 'in', 'my', 'night', 'see', 'you'}

In [151]:
# 集合不能通过索引进行访问
# set_8[0]

In [152]:
for word in set_8:
    print(word)

every
in
you
i
dreams
see
my
night
feel


In [153]:
'love' in set_8

False

In [154]:
'feel' in set_8

True

In [155]:
# 用len函数看一看集合的长度
len(set_8)

9

In [156]:
# 想想为什么结果是you
max(set_8)

'you'

In [157]:
list(range(1, 11))

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [158]:
list_9 = list(range(1, 101))

In [159]:
sum(set(list_9))

5050

## 集合的基本操作

下面通过小例子，看一下集合的一些基本用法和操作：

In [160]:
set_8

{'dreams', 'every', 'feel', 'i', 'in', 'my', 'night', 'see', 'you'}

In [161]:
# 添加一个元素
set_8.add('love')

In [162]:
set_8

{'dreams', 'every', 'feel', 'i', 'in', 'love', 'my', 'night', 'see', 'you'}

In [163]:
# 移除一个元素
set_8.remove('dreams')

In [164]:
set_8

{'every', 'feel', 'i', 'in', 'love', 'my', 'night', 'see', 'you'}

In [165]:
# 随机移除一个元素
set_8.pop()

'every'

In [166]:
set_8

{'feel', 'i', 'in', 'love', 'my', 'night', 'see', 'you'}

In [167]:
# 看一下是不是随机移除的
set_8.pop()

'in'

In [168]:
set_8

{'feel', 'i', 'love', 'my', 'night', 'see', 'you'}

`discard`方法用于移除指定的集合元素。该方法不同于`remove`方法，因为`remove`方法在移除一个不存在的元素时会发生错误，而`discard`方法不会。

In [169]:
# remove移除一个不存在的元素会报错
# set_8.remove('goooood')

In [170]:
set_8.discard('goooood')

In [171]:
set_8

{'feel', 'i', 'love', 'my', 'night', 'see', 'you'}

In [172]:
set_8.discard('i')

In [173]:
set_8

{'feel', 'love', 'my', 'night', 'see', 'you'}

In [174]:
# clear清空集合中的全部内容
set_8.clear()

In [175]:
set_8

set()

In [176]:
# 定义一个集合
set9 = {1,2}

In [177]:
# 将一个元组作为元素添加到集合中
set9.add((1,2))

In [178]:
set9

{(1, 2), 1, 2}

In [179]:
# 将一个列表作为元素添加到集合中，不行啊，列表是可变的
# set9.add([1,2])

In [180]:
# 将一个集合作为元素添加到集合中，不行啊，集合是可变的
# set9.add({1,2})

In [181]:
# 定义一个列表
list9 = [1, 2]

In [182]:
# 将一个列表作为元素添加到集合中，可以
list9.append([1,2])

In [183]:
list9

[1, 2, [1, 2]]

In [184]:
# 将一个集合作为元素添加到集合中，可以
list9.append({1,2})

In [185]:
list9

[1, 2, [1, 2], {1, 2}]

**集合运算操作**

Python提供了求交集、并集、差集和对称差集等集合运算。

- 使用`s1.intersection(s2)`或者`s1&s2`可以计算两个集合的交集。
- 使用`s1.union(s2)`或者`s1|s2`可以计算两个集合的并集。
- 使用`s1.difference(s2)`或者`s1-s2`可以计算两个集合的差集。
- 使用`s1.symmetric_difference(s2)`或者`s1^s2`可以计算两个集合的对称差集。

In [186]:
s1 = {1,2,3,4}

In [187]:
s1

{1, 2, 3, 4}

In [188]:
s2 = {3,4,5,6}

In [189]:
s2

{3, 4, 5, 6}

In [190]:
# 求交集
s1 & s2

{3, 4}

In [191]:
# 求并集
s1 | s2

{1, 2, 3, 4, 5, 6}

In [192]:
# 求差集，从集合s1中删除在集合s2中存在的元素
s1 - s2

{1, 2}

In [193]:
# 求差集，从集合s2中删除在集合s1中存在的元素
s2 - s1

{5, 6}

对称差集（Symmetric Difference），又被称作对称差分，即集合A与集合B中所有不属于A∩B的元素的集合，记为A△B。

In [194]:
# 求对称差集
s1 ^ s2

{1, 2, 5, 6}

In [195]:
# 求对称差集
s2 ^ s1

{1, 2, 5, 6}

# 4 字典

## 4.1 字典

- 字典是一个存储**键值对集合**的Python容器。它通过使用**关键字**来快速**获取**、**删除**和**更新**值。

- 一个字典对象中**无序地**存储了若干个条目，用一对花括号（`{` `}`）括起来。每个条目都是一个**键值对（key-value pair）**，由类似`关键字:对应值`的结构组成，即**一个关键字**和**一个对应值**。关键字在字典中是**唯一的**，每个关键字唯一地匹配一个值。

- 字典类型通过Python的内置类`dict`来定义，因此使用`dict`函数也可以创建一个字典。

In [1]:
# 使用花括号来创建一个新的字典film_dict
# 回忆一下，使用什么来创建列表、元组、集合、字符串
# film_dict中的key是电影在豆瓣上对应的网址id
# 例如，https://movie.douban.com/subject/1292722/，是电影《泰坦尼克号》的豆瓣网址
# 这里魔门就把网址中的数字1292722作为该部电影在字典中的key
film_dict = {
    '1292052':'肖申克的救赎',
    '1291546':'霸王别姬',
    '1292720':'阿甘正传',
    '1295644':'这个杀手不太冷',
    '1292722':'泰坦尼克号',
    '1441801':'局内人',
    '1295399':'七武士',
    '1460911':'七武士'
}

In [2]:
# 查看一下film_dict中有哪些key
film_dict.keys()

dict_keys(['1292052', '1291546', '1292720', '1295644', '1292722', '1441801', '1295399', '1460911'])

In [3]:
keys = film_dict.keys()

In [4]:
type(keys)

dict_keys

In [5]:
# 查看一下film_dict中有哪些key
film_dict.values()

dict_values(['肖申克的救赎', '霸王别姬', '阿甘正传', '这个杀手不太冷', '泰坦尼克号', '局内人', '七武士', '七武士'])

In [6]:
values = film_dict.values()

In [7]:
type(values)

dict_values

In [8]:
# 查看一下keys的长度
len(keys)

8

In [9]:
# 查看一下values的长度
len(values)

8

In [10]:
# 使用list函数把kyes变为列表，对values也可以进行类似操作
key_list = list(keys)

In [11]:
key_list

['1292052',
 '1291546',
 '1292720',
 '1295644',
 '1292722',
 '1441801',
 '1295399',
 '1460911']

In [12]:
value_list = list(values)

In [13]:
value_list

['肖申克的救赎', '霸王别姬', '阿甘正传', '这个杀手不太冷', '泰坦尼克号', '局内人', '七武士', '七武士']

In [14]:
# 使用tuple函数把kyes变为元组，对values也可以进行类似操作
key_tuple = tuple(keys)

In [15]:
key_tuple

('1292052',
 '1291546',
 '1292720',
 '1295644',
 '1292722',
 '1441801',
 '1295399',
 '1460911')

In [16]:
# 获取film_dic的key-value pair
items = film_dict.items()

In [17]:
items

dict_items([('1292052', '肖申克的救赎'), ('1291546', '霸王别姬'), ('1292720', '阿甘正传'), ('1295644', '这个杀手不太冷'), ('1292722', '泰坦尼克号'), ('1441801', '局内人'), ('1295399', '七武士'), ('1460911', '七武士')])

In [18]:
type(items)

dict_items

In [19]:
# 定义一个字符串格式化表达式
douban_url = 'https://movie.douban.com/subject/'

In [20]:
# 格式化输出电影名字和豆瓣链接
for k, v in items:
    film_url = douban_url + k
    print('{name:<10}{url:>45}'.format(url = film_url, name = v))

肖申克的救赎         https://movie.douban.com/subject/1292052
霸王别姬           https://movie.douban.com/subject/1291546
阿甘正传           https://movie.douban.com/subject/1292720
这个杀手不太冷        https://movie.douban.com/subject/1295644
泰坦尼克号          https://movie.douban.com/subject/1292722
局内人            https://movie.douban.com/subject/1441801
七武士            https://movie.douban.com/subject/1295399
七武士            https://movie.douban.com/subject/1460911


<b><font color=red>思考题</font></b>：

中文空格可以用`chr(12288)`表示，请问如何整齐地输出电影名（左对齐）和对应的超链接（右对齐），像下面这样

肖申克的救赎　　　　     https://movie.douban.com/subject/1292052<br>
霸王别姬　　　　　　     https://movie.douban.com/subject/1291546<br>
阿甘正传　　　　　　     https://movie.douban.com/subject/1292720<br>
这个杀手不太冷　　　     https://movie.douban.com/subject/1295644<br>
泰坦尼克号　　　　　     https://movie.douban.com/subject/1292722<br>
局内人　　　　　　　     https://movie.douban.com/subject/1441801<br>
七武士　　　　　　　     https://movie.douban.com/subject/1295399<br>
七武士　　　　　　　     https://movie.douban.com/subject/1460911<br>

请用lecture_3中所学的字符串格式化知识实现。

In [21]:
# 使用list函数把键值对转换为列表
item_list = list(items)

In [22]:
item_list

[('1292052', '肖申克的救赎'),
 ('1291546', '霸王别姬'),
 ('1292720', '阿甘正传'),
 ('1295644', '这个杀手不太冷'),
 ('1292722', '泰坦尼克号'),
 ('1441801', '局内人'),
 ('1295399', '七武士'),
 ('1460911', '七武士')]

<b><font color=blue>字典中没有重复的键值对</font></b>

In [23]:
film_dict

{'1292052': '肖申克的救赎',
 '1291546': '霸王别姬',
 '1292720': '阿甘正传',
 '1295644': '这个杀手不太冷',
 '1292722': '泰坦尼克号',
 '1441801': '局内人',
 '1295399': '七武士',
 '1460911': '七武士'}

In [24]:
# 根据key来获取对应的value值
film_dict['1292052']

'肖申克的救赎'

In [25]:
# # 根据key来获取对应的value值，这样对吗，为什么
# film_dict[1292052]

In [26]:
# 根据key来更新对应的value值
# 《肖申克的救赎》在香港被译为《月黑高飞》
film_dict['1292052'] = '月黑高飞'

In [27]:
film_dict

{'1292052': '月黑高飞',
 '1291546': '霸王别姬',
 '1292720': '阿甘正传',
 '1295644': '这个杀手不太冷',
 '1292722': '泰坦尼克号',
 '1441801': '局内人',
 '1295399': '七武士',
 '1460911': '七武士'}

In [28]:
# 根据key来删除 key-value pair
# 删除了《霸王别姬》对应的key-value pair
film_dict.pop('1291546')

'霸王别姬'

In [29]:
film_dict

{'1292052': '月黑高飞',
 '1292720': '阿甘正传',
 '1295644': '这个杀手不太冷',
 '1292722': '泰坦尼克号',
 '1441801': '局内人',
 '1295399': '七武士',
 '1460911': '七武士'}

<b><font color=red>思考题</font></b>：之前还有那种数据类型可以使用`pop`方法删除元素

<b><font color=red>思考题</font></b>：`film_dic.pop()`这行代码的执行结果是什么

In [30]:
item_list

[('1292052', '肖申克的救赎'),
 ('1291546', '霸王别姬'),
 ('1292720', '阿甘正传'),
 ('1295644', '这个杀手不太冷'),
 ('1292722', '泰坦尼克号'),
 ('1441801', '局内人'),
 ('1295399', '七武士'),
 ('1460911', '七武士')]

In [31]:
# 使用dict函数创建一个空字典
empty_dict = dict()

In [32]:
empty_dict

{}

In [33]:
# 使用dict函数创建一个空字典
small_film_dict = dict(a='肖申克的救赎',b='霸王别姬',c='阿甘正传')

In [34]:
# 这样是不行的
# small_film_dict = dict('1292052'='肖申克的救赎', '1291546'='霸王别姬', '1292720'='阿甘正传',)

In [35]:
small_film_dict

{'a': '肖申克的救赎', 'b': '霸王别姬', 'c': '阿甘正传'}

In [36]:
# 使用dict函数创建一个字典
film_dict_from_list = dict(item_list)

In [37]:
film_dict_from_list

{'1292052': '肖申克的救赎',
 '1291546': '霸王别姬',
 '1292720': '阿甘正传',
 '1295644': '这个杀手不太冷',
 '1292722': '泰坦尼克号',
 '1441801': '局内人',
 '1295399': '七武士',
 '1460911': '七武士'}

<b><font color=red>思考题</font></b>：

 - `item_list`是哪里来的，
 - 如果下面运行代码`film_dict_from_list = film_dict`，结果是什么
 - 如果下面运行代码`film_dict_from_list == film_dict`，结果是什么
 - 如果下面运行代码`film_dict_from_list is film_dict`，结果是什么

In [38]:
# 使用dict函数创建一个字典
film_dict_from_zip = dict(zip(key_list, value_list))

In [39]:
film_dict_from_zip

{'1292052': '肖申克的救赎',
 '1291546': '霸王别姬',
 '1292720': '阿甘正传',
 '1295644': '这个杀手不太冷',
 '1292722': '泰坦尼克号',
 '1441801': '局内人',
 '1295399': '七武士',
 '1460911': '七武士'}

In [40]:
key_list

['1292052',
 '1291546',
 '1292720',
 '1295644',
 '1292722',
 '1441801',
 '1295399',
 '1460911']

In [41]:
value_list

['肖申克的救赎', '霸王别姬', '阿甘正传', '这个杀手不太冷', '泰坦尼克号', '局内人', '七武士', '七武士']

In [42]:
zip(key_list, value_list)

<zip at 0x7f97bc05fc88>

In [43]:
type(zip(key_list, value_list))

zip

In [44]:
list(zip(key_list, value_list))

[('1292052', '肖申克的救赎'),
 ('1291546', '霸王别姬'),
 ('1292720', '阿甘正传'),
 ('1295644', '这个杀手不太冷'),
 ('1292722', '泰坦尼克号'),
 ('1441801', '局内人'),
 ('1295399', '七武士'),
 ('1460911', '七武士')]

<b><font color=red>思考题</font></b>：

 - 如果下面运行代码`item_list.append(item_list[2]); new_dict = dict(item_list)`，结果是什么
 - 如果下面运行代码`item_list.append(('1292052', '月黑风高')); new_dict = dict(item_list)`，结果是什么

字典的key必须是**不可变对象**

In [1]:
# 列表是可变的，所以不能作为字典的key，下面代码会报错
# dict_1 = {[1]:9}

TypeError: unhashable type: 'list'

字典的key如果有重复，**只会保留一个**

In [46]:
dict_2 = {1:1, 1:2, 1:3, 1:4}

In [47]:
dict_2

{1: 4}

## 4.2 字典的基本操作

### 添加、修改、获取、删除条目

- 关键字（键）在字典中的作用相当于列表中的下标。通过类似`字典对象名[关键字]`的语法可以读或写字典中的条目。

- 要从字典中删除一个条目，可使用`del`关键字进行删除。

In [48]:
film_dict

{'1292052': '月黑高飞',
 '1292720': '阿甘正传',
 '1295644': '这个杀手不太冷',
 '1292722': '泰坦尼克号',
 '1441801': '局内人',
 '1295399': '七武士',
 '1460911': '七武士'}

In [49]:
# 根据key获取字典中的value

film_dict['1292052']

'月黑高飞'

In [50]:
# '1292063'这个key在film_dict中不存在，所以下面的获取方式会报错 KeyError
# film_dict['1292063']

In [51]:
# 使用get方法根据key获取value
# 如果key在字典中存在，返回值
# 如果key在字典中不存在，不返回结果
film_dict.get('1292063')

In [52]:
# 如果key不存在，则返回'美丽人生'
film_dict.get('1292063', '美丽人生')

'美丽人生'

In [53]:
# 此时，字典并未发生变化哦
film_dict

{'1292052': '月黑高飞',
 '1292720': '阿甘正传',
 '1295644': '这个杀手不太冷',
 '1292722': '泰坦尼克号',
 '1441801': '局内人',
 '1295399': '七武士',
 '1460911': '七武士'}

In [54]:
# 如果key存在，则返回对应的value
film_dict.get('1292052', '美丽人生')

'月黑高飞'

In [55]:
# 往字典film_dict中新增一个key-value pair
film_dict['1292063'] = '美丽人生'

In [56]:
film_dict

{'1292052': '月黑高飞',
 '1292720': '阿甘正传',
 '1295644': '这个杀手不太冷',
 '1292722': '泰坦尼克号',
 '1441801': '局内人',
 '1295399': '七武士',
 '1460911': '七武士',
 '1292063': '美丽人生'}

In [57]:
# 使用del删除一个key-value pair
# 要用key指定删除哪一个哦
del film_dict['1295399']

In [58]:
film_dict

{'1292052': '月黑高飞',
 '1292720': '阿甘正传',
 '1295644': '这个杀手不太冷',
 '1292722': '泰坦尼克号',
 '1441801': '局内人',
 '1460911': '七武士',
 '1292063': '美丽人生'}

In [59]:
film_dict_backup = dict(film_dict.items())

In [60]:
film_dict_backup

{'1292052': '月黑高飞',
 '1292720': '阿甘正传',
 '1295644': '这个杀手不太冷',
 '1292722': '泰坦尼克号',
 '1441801': '局内人',
 '1460911': '七武士',
 '1292063': '美丽人生'}

In [61]:
film_dict_backup == film_dict

True

In [62]:
film_dict_backup is film_dict

False

In [63]:
film_dict_backup

{'1292052': '月黑高飞',
 '1292720': '阿甘正传',
 '1295644': '这个杀手不太冷',
 '1292722': '泰坦尼克号',
 '1441801': '局内人',
 '1460911': '七武士',
 '1292063': '美丽人生'}

In [64]:
# 删除film_dict_backup这个字典
del film_dict_backup

In [65]:
# 因为film_dict_backup被删除了，所以无法访问了，下面会报错哦
# film_dict_backup

In [66]:
a = [1, 2, 3]; b = (1, 2, 3); c = '123'

In [67]:
a, b, c

([1, 2, 3], (1, 2, 3), '123')

In [68]:
del a, b, c

In [69]:
# a, b, c均被删除，所以无法访问了哦
# a, b, c

In [70]:
a = [1, 2, 3]; b = (1, 2, 3); c = '123'

In [71]:
del a[0]

In [72]:
a

[2, 3]

<b><font color=red>思考题</font></b>：

 - 如果下面运行代码`del b[1]`，结果是什么
 - 如果下面运行代码`del c[2]`，结果是什么

### 字典推导式

与列表和集合相似，字典同样支持推导式生成。不同的是，字典推导式起始位置的表达式应该是`键:值`格式的。

In [73]:
dict_2 = {"a":1, "b":2, "c":3, "d":4}

In [74]:
# 利用字典推导式快速对调key value值
dict_3 = {v:k for k, v in dict_2.items()}

In [75]:
dict_3

{1: 'a', 2: 'b', 3: 'c', 4: 'd'}

<b><font color=red>思考题</font></b>：

 - 如果下面运行代码`dict_2 = {"a":1, "b":1, "c":2, "d":2, "e":3};{v:k for k, v in dict_2.items()}`，结果是什么

### 列表，集合推导式

In [76]:
# 从[0,9)中取偶数的平方
list_1 = [i*2 for i in range(10) if i % 2 == 0]

In [77]:
list_1

[0, 4, 8, 12, 16]

In [78]:
# 从[0,9)中取偶数的平方，取奇数的三次方
list_2 = [i*2 if i % 2 == 0 else i*3 for i in range(10)]

In [79]:
list_2

[0, 3, 4, 9, 8, 15, 12, 21, 16, 27]

In [80]:
# exp_gener不是一个元组推导式，生成器表达式(generator expression)
exp_gener = (i*2 if i % 2 == 0 else i*3 for i in range(10))

In [81]:
exp_gener

<generator object <genexpr> at 0x7f97a77da9a8>

In [82]:
for item in exp_gener:print(item)

0
3
4
9
8
15
12
21
16
27


In [83]:
import sys

In [84]:
sys.getsizeof(exp_gener)

120

In [85]:
sys.getsizeof(list_2)

192

In [86]:
big_exp_gener = (i*2 if i % 2 == 0 else i*3 for i in range(10000))

In [87]:
sys.getsizeof(big_exp_gener)

120

In [88]:
big_list = [i*2 if i % 2 == 0 else i*3 for i in range(10000)]

In [89]:
sys.getsizeof(big_list)

87624

<b><font color=blue>相比推导式，生成式有助于节约内存空间</font></b>

<b><font color=Chocolate>拓展学习</font></b>：<a href="https://blog.csdn.net/qq_36523839/article/details/79807866" target="_blank">Python列表推导式和生成器表达式的异同</a>

In [90]:
set_1 = {i%5 for i in range(100)}

In [91]:
set_1

{0, 1, 2, 3, 4}

<b><font color=blue>总结一下推导式</font></b>

四个重要部分：

- 边界符号（中括号是列表推导式，花括号是集合推导式）
- `for`关键词，用来遍历一个可迭代对象
- `if...else..`用来做条件判断
- 表达式，用来计算结果序列中每一个元素的值

一定记住，推导式中只使用`if` 和 推导式中使用`if else` 两者写法的区别：

- `[判断条件为真时要执行的表达式 for item in 可迭代对象 if 判断条件]`
- `[判断条件为真时要执行的表达式  if 判断条件 else 判断条件为假时要执行的表达式 for item in 可迭代对象]`

### 4.3 字典的基本操作

#### in/not in运算符

- 使用`in`或`not in`运算符可以用来判断一个**关键字**是否在字典中。

#### 比较运算符

- 可以使用运算符`==`和`!=`来检测两个字典中的条目是否相同。

#### 字典也是无序对象

In [92]:
film2id_dict = {v:k for k, v in film_dict.items()}

In [93]:
film2id_dict

{'月黑高飞': '1292052',
 '阿甘正传': '1292720',
 '这个杀手不太冷': '1295644',
 '泰坦尼克号': '1292722',
 '局内人': '1441801',
 '七武士': '1460911',
 '美丽人生': '1292063'}

In [94]:
# in/not in只能判断key，key，key是否在字典中存在
'肖申克的救赎' in film2id_dict

False

In [95]:
'阿甘正传' in film2id_dict

True

In [96]:
'阿甘正传' not in film2id_dict

False

In [97]:
# '1292052'在字典的values里，但是不在keys里
'1292052' in film2id_dict

False

In [98]:
# 字典无序
{1:'a', 2:'b', 3:'c'} == {2:'b',3:'c',1:'a'}

True

In [99]:
# 列表有序
[1,2,3] == [2,3,1]

False

## 4.4 字典相关的函数和方法

- `keys()`
- `values()`
- `items()`
- `get(key[, default])`
- `pop(key[, default])`
- `popitem()`
- `copy()`
- `setdefault(key[, default])`
- `update([other])`
- `clear()`

In [100]:
film2id_dict

{'月黑高飞': '1292052',
 '阿甘正传': '1292720',
 '这个杀手不太冷': '1295644',
 '泰坦尼克号': '1292722',
 '局内人': '1441801',
 '七武士': '1460911',
 '美丽人生': '1292063'}

In [101]:
# 删除不存在的key会报错哦
# film2id_dict.pop('肖申克的救赎')

In [102]:
# 如果key不存在则返回指定的值
# 此处指定如果不存在key，则返回”注意：字典中不存在该电影！！！“
film2id_dict.pop('肖申克的救赎','注意：字典中不存在该电影！！！')

'注意：字典中不存在该电影！！！'

In [103]:
# 看看popitem的用法
print(dict.popitem.__doc__)

D.popitem() -> (k, v), remove and return some (key, value) pair as a
2-tuple; but raise KeyError if D is empty.


In [104]:
# 删除某个，某个，某个，key-value pair，并以2元组的形式返回被删除的key-value pair
film2id_dict.popitem()

('美丽人生', '1292063')

In [105]:
# 字典的一个浅复制
print(dict.copy.__doc__)

D.copy() -> a shallow copy of D


### 直接赋值、浅复制、深复制的区别

以下“复制”和“拷贝”两词均表达相同意思（即copy），会互换着使用。

- 直接赋值：其实就是对象的引用（别名）。

- 浅拷贝(copy)：拷贝父对象，不会拷贝对象的内部的子对象。

- 深拷贝(deepcopy)： copy 模块的 deepcopy 方法，完全拷贝了父对象及其子对象。

In [106]:
a = {1: [1,2,3]}

In [107]:
# 直接赋值
b = a

`b = a`: 赋值引用，a 和 b 都指向同一个对象。

<div align=center>
<img width="350" height="550" src="https://github.com/zhangjianzhang/programming_basics/blob/master/files/codes/lecture_4/fuzhi.png?raw=true">

<p><center><font>直接赋值</font></center></p>
</div>

In [108]:
# 浅拷贝
b = a.copy()

`b = a.copy()`: 浅拷贝, a 和 b 是一个独立的对象，但他们的子对象还是指向统一对象（是引用）。

<div align=center>
<img width="350" height="550" src="https://github.com/zhangjianzhang/programming_basics/blob/master/files/codes/lecture_4/qian.png?raw=true">

<p><center><font>浅拷贝</font></center></p>
</div>

In [109]:
a, b

({1: [1, 2, 3]}, {1: [1, 2, 3]})

In [110]:
a[1].append(4)

In [111]:
a, b

({1: [1, 2, 3, 4]}, {1: [1, 2, 3, 4]})

In [112]:
# 深拷贝
import copy
c = copy.deepcopy(a)

`b = copy.deepcopy(a)`: 深度拷贝, a 和 b 完全拷贝了父对象及其子对象，两者是完全独立的。

<div align=center>
<img width="350" height="550" src="https://github.com/zhangjianzhang/programming_basics/blob/master/files/codes/lecture_4/shen.png?raw=true">

<p><center><font>深拷贝</font></center></p>
</div>

In [113]:
a, c

({1: [1, 2, 3, 4]}, {1: [1, 2, 3, 4]})

In [114]:
a[1].append(4)

In [115]:
a, c

({1: [1, 2, 3, 4, 4]}, {1: [1, 2, 3, 4]})

<b><font color=blue>对于列表：切片和列表迭代得到也是浅复制。</font></b>

In [116]:
list_5 = [1, [1,2,3], 4]

In [117]:
# 切片得到列表list_6，是浅复制
list_6 = list_5[:]

In [118]:
list_5[1].append(0)

In [119]:
list_5

[1, [1, 2, 3, 0], 4]

In [120]:
list_6

[1, [1, 2, 3, 0], 4]

In [121]:
# 迭代得到列表list_7，是浅复制
list_7 = [item for item in list_5]

In [122]:
list_5, list_7

([1, [1, 2, 3, 0], 4], [1, [1, 2, 3, 0], 4])

In [123]:
list_5[1].append(-1)

In [124]:
list_5, list_7

([1, [1, 2, 3, 0, -1], 4], [1, [1, 2, 3, 0, -1], 4])

In [125]:
list_5.append(-100)

In [126]:
list_5, list_7

([1, [1, 2, 3, 0, -1], 4, -100], [1, [1, 2, 3, 0, -1], 4])

In [127]:
list_5

[1, [1, 2, 3, 0, -1], 4, -100]

In [128]:
list_8 = list_5.copy()

In [129]:
list_8

[1, [1, 2, 3, 0, -1], 4, -100]

In [130]:
list_5[1].append(-2)

In [131]:
list_5, list_8

([1, [1, 2, 3, 0, -1, -2], 4, -100], [1, [1, 2, 3, 0, -1, -2], 4, -100])

In [132]:
del list_5, list_6

In [133]:
list_5 = [1, set([1,2,3]), 4]

In [134]:
list_5

[1, {1, 2, 3}, 4]

In [135]:
list_6 = list_5[:]

In [136]:
list_6

[1, {1, 2, 3}, 4]

In [137]:
list_5[1].pop()

1

In [138]:
list_5, list_6

([1, {2, 3}, 4], [1, {2, 3}, 4])

<b><font color=blue>无论是字典还是列表，`copy`方法都是浅复制，浅复制只复制最外面一层。</font></b>

<b><font color=blue>如果想要对原对象做备份，必须使用深复制，使用浅复制和直接赋值非常可能改变原对象，因为浅复制和直接赋值没有实现对原对象的完全复制。</font></b>

<b><font color=red>思考题</font></b>：
 - 如果下面运行代码`list_5 is list_6`，结果是什么

<b><font color=red>思考题</font></b>：

先执行如下两行代码<br>
`d1 = {'a':1, 'b':[1,2,3], 'c':set([4,5,6]), 'd':7}`<br>
`d2 = {k:v for k,v in d1.items()}`

如果继续执行`d1['b'].append(100)`，`d2`会如何变化<br>
如果继续执行`d1['c'].pop()`，`d2`会如何变化<br>
如果继续执行`d1['d'] = '阿里巴巴'`，`d2`会如何变化<br>

`setdefault(key[, default])`如果 key 在字典中，返回对应的值。如果key不在字典中，那就插入一个新的key-value pair，value值如果没有指定，则默认为None，插入后，返回value值。

In [139]:
film2id_dict

{'月黑高飞': '1292052',
 '阿甘正传': '1292720',
 '这个杀手不太冷': '1295644',
 '泰坦尼克号': '1292722',
 '局内人': '1441801',
 '七武士': '1460911'}

In [140]:
# key 在字典中，返回对应的value
film2id_dict.setdefault('月黑高飞')

'1292052'

In [141]:
film2id_dict

{'月黑高飞': '1292052',
 '阿甘正传': '1292720',
 '这个杀手不太冷': '1295644',
 '泰坦尼克号': '1292722',
 '局内人': '1441801',
 '七武士': '1460911'}

In [142]:
# key不在字典中，那就插入一个新的key-value pair
# value值如果没有指定，则默认为None
film2id_dict.setdefault('千与千寻', '1291561')

'1291561'

In [143]:
# 《三体3D MAX》目前还没有出来，那value值就取默认的None吧
film2id_dict.setdefault('三体3D MAX')

In [144]:
film2id_dict

{'月黑高飞': '1292052',
 '阿甘正传': '1292720',
 '这个杀手不太冷': '1295644',
 '泰坦尼克号': '1292722',
 '局内人': '1441801',
 '七武士': '1460911',
 '千与千寻': '1291561',
 '三体3D MAX': None}

In [145]:
print(dict.update.__doc__)

D.update([E, ]**F) -> None.  Update D from dict/iterable E and F.
If E is present and has a .keys() method, then does:  for k in E: D[k] = E[k]
If E is present and lacks a .keys() method, then does:  for k, v in E: D[k] = v
In either case, this is followed by: for k in F:  D[k] = F[k]


In [146]:
dict_3 = {'盗梦空间':'3541415', '忠犬八公的故事':'3011091'}

In [147]:
dict_4 = {'星际穿越':'1889243', '楚门的世界':'1292064', 
          '海上钢琴师':'1292001', '三傻大闹宝莱坞':'3793023'}

In [148]:
list_4 = list(dict_4.items())

In [149]:
# 基本用法，使用一个字典（此处为dict3）对已有字典进行更新（此处为film2id_dict）
film2id_dict.update(dict_3)

In [150]:
film2id_dict

{'月黑高飞': '1292052',
 '阿甘正传': '1292720',
 '这个杀手不太冷': '1295644',
 '泰坦尼克号': '1292722',
 '局内人': '1441801',
 '七武士': '1460911',
 '千与千寻': '1291561',
 '三体3D MAX': None,
 '盗梦空间': '3541415',
 '忠犬八公的故事': '3011091'}

In [151]:
# 使用list(2-tuple)，二元组列表，对已有字典进行更新
# 此处的二元组列表为list_4
film2id_dict.update(list_4)

In [152]:
film2id_dict

{'月黑高飞': '1292052',
 '阿甘正传': '1292720',
 '这个杀手不太冷': '1295644',
 '泰坦尼克号': '1292722',
 '局内人': '1441801',
 '七武士': '1460911',
 '千与千寻': '1291561',
 '三体3D MAX': None,
 '盗梦空间': '3541415',
 '忠犬八公的故事': '3011091',
 '星际穿越': '1889243',
 '楚门的世界': '1292064',
 '海上钢琴师': '1292001',
 '三傻大闹宝莱坞': '3793023'}

In [153]:
print(dict.clear.__doc__)

D.clear() -> None.  Remove all items from D.


In [154]:
# 清空列表
film2id_dict.clear()

<b><font color=red>思考题</font></b>：下面两行代码有什么区别

- `film2id_dict.clear()`
- `del film2id_dict`

In [155]:
# film2id_dict

## 4.6 有关Python 数据的补充说明

- `str()`函数：将值转化为适于人阅读的**字符串**的形式；

- `repr()`函数：将值转化为供解释器读取的**字符串**形式；

- `eval()`函数：执行一个字符串表达式，并返回表达式的值。

<b><font color=Chocolate>拓展学习</font></b>：<a href="https://blog.csdn.net/kongsuhongbaby/article/details/87398394" target="_blank">python3编程基础：str()、repr()的区别</a>

In [156]:
x = 123

In [157]:
x_str = str(x)

In [158]:
x_str

'123'

In [159]:
type(x_str)

str

In [160]:
x_repr = repr(x)

In [161]:
x_repr

'123'

In [162]:
type(x_repr)

str

In [163]:
# 执行一个字符串表达式
eval(x_str)

123

In [164]:
# 执行一个字符串表达式
eval(x_repr)

123

In [165]:
type(eval(x_str))

int

In [166]:
type(eval(x_repr))

int

In [167]:
y = '123'

In [168]:
y_str = str(y)

In [169]:
y_str

'123'

In [170]:
y_repr = repr(y)

In [171]:
y_repr

"'123'"

`str()`和`repr()`都可以把出传入的对象转换为字符串，当传入对象为字符串类型时，`repr()`会再加一层引号；

`eval()`函数接收**字符串**，先把字符串的**引号去掉**，再把字符串引号里的内容当做表达式执行，并返回执行结果。

In [172]:
type(eval(y_repr))

str

In [173]:
type(eval(y_str))

int

In [174]:
exp_1 = '+'.join('1234')

In [175]:
exp_1

'1+2+3+4'

In [176]:
type(exp_1)

str

In [177]:
str(exp_1)

'1+2+3+4'

In [178]:
repr(exp_1)

"'1+2+3+4'"

<b><font color=red>思考题</font></b>：

 - 如果下面运行代码`eval(str(exp_1))`，结果是什么
 - 如果下面运行代码`eval(repr(exp_1))`，结果是什么

## 4.7 转义字符

有些字符**无法直接输出**，可以通过`\`转义**其它字符**实现。你可以把下表理解为，在Python中表示**特殊字符**的汇总表。

<div align=center>
<img width="550" height="350" src="https://github.com/zhangjianzhang/programming_basics/blob/master/files/codes/lecture_4/zhuanyi.jpg?raw=true">

<p><center><font>转义字符表</font></center></p>
</div>

In [179]:
print('''line1
line2
line3''')

line1
line2
line3


In [180]:
print('''line1\
line2\
line3''')

line1line2line3


In [181]:
# 这样无法输出\
# print('\')

In [182]:
print('\\')

\


In [183]:
print("'")

'


In [184]:
print('\'')

'


In [185]:
# 在python自带的IDE会响铃，在其他第三方IDE可能会不响
# 即使在Python自带的IDE也可能会不响铃，响铃与否也跟电脑的设置有关
# 这个\a表示响铃，了解即可
print('\a')




In [186]:
# 退格就是键盘上的Backspace，在o后面有个退格，相当于敲了一下键盘上的Backspace键
# 这下你能理解结果了吧
print("Hello\b World!")

Hell World!


In [187]:
# 回车，将\r后面的内容移到字符串开头，
# 并逐一替换开头部分的字符，直至将\r后面的内容完全替换完成
print("Hello\rWorlddddd!")

Worlddddd!


In [188]:
print("Hello\rWo")

Wollo


In [189]:
print("Hello\r")

Hello


In [190]:
# 换页，将当前位置移到下页开头
print("Hello \f World!")

Hello  World!


In [191]:
# 空
print("\000")

 


In [192]:
# 横向制表符
print("Hello\tWorld!")

Hello	World!


In [193]:
# 将当前位置移到下一行开头
print("Hello\nWorld!")

Hello
World!


很抱歉，关于`\other`，我没有找到合适的例子

在字符串前加上r可以消除字符中的转义，语法:`r"带转义字符的字符串"`

In [194]:
print(r"Hello\nWorld!")

Hello\nWorld!
