# Lesson6 常用数据结构

## 课程内容

同学，你好！欢迎来到第六课。

在上一次课中，我们学习了使用Python操作系统文件的相关知识，包括

- 操作系统相关的自建模块`os`、`sys`、`shutil`
- 文件IO操作
- 最常用的数据结构——列表`list`

这些知识是不是很实用呢？如果对你的工作很有帮助，不要忘了多多的练习巩固。

今天这节课我们将继续为大家介绍更多的Python开发必备的基础知识——更多常用数据结构：
- for...in...循环
- 元组`tuple`
- 字典`dict`
- 集合`set`

## `for...in`循环

`for`循环是一种循环次数有限的迭代循环语法。其迭代方式为在一个可迭代对象（iterable object）中每次取一个元素存入迭代变量中，运行循环体内代码直至完全遍历所有元素或遇到程序退出为止。

In [1]:
for i in range(5):
    print i

0
1
2
3
4


In [2]:
name_list = ["Aaron", "Baron", "Caron"]
for name in name_list:
    print "Hello, my name is", name

Hello, my name is Aaron
Hello, my name is Baron
Hello, my name is Caron


## 元组

`元组（turple）`是一种类似于列表的数据结构，与列表不同，它具备一旦定义不可被修改的特性。因此，可以理解为元组是一种恒定不变的列表。

在语法上元组的特性为是**以小括号`（）`包围，元素之间以逗号分隔**。

### 赋值

In [4]:
my_tuple = (1, 2, 3)
print my_tuple, type(my_tuple)

(1, 2, 3) <type 'tuple'>


In [5]:
my_tuple[0]

1

In [6]:
my_tuple[0] = 4    # 不能对tuple的元素重新赋值

TypeError: 'tuple' object does not support item assignment

In [13]:
one_item_tuple = (9)    # 只有一个元素的元组的错误赋值方式
print one_item_tuple, type(one_item_tuple)

9 <type 'int'>


In [14]:
one_item_tuple = (9,)    # 只有一个元素的元组的错误赋值方式
print one_item_tuple, type(one_item_tuple)

(9,) <type 'tuple'>


### 运算

In [9]:
my_tuple + (4, 5, 6)    #tuple可以相加

(1, 2, 3, 4, 5, 6)

In [11]:
my_tuple * 5    # 同样可以计算乘法

(1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3)

In [12]:
my_tuple + [9, 8, 7]    # 不可以跨类型相加

TypeError: can only concatenate tuple (not "list") to tuple

### 方法

In [15]:
dir(my_tuple)

['__add__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__getnewargs__',
 '__getslice__',
 '__gt__',
 '__hash__',
 '__init__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__rmul__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'count',
 'index']

## 字典

字典(`dict`)也是一种元素可变的数据结构，也被称呼为“键值对”或“哈希表”。其特点是**每个元素由一键（`key`）一值(`value`)配对组成**，其中**键不可重复，值可以重复**。

字典的每个`键值对（key=>value）`的键和值之间用冒号`:`分割，每个键值对之间用逗号`,`分割，整个字典使用花括号`{}`包围 ,格式如下所示：
```python
my_dict = {key1 : value1, key2 : value2 }
```

### 定义

In [21]:
my_dict = {"name": "Aaron", "age": 32, "gender": "male", "position": "programmer"}
print my_dict

{'gender': 'male', 'age': 32, 'name': 'Aaron', 'position': 'programmer'}


In [16]:
{'a': 1, 'b': 2, 'b': '3'}    # 重复的键将会被覆盖

{'a': 1, 'b': '3'}

In [19]:
{"a": [1, 2, 3], "b": {1: "x", 2: "y"}, ("a", "B"): 123}    # 值可以为任意类型对象， 键可以为字符串、数字、元组等常量型基本数据结构

{'a': [1, 2, 3], 'b': {1: 'x', 2: 'y'}, ('a', 'B'): 123}

In [18]:
{[1,2]: "a"}    # 键不可为可变数据类型

TypeError: unhashable type: 'list'

> 虽然字典支持多种常量数据类型（`hashable`）的对象作为键，但在实际开发中，不建议使用字符串以外的对象作为字典的键。

### 取值

In [22]:
my_dict["age"]

32

In [23]:
my_dict.get("name")

'Aaron'

In [24]:
my_dict["hobby"]    # 使用中括号取不存在的key值时会触发KeyError

KeyError: 'hobby'

In [25]:
my_dict.get("hobby")    # 使用get方法取不存在的key值时返回空值None

In [26]:
my_dict.get("hobby", "No hobby")    # 默认值 等价于 my_dict.get("hobby") or "No hobby"

'No hobby'

### 修改值

In [27]:
my_dict["hobby"] = "Python"    # 当键不存在时，则会添加
print my_dict

{'hobby': 'Python', 'gender': 'male', 'age': 32, 'name': 'Aaron', 'position': 'programmer'}


In [29]:
my_dict["age"] = 31    # 当键已存在时，则更新此键的值
print my_dict

{'hobby': 'Python', 'gender': 'male', 'age': 31, 'name': 'Aaron', 'position': 'programmer'}


In [30]:
del my_dict["hobby"]    # 使用保留字 del 删除元素
print my_dict

{'gender': 'male', 'age': 31, 'name': 'Aaron', 'position': 'programmer'}


In [31]:
my_dict.clear()    # 使用clear方法清空所有元素
print my_dict

{}


### 迭代

In [32]:
my_dict = {"name": "Aaron", "age": 32, "gender": "male", "position": "programmer"}

for key in my_dict:    # 默认情况下只能迭代字典的key
    print key, my_dict[key] 

gender male
age 32
name Aaron
position programmer


In [33]:
for (key, value) in  my_dict.items(): 
    print key, value

gender male
age 32
name Aaron
position programmer


### 方法

In [45]:
len(my_dict)    # Python自建的求长度方法也适用于字典

4

方法 | 描述
-|-|
clear() | 删除字典内所有元素
copy() | 返回一个字典的浅复制
fromkeys(seq[, val]) | 创建一个新字典，以序列 seq 中元素做字典的键，val 为字典所有键对应的初始值
get(key, default=None) | 返回指定键的值，如果值不在字典中返回default值
has_key(key) | 如果键在字典dict里返回true，否则返回false
items() | 以列表返回可遍历的(键, 值) 元组数组
keys() | 以列表返回一个字典所有的键
setdefault(key, default=None) | 和get()类似, 但如果键不存在于字典中，将会添加键并将值设为default
update(dict2) | 把字典dict2的键/值对更新到dict里
values() | 以列表返回字典中的所有值
pop(key[,default]) | 删除字典给定键 key 所对应的值，返回值为被删除的值。key值必须给出。 否则，返回default值。
popitem() | 随机返回并删除字典中的一对键和值。

## 集合

集合（`set`）是一种无序不重复元素集数据结构。在语法上的特征是外部以大括号`{}`包围，元素之间以逗号`,`分割。

像中学数学中学习的集合一样，Python的集合对象也支持union(联合), intersection(交), difference(差)和sysmmetric difference(对称差集)等数学运算。

### 定义

In [36]:
set_a = {1, 2, 3}
set_b = {3, 4, 5}
print set_a, set_b

set([1, 2, 3]) set([3, 4, 5])


In [46]:
set_c = set([7, 7, 8, 8, 9, 9])    # 自动去除重复元素
print set_c

set([8, 9, 7])


### 运算

In [38]:
set_a & set_b    # 求交集

{3}

In [39]:
set_a | set_b    # 求并集

{1, 2, 3, 4, 5}

In [40]:
set_a - set_b    # 求差集

{1, 2}

In [41]:
set_a ^ set_b    # 对称差集

{1, 2, 4, 5}

### 取值

与列表不同，集合无法通过数字索引进行取值。

### 修改

In [42]:
set_a.add('x')    # 添加元素
print set_a

set([1, 2, 3, 'x'])


In [43]:
set_a.update('m', 'n', 'x', 'y')    # 更新集合
print set_a

set([1, 2, 3, 'm', 'n', 'y', 'x'])


### 本课结语

在本节课中，我们已经学习了以下几个内容：
- for...in...循环
- 元组`tuple`
- 字典`dict`
- 集合`set`

如果你还没有熟练地掌握这些知识，我建议你通过以下几种方式提高自己：

- 反复地阅读这一节课的内容；
- 依据本课知识，举一反三地进行更多的练习；
- 到互联网上浏览和补充相关的知识，完善和巩固知识体系；
- 在我们的课堂群中和我们进行更多的交流。

如果你觉得本课内容对你有帮助，欢迎到我们的[课程](https://ke.qq.com/course/328764?tuin=2a5bd9a8)中进行评价，给予我们一个珍贵的好评。