# 第03章 Python的数据结构、函数和文件

**数据结构：元组、列表、字典、集合**

## 元组
元组是用小括号表示的。其大小和内容都不能修改，但较为有用的是可以count（列表也可以）

In [1]:
a = (1, 2, 2, 2, 3, 4, 2)
a.count(2)

4

## 列表

与元组对比，列表的长度可变、内容可以被修改。你可以用方括号定义，或用list函数。 

通过加法将列表串联的计算量较大，因为要新建一个列表，并且要复制对象。用extend追加元素，尤其是到一个大列表中，更为可取。  

In [2]:
x = [4, None, 'foo']
x.extend([7, 8, (2, 3)])
x

[4, None, 'foo', 7, 8, (2, 3)]

## 字典

keys和values是字典的键和值的迭代器方法。虽然键值对没有顺序，这两个方法可以用相同的顺序输出键和值：

In [4]:
d1 = {'a': 'some value', 'b': [1, 2, 3, 4], 7: 'an integer'}
list(d1.keys())

['a', 'b', 7]

In [5]:
list(d1.values())

['some value', [1, 2, 3, 4], 'an integer']

用**update**方法可以将一个字典与另一个融合，update方法是原地改变字典，因此任何传递给update的键的旧的值都会被舍弃。

In [6]:
d1.update({'b' : 'foo', 'c' : 12})
d1

{'a': 'some value', 'b': 'foo', 7: 'an integer', 'c': 12}

## 集合

集合是无序的不可重复的元素的集合。你可以把它当做字典，但是只有键没有值。可以用两种方式创建集合：通过set函数或使用大括号set语句：

In [7]:
set([2, 2, 2, 1, 3, 3])

{1, 2, 3}

In [8]:
{2, 2, 2, 1, 3, 3}

{1, 2, 3}

集合支持交、并运算：

In [9]:
a = {1, 2, 3, 4, 5}
b = {3, 4, 5, 6, 7, 8}

In [10]:
a & b

{3, 4, 5}

In [11]:
a | b

{1, 2, 3, 4, 5, 6, 7, 8}

常用集合方法：

![常用集合方法](http://upload-images.jianshu.io/upload_images/7178691-980efe5d98ecc4d6.png?imageMogr2/auto-orient/strip|imageView2/2/w/1240)

还可以检测一个集合是否是另一个集合的子集或父集：

In [12]:
b.issubset(a)

False

In [13]:
b.issuperset(a)

False

## 列表推导式（重要！！）

**[expr for val in collection if condition]**  

它等同于下面的for循环;

In [None]:
result = []  

for val in collection:
    if condition:
        result.append(expr)  

In [14]:
strings = ['a', 'as', 'bat', 'car', 'dove', 'python']
[x.upper() for x in strings if len(x) > 2]

['BAT', 'CAR', 'DOVE', 'PYTHON']

In [None]:
# 同理，字典推导式
dict_comp = {key-expr : value-expr for value in collection if condition}
# 集合推导式
set_comp = {expr for value in collection if condition}

**嵌套列表推导式** : for表达式的顺序是与嵌套for循环的顺序一样（而不是列表推导式的顺序）

In [15]:
some_tuples = [(1, 2, 3), (4, 5, 6), (7, 8, 9)]
[x for tup in some_tuples for x in tup]

[1, 2, 3, 4, 5, 6, 7, 8, 9]

In [16]:
[[x for x in tup] for tup in some_tuples]

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]

## Lambda函数

Python支持一种被称为匿名的、或lambda函数。它仅由单条语句组成，该语句的结果就是返回值。它是通过lambda关键字定义的，这个关键字没有别的含义，仅仅是说“我们正在声明的是一个匿名函数”。

In [17]:
def apply_to_list(some_list, f):
    return [f(x) for x in some_list]

ints = [4, 0, 1, 5, 6]
apply_to_list(ints, lambda x: x * 2)

[8, 0, 2, 10, 12]

## 生成器

生成器（generator）是构造新的可迭代对象的一种简单方式。一般的函数执行之后只会返回单个值，而生成器则是以延迟的方式返回一个值序列，即每返回一个值之后暂停，直到下一个值被请求时再继续。要创建一个生成器，只需将函数中的return替换为yeild即可：

In [18]:
def squares(n=10):
    print('Generating squares from 1 to {0}'.format(n ** 2))
    for i in range(1, n + 1):
        yield i ** 2

调用该生成器时，没有任何代码会被立即执行，直到你从该生成器中请求元素时，它才会开始执行其代码：

In [19]:
gen = squares()
for x in gen:
   print(x, end=' ')

Generating squares from 1 to 100
1 4 9 16 25 36 49 64 81 100 

## 生成器表达式

另一种更简洁的构造生成器的方法是使用生成器表达式（generator expression）。这是一种类似于列表、字典、集合推导式的生成器。其创建方式为，把列表推导式两端的方括号改成圆括号：

In [20]:
gen = (x ** 2 for x in range(100))

In [21]:
dict((i, i **2) for i in range(5))

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16}