# Built-in Data Structures, Functions and Files

## 1. Tuple
元组是一个固定长度，不可改变的Python序列对象。创建元组的最简单方式，是用逗号分隔一列值：

In [1]:
tu = 1,2,3,4
tu

(1, 2, 3, 4)

Tuple不可改变，但是其中的对象可以在原位改变，并且可以相加，相乘

In [2]:
tup = tuple(['foo', [1, 2], True])
tup[1].append(3)
tup

('foo', [1, 2, 3], True)

In [3]:
(4, None, 'foo') + (6, 0) + ('bar',)

(4, None, 'foo', 6, 0, 'bar')

In [4]:
 ('foo', 'bar') * 3

('foo', 'bar', 'foo', 'bar', 'foo', 'bar')

#### 元祖的拆分

In [5]:
tup = 4, 5, (6, 7)
a, b, (c, d) = tup
d

7

In [6]:
# 数据替换
a, b = 1, 2
print('a={0}, b={1}'.format(a, b))
a, b = b, a
print('a={0}, b={1}'.format(a, b))

a=1, b=2
a=2, b=1


#### 迭代拆分元祖

In [7]:
seq = [(1, 2, 3), (4, 5, 6), (7, 8, 9)]
for a, b, c in seq:
    print('a={0}, b={1}, c={2}'.format(a, b, c))

a=1, b=2, c=3
a=4, b=5, c=6
a=7, b=8, c=9


Python最近新增了更多高级的元组拆分功能，允许从元组的开头“摘取”几个元素。它使用了特殊的语法*rest，这也用在函数签名中以抓取任意长度列表的位置参数：

In [8]:
values = 1, 2, 3, 4, 5
a, b, *rest = values
print(a, b)
print(rest)

1 2
[3, 4, 5]


In [9]:
a = (1, 2, 3, 4, 2, 3, 2, 2)
a.count(2)

4

## 2. List

In [10]:
# 可以用append在列表末尾添加元素：
b = ['foo', 'bar', 'baz']
b.append('end')
b

['foo', 'bar', 'baz', 'end']

In [11]:
# 可以用remove去除某个值，remove会先寻找第一个值并除去：
b.remove('end')
b

['foo', 'bar', 'baz']

In [12]:
# insert可以在特定的位置插入元素：插入的序号必须在0和列表长度之间。
b.insert(1,'red')
b

['foo', 'red', 'bar', 'baz']

```
警告：与append相比，insert耗费的计算量大，因为对后续元素的引用必须在内部迁移，以便为新元素提供空间。如果要在序列的头部和尾部插入元素，你可能需要使用collections.deque，一个双尾部队列。 
```

In [13]:
# insert的逆运算是pop，它移除并返回指定位置的元素：
print(b.pop(1))
b

red


['foo', 'bar', 'baz']

In [14]:
# 用in可以检查列表是否包含某个值：
'bar' in b

True

#### 串联和组合列表

In [15]:
[4, None, 'foo'] + [7, 8, (2, 3)]

[4, None, 'foo', 7, 8, (2, 3)]

In [18]:
# 如果已经定义了一个列表，用extend方法可以追加多个元素：
# 比 + 速度更快
x = [4, None, 'foo']
x.extend([7, 8, (2, 3)])
x

[4, None, 'foo', 7, 8, (2, 3)]

#### 排序
可以用sort函数将一个列表原地排序（不创建新的对象）：

In [19]:
a = [7, 2, 5, 1, 3]
a.sort()
a

[1, 2, 3, 5, 7]

sort有一些选项，有时会很好用。其中之一是二级排序key，可以用这个key进行排序。

In [20]:
b = ['saw', 'small', 'He', 'foxes', 'six']
b.sort(key=len)
b

['He', 'saw', 'six', 'small', 'foxes']

#### 二分搜索和维护已排序的列表
bisect模块支持二分查找，和向已排序的列表插入值。
* bisect.bisect可以找到插入值后仍保证排序的位置，
* bisect.insort是向这个位置插入值：

注意：bisect模块不会检查列表是否已排好序，进行检查的话会耗费大量计算。因此，对未排序的列表使用bisect不会产生错误，但结果不一定正确。

In [24]:
import bisect
c = [1, 2, 2, 2, 3, 4, 7]
bisect.bisect(c, 5)

6

In [25]:
bisect.insort(c,5)
c

[1, 2, 2, 2, 3, 4, 5, 7]

### 序列函数

#### 1. enumerate函数

In [26]:
some_list = ['foo', 'bar', 'baz']
mapping = {}
for i,v in enumerate(some_list):
    mapping[v] = i
mapping

{'foo': 0, 'bar': 1, 'baz': 2}

#### 2. sorted 函数
sorted函数可以从任意序列的元素返回一个新的排好序的列表（新建对象）：

In [27]:
a = [7, 1, 2, 6, 0, 3, 2]
b = sorted(a)
print(a)
print(b)

[7, 1, 2, 6, 0, 3, 2]
[0, 1, 2, 2, 3, 6, 7]


#### 3. zip 函数
zip可以将多个列表、元组或其它序列成对组合成一个元组列表：

In [30]:
seq1 = ['foo', 'bar', 'baz']
seq2 = [2, 3, 1]
zipped = zip(seq1,seq2)
print(list(zipped))

[('foo', 2), ('bar', 3), ('baz', 1)]


zip可以用于同时迭代多个序列

In [31]:
seq1 = ['foo', 'bar', 'baz']
seq2 = ['one', 'two', 'three']
for i, (a, b) in enumerate(zip(seq1, seq2)):
    print('{0}: {1}, {2}'.format(i, a, b))

0: foo, one
1: bar, two
2: baz, three


给出一个“被压缩的”序列，zip可以被用来解压序列。也可以当作把行的列表转换为列的列表。

In [35]:
pitchers = [('Nolan', 'Ryan'), ('Roger', 'Clemens'), ('Schilling', 'Curt')]
first_names, last_names = zip(*pitchers)
print(first_names)
print(last_names)

('Nolan', 'Roger', 'Schilling')
('Ryan', 'Clemens', 'Curt')
