# 内建数据结构、函数和文件

## 数据结构和序列

### 元组

- 元组是一种固定长度，不可变的Python对象序列
- 使用`tuple`函数将任意序列或者迭代器转换为元组
- 元组中的元素可以通过`[ ]`来获取，Python中的序列是从零开始的。
- 用加号`+`链接元组以生成更长的元组。
- 将元组乘以整数，会和列表一样生成含有多分拷贝的元组。对象自身没有复制，只是指向它们的引用发生了复制。

In [1]:
tup = 4, 5, 6
tup

(4, 5, 6)

In [2]:
nested_tup = (4, 5, 6), (7, 8)
nested_tup

((4, 5, 6), (7, 8))

In [3]:
tuple([4, 0, 2])

(4, 0, 2)

In [8]:
tup = tuple('string')
print(tup)
print(tup[0])

('s', 't', 'r', 'i', 'n', 'g')
s


In [11]:
tup = tuple(('foo', [1, 2], True))
# tup[2] = False wrong tuple不能被修改
tup[1].append(3)  # 列表是可变对象
print(tup)

('foo', [1, 2, 3], True)


In [13]:
(4,  None, 'foo') + (6, 0) + ('bar', )

(4, None, 'foo', 6, 0, 'bar')

In [16]:
tup = ('foo', 'bar')
print('tup =', tup)
tup_times_four = tup * 4
print('tup =', tup)
print('tup_times_four =', tup_times_four)

tup = ('foo', 'bar')
tup = ('foo', 'bar')
tup_times_four = ('foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'bar')


#### 元组拆包

- 将元组型的表达式赋值给变量时，Python会对等号右边的值进行拆包
- 元组的拆包可以交换变量；遍历元组或列表组成的序列；从函数返回多个值。
- 元组拆包还可以采集一些元素，使用`*rest`或者`*_`丢弃不想要的元素。

In [17]:
tup = (4, 5, 6)
a, b, c = tup
b

5

In [18]:
tup = 4, 5, (6, 7)
a, b, (c, d) = tup
d

7

```python
# 交换变量不用如此繁琐
temp = a
a = b
b = temp

###########
In [1]: a, b = 1, 2

In [2]: a
Out[2]: 1

In [3]: b
Out[3]: 2

In [4]: a, b = b, a

In [5]: a
Out[5]: 2

In [6]: b
Out[6]: 1
```

In [19]:
# 遍历元组或列表组成的序列

seq = [(1, 2, 3), (4, 5, 6), (7, 8, 9)]
for a, b, c in seq:
    print('a={0}, b={1}, c={2}'.format(a, b, c))

a=1, b=2, c=3
a=4, b=5, c=6
a=7, b=8, c=9


In [25]:
values = [1, 2, 3, 4, 5]
a, b, *rest = values
print('a =', a)
print('b = ' + str(b))
print(str(rest) + ' ' + str(type(rest)))

a = 1
b = 2
[3, 4, 5] <class 'list'>


#### 元组方法

- 元组的内容和长度是无法改变的，实例方法很少
- `count`方法用来计量某个数值在元组中出现的次数。

In [26]:
a = (1, 2, 2, 2, 3, 4, 2)
# 2在此元组中出现的次数
a.count(2)

4

### 列表

- 列表的长度是可变的，内容是可修改的。
- 可以使用中括号`[ ]`或者`list`函数来定义列表
- `list`函数用来将迭代器或生成器转化为列表

In [33]:
a_list = [2, 3, 7, None]
tup = ('foo', 'bar', 'baz')
b_list = list(tup)  # 将元组转化为列表
print(b_list)
b_list[1] = 'peekaboo'  # 修改列表的元素
print(b_list)

['foo', 'bar', 'baz']
['foo', 'peekaboo', 'baz']


In [34]:
gen = range(10)
print(gen)
print(list(gen))


range(0, 10)
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


#### 增加和移除元素

- `append`方法将元素添加到列表尾部,是直接在原列表上进行操作
- `insert`方法将元素插到指定的列表位置,插入位置范围是0到列表长度之间
- `insert`的反操作是`pop`该操作会将特定位置的元素移除并返回,默认是最后一个
- `remove`方法移除元素，该方法会定位第一个符合要求的值并移除。
- `in`检查一个值是否在列表中
- `not in`表示不在列表中
- 注意检查列表中是否含有某个值是十分缓慢的，线性扫描O(n),而字典或者集合速度较快(基于哈希表),为O(1)

In [35]:
b_list.append('dwarf')
b_list

['foo', 'peekaboo', 'baz', 'dwarf']

In [36]:
b_list.insert(1, 'red')
b_list

['foo', 'red', 'peekaboo', 'baz', 'dwarf']

In [37]:
b_list.pop(2)
b_list

['foo', 'red', 'baz', 'dwarf']

In [38]:
b_list.append('foo')
b_list

['foo', 'red', 'baz', 'dwarf', 'foo']

In [39]:
b_list.remove('foo')
b_list

['red', 'baz', 'dwarf', 'foo']

In [41]:
print('dwarf' in b_list)
print('dwarf' not in b_list)

True
False


#### 连接和联合列表

- 两个列表可以使用`+`连接
- `extend`方法用于向一个已经定义的列表中添加多个元素
- 连接时`extend`优于`+`

In [42]:
[4, None, 'foo'] + [7, 8, (2, 3)]

[4, None, 'foo', 7, 8, (2, 3)]

In [44]:
x = [4, None, 'foo']
x.extend([7, 8, (2, 3)])
x

[4, None, 'foo', 7, 8, (2, 3)]

#### 排序

- `sort`方法用于对列表进行内部排序(无需创建一个对象) 不可逆的
- `sort`方法指定二级排序参数`key`

In [49]:
a = [7, 2, 5, 1, 3]
print(a)
print(a.sort())
print(a)

[7, 2, 5, 1, 3]
None
[1, 2, 3, 5, 7]


In [50]:
# 通过字符串的长度来进行排序
b = ['saw', 'small', 'He', 'foxes', 'six']
b.sort(key=len)
print(b)

['He', 'saw', 'six', 'small', 'foxes']


#### 二分搜索和已排序列表的维护

- 内建的`bisect`模块实现了二分搜索和已排序列表的插值
- `bisect.bisect`会找到元素应当插入的位置
- `bisect.insort`将元素插入到相应位置
- `bisect`模块的函数并不会检查列列是否已经排序，代价太大，因此有可能出错。

In [51]:
import bisect
c = [1, 2, 2, 2, 3, 4, 7]
print(bisect.bisect(c, 2))
print(bisect.bisect(c, 5))
bisect.insort(c, 6)
print(c)

4
6
[1, 2, 2, 2, 3, 4, 6, 7]


#### 切片

- 使用切片符号可以对打说书苏烈类型选取其子集,将`start:stop`传入索引符号`[]`中
- 起始的`start`包含，结尾的`stop`不包含，因此元素的数量是`stop - start`
- `start`和`stop`省略的刷则会默认传入序列的起始位置和结束位置
- 步进值`step`可以在第二个默哀好后面使用，意思是每隔多少个数取一个值。
- 令步进值`step`为1可以对列表或者元组进行翻转。

In [53]:
seq = [7, 2, 3, 7, 5, 6, 0, 1]
seq[1: 5]

[2, 3, 7, 5]

In [55]:
seq[3:4] = [6, 3]
print(seq)

[7, 2, 3, 6, 3, 3, 5, 6, 0, 1]


In [56]:
seq[:5]

[7, 2, 3, 6, 3]

In [57]:
seq[3:]

[6, 3, 3, 5, 6, 0, 1]

In [58]:
seq[-4:]

[5, 6, 0, 1]

In [59]:
seq[-6:-2]

[3, 3, 5, 6]

In [60]:
seq[::2]

[7, 3, 3, 5, 0]

In [61]:
seq[::-1]

[1, 0, 6, 5, 3, 3, 6, 3, 2, 7]

### 内建序列函数

#### enumerate

- `enumerate`构造一个字典，返回`(i, value)`的元组序列，将序列值映射到索引位置上

```python
i = 0
for i in collection:
    do something
    i += 1
    
# 等效于
for i, value in enumerate(collection):
    do something
```

In [64]:
some_list = ['foo', 'bar', 'baz']
mapping = {}
for i, v in enumerate(some_list):
    mapping[i] = v
    
print(mapping)

{0: 'foo', 1: 'bar', 2: 'baz'}


#### sorted

#### zip

#### reversed

### 字典

### 集合

### 列表、集合和字典的推导式

## 函数

### 命名空间，作用域和本地函数

### 返回多个值

### 函数是对象

### 匿名(Lambda)函数

### 柯里化：部分参数应用

### 生成器

### 错误和异常处理

## 文件和操作系统

### 字节与Unicode文件