# 第10章 列表

## 10.1 列表是一个序列  
与字符串类似，列表（list）是值的序列。  
在字符串中，这些值是字符；在列表中。可以是任何类型。  
列表中的值称为**元素（element）**，有时也称为**列表项（item）**。

In [4]:
list1 = ['spam',2.0,5,[10,20]]

上面这个列表是**嵌套的（nested）**。

In [3]:
empty = [    ] # 空列表
print(l1,empty)

['spam', 2.0, 5, [10, 20]] []


## 10.2 列表是可变的
与字符串不同的是，列表是可变的。  
可以使用方括号操作符[ ]指定列表中的哪个元素被赋值。

In [5]:
list1[0]='ok'
list1

['ok', 2.0, 5, [10, 20]]

in操作符同样也可以用于列表。

In [6]:
2 in list1

True

In [8]:
[10,20] in list1

True

## 10.3 遍历一个列表
遍历一个列表元素最常用的方式是使用for循环。

In [9]:
for i in list1:
    print(i)

ok
2.0
5
[10, 20]


如果需要写入或者更新元素时，则需要下标。  
一个常见的方式是使用内置函数range和len。

In [12]:
numbers = [1,2,3,4]
for i in range(len(numbers)):
    numbers[i] = numbers[i] * 2
    print(numbers[i])

2
4
6
8


嵌套的列表仍被看作一个单独的元素

In [15]:
list1[3],len(list1)

([10, 20], 4)

## 10.4 列表操作
  +操作符可以拼接列表

In [16]:
list2 = list1 + numbers
list2

['ok', 2.0, 5, [10, 20], 2, 4, 6, 8]

\*操作符重复一个列表多次

In [17]:
[0]*5

[0, 0, 0, 0, 0]

## 10.5 列表切片

In [31]:
t = ['a','b','c','d','e','f']

In [32]:
t[1:3]

['b', 'c']

In [33]:
t[3:]

['d', 'e', 'f']

In [34]:
t[:4]

['a', 'b', 'c', 'd']

In [35]:
t[:-2]

['a', 'b', 'c', 'd']

切片操作符出现在赋值语句的左侧，可以更新多个元素。

In [36]:
t[1:3]=['x']

In [37]:
t,len(t)

(['a', 'x', 'd', 'e', 'f'], 5)

## 10.6 列表方法
`s.append(x)`:将 x 添加到序列的末尾 (等同于 `s[len(s):len(s)] = [x]`)

In [38]:
t = ['a','b','c']
t.append('d')
t

['a', 'b', 'c', 'd']

`s.extend(t)` 或 `s += t` :用 t 的内容扩展 s (基本上等同于 `s[len(s):len(s)] = t`)

In [39]:
t1 = ['a','b','c']
t2 = ['d','e']
t1.extend(t2)
t1

['a', 'b', 'c', 'd', 'e']

## 10.7 映射（map）、过滤（filter）和化简（reduce）
- 如果想把列表中的所有元素加起来，可以使用下面这样的循环：  
随着循环的进行，total会累积列表中的值的和；这样使用一个变量有时称为**累加器（accumulator）**

In [42]:
def add_all(t):
    total = 0
    for x in t:
        total += x 
    return total

In [43]:
t = [1,2,3]
add_all(t)

6

对列表元素累加，Python提供了一个内置函数`sum()`

In [44]:
sum(t)

6

类似这样，将一个序列的元素值合起来到一个单独的变量的操作，有时称为**化简(reduce)**

- 下面的函数接收一个字符串列表，并返回一个新列表，其元素是大写的字符串：

In [45]:
def capitalize_all(t):
    res = []
    for s in t:
        res.append(s.capitalize())
    return res

In [47]:
t = ['a','b','c','de']
capitalize_all(t)

['A', 'B', 'C', 'De']

类似`capitalize_all`这样的操作被称为**映射（map）**，它将一个函数（这里是`capitalize`方法）“映射”到一个序列的每个元素上。

- 下面的函数接收一个字符串列表，并返回那些只包含有大写字母的字符串：

In [48]:
def only_upper(t):
    res = []
    for s in t:
        if s.isupper():
            res.append(s)
    return res

In [49]:
t = ['a','B','c','DE','Gh']
only_upper(t)

['B', 'DE']

类似`only_upper`这样的操作称为**过滤(filter)**,因为它选择列表中的某些元素，并过滤掉其他的元素。  
`str.ispper()`是一个字符串方法，当字符串中只包含大写字母时返回True。

## 10.8 删除元素
从列表中删除元素，如果知道下标，可以使用`s.pop(i)`:提取在 i 位置上的项，并将其从 s 中移除

In [63]:
t = ['a','b','c']
x = t.pop(1)
t,x

(['a', 'c'], 'b')

不提供下标，使用`s.pop()`:删除并返回最后一个元素

In [64]:
x = t.pop()
t,x

(['a'], 'c')

如果不需要使用删除的值，可以使用`del`操作符：

In [65]:
t = ['a','b','c']
del t[1]
t

['a', 'c']

如果知道要删除的元素（而不是下标），则可以使用`remove`: 

In [66]:
t = ['a','b','c']
t.remove('b')
t

['a', 'c']

当在 s 中找不到 x 时 remove() 操作会引发 ValueError。

In [67]:
t.remove('d')

ValueError: list.remove(x): x not in list

若要删除多个元素，可以使用`del`和切片下标：

In [68]:
t = ['a','b','c','d','e','f']
del t[1:5]
t

['a', 'f']

## 10.9 列表和字符串
字符串是字符的序列，列表是值的序列。  
字符的列表和字符串并不相同，若要将一个字符串转换成一个字符的列表，可以使用内置函数`lsit`：

In [82]:
s = 'spam'
t = list(s)
t

['s', 'p', 'a', 'm']

`list`函数会将字符串拆成单个字母。如果先要将字符串拆成单词，可以使用`str.split()`方法：


In [88]:
s = 'pining for the'
t1 = list(s)
t2 = s.split()
t1,t2

(['p', 'i', 'n', 'i', 'n', 'g', ' ', 'f', 'o', 'r', ' ', 't', 'h', 'e'],
 ['pining', 'for', 'the'])

`str.split()`接受一个可选的形参，称为**分隔符（delimiter）**，用于指定用哪个字符来分隔单词。<br>
下列的例子中使用连字符（`-`）作为分隔符：

In [89]:
s = 'spam-spam-spam'
t = s.split('-')
t

['spam', 'spam', 'spam']

`str.join()`是`str.split()`的逆操作。接收字符串列表，并拼接每个元素。<br>
`str.join()`是字符串的方法，所以必须在分隔符上调用它，并传入列表作为实参：

In [91]:
t =['pining','for','the','fjords']
s1 = ' '.join(t)
s2 = '-'.join(t)
s1,s2

('pining for the fjords', 'pining-for-the-fjords')

## 10.10 对象和值

In [92]:
a = 'banana'
b = 'banana'

![状态图](https://www.greenteapress.com/thinkpython2/html/thinkpython2012.png)<br>
我们知道a和b都是一个字符串的引用。但我们不知道他们是否指向同一个字符串。有以上两种可能的状态:<br>
1. a和b引用着不同的对象，他们的值相同。
2. a和b指向同一个对象。

In [93]:
a is b

True

只建立了**一个字符串对象**，a和b都引用它。

In [94]:
a = [1,2,3]
b = [1,2,3]
a is b

False

![状态图](https://www.greenteapress.com/thinkpython2/html/thinkpython2013.png)
在这个例子中，这两个列表是**相等的（equivalent）**,因为它们有相同的元素，但它们不是**相同的（identical）**，因为它们并**不是一个对象**。

## 10.11 别名
如果`a`引用一个对象，赋值`b = a`，则两个变量都会引用同一个对象：

In [97]:
a = [1,2,3]
b = a
b is a

True

![状态图](https://www.greenteapress.com/thinkpython2/html/thinkpython2014.png)
变量和对象之间的关联关系称为**引用（reference）**。<br>
在上面这个例子中，有两个指向同一个对象的引用。<br>
当一个对象有多个引用，并且引用有不同的名称时，则这个变量有**别名（aliased）**。

In [99]:
b[0]=42
a

[42, 2, 3]

如果有别名的对象是可变的，则对一个别名的修改会影响另一个。<br>
通常来说，当处理可变对象时，避免使用别名会更加安全。

对于字符串这样的不可变对象，别名则不会带来问题。

In [100]:
a = 'banana'
b = 'banana'

## 10.12 列表参数
将一个列表传递给函数，函数会得到列表的一个引用。如果函数中修改了该列表，则调用者也会看到这个修改。<br>
`delete_head`函数删除列表中的第一个元素:

In [102]:
def delete_head(t):
    del t[0]
    
letters = ['a','b','c']
delete_head(letters)
letters

['b', 'c']

参数`t`和变量`letters`是同一个对象的别名。
![栈图](https://www.greenteapress.com/thinkpython2/html/thinkpython2015.png)

注意区分：`str.append()`方法修改列表，`+`操作符新建列表(原始列表不变)：

In [108]:
t1 = [1,2]
t2 = t1.append(3)
t2,t1

(None, [1, 2, 3])

In [109]:
t3 = t1 + [4]
t3,t1

([1, 2, 3, 4], [1, 2, 3])

这个区别，在编写希望修改列表的函数十分重要。例如，下面的函数并不会删除列表的开头：

In [110]:
def bad_delete_head(t):
    t = t[1:]

t4 = [1,2,3]
bad_delete_head(t4)
t4

[1, 2, 3]

t和t4指向同一个列表。在函数最后，t指向了一个新的列表，但t4仍指向原先那个没有改变的列表

另外有一个方法是编写函数创建和返回一个新的列表。例如，tail返回除了第一个元素以外所有元素的列表：

In [111]:
def tail(t):
    return t[1:]

letters = ['a','b','c']
rest = tail(letters)
rest

['b', 'c']

## 10.14 术语表
- 列表（list）
- 元素（element）
- 嵌套列表（nested list）
- 累加器（accumulator）
- 增加赋值（augmented assignment）
- 化简（reduce）
- 映射（map）
- 过滤（filter）
- 对象（object）
- 相等（equivalent）
- 相同（identical）
- 引用（reference）
- 别名（aliasing）
- 分隔符（delimiter）