# 列表和元组

- 数据结构是以某种方式(如通过编号)组合起来的数据元素(如数、字符乃至其他数据结构)集合
- 在Python中,最基本的数据结构为序列(sequence)。序列中的每个元素都有编号,即其位置或索引,其中第一个元素的索引为0,第二个元素的索引为1,依此类推

## 序列概述
- 列表和元组的主要不同在于,列表是可以修改的,而元组不可以
- 在需要处理一系列值时,序列很有用

## 通用的序列操作
- 有几种操作适用于所有序列,包括索引、切片、相加、相乘和成员资格检查
- 另外,Python还提供了一些内置函数,可用于确定序列的长度以及找出序列中最大和最小的元素

In [1]:
edward = ['Edward Gumby', 42]
john = ['John Smith', 50]
database = [edward, john]
database

[['Edward Gumby', 42], ['John Smith', 50]]

In [2]:
'''
Python支持一种数据结构的基本概念,名为容器(container)。容器基本上就是可包含其他对象的对象。两种主要的容器是序列(如列表和元组)和
映射(如字典)。在序列中,每个元素都有编号,而在映射中,每个元素都有名称(也叫键)。有一种既不是序列也不是映射的容器,它就是集合(set)
'''
# 索引
greeting = 'Hello'
greeting[0]

'H'

In [3]:
greeting[-1] # 从右(即从最后一个元素)开始往左数,因此-1是最后一个元素的位置

'o'

In [4]:
'''
对于字符串字面量(以及其他的序列字面量),可直接对其执行索引操作,无需先将其赋给
变量。这与先赋给变量再对变量执行索引操作的效果是一样的。
'''
'Hello'[1]

'e'

In [6]:
'''
如果函数调用返回一个序列,可直接对其执行索引操作。例如,如果你只想获取用户输入的
年份的第4位,可像下面这样做:
'''
forth = input('Year: ')[3]
forth

Year: 2009


'9'

In [8]:
# 将以数指定年、月、日的日期打印出来
months = [
'January',
'February',
'March',
'April',
'May',
'June',
'July',
'August',
'September',
'October',
'November',
'December'
]
# 一个列表,其中包含数1~31对应的结尾
endings = ['st', 'nd', 'rd'] + 17 * ['th'] \
        + ['st', 'nd', 'rd'] + 7 * ['th'] \
        + ['st']
year = input('Year: ')
month = input('Month (1-12): ')
day = input('Day (1-31): ')

month_number = int(month)
day_number = int(day)
# 别忘了将表示月和日的数减1,这样才能得到正确的索引
month_name = months[month_number-1]
ordinal = day + endings[day_number-1]

print(month_name + ' ' + ordinal + ', ' + year)

Year: 2019
Month (1-12): 10
Day (1-31): 14
October 14th, 2019


### 切片
- 除使用索引来访问单个元素外,还可使用切片(slicing)来访问特定范围内的元素

In [9]:
# 使用两个索引,并用冒号分隔
tag = '<a href="http://www.python.org">Python web site</a>'
tag[9:30]

'http://www.python.org'

In [10]:
tag[32:-4]

'Python web site'

In [12]:
# 切片适用于提取序列的一部分,其中的编号非常重要:第一个索引是包含的第一个元素的编号,但第二个索引是切片后余下的第一个元素的编号
# 你提供两个索引来指定切片的边界,其中第一个索引指定的元素包含在切片内,但第二个索引指定的元素不包含在切片内
numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
numbers[5:8]

[6, 7, 8]

In [13]:
numbers[0:2]

[1, 2]

In [14]:
numbers[7:10] # 索引10指的是第11个元素:它并不存在,但确实是到达最后一个元素后再前进一步所处的位置

[8, 9, 10]

In [15]:
numbers[-3:-1] # 这样好像无法包含最后一个元素

[8, 9]

In [16]:
numbers[-3:0] # 第一个索引指定的元素位于第二个索引指定的元素后面(在这里,倒数第3个元素位于第1个元素后面),结果就为空序列

[]

In [17]:
numbers[-3:] # 简写:如果切片结束于序列末尾,可省略第二个索引

[8, 9, 10]

In [18]:
numbers[:3] # 切片始于序列开头,可省略第一个索引

[1, 2, 3]

In [19]:
numbers[:] # 复制整个序列,可将两个索引都省略

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [21]:
# 从类似于http://www.something.com的URL中提取域名
url = input('Please enter the URL:')
domain = url[11:-4]
print("Domain name: " + domain)

Please enter the URL:http://www.baidu.com
Domain name: baidu


### 更大的步长
- 执行切片操作时,你显式或隐式地指定起点和终点,但通常省略另一个参数,即步长

In [22]:
numbers[0:10:1]

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [23]:
numbers[0:10:2]

[1, 3, 5, 7, 9]

In [24]:
numbers[3:6:3]

[4]

In [25]:
numbers[::4] # 从序列中每隔3个元素提取1个,只需提供步长4即可

[1, 5, 9]

In [26]:
numbers[8:3:-1] # 步长不能为0,否则无法向前移动,但可以为负数,即从右向左提取元素

[9, 8, 7, 6, 5]

In [27]:
numbers[10:0:-2]

[10, 8, 6, 4, 2]

In [28]:
numbers[0:10:-2]

[]

In [29]:
numbers[::-2]

[10, 8, 6, 4, 2]

In [30]:
numbers[5::-2]

[6, 4, 2]

In [31]:
numbers[:5:-2]

[10, 8]

### 序列相加
- 使用加法运算符来拼接序列

In [32]:
[1, 2, 3] + [4, 5, 6]

[1, 2, 3, 4, 5, 6]

In [33]:
'Hello,' + 'world!'

'Hello,world!'

In [34]:
[1, 2, 3] + 'world!' # 不能拼接不同类型的序列

TypeError: can only concatenate list (not "str") to list

### 乘法
- 将序列与数x相乘时,将重复这个序列x次来创建一个新序列

In [35]:
'python' * 5

'pythonpythonpythonpythonpython'

In [36]:
[39] * 4

[39, 39, 39, 39]

In [38]:
sequence = [None] * 10
sequence

[None, None, None, None, None, None, None, None, None, None]

In [51]:
# 在位于屏幕中央且宽度合适的方框内打印一个句子
sentence = input("Sentence: ")

screen_width = 80 # 总宽度80
text_width = len(sentence)
box_width = text_width + 6 # 盒子宽度=文本宽度+6
left_margin = (screen_width - box_width) // 2 # 左边空白宽度=（总宽度-盒子宽度）//2
sentence_margin = (box_width - text_width -2) // 2 # 句子距盒子两边的空白宽度=（盒子宽度-文本宽度-2）//2

print()
print(' ' * left_margin + '+' + '-' * (box_width-2) +   '+')
print(' ' * left_margin + '|' + ' ' * (box_width-2) + '|' )
print(' ' * left_margin + '|' + ' ' * sentence_margin + sentence + ' ' * sentence_margin + '|')
print(' ' * left_margin + '|' + ' ' * (box_width-2)  + '|' )
print(' ' * left_margin + '+' + '-' * (box_width-2) + '+')
print()

Sentence: I love Python!

                              +------------------+
                              |                  |
                              |  I love Python!  |
                              |                  |
                              +------------------+



### 成员资格
- 要检查特定的值是否包含在序列中,可使用运算符 in
- 它检查是否满足指定的条件,并返回相应的值:满足时返回 True ,不满足时返回 False

In [52]:
permissions = 'Python'
'y' in permissions

True

In [53]:
'x' in permissions

False

In [54]:
# 在程序需要执行特定的安全策略时很有用(在这种情况下,可能还需检查密码)
users = ['mlh', 'foo', 'bar']
input('Enter your user name: ') in users

Enter your user name: foo


True

In [56]:
subject = '$$$ Get rich now!!! $$$' # 用于垃圾邮件过滤器
'$$$' in subject

True

In [58]:
'Py' in 'Python' # 使用运算符 in 来检查指定的字符串是否为另一个字符串的子串

True

In [59]:
# 检查用户名和PIN码
database = [
    ['albert','1234'],
    ['dilbert','4242'],
    ['smith','7524'],
    ['jones','9843']
]

username = input('User name: ')
pin = input('PIN code: ')
if [username, pin] in database: print('Access granted') # 授予访问权限

User name: smith
PIN code: 7524
Access granted


In [60]:
numbers = [100, 34, 678]
len(numbers)
max(numbers)
min(numbers)

34

## 列表:Python 的主力
### 函数 list

In [61]:
# 鉴于不能像修改列表那样修改字符串,因此在有些情况下使用字符串来创建列表很有帮助
list('Hello')

['H', 'e', 'l', 'l', 'o']

### 基本的列表操作
- 一些修改列表的方式:给元素赋值、删除元素、给切片赋值以及使用列表的方法(请注意,并非所有列表方法都会修改列表。)

In [62]:
names = ['Alice', 'Beth', 'Cecil', 'Dee-Dee', 'Earl']
del names[2]
names

['Alice', 'Beth', 'Dee-Dee', 'Earl']

In [65]:
name = list('Perl')
name

['P', 'e', 'r', 'l']

In [66]:
name[2:] = list('ar') # 切片是一项极其强大的功能,而能够给切片赋值让这项功能显得更加强大
name

['P', 'e', 'a', 'r']

In [67]:
# 通过使用切片赋值,可将切片替换为长度与其不同的序列
name = list('Perl')
name[1:] = list('ython')
name

['P', 'y', 't', 'h', 'o', 'n']

In [68]:
# 使用切片赋值还可在不替换原有元素的情况下插入新元素
num = [1,5]
num[1:1] = [2,3,4]
num

[1, 2, 3, 4, 5]

In [69]:
# “替换”了一个空切片,相当于插入了一个序列
num[1:4]= [] # 与 del numbers[1:4] 等效
num

[1, 5]

### 列表方法
- 方法是与对象(列表、数、字符串等)联系紧密的函数
- 方法调用与函数调用很像,只是在方法名前加上了对象和句点：object.method(arguments)

In [70]:
# 方法 append 用于将一个对象附加到列表末尾
lst = [1,2,3] # 列 表 为 价 格 列 表 , 可 能 应 该 将 其 命 名 为 prices 、 prices_of_eggs 或pricesOfEggs
lst.append(4)
lst

[1, 2, 3, 4]

In [71]:
# 方法 clear 就地清空列表的内容
lst.clear() # 类似于切片赋值语句 lst[:] = []
lst

[]

In [72]:
# 方法 copy 复制列表
# 常规复制只是将另一个名称关联到列表
a = [1,2,3]
b = a
b[1] = 4
b

[1, 4, 3]

In [76]:
# 要让 a 和 b 指向不同的列表,就必须将 b 关联到 a 的副本
a = [1,2,3]
b = a.copy() # 类似于使用 a[:] 或 list(a) ,它们也都复制 a
b[1] = 4
a

[1, 2, 3]

In [77]:
b

[1, 4, 3]

In [78]:
# 类似于使用 a[:] 或 list(a) ,它们也都复制 a
['to', 'be', 'or', 'not', 'to', 'be'].count('to')

2

In [79]:
x = [[1, 2], 1, 1, [2, 1, [1, 2]]]
x.count(1)

2

In [80]:
x.count([1,2])

1

In [85]:
# 方法 extend 能够同时将多个值附加到列表末尾,为此可将这些值组成的序列作为参数提供给方法 extend
a = [1,2,3]
print(id(a))
b = [4,5,6]
a.extend(b) # 修改被扩展的序列(这里是 a )
print(a)
print(id(a))

140572873578128
[1, 2, 3, 4, 5, 6]
140572873578128


In [90]:
a = [1,2,3]
print(id(a))
b = [4,5,6]

print(a+b)
print(a)
print(id(a))
print(id(a+b)) # 返回一个全新的序列

140572917897568
[1, 2, 3, 4, 5, 6]
[1, 2, 3]
140572917897568
140572917898288


In [91]:
# 拼接操作并非就地执行的,即它不会修改原来的列表。要获得与 extend 相同的效果,可将列表赋给切片
a = [1,2,3]
print(id(a))

b = [4,5,6]
a[len(a):] = b # 可读性不是很高
print(a)
print(id(a))

140572917898288
[1, 2, 3, 4, 5, 6]
140572917898288


In [92]:
# 方法 index 在列表中查找指定值第一次出现的索引
knights = ['We', 'are', 'the', 'knights', 'who', 'say', 'ni']
knights.index('who')

4

In [93]:
knights[4]

'who'

In [94]:
# 方法 insert 用于将一个对象插入列表
numbers = [1, 2, 3, 5, 6, 7]
numbers.insert(3,'four')
numbers

[1, 2, 3, 'four', 5, 6, 7]

In [96]:
numbers = [1, 2, 3, 5, 6, 7]
numbers[3:3] = ['four'] # 可读性根本无法与使用 insert 媲美
numbers

[1, 2, 3, 'four', 5, 6, 7]

In [97]:
# 方法 pop 从列表中删除一个元素(末尾为最后一个元素),并返回这一元素
# pop 是唯一既修改列表又返回一个非 None 值的列表方法
a = [1,2,3]
a.pop()

3

In [98]:
a

[1, 2]

In [99]:
a.pop(0)

1

In [100]:
a

[2]

In [101]:
'''
使用 pop 可实现一种常见的数据结构——栈 (stack)。栈就像一叠盘子,你可在上面添加盘子,还可从上面取走盘子。最后加入的盘子最先取走,
后进先出(LIFO)。
push 和 pop 是大家普遍接受的两种栈操作(加入和取走)的名称。Python没有提供 push ,但可使用 append 来替代。方法 pop 和 append
的效果相反,因此将刚弹出的值压入(或附加)后,得到的栈将与原来相同。
==========================================================
要创建先进先出(FIFO)的队列,可使用 insert(0, ...) 代替 append 。另外,也可继续使用 append ,但用 pop(0) 替代 pop() 。
一种更佳的解决方案是,使用模块 collections 中的deque 。请参阅第10章
'''
a = [1,2,3]
a.append(a.pop())
a

[1, 2, 3]

In [102]:
# 方法 remove 用于删除第一个为指定值的元素
x = ['to', 'be', 'or', 'not', 'to', 'be']
x.remove('be') # remove 是就地修改且不返回值的方法之一
x

['to', 'or', 'not', 'to', 'be']

In [103]:
# 方法 reverse 按相反的顺序排列列表中的元素
# reverse 修改列表,但不返回任何值(与 remove 和 sort 等方法一样)
a = [1,2,3]
a.reverse()
a

[3, 2, 1]

In [104]:
'''
如果要按相反的顺序迭代序列,可使用函数 reversed 。这个函数不返回列表,而是返回一个迭代器(迭代器将在第9章详细介绍)。你可使用
list 将返回的对象转换为列表。
'''
a = [1,2,3]
list(reversed(a))

[3, 2, 1]

In [105]:
# 方法 sort 用于对列表就地排序
# 就地排序意味着对原来的列表进行修改,使其元素按顺序排列,而不是返回排序后的列表的副本
x = [4, 6, 2, 1, 7, 9]
x.sort()
x

[1, 2, 4, 6, 7, 9]

In [109]:
x = [4, 6, 2, 1, 7, 9]
y = x.sort() # Don't do this!
print(y)

None


In [111]:
# 正确的方式之一是先将 y 关联到 x 的副本,再对 y 进行排序
x = [4, 6, 2, 1, 7, 9]
y = x.copy()
y.sort()
y

[1, 2, 4, 6, 7, 9]

In [112]:
x

[4, 6, 2, 1, 7, 9]

In [114]:
# 只是将 x 赋给 y 是不可行的,因为这样 x 和 y 将指向同一个列表。为获取排序后的列表的副本,另一种方式是使用函数 sorted
x = [4, 6, 2, 1, 7, 9]
#y = x.sorted() # 'list' object has no attribute 'sorted':“list”对象没有“sorted”属性
y = sorted(x) # 这个函数可用于任何序列,但总是返回一个列表
y

[1, 2, 4, 6, 7, 9]

In [115]:
x

[4, 6, 2, 1, 7, 9]

In [116]:
sorted('Python')

['P', 'h', 'n', 'o', 't', 'y']

In [1]:
# 高级排序
# 方法 sort 接受两个可选参数: key 和 reverse
'''
参数 key 类似于参数 cmp :你将其设置为一个用于排序的函数。然而,不会直接使用这个函数来判断一个元素是否比另一个元素小,而是使用它来为
每个元素创建一个键,再根据这些键对元素进行排序。因此,要根据长度对元素进行排序,可将参数 key 设置为函数 len 。
'''
x = ['aardvark', 'abalone', 'acme', 'add', 'aerate']
x.sort(key=len)
x

['add', 'acme', 'aerate', 'abalone', 'aardvark']

In [2]:
#对于另一个关键字参数 reverse ,只需将其指定为一个真值( True 或 False ,将在第5章详细介绍),以指出是否要按相反的顺序对列表进行排序。
x = [4, 6, 2, 1, 7, 9]
x.sort(reverse=True)
x
'''
函数 sorted 也接受参数 key 和 reverse 。在很多情况下,将参数 key 设置为一个自定义函数很有用。第6章将介绍如何创建自定义函数。
如果你想更深入地了解排序,可以参阅文章“Sorting Mini-HOW TO":https://wiki.python.org/moin/HowTo/Sorting
'''

[9, 7, 6, 4, 2, 1]

## 元组：不可修改的序列
- 与列表一样,元组也是序列,唯一的差别在于元组是不能修改的(你可能注意到了,字符串也不能修改)
- 用作映射中的键(以及集合的成员),而列表不行
- 有些内置函数和方法返回元组,与元组“打交道”通常意味着像处理列表一样处理它们(需要使用元组没有的 index 和 count等方法时例外)
- 一般而言,使用列表足以满足对序列的需求

In [3]:
# 元组语法很简单,只要将一些值用逗号分隔,就能自动创建一个元组
1,2,3

(1, 2, 3)

In [4]:
(1,2,3) # 元组还可用圆括号括起(这也是通常采用的做法)

(1, 2, 3)

In [5]:
# 空元组用两个不包含任何内容的圆括号表示
()

()

In [6]:
# 如何表示只包含一个值的元组呢?这有点特殊:虽然只有一个值,也必须在它后面加上逗号
3

3

In [7]:
3,

(3,)

In [8]:
(3,)

(3,)

In [9]:
# 仅仅加上一个逗号,就能完全改变表达式的值
2 * (3 + 9)

24

In [10]:
2 * (3+9,)

(12, 12)

In [11]:
# 函数 tuple 的工作原理与 list 很像:它将一个序列作为参数,并将其转换为元组
tuple([1, 2, 3])

(1, 2, 3)

In [12]:
tuple('abc')

('a', 'b', 'c')

In [13]:
tuple((1,2,3))

(1, 2, 3)

In [14]:
# 元组并不太复杂,而且除创建和访问其元素外,可对元组执行的操作不多。元组的创建及其元素的访问方式与其他序列相同
a = 1,2,3
a[1]

2

In [16]:
a[:2] # 元组的切片也是元组,就像列表的切片也是列表一样

(1, 2)

- 序列:序列是一种数据结构,其中的元素带编号(编号从0开始)。列表、字符串和元组都属于序列,其中列表是可变的(你可修改其内容),而元组和字符串是不可变的(一旦创建,内容就是固定的)。要访问序列的一部分,可使用切片操作:提供两个指定切片起始和结束位置的索引。要修改列表,可给其元素赋值,也可使用赋值语句给切片赋值。
- 成员资格:要确定特定的值是否包含在序列(或其他容器)中,可使用运算符 in 。将运算符 in 用于字符串时情况比较特殊——这样可查找子串。
- 方法:一些内置类型(如列表和字符串,但不包括元组)提供了很多有用的方法。方法有点像函数,只是与特定的值相关联。方法是面向对象编程的一个重要方面,这将在第7章介绍。
======================================================================================================================
len(seq) 返回序列的长度
list(seq) 将序列转换为列表
max(args) 返回序列或一组参数中的最大值
min(args) 返回序列和一组参数中的最小值
reversed(seq) 让你能够反向迭代序列
sorted(seq) 返回一个有序列表,其中包含指定序列中的所有元素
tuple(seq) 将序列转换为元组