# 列表和元组
**数据结构**
## 序列概述
Python内置了多种序列,本章重点讨论其中最常用的两种:**列表和元组**


In [1]:
edward = ['Edward Gumby',42]
john = ['John Smith',50]
database = [edward,john]
database

[['Edward Gumby', 42], ['John Smith', 50]]

Python支持一种数据据结构的基本概念, 名为容器. 容器基本上就是可包含其他对象的对象. 两种主要的容器是序列和映射(键). 有一种既不是序列也不是映射的容器,叫做集合(set)
## 通用的序列操作
索引,切片,相加,数乘和成员资格检查,以及python提供的一些内置函数
### 索引

In [1]:
greeting = 'hello world!'
greeting[0]              # first

'h'

In [2]:
greeting[-1]            # last

'!'

In [4]:
'hello'[1]              # 可直接对字符串字面量进行索引

'e'

In [5]:
[1,2,3,4,5,67,8][2]

3

In [9]:
fourth = input("Year:")[3]
fourth

'5'

In [10]:
month = ['January','February','March','April','May','June','July','August']
month[2][0]

'M'

### 切片
**访问**特定片段,而不是取出

In [3]:
tag = 'https://www.ruc.edu.cn/'
tag[12:15]                  # 左闭右开区间, 注意从0开始数

'ruc'

In [4]:
tag[12:15] = 'RUC'         # 不能直接赋值, 会报错

TypeError: 'str' object does not support item assignment

In [14]:
tag[:5]                     # 头尾可省略

'https'

In [15]:
tag[-3:-1]              # 最后一位为-1, 依旧左闭右开

'cn'

In [16]:
tag[-3:]                # 包含最后一位

'cn/'

In [17]:
tag[6:3]            # 什么也没有,返回空

''

In [18]:
tag[1:10:2]         # 步长可选,默认为1

'tp:/w'

In [20]:
tag[10:1:-1]        # 步长可负,但需注意前面顺序前后需交换

'www//:spt'

In [21]:
tag[:]              # 复制整个序列(注意是复制,而不是本身)

'https://www.ruc.edu.cn/'

In [7]:
ls = [1,2,3,4,5]
ls[1:3] = [6,7,8]         # 替换列表中的元素
ls

[1, 6, 7, 8, 4, 5]

这里很重要的一点是字符串是**不可修改的**, 而列表是允许修改的.

### 序列相加

In [22]:
a = 'hello'
b = ' world'
c = '!'
a + b + c

'hello world!'

### 数乘
理解为加法

In [23]:
'ruc!' * 5

'ruc!ruc!ruc!ruc!ruc!'

In [26]:
[1,2] * 5

[1, 2, 1, 2, 1, 2, 1, 2, 1, 2]

In [29]:
# None,空列表和初始化 #
sequence = [None] * 10
sequence

[None, None, None, None, None, None, None, None, None, None]

- 关于字符串的应用可以参考cmd/powershell中运行python后进入help(), 笔者认为这既是学习python"正统知识"的绝佳方式, 亦能使读者尽快熟悉命令行的使用以及英文阅读, 更是欣赏代码之美, 提升编程素质的契机.

### 成员资格

我们介绍**布尔运算符**,即通过检查指定的条件,并返回相应的值:满足时返回True,否则返回False.成员资格用到的运算符是in.

In [31]:
users = ['Bob','Alice','Flechazo']
'Flechazo' in users

True

In [33]:
"Mike" in users

False

In [34]:
words = 'hello everyone, my name is Mike!'
'a' in words

True

In [35]:
'ike' in words

True

In [36]:
'iek' in words

False

In [37]:
# exercise
database = [['a','1234'],['b','2345'],['c','3456'],['d','4567']]
if [input('User name'), input('Password')] in database:
    print('You are logged in!')

You are logged in!


长度,最小值和最大值

In [38]:
len(database)           # 返回元素个数

4

In [39]:
max(database)           # 返回最大元素

['d', '4567']

In [40]:
min(database)           # 返回最小元素

['a', '1234']

In [41]:
['d', '4567'] > ['a', '1234']

True

这里需要补充**序列比较大小的规则**

In [45]:
'a' > 'b'

False

In [46]:
'A' < "a"

True

## 列表

本节主要讨论列表不同于元组和字符串的地方: 列表是**可变的**(这意味着它的索引和切片都允许赋值!),且列表有很多特有的**方法**

In [27]:
a = list('hello world')         # 请注意,可将任何序列作为list的参数
a

['h', 'e', 'l', 'l', 'o', ' ', 'w', 'o', 'r', 'l', 'd']

In [28]:
''.join(a)              # 列表转换成字符串,后续会讲到

'hello world'

In [29]:
num = [1,2,3,4,5,6,7,8,9,0]
num[-1] = 10            # 给元素赋值
num                     # 不能给不存在的元素赋值,需要初始化

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [30]:
del num[-1]             # 删除元素, 同时长度变短
num                     # 将这段代码多执行几次看看~

[1, 2, 3, 4, 5, 6, 7, 8, 9]

In [31]:
name = list('Jessica')
name[-2:] = ['hello',[123,456,666],(1,2,4,66)]          # 给切片赋值, 且可替换成长度不同的序列
name

['J', 'e', 's', 's', 'i', 'hello', [123, 456, 666], (1, 2, 4, 66)]

In [32]:
seq = [1,2,3,4]
seq[1:1] = [8,9,10]             # 这里"替换"了一个空切片,相当于插入新元素
seq

[1, 8, 9, 10, 2, 3, 4]

In [33]:
seqs = [1,2,3,4,5,6,7,8,9,0]
seqs[1:4] = []              # 亦可来删除片段
seqs

[1, 5, 6, 7, 8, 9, 0]

你可能猜到了, 上述代码其实与下面的代码等效:
```Python
del seqs[1:4]

```


In [34]:
seqs = [1,2,3,4,5,6,7,8,9,0]
seqs[::2] = [100,100,100,100,100]           # 步长不为1时,长度必须严格匹配!!!
seqs

[100, 2, 100, 4, 100, 6, 100, 8, 100, 0]

### 列表方法
方法是与对象(列表,数,字符串等)联系紧密的函数. 通常,像下面的这样调用方法:
```Python
object.method(arguments)

```

In [None]:
lst = [1,2,3]
lst.append(4)           # 将一个对象附加到列表末尾. 且就地修改列表, 而不返回值
lst

[1, 2, 3, 4]

In [36]:
lst.clear()             # 就地清空列表的内容
lst

[]

这类似于
```Python
lst[:] = []
```

In [None]:
ls = [1,2,3,4,5]
ls[:] = []          # 与字符串不同, 这修改了列表本身!
ls

[]

In [None]:
a = [ 1, 2, 3 ]
b = a           # 常规方法仅仅是将另一个名称关联到这个列表上,并没有创建新的副本
b[2] = 4
a

[1, 2, 4]

In [38]:
c = [1,2,3]
d = a.copy()
d[2] = 4
c

[1, 2, 3]

这类似于
```Python
b = a[:]
b = list(a)

```

In [39]:
[1,2,3,4,5,6,7,7,2,3,22,[1,2],1,2,3,2,2,2,2,[1,2]].count(2)

7

In [40]:
[1,2,3,4,5,6,7,7,2,3,22,[1,2],1,2,3,2,2,2,2,[1,2]].count([1,2])

2

In [41]:
x = [1,2,3]
y = [4,5,6]
x.extend(y)             # x就地被改变!!!这不同于 a + b , 而是 a = a + b / a += b
x

[1, 2, 3, 4, 5, 6]

In [None]:
[1,3,5,7,9].index(5)            # 返回指定值第一次出现的索引,没找到则会报错

2

In [43]:
numbers = [1,2,3,4,5]
numbers.insert(1,'hello')
numbers

[1, 'hello', 2, 3, 4, 5]

In [56]:
x = [1,2,3]
x.pop()             # 删除一个元素(默认最后一个), 且返回被删去的这一元素的值

3

In [None]:
x.pop(0)            # 删除指定索引的元素, 且返回被删去的这一元素的值

1

- 使用pop方法可实现一种常见的数据结构--栈. 栈就像一叠盘子,你可以在上面添加盘子,还可以从上面取走盘子.
最后加入的盘子最先取走,这被称为后进先出(LIFO)

In [60]:
y = [1,2,3,3,4,5,7,9]
y.remove(3)         # 删除第一个为指定值的元素
y                   # 就地修改且不返回值

[1, 2, 3, 4, 5, 7, 9]

In [None]:
x = [1,2,3]
x.reverse()         # 就地反转
x

[3, 2, 1]

In [None]:
# 实现偶数位元素反转 #
x = [1,2,3,4,5,6,7,8,9,0]
y = x[1::2]
y.reverse()
x[1::2] = y
x

[1, 0, 3, 8, 5, 6, 7, 4, 9, 2]

In [63]:
x = [1,2,3,4,5,6,7,8,9,0]
x[1::2].reverse()
x

[1, 2, 3, 4, 5, 6, 7, 8, 9, 0]


这个问题涉及到 Python 中**切片操作**和**切片赋值**的底层机制，看似矛盾，实则是因为两种操作在 Python 中的实现逻辑完全不同。以下是详细解释：

---

### 1. **切片操作 (`x[1::2]`) 的本质**
当执行 `x[1::2]` 时，Python 会生成一个**新列表**，其中包含原列表 `x` 在偶数索引位置的元素（例如 `[2,4,6,8,0]`）。  
这个新列表是一个独立的对象，与原列表 `x` **无任何关联**。此时对新列表的任何操作（如 `reverse()`）都不会影响原列表。

**示例代码：**
```python
x = [1,2,3,4,5,6,7,8,9,0]
y = x[1::2]  # y 是新列表 [2,4,6,8,0]
y.reverse()  # 反转 y → [0,8,6,4,2]
print(x)    # 原列表 x 未改变 → [1,2,3,4,5,6,7,8,9,0]
```

---

### 2. **切片赋值 (`x[1::2] = ...`) 的机制**
切片赋值是 Python 中的一个**特殊语法**，它的行为与普通切片操作完全不同。  
当执行 `x[1::2] = y` 时，Python 会直接操作原列表 `x` 的内存结构，将 `y` 中的元素按顺序插入到 `x` 的偶数索引位置。  
这一过程本质上是**对原列表的原地修改**，而非操作切片生成的新列表。

**示例代码：**
```python
x = [1,2,3,4,5,6,7,8,9,0]
y = x[1::2]       # y = [2,4,6,8,0]
y.reverse()       # y = [0,8,6,4,2]
x[1::2] = y      # 将 y 的元素按顺序插入 x 的偶数索引位置
print(x)         # x 被修改 → [1,0,3,8,5,6,7,4,9,2]
```

---

### 3. **关键区别：操作对象不同**
| **操作类型**       | **行为**                                                                 |
|---------------------|--------------------------------------------------------------------------|
| 普通切片操作 `x[1::2]` | 生成新列表，与原列表无关。                                               |
| 切片赋值 `x[1::2] = y` | 直接修改原列表的内存结构，按规则替换指定位置的元素。                     |

#### 为什么切片赋值能修改原列表？
- **底层实现机制**：Python 解释器对切片赋值的语法进行了特殊处理。  
  当检测到 `x[...] = ...` 形式的赋值时，解释器会直接操作原列表，按以下步骤执行：
  1. **定位切片区间**：确定原列表 `x` 中需要替换的位置（如偶数索引）。
  2. **删除旧元素**：删除这些位置上的原有元素。
  3. **插入新元素**：将右侧的值按顺序插入到这些位置。

- **语法糖**：切片赋值是 Python 提供的一种高效语法，允许直接修改列表的指定区间，而无需手动遍历或创建临时变量。

---

### 4. **错误代码分析：`x[1::2].reverse()`**
在以下代码中：
```python
x = [1,2,3,4,5,6,7,8,9,0]
x[1::2].reverse()  # 错误：操作的是新列表，原列表未被修改
print(x)           # 输出仍为 [1,2,3,4,5,6,7,8,9,0]
```

**问题原因：**
1. `x[1::2]` 生成一个新列表 `[2,4,6,8,0]`。
2. `reverse()` 方法反转这个新列表，得到 `[0,8,6,4,2]`。
3. **但反转后的新列表未被赋值回原列表**，因此原列表 `x` 的偶数索引位置未被更新。

---

### 5. **总结：切片赋值的本质**
虽然切片操作 `x[1::2]` 返回新列表，但切片赋值 `x[1::2] = y` 是 Python 解释器的**特殊语法**，它通过以下机制直接修改原列表：
1. **定位目标区间**：找到原列表的指定位置。
2. **替换元素**：用右侧的值覆盖这些位置。

这种机制与普通切片操作的“生成新对象”逻辑完全不同，因此切片赋值能够直接修改原列表。

In [50]:
x = [9,3,4,5,2,7,8,1]
x.sort()                # 对列表就地排序,而不会生成副本
x

[1, 2, 3, 4, 5, 7, 8, 9]

In [None]:
x = [9,3,4,5,2,7,8,1]
y = sorted(x)               # sorted函数可用于任何可迭代对象,总是返回一个列表,不会修改x
y

[1, 2, 3, 4, 5, 7, 8, 9]

In [52]:
# 高级排序 #
x = ['dnjkfn','dcmdkmckd','dmcdlcd','sods','cdscop']
x.sort(key=len)
x

['sods', 'dnjkfn', 'cdscop', 'dmcdlcd', 'dcmdkmckd']

In [53]:
x.sort(key=len,reverse=True)
x

['dcmdkmckd', 'dmcdlcd', 'dnjkfn', 'cdscop', 'sods']

强烈推荐阅读: 如果你想更深入地了解排序,可以参阅文章: ["Sorting Mini-HOW TO"](https:/wiki.python.org/moin/HowTo/Sorting)
## 元组: 不可修改的序列

In [64]:
1,2,3,4,5,6,7,8,9,0             # 自动创建元组

(1, 2, 3, 4, 5, 6, 7, 8, 9, 0)

In [65]:
tp = (1,2,3,4,5,6,7,8,9,0)
()                             # 空元组

()

In [66]:
(2,)                    # 只有一个元素的元组需要保留逗号!!!

(2,)

In [68]:
(42) == 42              # 括号内的42,不是元组

True

In [69]:
tuple("hello world")            # 转换函数

('h', 'e', 'l', 'l', 'o', ' ', 'w', 'o', 'r', 'l', 'd')

- 元组主要用作映射中的键,将在后续介绍.
- 多参数或多返回值的函数与方法其实是通过元组的打包与解包实现的.