---
title: "Python数据结构"
format:
  html:
   code-fold: false
   code-tools: true
jupyter: python3
---

<video controls style="width: 100%;">
  <source src="http://szmspython.oss-cn-hangzhou.aliyuncs.com/%E5%91%A8%E4%B8%80%E7%8E%AF%E5%A2%83%E6%90%AD%E5%BB%BA%26%E5%9F%BA%E7%A1%80%E8%AF%AD%E6%B3%95/%E6%96%B0%E6%89%8B%E7%AC%AC%E4%B8%80%E5%A4%A9/%E5%91%A8%E4%B8%89%E8%A7%86%E9%A2%91.mp4" type="video/mp4">
</video>

<style>
video {
  max-width: 100%;
  height: auto;
  
}
</style>



## 数据结构

数据结构是计算机科学中研究和组织数据的一种方式。它是一种将数据按照特定的方式进行存储、组织和管理的方法，以便于在计算机程序中进行访问、处理和操作。

数据结构可以看作是数据的容器，它定义了数据元素之间的关系，以及对这些数据元素进行操作的方法。不同的数据结构适用于不同的应用场景，它们可以是简单的数据类型（如整数、浮点数等），也可以是复杂的组合类型（如列表、元组、字典等）。

在Python中，数据结构是指用于存储和组织数据的不同方式和容器。Python提供了多种内置的数据结构，使得在程序中可以更加灵活地操作和处理数据。

### 一、列表

#### 1. 列表的概念

列表 (Lists) 是Python中最常用的数据结构之一。它是一种有序的可变序列，可以存储多个元素，并且允许在列表中添加、删除、修改元素。列表使用方括号 `[ ]` 表示，各个元素之间用逗号 `,` 分隔。列表可以根据索引来访问和修改元素，可以存储不同类型的数据，并且允许重复元素。

另外，列表支持嵌套，也就是说，列表中的元素，也可以是列表或任意类型的数据结构。

尝试跟着下面的示例，来创建一些列表：

In [16]:
# 创建一个整数列表
numbers = [1, 2, 3, 4, 5]
# 创建一个字符串列表
fruits = ["apple", "banana", "orange"]
# 创建一个混合类型的列表
mixed_list = [1, "hello", True, 3.14]
# 创建一个嵌套列表
nested_list = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]


print(numbers)
print(type(numbers))
print(fruits)
print(type(fruits))
print(mixed_list)
print(type(mixed_list))
print(nested_list)
print(type(nested_list))

[1, 2, 3, 4, 5]
<class 'list'>
['apple', 'banana', 'orange']
<class 'list'>
[1, 'hello', True, 3.14]
<class 'list'>
[[1, 2, 3], [4, 5, 6], [7, 8, 9]]
<class 'list'>


::: {.callout-note}
列表是有序的序列，因此列表中的每一个元素都有一个索引，索引从`0`开始，从前往后，依次递增，表示元素在列表中的位置。

:::

现在，让我们来看一看，有哪些关于列表的常用操作。

#### 2. 列表的常用操作

##### (1) 查找

由于列表是一种可以存储多个元素的有序的数据结构，并且支持索引，因此，我们可以根据索引来查找列表中特定的元素。

**a. 索引查找**

延续刚才的代码，使用索引来查找其中特定的元素。注意，如果列表是嵌套的列表，同样支持下标索引。在查询嵌套列表中的下标索引时，先找到内层列表的下标编号，在找到内层列表元素在内层列表中的下标编号，将二者联合查询。


In [17]:
print(numbers[0])
print(fruits[1])
print(mixed_list[2])
print(nested_list[0][0])

1
banana
True
1


索引可以帮助我们取出特定位置的数据。另外，下标索引除了从前往后，从`0`开始递增排序，也可以从最后一个元素开始，从后往前，从`-1`开始向前递减排序。

**b. `.index()`方法查找**

除了直接使用索引进行查找指定元素，我们也可以使用`.index()`方法来查找元素的索引。如果元素不存在，则会抛出ValueError异常。该方法返回列表中第一个匹配的元素的索引。

试试看下面的代码，你就可以得到特定元素的索引。

In [18]:
print(numbers.index(1))
print(fruits.index('apple'))
print(mixed_list.index(3.14))
print(nested_list.index([1, 2, 3]))

0
0
3
0


在使用下标索引时，要注意索引的取值范围，超出范围将无法取出元素，并且报错。

##### (2) 修改

在Python中，列表是可变的，我们可以在需要时对列表中的元素进行修改操作。

与查找元素一样，修改列表中的元素也是通过索引实现的。

In [19]:
# 查看原列表中的内容
print(numbers)

# 修改列表中的元素
numbers[2] = 10

# 查看修改过的列表
print(numbers)

[1, 2, 3, 4, 5]
[1, 2, 10, 4, 5]


列表的可变性使得它在存储和处理数据时非常灵活，在修改列表时，要确保操作的正确性，以避免出现意外的结果。

##### (3) 增加元素

在Python中，向列表中增加元素一共有两种方法：

**a. 在列表末尾添加元素**

使用`append()`方法可以在列表的末尾添加元素，使用方法如下例所示：

In [20]:
# 查看原列表
print(fruits)

# 在列表末尾添加元素
fruits.append("grape")

# 查看修改过的列表
print(fruits)

['apple', 'banana', 'orange']
['apple', 'banana', 'orange', 'grape']


**b. 在指定位置插入元素**

使用`insert()`方法可以在列表中的指定位置插入元素，与修改元素一样，我们也需要使用索引用以定位。

该方法在使用时，要在括号中填入两个参数，第一个参数为索引，第二个参数为添加的元素。`insert()`

In [21]:
# 查看原列表
print(fruits)

# 在指定位置添加元素
fruits.insert(2,"watermelon")

# 查看修改过的列表
print(fruits)

['apple', 'banana', 'orange', 'grape']
['apple', 'banana', 'watermelon', 'orange', 'grape']


##### (4) 追加多个元素

有时候，我们会遇见需要追加多个元素的情况，可以使用`extend()`方法，将其它数据容器的内容取出，依次追加到列表尾部。其语法为：


In [22]:
numbers.extend(fruits)

print(numbers)

[1, 2, 10, 4, 5, 'apple', 'banana', 'watermelon', 'orange', 'grape']


##### (5) 删除元素

在Python中，有三种常用的方法可以删除列表中的元素。

**a. `del`方法**

使用`del`方法将根据索引删除指定位置的元素。

In [23]:
# 查看原列表
print(numbers)

# 根据索引，删除指定位置的元素
del numbers[3]

# 查看修改过的列表
print(numbers)


[1, 2, 10, 4, 5, 'apple', 'banana', 'watermelon', 'orange', 'grape']
[1, 2, 10, 5, 'apple', 'banana', 'watermelon', 'orange', 'grape']


**b. `pop()`方法**

`pop()`方法在删除指定索引位置的元素时，还会将其返回出来，你可以使用一个变量来接收这个返回值。

::: {.callout-note}
你可以将`pop()`方法的逻辑理解为，将列表中指定位置的元素提取了出来，并且不再放回原列表。

:::

如果不向括号中填入索引，`pop()`方法将默认删除末尾元素。

In [24]:
# 查看原列表
print(numbers)

# 根据索引，删除指定位置的元素
popped_element = numbers.pop(1)

# 查看修改过的列表
print(numbers)
print(popped_element)

[1, 2, 10, 5, 'apple', 'banana', 'watermelon', 'orange', 'grape']
[1, 10, 5, 'apple', 'banana', 'watermelon', 'orange', 'grape']
2


**c. `remove()`方法**

使用`remove()`方法将会删除第一个匹配的元素，如果不存在则会抛出异常。

In [25]:
# 查看原列表
print(fruits)

# 删除指定的元素
fruits.remove("banana")

# 查看修改过的列表
print(fruits)

['apple', 'banana', 'watermelon', 'orange', 'grape']
['apple', 'watermelon', 'orange', 'grape']


列表是Python编程中非常常用的数据结构，它可以用于存储各种类型的数据，并且允许灵活地对数据进行增删改查操作，提供了强大的功能来处理和组织数据。

大家可以试着创建一个新的列表，并对它进行添加、删除、修改以及查找等操作，以加深对列表的理解。

### 二、元组

#### 1. 元组的概念

元组（Tuple）是Python中的一种数据结构，类似于列表，但具有一些重要的区别。元组是有序的，可以包含多个元素，而且一旦创建后，其元素是不可变的，即不可被修改。元组使用圆括号`()`表示，元素之间用逗号`,`分隔。

与列表不同，元组的不可变性使得它适用于存储那些不希望被改变的数据，例如坐标、日期、配置信息等。

与列表相似的是，元组也支持嵌套操作，这意味着我们可以在一个元组中包含其他元组或任意类型的数据结构，包括列表、字典等。

::: {.callout-note}
可以认为元组就是一个只读的列表，但是要注意元组内只有一个数据时，这个数据后也要加上`,`

:::

In [26]:
# 创建一个整数元组
numbers = (1, 2, 3, 4, 5)

# 创建一个字符串元组
fruits = ("apple", "banana", "orange")

# 创建一个混合类型的元组
mixed_tuple = (1, "hello", True, 3.14)

print(numbers)
print(type(numbers))
print(fruits)
print(type(fruits))
print(mixed_list)
print(type(mixed_list))
print(nested_list)
print(type(nested_list))

(1, 2, 3, 4, 5)
<class 'tuple'>
('apple', 'banana', 'orange')
<class 'tuple'>
[1, 'hello', True, 3.14]
<class 'list'>
[[1, 2, 3], [4, 5, 6], [7, 8, 9]]
<class 'list'>


::: {.callout-note}
元组也是有序的序列，元组中的每一个元素都有一个索引，索引从`0`开始，从前往后，依次递增，表示元素在元组中的位置。

:::

#### 2. 元组的常用操作

##### (1) 查找

元组具有与列表一样的下标索引规则，因此也可以通过下标索引进行查找操作。

**a. 索引查找**

In [27]:
print(numbers[0])  # 输出：1
print(fruits[1])   # 输出："banana"

1
banana


**b. `index()`方法查找**

In [28]:
print(numbers.index(1))
print(fruits.index('apple'))
print(mixed_list.index(3.14))

0
0
3


##### (2) 尝试修改

与列表不同的是，元组中的内容是不可变的，因此无法直接修改元组中的元素，如果尝试修改则会引发异常

In [29]:
numbers[2] = 10

TypeError: 'tuple' object does not support item assignment

::: {.callout-note}
当元组中包含嵌套的列表时，我们可以修改列表中的元素，但不能改变列表本身的数据类型。

:::

##### (3) 解包

在Python中，解包（Unpacking）是一种特殊的操作，用于将一个序列（例如列表、元组）或其他可迭代对象中的元素，分别赋值给多个变量。解包可以在一行代码中同时为多个变量赋值，从而方便地提取序列或可迭代对象中的元素。

解包的语法非常简单，通常使用等号（=）将目标序列与变量列表相结合。要注意的是，被解包的序列中的元素数量必须与变量的数量相匹配，否则会引发ValueError异常。

In [30]:
point = (10, 20)
x, y = point
print(x)
print(y)

10
20


元组的不可变性意味着一旦创建了元组，它的内容不会被修改，因此元组通常用于存储一组相关的值，以及在函数返回多个值时使用。虽然元组的内容不可变，但元组本身可以被重新赋值，因此可以用来在不可变和可变数据之间进行转换。

### 三、字典

#### 1. 字典的概念

字典是Python中非常重要的数据结构，用于存储键值对(即key-value)映射。字典提供了一种灵活的方式来组织和访问数据，允许根据键快速查找和修改对应的值。字典用花括号`{}`来创建，每个键值对用冒号`:`分隔，键必须是不可变的类型，通常使用字符串或整数。

注意，字典是无序键值对的集合，每个键都是唯一的。这也意味着，字典不可以通过索引来访问，只可以通过'键'来查找'值'。


::: {.callout-note}
字典中'键'对应的'值'可以为任意元素，也可以为列表、元组等数据结构。

:::

In [31]:
# 创建一个空字典
empty_dict = {}

# 创建一个包含键值对的字典
person = {
    "name": "John",
    "age": 30,
    "city": "New York"
}

print(person)

{'name': 'John', 'age': 30, 'city': 'New York'}


#### 2. 字典的常用操作

##### (1) 查找

在字典中，由于字典自身的无序性，所以需要使用'键'来代替索引进行查找。

In [32]:
print(person["name"])
print(person["age"])

John
30


但是在查找时要注意，如果输入的'键'不存在，会引发`KeyError`异常。为避免异常，可以使用`get()`方法来查找'键'对应的'值'。

In [33]:
print(person.get("city"))
print(person.get("occupation"))  # 键"occupation"不存在时返回None

New York
None


##### (2) 修改

字典中的值是可以修改的，与查找过程类似，我们也需要通过指定'键'来更新对应的'值'。

In [34]:
person["age"] = 31
print(person["age"])

31


如果输入的'键'是字典中不存在的，则会向字典中添加一个键值对。

In [35]:
person["occupation"] = "Engineer"
print(person)

{'name': 'John', 'age': 31, 'city': 'New York', 'occupation': 'Engineer'}


##### (3) 删除

对于字典，我们可以使用`del`方法来进行删除指定的键值对。

In [36]:
# 使用del删除指定键值对
del person["age"]

# 输出结果
print(person)

{'name': 'John', 'city': 'New York', 'occupation': 'Engineer'}


也可以使用`.clear()`方法清空字典中的所有条目。

In [37]:
# 使用clear()清空字典
person.clear()

# 输出结果
print(person)

{}


字典Dict中键和值是一 一对应的，键是唯一的，如果重复最后的一个键【值】对会替换前面的。若一个键中需要存放多个值，可以考虑使用元组Tuple和列表List
。

字典是Python编程中非常重要的数据结构，它允许将数据组织为键值对的形式，方便快速查找和修改数据。字典的灵活性和高效性使其在很多场景中得到广泛应用，例如用于存储配置信息、处理JSON数据、构建数据库等。

### 四、数据结构的通用操作

数据结构尽管各自有各自的特点，但是也存在一些通用的操作。

#### 1. 通用的统计操作

::: {.callout-note}
字符串的大小比较是通过`ASCⅡ`码表进行的，从头到尾，一位位进行比较，其中一位大，后面就无需比较了。对于单个字符，将其转换为`ASCⅡ`码表中对应的码值数字后来确定大小。

:::

##### (1) 统计元素个数

In [None]:
len(容器)

##### (2) 统计最大/最小元素

In [None]:
# 统计最大元素
max(容器)

# 统计最小元素
min(容器)

#### 2. 通用转换功能

1. 使用 `list()` 函数将`元组`转换为`列表`。
2. 使用 `tuple()` 函数将`列表`转换为`元组`

In [None]:
"""
列表、元组互相转换时，看起来会好像只有括号的形式变了
"""

# 将给定容器转换为列表
list(容器)
	"""
	* 字符串列表时，会将字符串内的每一个字符提取出来作为列表内的一个新元素
	* 字典转列表时，会舍弃value，只保留key作为列表里面的元素
	"""
    
    
# 将给定容器转换为元组
tuple(容器)
	"""
	* 字符串元组时，会将字符串内的每一个字符提取出来作为元组内的一个新元素
	* 字典转元组时，会舍弃value，只保留key作为元组里面的元素
	"""
    

In [38]:
# 元组转列表
my_tuple = (1, 2, 3, 4, 5)
my_list = list(my_tuple)
print(my_list)

[1, 2, 3, 4, 5]


In [39]:
# 列表转元组
my_list = [1, 2, 3, 4, 5]
my_tuple = tuple(my_list)
print(my_tuple)

(1, 2, 3, 4, 5)


In [40]:
# keys() 是一个字典(Dictionary)对象的方法，用于返回字典中所有的键

my_dict = {"name": "John", "age": 25, "city": "New York"}
my_list = list(my_dict.keys())
print(my_list)

print(type(my_list))


['name', 'age', 'city']
<class 'list'>


如果想要将字典转换为元组，可以使用`items()`方法。

In [41]:
# 使用 items() 方法获取字典的键值对，然后使用 tuple() 函数将键值对转换为元组。

my_dict = {"name": "John", "age": 25, "city": "New York"}
my_tuple = tuple(my_dict.items())
print(my_tuple)

print(type(my_tuple))


(('name', 'John'), ('age', 25), ('city', 'New York'))
<class 'tuple'>


#### 3. 通用排序功能

使用`sorted`函数，可以将容器从小到大排序；如果添加`reverse=True`参数，则会将排序结果反转。

In [None]:
sorted(容器, reverse=True)
# 使用sorted函数进行排序后，会将内容全部转换为列表对象，实际上，这个函数就是将排序结果放入了列表之中。

### 五、列表、元组、字典的异同点

#### 1. 列表、元组、字典的相同点：

1. 都是Python中常用的数据结构，用于存储和组织数据。
2. 都可以存储多个元素，可以包含不同类型的数据。
3. 都支持索引访问，可以根据位置获取元素。
4. 都可以用于存储任意数量的数据项。
5. 都可以通过迭代和循环遍历其中的元素。

#### 2. 列表、元组、字典的不同点：

1. 可变性：
   - 列表是可变的，可以随时添加、删除和修改其中的元素。
   - 元组是不可变的，一旦创建了元组，就不能修改其中的元素。
   - 字典也是可变的，可以根据键添加、删除和修改对应的值。

2. 创建方式：
   - 列表使用方括号 `[]` 创建。
   - 元组使用圆括号 `()` 创建。
   - 字典使用花括号 `{}` 创建，每个键值对用冒号 `:` 分隔。

3. 可以包含的数据类型：
   - 列表和元组都可以包含不同类型的数据，甚至可以包含其他列表或元组（嵌套结构）。
   - 字典的值可以是任意类型的数据，而键必须是不可变的类型，通常使用字符串或整数。

4. 访问元素方式：
   - 列表和元组使用索引来访问元素，索引从0开始。
   - 字典使用键来查找对应的值，键必须是唯一的。

5. 适用场景：
   - 列表适用于存储有序、可变的数据集合，常用于保存一组相关的数据项。
   - 元组适用于存储有序、不可变的数据集合，常用于函数返回多个值或作为字典的键。
   - 字典适用于存储键值对映射，常用于需要通过键快速查找对应值的情况。

总的来说，列表、元组和字典都是有用且重要的数据结构，根据不同的需求和场景，我们可以灵活地选择使用其中的任何一个或多个来处理和组织数据。