# 数据结构与序列

## 元组

In [None]:
# 元组无法被改变，所以长度固定，内部对象固定
tup = (2, 3, 4)

In [None]:
type(tup)

In [None]:
# 尝试进行改变，但是会报错
try:
    tup.add(123)
except:
    print("元组无法被改变")

也可以省略掉括号来进行创建，但是建议不要这么做：

In [None]:
tup = 1, 2, 3

In [None]:
tup

可以使用tuple()来将任何可以迭代的对象转换为元组：

In [None]:
num_list = [1, 2, 3, 4, 5]

In [None]:
num_list_to_tup = tuple(num_list)

In [None]:
num_list_to_tup

In [None]:
# 还有字符串转换为元组
tuple("abc def")

可以使用[]来访问元组中的元素：

In [None]:
num_list_to_tup[0]

Python从0开始。

tuple中可以嵌套tuple：

In [None]:
tuple_contain_tuple = (1, 2, 3), (4, 5, 6)

In [None]:
tuple_contain_tuple

tuple中包括的对象是不可变的，但是对象本身是可变的：

In [None]:
tuple_contain_list = (1, 2, [4, 5, 6])

In [None]:
tuple_contain_list

[3, 4, 5] 是一个list，是可变的，可以将这个对象进行修改。

In [None]:
id(tuple_contain_list)

In [None]:
id(tuple_contain_list[2])

In [None]:
# 开始进行修改
tuple_contain_list[2].append(7)  # 这是一个原地修改

In [None]:
tuple_contain_list

In [None]:
tuple_contain_list[2]

In [None]:
id(tuple_contain_list[2])

简单的认为：tuple对象中包含了对其他对象的指向，这是不可变的，但是其他对象中的内容是可变的。

tuple也可以使用 + 来进行连接：

In [None]:
tuple_1 = (1, 2, 3)
tuple_2 = (4, 5, 6)

tuple_together = tuple_1 + tuple_2

In [None]:
tuple_together

元组是可以被拆包的：

In [None]:
num_tuple = (1, 2, 3)

a, b, c = num_tuple

In [None]:
a

In [None]:
b

In [None]:
c

利用python的这个功能，可以实现简单的交换。

In [None]:
# 如果是其他语言
temp = a
a = b
b = temp

In [None]:
a, b

In [None]:
# 但是python可以这样做
a, b = b, a

In [None]:
a, b

有些时候，想要提取某几个元素，然后剩下的元素全部赋值到某一个对象中：

In [None]:
values = 1, 2, 3, 4, 5

In [None]:
a, b, *rest = values

In [None]:
rest

如果剩余的部分是不重要的，Python通常使用 _ 来进行表示：

In [None]:
a, b, *_ = values

In [None]:
_

元组是无法被修改的，所以关于元组的实例方法都是非常的轻量的：

In [None]:
a = (1, 1, 1, 2, 3, 4, 5)

In [None]:
a.count(1)

## 列表

列表是可变的：

In [None]:
num_list = [0, 1, 2, 3, 4]

In [None]:
num_list

可以使用生成器来生成序列，并且使用list()来转换为list：

In [None]:
gen = range(10)

In [None]:
list(gen)

可以使用append()来在末尾进行添加：

In [None]:
num_list.append(5)

In [None]:
num_list

也可以使用insert()函数来在指定的位置插入元素：

In [None]:
num_list.insert(1, -999)

In [None]:
num_list

insert(index, num)会将index所在的位置的元素往后推一个位置，然后将num插入进去。

insert函数的反面是pop函数：

In [None]:
num_list.pop(1)

In [None]:
num_list

如果不指定pop(index)中的index的值，结果如下所示：

In [None]:
num_list.pop()

num_list

默认从list的末尾弹出。

In [None]:
pop_num = num_list.pop()

In [None]:
pop_num

可以发现pop函数是有返回值的。

还有一个方法就是使用remove()函数，remove函数会找到第一个出现的符合条件的值，然后移除：

In [None]:
num_list = [0, 1, 2, 3, 4, 4, 5, 6]

In [None]:
num_list.remove(4)

In [None]:
num_list

如果要判断一个值否是在list中：

In [None]:
3 in num_list

In [None]:
3 not in num_list

append()可以添加单个元素，如果要添加多个元素，则可以使用extend()函数：

In [None]:
num_list.extend([999, 999, [1, 2, 3, 4, 5]])

In [None]:
num_list

extend()添加的计算量比 + 来进行添加，计算量来的更小一些。

这里可以实现一下，然后查看一下是否真的是这样：

In [None]:
import time

# 创建两个较大的列表
list1 = list(range(100000000))  # 1亿个元素
list2 = list(range(100000000, 200000000))  # 另1亿个元素

# 测试 extend() 的时间
start_time = time.time()
list1_copy = list1.copy()  # 创建一个副本，避免修改原列表
list1_copy.extend(list2)
extend_time = time.time() - start_time

# 测试 + 的时间
start_time = time.time()
combined_list = list1 + list2
plus_time = time.time() - start_time

# 输出结果
print(f"Time taken by extend(): {extend_time:.6f} seconds")
print(f"Time taken by +: {plus_time:.6f} seconds")

In [None]:
del list1

In [None]:
del list2

如果要对列表中的内容进行排序，可以使用 .sort() 函数来进行：

In [None]:
random_list = [2, 34, 5, 1, 6, 2, 4,7, 9, 8, 0]

random_list.sort()

In [None]:
random_list

list可以切片：

In [None]:
random_list[:5]

In [None]:
random_list

In [None]:
random_list[-3:-1]

In [None]:
# 直接进行翻转
random_list[::-1]

## 字典

In [None]:
empty_dict = {}

In [None]:
empty_dict["key_01"] = "value_01"

In [None]:
empty_dict

In [None]:
empty_dict["key_01"]

使用 in 可以查看字典是否包含了某一个键：

In [None]:
'key_02' in empty_dict

In [None]:
'key_01' in empty_dict

如果要删除，则需要使用 del 函数

In [None]:
del empty_dict['key_01']

In [None]:
empty_dict

也可以使用 pop 来弹出字典的指定的键所对应的值：

In [None]:
dict_01 = {"key01":"value01", "key02":"value02", "key03":"value03"}

In [None]:
# pop弹出
pop_value = dict_01.pop("key02")

In [None]:
pop_value

可以使用 items() 来同时迭代 键，值：

In [None]:
list(dict_01.items())

如果要对字典进行合并，不能够使用 + 或者 extend，但是可以使用update函数：

In [None]:
dict_02 = {"key99": "value99"}

In [None]:
dict_01

In [None]:
dict_02

In [None]:
dict_01.update(dict_02)

In [None]:
dict_01

如果存在着相同的键但是不同的值，则会保留最新的键值对。

如果想要使用序列来创建元素配对，可以使用 zip() 函数：

In [None]:
mapping = {}

In [None]:
tuple_zip = zip(range(5), reversed(range(5)))

In [None]:
tuple_zip

In [None]:
mapping = dict(tuple_zip)

In [None]:
mapping

## 集合

集合是唯一元素的无序集合。

In [None]:
set([2, 3, 4, 5, 6, 2, 3, 4])

也可以直接使用尖括号：

In [None]:
{1, 1, 2, 3, 4, 5, 2, 1, 1}

集合的常见的函数如下所示：

![image.png](attachment:93039af3-acad-4bf2-b569-914849d82b87.png)

enumerate函数：

In [None]:
fruits = ["apple", "banana", "cherry"]

for index, fruit in enumerate(fruits):
    print(f"Index: {index}, Fruit: {fruit}")

列表推导式：

In [None]:
# [expr for value in collection if condition]

In [None]:
strings = ["a", "as", "bat", "car"]

In [None]:
[x.upper() for x in strings if len(x) > 2]

字典推导式：

In [None]:
fruits = ["apple", "banana", "cherry", "date"]

# 使用字典推导式创建字典
fruit_lengths = {fruit: len(fruit) for fruit in fruits}

print(fruit_lengths)

map可以对每一个可以迭代的对象调用函数：

In [None]:
# map(function, iterable)

numbers = [1, 2, 3, 4, 5]

# 使用 map() 将每个数字平方
squared_numbers = map(lambda x: x ** 2, numbers)

# 将结果转换为列表
squared_numbers_list = list(squared_numbers)

print(squared_numbers_list)

# 函数

## 函数与命名空间

函数是一段可以重复使用的代码块，用于执行特定的任务。通过使用函数，可以使代码更加模块化、易于维护和复用。

In [5]:
def function_name(parameters):
    """文档字符串（可选，用于描述函数功能）"""
    # 函数体
    return value  # 可选，返回值

In [7]:
# result = function_name(arguments)

命名空间（Namespace）是一个映射，将名称（标识符）映射到对象。在 Python 中，命名空间决定了变量、函数等的可见范围。

命名空间的类型：

- 内置命名空间（Built-in Namespace）：包含内置函数和异常，如 len()、print() 等。
- 全局命名空间（Global Namespace）：在模块级别定义，包含模块中的变量、函数等。
- 局部命名空间（Local Namespace）：在函数或类内部定义，包含局部变量。

命名空间的查找顺序：

Python 使用 LEGB 规则查找变量：

- L（Local）：首先在局部命名空间查找。
- E（Enclosing）：如果在局部找不到，查找封闭的函数（如嵌套函数的外层函数）。
- G（Global）：接着在全局命名空间查找。
- B（Built-in）：最后在内置命名空间查找。

In [8]:
# 示例
x = 10  # 全局变量

def outer_function():
    y = 20  # 局部变量（对于 outer_function 来说）

    def inner_function():
        z = 30  # 局部变量（对于 inner_function 来说）
        print(z)  # 查找顺序：L -> E -> G -> B

    inner_function()
    print(y)

outer_function()
print(x)

30
20
10


使用 *args 接收任意数量的位置参数，使用 **kwargs 接收任意数量的关键字参数。

In [9]:
def calculate_sum(*args):
    return sum(args)

print(calculate_sum(1, 2, 3, 4))  # 输出 10

def print_info(**kwargs):
    for key, value in kwargs.items():
        print(f"{key}: {value}")

print_info(name="Eve", age=30)  # 输出 name: Eve 和 age: 30

10
name: Eve
age: 30


使用 return 语句返回值。如果没有 return 或 return 后没有值，则返回 None。

## 匿名函数

In [10]:
square = lambda x: x ** 2
print(square(4))  # 输出 16

add = lambda a, b: a + b
print(add(2, 3))  # 输出 5

16
5


## 生成器

In [12]:
def squares(n = 10):
    print(f"Generating squares from 1 to {n ** 2}")
    for i in range(1, n + 1):
        yield i ** 2

调用这个生成器的时候，不会立刻执行任何代码：

In [13]:
gen = squares()

In [14]:
gen

<generator object squares at 0x0000020394DDAFF0>

In [15]:
for x in gen:
    print(x, end = ' ')

Generating squares from 1 to 100
1 4 9 16 25 36 49 64 81 100 

In [16]:
import itertools

for num in itertools.count(10, 2):
    print(num)
    if num >= 20:
        break
# 输出：10 12 14 16 18 20

10
12
14
16
18
20


In [17]:
for item in itertools.cycle(['A', 'B', 'C']):
    print(item)
    # 添加一个条件来终止循环，否则会无限运行
    if item == 'C':
        break
# 输出：A B C

A
B
C


In [18]:
# 无限重复
for num in itertools.repeat(5):
    print(num)
    break

# 重复3次
for num in itertools.repeat(5, 3):
    print(num)
# 输出：5 5 5

5
5
5
5


## 错误和异常处理

语法为：
```python

try:
    expr_01
except:
    expr_02
```

In [19]:
string_01 = "Hello World"

try:
    float(string_01)
except:
    print("无法将该字符串转换为float格式的数据")

无法将该字符串转换为float格式的数据


有时候我们希望无论try是否捕捉到报错，我们都可以执行某一段代码：

In [20]:
try:
    float(string_01)
except:
    print("无法将该字符串转换为float格式的数据")
finally:
    print("这一段代码一定会被执行")

无法将该字符串转换为float格式的数据
这一段代码一定会被执行


# 文件和操作系统

首先是文件的路径：

In [21]:
file_path = './../../examples/segismundo.txt'

In [22]:
f = open(file_path, encoding = 'utf-8')

不同平台读取文件的时候的默认编码不一定一致，所以这里最好传入 utf-8 参数。

默认情况之下，文件的导入是只读，也就是r的形式：

In [23]:
for line in f:
    print(line)

Sueña el rico en su riqueza,

que más cuidados le ofrece;



sueña el pobre que padece

su miseria y su pobreza;



sueña el que a medrar empieza,

sueña el que afana y pretende,

sueña el que agravia y ofende,



y en el mundo, en conclusión,

todos sueñan lo que son,

aunque ninguno lo entiende.





使用完之后一定要使用 .close() 来关闭文件对象，用来节约系统的资源。

In [24]:
f.close()

一个更简单的方法是使用 with 关键字来打开：

In [26]:
with open(file_path, encoding = 'utf-8') as f:
    lines= [x.rstrip() for x in f]
    print(lines)

['Sueña el rico en su riqueza,', 'que más cuidados le ofrece;', '', 'sueña el pobre que padece', 'su miseria y su pobreza;', '', 'sueña el que a medrar empieza,', 'sueña el que afana y pretende,', 'sueña el que agravia y ofende,', '', 'y en el mundo, en conclusión,', 'todos sueñan lo que son,', 'aunque ninguno lo entiende.', '']


当代码被执行完退出了with语句的时候，自动关闭文件对象。

以下是各种文件模式的简要说明：

- r：只读模式，默认模式，打开文件进行读取操作。
- w：写入模式，打开文件进行写入操作，如果文件已存在则覆盖原有内容。
- x：创建模式，创建新文件并打开进行写入操作，如果文件已存在则会报错。
- a：追加模式，打开文件进行追加操作，在文件末尾添加内容，不会覆盖原有内容。
- r+：读写模式，打开文件进行读取和写入操作。
- b：二进制模式，以二进制格式打开文件，用于处理非文本文件，如图片、音频等。
- t：文本模式，默认模式，以文本格式打开文件，用于处理文本文件。

In [29]:
# 创建example.txt文件并写入初始内容（使用w模式）
with open("example.txt", "w") as file:
    file.write("这是使用w模式写入的初始内容。\n")

# 使用r模式读取文件内容
with open("example.txt", "r") as file:
    content = file.read()
    print("使用r模式读取的内容：")
    print(content)

# 使用x模式尝试创建新文件（如果文件已存在会报错）
try:
    with open("example.txt", "x") as file:
        file.write("这是使用x模式写入的内容。\n")
except FileExistsError:
    print("文件已存在，x模式无法覆盖。文件")

# 使用a模式追加内容到文件
with open("example.txt", "a") as file:
    file.write("这是使用a模式追加的内容。\n")

# 使用r+模式读取和写入文件
with open("example.txt", "r+") as file:
    content = file.read()
    print("使用r+模式读取的内容：")
    print(content)
    file.seek(0, 2)  # 移动文件指针到文件末尾
    file.write("这是使用r+模式追加的内容。\n")

# 使用b模式以二进制方式写入文件
with open("example.txt", "wb") as file:
    file.write("这是使用b模式写入的二进制内容。\n".encode('utf-8'))

# 使用t模式以文本方式写入文件（默认模式，可省略）
with open("example.txt", "wt") as file:
    file.write("这是使用t模式写入的文本内容。\n")

# 最后读取文件内容并打印
with open("example.txt", "r") as file:
    content = file.read()
    print("最终文件内容：")
    print(content)

使用r模式读取的内容：
这是使用w模式写入的初始内容。

文件已存在，x模式无法覆盖。文件
使用r+模式读取的内容：
这是使用w模式写入的初始内容。
这是使用a模式追加的内容。

最终文件内容：
这是使用t模式写入的文本内容。

