## 常用数据结构之列表-1

1. 将一颗色子掷 6000 次，统计每种点数出现的次数。

In [11]:
import random

counts = [0] * 6
for i in range(6000):
    face = random.randint(1, 6)
    counts[face - 1] += 1
print(counts)

[1002, 1045, 1035, 991, 962, 965]


2. 数值格式化
```格式化规范迷你语言 (Format Specification Mini-Language)
其通用形式（在 f-string 和 str.format() 中）如下：
:[[fill]align][sign][#][0][width][grouping_option][.precision][type]

:: 分隔符，表示格式化规范的开始。
fill (可选): 填充字符，如果指定了 align 但未指定 fill，则默认为空格。
align (可选): 对齐方式：
<: 左对齐 (默认)
>: 右对齐
^: 居中对齐
=: (仅对数字有效) 符号放在填充字符之后，数字本身右对齐。例如 +000120。
sign (可选): 符号显示：
+: 正数前显示 +，负数前显示 -。
-: 仅负数前显示 - (默认)。
 (空格): 正数前显示一个空格，负数前显示 -。
# (可选): "替代形式"，对于不同类型有不同含义：
对于整数，与 b (二进制), o (八进制), x (十六进制) 结合使用时，会添加前缀 0b, 0o, 0x。
0 (可选): 如果指定，则在宽度前面补零而不是空格（等效于 fill='0' 和 align='='）。
width (可选): 最小总字段宽度。如果值的字符串形式比 width 短，则根据 align 和 fill 进行填充。
grouping_option (可选):
,: 使用逗号作为千位分隔符。
_: 使用下划线作为千位分隔符 (Python 3.6+)。
.precision (可选): 精度。
对于浮点数 (f, F, e, E, g, G, %): 表示小数点后的位数。
对于整数 (d, b, o, x, X): 不能与整数一起使用（会导致 ValueError）。
对于 g, G: 表示有效数字的总位数。
type (可选): 数值类型转换：
整数类型:
d: 十进制整数 (默认)。
b: 二进制。
o: 八进制。
x: 十六进制 (小写字母)。
X: 十六进制 (大写字母)。
c: 字符 (将整数转换为对应的 Unicode 字符)。
n: 数字。与 d 类似，但会使用当前区域设置的分隔符。
浮点数类型:
f 或 F: 定点表示法 (默认精度 6)。
e 或 E: 科学计数法 (指数用 e 或 E)。
g 或 G: 通用格式。对于给定精度 p >= 1，它会舍入到 p 位有效数字，然后根据数值大小在定点和科学计数法之间选择。
%: 百分比。数值乘以 100，然后使用 f 格式显示，并附加一个 %。
n: 数字。与 g 类似，但会使用当前区域设置的分隔符。
```

In [34]:

pi = 3.1415926535
large_number = 1234567.89
integer_val = 42
negative_val = -10

# 基本浮点数格式化 (保留2位小数)
print(f"Pi (2 decimal places): {pi:.2f}") # 输出: Pi (2 decimal places): 3.14

# 指定宽度和对齐 (总宽度10, 右对齐, 保留3位小数)
print(f"Pi (width 10, right align, 3 dp): {pi:>10.3f}") # 输出: Pi (width 10, right align, 3 dp):      3.142

# 零填充 (总宽度8, 整数)
print(f"Integer (zero padding, width 8): {integer_val:08d}") # 输出: Integer (zero padding, width 8): 00000042

# 符号显示
print(f"Positive with sign: {integer_val:+d}") # 输出: Positive with sign: +42
print(f"Negative with sign: {negative_val:+d}") # 输出: Negative with sign: -10
print(f"Positive with space: {integer_val: d}") # 输出: Positive with space:  42
print(f"Negative with space: {negative_val: d}") # 输出: Negative with space: -10

# 千位分隔符
print(f"Large number with comma: {large_number:,.2f}") # 输出: Large number with comma: 1,234,567.89
print(f"Large number with underscore: {large_number:_.2f}") # 输出: Large number with underscore: 1_234_567.89

# 百分比
ratio = 0.758
print(f"Ratio as percentage (1 decimal): {ratio:.1%}") # 输出: Ratio as percentage (1 decimal): 75.8%

# 科学计数法
small_number = 0.00000012345
print(f"Small number (scientific, 3 precision): {small_number:.3e}") # 输出: Small number (scientific, 3 precision): 1.235e-07
print(f"Large number (scientific, 3 precision): {large_number:.3E}") # 输出: Large number (scientific, 3 precision): 1.235E+06

# 不同进制
print(f"Integer as binary: {integer_val:b}")     # 输出: Integer as binary: 101010
print(f"Integer as octal: {integer_val:o}")      # 输出: Integer as octal: 52
print(f"Integer as hex (lower): {integer_val:x}")  # 输出: Integer as hex (lower): 2a
print(f"Integer as hex (upper): {integer_val:X}")  # 输出: Integer as hex (upper): 2A

# 带前缀的进制
print(f"Integer as binary with prefix: {integer_val:#b}") # 输出: Integer as binary with prefix: 0b101010
print(f"Integer as hex with prefix: {integer_val:#x}")   # 输出: Integer as hex with prefix: 0x2a

Pi (2 decimal places): 3.14
Pi (width 10, right align, 3 dp):      3.142
Integer (zero padding, width 8): 00000042
Positive with sign: +42
Negative with sign: -10
Positive with space:  42
Negative with space: -10
Large number with comma: 1,234,567.89
Large number with underscore: 1_234_567.89
Ratio as percentage (1 decimal): 75.8%
Small number (scientific, 3 precision): 1.235e-07
Large number (scientific, 3 precision): 1.235E+06
Integer as binary: 101010
Integer as octal: 52
Integer as hex (lower): 2a
Integer as hex (upper): 2A
Integer as binary with prefix: 0b101010
Integer as hex with prefix: 0x2a


## 函数应用实战

### 例子1：随机验证码

设计一个生成随机验证码的函数，验证码由数字和英文大小写字母构成，长度可以通过参数设置。


In [19]:
import random
import string

ALL_CHARS = string.ascii_letters + string.digits

def generate_code(code_len=6):
    return "".join(random.choices(ALL_CHARS, k=code_len))


print(generate_code())

1zMuy6


### 例子2：判断素数

设计一个判断给定的大于1的正整数是不是质数的函数。质数是只能被1和自身整除的正整数（大于1），如果一个大于 1 的正整数 $\small{N}$ 是质数，那就意味着在 2 到 $\small{N-1}$ 之间都没有它的因子。


In [23]:

def is_prime(num):
    for i in range(2, num):
        if num % i == 0:
            return False
    return True

print(is_prime(4))

False


### 例子3：最大公约数和最小公倍数

设计计算两个正整数最大公约数和最小公倍数的函数。 $\small{x}$ 和 $\small{y}$ 的最大公约数是能够同时整除 $\small{x}$ 和 $\small{y}$ 的最大整数，如果 $\small{x}$ 和 $\small{y}$ 互质，那么它们的最大公约数为 1； $\small{x}$ 和 $\small{y}$ 的最小公倍数是能够同时被 $\small{x}$ 和 $\small{y}$ 整除的最小正整数，如果 $\small{x}$ 和 $\small{y}$ 互质，那么它们的最小公倍数为 $\small{x \times y}$ 。需要提醒大家注意的是，计算最大公约数和最小公倍数是两个不同的功能，应该设计成两个函数，而不是把两个功能放到同一个函数中。


In [25]:
def lcm(x: int, y: int) -> int:
    return x * y // gcd(x, y)   

def gcd(x: int, y: int) -> int:
    if x > y:
        x, y = y, x
    for factor in range(x, 0, -1):
        if x % factor == 0 and y % factor == 0:
            return factor
    return 1

print(lcm(12, 18))
print(gcd(12, 18))

36
6


### 例子4：数据统计

假设样本数据保存一个列表中，设计计算样本数据描述性统计信息的函数。描述性统计信息通常包括：算术平均值、中位数、极差（最大值和最小值的差）、方差、标准差、变异系数等，计算公式如下所示。

样本均值（sample mean）：

$$
\bar{x} = \frac{\sum_{i=1}^{n}x_{i}}{n} = \frac{x_{1}+x_{2}+\cdots +x_{n}}{n}
$$

样本方差（sample variance）：

$$
s^2 = \frac {\sum_{i=1}^{n}(x_i - \bar{x})^2} {n-1}
$$

样本标准差（sample standard deviation）：

$$
s = \sqrt{\frac{\sum_{i=1}^{n}(x_i - \bar{x})^2}{n-1}}
$$

变异系数（coefficient of sample variation）：

$$
CV = \frac{s}{\bar{x}}
$$

In [28]:
def mean(data: list[int]) -> float:
    return sum(data) / len(data)

def median(data: list[int]) -> float:
    data.sort()
    if len(data) % 2 == 0:
        return (data[len(data) // 2 - 1] + data[len(data) // 2]) / 2
    else:
        return data[len(data) // 2]

def ptp(data: list[int]) -> float:
    return max(data) - min(data)

def var(data: list[int]) -> float:
    mean_data = mean(data)
    return sum((x - mean_data) ** 2 for x in data) / (len(data) - 1)

def std(data: list[int]) -> float:
    return var(data) ** 0.5

def cv(data: list[int]) -> float:
    return std(data) / mean(data)


def describe(data):
    """输出描述性统计信息"""
    print(f'均值: {mean(data)}')
    print(f'中位数: {median(data)}')
    print(f'极差: {ptp(data)}')
    print(f'方差: {var(data)}')
    print(f'标准差: {std(data)}')
    print(f'变异系数: {cv(data)}')


describe([1, 2, 3, 4, 5])

均值: 3.0
中位数: 3
极差: 4
方差: 2.5
标准差: 1.5811388300841898
变异系数: 0.5270462766947299


## 函数使用进阶
### 高阶函数

我们回到之前讲过的一个例子，设计一个函数，传入任意多个参数，对其中`int`类型或`float`类型的元素实现求和操作。我们对之前的代码稍作调整，让整个代码更加紧凑一些，如下所示。


In [30]:
def add(*args):
    total = 0
    for val in args:
        if isinstance(val, int) or isinstance(val, float):
            total += val
    return total

print(add(1, 2, 3, 4, 5))
print(add(1, 2, 3, "4", 5.0))

15
11.0


In [32]:
def add(x, y):
    return x + y

def mul(x, y):
    return x * y


def calc(init_value, func, *args):
    result = init_value
    for val in args:
        if isinstance(val, int) or isinstance(val, float):
            result = func(result, val)
    return result

print(calc(1, add, 3, 4, 5))
print(calc(1, mul, 3, "4", 5.0))

13
15.0


### Lambda函数

In [33]:
old_nums = [35, 12, 8, 99, 60, 52]
new_nums = list(map(lambda x: x ** 2, filter(lambda x: x % 2 == 0, old_nums)))
print(new_nums)  # [144, 64, 3600, 2704]

[144, 64, 3600, 2704]


### 偏函数

偏函数是指固定函数的某些参数，生成一个新的函数，这样就无需在每次调用函数时都传递相同的参数。在 Python 语言中，我们可以使用`functools`模块的`partial`函数来创建偏函数。例如，`int`函数在默认情况下可以将字符串视为十进制整数进行类型转换，如果我们修改它的`base`参数，就可以定义出三个新函数，分别用于将二进制、八进制、十六进制字符串转换为整数，代码如下所示。


In [None]:
import functools

int2 = functools.partial(int, base=2)
int8 = functools.partial(int, base=8)
int16 = functools.partial(int, base=16)

print(int('1001'))    # 1001

print(int2('1001'))   # 9
print(int8('1001'))   # 513
print(int16('1001'))  # 4097

## 函数高级应用
### 装饰器

Python 语言中，装饰器是“**用一个函数装饰另外一个函数并为其提供额外的能力**”的语法现象。装饰器本身是一个函数，它的参数是被装饰的函数，它的返回值是一个带有装饰功能的函数。通过前面的描述，相信大家已经听出来了，装饰器是一个高阶函数，它的参数和返回值都是函数。但是，装饰器的概念对编程语言的初学者来说，还是让人头疼的，下面我们先通过一个简单的例子来说明装饰器的作用。假设有名为`downlaod`和`upload`的两个函数，分别用于文件的上传和下载，如下所示。


In [1]:
import random
import time


def download(filename):
    """下载文件"""
    print(f'开始下载{filename}.')
    time.sleep(random.random() * 6)
    print(f'{filename}下载完成.')

    
def upload(filename):
    """上传文件"""
    print(f'开始上传{filename}.')
    time.sleep(random.random() * 8)
    print(f'{filename}上传完成.')

    
download('MySQL从删库到跑路.avi')
upload('Python从入门到住院.pdf')

开始下载MySQL从删库到跑路.avi.
MySQL从删库到跑路.avi下载完成.
开始上传Python从入门到住院.pdf.
Python从入门到住院.pdf上传完成.


加装饰器

In [11]:
import time


def record_time(func):

    def wrapper(*args, **kwargs):
        # 在执行被装饰的函数之前记录开始时间
        start = time.time()
        # 执行被装饰的函数并获取返回值
        result = func(*args, **kwargs)
        # 在执行被装饰的函数之后记录结束时间
        end = time.time()
        # 计算和显示被装饰函数的执行时间
        print(f'{func.__name__}执行时间: {end - start:.2f}秒')
        # 返回被装饰函数的返回值
        return result
    
    return wrapper

download = record_time(download)
upload = record_time(upload)
download('MySQL从删库到跑路.avi')
upload('Python从入门到住院.pdf')

开始下载MySQL从删库到跑路.avi.
MySQL从删库到跑路.avi下载完成.
download执行时间: 1.01秒
wrapper11执行时间: 1.01秒
wrapper执行时间: 1.01秒
开始上传Python从入门到住院.pdf.
Python从入门到住院.pdf上传完成.
upload执行时间: 5.56秒
wrapper11执行时间: 5.56秒
wrapper执行时间: 5.56秒


可以用`@装饰器函数`将装饰器函数直接放在被装饰的函数上，效果跟上面的代码相同。我们把完整的代码为大家罗列出来，大家可以再看看我们是如何定义和使用装饰器的。


In [None]:
import random
import time


def record_time(func):

    def wrapper(*args, **kwargs):
        start = time.time()
        result = func(*args, **kwargs)
        end = time.time()
        print(f'{func.__name__}执行时间: {end - start:.2f}秒')
        return result

    return wrapper


@record_time
def download(filename):
    print(f'开始下载{filename}.')
    time.sleep(random.random() * 6)
    print(f'{filename}下载完成.')


@record_time
def upload(filename):
    print(f'开始上传{filename}.')
    time.sleep(random.random() * 8)
    print(f'{filename}上传完成.')


download('MySQL从删库到跑路.avi')
upload('Python从入门到住院.pdf')

开始下载MySQL从删库到跑路.avi.
MySQL从删库到跑路.avi下载完成.
download执行时间: 0.69秒
开始上传Python从入门到住院.pdf.
Python从入门到住院.pdf上传完成.
upload执行时间: 5.72秒


如果在代码的某些地方，我们想去掉装饰器的作用执行原函数，那么在定义装饰器函数的时候，需要做一点点额外的工作。Python 标准库functools模块的wraps函数也是一个装饰器，我们将它放在wrapper函数上，这个装饰器可以帮我们保留被装饰之前的函数，这样在需要取消装饰器时，可以通过被装饰函数的__wrapped__属性获得被装饰之前的函数。

In [12]:
import random
import time

from functools import wraps


def record_time(func):

    @wraps(func)
    def wrapper(*args, **kwargs):
        start = time.time()
        result = func(*args, **kwargs)
        end = time.time()
        print(f'{func.__name__}执行时间: {end - start:.2f}秒')
        return result

    return wrapper


@record_time
def download(filename):
    print(f'开始下载{filename}.')
    time.sleep(random.random() * 6)
    print(f'{filename}下载完成.')


@record_time
def upload(filename):
    print(f'开始上传{filename}.')
    time.sleep(random.random() * 8)
    print(f'{filename}上传完成.')


# 调用装饰后的函数会记录执行时间
download('MySQL从删库到跑路.avi')
upload('Python从入门到住院.pdf')
# 取消装饰器的作用不记录执行时间
download.__wrapped__('MySQL必知必会.pdf')
upload.__wrapped__('Python从新手到大师.pdf')

开始下载MySQL从删库到跑路.avi.
MySQL从删库到跑路.avi下载完成.
download执行时间: 3.51秒
开始上传Python从入门到住院.pdf.
Python从入门到住院.pdf上传完成.
upload执行时间: 6.63秒
开始下载MySQL必知必会.pdf.
MySQL必知必会.pdf下载完成.
开始上传Python从新手到大师.pdf.
Python从新手到大师.pdf上传完成.


### 递归调用

Python 中允许函数嵌套定义，也允许函数之间相互调用，而且一个函数还可以直接或间接的调用自身。函数自己调用自己称为递归调用，那么递归调用有什么用处呢？现实中，有很多问题的定义本身就是一个递归定义，例如我们之前讲到的阶乘，非负整数`N`的阶乘是`N`乘以`N-1`的阶乘，即 $\small{N! = N \times (N-1)!}$ ，定义的左边和右边都出现了阶乘的概念，所以这是一个递归定义。既然如此，我们可以使用递归调用的方式来写一个求阶乘的函数，代码如下所示。


In [15]:
def fac(num):
    if num in (0, 1):
        return 1
    return num * fac(num - 1)

print(fac(5))

120


## 面向对象

In [16]:
import time


# 定义时钟类
class Clock:
    """数字时钟"""

    def __init__(self, hour=0, minute=0, second=0):
        """初始化方法
        :param hour: 时
        :param minute: 分
        :param second: 秒
        """
        self.hour = hour
        self.min = minute
        self.sec = second

    def run(self):
        """走字"""
        self.sec += 1
        if self.sec == 60:
            self.sec = 0
            self.min += 1
            if self.min == 60:
                self.min = 0
                self.hour += 1
                if self.hour == 24:
                    self.hour = 0

    def show(self):
        """显示时间"""
        return f'{self.hour:0>2d}:{self.min:0>2d}:{self.sec:0>2d}'


# 创建时钟对象
clock = Clock(23, 59, 58)
while True:
    # 给时钟对象发消息读取时间
    print(clock.show())
    # 休眠1秒钟
    time.sleep(1)
    # 给时钟对象发消息使其走字
    clock.run()

23:59:58
23:59:59
00:00:00
00:00:01
00:00:02
00:00:03
00:00:04
00:00:05
00:00:06
00:00:07
00:00:08
00:00:09
00:00:10
00:00:11
00:00:12
00:00:13


KeyboardInterrupt: 

可以直接使用类名.方法名的方式来调用静态方法和类方法，二者的区别在于，类方法的第一个参数是类对象本身，而静态方法则没有这个参数。简单的总结一下，对象方法、类方法、静态方法都可以通过“类名.方法名”的方式来调用，区别在于方法的第一个参数到底是普通对象还是类对象，还是没有接受消息的对象。静态方法通常也可以直接写成一个独立的函数，因为它并没有跟特定的对象绑定。

这里做一个补充说明，我们可以给上面计算三角形周长和面积的方法添加一个property装饰器（Python 内置类型），这样三角形类的perimeter和area就变成了两个属性，不再通过调用方法的方式来访问，而是用对象访问属性的方式直接获得，修改后的代码如下所示。

In [None]:
class Triangle(object):
    """三角形"""

    def __init__(self, a, b, c):
        """初始化方法"""
        self.a = a
        self.b = b
        self.c = c

    @staticmethod
    def is_valid(a, b, c):
        """判断三条边长能否构成三角形(静态方法)"""
        return a + b > c and b + c > a and a + c > b

    @property
    def perimeter(self):
        """计算周长"""
        return self.a + self.b + self.c

    @property
    def area(self):
        """计算面积"""
        p = self.perimeter / 2
        return (p * (p - self.a) * (p - self.b) * (p - self.c)) ** 0.5


t = Triangle(3, 4, 5)
print(f'周长: {t.perimeter}')
print(f'面积: {t.area}')