## 常用数据结构之列表-1

1. 将一颗色子掷 6000 次，统计每种点数出现的次数。

In [11]:
import random

counts = [0] * 6
for i in range(6000):
    face = random.randint(1, 6)
    counts[face - 1] += 1
print(counts)

[1002, 1045, 1035, 991, 962, 965]


## 函数应用实战

### 例子1：随机验证码

设计一个生成随机验证码的函数，验证码由数字和英文大小写字母构成，长度可以通过参数设置。


In [19]:
import random
import string

ALL_CHARS = string.ascii_letters + string.digits

def generate_code(code_len=6):
    return "".join(random.choices(ALL_CHARS, k=code_len))


print(generate_code())

1zMuy6


### 例子2：判断素数

设计一个判断给定的大于1的正整数是不是质数的函数。质数是只能被1和自身整除的正整数（大于1），如果一个大于 1 的正整数 $\small{N}$ 是质数，那就意味着在 2 到 $\small{N-1}$ 之间都没有它的因子。


In [23]:

def is_prime(num):
    for i in range(2, num):
        if num % i == 0:
            return False
    return True

print(is_prime(4))

False


### 例子3：最大公约数和最小公倍数

设计计算两个正整数最大公约数和最小公倍数的函数。 $\small{x}$ 和 $\small{y}$ 的最大公约数是能够同时整除 $\small{x}$ 和 $\small{y}$ 的最大整数，如果 $\small{x}$ 和 $\small{y}$ 互质，那么它们的最大公约数为 1； $\small{x}$ 和 $\small{y}$ 的最小公倍数是能够同时被 $\small{x}$ 和 $\small{y}$ 整除的最小正整数，如果 $\small{x}$ 和 $\small{y}$ 互质，那么它们的最小公倍数为 $\small{x \times y}$ 。需要提醒大家注意的是，计算最大公约数和最小公倍数是两个不同的功能，应该设计成两个函数，而不是把两个功能放到同一个函数中。


In [25]:
def lcm(x: int, y: int) -> int:
    return x * y // gcd(x, y)   

def gcd(x: int, y: int) -> int:
    if x > y:
        x, y = y, x
    for factor in range(x, 0, -1):
        if x % factor == 0 and y % factor == 0:
            return factor
    return 1

print(lcm(12, 18))
print(gcd(12, 18))

36
6


### 例子4：数据统计

假设样本数据保存一个列表中，设计计算样本数据描述性统计信息的函数。描述性统计信息通常包括：算术平均值、中位数、极差（最大值和最小值的差）、方差、标准差、变异系数等，计算公式如下所示。

样本均值（sample mean）：

$$
\bar{x} = \frac{\sum_{i=1}^{n}x_{i}}{n} = \frac{x_{1}+x_{2}+\cdots +x_{n}}{n}
$$

样本方差（sample variance）：

$$
s^2 = \frac {\sum_{i=1}^{n}(x_i - \bar{x})^2} {n-1}
$$

样本标准差（sample standard deviation）：

$$
s = \sqrt{\frac{\sum_{i=1}^{n}(x_i - \bar{x})^2}{n-1}}
$$

变异系数（coefficient of sample variation）：

$$
CV = \frac{s}{\bar{x}}
$$

In [28]:
def mean(data: list[int]) -> float:
    return sum(data) / len(data)

def median(data: list[int]) -> float:
    data.sort()
    if len(data) % 2 == 0:
        return (data[len(data) // 2 - 1] + data[len(data) // 2]) / 2
    else:
        return data[len(data) // 2]

def ptp(data: list[int]) -> float:
    return max(data) - min(data)

def var(data: list[int]) -> float:
    mean_data = mean(data)
    return sum((x - mean_data) ** 2 for x in data) / (len(data) - 1)

def std(data: list[int]) -> float:
    return var(data) ** 0.5

def cv(data: list[int]) -> float:
    return std(data) / mean(data)


def describe(data):
    """输出描述性统计信息"""
    print(f'均值: {mean(data)}')
    print(f'中位数: {median(data)}')
    print(f'极差: {ptp(data)}')
    print(f'方差: {var(data)}')
    print(f'标准差: {std(data)}')
    print(f'变异系数: {cv(data)}')


describe([1, 2, 3, 4, 5])

均值: 3.0
中位数: 3
极差: 4
方差: 2.5
标准差: 1.5811388300841898
变异系数: 0.5270462766947299


## 函数使用进阶
### 高阶函数

我们回到之前讲过的一个例子，设计一个函数，传入任意多个参数，对其中`int`类型或`float`类型的元素实现求和操作。我们对之前的代码稍作调整，让整个代码更加紧凑一些，如下所示。


In [30]:
def add(*args):
    total = 0
    for val in args:
        if isinstance(val, int) or isinstance(val, float):
            total += val
    return total

print(add(1, 2, 3, 4, 5))
print(add(1, 2, 3, "4", 5.0))

15
11.0


In [32]:
def add(x, y):
    return x + y

def mul(x, y):
    return x * y


def calc(init_value, func, *args):
    result = init_value
    for val in args:
        if isinstance(val, int) or isinstance(val, float):
            result = func(result, val)
    return result

print(calc(1, add, 3, 4, 5))
print(calc(1, mul, 3, "4", 5.0))

13
15.0


### Lambda函数

In [33]:
old_nums = [35, 12, 8, 99, 60, 52]
new_nums = list(map(lambda x: x ** 2, filter(lambda x: x % 2 == 0, old_nums)))
print(new_nums)  # [144, 64, 3600, 2704]

[144, 64, 3600, 2704]


### 偏函数

偏函数是指固定函数的某些参数，生成一个新的函数，这样就无需在每次调用函数时都传递相同的参数。在 Python 语言中，我们可以使用`functools`模块的`partial`函数来创建偏函数。例如，`int`函数在默认情况下可以将字符串视为十进制整数进行类型转换，如果我们修改它的`base`参数，就可以定义出三个新函数，分别用于将二进制、八进制、十六进制字符串转换为整数，代码如下所示。


In [None]:
import functools

int2 = functools.partial(int, base=2)
int8 = functools.partial(int, base=8)
int16 = functools.partial(int, base=16)

print(int('1001'))    # 1001

print(int2('1001'))   # 9
print(int8('1001'))   # 513
print(int16('1001'))  # 4097