**感悟：在这个项目中，突然有一种感受，就是Python的标准库真的很丰富，很多东西标准库里都有，拿来用就行。这很大程度上，便利了开发者。这种标准库的丰富程度，是我以往所没有遇到的。** 

2024-02-19 17:31

## 1. Cats 项目包简介

https://cs61a.org/proj/cats/

`cats.py`里面是Typing的主要逻辑

看了一下`cats`项目，还是有一些些复杂，考虑之后，为了实现类似`cats`项目的效果，使用了`cats`项目的`sample_paragraphs.txt`文件，然后直接在命令行实现，打字测试程序。

单文件运行代码见：`typingimp.py`

In [1]:
import random
import string
from datetime import datetime


def pick_paragraph_from_file(file_path):
    """
    从文件中随机选择一个段落。

    参数:
      file_path: 文件路径

    返回:
      一个随机选择的段落字符串
    """
    with open('sample_paragraphs.txt', 'r') as file:
        paragraphs = file.readlines()
    return random.choice(paragraphs)


def generate_random_paragraph():
    """
    生成一个随机段落。

    返回:
      一个随机生成的段落字符串
    """
    paragraph = ' '.join(''.join(random.choices(string.ascii_letters + string.punctuation, k=random.randint(5, 15)))
                         for _ in range(random.randint(3, 5)))
    return paragraph


def calculate_accuracy(typed, source):
    """
    计算打字准确率。

    参数:
      typed: 输入的文本
      source: 原始文本

    返回:
      准确率百分比
    """
    typed_words = typed.split() #按照空格分割
    source_words = source.split()
    correct_words = sum(1 for tw, sw in zip(typed_words, source_words) if tw.lower() == sw.lower())
    return round(correct_words / len(source_words) * 100, 2)


def calculate_wpm(typed, elapsed_time):
    """
    计算打字速度 (每分钟字数)。

    参数:
      typed: 输入的文本
      elapsed_time: 花费的时间 (秒)

    返回:
      每分钟字数
    """
    return round(len(typed.split()) / elapsed_time * 60, 2)


def run_test(topic):
    """
    运行打字测试。

    参数:
      topic: 主题单词
    """
    try:
        paragraph = pick_paragraph_from_file("paragraphs.txt")
    except FileNotFoundError:
        print("段落文件未找到。")
        return

    print(f"\n主题: {topic.upper()}")
    print(paragraph)
    start_time = datetime.now()
    typed_text = input("\n请键入以上段落并按回车键: ")
    end_time = datetime.now()
    elapsed_time = (end_time - start_time).total_seconds()
    accuracy = calculate_accuracy(typed_text, paragraph)
    wpm = calculate_wpm(typed_text, elapsed_time)
    print(f"\n准确率: {accuracy:.2f}%")
    print(f"每分钟字数: {wpm:.2f}")


if __name__ == "__main__":
    topic = input("请输入一个主题单词: ")
    run_test(topic)



主题: CAT
Coming into the market in the early 1880s, the index typewriter uses a pointer or stylus to choose a letter from an index.


准确率: 100.00%
每分钟字数: 27.08


## 2. 代码解释



In [None]:
# Part1：使用 with 语句打开文件
# 使用 with 语句打开文件
with open('example.txt', 'r') as file:
    # 在 with 代码块中，可以通过 file 来访问文件对象
    contents = file.read()
    print(contents)

# 文件已经在 with 代码块结束后自动关闭，无需显式调用 file.close()


In [None]:
paragraph = ' '.join(''.join(random.choices(string.ascii_letters + string.punctuation, k=random.randint(5, 15)))
                         for _ in range(random.randint(3, 5)))


上述代码片段的注解如下，使用了很多平时我不使用的库和函数，所以可能看起来比较奇怪。

random.randint(3, 5): 这个表达式调用 random 模块中的 randint() 函数，它返回一个指定范围内的随机整数，包括 3 和 5。  random.randint(5, 15)

random.choices(string.ascii_letters + string.punctuation, k=random.randint(5, 15)): 这个表达式调用 random 模块中的 choices() 函数，它从给定的序列中随机选择 k 个元素。 random.choice(paragraphs)



In [4]:
#random.choice(sequence) 非空序列

import random

# 从列表中随机选择一个元素
colors = ['red', 'green', 'blue', 'yellow']
print(random.choice(colors))

# 从元组中随机选择一个元素
fruits = ('apple', 'banana', 'orange', 'grape')
print(random.choice(fruits))

# 从字符串中随机选择一个字符
word = 'Python'
print(random.choice(word))



blue
apple
t


string.ascii_letters 和 string.punctuation 是 Python 标准库中 string 模块提供的两个常量，它们分别表示了字母和标点符号的序列。

在这里，string.ascii_letters + string.punctuation 是一个包含所有字母和标点符号的序列，k 的值是在 5 和 15 之间随机选择的整数。因此，这个表达式返回一个由随机字母和标点符号组成的长度在 5 到 15 之间的字符串列表。

string.ascii_letters 的值是 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ'

string.punctuation 的值是 '!"#$%&\'()*+,-./:;<=>?@[\\]^_{|}~'`

`+`其实是“连接”在一起，得到的是一个字符串序列。

**注释：**
这样的序列通常用于生成随机字符串或者在某些文本处理任务中使用，比如在密码生成、文本处理、数据清洗等方面都有一定的应用场景。

`k`值规定了“长度”，在整个字符串中，随机选取`k`个字符，而后形成新的随机字符串（`S`，这是我命名的方便后文阐述）。

`'.join(''.join())` 在整个表达式处理完成后，形成的这个（`S`），随后交给`join`处理，具体如何处理：

有关`join()`方法详见：https://docs.python.org/3/library/stdtypes.html#str.join

通常用于将字符串列表中的元素拼接成一个单独的字符串

`separator.join(iterable)` separator 是连接字符串，iterable 是一个可迭代对象，比如列表、元组



In [5]:
words = ["Hello", "world", "Python", "is", "awesome"]

# 使用空格连接列表中的元素
sentence = ' '.join(words)

print(sentence)  # 输出: Hello world Python is awesome


Hello world Python is awesome


In [None]:
# 定义一个包含多个列表的列表
matrix = [
    ['1', '2', '3'],
    ['4', '5', '6'],
    ['7', '8', '9']
]

# 将每个子列表中的元素连接成一个字符串，然后将这些字符串用换行符连接起来
result = '\n'.join(' '.join(row) for row in matrix)

print(result)



上述代码片段给出了 `join()`的嵌套使用方法，回忆本节提到的打字检测程序，其采用了嵌套的`join()`来生成随机单词。

再看
`typed_words = typed.split()` 中的`.split()`方法，这也是一个字符串操作的方法，按要求进行分割

In [6]:
# 使用空格分割字符串
text = "Hello world Python"
words = text.split()
print(words)  # 输出: ['Hello', 'world', 'Python']

# 使用逗号分割字符串
csv_data = "apple,banana,orange"
items = csv_data.split(',')
print(items)  # 输出: ['apple', 'banana', 'orange']

# 指定最多分割两次
text = "apple,banana,orange,grape"
items = text.split(',', 2)
print(items)  # 输出: ['apple', 'banana', 'orange,grape']


['Hello', 'world', 'Python']
['apple', 'banana', 'orange']
['apple', 'banana', 'orange,grape']


In [None]:
def calculate_accuracy(typed, source):
    """
    计算打字准确率。

    参数:
      typed: 输入的文本
      source: 原始文本

    返回:
      准确率百分比
    """
    typed_words = typed.split()
    source_words = source.split()
    correct_words = sum(1 for tw, sw in zip(typed_words, source_words) if tw.lower() == sw.lower())
    return round(correct_words / len(source_words) * 100, 2)


`zip(typed_words, source_words)` 代码解释： 将`typed_words`和`source_words`这两个列表打包成一个元组的列表。


`zip()`函数为内置函数，简单说就是可以合并迭代器。**注意：如果传递给 zip() 函数的可迭代对象的长度不一致，zip() 函数会以最短的可迭代对象的长度为准进行迭代。这意味着，如果其中一个可迭代对象比其他对象短，则 zip() 函数的迭代将在较短的对象结束后停止。**

In [7]:
# 定义两个列表
names = ['Alice', 'Bob', 'Charlie']
scores = [85, 90, 88]

# 使用 zip() 函数将两个列表合并
combined_data = zip(names, scores)

# 遍历合并后的结果
for item in combined_data:
    print(item)


('Alice', 85)
('Bob', 90)
('Charlie', 88)


In [None]:
# try:
#         paragraph = pick_paragraph_from_file("paragraphs.txt")
#     except FileNotFoundError:
#         print("段落文件未找到。")
#         return

上述这段使用了 `try/except` 语句来处理可能发生的 `FileNotFoundError` 异常。在 `try` 块中，尝试从文件中读取段落，如果文件不存在，则打印错误信息并返回。

