# 计算素数个数

我们做一个小实验：计算小于给定正整数 $N$ 的素数的个数。我们用一个函数 `is_prime` 来判断某个正整数 $n$ 是不是素数，是素数则返回 1，不是则返回 0。这只要遍历检查从 2 到 $\sqrt{n}$ 之间是否有整数能够整除 $n$ 即可。然后将小于 $n$ 的全部整数依次代入此函数并统计结果。

In [None]:
import time

N = 1000000

def is_prime(n: int):
    result = True
    for k in range(2, int(n**0.5) + 1):
        if n % k == 0:
            result = False
            break
    return result

def count_primes(n: int) -> int:
    count = 0
    for k in range(2, n):
        if is_prime(k):
            count += 1

    return count

start = time.perf_counter()
print(f"Number of primes: {count_primes(N)}")
print(f"time elapsed: {time.perf_counter() - start}/s")

然后我们引入 `taichi`，分别给 `is_prime` 函数和 `count_primts` 函数加上一个装饰器，再比较下耗时：

In [None]:
import taichi as ti
ti.init(arch=ti.cpu)

@ti.func
def is_prime(n: int):
    result = True
    for k in range(2, int(n**0.5) + 1):
        if n % k == 0:
            result = False
            break
    return result

@ti.kernel
def count_primes(n: int) -> int:
    count = 0
    for k in range(2, n):
        if is_prime(k):
            count += 1

    return count

start = time.perf_counter()
print(f"Number of primes: {count_primes(N)}")
print(f"time elapsed: {time.perf_counter() - start}/s")

$N$ 等于一百万时 Taichi 的加速效果也许看起来没有那么惊人，这是因为在 binder 的服务器上 CPU 的多线程并行是受到限制的。我们建议你把此 notebook 下载到本地，然后试试把 $N$ 改成一千万，看看加速效果如何？