**by @wp-lai, updated by @bambooom**

In [1]:
import numpy as np

# 1. 计算素数
使用循环和向量化两种不同的方法来计算100以内质数之和

**算法思路**: 10以内的质数有2、3、5、7四个，要找出100以内的其他质数，只需在10到100里筛掉能被2、3、5、7其中一个整除的，留下的就是剩下要找的质数。如果想求质数之和，可以将非质数赋值为0，再对数值求和。

参考:
+ [埃拉托斯特尼筛法](https://en.wikipedia.org/wiki/Sieve_of_Eratosthenes)
+ [Fastest way to list all primes below N - StackOverflow](http://stackoverflow.com/questions/2068372/fastest-way-to-list-all-primes-below-n)

## 循环方法

In [2]:
numbers = range(10, 101)

# 将能被2,3,5,7之一整除的赋值为0
for i in range(len(numbers)):
    for prime in [2, 3, 5, 7]:
        if numbers[i] % prime == 0:
            numbers[i] = 0
# 计算总和
sum_of_prime_in_100 = sum([2, 3, 5, 7] + numbers)

In [3]:
print "100以内质数之和为", sum_of_prime_in_100

100以内质数之和为 1060


## 向量化

In [4]:
numbers = np.arange(10,100)
prime_in_10 = np.array([2, 3, 5, 7])

# 将能被2,3,5,7之一整除的赋值为0
mask = np.any(numbers[:, np.newaxis] % prime_in_10 == 0, axis=1)
numbers[mask] = 0

# 计算总和
sum_of_prime_in_100 = np.sum(np.hstack((prime_in_10, numbers)))

In [5]:
print "100以内质数之和为", sum_of_prime_in_100

100以内质数之和为 1060


## 效率比较

In [6]:
%%timeit
numbers = range(10, 101)

# 将能被2,3,5,7之一整除的赋值为0
for i in range(len(numbers)):
    for prime in [2, 3, 5, 7]:
        if numbers[i] % prime == 0:
            numbers[i] = 0
# 计算总和
sum_of_prime_in_100 = sum([2, 3, 5, 7] + numbers)

10000 loops, best of 3: 85.1 µs per loop


In [7]:
%%timeit
numbers = np.arange(10,100)
prime_in_10 = np.array([2, 3, 5, 7])

# 将能被2,3,5,7之一整除的赋值为0
mask = np.any(numbers[:, np.newaxis] % prime_in_10 == 0, axis=1)
numbers[mask] = 0

# 计算总和
sum_of_prime_in_100 = np.sum(np.hstack((prime_in_10, numbers)))

10000 loops, best of 3: 66 µs per loop


从上面的比较结果可知，同样的算法思想，向量化的方法比循环的方法更快。

# 2. 随机漫步
模拟一个醉汉在二维空间上的随机漫步。

首先可以建立一个坐标系，以醉汉最初的位置为原点 (0, 0)， 以醉汉从后向前的方向为X轴，从左往右的方向为Y轴。

设置想要模拟的步数，可设为50

In [8]:
NSTEPS = 50

为了结果可重复，设置seed

In [9]:
np.random.seed(0)

假设醉汉漫步的方向 $ \theta $ 服从0到 $ 2\pi $ 的均匀分布，即 $ \theta \sim U[0, 2\pi]$

In [10]:
theta = np.random.uniform(0, 2 * np.pi, size=NSTEPS)

假设醉汉漫步的步长r服从0到1的均匀分布，即$ r \sim U[0, 1] $

In [11]:
r = np.random.uniform(0, 1, size=NSTEPS)

再计算出每步在X轴和Y轴上的位移, 即[极坐标](https://en.wikipedia.org/wiki/Polar_coordinate_system)
$$ x = r\cos(\theta) $$
$$ y = r\sin(\theta) $$

In [12]:
x = np.cos(theta) * r
y = np.sin(theta) * r
delta = np.array([x, y]).T # 合并为一个2维数组

In [13]:
for i in range(NSTEPS):
    print "第{}步的位移为".format(i+1),
    print delta[i]

第1步的位移为 [-0.54358784 -0.17215288]
第2步的位移为 [-0.0951686  -0.42815211]
第3步的位移为 [-0.78940427 -0.59474679]
第4步的位移为 [-0.09801386 -0.02839766]
第5步的位移为 [-0.18530241  0.09639769]
第6步的位移为 [-0.09815013 -0.12801294]
第7步的位移为 [-0.60353028  0.24960306]
第8步的位移为 [ 0.196951   -0.15927002]
第9步的位移为 [ 0.45420976 -0.10554255]
第10步的位移为 [-0.18175475  0.16342913]
第11步的位移为 [ 0.04120067 -0.15353773]
第12步的位移为 [-0.10856108 -0.01992894]
第13步的位移为 [-0.59725331 -0.27213419]
第14步的位移为 [ 0.12335622 -0.06227175]
第15步的位移为 [ 0.1773244   0.08485683]
第16步的位移为 [ 0.31483777  0.19192558]
第17步的位移为 [ 0.81437749  0.10401535]
第18步的位移为 [ 0.04817317 -0.08430898]
第19步的位移为 [ 0.14747216 -0.82486583]
第20步的位移为 [ 0.06578923 -0.0700477 ]
第21步的位移为 [ 0.96766087 -0.13078811]
第22步的位移为 [ 0.14246273 -0.4464732 ]
第23步的位移为 [-0.94829132  0.23410638]
第24步的位移为 [ 0.11531156 -0.59375192]
第25步的位移为 [ 0.54435494  0.50018831]
第26步的位移为 [-0.02499422 -0.03018231]
第27步的位移为 [ 0.17563713  0.22165599]
第28步的位移为 [ 0.11300569 -0.0409503 ]
第29步的位移为 [-0.2933542  -0.0405

最后计算每步后醉汉的位置

In [14]:
loc = delta.cumsum(axis=0)

In [15]:
for i in range(NSTEPS):
    print "醉汉在第{}步之后的位置为".format(i+1),
    print loc[i]

醉汉在第1步之后的位置为 [-0.54358784 -0.17215288]
醉汉在第2步之后的位置为 [-0.63875644 -0.60030499]
醉汉在第3步之后的位置为 [-1.42816071 -1.19505178]
醉汉在第4步之后的位置为 [-1.52617456 -1.22344944]
醉汉在第5步之后的位置为 [-1.71147698 -1.12705175]
醉汉在第6步之后的位置为 [-1.80962711 -1.25506469]
醉汉在第7步之后的位置为 [-2.41315739 -1.00546163]
醉汉在第8步之后的位置为 [-2.21620639 -1.16473165]
醉汉在第9步之后的位置为 [-1.76199663 -1.2702742 ]
醉汉在第10步之后的位置为 [-1.94375137 -1.10684506]
醉汉在第11步之后的位置为 [-1.9025507  -1.26038279]
醉汉在第12步之后的位置为 [-2.01111179 -1.28031173]
醉汉在第13步之后的位置为 [-2.6083651  -1.55244592]
醉汉在第14步之后的位置为 [-2.48500887 -1.61471767]
醉汉在第15步之后的位置为 [-2.30768447 -1.52986084]
醉汉在第16步之后的位置为 [-1.9928467  -1.33793526]
醉汉在第17步之后的位置为 [-1.17846921 -1.23391991]
醉汉在第18步之后的位置为 [-1.13029604 -1.31822889]
醉汉在第19步之后的位置为 [-0.98282389 -2.14309472]
醉汉在第20步之后的位置为 [-0.91703465 -2.21314242]
醉汉在第21步之后的位置为 [ 0.05062622 -2.34393053]
醉汉在第22步之后的位置为 [ 0.19308895 -2.79040373]
醉汉在第23步之后的位置为 [-0.75520237 -2.55629736]
醉汉在第24步之后的位置为 [-0.63989082 -3.15004928]
醉汉在第25步之后的位置为 [-0.09553588 -2.64986098]
醉汉在第26步之后

### PS
此处的设定中, 二维随机漫步在每一步的可能范围为一个圆, 但也可简单化为, 每一步的可能步长为固定值, 方向仅四个方向, 即 (1,0),(0,1),(-1,0),(0,-1). 随机漫步定义并非唯一, 在合理情况下设定即可.

# 3. 梯形法
使用梯形法计算一个二次函数的数值积分

可以先写一个用梯形法求函数`f`在区间`[a, b]`上定积分的函数 `trapzf(f, a, b, npts=100)`

要用到的公式为：$\int_{a}^{b}f(x)dx\approx\frac{1}{2}\sum_{i=1}^{n}\left(x_{i}-x_{i-1}\right)\left(f(x_{i})+f(x_{i-1})\right).$

In [16]:
def trapzf(f, a, b, npts=100):
    x = np.linspace(a, b, npts)
    y = f(x)
    integral = 0.5 * np.dot(x[1:] - x[:-1], y[1:] + y[:-1])
    return integral

接下来试试用这个函数求 $ \int_{0}^{10} x^2dx （= 333.333） $

In [17]:
def f(x):
    return x ** 2

trapzf(f, 0, 10)

333.35033840084344