### Numpy的ndarray: 一种多维数组对象
### 创建ndarray

In [1]:
import numpy as np
data1 = [6, 7.5, 8, 0, 1]
# 将列表转换成一个一维数组
arr1 = np.array(data1)
arr1

array([ 6. ,  7.5,  8. ,  0. ,  1. ])

In [2]:
data2 = [[1, 2, 3, 4], [5, 6, 7, 8]]
# 转换成二维数组
arr2 = np.array(data2)
arr2

array([[1, 2, 3, 4],
       [5, 6, 7, 8]])

In [3]:
# 显示维度
arr2.ndim

2

In [4]:
# 数组的维度和长度
arr2.shape

(2, 4)

In [5]:
# 如果没有指定数组的类型，会在创建的时候推断一个最合适的数据类型
arr1.dtype

dtype('float64')

In [6]:
# 创建元素都为0的数组
np.zeros(10)

array([ 0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.])

In [7]:
np.zeros((3, 6))

array([[ 0.,  0.,  0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.,  0.,  0.]])

In [8]:
# 创建没有任何值的数组，因为Python小数点精确的问题，大部分情况下返回的值不是0，而是一些未初始化的垃圾值
np.empty((2, 3, 2))

array([[[ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]],

       [[ 0.,  0.],
        [ 0.,  0.],
        [ 0.,  0.]]])

In [9]:
# 内置函数range的数组版
np.arange(15)

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14])

### 数组创建函数
<table align = left>
  <tr>
    <th>函数</th>
    <th>说明</th>
  </tr>
  <tr>
    <td> array </td>
    <td> 将输入数据（列表、元祖、数组、或其他序列类型）转换成ndarray。要么推断出dtype，要么显式指定dtype。默认直接复制输入数据 </td>
  </tr>
  <tr>
    <td> asarray </td>
    <td> 将输入转换成ndarray，如果输入本身就是ndarray就不进行复制 </td>
  </tr>
  <tr>
    <td> arange </td>
    <td> 类似于内置函数range，但是返回的是ndarray </td>
  </tr>
  <tr>
    <td> ones、ones_like </td>
    <td> 根据指定的形状和dtype创建全1的数组。ones_like以另一个数组为参数，并根据其形状和dtype创建全1数组 </td>
  </tr>
  <tr>
    <td> zeros、zeros_like </td>
    <td> 类似于ones、ones_like，不过创建的是全0数组 </td>
  </tr>
  <tr>
    <td> empty、empty_like </td>
    <td> 创建新数组，只分配内存空间但不填充任何值 </td>
  </tr>
  <tr>
    <td> eye、identity </td>
    <td> 创建一个正方N\*N的单位矩阵（对角线为1，其余为0） </td>
  </tr>
</table>

### ndarray的数据类型

<table align = left>
  <tr>
    <th>类型</th>
    <th>类型代码</th>
    <th>说明</th>
  </tr>
  <tr>
    <td> int8、uint8 </td>
    <td> i1、u1 </td>
    <td> 有符号和无符号的8位（1个字节）整形 </td>
  </tr>
  <tr>
    <td> int16、uint16 </td>
    <td> i2、u2 </td>
    <td> 有符号和无符号的16位（2个字节）整形 </td>
  </tr>
  <tr>
    <td> int32、uint32 </td>
    <td> i4、u4 </td>
    <td> 有符号和无符号的32位（4个字节）整形 </td>
  </tr>
  <tr>
    <td> int64、uint64 </td>
    <td> i8、u8 </td>
    <td> 有符号和无符号的64位（8个字节）整形 </td>
  </tr>
  <tr>
    <td> fooat16 </td>
    <td> f2 </td>
    <td> 半精度浮点数 </td>
  </tr>
  <tr>
    <td> fooat32 </td>
    <td> f4或f </td>
    <td> 标准的单精度浮点数。与C的float兼容 </td>
  </tr>
  <tr>
    <td> fooat64 </td>
    <td> f8或d </td>
    <td> 标准的双精度浮点数。与C的double和Python的float对象兼容 </td>
  </tr>
  <tr>
    <td> fooat128 </td>
    <td> f16或g </td>
    <td> 扩展精度浮点数 </td>
  </tr>
  <tr>
    <td> complex(64、128、256) </td>
    <td> c8、c16、c32 </td>
    <td> 分别用两个32、64、128位的浮点数表示的复数 </td>
  </tr>
  <tr>
    <td> bool </td>
    <td> ? </td>
    <td> 布尔类型 </td>
  </tr>
  <tr>
    <td> object </td>
    <td> O </td>
    <td> Python对象类型 </td>
  </tr>
  <tr>
    <td> string_ </td>
    <td> S </td>
    <td> 固定长度的字符串类型（每个字符1个字节） S10表示长度为10的字符串 </td>
  </tr>
  <tr>
    <td> unicode_ </td>
    <td> U </td>
    <td> 固定长度的unicode类型 </td>
  </tr>
</table>

In [10]:
# 默认推断出来为int64
arr = np.array([1, 2, 3, 4, 5])
arr.dtype

dtype('int32')

In [11]:
# 显式类型转换为float64
float_arr = arr.astype(np.float64)
# astype无论如何都会创建一个新的数组（原始数据的一份拷贝），即使新的dtype和老的相同
float_arr.dtype

dtype('float64')

In [12]:
# 也可以直接用上面类型代码来进行类型转换
float32_arr = arr.astype('f')
float32_arr.dtype

dtype('float32')

### 基本的索引和切片

In [13]:
arr = np.arange(10)
arr

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [14]:
arr[5:8] = 12
arr

array([ 0,  1,  2,  3,  4, 12, 12, 12,  8,  9])

In [15]:
# 和Python的列表有很大的不同，数组切片是原始数组的视图（内存地址），视图上的任何修改都会反映到源数组上
# numpy是用来处理大数据的，假如要数据复制来复制去，会引起巨大的性能和内存问题。
arr_slice = arr[5:8]
arr_slice[1] = 1212
arr

array([   0,    1,    2,    3,    4,   12, 1212,   12,    8,    9])

In [16]:
# 加入你想得到切片的一份副本而非视图，必须要显示的进行复制操作
arr_copy = arr[5:8].copy()
# 这样就不会改变源数组了
arr_copy[1] = 12312
arr

array([   0,    1,    2,    3,    4,   12, 1212,   12,    8,    9])

In [17]:
# 2维数组
arr2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
arr2d[2]

array([7, 8, 9])

In [18]:
# 2种不同的方式取出二维数组中的一个值
arr2d[0][2]
arr2d[0, 2]

3

In [19]:
# 可以使用reshape对数组进行维度转换
arr3d = np.arange(12).reshape(2, 2, 3)
arr3d

array([[[ 0,  1,  2],
        [ 3,  4,  5]],

       [[ 6,  7,  8],
        [ 9, 10, 11]]])

In [20]:
# 多维数组中，如果省略后面的索引，则返回一个低一维的数组
arr3d[0]

array([[0, 1, 2],
       [3, 4, 5]])

In [21]:
# 对一个维度上的赋值操作，将会扩散到整个选取
arr3d[0] = 12
arr3d

array([[[12, 12, 12],
        [12, 12, 12]],

       [[ 6,  7,  8],
        [ 9, 10, 11]]])

In [22]:
# ndarray的切片比Python的更丰富，可以传入多个切片
arr2d[:2, 1:]

array([[2, 3],
       [5, 6]])

### 布尔型索引

In [23]:
names = np.array(['Bob', 'Joe', 'Will', 'Bob', 'Will', 'Joe', 'Joe'])
# 生成随机2维数组
data = np.random.randn(7, 4)
data

array([[ 0.31724488, -1.16760072, -0.27753614, -0.02654263],
       [-0.84655678, -1.61475276,  0.85690362,  0.12296164],
       [-0.60194157,  2.18419708,  0.41563287, -2.17938786],
       [-0.72194855, -0.65042387,  0.57844054, -0.98787535],
       [ 0.23285741, -0.65384909, -0.30415637, -1.17370953],
       [-0.24655064,  1.89507864,  0.97512836, -0.20035588],
       [-2.31094121, -0.9523352 , -0.61972191,  0.33174027]])

In [24]:
# 可以直接进行运算，生成一个布尔型的数组
names == 'Bob'

array([ True, False, False,  True, False, False, False], dtype=bool)

In [25]:
# 可以直接用作数组的索引，布尔型的长度必须和轴长度一致
data[names=='Bob']

array([[ 0.31724488, -1.16760072, -0.27753614, -0.02654263],
       [-0.72194855, -0.65042387,  0.57844054, -0.98787535]])

In [26]:
# 还可以和切片混合使用
data[names=='Bob', 2:]

array([[-0.27753614, -0.02654263],
       [ 0.57844054, -0.98787535]])

In [27]:
# 还可以进行不等于判断，下面2种方式一样
data[names!='Bob']
data[~(names=='Bob')]

array([[-0.84655678, -1.61475276,  0.85690362,  0.12296164],
       [-0.60194157,  2.18419708,  0.41563287, -2.17938786],
       [ 0.23285741, -0.65384909, -0.30415637, -1.17370953],
       [-0.24655064,  1.89507864,  0.97512836, -0.20035588],
       [-2.31094121, -0.9523352 , -0.61972191,  0.33174027]])

In [28]:
# 还可以用&、|之类的组合多个布尔条件
data[(names=='Bob') | (names=='Will')]

array([[ 0.31724488, -1.16760072, -0.27753614, -0.02654263],
       [-0.60194157,  2.18419708,  0.41563287, -2.17938786],
       [-0.72194855, -0.65042387,  0.57844054, -0.98787535],
       [ 0.23285741, -0.65384909, -0.30415637, -1.17370953]])

### 花式索引
花式索引和切片不同，它总是将数据复制到新的数组中

In [29]:
arr = np.empty((8, 4))
for i in range(8):
    arr[i] = i
# 按照特定顺序选取子集，传入负数就是从末尾开始选取行
arr[[4, 3, 0, 6]]

array([[ 4.,  4.,  4.,  4.],
       [ 3.,  3.,  3.,  3.],
       [ 0.,  0.,  0.,  0.],
       [ 6.,  6.,  6.,  6.]])

In [30]:
arr = np.arange(32).reshape((8, 4))
# 将会选出(1,0),(5,3),(7,1),(2,2)的数据，可能和我们想要的结果不一样，我们是想要选取列做自定义排序
arr[[1, 5, 7, 2], [0, 3, 1, 2]]

array([ 4, 23, 29, 10])

In [31]:
# 下面这2种方式就是选取行和选取列做自定义排序
arr[[1, 5, 7, 2]][:, [0, 3, 1, 2]]
# 使用ix_，它可以将两个一维数组转换成一个用于选取方形区域的索引器
arr[np.ix_([1, 5, 7, 2], [0, 3, 1, 2])]

array([[ 4,  7,  5,  6],
       [20, 23, 21, 22],
       [28, 31, 29, 30],
       [ 8, 11,  9, 10]])

### 数组转置和轴对换

In [32]:
arr = np.random.randn(6, 3)
# 可以利用dot来计算矩阵内积 X.TX
np.dot(arr.T, arr)

array([[  3.22120252,  -1.13005546,   2.23518247],
       [ -1.13005546,   9.52517759,   0.74412552],
       [  2.23518247,   0.74412552,  10.35138794]])

In [33]:
# transpose需要得到一个由轴编号组成的元祖才能对轴进行转置
arr = np.arange(16).reshape(2, 2, 4)
arr.transpose((1, 0, 2))

array([[[ 0,  1,  2,  3],
        [ 8,  9, 10, 11]],

       [[ 4,  5,  6,  7],
        [12, 13, 14, 15]]])

#### transpose理解
arr.transpose((1,0,2))的1,0,2三个数分别代表shape()的三个数的顺序，初始的shape是（2,2,4），也就是2维的2 x 4矩阵，索引分别是shape的[0],[1],[2]，arr.transpose((1,0,2))之后，我们的索引就变成了shape[1],[0],[2],对应shape值是shape(2,2,4)，所以矩阵形状不变。  
与此同时，我们矩阵的索引也发生了类似变化，如arr中的4，索引是arr[0,1,0],arr中的5是arr[0,1,1]，转换后，4的位置应该是在[1,0,0]，5的位置变成[1,0,1]，同理8的索引从[1,0,0]变成[0,1,0]。

In [34]:
# swapaxes交换两个轴方向上的数据。当交换0，1的时候就和上面的结果一样了
arr.swapaxes(1, 0)

array([[[ 0,  1,  2,  3],
        [ 8,  9, 10, 11]],

       [[ 4,  5,  6,  7],
        [12, 13, 14, 15]]])

### 通用函数：快速的元素级数组函数
#### 一元ufunc
<table align = left>
  <tr>
    <th>函数</th>
    <th>说明</th>
  </tr>
  <tr>
    <td> abs、fabs </td>
    <td> 计算整数、浮点数或复数的绝对值。对于非复数值，可以使用更快的fabs </td>
  </tr>
  <tr>
    <td> sqrt </td>
    <td> 计算各元素的平方根。相当于arr \*\* 0.5 </td>
  </tr>
  <tr>
    <td> square </td>
    <td> 计算各元素的平方。相当于arr \*\* 2 </td>
  </tr>
  <tr>
    <td> ext </td>
    <td> 计算各元素的指数 </td>
  </tr>
  <tr>
    <td> log、log10、log2、log1p </td>
    <td> 分别为自然对数（底数e）、底数为10的log、底数为2的log、log(1+x) </td>
  </tr>
  <tr>
    <td> sign </td>
    <td> 计算各元素的正负号： 1（正）、0（零）、-1（负） </td>
  </tr>
  <tr>
    <td> ceil </td>
    <td> 计算各元素的ceiling值，即大于等于该值的最小整数 </td>
  </tr>
  <tr>
    <td> floor </td>
    <td> 计算各元素的floor值，即小于等于该值的最大整数 </td>
  </tr>
  <tr>
    <td> rint </td>
    <td> 将各元素四舍五入到最接近的整数，保留dtype </td>
  </tr>
  <tr>
    <td> modf </td>
    <td> 将数组的小数和整数部分以两个独立数组的形式返回 </td>
  </tr>
  <tr>
    <td> isnan </td>
    <td> 返回一个表示哪些是NaN的布尔型数组 </td>
  </tr>
  <tr>
    <td> isfinite,isinf </td>
    <td> 返回一个表示哪些是有穷的（非inf、非NaN）或哪些是无穷的布尔型数组 </td>
  </tr>
  <tr>
    <td> cos、cosh、sin、sinh、tan、tanh </td>
    <td> 普通型和双曲型三角函数 </td>
  </tr>
  <tr>
    <td> arccos、
    arccosh、
    arcsin、arcsinh、arctan、arctanh </td>
    <td> 反三角函数 </td>
  </tr>
  <tr>
    <td> logical_not </td>
    <td> 计算各元素not x的真值。相当于~arr </td>
  </tr>
</table>


#### 二元ufunc

<table align = left>
  <tr>
    <th>函数</th>
    <th>说明</th>
  </tr>
  <tr>
    <td> add </td>
    <td> 数组相加 </td>
  </tr>
  <tr>
    <td> subtract </td>
    <td> 数组一减去数组二 </td>
  </tr>
  <tr>
    <td> multiply </td>
    <td> 数组相乘 </td>
  </tr>
  <tr>
    <td> divide、floor_divide </td>
    <td> 除法或者向下圆整除法（丢弃余数） </td>
  </tr>
  <tr>
    <td> power </td>
    <td> 数组A,B中对应元素的幂 </td>
  </tr>
  <tr>
    <td> maximum,fmax </td>
    <td> 元素级的最大值计算。fmax忽略NaN </td>
  </tr>
  <tr>
    <td> minimum,fmin </td>
    <td> 元素级的最小值计算。fmin忽略NaN </td>
  </tr>
  <tr>
    <td> mod </td>
    <td> 元素级求模（除法的余数） </td>
  </tr>
  <tr>
    <td> copysign </td>
    <td> 将第二个数组中的值的符号复制给第一个数组中的值 </td>
  </tr>
  <tr>
    <td> greater、greater_equal、less、less_equal、equal、not_equal </td>
    <td> 执行元素级的比较运算相当于 >, >=, <, <=, ==, != </td>
  </tr>
  <tr>
    <td> logical_and、logiacl_or、logical_xor </td>
    <td> 相当于 &、|、^ </td>
  </tr>
</table>


### 讲条件逻辑表述为数组运算

In [35]:
xarr = np.array([1.1, 1.2, 1.3, 1.4, 1.5])
yarr = np.array([2.1, 2.2, 2.3, 2.4, 2.5])
cond = np.array([True, False, True, True, False])
# 根据cond中的值选取xarr和yarr的值，当cond中的值为True时，选取xarr，否则选取yarr
# 使用列表推导式写法
result = [(x if c else y) for x, y, c in zip(xarr, yarr, cond)]
result

[1.1000000000000001, 2.2000000000000002, 1.3, 1.3999999999999999, 2.5]

In [36]:
# 使用纯python速度慢，无法用于多维数组，下面使用np.where的方法
result = np.where(cond, xarr, yarr)
result

array([ 1.1,  2.2,  1.3,  1.4,  2.5])

In [37]:
arr = np.random.randn(4, 4)
# 讲大于0的设成2，小于0的为-2
np.where(arr>0, 2, -2)

array([[ 2,  2,  2, -2],
       [ 2, -2,  2,  2],
       [ 2, -2, -2,  2],
       [ 2,  2, -2,  2]])

### 数学和统计方法
<table align = left>
  <tr>
    <th>函数</th>
    <th>说明</th>
  </tr>
  <tr>
    <td> sum </td>
    <td> 对数组中全部或某轴向的元素求和 </td>
  </tr>
  <tr>
    <td> mean </td>
    <td> 算术平均数 </td>
  </tr>
  <tr>
    <td> std、var </td>
    <td> 标准差和方差，自由度可调（默认为n） </td>
  </tr>
  <tr>
    <td> min、max </td>
    <td> 最大值和最小值 </td>
  </tr>
  <tr>
    <td> argmin、argmax </td>
    <td> 最大元素和最小元素的索引 </td>
  </tr>
  <tr>
    <td> cumsum </td>
    <td> 所有元素的累计和 </td>
  </tr>
  <tr>
    <td> sumprod </td>
    <td> 所有元素的累计积 </td>
  </tr>
</table>

### 布尔数组方法

In [38]:
arr = np.random.randn(100)
# 正数的数量
(arr>0).sum()

42

In [39]:
# any和all方法
bools = np.array([False, False, True, False])
# any判断数组中的是否存在True
bools.any()

True

In [40]:
# all判断数组中是否都是True
bools.all()

False

### 唯一化以及其他的集合逻辑

<table align = left>
  <tr align="left">
    <th>函数</th>
    <th>详细解释</th>
  </tr>
  <tr>
    <td> unique(x)  </td>
    <td> 以长列表方式显示（显示出文件/文件夹详细信息）  </td>
  </tr>
  <tr>
    <td> intersect1d(x, y) </td>
    <td> 计算x和y中的公共元素，并返回有序结果 </td>
  <tr>
    <td> union1d(x, y) </td>
    <td> 计算x和y的并集，并返回有序结果 </td>
  </tr>
  <tr>
    <td> in1d(x, y) </td>
    <td> 得到一个表示x的元素是否在y中的布尔型数组 </td>
  </tr>
  <tr>
    <td> setdiff1d(x, y) </td>
    <td> 集合的差，即元素在x中不在y中 </td>
  </tr>
  <tr>
    <td> setxor1d(x, y) </td>
    <td> 集合的对称差，即存在于一个数组中但不同时存在于2个数组中的元素 </td>
  </tr>
</table>


### 数组的文件输入输出

In [41]:
arr = np.arange(10)
# 讲数组存放在本地文件中，会自动加上后缀npy
np.save('some_array', arr)

In [42]:
# 读取文件信息
np.load('some_array.npy')

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [43]:
# 将多个数组存在一个压缩文件中，后缀为npz
np.savez('array_archive.npz', a=arr, b=arr)
# 读取压缩文件
arch = np.load('array_archive.npz')
arch['a']

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [44]:
# 加载txt或csv文件 savetxt可以将数组写到以某种分隔符分隔的文本文件中
arr = np.loadtxt('ch04/array_ex.txt', delimiter=',')
arr

array([[ 0.580052,  0.18673 ,  1.040717,  1.134411],
       [ 0.194163, -0.636917, -0.938659,  0.124094],
       [-0.12641 ,  0.268607, -0.695724,  0.047428],
       [-1.484413,  0.004176, -0.744203,  0.005487],
       [ 2.302869,  0.200131,  1.670238, -1.88109 ],
       [-0.19323 ,  1.047233,  0.482803,  0.960334]])

### 线性代数
####  常用numpy.linalg函数 

<table align = left>
  <tr>
    <th>函数</th>
    <th>说明</th>
  </tr>
  <tr>
    <td> diag </td>
    <td> 以一维数组的形式返回对角线元素，或将一维数组转换成方阵（非对角线元素为0） </td>
  </tr>
  <tr>
    <td> dot </td>
    <td> 矩阵内积 </td>
  </tr>
  <tr>
    <td> trace </td>
    <td> 计算矩阵对角线元素的和 </td>
  </tr>
  <tr>
    <td> det </td>
    <td> 计算矩阵行列式 </td>
  </tr>
  <tr>
    <td> eig </td>
    <td> 计算矩阵的特征值和特征向量 </td>
  </tr>
  <tr>
    <td> inv </td>
    <td> 计算矩阵的逆 </td>
  </tr>
  <tr>
    <td> pinv </td>
    <td> 计算矩阵的Moore-Penrose伪逆 </td>
  </tr>
  <tr>
    <td> qr </td>
    <td> 计算QR分解 </td>
  </tr>
  <tr>
    <td> svd </td>
    <td> 计算奇异值分解（svd） </td>
  </tr>
  <tr>
    <td> solve </td>
    <td> 解线性方程组Ax = b，A必须为方阵 </td>
  </tr>
  <tr>
    <td> lstsq </td>
    <td> 计算Ax = b的最小二乘解 </td>
  </tr>
</table>

### 随机数生成
#### numpy.random函数  
<table align = left>
  <tr align="left">
    <th>函数</th>
    <th>说明</th>
  </tr>
  <tr>
    <td> seed </td>
    <td> 确定随机数生成器的种子 </td>
  </tr>
  <tr>
    <td> pernutation </td>
    <td> 返回一个序列的随机排列或返回一个随机排列的范围 </td>
  </tr>
  <tr>
    <td> shuffle </td>
    <td> 对一个序列就地随机排序 </td>
  </tr>
  <tr>
    <td> rand </td>
    <td> 产生均匀分布的样本值 </td>
  </tr>
  <tr>
    <td> randint </td>
    <td> 从给定的上下限范围内随机选取整数 </td>
  </tr>
  <tr>
    <td> randn </td>
    <td> 产生正态分布（平均值为0，标准差为1）的样本值 </td>
  </tr>
  <tr>
    <td> binomial </td>
    <td> 产生二项分布的样本值 </td>
  </tr>
  <tr>
    <td> normal </td>
    <td> 产生正态分布的样本值 </td>
  </tr>
  <tr>
    <td> beta </td>
    <td> 产生beta分布的样本值 </td>
  </tr>
  <tr>
    <td> chisquare </td>
    <td> 产生卡方分布的样本值 </td>
  </tr>
  <tr>
    <td> gamma </td>
    <td> 产生Gamma分布的样本值 </td>
  </tr>
  <tr>
    <td> uniform </td>
    <td> 产生在[0，1]中均匀分布的样本值 </td>
  </tr>

</table>


### 范例：随机漫步

In [45]:
# 用python实现的随机漫步，就是随机+1/-1
import random
import matplotlib.pyplot as plt
position = 0
walk = [position]
steps = 1000
for i in range(steps):
    step = 1 if random.randint(0, 1) else -1
    position += step
    walk.append(position)
# 画图展示
plt.plot(range(100), walk[:100])

[<matplotlib.lines.Line2D at 0x24d81386278>]

In [46]:
# 使用numpy来生成
nsteps = 1000
draws = np.random.randint(0, 2, size=nsteps)
steps = np.where(draws>0, 1, -1)
walk = steps.cumsum()
plt.plot(range(100), walk[:100])

[<matplotlib.lines.Line2D at 0x24dfff22278>]

In [47]:
# 可以查看最小值、最大值
walk.min()
walk.max()

47

In [48]:
# 计算首次穿越时间，也就是第一次到达某个特定值的时间
# argmax返回布尔型数组的第一个最大值索引（True就是最大值）
(np.abs(walk) >= 10).argmax()

69

### 一次模拟多个随机漫步

In [49]:
nsteps = 1000
nwalks = 5000
draws = np.random.randint(0, 2, size=(nwalks, nsteps))
steps = np.where(draws>0, 1, -1)
walks = steps.cumsum(1)
# 计算最小值最大值
walks.min()
walks.max()

114

In [50]:
# 查看5000个过程中最大值/最小值达到过30
hits30 = (np.abs(walks) >= 30).any(1)
# 达到过30的总数
hits30.sum()

3345

In [51]:
# 统计每一个达到30所使用的步数
crossing_times = (np.abs(walks[hits30]) >= 30).argmax(1)
# 得到平均值
crossing_times.mean()

504.81823617339313