### NumPy 数组对象

NumPy 中的 ndarray 是一个多维数组对象，该对象由两部分组成：

- 实际的数据；
- 描述这些数据的元数据；

大部分数据操作只修改元数据部分呢，而不改变底层的实际数据。 ndarray 中的数据类型都是同一数据类型。

In [51]:
import numpy as np

# 通过 arange 创建指定长度数组
arange = np.arange(6)
print(arange)

print('------------------')

# arange(起始值， 终止值， 递增值) 
print(np.arange(10, 30, 5))

print('------------------')

# 创建一个向量
vector = np.array([5, 10, 15, 20])
print(vector)

print('------------------')

# 创建一个矩阵
matrix = np.array([ [5, 10, 15], [20, 25, 30], [35, 40, 45] ])
print(matrix)

print('------------------')

# 单位矩阵，即主对角线上的元素均为 1，其余元素均为 0 的正方形矩阵
eye = np.eye(5)
print(eye)

print('------------------')

#  创建元素值为 0 的数组
zero_arr = np.zeros((3, 5))
print(zero_arr)

print('------------------')

#  创建元素值为 1 的数组，dtype 设置元素的类型 
one_arr = np.ones((3,5), dtype=str)
print(one_arr)





[0 1 2 3 4 5]
------------------
[10 15 20 25]
------------------
[ 5 10 15 20]
------------------
[[ 5 10 15]
 [20 25 30]
 [35 40 45]]
------------------
[[1. 0. 0. 0. 0.]
 [0. 1. 0. 0. 0.]
 [0. 0. 1. 0. 0.]
 [0. 0. 0. 1. 0.]
 [0. 0. 0. 0. 1.]]
------------------
[[0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0.]
 [0. 0. 0. 0. 0.]]
------------------
[['1' '1' '1' '1' '1']
 ['1' '1' '1' '1' '1']
 ['1' '1' '1' '1' '1']]


In [45]:
# 查看数组的维度，返回一个 Tuple 数据类型
print(vector.shape)
print(matrix.shape)

# 查看数组维度
print(vector.ndim)
print(matrix.ndim)

(4,)
(3, 3)
1
2


In [None]:
# 获取数组中的元素，下标是从 0 开始的
print(vector[0])
print(matrix[0, 1]) # 多维数组下指定 第二维度的下标，也是从 0 开始的

In [None]:
# 范围取值
print(vector[:3]) # 取 vector 数组的前 3 个元素
print(matrix[:,1]) # 取 matrix 多维数组中的 下标为 1 的元素
print(matrix[:,0:2]) # 取 matrix 多维数组中的 下标范围 0~2，不包含 2

In [None]:
# 数据类型
print(vector.dtype)
print(matrix.dtype)

In [None]:
# 元素判断，判断数组中的元素是否等于判断值，等于返回 True, 否则返回 False 的数组
print(vector == 10)
print(matrix == 10)

In [None]:
# 元素判断， & 和 |
print( (vector == 10) & (vector == 5) )
print( (matrix == 10) & (matrix == 5) )

print( (vector == 10) | (vector == 5) )
print( (matrix == 10) | (matrix == 5) )

In [39]:
# 类型转换
str_data = vector.astype(str)
print(str_data)
print(str_data.dtype)

['5' '10' '15' '20']
<U21


In [43]:
# 数组求和
print(vector.sum())

# 多维数组按行求和，axis 表示维度
print(matrix.sum(axis=1)) 

# 多维数组按列求和
print(matrix.sum(axis=0))

50
[ 30  75 120]
[60 75 90]


In [44]:
array = np.arange(15)
print(array)

# 将数组转换为 3行 5列的矩阵
print(array.reshape(3, 5))

[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14]
[[ 0  1  2  3  4]
 [ 5  6  7  8  9]
 [10 11 12 13 14]]


### NumPy 读写文件

In [None]:
import numpy as np

# 单位矩阵，即主对角线上的元素均为 1，其余元素均为 0 的正方形矩阵
t1 = np.eye(2)
print(t1)

# 使用 savetxt 函数将数据存储到文件中
np.savetxt('test.txt', t1)

# 加载文件 ( 文件名称, delimiter='分隔符', usecols= (分割的字符串的取值范围，(6,7) 即6-7段的值), unpack=是否将读取的数据进行分拆)
c,v = np.loadtxt('data.txt', delimiter=',', usecols=(6,7), unpack=True)
print(c, v)

# 使用 genfromtxt 读取文件 (文件名称，delimiter='分隔符', dtype=读取数据的类型， skip_header=指定跳过表头)
data = np.genfromtxt('data.txt', delimiter=',', dtype=str)
print(data)


# 计算平均价格 VWAP 为成交量加权平均价格，代表金融资产的 平均 价格，某个价格的成交量越高，该价格所占的权重就越大
vwap = np.average(c, weights = v)
print('vwap => ', vwap)

### NumPy 常用函数

In [54]:
# 随机矩阵
np.random.random((2, 3))

array([[0.67850622, 0.13200815, 0.09733125],
       [0.31508312, 0.48313031, 0.54604556]])

In [53]:
# 生成指定范围数值的数组，(起始值，终止值，数据长度)
np.linspace(0, 2 * np.pi, 100)

array([0.        , 0.06346652, 0.12693304, 0.19039955, 0.25386607,
       0.31733259, 0.38079911, 0.44426563, 0.50773215, 0.57119866,
       0.63466518, 0.6981317 , 0.76159822, 0.82506474, 0.88853126,
       0.95199777, 1.01546429, 1.07893081, 1.14239733, 1.20586385,
       1.26933037, 1.33279688, 1.3962634 , 1.45972992, 1.52319644,
       1.58666296, 1.65012947, 1.71359599, 1.77706251, 1.84052903,
       1.90399555, 1.96746207, 2.03092858, 2.0943951 , 2.15786162,
       2.22132814, 2.28479466, 2.34826118, 2.41172769, 2.47519421,
       2.53866073, 2.60212725, 2.66559377, 2.72906028, 2.7925268 ,
       2.85599332, 2.91945984, 2.98292636, 3.04639288, 3.10985939,
       3.17332591, 3.23679243, 3.30025895, 3.36372547, 3.42719199,
       3.4906585 , 3.55412502, 3.61759154, 3.68105806, 3.74452458,
       3.8079911 , 3.87145761, 3.93492413, 3.99839065, 4.06185717,
       4.12532369, 4.1887902 , 4.25225672, 4.31572324, 4.37918976,
       4.44265628, 4.5061228 , 4.56958931, 4.63305583, 4.69652

In [62]:
# 数值计算操作，两个数组对应位置的元素进行数值操作
one_arr = np.array([1, 2, 3, 4])
two_arr = np.array([10])

#  加法操作
print(one_arr + two_arr)

# 减法操作
print(one_arr - two_arr)

# 相乘操作
print(one_arr * two_arr)

# 除法操作
print(one_arr / two_arr)


[11 12 13 14]
[-9 -8 -7 -6]
[10 20 30 40]
[0.1 0.2 0.3 0.4]


In [8]:
data = np.arange(6)
print(data)
# 数组的裁剪和压缩

## clip 方法将数组中的比最小值还小的元素设为最小值，将比最大值还大的元素设置为最大值
print(f'clip -> { data.clip(1, 2)}')

## compress 返回条件筛选后的数组
print(f'compress -> { data.compress( data >= 2) }')

[0 1 2 3 4 5]
clip -> [1 1 2 2 2 2]
compress -> [2 3 4 5]


In [10]:
# 计算定义的数组的乘阶段
data = np.arange(1, 9)
print(data)
print(f'prod -> { data.prod() }')

# 计算数组元素的累积乘积
print(f'cumprod -> {data.cumprod()}')

[1 2 3 4 5 6 7 8]
prod -> 40320
cumprod -> [    1     2     6    24   120   720  5040 40320]
