In [1]:
import numpy as np
import matplotlib.pyplot as plt
import sys

## I. numpy array的六类基本操作

### 第1类操作：创建
1. 有3种常用的创建方式：\
   (1) 直接用sequence \
   (2) 指定shape和初始值 \
   (3) 用arange或者linspace设置起始值和分割数量
2. 创建时可以直接指定数据类型 \
   <font color=orange>如果不指定，整数默认是int64，浮点数默认是float64</font>

#### 创建例子
1. 直接用sequence创建
 - <font color=orange>array transforms sequences of sequences into two-dimensional arrays, sequences of sequences of sequences into three-dimensional arrays, and so on.</font>

In [2]:
a = np.array([1, 2, 3, 4])
# a = np.array(1, 2, 3, 4)    # WRONG 要用sequence

In [3]:
b = np.array([(1.5, 2, 3), (4, 5, 6)])
b

array([[1.5, 2. , 3. ],
       [4. , 5. , 6. ]])

In [4]:
c = np.array([[1, 2], [3, 4]], dtype=np.float32)
c.dtype, b.dtype, a.dtype

(dtype('float32'), dtype('float64'), dtype('int64'))

2. 指定shape来初始化矩阵 \
   (1) np.zeros, np.ones, np.empty \
   (2) np.zeros_like, np.ones_like, np.empty_like \
   (3) 默认数据类型是float64，可以直接指定类型

In [5]:
x, y = np.zeros((2, 3), dtype=np.int16), np.empty((2, 3))
x, y

(array([[0, 0, 0],
        [0, 0, 0]], dtype=int16),
 array([[1.5, 2. , 3. ],
        [4. , 5. , 6. ]]))

In [6]:
z = np.ones_like(y, dtype=np.int16)
z

array([[1, 1, 1],
       [1, 1, 1]], dtype=int16)

3. 设置起始值和分割数量 \
   (1) arange(start, stop, step)，生成的数据范围是[start, stop) \
   (2) linspace(start, stop, number_of_point)，生成的数据范围是[start, stop]
    - <font color=orange>arange能提前知道前后两个point之间的step size，不知道生成的point数量。linspace直接指定生成的point数量</font>

In [7]:
p, q = np.arange(0, 20, 5), np.arange(20, 0, -5) # reverse的时候，step size要设为负数
p, q

(array([ 0,  5, 10, 15]), array([20, 15, 10,  5]))

In [8]:
s, t = np.linspace(0, 2, 9), np.linspace(0, 2, 8, dtype=np.float16)
s, t

(array([0.  , 0.25, 0.5 , 0.75, 1.  , 1.25, 1.5 , 1.75, 2.  ]),
 array([0.    , 0.2856, 0.5713, 0.857 , 1.143 , 1.429 , 1.714 , 2.    ],
       dtype=float16))

In [9]:
# linspace常用于函数自变量取值范围分割
x = np.linspace(0, 2*np.pi, 100)
f = np.sin(s)

4. 打印numpy array

In [10]:
# 当array太大的时候，默认的print会省略一部分内容。如果想打印全部，可以用np.set_printoptions()
np.set_printoptions(threshold=sys.maxsize)
print(np.arange(50).reshape(10, 5))

[[ 0  1  2  3  4]
 [ 5  6  7  8  9]
 [10 11 12 13 14]
 [15 16 17 18 19]
 [20 21 22 23 24]
 [25 26 27 28 29]
 [30 31 32 33 34]
 [35 36 37 38 39]
 [40 41 42 43 44]
 [45 46 47 48 49]]


In [11]:
# 通常还是设置为只打印部分
np.set_printoptions(threshold=10)
print(np.arange(50).reshape(10, 5))

[[ 0  1  2  3  4]
 [ 5  6  7  8  9]
 [10 11 12 13 14]
 ...
 [35 36 37 38 39]
 [40 41 42 43 44]
 [45 46 47 48 49]]


### 第2类操作：属性
1. 属性不是函数，是实例的变量
2. 主要的属性有：\
   (1) A.ndim，A.dtype，A.shape \
   (2) A.size是number of elements, A.itemsize是byte size of one elements \
   (3) A.data是数据存储地址

In [12]:
a = np.array([[1., 0., 0.],[0., 1., 2.]])
print(a.ndim, a.shape, a.size)
print(a.dtype, a.itemsize)
print(a.data)

2 (2, 3) 6
float64 8
<memory at 0x76d1d2513850>
