## 1.dtype元素类型

# 数组
- **ndarray.ndim	秩，即轴的数量或维度的数量**
- **ndarray.shape	数组的维度，对于矩阵，n 行 m 列**
- **ndarray.size	数组元素的总个数，相当于 .shape 中 n*m 的值**
- **ndarray.dtype	ndarray 对象的元素类型**
- ndarray.itemsize	ndarray 对象中每个元素的大小，以字节为单位
- ndarray.flags	ndarray 对象的内存信息
- ndarray.real	ndarray元素的实部
- ndarray.imag	ndarray 元素的虚部
- ndarray.data	包含实际数组元素的缓冲区，由于一般通过数组的索引获取元素，所以通常不需要使用这个属性。

In [5]:
import numpy as np
a = np.array([1,3,5,7],dtype=np.int64) # 不定义dtype，默认为int32
b = np.array([1,3,5,7],dtype=float)
c = np.array([1,3,5,7],dtype=complex)
d = np.array([1,3,5,7],dtype=bool)
data = [a,b,c,d]

for i in data:
    print(i,i.dtype)

[1 3 5 7] int64
[1. 3. 5. 7.] float64
[1.+0.j 3.+0.j 5.+0.j 7.+0.j] complex128
[ True  True  True  True] bool


In [9]:
import numpy as np
arr1 = np.array(["abc","python","java"],dtype=np.string_)
arr2 = np.array(["abc","python","java"],dtype=np.unicode_)
print(arr1,arr1.dtype)
print(arr2,arr2.dtype)

[b'abc' b'python' b'java'] |S6
['abc' 'python' 'java'] <U6


![image.png](attachment:d53035ec-6ca7-4969-b760-41164478c3c3.png)
- 小段字节序和大端字节序
- <U6 的 < 意思即小端字节序

## 2.ndim、shape

In [29]:
import numpy as np 
a = np.arange(24)  
print (a)             # a 现只有一个维度
print ("a.shape:", a.shape, "    a.ndim:", a.ndim, end="\n\n")
# 现在调整其大小
b = a.reshape(2,4,3)  # b 现在拥有三个维度
print (b)
print ("b.ndim:",b.ndim)

[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23]
a.shape: (24,)     a.ndim: 1

[[[ 0  1  2]
  [ 3  4  5]
  [ 6  7  8]
  [ 9 10 11]]

 [[12 13 14]
  [15 16 17]
  [18 19 20]
  [21 22 23]]]
b.ndim: 3


## 3.简介生成数组的函数

### (1)arrange
**numpy.arange(start=0, stop, step=1, dtype=None)，返回均匀间隔值的数组**
- start —— 开始位置，数字，可选项，默认起始值为0
- stop —— 停止位置，数字，**必填**
- step —— 步长，数字，可选项， 默认步长为1，**如果指定了step，则还必须给出start**。
- dtype —— 输出数组的类型。 如果未给出dtype，则从其他输入参数推断数据类型。

In [31]:
from numpy import *  # 引入numpy

A = arange(5)  # 只有结束项
print(A)  # 结果 [0 1 2 3 4] 结果不包含结束项
print(type(A))  # 结果 <class 'numpy.ndarray'>

A = arange(1, 5)  # 起点为1，步长默认为1
print(A)  # 结果 [1 2 3 4]

A = arange(1, 5, 2)  # 步长默认为2
print(A)  # 结果 [1 3]

A = arange(1, 5.2, 0.6)  # 浮点数参数，结果就不一定完全符合了
print(A)  # 结果 [1.  1.6 2.2 2.8 3.4 4.  4.6 5.2]

[0 1 2 3 4]
<class 'numpy.ndarray'>
[1 2 3 4]
[1 3]
[1.  1.6 2.2 2.8 3.4 4.  4.6 5.2]


### (2)linspace
**np.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)**

- start —— 序列的起始值
- stop —— 序列的终止值，如果endpoint为true，该值包含于数列中
- num —— 要生成的等步长的样本数量，默认为50
- endpoint —— 该值为 true 时，数列中包含stop值，反之不包含，默认是True。
- retstep —— 如果为 True 时，生成的数组中会显示间距，反之不显示。
- dtype —— ndarray 的数据类型

In [40]:
import numpy as np
a1 = np.linspace(0,10,10)
a2 = np.linspace(1,10,10)
a3 = np.linspace(0,10,11)
arrs = [a1,a2,a3]
for i in arrs:
    print(i)

[ 0.          1.11111111  2.22222222  3.33333333  4.44444444  5.55555556
  6.66666667  7.77777778  8.88888889 10.        ]
[ 1.  2.  3.  4.  5.  6.  7.  8.  9. 10.]
[ 0.  1.  2.  3.  4.  5.  6.  7.  8.  9. 10.]


### (3)logspace
**np.logspace(start, stop, num=50, endpoint=True, base=10.0, dtype=None)**

- start —— 序列的起始值为：base ** start
- stop —— 序列的终止值为：base ** stop。如果endpoint为true，该值包含于数列中
- num —— 要生成的等步长的样本数量，默认为50
- endpoint —— 该值为 true 时，数列中中包含stop值，反之不包含，默认是True。
- base —— 对数 log 的底数，默认为10。
- dtype —— ndarray 的数据类型

In [46]:
import numpy as np
# 默认底数是 10
a = np.logspace(1.0,  2.0, num =  10)  
b = np.logspace(0,9,10,base=2)
print (a)
print(b)

[ 10.          12.91549665  16.68100537  21.5443469   27.82559402
  35.93813664  46.41588834  59.94842503  77.42636827 100.        ]
[  1.   2.   4.   8.  16.  32.  64. 128. 256. 512.]


### (4)empty
**numpy.empty(shape, dtype = float, order = 'C')**
- order	有"C"和"F"两个选项,分别代表，行优先和列优先，在计算机内存中的存储元素的顺序。
- 默认类型 ***float***

In [17]:
import numpy as np 
x = np.empty([3,2], dtype = int) 
print (x)

[[497815088       465]
 [        0         0]
 [   131074         0]]


### (5)zeros
**numpy.zeros(shape, dtype = float, order = 'C')**
- 默认类型 ***float***

In [19]:
import numpy as np
 
# 默认为浮点数
x = np.zeros(5) 
print(x)
 
# 设置类型为整数
y = np.zeros((5,), dtype = int) 
print(y)
 
# 自定义类型
z = np.zeros((2,2), dtype = [('x', 'i4'), ('y', 'i4')])  
print(z)

[0. 0. 0. 0. 0.]
[0 0 0 0 0]
[[(0, 0) (0, 0)]
 [(0, 0) (0, 0)]]


### (6)ones
**numpy.ones(shape, dtype = None, order = 'C')**

In [20]:
import numpy as np
 
# 默认为浮点数
x = np.ones(5) 
print(x)
 
# 自定义类型
x = np.ones([2,2], dtype = int)
print(x)

[1. 1. 1. 1. 1.]
[[1 1]
 [1 1]]


### (7)random函数

- np.random.rand() --> 生成指定维度的的[0,1)范围之间的随机数，输入参数为shape

In [28]:
import numpy as np
np.random.rand(2,3)

array([[0.77257085, 0.75606545, 0.82692918],
       [0.93346041, 0.5447893 , 0.56386316]])

- np.random.randn() --> 生成指定维度的服从标准正态分布的随机数，输入参数为shape

In [31]:
import numpy as np
np.random.randn(2,4)

array([[ 2.19447258,  2.02723069,  2.13742263,  0.78895199],
       [-0.49143836, -0.00466576,  0.46530065,  0.04217123]])

- np.random.randint(low, high = None, size = None(shape),dtype = 'l')--> 返回[low,high)之间的随机数或者随机数组成的array

In [36]:
import numpy as np
np.random.randint(10,size=(2,3))

array([[4, 1, 5],
       [9, 4, 7]])

- np.random.seed() -->使随即数据可预测，对于同一个seed，生成的随机数相同

In [38]:
import numpy as np
np.random.seed(0) # 0号种子
print(1,np.random.rand(1))

np.random.seed(1) # 1号种子
print(2,np.random.rand(1))

np.random.seed(1)
print(3,np.random.rand(1))

1 [0.5488135]
2 [0.417022]
3 [0.417022]


### (8)三角函数

In [3]:
import numpy as np
a = np.array([0,np.pi/6,np.pi/4,np.pi/3,np.pi/2])
print ('不同角度的正弦值：')
# 通过乘 pi/180 转化为弧度  
print (np.sin(a))
print ('数组中角度的余弦值：')
print (np.cos(a))
print ('数组中角度的正切值：')
print (np.tan(a))

不同角度的正弦值：
[0.         0.5        0.70710678 0.8660254  1.        ]
数组中角度的余弦值：
[1.00000000e+00 8.66025404e-01 7.07106781e-01 5.00000000e-01
 6.12323400e-17]
数组中角度的正切值：
[0.00000000e+00 5.77350269e-01 1.00000000e+00 1.73205081e+00
 1.63312394e+16]


## 4.切片与索引

### (1)切片

In [47]:
import numpy as np
 
a = np.arange(10)
s = slice(2,7,2)   # 从索引 2 开始到索引 7 停止，间隔为2
print (a[s])

[2 4 6]


In [21]:
import numpy as np
 
a = np.arange(10)  
b = a[2:7:2]   # 从索引 2 开始到索引 7 停止(包含2，但不包含7)，间隔为 2
c = a[::-1]
print(a)
print(b)
print(c)

[0 1 2 3 4 5 6 7 8 9]
[2 4 6]
[9 8 7 6 5 4 3 2 1 0]


In [23]:
import numpy as np
a = np.arange(24).reshape(6,4)
print(a,end="\n\n")
print(a[:2]) # 前3行
print(a[:,2],end="\n\n") # 第3列，即每一行的第3个数据
print(a[1,:],end="\n\n") # 第2行，即第2行的所有数据
print(a[3:5,1:3]) # 索引3行到5行（不含5）的1列到3列（不含3）

[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]
 [12 13 14 15]
 [16 17 18 19]
 [20 21 22 23]]

[[0 1 2 3]
 [4 5 6 7]]
[ 2  6 10 14 18 22]

[4 5 6 7]

[[13 14]
 [17 18]]


### (2)高级索引

#### 整数数组索引
以下实例获取数组中(0,0)，(1,1)和(2,0)位置处的元素。

In [53]:
import numpy as np 
 
x = np.array([[1,  2],  [3,  4],  [5,  6]]) 
y = x[[0,1,2],  [0,1,0]]  
print (y)

[1 4 5]


以下实例获取了 4X3 数组中的四个角的元素。 行索引是 [0,0] 和 [3,3]，而列索引是 [0,2] 和 [0,2]。

In [54]:
import numpy as np 
 
x = np.array([[  0,  1,  2],[  3,  4,  5],[  6,  7,  8],[  9,  10,  11]])  
print ('我们的数组是：' )
print (x)
print ('\n')
rows = np.array([[0,0],[3,3]]) 
cols = np.array([[0,2],[0,2]]) 
y = x[rows,cols]  
print  ('这个数组的四个角元素是：')
print (y)

我们的数组是：
[[ 0  1  2]
 [ 3  4  5]
 [ 6  7  8]
 [ 9 10 11]]


这个数组的四个角元素是：
[[ 0  2]
 [ 9 11]]


#### 布尔索引

In [56]:
import numpy as np 
 
x = np.array([[  0,  1,  2],[  3,  4,  5],[  6,  7,  8],[  9,  10,  11]])  
print ('我们的数组是：')
print (x)
print ('\n')
# 现在我们会打印出大于 5 的元素  
print  ('大于 5 的元素是：')
print (x[x >  5])

我们的数组是：
[[ 0  1  2]
 [ 3  4  5]
 [ 6  7  8]
 [ 9 10 11]]


大于 5 的元素是：
[ 6  7  8  9 10 11]


In [57]:
import numpy as np 
 
a = np.array([np.nan,  1,2,np.nan,3,4,5])  
print (a[~np.isnan(a)])

[1. 2. 3. 4. 5.]


#### 花式索引
- 花式索引指的是利用整数数组进行索引。
- 花式索引根据索引数组的值作为目标数组的某个轴的下标来取值。对于使用一维整型数组作为索引，如果目标是一维数组，那么索引的结果就是对应下标的行，如果目标是二维数组，那么就是对应位置的元素。
- 花式索引跟切片不一样，它总是将数据复制到新数组中。

In [60]:
# 传入顺序索引数组
import numpy as np 
x=np.arange(32).reshape((8,4))
print (x[[4,2,1,7]]) # 第5，3，2，8行

[[16 17 18 19]
 [ 8  9 10 11]
 [ 4  5  6  7]
 [28 29 30 31]]


In [61]:
# 传入倒序索引数组
import numpy as np 
x=np.arange(32).reshape((8,4))
print (x[[-4,-2,-1,-7]])

[[16 17 18 19]
 [24 25 26 27]
 [28 29 30 31]
 [ 4  5  6  7]]


In [62]:
# 传入多个索引数组（要使用np.ix_）
import numpy as np 
x=np.arange(32).reshape((8,4))
print (x[np.ix_([1,5,7,2],[0,3,1,2])])

[[ 4  7  5  6]
 [20 23 21 22]
 [28 31 29 30]
 [ 8 11  9 10]]


## 5.numpy广播
**广播(Broadcast)是 numpy 对不同形状(shape)的数组进行数值计算的方式**
- 让所有输入数组都向其中形状最长的数组看齐，形状中不足的部分都通过在前面加 1 补齐。
- 输出数组的形状是输入数组形状的各个维度上的最大值。
- 如果输入数组的某个维度和输出数组的对应维度的长度相同或者其长度为 1 时，这个数组能够用来计算，否则出错。
- 当输入数组的某个维度的长度为 1 时，沿着此维度运算时都用此维度上的第一组值。

### (1)a.shape == b.shape

In [4]:
import numpy as np 
a = np.array([1,2,3,4]) 
b = np.array([10,20,30,40]) 
c = a * b 
print (c)

[ 10  40  90 160]


### (2)a.shape != b.shape

In [5]:
import numpy as np 
a = np.array([[ 0, 0, 0],
           [10,10,10],
           [20,20,20],
           [30,30,30]])
b = np.array([1,2,3])
print(a + b)

[[ 1  2  3]
 [11 12 13]
 [21 22 23]
 [31 32 33]]


![image.png](attachment:5817c006-31df-4651-bdb6-9b614a6d8a09.png)

In [6]:
import numpy as np 
a = np.array([[ 0, 0, 0],
           [10,10,10],
           [20,20,20],
           [30,30,30]])
b = np.array([1,2,3])
bb = np.tile(b, (4, 1))  # 重复 b 的各个维度
print(a + bb)

[[ 1  2  3]
 [11 12 13]
 [21 22 23]
 [31 32 33]]


## 6.迭代数组
- NumPy 迭代器对象 numpy.nditer 提供了一种灵活访问一个或者多个数组元素的方式。
- 迭代器最基本的任务的可以完成对数组元素的访问。

In [25]:
import numpy as np
a = np.arange(6).reshape(2,3)
print ('原始数组是：')
print (a)
print ('\n')
print ('迭代输出元素：')
for x in np.nditer(a):
    print (x, end=", " )
print ('\n')

原始数组是：
[[0 1 2]
 [3 4 5]]


迭代输出元素：
0, 1, 2, 3, 4, 5, 



In [30]:
import numpy as np
a = np.arange(6).reshape(2,3)
print(a)
print(a.T)
for x in np.nditer(a.T): # a的转置,默认以原数组的行序访问
    print (x, end=", " )
print ('\n')
 
for x in np.nditer(a.T.copy(order='C')): # 转置的行序优先
    print (x, end=", " )
print ('\n')

[[0 1 2]
 [3 4 5]]
[[0 3]
 [1 4]
 [2 5]]
0, 1, 2, 3, 4, 5, 

0, 3, 1, 4, 2, 5, 



In [32]:
# 修改
import numpy as np
a = np.arange(0,60,5) 
a = a.reshape(3,4)  
print ('原始数组是：')
print (a)
print ('\n')
for x in np.nditer(a, op_flags=['readwrite']): 
    x[...]=2*x # x只是指针，x[...]代表修改的是原元素
print ('修改后的数组是：')
print (a)

原始数组是：
[[ 0  5 10 15]
 [20 25 30 35]
 [40 45 50 55]]


修改后的数组是：
[[  0  10  20  30]
 [ 40  50  60  70]
 [ 80  90 100 110]]


## 7.数组运算

- 同一维： 各项分别加减乘除
- 一个一维，一个多维：广播
- 两个多维，无法直接计算

In [5]:
import numpy as np
 
a = np.array([4,2,3])
b = np.array([2,5,7])
 
c = a+b
d = a-b
e = a*b
f = a/b
 
print("加%s" % c)
print("减%s" % d)
print("乘%s" % e)
print("除%s" % f)

加[ 6  7 10]
减[ 2 -3 -4]
乘[ 8 10 21]
除[2.         0.4        0.42857143]


In [6]:
import numpy as np
 
a = np.array([4,2,3])
b = np.array([[2,5,7],[1,2,3]])
 
c = a+b
d = a-b
e = a*b
f = a/b
 
print("加%s" % c)
print("减%s" % d)
print("乘%s" % e)
print("除%s" % f)

加[[ 6  7 10]
 [ 5  4  6]]
减[[ 2 -3 -4]
 [ 3  0  0]]
乘[[ 8 10 21]
 [ 4  4  9]]
除[[2.         0.4        0.42857143]
 [4.         1.         1.        ]]


In [10]:
import numpy as np
# 此方法只能一维，多维报错
a = np.array([4,2,3])

c = a+2
d = a-2
e = a*2
f = a/2
 
print("加%s" % c)
print("减%s" % d)
print("乘%s" % e)
print("除%s" % f)

加[6 4 5]
减[2 0 1]
乘[8 4 6]
除[2.  1.  1.5]
