In [1]:
# 一维数组
import numpy as np
a = np.array([1,2,3])
print(a)

[1 2 3]


In [3]:
# 二维数组
import numpy as np
a = np.array([[1,2,3],[6,6,3]])
print(a)

[[1 2 3]
 [6 6 3]]


In [4]:
# 复数
import numpy as np 
a = np.array([1,  2,  3], dtype = complex)  
print (a)

[1.+0.j 2.+0.j 3.+0.j]


In [5]:
# 使用标量类型
import numpy as np
dt = np.dtype(np.int32)
print(dt)

int32


In [6]:
# int8, int16, int32, int64 四种数据类型可以使用字符串 'i1', 'i2','i4','i8' 代替
import numpy as np
dt = np.dtype('i4')
print(dt)

int32


In [7]:
# 字节顺序标注
import numpy as np
dt = np.dtype('<i4')
print(dt)

int32


In [8]:
# 首先创建结构化数据类型
import numpy as np
dt = np.dtype([('age',np.int8)])
print(dt)

[('age', 'i1')]


In [9]:
# 将数据类型应用于 ndarray 对象
import numpy as np
dt = np.dtype([('age',np.int8)])
a = np.array([(10,),(20,),(30,)],dtype=dt)
print(a)

[(10,) (20,) (30,)]


In [10]:
# 类型字段名可以用于存取实际的 age 列
import numpy as np
dt = np.dtype([('age',np.int8)]) 
a = np.array([(10,),(20,),(30,)], dtype = dt) 
print(a['age'])

[10 20 30]


In [1]:
import numpy as np
student = np.dtype([('name','S20'),('age','i1'),('marks','f4')])
print(student)

[('name', 'S20'), ('age', 'i1'), ('marks', '<f4')]


In [2]:
import numpy as np
student = np.dtype([('name','S20'),('age','i1'),('marks','f4')]) # 定义student这种数据类型
a = np.array([('abc',21,45),('cvf',34,56.9)],dtype=student) # 类型设置为student
print(a)

[(b'abc', 21, 45. ) (b'cvf', 34, 56.9)]


In [6]:
import numpy as np
a = np.arange(24)
b = a.reshape(2,4,3) # 两个四行三列是数组
print(b)
print(a.ndim)
print(b.ndim)

[[[ 0  1  2]
  [ 3  4  5]
  [ 6  7  8]
  [ 9 10 11]]

 [[12 13 14]
  [15 16 17]
  [18 19 20]
  [21 22 23]]]
1
3


In [8]:
import numpy as np
a = np.array([[1,2,3],[4,5,6]])
print(a.shape)

(2, 3)


In [9]:
import numpy as np
a = np.array([[1,2,3],[4,5,6]])
a.shape = (3,2) # 给shape赋值
print(a)

[[1 2]
 [3 4]
 [5 6]]


In [12]:
import numpy as np
a = np.array([[1,2,3],[4,5,6]])
b = a.reshape(3,2) # 使用reshape函数
print(b)

[[1 2]
 [3 4]
 [5 6]]


In [16]:
import numpy as np
a = np.array([1,2,3],dtype=np.float64)
b = np.array([100,200,300],dtype=np.int8)

print(a.itemsize)
print(b.itemsize)
print(a.flags)
# print(b.flags)

8
1
  C_CONTIGUOUS : True
  F_CONTIGUOUS : True
  OWNDATA : True
  WRITEABLE : True
  ALIGNED : True
  WRITEBACKIFCOPY : False
  UPDATEIFCOPY : False


In [22]:
import numpy as np
a = np.empty([3,2],dtype=np.int8)

b = np.empty([3,2],dtype=int)

print(a)
print(10*'=')
print(b)

[[  5   0]
 [ 71   0]
 [100  77]]
[[1 2]
 [3 4]
 [5 6]]


In [27]:
import numpy as np
x = np.zeros(5) # 默认是浮点型
print(x)
y1 = np.zeros((5,),dtype=np.int) # 打印一行5列
print(y1)
y2 = np.zeros((5,2),dtype=np.int) # 打印五行2列
print(y2)

z = np.zeros((2,2), dtype = [('x', 'i4'), ('y', 'i4')])  # 打印两行两列，每个元素的是(a,b)类型的
print(z)

[0. 0. 0. 0. 0.]
[0 0 0 0 0]
[[0 0]
 [0 0]
 [0 0]
 [0 0]
 [0 0]]
[[(0, 0) (0, 0)]
 [(0, 0) (0, 0)]]


In [32]:
import numpy as np
x = np.ones(5)
print(x)
print(10*'==')
y = np.ones([2,2],dtype=np.int) # 形状用[]来表示
print(y)
print(10*'==')

z = np.ones((2,2),dtype=np.int) # 形状用()来表示
print(z)

[1. 1. 1. 1. 1.]
[[1 1]
 [1 1]]
[[1 1]
 [1 1]]


In [35]:
# NumPy 从已有的数组创建数组 numpy.asarray，numpy.frombuffer,

import numpy as np
x = [1,2,3] # 列表
a1 = np.asarray(x)
a2 = np.asarray(x,dtype=float)
print(a1)
print(a2)

y = (1,2,3) # 元组
b = np.asarray(y)
print(b)

[1 2 3]
[1. 2. 3.]
[1 2 3]


In [36]:
# numpy.frombuffer 接受 buffer 输入参数，以流的形式读入转化成 ndarray 对象。
import numpy as np
s = b'hello world'
a = np.frombuffer(s, dtype='S1')
print(a)

[b'h' b'e' b'l' b'l' b'o' b' ' b'w' b'o' b'r' b'l' b'd']


In [38]:
# numpy.fromiter 方法从可迭代对象中建立 ndarray 对象，返回一维数组。
import numpy as np
list = range(5)
it = iter(list)
a = np.fromiter(it, dtype=float)
print(a)

[0. 1. 2. 3. 4.]


## NumPy 从数值范围创建数组
- numpy 包中的使用 arange 函数创建数值范围并返回 ndarray 对象，函数格式如下：
    - numpy.arange(start, stop, step, dtype)
- numpy.linspace 函数用于创建一个一维数组，数组是一个等差数列构成的，格式如下：
    - np.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)
- numpy.logspace 函数用于创建一个于等比数列。格式如下：
    - np.logspace(start, stop, num=50, endpoint=True, base=10.0, dtype=None)

In [41]:
import numpy as np
a = np.arange(10)
print(a)
print(10*'==')
b = np.arange(10,dtype=float)
print(b)
print(10*'==')
c = np.arange(10,20,2)
print(c)

[0 1 2 3 4 5 6 7 8 9]
[0. 1. 2. 3. 4. 5. 6. 7. 8. 9.]
[10 12 14 16 18]


In [49]:
import numpy as np
a = np.linspace(1,10,10) # 设置起始点为 1 ，终止点为 10，数列个数为 10。
print(a)
print(10*'===')

b = np.linspace(10,20,5)
c = np.linspace(10,20,5,endpoint=False)
print(b)
print(c)

[ 1.  2.  3.  4.  5.  6.  7.  8.  9. 10.]
[10.  12.5 15.  17.5 20. ]
[10. 12. 14. 16. 18.]


In [53]:
import numpy as np
a = np.logspace(1,2,10) 
# 目的生成一组元素，包含10个。默认以10为底，得到的第一个元素对数值为1，最后一个元素的对数值为2，元素之间自动等比
print(a)


[ 10.          12.91549665  16.68100537  21.5443469   27.82559402
  35.93813664  46.41588834  59.94842503  77.42636827 100.        ]


In [52]:
import numpy as np
a = a = np.logspace(0,9,10,base=2)
# 目的生成一组元素，包含10个。设置以2为底，得到的第一个元素对数值为0，最后一个元素的对数值为9，元素之间自动等比
print (a)

[  1.   2.   4.   8.  16.  32.  64. 128. 256. 512.]


In [61]:
# 切片和索引
import numpy as np
a = np.arange(10)
s = slice(2,7,2) # 从索引 2 开始到索引 7 停止，间隔为2
print(a[s])
print(10*'===')
print(a[2:7:2]) # 类似于列表的索引
print(10*'===')

b = a[2:7:2] # 相当于索引出来赋值给b
print(b)

[2 4 6]
[2 4 6]
[2 4 6]


In [68]:
# 切片和索引
import numpy as np
a = np.arange(10)
print(a[5])
print(10*'===')
print(a[5,])
print(10*'===')
print(a[5:])
print(10*'===')
print(a[:5])
print(a[:])

5
5
[5 6 7 8 9]
[0 1 2 3 4]
[0 1 2 3 4 5 6 7 8 9]


In [72]:
import numpy as np 
a = np.array([[1,2,3],[4,5,6],[7,8,9]]) # 3维数组
print(a)
print(10*'===')
print(a[1:])

[[1 2 3]
 [4 5 6]
 [7 8 9]]
[[4 5 6]
 [7 8 9]]


In [75]:
import numpy as np 
a = np.array([[1,2,3],[4,5,6],[7,8,9]])
print(a[...,1]) # 打印第2列元素
print(10*'===')
print(a[1,...]) # 打印第2行元素
print(10*'===')
print(a[1,1:]) # 打印第2行，第2列以后第所有元素

[2 5 8]
[4 5 6]
[5 6]


## 数组高级索引
- NumPy 比一般的 Python 序列提供更多的索引方式。除了之前看到的用整数和切片的索引外，数组可以由整数数组索引、布尔索引及花式索引。
- 整数数组索引
- 布尔索引
- 花式索引

In [76]:
import numpy as np
x = np.array([[1,2],[3,4],[5,6]])
y = x[[0,1,2],[0,1,1]] # 通过数组索引元素
print(y)

[1 4 6]


In [77]:
import numpy as np
x = np.array([[1,2,3],[4,5,6],[7,8,9],[10,11,12]])
rows = np.array([[0,0],[3,3]]) # 构造一个两行两列数组，第一行是x数组的第一行，第二行是x数组的最后一行
colo = np.array([[0,2],[0,2]]) # 构造一个两行两列数组，每一行第一个元素是x数组的第一列，每一行第二个元素是x数组的最后一列
y = x[rows,colo]
print(y)

[[ 1  3]
 [10 12]]


In [79]:
# 可以借助切片 : 或 … 与索引数组组合。如下面例子：
import numpy as np
a = np.array([[1,2,3],[4,5,6],[7,8,9],[10,11,12]])
b = a[1:3,1:3]
c = a[1:3,(1,2)]
d = a[...,1:]
print(a)
print('\n')
print(b)
print('\n')
print(c)
print('\n')
print(d)

[[ 1  2  3]
 [ 4  5  6]
 [ 7  8  9]
 [10 11 12]]


[[5 6]
 [8 9]]


[[5 6]
 [8 9]]


[[ 2  3]
 [ 5  6]
 [ 8  9]
 [11 12]]


In [80]:
# 布尔索引通过布尔运算（如：比较运算符）来获取符合指定条件的元素的数组。
import numpy as np
a = np.array([[1,2,3],[4,5,6],[7,8,9],[10,11,12]])
print(a[a>5])

[ 6  7  8  9 10 11 12]


In [86]:
import numpy as np
a = np.array([np.nan,12,2,3,np.nan,34,65])
print(a)
print('\n')
print(a[np.isnan(a)]) # 得到数组中第nan元素
print(a[~np.isnan(a)]) # 过滤掉数组中给nan元素

[nan 12.  2.  3. nan 34. 65.]


[nan nan]
[12.  2.  3. 34. 65.]


In [87]:
# 以下实例演示如何从数组中得到和过滤复数元素。
import numpy as np
a = np.array([1,  2+6j,  5,  3.5+5j])

print(a[np.iscomplex(a)]) # 得到复数元素
print(a[~np.iscomplex(a)]) # 过滤掉复数元素

[2. +6.j 3.5+5.j]
[1.+0.j 5.+0.j]


In [90]:
import numpy as np
a = np.arange(32).reshape(8,4)
print(a)
print(10*'==')
b = a[[4,5,6,2]] # 目标数组是2维数组，则a[[4,5,6,2]]索引到的是4，5，6，2行的整行元素.传入的是正序
print(b)
print(10*'==')

print (a[[-4,-2,-1,-7]]) # 传入的是倒序

[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]
 [12 13 14 15]
 [16 17 18 19]
 [20 21 22 23]
 [24 25 26 27]
 [28 29 30 31]]
[[16 17 18 19]
 [20 21 22 23]
 [24 25 26 27]
 [ 8  9 10 11]]
[[16 17 18 19]
 [24 25 26 27]
 [28 29 30 31]
 [ 4  5  6  7]]


In [92]:
# 3、传入多个索引数组（要使用np.ix_）
import numpy as np
x = np.arange(32).reshape(8,4)
print(x)
print(10*'==')
print(x[np.ix_([1,2,3],[2,3])]) # 这种写法很好用啊

[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]
 [12 13 14 15]
 [16 17 18 19]
 [20 21 22 23]
 [24 25 26 27]
 [28 29 30 31]]
[[ 6  7]
 [10 11]
 [14 15]]
