In [2]:
import numpy as np

# 1 创建数组


## 1.1 numpy 创建数组

object 可以是列表，元组，数组，可迭代对象，生成器
![image.png](attachment:image.png)


In [3]:
# 列表
a = np.array([1, 2, 3, 4, 5])
a

array([1, 2, 3, 4, 5])

In [4]:
# 元组
a = np.array((1, 2, 3, 4, 5))
a

array([1, 2, 3, 4, 5])

In [5]:
# 数组
a = np.array(np.array([1, 2, 3, 4, 5]))
a

array([1, 2, 3, 4, 5])

In [6]:
# 可迭代对象
a = np.array(range(2, 5))
a

array([2, 3, 4])

In [7]:
# 生成器
a = np.array([i**2 for i in range(1, 5)])
a

array([ 1,  4,  9, 16])

In [8]:
# 10 以内偶数
a = np.array([i for i in range(10) if i % 2 == 0])
a

array([0, 2, 4, 6, 8])

### 1.1.1 元素类型不相同


In [9]:
a = np.array([1, 2, 3, 4, 5, "1.5"])
a

array(['1', '2', '3', '4', '5', '1.5'], dtype='<U21')

In [10]:
a = np.array([[1, 2, 3], ["a", "b", "c"]])
a

array([['1', '2', '3'],
       ['a', 'b', 'c']], dtype='<U21')

### 1.1.2 dtype 数据类型转换


In [11]:
a = np.array([1, 2, 3, 4, 5])
b = np.array(a, dtype=float)
print(b)

c = np.array([-1.2, 1.8, 3.14])  # 向 0 舍入
d = np.array(c, dtype=int)
print(d)

[1. 2. 3. 4. 5.]
[-1  1  3]


### 1.1.3 copy 参数


In [12]:
list1 = [1, 2, 3, 4, 5]
list2 = list1  # 引用赋值，两个变量名指向同一个地址
print(id(list1) - id(list2))
list3 = list(list1)
print(id(list3) - id(list1))

0
180096


In [13]:
array1 = np.array([1, 2, 3, 4, 5])
array2 = array1
print(id(array1) - id(array2))

# 下面这种方式会创建一个新的副本，copy 参数默认为 True
array3 = np.array(array1)
print(id(array3) - id(array1))

# 如果将 copy 参数改成 False，则不会创建新的副本，效果上和引用赋值相同
array4 = np.array(array1, copy=False)
print(id(array4) - id(array1))

# 或者直接用 copy 函数创建副本，这样两个数组相互独立，不会干扰
array5 = array1.copy()
print(id(array5) - id(array1))

0
-94927936
0
-1440


### 1.1.4 ndmin 用于指定数组的维数


In [14]:
a = np.array([1, 2, 3], ndmin=2)
print(a.ndim)
print(a.shape)
a

2
(1, 3)


array([[1, 2, 3]])

### 1.1.5 subok 指定新数组的数据类型

默认 False 为 ndarray ，True 为 object 本身的数据类型


In [15]:
a = np.mat([1, 2, 3, 4])
print(type(a))
b = np.array(a)
c = np.array(a, subok=True)
print("subok == True:", type(c))
print("subok == False:", type(b))

<class 'numpy.matrix'>
subok == True: <class 'numpy.matrix'>
subok == False: <class 'numpy.ndarray'>


## 1.2 arange 创建区间数组

**np.arange(start, stop, step, dtype)**
![image.png](attachment:image.png)


In [16]:
a = np.arange(3, 10, 0.9, dtype=float)
a

array([3. , 3.9, 4.8, 5.7, 6.6, 7.5, 8.4, 9.3])

## 1.3 linspace 创建等差数组

![image.png](attachment:image.png)


In [17]:
a = np.linspace(0, 10, 20, endpoint=True, retstep=True, dtype=float)
print("a : ", a, "\n")
b = np.linspace(0, 10, 20, endpoint=False, retstep=False, dtype=float)
print("b :", b, "\n")
print("type(a) == ", type(a))
print("step_a = ", a[1])

a :  (array([ 0.        ,  0.52631579,  1.05263158,  1.57894737,  2.10526316,
        2.63157895,  3.15789474,  3.68421053,  4.21052632,  4.73684211,
        5.26315789,  5.78947368,  6.31578947,  6.84210526,  7.36842105,
        7.89473684,  8.42105263,  8.94736842,  9.47368421, 10.        ]), 0.5263157894736842) 

b : [0.  0.5 1.  1.5 2.  2.5 3.  3.5 4.  4.5 5.  5.5 6.  6.5 7.  7.5 8.  8.5
 9.  9.5] 

type(a) ==  <class 'tuple'>
step_a =  0.5263157894736842


## 1.4 logspace 创建等比数列

在 start 和 stop 之间均匀取点，相当于 linspace(start, stop, num) ，然后再作为 base 的幂指数进行运算
![image.png](attachment:image.png)


In [18]:
a = np.logspace(3, 10, 10, base=4, dtype=float)
print(a)

c = np.linspace(3, 10, 10)
b = np.array([4**i for i in c])
b

[6.40000000e+01 1.88126015e+02 5.52990586e+02 1.62549868e+03
 4.77810295e+03 1.40450854e+04 4.12850930e+04 1.21356250e+05
 3.56722934e+05 1.04857600e+06]


array([6.40000000e+01, 1.88126015e+02, 5.52990586e+02, 1.62549868e+03,
       4.77810295e+03, 1.40450854e+04, 4.12850930e+04, 1.21356250e+05,
       3.56722934e+05, 1.04857600e+06])

## 1.5 创建全 0 全 1 数组

全 0:![image.png](attachment:image.png)
全 1 只需改成 np.ones() 以及 np.ones_like() 即可


In [19]:
a = np.zeros((3, 4))  # 默认 dtype 是 float
print(a)
b = np.zeros_like(a, dtype=int)
print(b)

[[0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]]
[[0 0 0 0]
 [0 0 0 0]
 [0 0 0 0]]


## 1.6 Numpy 数组的重要属性

![image.png](attachment:image.png)


# 2 ndarray 的常见操作


### 2.1 改变维度


#### 2.1.1 `ndarray.reshape(**tupple**)`

返回调整维度后的副本，并不改变原数组


In [20]:
a = np.array([1, 2, 3, 4, 5, 6])
b = a.reshape((2, 3))
b

array([[1, 2, 3],
       [4, 5, 6]])

#### 2.1.2 `ndarray.resize(new_shape, refcheck=True)`

new_shape: 新的数组形状，可以是整数或整数的元组。

refcheck: 默认为 True，检查数组是否被引用，如果设置为 False，则允许重塑即使数组被引用。

改变形状:
当数组大小增加时，新的位置会被填充零。如果大小减小，超出的数据会被丢弃。


In [21]:
a = np.array([1, 2, 3, 4, 5, 6])
a.resize((2, 3), refcheck=False)
print(a)
a.resize((3, 4), refcheck=False)
print(a)

[[1 2 3]
 [4 5 6]]
[[1 2 3 4]
 [5 6 0 0]
 [0 0 0 0]]


#### 2.1.3 `np.resize(a, new_shape)`

a: 要调整大小的数组。

new_shape: 新数组的形状，可以是整数或者整数的元组。

重复和截断:

如果 new_shape 指定的大小比原始数组大，那么原数组的元素会重复以填满新数组。

如果指定的大小比原数组小，原数组的元素将被截断以匹配新的大小。

np.resize() 不会修改原数组，而是返回一个新的数组。


In [22]:
a = np.array([1, 2, 3, 4, 5, 6])
b = np.resize(a, (3, 4))
print(b)

[[1 2 3 4]
 [5 6 1 2]
 [3 4 5 6]]


### 2.2 改变数组元素的数据类型

`ndarray.astype(**dtype**)`

返回原数组修改完数据类型的一份副本，并不改变原数组的数据类型


In [23]:
a = np.array([1, 2, 3, 4, 5, 6])
print(a.dtype)
b = a.astype(np.float64)
print(b)
print(a.dtype)

int64
[1. 2. 3. 4. 5. 6.]
int64


# 3 切片和索引

切片得到的是原始数组的一个视图，而不是一个副本，因此修改切片，原始数组也会一起改变。

但是列表相反，列表得到的切片是原列表的一个副本。


In [24]:
a_ndarray = np.array([1, 2, 3, 4, 5, 6])
a_list = [1, 2, 3, 4, 5, 6]

b_ndarray = a_ndarray[0:3]
b_list = a_list[0:3]

b_ndarray[0] = 1000
b_list[0] = 1000

print(a_ndarray)
print(a_list)

[1000    2    3    4    5    6]
[1, 2, 3, 4, 5, 6]


## 3.1 二维数组的索引

`ndarray[row_1:row_2, col_1:col_2]`

注意这里一定是在同一个 [] 中，如果是两个 [] ，就不是取行列的交叉点了，就是先取行得到一个二维数组，然后再取这个二维数组的行

如果要取所有行或者所有列，可以用...或者 : 表示


In [25]:
a = np.arange(20).reshape(4, 5)
a

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14],
       [15, 16, 17, 18, 19]])

In [26]:
a[1:3, 1:3]

array([[ 6,  7],
       [11, 12]])

In [27]:
# 取得第二列数据
print(a[..., 1:2])
print("\n")
print(a[:, 1])

[[ 1]
 [ 6]
 [11]
 [16]]


[ 1  6 11 16]


In [28]:
b = a[0:2]
print(b)
print("\n")
print(b[1])
a[0:2][1]

[[0 1 2 3 4]
 [5 6 7 8 9]]


[5 6 7 8 9]


array([5, 6, 7, 8, 9])

## 3.2 高级索引/花式索引


### 3.2.1 整数数组索引

r 为要获得数据的行索引数组，维度为 1 $\times$ m

l 为要获得数据的列索引数组，维度为 1 $\times$ m

a[r, l] 为要获得的数据


In [29]:
# 创建二维数组
x = np.array([[1, 2], [3, 4], [5, 6]])
x

array([[1, 2],
       [3, 4],
       [5, 6]])

In [30]:
# 获取 x[0][0], x[1][1], x[2][0] 的值
res = x[[0, 1, 2], [0, 1, 0]]
res

array([1, 4, 5])

In [31]:
# 获取数组的第一行和最后一行，第 1 3 4 列
# 这种取整个行列，而非取某些给定坐标点的值，需要先取行，再取列，两步走
a = np.arange(12).reshape((3, 4))
a[[0, -1], :][:, [0, 2, 3]]

array([[ 0,  2,  3],
       [ 8, 10, 11]])

### 3.2.2 布尔数组索引

布尔数组的形状必须与要索引的数组的形状相同，或者是可以广播到相同形状的。

也可以在一次操作中直接使用布尔条件来筛选二维数组

逻辑与: &, 逻辑或: |

不同条件用 () 单独括起来

还可以根据条件修改原始数组的值


In [32]:
# 创建一个示例的二维数组
array = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

# 创建一个布尔数组，表示要选择的条件
condition = array > 3

# 使用布尔索引选择满足条件的元素
result = array[condition]

print(result)

[4 5 6 7 8 9]


In [33]:
result = array[(array > 3) & (array <= 5)]
result

array([4, 5])

In [34]:
a = np.array([1, 2, 3, 4, 5, 6]).reshape((2, 3))
a[a > 3] = 0
a

array([[1, 2, 3],
       [0, 0, 0]])

# 4 广播机制

维度相容性规则：

两个数组的维度从最后一个维度开始比较，依次向前比较，要么维度相等，要么其中一个数组的维度为 1。如果两个数组的某个维度都不为 1 且不相等，那么广播操作将引发错误。

维度为 1 的维度被自动扩展： 如果某个维度的长度为 1，那么它将被扩展到与另一个数组相同的长度。


In [35]:
# 示例1：广播将一个标量与一个数组相加
arr1 = np.array([1, 2, 3])
result = arr1 + 2  # 广播：将标量2添加到数组中的每个元素
print(result)  # 输出 [3 4 5]
print("\n")

# 示例2：广播将两个不同形状的数组相加
arr2 = np.array([[1, 2, 3], [4, 5, 6]])
arr3 = np.array([10, 20, 30])
result = arr2 + arr3  # 广播：将arr3的每一行添加到arr2的对应行
print(result)
print("\n")
# 输出:
# [[11 22 33]
#  [14 25 36]]

# 示例3：广播失败的情况，因为维度不兼容
arr4 = np.array([1, 2, 3])
arr5 = np.array([4, 5])
# 下面的操作会引发广播错误
try:
    result = arr4 + arr5
except:
    print("广播维度错误！")


[3 4 5]


[[11 22 33]
 [14 25 36]]


广播维度错误！
