# 创建数组的几种方式

## 引入Numpy库

In [2]:
import numpy as np

## np.array创建数组

In [3]:
# 使用np.array()创建数组
a = np.array([1, 2, 3, 4])
# 打印数组
print(a)
# 查看类型
print(type(a))

[1 2 3 4]
<class 'numpy.ndarray'>


## np.arange创建数组
* np.arange(3) = [0,3) 起点默认为0，长度为3，步长默认为1。所以结果为[0,1,2]

* np.arange(3,9) = [3,9) 起点为3，终点为8，步长默认为1。所以结果为[3,4,5,6,7,8]

* np.arange(0,3,0.5) = [0,2.5) 起点为0，终点为2.5，步长为0.5。所以结果为[0,0.5,1,1.5,2,2.5]

In [4]:
a = np.arange(3)
b = np.arange(3, 9)
c = np.arange(0, 3, 0.5)
print(a)
print(b)
print(c)

[0 1 2]
[3 4 5 6 7 8]
[0.  0.5 1.  1.5 2.  2.5]


## np.random.random创建数组
* np.random.random((N,N))创建一个N行N列的数组，其中里面的值是0-1之间的随机数

In [5]:
# 使用np.random.randon((X,Y))，创建一个X行，Y列的数组，其中里面的值是0-1之间的随机数
c = np.random.random((3, 4))
print(c)

[[0.39009448 0.93535265 0.59188128 0.37647236]
 [0.90966277 0.96936254 0.79375361 0.68575259]
 [0.28008832 0.92937325 0.35892415 0.7532148 ]]


## np.random.randint创建数组

* np.random.randint(X,Y,size=(A,B))，创建一个A行B列，数值范围在[X,Y)的数组

In [6]:
d = np.random.randint(0, 9, size=(3, 4))
print(d)

[[2 1 4 1]
 [7 4 4 3]
 [5 3 1 7]]


## 特殊函数
* np.zeros((N,M)) N行M列的全零数组
* np.ones((N,M)) N行M列的全1数组
* np.full((N,M),Y) 值为Y的N行M列的数组
* np.eye(N) 生成一个在斜方形上元素为1，其他元素都为0的N行矩阵

In [7]:
print("np.zeros((N,M)) N行M列的全零数组")
array_zeros = np.zeros((3, 4))
print(array_zeros)
print()
print("np.ones((N,M)) N行M列的全1数组")
array_ones = np.ones((4, 5))
print(array_ones)
print()
print("np.full((N,M),Y) 值为Y的N行M列的数组")
arrzy_full = np.full((2, 3), 8)
print(arrzy_full)
print()
print("np.eye(N) 生成一个在斜方形上元素为1，其他元素都为0的N行矩阵")
array_eye = np.eye(4)
print(array_eye)

np.zeros((N,M)) N行M列的全零数组
[[0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]]

np.ones((N,M)) N行M列的全1数组
[[1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1.]]

np.full((N,M),Y) 值为Y的N行M列的数组
[[8 8 8]
 [8 8 8]]

np.eye(N) 生成一个在斜方形上元素为1，其他元素都为0的N行矩阵
[[1. 0. 0. 0.]
 [0. 1. 0. 0.]
 [0. 0. 1. 0.]
 [0. 0. 0. 1.]]


# 数组数据类型

## 数据类型

![image.png](attachment:96b8b24c-0ad6-4d36-80f0-6a61c4eaa5f6.png)

## 创建数组指定数据类型

In [8]:
a = np.array([1, 2, 3, 4, 5], dtype="i1")
print(a)
print(a.dtype)

a = np.array([1, 2, 3, 4, 5], dtype="i4")
print(a)
print(a.dtype)

[1 2 3 4 5]
int8
[1 2 3 4 5]
int32


## 查询数据类型
```py
a = np.array([1,2,3,4,5],dtype='i4')
print(a.dtype)
===============================
int32
```

In [9]:
a = np.array([1, 2, 3, 4, 5], dtype="i4")
print(a)
print(a.dtype)
print()


class Person:
    def __init__(self, name, age):
        self.name = name
        self.age = age


d = np.array([Person("test1", 18), Person("test2", 22)])
print(d)
print(d.dtype)

[1 2 3 4 5]
int32

[<__main__.Person object at 0x7f3354120280>
 <__main__.Person object at 0x7f33541201f0>]
object



## 修改数据类型
* f = a.astype('f2')

In [9]:
a = np.array([1, 2, 3, 4, 5], dtype="i4")
print(a)
print(a.dtype)
print()
f = a.astype("f2")
print(f)
print(f.dtype)

[1 2 3 4 5]
int32

[1. 2. 3. 4. 5.]
float16


## 总结
1. numpy是基于C语言编写，引用了C语言的数据类型，所以Numpy的数组中数据类型多样
2. 不同的数据类型有利于处理海量数据，针对不同数据赋予不同数据类型，从而节省内存空间

# 多维数组

## 数组维度查询
* ndim

```py
a1 = np.array([1,2,3])
print(f'维度：{a1.ndim}')
========================
维度：1
```

In [10]:
# 数组维度
# 维度为1
a1 = np.array([1, 2, 3])
print(f"维度：{a1.ndim}")

# 维度为2
a2 = np.array([[1, 2, 3], [4, 5, 6]])
print(f"维度：{a2.ndim}")

# 维度为3
a3 = np.array([[[1, 2, 3], [4, 5, 6]], [[7, 8, 9], [10, 11, 12]]])
print(f"维度：{a3.ndim}")

维度：1
维度：2
维度：3


## 数组形状查询

In [1]:
a1 = np.array([1, 3, 5])
# 结果为(3,)
print(a1.shape)


a2 = np.array([[1, 2, 3], [4, 5, 6]])
print(a2.shape)
# 结果为（2，3）

a3 = np.array([[[1, 2, 3], [4, 5, 6]], [[7, 8, 9], [10, 11, 12]]])
print(a3.shape)
# 结果为（2，2，3）

NameError: name 'np' is not defined

## 修改数组的形状

>修改后的数组行数 X 修改后的数组列数 = 原有数组的元素个数

```sh
a1.reshape((修改后的数组行数,修改后的数组列数))
```

In [12]:
a1 = np.array([[[1, 3, 5], [2, 4, 6]], [[9, 7, 5], [8, 6, 4]]])
print(a1)
print("========================")

a2 = a1.reshape((2, 6))
print(a2)
print("========================")
a3 = a1.reshape((3, 4))
print(a3)
print("========================")
print("扁平化")
a4 = a1.flatten()
print(a4)

[[[1 3 5]
  [2 4 6]]

 [[9 7 5]
  [8 6 4]]]
[[1 3 5 2 4 6]
 [9 7 5 8 6 4]]
[[1 3 5 2]
 [4 6 9 7]
 [5 8 6 4]]
扁平化
[1 3 5 2 4 6 9 7 5 8 6 4]


## 数组元素个数与所占内存

In [13]:
a1 = np.array([[[1, 2, 3], [4, 5, 6]], [[7, 8, 9], [10, 11, 12]]])

print("数组元素个数")
count = a1.size
print(count)

print("各元素所占内存")
print(a1.itemsize)

print("各元素类型")
print(a1.dtype)

print("数组所占内存")
print(a1.size * a1.itemsize)

数组元素个数
12
各元素所占内存
8
各元素类型
int64
数组所占内存
96


## 总结
* 一般情况下，数组维度最大到三维，一般会把三维以上的数组转化为二维数组来计算
* **ndarray.ndmin** 查询数组的**维度**
* **ndarray.shape** 可以看到数组的**形状（几行几列）**，shape是一个元组，里面有几个元素代表是几维数组
* **ndarray.reshape** 可以**修改数组的形状**。条件只有一个，就是修改后的形状的元素个数必须和原来的个数一致。比如原来是（2,6），那么修改完成后可以变成（3,4），但是不能变成（1,4）。reshape不会修改原来数组的形状，只会将修改后的结果返回。
* **ndarray.size** 查询数组**元素个数**
* **ndarray.itemsize** 可以看到数组中**每个元素所占内存的大小，单位是字节**。（1个字节=8位）

# 数组索引和切片

## 一维数组

In [14]:
a1 = np.arange(10)
print(a1)

[0 1 2 3 4 5 6 7 8 9]


### 索引

In [15]:
print(a1[4])

4


### 使用负数作为索引

In [16]:
print(a1[-1])

9


### 切片

In [17]:
print(a1[4:6])

[4 5]


### 使用步长切片

In [18]:
print(a1[::2])

[0 2 4 6 8]


In [19]:
print(a1[::3])

[0 3 6 9]


## 二维数组

In [20]:
a2 = np.random.randint(0, 10, size=(4, 6))
print(a2)

[[9 1 6 6 5 7]
 [9 5 4 5 3 8]
 [3 8 9 0 8 4]
 [7 6 3 8 1 0]]


### 获取第0行数据

In [21]:
print(a2[0])

[9 1 6 6 5 7]


### 获取第1,2行数据

In [22]:
print(a2[1:3])

[[9 5 4 5 3 8]
 [3 8 9 0 8 4]]


### 获取多行数据(0,2,3行)

In [23]:
print(a2[[0, 2, 3]])

[[9 1 6 6 5 7]
 [3 8 9 0 8 4]
 [7 6 3 8 1 0]]


### 获取第2行第1列数据

In [24]:
print(a2[2, 1])

8


### 取多个数据 例:第一行第四列、第二行第五列数据

In [25]:
a2 = np.random.randint(0, 10, size=(4, 6))
print(a2)
print(a2[0, 0])
print(a2[1, 1])
print(a2[[1, 2], [2, 5]])

[[2 3 6 7 7 5]
 [2 5 1 6 4 5]
 [4 7 9 3 3 0]
 [9 3 9 4 1 7]]
2
5
[1 0]


### 获取多个数据 例:第一、二行的第四、五列的数据

In [26]:
print(a2[1:3, 4:6])

[[4 5]
 [3 0]]


### 获取某一列的数据 例:第一列的全部数据

In [27]:
print(a2[:, 5])

[5 5 0 7]


### 获取多列数据 例:第一、三列的全部数据

In [28]:
print(a2[:, [1, 3]])

[[3 7]
 [5 6]
 [7 3]
 [3 4]]


## 总结
1. 如果数组是一维的，那么索引和切片就是和python的列表是一样的
2. 如果是多维的（以二维为例），那么在中括号中，给两个值，两个值是通过逗号分割得，逗号前面的是行，逗号后面的是列。如果括号中只有一个值，那么就是代表行。
3. 如果是多维数组（以二维为例），那么行的部分和列的部分，都是遵循以为数组的方式，可以使用整形、切片，还可以使用中括号的形式代表不连续的。比如a[[1,2][3,4]],那么返回的就是第一行第二列、第三行第四列的两个值。

# 布尔索引

## 生成1-24的4行6列的二维数组

In [29]:
a1 = np.arange(24).reshape((4, 6))
print(a1)

[[ 0  1  2  3  4  5]
 [ 6  7  8  9 10 11]
 [12 13 14 15 16 17]
 [18 19 20 21 22 23]]


## 提取小于10的数据

In [30]:
print(a1[a1 < 10])

[0 1 2 3 4 5 6 7 8 9]


## 提取小于5和大于10的数据集

In [31]:
print(a1[(a1 < 5) | (a1 > 10)])

[ 0  1  2  3  4 11 12 13 14 15 16 17 18 19 20 21 22 23]


## 总结
1. 布尔索引是通过相同数据上的True还是False来进行提取的
2. 提取条件可以为1个或多个，当提取条件为多个时，&代表且，|代表或
3. 当提取条件为多个时，每个条件要用圆括号括起来

# 数组元素值的替换

## 索引

### 创建数组元素为[0.10)随机数的3行5列数组

In [32]:
a = np.random.randint(0, 10, size=(3, 5))
print(a)

[[9 1 1 2 9]
 [2 8 8 9 7]
 [0 7 0 2 1]]


### 将数组第一行全部更换为0

In [33]:
a[1] = 0
print(a)

[[9 1 1 2 9]
 [0 0 0 0 0]
 [0 7 0 2 1]]


### 将数组第一列全部更换为1

In [34]:
a[:, 1] = 1
print(a)

[[9 1 1 2 9]
 [0 1 0 0 0]
 [0 1 0 2 1]]


### 将数组的第2列数据更换为[1,2,3,4,5]

In [35]:
a[2] = np.array([1, 2, 3, 4, 5])
print(a)

[[9 1 1 2 9]
 [0 1 0 0 0]
 [1 2 3 4 5]]


In [36]:
a[2] = [5, 4, 3, 2, 1]
print(a)

[[9 1 1 2 9]
 [0 1 0 0 0]
 [5 4 3 2 1]]


In [37]:
print(type([1, 2, 3, 4, 5]))
print(type(np.array([1, 2, 3, 4, 5])))

<class 'list'>
<class 'numpy.ndarray'>


## 条件索引

### 将数组中小于3的元素全部置换为1

In [38]:
a[a < 3] = 1
print(a)

[[9 1 1 1 9]
 [1 1 1 1 1]
 [5 4 3 1 1]]


## 函数

### 将数组中大于3的值替换为0

In [39]:
result = np.where(a > 3, 0, 1)
print(result)

[[0 1 1 1 0]
 [1 1 1 1 1]
 [0 0 1 1 1]]


## 总结
1. 使用索引或者欺骗来替换值
2. 使用条件索引来替换值
3. 使用where函数来替换值

# 数组的广播机制

