## NumPy中的数据类型——ndarray

NumPy 是以多维数组为基本数据结构进行操作的软件库。<br>NumPy 没有使用 Python 的列表，<br>而是使用 NumPy 自己实现的名为 ndarray 的这一独特的数据结构进行更为高效的运算。

官网描述：ndarray（N维数组），
<br>是由多个具有相同类型和尺寸的元素所组成的（通常具有固定的尺寸）多维的容器。

简要地说：ndarray 就是用于对包含**同样属性同样大小**的元素的多维数组进行处理的一个 Python 类。

In [None]:
# 从已有数据中创建数组
import numpy as np
a = np.array(
[[ 1, 2, 3],
 [ 4, 5, 6]])
a

In [None]:
floats = np.array([0.0, 0.1, 0.2, 0.3, 0.4])
floats             

Numpy 不会显示浮点数小数点后面尾随的0。

ndarray对象提供属性，允许我们知晓关于其结构和内容的信息。

ndarray对象的属性：使用`(实例变量名).(属性)`形式的语句可以获取 ndarray 实例中所包含的属性值。

每个数组都有一个shape（一个表示各维度大小的元组）和一个dtype（一个用于说明数组数据类型的对象）：

In [None]:
# 确定array元素类型
import numpy as np
a = np.array(
[[ 1, 2, 3],
 [ 4, 5, 6]])

a.shape

In [None]:
# 确定array的维度
print(a.ndim)
print(a.shape)

In [None]:
# 确定array的元素数量和元素大小
print(a.size)      # 查看array的元素数量
print(a.itemsize)  # 查看存储每个元素需要的字节数

#### 总结：
1. NumPy 数组中的元素都需要具有相同的数据类型
2. NumPy 数组在创建时具有固定的大小
3. 基于C语言实现，并经过了大量优化的矩阵运算，可以实习高性能的数据处理
4. 常用属性：`shape` \ `ndim` \ `dtype` \ `itermsize` \ `size`

## 创建多维数组

1. 创建数组最简单的办法就是使用`array`函数。<br>它接受一切序列型的对象（包括其他数组），<br>然后产生一个新的含有传入数据的 NumPy 数组。

创建一个一维数组

In [None]:
l1 = [[1.0, 2.0, 3.0], [4.0, 5.0, 6.0]]
arr1 = np.array(l1)
arr1.dtype

In [None]:
data1 = [6.0, 7.5, 8, 0, 1]

In [None]:
arr1 = np.array(data1)
arr1

嵌套序列（比如由一组等长列表组成的列表）将会被转换为一个多维数组：

创建一个二维数组

In [None]:
data2 = [[1, 2, 3, 4], [5, 6, 7, 8]]
arr2 = np.array(data2)
data2

创建一个三维数组

In [None]:
arr3 = np.array([[[0, 1, 1], [1, 0, 1], [1, 1, 0]]])
print(arr3)

除非特别，np.array会尝试为新建的这个数组推断出一个较为合适的数据类型。<br>数据类型保存在一个特殊的dtype对象中。比如说，在上面的两个例子中：

In [None]:
arr1.dtype

In [None]:
arr2.dtype

In [None]:
#  标准的双精度浮点值（即 Python中的float对象）需要占用8字节（即64位）。
#  因此，该类型在NumPy中就记作float64。
arr3 = np.array([1, 2, 3], dtype=np.float64)
arr3.dtype

Numpy 的数据类型有很多, 当前只需要知道你所处理的数据<br>的大致类型是浮点数、复数、整数、布尔值、字符串，<br>还是普通的Python对象即可。

In [None]:
arr = np.array([1, 2, 3, 4, 5])
arr.dtype

In [None]:
float_arr = arr.astype(np.float64)
float_arr.dtype

2. 指定元素填充
    + `np.zeros()`
    + `np.ones()`
    + `np.empty()`    
    + `np.full()`

In [None]:
import numpy as np
np.zeros(5)

In [None]:
np.ones((2, 4), dtype=int)

In [None]:
np.full((3, 5), 13)

注意：
`np.zeros()`
`np.ones()`
`np.empty()`<br>生成的都是浮点类型的数据

+ `np.ones_like()`
+ `np.empty_like()`
+ `np.zeros_like()`

In [None]:
a = np.empty((3, 4))
np.empty_like(a)

参考了已有多维数组形状和数据类型等信息，<br>以指定数值填充的多维数组。

 2. 从值域中创建 array
 + `np.arange()`
 + `np.linspace()`

In [None]:
# np.arange(12)
np.arange(5, 10)
# np.arange(10, 1, -2)

In [None]:
# 生成等间隔数值序列,返回一个包含等间隔数值的数组
np.linspace(0.0, 1.0, num=50)

In [None]:
# 重塑 array，链式调用
np.arange(1, 21).reshape(5, 4)

2. 生成随机数的函数
    + `np.random.randint()`   生成指定范围内的随机整数
    + `np.random.random()`   生成指定范围内的随机浮点数

In [None]:
np.random.randint(0, 20, size=(3, 2, 4))

In [None]:
np.random.random((3, 4))

#### 总结：
+ `np.zeros()` 数字0填充的多维数组
+ `np.ones()` 数字1填充的多维数组
+ `np.empty()` 未格式化的多维数组    
+ `np.full()` 以指定数字填充的多维数组
+ `np.arange().reshape()` 用整数序列生成的多维数组
+ `np.ones_like()` 参照指定多维数组的形状等信息，用1来填充的多维数组
+ `np.empty_like()` 参照指定多维数组的形状等信息，用初始值来填充的多维数组
+ `np.zeros_like()` 参照指定多维数组的形状等信息，用0来填充的多维数组
+ `np.random.randint()` 随机整数填充的多维数组
+ `np.random.random()` 随机浮点数填充的多维数组

## ndarray--坐标轴和维度


In [None]:
import numpy as np

a = np.arange(6).reshape(3, 2)
print(a)

# 计算元素合计值
# np.sum(a)


In [None]:
print(np.sum(a))
print(np.sum(a, axis=0))
print(np.sum(a, axis=1))

使用 `NumPy` 对` ndarray` 进行操作时，如用于计算元素的合计值的`np.sum`函数，计算元素平均值的 `np.average`函数，查找最大值元素的`np.amax`等函数中都可以指定`axis`参数。

什么是维度？<br>
什么是坐标轴？<br>
在函数的参数中指定`axis`会发生什么事情？

### 1. ndarray 的维度

In [None]:
import numpy as np 
# 数组 a 的维度（形状）
a = np.array([[1, 2, 3], [4, 5, 6]])
print(a)

In [None]:
a.ndim  # 维度的数量，相当于 shape 的元素数量

### 2.  关于axis

官网是这么写的 “In NumPy dimensions are called axes”，即维度被称为轴。指定坐标轴的方法是将 axis 对应为shape的索引。

In [None]:
a = np.array([1, 2, 3, 4, 5])
a.shape

In [None]:
# 3*2的矩阵示例
a = np.arange(6).reshape(3, 2)
# a.shape
a

![image.png](attachment:image.png)

In [None]:
# 扩展为 3 维，为了方便理解，创建包含两个 a 的数组
b = np.array([a, a])
b.shape
# b

In [None]:
b

![image.png](attachment:image.png)

### 3. 作为函数参数的axis

例：sum 函数，当参数中指定 axis=0 进行加法运算时，程序会对axis=0的箭头方向上的元素进行加法运算。

In [None]:
b = np.array([a, a])
print(b)

In [None]:
b.sum(axis=1).shape

### 4. 高维数组切片

只需要将各个维度中的切片组合起来，不同维度之间使用逗号进行分隔`[:, :, :]`。

In [None]:
b = np.arange(20).reshape(4, 5) # 4×5的二维数组
print(b)
# 将第1~2行，第2~3列提取出来
# 将第0~1行，第1~4列提取出来


#### 总结：
1. NumPy 中的 `axis` 实际上就是`shape`的索引
2. `shape`表示的是每个维度中元素的个数。


#### 思考：
给定多维数组 `arr`:
```python
arr = np.arange(12).reshape(2, 3, 2)
```
任务：打印`arr`的形状，然后计算沿着不同坐标轴的平均值。
