# 数组元素类型

In [1]:
import numpy as np

## 1. dtype 类型

Numpy 通过数组的 `dtype` 属性来表示数组元素的类型

`dtype` 类型不仅表示数组元素的数据类型, 还表示了存储这些类型所需内存空间的大小和字节序

### 1.1. 类型说明

#### 1.1.1. 内置 `dtype` 类型

Numpy 通过一组常量标识内置了各种数据类型的 `dtype` 值, 内置的 `dtype` 类型字节序为自动匹配本机 CPU, 内置的 `dtype` 常量标识包括:

- `np.int8`
- `np.int16`
- `np.int32`
- `np.int64`
- `np.uint8`
- `np.uint16`
- `np.uint32`
- `np.uint64`
- `np.float16`
- `np.float32`
- `np.float64`
- `np.complex64`
- `np.complex128`
- `np.bool_`
- `np.str_`
- `np.bytes_`
- `np.object_`

#### 1.1.2. `dtype` 类型属性

一个 `dtype` 类型对象包括以下属性:

##### 1.1.2.1. `.name` 属性

`dtype` 对象的 `.name` 属性用于表示该类型的名称, 例如: `np.int64` 的 `.name` 属性是 `'int64'`

##### 1.1.2.2. `.itemsize` 属性

`dtype` 对象的 `.itemsize` 属性用于表示该类型数据占内存字节数, 例如 `np.int32` 的 `.itemsize` 属性为 `4`, 表示该类型数据占据 `4` 个字节内存

##### 1.1.2.3. `.byteorder` 属性

`dtype` 对象的 `.byteorder` 属性表示该类型数据的字节序, 用一个字符表示, 包括:

- `'<'`: Little-Endian (小端字节序)
- `'>'`: Big-Endian (大端字节序)
- `'='`: Native (本机字节序)
- `'|'`: one byte (单字节数据, 无字节序)

##### 1.1.2.4. `.kind` 属性

`dtype` 对象的 `.kind`: 该类型数据的类型标识, 用一个字符表示, 包括:

- `i` 表示整肃
- `u` 表示无符号整肃
- `f` 表示浮点数
- `c` 表示复数
- `b` 表示布尔值
- `U` 表示 Unicode 字符串
- `S` 表示字节串
- `O` 表示对象

##### 1.1.2.5. `.alignment` 属性

`dtype` 对象的 `.alignment` 属性表示该类型数据存储在内存中的字节对齐大小, 可取值为 `1`, `2`, `4`, `8` 或 `16`

##### 1.1.2.6. `.char` 属性

`dtype` 对象的 `.char` 属性表示该类型的名称标识, 用一个字符标识, 包括:

- `b` 表示 8 位有符号整数
- `h` 表示 16 位有符号整数
- `i` 表示 32 位有符号整数
- `l` 表示 64 位有符号整数
- `B` 表示 8 位无符号整数
- `H` 表示 16 位无符号整数
- `I` 表示 32 位无符号整数
- `L` 表示 64 位无符号整数
- `e` 表示 16 位浮点数
- `f` 表示 32 位浮点数
- `d` 表示 64 位浮点数
- `g` 表示 128 位浮点数
- `F` 表示 64 位复数
- `?` 表示 1 字节布尔值
- `U` 表示 4 字节 Unicode 字符串fu
- `S` 表示 1 字节字节串
- `O` 表示对象

##### 1.1.2.7. `.descr` 属性

`dtype` 对象的 `.descr` 表示该类型数据的描述符, 通过 '字节序' + '类型标识' + '字节数' 组成, 包括:

- `|i1`: 表示 1 字节有符号整数
- `<i2`: 表示 2 字节有符号整数, 小端字节序
- `>i2`: 表示 2 字节有符号整数, 大端字节序
- `=i2`: 表示 2 字节有符号整数, 本机字节序
- `<i4`: 表示 4 字节有符号整数, 小端字节序
- `>i4`: 表示 4 字节有符号整数, 大端字节序
- `=i4`: 表示 4 字节有符号整数, 本机字节序
- `<i8`: 表示 8 字节有符号整数, 小端字节序
- `>i8`: 表示 8 字节有符号整数, 大端字节序
- `=i8`: 表示 8 字节有符号整数, 本机字节序
- ... 其它类型标识符, 以此类推

#### 1.1.3. `dtype` 属性查看

In [2]:
dts = [
    np.int8,
    np.int16,
    np.int32,
    np.int64,
    np.uint8,
    np.uint16,
    np.uint32,
    np.uint64,
    np.float16,
    np.float32,
    np.float64,
    np.float128,
    np.complex64,
    np.complex128,
    np.bool_,
    np.str_,
    np.bytes_,
    np.object_,
]

for dt in dts:
    dt = np.dtype(dt)
    print(
        f"dtype is '{dt.name}', size is '{dt.itemsize}B', kind is '{dt.kind}', alignment '{dt.alignment}', char is '{dt.char}', byteorder is '{dt.byteorder}', describe is '{dt.descr}'"
    )

dtype is 'int8', size is '1B', kind is 'i', alignment '1', char is 'b', byteorder is '|', describe is '[('', '|i1')]'
dtype is 'int16', size is '2B', kind is 'i', alignment '2', char is 'h', byteorder is '=', describe is '[('', '<i2')]'
dtype is 'int32', size is '4B', kind is 'i', alignment '4', char is 'i', byteorder is '=', describe is '[('', '<i4')]'
dtype is 'int64', size is '8B', kind is 'i', alignment '8', char is 'l', byteorder is '=', describe is '[('', '<i8')]'
dtype is 'uint8', size is '1B', kind is 'u', alignment '1', char is 'B', byteorder is '|', describe is '[('', '|u1')]'
dtype is 'uint16', size is '2B', kind is 'u', alignment '2', char is 'H', byteorder is '=', describe is '[('', '<u2')]'
dtype is 'uint32', size is '4B', kind is 'u', alignment '4', char is 'I', byteorder is '=', describe is '[('', '<u4')]'
dtype is 'uint64', size is '8B', kind is 'u', alignment '8', char is 'L', byteorder is '=', describe is '[('', '<u8')]'
dtype is 'float16', size is '2B', kind is 'f',

### 1.2. 创建 `dtype` 对象

通过 `np.dtype` 函数，可以通过字符串的描述字符串创建 `dtype` 类型对象

In [3]:
desc = [
    ("|i1",),
    ("<i2", ">i2"),
    ("<i4", ">i4"),
    ("<i8", ">i8"),
    ("|u1",),
    ("<u2", ">u2"),
    ("<u4", ">u4"),
    ("<u8", ">u8"),
    ("<f2", ">f2"),
    ("<f4", ">f4"),
    ("<f8", ">f8"),
    ("<c8", ">c8"),
    ("<c16", ">c16"),
    ("|b1",),
    ("<U0", ">U0"),
    ("|S0",),
    ("|O",),
]

for ds in desc:
    for d in ds:
        dt = np.dtype(d)
        print(
            f"dtype is '{dt.name}', size is '{dt.itemsize}B', kind is '{dt.kind}', alignment '{dt.alignment}', char is '{dt.char}', byteorder is '{dt.byteorder}', describe is '{dt.descr}'"
        )
    print("-----")

dtype is 'int8', size is '1B', kind is 'i', alignment '1', char is 'b', byteorder is '|', describe is '[('', '|i1')]'
-----
dtype is 'int16', size is '2B', kind is 'i', alignment '2', char is 'h', byteorder is '=', describe is '[('', '<i2')]'
dtype is 'int16', size is '2B', kind is 'i', alignment '2', char is 'h', byteorder is '>', describe is '[('', '>i2')]'
-----
dtype is 'int32', size is '4B', kind is 'i', alignment '4', char is 'i', byteorder is '=', describe is '[('', '<i4')]'
dtype is 'int32', size is '4B', kind is 'i', alignment '4', char is 'i', byteorder is '>', describe is '[('', '>i4')]'
-----
dtype is 'int64', size is '8B', kind is 'i', alignment '8', char is 'l', byteorder is '=', describe is '[('', '<i8')]'
dtype is 'int64', size is '8B', kind is 'i', alignment '8', char is 'l', byteorder is '>', describe is '[('', '>i8')]'
-----
dtype is 'uint8', size is '1B', kind is 'u', alignment '1', char is 'B', byteorder is '|', describe is '[('', '|u1')]'
-----
dtype is 'uint16', 

## 2. `dtype` 类型数据

### 2.1. 数值类型数据

在创建 Numpy 数组时, 整数元素数组默认为 `int64` 类型, 浮点数元素数组默认为 `float64` 类型, 可以通过 `dtype` 参数指定明确的元素类型

可以通过数组对象的 `.astype` 方法将数组的元素类型转换为指定的类型, 返回指定元素类型的新数组

In [4]:
a = np.array([1, 2, 3])
print(f"a = {a}, describe: '{a.dtype.descr[0][1]}', size: '{a.nbytes}'")

a = a.astype(np.float64)
print(f"a = {a}, describe: '{a.dtype.descr[0][1]}', size: '{a.nbytes}'")

a = a.astype('>u8')
print(f"a = {a}, describe: '{a.dtype.descr[0][1]}', size: '{a.nbytes}'")

a = [1 2 3], describe: '<i8', size: '24'
a = [1. 2. 3.], describe: '<f8', size: '24'
a = [1 2 3], describe: '>u8', size: '24'


### 2.2. 其它类型数据

#### 2.2.1. 布尔类型

在创建 Numpy 数组时, 布尔类型元素数组默认为 `bool_` 类型

如果将数值类型数组强制转换为布尔类型数组, 则数组中的非 `0` 元素会被转换为 `True`, `0` 元素会被转换为 `False`

如果将字符串类型数组强制转换为布尔类型数组, 则数组中的非空元素会被转换为 `True`, 空元素会被转换为 `False`

In [None]:
a = np.array([False, True, False, False])
print(f"a = {a}, describe: '{a.dtype.descr[0][1]}', size: '{a.nbytes}'")

a = np.array([0, 1, 0, 2], dtype=np.bool_)
print(f"a = {a}, describe: '{a.dtype.descr[0][1]}', size: '{a.nbytes}'")

a = [False  True False False], describe: '|b1', size: '4'
a = [False  True False  True], describe: '|b1', size: '4'


#### 2.2.2. 字符串类型

In [7]:
a = np.array(['AAA', 'BBB', 'CCC'])
print(f"a = {a}, describe: '{a.dtype.descr[0][1]}', size: '{a.nbytes}'")

a = ['AAA' 'BBB' 'CCC'], describe: '<U3', size: '36'
