# 数据类型

Python 中标准数据类型包括数字类型、布尔型（`bool`）、字符串（`str`）、元组（`tuple`）、列表（`list`）、集合（`set`）、字典（`dict`）以及一个特殊的类型 `NoneType`。

其中数字类型包括整型（`int`），浮点型（`float`）和复数类型（`complex`）。

按照数据的组织方式我们可以把它们分为两类：

1. 基本类型：表示单个值的数据类型

- 数字类型
- 布尔型
- 字符串

2. 容器类型：表示容纳多个值的数据类型

- 列表
- 集合
- 字典
- 元组

基本类型都是单个值，它们在内存有固定的地址，你无法在同一个地址上对原值进行修改，因此基本类型都是不可变值。


对了，类型 `NoneType` 我们差点忘了说，其实它只有一个对象 `None`，代表空值。


In [3]:
# 使用 type 方法可以查看一个对象的类型
type(None)

NoneType

### 基本类型


###


## 类型分类


### 按`数据可变性`划分

- 可变（mutable）：可变数据可以在原始对象所在的内存地址上进行修改，而不是创建一个新的对象
  - 包括：列表、集合、字典
- 不可变（immutable）：不可变数据则不可以在原始对象所在的内存地址上直接进行修改
  - 包括：数字、字符串、元组，冻结集合
  - 可哈希对象是不可变对象


In [27]:
# 字符串无法在原内存地址上直接进行修改，只能通过新建对象的方式进行替换

# 两次打印的内存标识不一样
s = "this is a str"
print(id(s))

s = "this is a new str"
print(id(s))

4393962544
4398874752


In [29]:
# 而列表则可以直接在原始对象上进行修改

# 列表 l 新增加了一个元素，但是内存地址并没有改变
l = [1, 2]
print(id(l))

l.append(3)
print(id(l))

4398595584
4398595584


tip: 字典的键必须为不可变数据类型


### 按`序列类型`划分

- 序列类型：元素在内存中连续存储。序列类型可通过索引访问每个元素，且元素可以为不同类型。

  - 包括：字符串、元组、列表

- 非序列类型：元素在内存中非连续存储。非序列类型的元素不可访问，因为它们没有像序列类型那样的索引机制。

  - 包括：数字、集合、字典

#### 序列类型的通用操作：（操作的具体解释写在类型分章节）

假如有两个序列：x，长度为 8，y，长度为 2


- 连接：使用 + 运算符来连接两个序列，生成一个新的序列。

  `x + y` 获得一个长度为 10 的新序列


- 重复：使用 \* 运算符将序列重复指定次数，生成一个新的序列。

  `x * 2` 获得一个由 x 重复两次获得的新序列


- 长度获取：使用 `len` 函数获取序列的长度，即序列中元素的个数。

  `len(x) == 8`


- 索引访问：可使用索引来访问序列中的单个元素。

  获取 x 第 3 个元素：`x[2]`


- 元素位置获取：使用 `index` 方法获取序列中指定元素首次出现的位置。

  如果找不到对应元素，`index` 返回错误 `ValueError`

  x 中数字 4 的索引：`x.index(4)`


- 切片操作：切片操作用于获取序列中的子序列，可以指定起始索引和结束索引（不包括结束索引本身）。使用方括号和冒号 [:] 来实现。

  获取 x 从 2 到 6 的片段：`x[2:7]`
  `[:]` 表示从开始到结尾


- 成员运算：使用 `in` 和 `not in` 运算符来判断某个元素是否存在于序列中。

  判断数字 9 是否在序列 x 中：`9 in x` 或 `9 not in x`


- 迭代：序列可以使用 for 循环进行迭代，依次访问序列中的每个元素。


- 最大值和最小值：使用 `max` 和 `min` 函数分别获取序列中的最大值和最小值。

  x 中最小值：`min(x)`，x 中最大值：`max(x)`


- 元素计数：使用 `count` 函数统计序列中指定元素的出现次数。

  x 中数字 3 出现的次数：`x.count(3)`
