# 数据类型 & 特性

Python 中标准数据类型包括数字类型、布尔型（`bool`）、字符串（`str`）、元组（`tuple`）、列表（`list`）、集合（`set`）、字典（`dict`）以及一个特殊的类型 `NoneType`。

数字类型是由整型（`int`），浮点型（`float`）和复数类型（`complex`）组成的。

`NoneType` 类型只有一个对象 `None`，代表空值。


In [27]:
# 使用 type 方法可以查看一个对象的类型
type(None)

NoneType

## 数据特性

数据特性是指数据本身的属性或特点。


### 可变与不可变性

- 可变性是指对象可以在原内存地址上进行就地修改，而不需要重新分配内存。

列表、集合和字典都是可变对象类型。

- 不可变性是指对象保持着固定的值，无法通过任何操作来改变其状态。

数字、字符串和元组都是不可变对象类型。

> 可变对象和不可变对象在进行复制操作时表现不同。请看[深拷贝 & 浅拷贝]('./copy.ipynb')

> 通过 `id` 方法可获得对象的内存标识。


In [28]:
# 列表变量 b 在原内存地址上进行了元素增加操作
b = []

print(id(b))

b.append(1)

print(id(b))

4408561664
4408561664


### 可哈希性

可哈希是指对象在其生命周期中状态保持不变。生命周期指的是对象存在的时间段，从对象的创建到销毁的整个过程。

简单来说，可哈希对象从创建到销毁都是不可变的。显然，不可变对象都是可哈希的。

> 通过 `hash` 方法可获取可哈希对象的哈希值。


In [29]:
hash("foo")

6717373325313123974

#### 自定义可哈希对象类

> 内置方法 `repr` 返回一个对象的字符串表示形式。


In [30]:
class CustomHashable:
    def __init__(self, value):
        self.value = value

    def __hash__(self):
        if self.value.__hash__:
            return self.value.__hash__()
        else:
            # 方法 hash 只接收不可变类型，因此把 value 转为字符串
            return hash(repr(self.value))


obj = CustomHashable([1, 2, 3])

hash(obj)

-5603055806371908543

### 可迭代性

可迭代是指对象可被迭代器遍历。

字符串、元组、列表、集合和字典都是可迭代的。

详细介绍看[迭代器 & 可迭代对象 & 生成器]('./iterator_generator.ipynb')


## 类型划分

按照特性与共性，划分数据类型。


### 容器类型

容器类型是可容纳多个元素的对象的数据类型。包括：元组、列表、集合、字典。


### 序列类型

序列类型是一种包含多个元素的数据类型，并且这些元素按照一定的顺序排列。字符串、元组、列表都是序列类型。

序列类型的共同特性：

- 可迭代性

- 可索引性

- 可切片性


#### 序列类型的通用操作：（操作的具体解释写在类型分章节）

假如有两个序列：x，长度为 8，y，长度为 2


- 连接：使用 + 运算符来连接两个序列，生成一个新的序列。

  `x + y` 获得一个长度为 10 的新序列


- 重复：使用 \* 运算符将序列重复指定次数，生成一个新的序列。

  `x * 2` 获得一个由 x 重复两次获得的新序列


- 长度获取：使用 `len` 函数获取序列的长度，即序列中元素的个数。

  `len(x) == 8`


- 索引访问：可使用索引来访问序列中的单个元素。

  获取 x 第 3 个元素：`x[2]`


- 元素位置获取：使用 `index` 方法获取序列中指定元素首次出现的位置。

  如果找不到对应元素，`index` 返回错误 `ValueError`

  x 中数字 4 的索引：`x.index(4)`


- 切片操作：切片操作用于获取序列中的子序列，可以指定起始索引和结束索引（不包括结束索引本身）。使用方括号和冒号 [:] 来实现。

  获取 x 从 2 到 6 的片段：`x[2:7]`
  `[:]` 表示从开始到结尾


- 成员运算：使用 `in` 和 `not in` 运算符来判断某个元素是否存在于序列中。

  判断数字 9 是否在序列 x 中：`9 in x` 或 `9 not in x`


- 迭代：序列可以使用 for 循环进行迭代，依次访问序列中的每个元素。


- 最大值和最小值：使用 `max` 和 `min` 函数分别获取序列中的最大值和最小值。

  x 中最小值：`min(x)`，x 中最大值：`max(x)`


- 元素计数：使用 `count` 函数统计序列中指定元素的出现次数。

  x 中数字 3 出现的次数：`x.count(3)`
