# 数据类型 & 特性

Python 中标准数据类型包括数字类型、字符串（`str`）、元组（`tuple`）、列表（`list`）、集合（`set`）、字典（`dict`）以及一个特殊的类型 `NoneType`。

数字类型是由整型（`int`），浮点型（`float`）和复数类型（`complex`）组成的。

`NoneType` 类型只有一个对象 `None`，代表空值。


In [102]:
# 使用 type 方法可以查看一个对象的类型
type(None)

NoneType

## 数据特性

数据特性是指数据本身的属性或特点。


### 可变与不可变性

- 可变性是指对象可以在原内存地址上进行就地修改，而不需要重新分配内存。

  列表、集合和字典都是可变对象类型。

- 不可变性是指对象保持着固定的值，无法通过任何操作来改变其状态。

  数字、字符串和元组都是不可变对象类型。

> 可变对象和不可变对象在进行复制操作时表现不同。请看 [深拷贝 & 浅拷贝]('./copy.ipynb')

> 通过 `id` 方法可获得对象的内存标识。


In [103]:
# 对列表变量 b 在原内存地址上进行元素增加
b = []

print(id(b))

b.append(1)

print(id(b))

4402982208
4402982208


### 可哈希性

可哈希是指对象在其生命周期中状态保持不变。生命周期指的是对象存在的时间段，从对象的创建到销毁的整个过程。

简单来说，可哈希对象从创建到销毁都是不可变的。显然，不可变对象都是可哈希的。

> 通过 `hash` 方法可获取可哈希对象的哈希值。


In [104]:
hash("foo")

6717373325313123974

#### 自定义可哈希对象类

> 内置方法 `repr` 返回一个对象的字符串表示形式。


In [105]:
class CustomHashable:
    def __init__(self, value):
        self.value = value

    def __hash__(self):
        if self.value.__hash__:
            return self.value.__hash__()
        else:
            # 方法 hash 只接收不可变对象，因此把 value 转为字符串
            return hash(repr(self.value))


obj = CustomHashable([1, 2, 3])

hash(obj)

-5603055806371908543

### 可迭代性

可迭代是指对象可被迭代器遍历。

字符串、元组、列表、集合和字典都是可迭代的。

详细介绍看[迭代器 & 可迭代对象 & 生成器]('./iterator_generator.ipynb')


## 类型划分

按照特性与共性，划分数据类型。


### 序列类型

序列类型是一种包含多个元素的数据类型，这些元素按照一定的顺序排列。

字符串、元组、列表都是序列类型。

序列类型的一些共同特性：

- 可迭代

- 索引访问

  可以使用索引来访问序列中的元素。可以使用正整数和负整数来访问元素，其中正整数索引从左往右从 0 递增，负整数索引从右往左从 -1 递减。

- 切片操作

  可以通过切片操作获取序列的子序列。切片操作使用 `[start:stop:step]` 的形式，表示从索引 `start` 开始（闭），到索引 `stop` 结束（开），步长为 `step`。


- 元素查找

> `index` 方法可查找序列类型中特定元素第一次出现的索引。如果要查找的元素不存在，引发 `ValueError` 异常。


In [106]:
[1, 2].index(1)

0

- 可拼接（`+`）、可重复（`*`）


In [107]:
# 字符串先重复后拼接
"foo" * 2 + "bar"

# 列表先重复后拼接
[1, 2] * 2 + [3, 4]

[1, 2, 1, 2, 3, 4]

- 可计数


In [108]:
"foo".count("o")

[1, 2, 3].count(1)

1

### 容器类型

容器类型是可容纳多个元素的对象的数据类型。

元组、列表、集合和字典都是容器类型。

序列类型除了字符串都是容器类型，字符串虽不算容器类型，但它却支持很多容器类型的特性。

容器类型的一些共同特性（以下特性字符串同样支持）：

- 可迭代


- 长度

  通过内置方法 `len` 获取对象长度。


In [109]:
len({"a": 1, "b": 2})

2

- 包含性检查

  使用 `in` 和 `not in` 操作符来检查容器中是否包含某个特定元素。


In [110]:
1 in {1, 2, 3}

True

- 最大/最小值


In [111]:
min({"a": 1, "b": 2})

'a'

In [112]:
max({"a": 1, "b": 2})

'b'