# 数据类型

## 数字类型

数字类型是**不可变类型**, 一旦类型的值有所改变, 那就变成了全新的对象. 如下所示, 当`a = 2`时, a的地址发生了改变

In [132]:
a = 1
print(id(a))
a = 2
print(id(a))

140736757302944
140736757302976


### 整数

Python在初始化环境的时候就会在内存中自动划分一块空间, 专门用于整数对象的存取

Python初始化的时候会自动建立了一个小**整数对象池**, 方便调用避免后期重复生成, 范围从-5~256. 比如说整数10, 即使没有被创建出来, Python其实在后台已经被创建出来了. 小整数对象池的作用就是, 平时会频繁使用这个范围的整数, 如果每需要一个就创建一个, 会增加很多开销

还有一个**大整数对象池**, 范围就是除**小整数对象池**之外, Python提供了一块内存空间供大整数轮流使用. **大整数对象池**使用的是链表组织, 即使两个变量是相同的值, 但在链表中却是两个不同的节点, 所以实际上是两个对象

Python还有整数缓冲区的概念, 刚被删除的整数不会被真正立刻删除回收, 而是会在后台缓冲一段时间, 等待下一次的可能调用

In [133]:
# 小整数对象池
a = 256
b = 256
print(a is b)
# 大整数对象池
c = 257
d = 257
print(c is d)

True
False


In [134]:
# 数字类型转换
x = 2.23
y = 10
z = 5
z2 = 6
# int(x): 将x转换为一个整数, 如果x是一个浮点数, 则截取小数部分
print(int(x))
# float(x): 将y转换为一个浮点数
print(float(y))
# complex(x): 将x转换为一个复数, 实数部分为x, 虚数部分为0
print(complex(z))
# complex(x, y): 将x和y转换到一个复数, 实数部分为x, 虚数部分为y
print(complex(z, z2))

2
10.0
(5+0j)
(5+6j)


### 布尔类型

最简单的就是`True`和`False`, 常用的`bool()`进行判断, 比较特殊的是`None`, `None`不是布尔类型, 而是`NoneType`

### 序列

Python的序列包含:
* 字符串
* 列表
* 元组
* 字典
* 集合

#### 列表

其实就是数组, 索引为key, 元素为value. Python的列表是一个*有序可重复*的元素集合, 可以进行嵌套, 迭代, 修改, 分片, 追加, 删除, 成员判断

从数据结构上看, Python的列表是一个可变长度的*顺序存储结构*, 每一个块内存储的实际上是指针

`alist = [1, "a", [11, 22], {"k1" : "v1"}]`

![list.png](image/list.png)

alist[0]的值确实是1, 但在内存中存储的实际上是一个指针, 指针指向存储数字1的内存空间

##### 列表的基本操作

In [135]:
# 创建, 可以多层嵌套, 列表内的元素可以是不同类型
list1 = [1, 2, 3]
list1 = [1, "a", [11, 22], {"k1" : "v1"}]
list1 = [1, 2, [3, 4]]

# 访问, 直接通过索引来访问元素
list2 = ["a", "b", "c"]
print(list2[1])
# 修改, 直接重新赋值即可
list2[0] = "d"
print(list2)
# 删除元素
# del
del list2[0]
print("删除list2[0]: ", list2)
# 删除指定元素, remove(element)
list2.remove("b")
print("删除元素b: ", list2)
# 通过弹出栈顶元素的方式删除元素
list2.pop()
print("弹出栈顶元素: ", list2)

# 合并两个列表
l1 = [1, 2, 3]
l2 = [4, 5, 6]
print(l1 + l2)
# 列表的元素重复出现
print([1] * 4)


b
['d', 'b', 'c']
删除list2[0]:  ['b', 'c']
删除元素b:  ['c']
弹出栈顶元素:  []
[1, 2, 3, 4, 5, 6]
[1, 1, 1, 1]


In [136]:
s = [1, 4, 9, 16, 25]
# 返回列表元素个数
print(len(s))
# 返回列表元素最大值
print(max(s))
# 返回列表元素最小值
print(min(s))
# 将其他类型的序列转换成列表
s2 = (1, "a", "b", 2)
print(list(s2))

5
25
1
[1, 'a', 'b', 2]


##### 切片

切片的语法: `list[start : end]`, 其中省略start表示以0开始, 省略end表示到列表的结尾, 范围区间为左闭右开

切片并不会影响原来的列表, 而是将切片下来的结果保存到新的变量中; 如果提供的是负数下标, 则从列表的最后开始往头部查找, 例如-1表示最后一个元素, -3表示倒数第三个元素

切片过程也可以设置步长, 例如`list[3:9:2]`, 从3~8, 步长为2

In [137]:
a = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
print(a[3 : 6])
# 从头到第六个元素
print("从头到第六个元素: ", a[:7])
# 从第二个元素到最后
print("从第二个元素到最后: ", a[2:])
# 从头到尾
print("从头到尾: ", a[:])
# 取最后一个元素
print("取最后一个元素: ", a[-1])
# 取倒数第三个元素
print("取倒数第三个元素: ", a[-3])
# 从倒数第五个元素到最后一个元素
print("从倒数第五个元素到最后一个元素: ", a[-5:])
# 从第一个元素到第八个元素, 步长为2
print("从第一个元素到第八个元素, 步长为2: ", a[1:8:2])

[4, 5, 6]
从头到第六个元素:  [1, 2, 3, 4, 5, 6, 7]
从第二个元素到最后:  [3, 4, 5, 6, 7, 8, 9, 10]
从头到尾:  [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
取最后一个元素:  10
取倒数第三个元素:  8
从倒数第五个元素到最后一个元素:  [6, 7, 8, 9, 10]
从第一个元素到第八个元素, 步长为2:  [2, 4, 6, 8]


In [138]:
# 多维列表
a = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
print(a[0][1])
b = [[1,2,3],[4,5,6],[7,8,9],{"k1":"v1"}]
print(b[3]["k1"])

2
v1


In [139]:
# 列表的遍历
a = [1, 2, 3, 4, 5, 6]
# 遍历每一个元素
for i in a:
    print(i)

# 遍历列表的下表, 通过下标取值
# range()也是左闭右开, 返回的是一个可迭代对象
for i in range(len(a)):
    print(i, a[i])

1
2
3
4
5
6
0 1
1 2
2 3
3 4
4 5
5 6


##### 列表的内置

In [140]:
list1 = ["a", "b", "c", "d"]
# 在列表末尾添加新的对象
list1.append("A")
print(list1)
# 统计某一元素在列表出现的频率次数
appearance1 = list1.count("a")
print("a在列表list1出现的次数: ", appearance1)
# 在列表末尾一次性追加另一个列表的多个值
list1.extend(["a", "b"])
print(list1)
# 在列表中找出某个值第一个匹配项的索引位置
appearance2 = list1.index("a")
print("a在list1第一次出现的索引: ", appearance2)
# 将某对象按照指定索引位置插入列表, 原索引及其后面的元素依次后移一位
list1.insert(3, "E")
print(list1)
# 移除列表中某一元素(默认是最后一个), 并返回该元素的值
print(list1.pop())
print(list1.pop(4))
print(list1)
# 反转列表
list1.reverse()
print(list1)
# 复制列表(浅拷贝)
newlist1 = list1.copy()
print(newlist1)
# 清空列表, 只清空列表内容, 但还是在内存当中存在该列表
# 如果想要在内存当中直接清楚该列表, 使用del
newlist1.clear()
print(newlist1)

['a', 'b', 'c', 'd', 'A']
a在列表list1出现的次数:  1
['a', 'b', 'c', 'd', 'A', 'a', 'b']
a在list1第一次出现的索引:  0
['a', 'b', 'c', 'E', 'd', 'A', 'a', 'b']
b
d
['a', 'b', 'c', 'E', 'A', 'a']
['a', 'A', 'E', 'c', 'b', 'a']
['a', 'A', 'E', 'c', 'b', 'a']
[]


##### 列表的堆栈和队列用法

堆栈先进后出, 所以以表头为栈底, 表尾为栈顶

列表实现队列的效率并不是很高, 通常使用`queue.Queue`作为单项队列, 使用`collections.deque`作为双向队列

In [141]:
# 模拟堆栈的出栈和入栈
stack = [3, 4, 5]
stack.append(6)
stack.append(7)
print(stack)
stack.pop()
print(stack)

[3, 4, 5, 6, 7]
[3, 4, 5, 6]


#### 元组

元组与列表不同, 使用的是(), 而非列表的[]; 元组是一种*不可变序列*, 内容不可被改变

In [142]:
tup1 = ()
# 创建只含有一个元素的元组时, 要在元素的后面加上逗号
tup1 = (50, )
tup1 = ("physical", "chemistry", 1997, 2000)
tup2 = (1, 2, 3, 4, 5)
tup = (1, 2, 3, 4)
print(tup1)
print(tup2)
print(tup[2])
tup[3] = "a"
print(tup)

('physical', 'chemistry', 1997, 2000)
(1, 2, 3, 4, 5)
3


TypeError: 'tuple' object does not support item assignment

不可变的特性很适合存储那些不能被修改的数据, 例如主机地址和端口号, 两者捆绑在一起, 不允许被修改

但元组的不可变性只能保证其一级子元素不可变, 对于嵌套的元素内部, 不保证不可变

In [None]:
tup = ("a", "b", ["A", "B"])
tup[2][0] = "X"
tup[2][1] = "Y"
print(tup)

所以在使用元组的时候尽量使用数字, 字符串和元组这种不可变的数据类型作为元组的元素, 如果使用列表作为元组的元素, 其实还是能被修改的

#### 字符串

字符串是**不可变**的序列数据类型, 不过虽然不可变, 但是列表中其他比如索引切片等等操作都可以实现

In [1]:
# 和Java相同, 可以使用+拼接字符串, 同样的不建议使用
a = "Hello"
b = " World"
print(a + b)
print(a[1])
a.capitalize()

Hello World
e


'Hello'

[字符串常用的内置方法](https://docs.python.org/zh-cn/3.8/library/stdtypes.html#string-methods)

#### 字典

字典的查询和插入操作比较快, 其中字典的value可以是任何数据类型, 但是字典的key必须是不可变对象, 例如整数, 字符串, bytes和元组; 实际应用中使用字符串作为key的情况更多一些

从Python 3.6开始, 字典要是有序的, 顺序会保持元素插入时的先后顺序

字典是**不定长, 可变, 散列**的集合类型, 字典元素在内存中的存储方式是**不连续**的

##### 创建字典

In [144]:
dic = {"Alice" : "2341", "Beth" : "9102", "Cecil" : "3258"}
dic

{'Alice': '2341', 'Beth': '9102', 'Cecil': '3258'}

In [145]:
dict([("sape", 4139), ("guido", 4127), ("jack", 4098)])

{'sape': 4139, 'guido': 4127, 'jack': 4098}

In [146]:
dict(sape = 4139, guido = 4127, jack = 4098)

{'sape': 4139, 'guido': 4127, 'jack': 4098}

##### 访问字典

In [148]:
# 字典没有切片这个说法, 一般通过访问key的方式获取value
dic = {'Name': 'Jack','Age': 7, 'Class': 'First'}
print("dic['Name']: ",dic["Name"])
print("dic['Age']: ", dic["Age"])
# 如果访问的key不存在, 则抛出异常

dic['Name']:  Jack
dic['Age']:  7


##### 增删改

In [156]:
# 增加新的键值对
dic = {'Name': 'Jack','Age': 7, 'Class': 'First'}
dic["address"] = "shanghai"
print(dic)
# 修改已存在的键值对
dic["address"] = "Beijing"
dic["Age"] = 18
print(dic)
# 统计字典内的键值对个数
print("字典内键值对个数为: %d" % len(dic))


{'Name': 'Jack', 'Age': 7, 'Class': 'First', 'address': 'shanghai'}
{'Name': 'Jack', 'Age': 18, 'Class': 'First', 'address': 'Beijing'}
字典内键值对个数为: 4


In [161]:
dic1 = {"Name": "Jack", "Age": "20", "Class": "First", "Sex": "male"}
# 删除字典元素
del dic1["Name"]
print(dic1)
# 删除字典元素, 其实是弹出指定的键值对, 并返回要删除的value
a = dic1.pop("Class")
print(a)
print(dic1)
# 清空字典, 清空里面的全部的内容, 但字典还是存在的
dic1.clear()
print(dic1)
# 删除字典本身, 包括内容, 结构和所占有的内容
del dic1

{'Age': '20', 'Class': 'First', 'Sex': 'male'}
First
{'Age': '20', 'Sex': 'male'}
{}


##### 遍历字典

In [169]:
dic = {'Name': 'Jack', 'Age': 7, 'Class': 'First'}

# 直接通过key来获取value
for key in dic:
    print(key, dic[key])
print("\n")

# 利用items获取键值对元组(key, value)
for key, value in dic.items():
    print(key, value)
print("\n")

# 通过keys方法来获取键
for key in dic.keys():
    print(key, dic[key])
print("\n")

# 通过values方法获取值, 但无法获取对应的key
for value in dic.values():
    print(value)

Name Jack
Age 7
Class First


Name Jack
Age 7
Class First


Name Jack
Age 7
Class First


Jack
7
First


#### 集合set

set集合是一个**无序不重复**的元素集, 使用的是{}, 如果要创建的一个空集合, 必须使用`set()`, 使用的是{}创建的其实是一个空字典; 集合的核心在于**自动去重**

In [176]:
# 创建set集合
# 也可以使用 s = set([1, 1, 2, 3, 3, 4])
s = {1, 1, 2, 3, 3, 4}
print(s)
s1 = set("it is a nice day")
print(s1)

{1, 2, 3, 4}
{'i', 'n', ' ', 'd', 'y', 't', 'c', 's', 'a', 'e'}


In [183]:
# 添加元素到set, 可以添加重复的元素, 但不会有效
s = {1, 2, 3, 4}
s.add(5)
print(s)
s.add(5)
print(s)
# 将另一个对象更新到已有的集合中, 同样会进行去重
s.update("hello")
print(s)
# 删除指定元素
# remove()方法
s.remove("l")
print(s)
# pop()方法, 无法设置参数, 所以无法删除指定的元素
# 弹出第一个元素
print(s.pop())
print(s)

{1, 2, 3, 4, 5}
{1, 2, 3, 4, 5}
{1, 2, 3, 4, 5, 'l', 'o', 'h', 'e'}
{1, 2, 3, 4, 5, 'o', 'h', 'e'}
1
{2, 3, 4, 5, 'o', 'h', 'e'}


set集合既不支持下标索引, 也不支持字典那样通过key获取value

set集合可以进行交并差集操作

In [189]:
basket = {"apple", "orange", "apple", "pear", "orange", "banana"}
print(basket)

# 检测成员
print("orange" in basket)

a = set('abracadabra')
b = set('alacazam')

# -可以进行差集计算
# 在a中的字母, 但不在b中
print(a - b)
# 在a或b中的字母
print(a | b)
# 在a和b中的字母
print(a & b)
# 在a或b中的字母, 但不同时在a和b中
print(a ^ b)

{'orange', 'banana', 'apple', 'pear'}
True
{'b', 'r', 'd'}
{'d', 'l', 'm', 'c', 'r', 'z', 'a', 'b'}
{'a', 'c'}
{'r', 'd', 'l', 'z', 'm', 'b'}
