## 常用数据结构之**元组**
***
之前介绍的Python中的列表，是一种容器型的数据类型，通过列表类型的变量，可以保存多个数据并通过循环实现对数据的批量操作。Python中还有其它容器型的数据类型，本节主要介绍**元组**

### 元组的定义和运算
在Python语言中，无级也是多个元素按照一定顺序构成的序列。
> 元组和列表的不同之处在于，**元组是不可变类型**。

这就意味着元组类型的变量一旦定义，其中的元素不能再添加或删除，而且元素的值也不能修改。如果试图修改元组中的元素，将引发`TypeError`错误，导致程序崩溃。
> 定义元组通常使用形如`(x, y, z)`的字面量语法，元素支持的运算符跟列表是一样的。

In [12]:
# 定义一个三元组
t1 = (35, 12, 98)
# 定义一个四元组
t2 = ('陈章齐', 29, True, '江苏南京')

# 查看变量类型
print(type(t1), end = ' ') # <class 'tuple'>
print(type(t2)) #

# 查看元组中的元素的数量
print(len(t1), end = ' ') # 3
print(len(t2)) # 4

# 索引运算
print(t1[0]) # 35
print(t1[2]) # 98
print(t2[-1]) # 江苏南京

# 切片运算
print(t2[:2]) # (‘陈章齐’， 29)
print(t2[:0]) # ()
print(t2[::3]) # ('陈章齐', '江苏南京')

# 循环遍历元组中的元素
for ele in t1:
    print(ele, end = ' ') # 35 12 98 这一部分是不带括号的，只输出了元组中的元素
print()
print(t1) # (35, 12, 98)

# 成员运算
print(12 in t1) # Ture
print(99 in t1) # False
print('Hao' not in t2) # True

# 拼接运算
t3 = t1 + t2
print(t3) # (35, 12, 98, '陈章齐', 29, True, '江苏南京')

# 比较运算
print(t1 == t3) # False
print(t1 >= t3) # False
print(t1 <= (35, 11, 99)) # False

<class 'tuple'> <class 'tuple'>
3 4
35
98
江苏南京
('陈章齐', 29)
()
('陈章齐', '江苏南京')
35 12 98 
(35, 12, 98)
True
False
True
(35, 12, 98, '陈章齐', 29, True, '江苏南京')
False
False
False


一个元组中如果有两个元素，称之为二元组；一个元组中如果有五个元素，称之为五无组。`()`表示空元组，但是如果元组中只有一个元元，则需要加上一个逗号，否则`()`就不再是代表元组字面量的语法，而是改变运算优先组的圆括号，所以`('hello', )`和`(100, )`才是一元组，而`('hello')`和`(100)`只是字符串和整数。可以通过以下代码时行验证

In [17]:
a = ()
print(f'{type(a) = }') # type(a) = <class 'tuple'>

b = ('hello')
print(f'{type(b) = }') # type(b) = <class 'str'>

c = ('hello', )
print(f'{type(c) = }') # type(c) = <class 'tuple'>

d = (100)
print(f'{type(d) = }') # type(d) = <class 'int'>

e = (100, )
print(f'{type(e) = }') # type(e) = <class 'tuple'>

type(a) = <class 'tuple'>
type(b) = <class 'str'>
type(c) = <class 'tuple'>
type(d) = <class 'int'>
type(e) = <class 'tuple'>


### 打包和解包操作
当我们把多个逗号分隔的值赋给一个变量时，多个值会打包成一个元组类型；当我们把一个元组赋值组多个变量时，元组会解包成多个值然后分别赋给对应的变量，如下面的代码所示。

In [20]:
# 打包操作
a = 1, 10, 100
print(f'{a = }') # a = (1, 10, 100)
print(f'{type(a) = }') # type(a) = <class 'tuple'>

# 解包操作
i, j ,k = a
print(i, j, k) # 1 10 100
print(f'{i = }, {j = }, {k = }') # i = 1, j = 10, k = 100
print(f'{type(i) = }') # type(i) = <class 'int'>

a = (1, 10, 100)
type(a) = <class 'tuple'>
1 10 100
i = 1, j = 10, k = 100
type(i) = <class 'int'>


> 说明：如果解包出来的元素个数和变量个数不对应，会引发`ValueError`异常，错误信息为: `too many values to unpack` 或 `not enough valuse to unpack`.

In [23]:
a = 1, 10 ,100, 1000
# i, j, k = a # ValueEooro: too many values to unpack (expected 3)
# i, j, k, m, n = a # ValueError: not enough values to unpack (expected 5, got 4)

有一种解决变量个数少于元素的个数方法，就是使用**星号表达式**。通过星号表达式，可以让一个变量接收多个值。但需要注意两点：\
1） 首先，用星号表达式修饰的变量会变成一个**列表**，列表中有0个或多个元素；\
2） 其次，在解包语法中，星号表达式只能出现一次。


In [31]:
a = 1, 10, 100, 1000

i, j, *k = a
print(f'{i = }, {j = }, {k = }') # a = 1, 10, 100, 1000

i, *j, k = a
print(f'{i = }, {j = }, {k = }') # i = 1, j = [10, 100], k = 1000

*i, j, k = a
print(f'{i = }, {j = }, {k = }') # i = [1, 10], j = 100, k = 1000

*i, j = a
print(f'{i = }, {j = }') # i = [1, 10, 100], j = 1000

i, *j = a
print(f'{i = }, {j = }') # i = 1, j = [10, 100, 1000]

i, j, k, *l = a
print(f'{i = }, {j = }, {k = }, {l = }') # i = 1, j = 10, k = 100, l = [1000]

i, j, k, l, *m = a
print(f'{i = }, {j = }, {k = }, {l = }, {m = }') # i = 1, j = 10, k = 100, l = 1000, m = []

i = 1, j = 10, k = [100, 1000]
i = 1, j = [10, 100], k = 1000
i = [1, 10], j = 100, k = 1000
i = [1, 10, 100], j = 1000
i = 1, j = [10, 100, 1000]
i = 1, j = 10, k = 100, l = [1000]
i = 1, j = 10, k = 100, l = 1000, m = []


> 说明：解包语法对所有的序列都成立，这意味着之前的列表，`range`函数构造的范围序列甚至字符串都可以使用解包语法

In [38]:
a, b, *c = range(1,10)
print(range(1, 10)) # range(1, 10)
print(list(range(1, 10))) #[1, 2, 3, 4, 5, 6, 7, 8, 9]
print(f'{a = }, {b = }, {c = }') # a = 1, b = 2, c = [3, 4, 5, 6, 7, 8, 9]

a, b, c = [1, 10, 100]
print(f'{a = }, {b = }, {c = }') # a = 1, b = 10, c = 100

a, *b, c = [1, 10, 100]
print(f'{a = }, {b = }, {c = }') # a = 1, b = [10], c = 100

a, b, *c = 'hello'
print(f'{a = }, {b = }, {c = }') # a = 'h', b = 'e', c = ['l', 'l', 'o']

range(1, 10)
[1, 2, 3, 4, 5, 6, 7, 8, 9]
a = 1, b = 2, c = [3, 4, 5, 6, 7, 8, 9]
a = 1, b = 10, c = 100
a = 1, b = [10], c = 100
a = 'h', b = 'e', c = ['l', 'l', 'o']


### 交换变量的值
 交换变量的值是写代码时经常乃至的一个操作，但是在很多编程语言中，变换两个变量的值都需要借助一个中间变量才能够做到，如果不用中间变量就需要使用比较晦涩的位运算来实现。在Python中，交换两个变量`a`和`b`的值只需要使用如下所示的代码：

In [39]:
a , b = 1, 2
print(f'{a = }, {b = }') # a = 1, b = 2
a, b = b, a
print(f'{a = }, {b = }') # a = 2, b = 1

a = 1, b = 2
a = 2, b = 1


同理，如果要将三个变量`a`、`b`、`c`的值互换，即b的值赋给`a`，`c`的值赋给`b`，`a`的值赋给`c`，也可以如法炮制。

In [40]:
a, b, c = (1, 10, 100)
print(f'{a = }, {b = }, {c = }') # a = 1, b = 10, c = 100

a, b, c = b, c, a
print(f'{a = }, {b = }, {c = }') # a = 10, b = 100, c = 1

a = 1, b = 10, c = 100
a = 10, b = 100, c = 1


需要说明的是，上面的操作并没有用到打包和解包语法，Python 的字节码指令中有`ROT_TWO`和`ROT_THREE`这样的指令可以直接实现这个操作，效率是常高的。但是如果有多于三个变量的值要依次互换，这个时候是没有直接可用的字节码指令的，需要通过打包解包的方式来完成变量之间值的交换。



In [42]:
elements = (1, 10, 100, 1000, 10000)
a, b, c, d, e = elements
print(f'{a = }, {b = }, {c = }, {d = }, {e = }') # a = 1, b = 10, c = 100, d = 1000, e = 1000

e, a, b, c, d = elements
print(f'{a = }, {b = }, {c = }, {d = }, {e = }') # a = 10, b = 100, c = 1000, d = 10000, e = 1

a = 1, b = 10, c = 100, d = 1000, e = 10000
a = 10, b = 100, c = 1000, d = 10000, e = 1


### 元组和列表的比较
这里还有一个非常值得讨论的问题，Python中已经有了列表的类型，为什么还需要元组这样的类型？\
1. 元组是不可变类型，**不可变类型更适合多线程环境**，因为它降低了并发访问变量的同步化开销。这一点在后续并发编程时进行学习；
2. 元是不可变类型，通常**不可变类型在创建时间上优于对应的可变类型**。可以使用`timeit`模块的`timeit`函数来看看创建保存相同元素的元组和列表各自花费的时间，`timeit`函数的`number`参数表示代码执行的次数。下面的代码中，分别创建和保存`1`到`9`的整数的列表和元组，每个操作执行`1000,0000`次，统计运行时间。

In [49]:
import timeit

# print('%.3f 秒' % timeit.timeit('[1, 2, 3, 4, 5, 6, 7, 8, 9]', number = 100000000)) # 4.675s
# print('%.3f 秒' % timeit.timeit('(1, 2, 3, 4, 5, 6, 7, 8, 9)', number = 100000000)) # 0.532s

a = timeit.timeit('[1, 2, 3, 4, 5, 6, 7, 8, 9]', number = 100000000)
b = timeit.timeit('(1, 2, 3, 4, 5, 6, 7, 8, 9)', number = 100000000)
print('%.3f s' % a)
print('%.3f s' % b)
ratio = a / b
print(f'在创建和保存元素的效率上，元组执行效率是列表的{ratio = :.1f}倍 ')

4.614 s
0.531 s
在创建和保存元素的效率上，元组执行效率是列表的ratio = 8.691倍 


当然，Python中的元组和列表类型是可以相互转换的，可以通过下面的代码来完成操作。

In [51]:
infos = ('陈章齐', 29, True, '江苏南京')
# 将元组转换成列表
print(list(infos)) # infos = ('陈章齐', 29, True, '江苏南京')

frts = ['apple', 'banana', 'orange']
# 将列表转换成元组
print(tuple(frts)) # ('apple', 'banana', 'orange')

['陈章齐', 29, True, '江苏南京']
('apple', 'banana', 'orange')


### 总结
**列表和元组都是容器型的数据类型**，即一个变量可以保丰多个数据而且它们都是按一定顺序组织元素的有序容器。**列表是可变数据类型，元组是不可变数据类型**，所以列表可以添加元素、删除元素、清空元素、排序反转，但这些操作对元组来说是不成立的。列表和元组都可以支持接**拼接运算、成员运算、索引运算、切片运算**等操作，之后的字符串也支持这些运算，因为字符串就是字符按一定顺序构成的序列，这一点上三者并没有什么区别。**推荐使用列表的生成语法来创建列表**，它不仅好用而且效率也高，是Python语言中非常有特色的语法。