# 数据结构

1. [字符串](#字符串)
2. [序列](#序列)
3. [字典](#字典)

### 字符串

第二次世界大战促使了现代电子计算机的诞生，最初计算机被应用于导弹弹道的计算，而在计算机诞生后的很多年时间里，计算机处理的信息基本上都是数值型的信息。世界上的第一台电子计算机叫ENIAC（电子数值积分计算机），诞生于美国的宾夕法尼亚大学，每秒钟能够完成约5000次浮点运算。随着时间的推移，虽然数值运算仍然是计算机日常工作中最为重要的事情之一，但是今天的计算机处理得更多的数据可能都是以文本的方式存在的，如果我们希望通过Python程序操作本这些文本信息，就必须要先了解字符串类型以及与它相关的知识。

所谓字符串，就是由零个或多个字符组成的有限序列，一般记为${\displaystyle s=a_{1}a_{2}\dots a_{n}(0\leq n \leq \infty)}$。在Python程序中，如果我们把单个或多个字符用单引号或者双引号包围起来，就可以表示一个字符串。

In [None]:
s1 = 'hello, world!'
s2 = "hello, world!"
# 以三个双引号或单引号开头的字符串可以折行
s3 = """
hello, 
world!
"""
print(s1, s2, s3, end='')

可以在字符串中使用\（反斜杠）来表示转义，也就是说\后面的字符不再是它原来的意义，例如：\n不是代表反斜杠和字符n，而是表示换行；而\t也不是代表反斜杠和字符t，而是表示制表符。所以如果想在字符串中表示'要写成\'，同理想表示\要写成\\。可以运行下面的代码看看会输出什么。

In [None]:
s1 = '\'hello, world!\''
s2 = '\n\\hello, world!\\\n'
print(s1, s2, end='')

在\后面还可以跟一个八进制或者十六进制数来表示字符，例如\141和\x61都代表小写字母a，前者是八进制的表示法，后者是十六进制的表示法。也可以在\后面跟Unicode字符编码来表示字符，例如\u9a86\u660a代表的是中文“骆昊”。运行下面的代码，看看输出了什么。

In [None]:
s1 = '\141\142\143\x61\x62\x63'
s2 = '\u9a86\u660a'
print(s1, s2)

如果不希望字符串中的\表示转义，我们可以通过在字符串的最前面加上字母r来加以说明，再看看下面的代码又会输出什么。

In [None]:
s1 = r'\'hello, world!\''
s2 = r'\n\\hello, world!\\\n'
print(s1, s2, end='')

Python为字符串类型提供了非常丰富的运算符，我们可以使用+运算符来实现字符串的拼接，可以使用*运算符来重复一个字符串的内容，可以使用in和not in来判断一个字符串是否包含另外一个字符串（成员运算），我们也可以用[\]和[:]运算符从字符串取出某个字符或某些字符（切片运算），代码如下所示。

In [None]:
s1 = 'hello ' * 3
print(s1) # hello hello hello 
s2 = 'world'
s1 += s2
print(s1) # hello hello hello world
print('ll' in s1) # True
print('good' in s1) # False
str2 = 'abc123456'
# 从字符串中取出指定位置的字符(下标运算)
print(str2[2]) # c
# 字符串切片(从指定的开始索引到指定的结束索引)
print(str2[2:5]) # c12
print(str2[2:]) # c123456
print(str2[2::2]) # c246
print(str2[::2]) # ac246
print(str2[::-1]) # 654321cba
print(str2[-3:-1]) # 45

在Python中，我们还可以通过一系列的方法来完成对字符串的处理，代码如下所示。

In [None]:
str1 = 'hello, world!'
# 通过内置函数len计算字符串的长度
print(len(str1)) # 13
# 获得字符串首字母大写的拷贝
print(str1.capitalize()) # Hello, world!
# 获得字符串每个单词首字母大写的拷贝
print(str1.title()) # Hello, World!
# 获得字符串变大写后的拷贝
print(str1.upper()) # HELLO, WORLD!
# 从字符串中查找子串所在位置
print(str1.find('or')) # 8
print(str1.find('shit')) # -1
# 与find类似但找不到子串时会引发异常
# print(str1.index('or'))
# print(str1.index('shit'))
# 检查字符串是否以指定的字符串开头
print(str1.startswith('He')) # False
print(str1.startswith('hel')) # True
# 检查字符串是否以指定的字符串结尾
print(str1.endswith('!')) # True
# 将字符串以指定的宽度居中并在两侧填充指定的字符
print(str1.center(50, '*'))
# 将字符串以指定的宽度靠右放置左侧填充指定的字符
print(str1.rjust(50, ' '))
str2 = 'abc123456'
# 检查字符串是否由数字构成
print(str2.isdigit())  # False
# 检查字符串是否以字母构成
print(str2.isalpha())  # False
# 检查字符串是否以数字和字母构成
print(str2.isalnum())  # True
str3 = '  jackfrued@126.com '
print(str3)
# 获得字符串修剪左右两侧空格之后的拷贝
print(str3.strip())

我们之前讲过，可以用下面的方式来格式化输出字符串。

In [None]:
a, b = 5, 10
print('%d * %d = %d' % (a, b, a * b))

当然，我们也可以用字符串提供的方法来完成字符串的格式，代码如下所示

In [None]:
a, b = 5, 10
print('{0} * {1} = {2}'.format(a, b, a * b))

Python 3.6以后，格式化字符串还有更为简洁的书写方式，就是在字符串前加上字母f，我们可以使用下面的语法糖来简化上面的代码。

In [None]:
a, b = 5, 10
print(f'{a} * {b} = {a * b}')

## 序列
除了字符串，Python还内置了多种类型的数据结构，如果要在程序中保存和操作数据，绝大多数时候可以利用现有的数据结构来实现，最常用的包括列表、元组、集合和字典。

序列分类：
- 可变序列list
- 不可变序列tuple、str

序列是Python中最基本的数据结构，它支持字符，数字，字符串甚至可以包含列表（即嵌套）
列表用 [ ] 标识，是 python 最通用的复合数据类型。
列表中值的切片也可以用到变量`[头下标:尾下标]`，就可以截取相应的列表，从左到右索引默认 0 开始，从右到左索引默认 -1 开始，下标可以为空表示取到头或尾。
加号 + 是列表连接运算符，星号 * 是重复操作


### 列表

不知道大家是否注意到，刚才我们讲到的字符串类型（str）和之前我们讲到的数值类型（int和float）有一些区别。数值类型是标量类型，也就是说这种类型的对象没有可以访问的内部结构；而字符串类型是一种结构化的、非标量类型，所以才会有一系列的属性和方法。接下来我们要介绍的列表（list），也是一种结构化的、非标量类型，它是值的有序序列，每个值都可以通过索引进行标识，定义列表可以将列表的元素放在[\]中，多个元素用 `,` 进行分隔，可以使用for循环对列表元素进行遍历，也可以使用[]或[:]运算符取出列表中的一个或多个元素。

下面的代码演示了如何定义列表、如何遍历列表以及列表的下标运算。

In [None]:
list1 = [1, 3, 5, 7, 100]
print(list1) # [1, 3, 5, 7, 100]
# 乘号表示列表元素的重复
list2 = ['hello'] * 3
print(list2) # ['hello', 'hello', 'hello']
# 计算列表长度(元素个数)
print(len(list1)) # 5
# 下标(索引)运算
print(list1[0]) # 1
print(list1[4]) # 100
# print(list1[5])  # IndexError: list index out of range
print(list1[-1]) # 100
print(list1[-3]) # 5
list1[2] = 300
print(list1) # [1, 3, 300, 7, 100]
# 通过循环用下标遍历列表元素
for index in range(len(list1)):
    print(list1[index])
# 通过for循环遍历列表元素
for elem in list1:
    print(elem)
# 通过enumerate函数处理列表之后再遍历可以同时获得元素索引和值
for index, elem in enumerate(list1):
    print(index, elem)

In [None]:
list1 = [1, 3, 5, 7, 100]
# 添加元素
list1.append(200)
list1.insert(1, 400)
# 合并两个列表
# list1.extend([1000, 2000])
list1 += [1000, 2000]
print(list1) # [1, 400, 3, 5, 7, 100, 200, 1000, 2000]
print(len(list1)) # 9
# 先通过成员运算判断元素是否在列表中，如果存在就删除该元素
if 3 in list1:
	list1.remove(3)
if 1234 in list1:
    list1.remove(1234)
print(list1) # [1, 400, 5, 7, 100, 200, 1000, 2000]
# 从指定的位置删除元素
list1.pop(0)
list1.pop(len(list1) - 1)
print(list1) # [400, 5, 7, 100, 200, 1000]
# 清空列表元素
list1.clear()
print(list1) # []

和字符串一样，列表也可以做切片操作，通过切片操作我们可以实现对列表的复制或者将列表中的一部分取出来创建出新的列表，代码如下所示。

In [None]:
fruits = ['grape', 'apple', 'strawberry', 'waxberry']
fruits += ['pitaya', 'pear', 'mango']
# 列表切片
fruits2 = fruits[1:4]
print(fruits2) # apple strawberry waxberry
# 可以通过完整切片操作来复制列表
fruits3 = fruits[:]
print(fruits3) # ['grape', 'apple', 'strawberry', 'waxberry', 'pitaya', 'pear', 'mango']
fruits4 = fruits[-3:-1]
print(fruits4) # ['pitaya', 'pear']
# 可以通过反向切片操作来获得倒转后的列表的拷贝
fruits5 = fruits[::-1]
print(fruits5) # ['mango', 'pear', 'pitaya', 'waxberry', 'strawberry', 'apple', 'grape']

下面的代码实现了对列表的排序操作。

In [None]:
list1 = ['orange', 'apple', 'zoo', 'internationalization', 'blueberry']
list2 = sorted(list1)
# sorted函数返回列表排序后的拷贝不会修改传入的列表
# 函数的设计就应该像sorted函数一样尽可能不产生副作用
list3 = sorted(list1, reverse=True)
# 通过key关键字参数指定根据字符串长度进行排序而不是默认的字母表顺序
list4 = sorted(list1, key=len)
print(list1)
print(list2)
print(list3)
print(list4)
# 给列表对象发出排序消息直接在列表对象上进行排序
list1.sort(reverse=True)
print(list1)

#### 生成式和生成器

我们还可以使用列表的生成式语法来创建列表，代码如下所示。

In [None]:
f = [x for x in range(1, 10)]
print(f)
f = [x + y for x in 'ABCDE' for y in '1234567']
print(f)
# 用列表的生成表达式语法创建列表容器
# 用这种语法创建列表之后元素已经准备就绪所以需要耗费较多的内存空间
f = [x ** 2 for x in range(1, 1000)]
print(sys.getsizeof(f))  # 查看对象占用内存的字节数
print(f)
# 请注意下面的代码创建的不是一个列表而是一个生成器对象
# 通过生成器可以获取到数据但它不占用额外的空间存储数据
# 每次需要数据的时候就通过内部的运算得到数据(需要花费额外的时间)
f = (x ** 2 for x in range(1, 1000))
print(sys.getsizeof(f))  # 相比生成式生成器不占用存储数据的空间
print(f)
for val in f:
    print(val)

除了上面提到的生成器语法，Python中还有另外一种定义生成器的方式，就是通过yield关键字将一个普通函数改造成生成器函数。下面的代码演示了如何实现一个生成[斐波拉切数列](https://zh.wikipedia.org/wiki/%E6%96%90%E6%B3%A2%E9%82%A3%E5%A5%91%E6%95%B0%E5%88%97)的生成器。所谓斐波拉切数列可以通过下面递归的方法来进行定义：

$${\displaystyle F_{0}=0}$$

$${\displaystyle F_{1}=1}$$

$${\displaystyle F_{n}=F_{n-1}+F_{n-2}}({n}\geq{2})$$

![5.png](attachment:5.png)

In [None]:
def fib(n):
    a, b = 0, 1
    for _ in range(n):
        a, b = b, a + b
        yield a


def main():
    for val in fib(20):
        print(val)


if __name__ == '__main__':
    main()

#### 克隆列表

如果要修改列表，但是要保留原来列表的一份拷贝，就需要列表自我复制，这过程叫做克隆。克隆的结果是产生两个值一样，但却有不同标识符的列表。克隆的方法是利用列表的片断操作符：

In [None]:
x = [1, 3, 5, 7]
y = x[:]
print(y)

In [None]:
y[0] = 9
print(y)
print(x)
id(x)
id(y)

利用片断操作符，克隆了整个列表。可以清楚的看到，x 和 y 分别代表不同的列表。修改 y 的元素值，不影响 x 列表。

#### 列表嵌套

嵌套的列表是作为另一个列表中的元素。其实列表可以看作是数组，嵌套列表就是多维数组的元素。所以也可以按照下列形式取得元素：

In [None]:
list = [0, [1,2,3], [4,5,6]]
print(list[0])
print(list[1][0])
print(list[1][0],list[1][1],list[1][2])

#### 矩阵

嵌套列表可以代表矩阵

In [None]:
matrix = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]

#### 列表映射

In [None]:
fruit = ['apple', 'orange', 'pear', 'banana']
[fruit + 's' for fruit in fruit]

如果我们只想对满足条件的元素进行处理该怎么办呢？很简单，只要在加上if语句就行了。

In [None]:
[fruit + 's' for fruit in fruit if len(fruit) != 6]

In [None]:
# 判断值是否属于序列
lst = [1,2,3,4,5,6]
a,b = 1,10
print(a in lst)  # a 在 lst 序列中 , 如果 x 在 y 序列中返回 True。
print(b not in lst)  # b 不在 lst 序列中 , 如果 x 不在 y 序列中返回 True。

# 序列链接与重复
lst1 = [1,2,3]
lst2 = ['a','b','c']
print(lst1+lst2)  # "+"：序列的链接
print(lst1*3,lst2*2)  # "*"：序列重复

# 下标索引
lst = [1,2,3,4,5,6,7,8,9,0]
print(lst[0],lst[2],lst[9])  # 索引从0开始，eg lst[2]中，下标索引是2，指向lst的第3个值
print(lst[-1])  # 索引-1代表最后一个值
#print(lst[10])  # 这里一共有10个值，所以最大索引是9

In [None]:
# 切片
lst = [1,2,3,4,5,6,7,8,9,0]
print(lst[2:5])  # 切片可以理解成列表的值区间，且是一个左闭右开区间，这里lst[2:5]代表的区间是：索引2的值 - 索引4的值
print(lst[:5])  # 左边无索引，代表从索引0开始
print(lst[4:])  # 右边无索引，代表以最后一个值结束
print(lst[5:-1])  # 索引5的值 - 倒数第二个值 （切片是右闭区间，注意了）

# 步长
lst = [1,2,3,4,5,6,7,8,9,0]
print(lst[0:5:2])  # List[i:j:n]代表：索引i - 索引j，以n为步长
print(lst[::2])  # 按照2为步长，从第一个值开始截取lst数据
print(lst[1::2])  # 按照2为步长，从第二个值开始截取lst数据

# 序列的基本内置全局函数
lst = [1,2,3,4,5,6,7,8,9,0]
print(len(lst))  # 列表元素个数
print(max(lst),min(lst),sum(lst))  # 返回列表的最大值、最小值、求和，这三个函数都只针对数字的list
print(lst.index(3))  # .index(obj)方法：从列表中找出某个值第一个匹配项的索引位置
lst = [1,1,2,3,3,4,4,4,4,5,6]
print(lst.count(4))  # .count(obj)方法：计算值的出现次数

In [None]:
# 列表的特征
lst1 = [1,2,3,'a','b','c',[1,2,3]]
# 可包含任意类型的对象：数值、字符串、列表等
lst2 = [143,56,894,67,43]
print(lst2[0],lst2[4],lst2[-1])
# 通过下标索引访问序列中的值 → 序列的顺序是不能改变的,通过索引来定位列表的元素
lst3 = [1,2,3]
lst3 = lst3 * 3
print(lst3)
# 可随意变换列表长度，相当于随意指定新的列表
lst4 = [1,2,['a','b']]
# 可嵌套
lst5 = [100,101,102]
lst5[0] = 10
print(lst5)
# 可原位改变

# 列表与生成器
print(range(5),type(range(5)))  
# range()是生成器，指向了一个范围
# range(5)代表指向了0,1,2,3,4这几个值
# range(2,5)代表指向了2,3,4这几个值，注意这里不是使用:
# range(0,10,2)代表指向了0,2,4,6,8这几个值，最后的2代表步长
lst = list(range(5))
print(lst)
# 通过list()函数生成列表

In [None]:
# 可变列表list常用操作 - 添加元素
lst = list(range(10))
lst.append('hello')
print(lst)
# list.append() 添加元素
lst.append(['a','b','c'])
print(lst)
lst.extend(['a','b','c'])
print(lst)
# 添加多个元素用.extend()方法：用新列表扩展原来的列表，注意和append()方法的区别

# 可变列表list常用操作 - 删除元素
lst = ['Jack','Jack','Tom','Tracy','Alex','White']
lst.remove('Jack')
print(lst)
# .remove方法：移除列表中某个值的第一个匹配项
del lst[3:5]
print(lst)
# del语句：删除list的相应索引值
lst.clear()
print(lst)
# 移除所有值

In [None]:
# 可变列表list常用操作 - 插入元素
lst = list(range(10))
print(lst)
lst.insert(3,'a')
print(lst)
# x.insert(i,m)方法：在索引i处插入m，这里索引3代表第四个值
lst.insert(5,[1,2,3])
print(lst)
# 插入一个列表元素

In [None]:
# 可变列表list常用操作 - 复制
lst = list(range(10))
lst1 = lst
lst1[2] = 'hello'
print(lst,lst1)
# lst，lst1指向同一个列表
lst = list(range(10))
lst2 = lst.copy()
lst2[2] = 'hello'
print(lst,lst2)
# list.copy()方法：复制一个新的列表，lst，lst2指向两个列表（虽然两个列表值相同）

In [None]:
# 可变列表list常用操作 - 排序
lst1 = [12,45,32,98,45,66,3]
lst2 = ["asd", "cxv", "ghv"]
lst1.sort()
lst2.sort()
print(lst1,lst2)
# 默认升序排序/字母顺序
lst1.sort(reverse=True)
lst2.sort(reverse=True)
print(lst1,lst2)
# 参数reverse：反向排序，针对数字
lst3 = sorted(lst1)
lst3.append('hello')
print(lst1,lst3)
# 函数sorted():排序并复制

### 元组（序列）

Python 中的元组与列表类似也是一种容器数据类型，可以用一个变量（对象）来存储多个数据，不同之处在于元组的元素不能修改，在前面的代码中我们已经不止一次使用过元组了。顾名思义，我们把多个元素组合到一起就形成了一个元组，所以它和列表一样可以保存多条数据。

通常情况下，序列用小括号括起来。如果要创造一个包含一个元素的序列，那需要在序列的最后加上逗号。要是不加逗号，就把这个变量当成字符串。

下面的代码演示了如何定义和使用元组。

In [None]:
# 定义元组
t = ('骆昊', 38, True, '四川成都')
print(t)
# 获取元组中的元素
print(t[0])
print(t[3])
# 遍历元组中的值
for member in t:
    print(member)
# 重新给元组赋值
# t[0] = '王大锤'  # TypeError
# 变量t重新引用了新的元组原来的元组将被垃圾回收
t = ('王大锤', 20, True, '云南昆明')
print(t)
# 将元组转换成列表
person = list(t)
print(person)
# 列表是可以修改它的元素的
person[0] = '李小龙'
person[1] = 25
print(person)
# 将列表转换成元组
fruits_list = ['apple', 'banana', 'orange']
fruits_tuple = tuple(fruits_list)
print(fruits_tuple)

这里有一个非常值得探讨的问题，我们已经有了列表这种数据结构，为什么还需要元组这样的类型呢？

元组中的元素是无法修改的，事实上我们在项目中尤其是多线程环境（后面会讲到）中可能更喜欢使用的是那些不变对象（一方面因为对象状态不能修改，所以可以避免由此引起的不必要的程序错误，简单的说就是一个不变的对象要比可变的对象更加容易维护；另一方面因为没有任何一个线程能够修改不变对象的内部状态，一个不变对象自动就是线程安全的，这样就可以省掉处理同步化的开销。一个不变对象可以方便的被共享访问）。所以结论就是：如果不需要对元素进行添加、删除、修改的时候，可以考虑使用元组，当然如果一个方法要返回多个值，使用元组也是不错的选择。

元组在创建时间和占用的空间上面都优于列表。我们可以使用sys模块的getsizeof函数来检查存储同样的元素的元组和列表各自占用了多少内存空间，这个很容易做到。我们也可以在ipython中使用魔法指令%timeit来分析创建同样内容的元组和列表所花费的时间，下图是我的macOS系统上测试的结果。

![6.png](attachment:6.png)

和列表相似，也可以用索引从序列中读取一个元素。也可以用片断操作符取得列表的一部分。

如果我们试图更改序列的值，解释器会返回错误信息：object doesn't support item assignment

但是我们可以用另一个方法修改序列中的元素：

In [None]:
tuple = ('A',) + tuple[1:]
tuple

In [None]:
# 讲一讲元祖tuple ：不可变的“列表”
tup1 = ('physics', 'chemistry', 1997, 2000);
tup2 = (1, 2, 3, 4, 5 );
tup3 = "a", "b", "c", "d"  # 可以不加括号
tup4 = (50,)  # 元组中只包含一个元素时，需要在元素后面添加逗号
print(tup1[2],tup3[:2])  # 索引、切片和list一样
del tup3 # 元祖不能单独删除内部元素（不可变性），但可以del语句来删除整个元祖
#print(tup3)
print(len(tup1))
print(tup1 + tup2)
print(tup4 * 3)
print(max(tup2),min(tup2))
# 序列通用函数
lst = list(range(10))
tup5 = tuple(lst)
print(tup5)
# tuple()函数：将列表转换为元组

字符串是 Python 中最常用的数据类型。我们可以使用引号('或")来创建字符串
字符串也是序列：文本序列

In [None]:
# 字符串引号
str1 = "abc"
str2 = 'abc'
str3 = 'my name is "fatbird"'
# 双引号单引号无区别，但文本中有引号的时候要相互交替使用
str4 = '''hello! how are you?
          I`m fine, thank you.'''
# 需要多行字符串时候用三引号 ''' ''',""" """

In [None]:
# 转义字符：\
print('\'', '\"')  # \',\" ：分别输出单引号，双引号
print('hello\nhow do you do?')  # \n：空行
print('\\')  # 输出\，所以文件路径用“/”或者“\\”

#### 序列赋值

在编程中，我们可能要交换两个变量的值。用传统的方法，需要一个临时的中间变量。

Python用序列轻松的解决了这个问题：

In [None]:
a = 1
b = 2
c = 3
a, b, c = c, b, a
print(a, b, c)

从这个例子可以看到，右边序列元素的值按照从左到右的顺序赋值给左边的序列元素。如果右边的序列包含表达式，则先进行计算，然后再赋值。

很自然的想到，如果两个序列的元素个数不相等会怎样呢？解释器会报告出错：unpack tuple of wrong size

#### 序列作为返回值

In [None]:
"""
一个语义错误：
"""
def swap(x, y):
    x, y = y, x
    
a = 1
b = 2
swap(a, b)
print(a, b)

#### 随机函数

random模块中的函数random能够产生一个值的范围在0.0到1.0之间的浮点数

In [None]:
import random
for i in range(10):
    x = random.random()
    print(x)

#### 随机数列表

我们编写了一个产生随机数列表的函数：randomList。它的参数是一个整数，返回列表的长度等于这个整数。

In [None]:
import random

def randomList(n):
    s = [0] * n
    for i in range(n):
        s[i] = random.random()
    return s

randomList(8)

产生的随机数是均匀分布的，也就是说每一个值的机率是相等的。函数random产生的随机数范围是从0.0到1.0。如果把这个范围再分成几个部分，那么每部分产生的随机数的个数，从理论上讲，应该是完全相等。下面来验证这个猜想。

#### 计数

解决像这样问题的好办法是把它分成几个子问题，再寻找子问题的解决办法。我们想计算在给定范围内随机数出现的个数。我们曾写了一个程序，遍历一个字符串，计算给定字符出现的次数。对这个程序作一些修改，使之能够解决现在的问题。这个程序的源代码是：

In [None]:
count = 0
for char in fruit:
    if char == 'a':
        count = count + 1
print(count)

第一步：list替换fruit；num替换char。不要着急改变其他部分。

In [None]:
count = 0
for num in list:
    if num == 'a':
        count = count + 1
print(count)

第二步：修改测试条件。检查变量num是否出现在变量low和high之间。

In [None]:
count = 0 
for num in list:
    if low < num < high:
        count = count + 1
print(count)

第三步：封装代码在名为inBucket的函数中。参数是list、low和high。

In [None]:
def inBucket(list, low, high):
    count = 0
    for num in list:
        if low < num < high:
            count = count + 1
    return count

通过拷贝和修改存在的程序，我们很快就写完了一个函数，节约了大量的调试时间。

In [None]:
# 序列通用功能
print('a' in 'abc')  # in/not in ：判断是否存在
print('我很帅' + "没错")  # 文本连接
print('handsome '*4)  # 文本复制
st = 'abcdefg'
print(st[2],st[-1])
print(st[:2])
print(st[::2])
# 索引、切片、步长
print(st.index('g'))  # .index()方法
print('st长度为：',len(st))  # 计算字符串长度（思考这里能否把逗号换为"+"）

In [None]:
# 字符串常用功能
st = "i`m handsome!"
st2 = st.replace('handsome','ugly')
print(st)
print(st2)
st = 'hahaha'
st2 = st.replace('ha','he',2)
print(st2)
# str.replace(old,new,count)：修改字符串，count：更换几个
st = "poi01,116.446238,39.940166"
lst = st.split(',')
print(lst)
# str.split(obj)：拆分字符串，生成列表
lst = ['poi01', '116.446238', '39.940166']
m = '-'
st = m.join(lst)
print(st)
# str.join()：连接字符串，对象为列表
st = 'abcdefg'
print(st.startswith('a'), st.endswith('f'))
# str.startswith(“str”)  判断是否以“str”开头；str.endswith (“str”)  判断是否以“str”结尾
st = 'aBDEAjc kLM'
print(st.upper())  # 全部大写
print(st.lower())  # 全部小写
print(st.swapcase())  # 大小写互换
print(st.capitalize())  # 首字母大写
st = '1234567'
print(st.isnumeric())  # 如果 string 只包含数字则返回 True,否则返回 False.
st = 'DNVAK'
print(st.isalpha())  # 如果 string 至少有一个字符并且所有字符都是字母则返回 True,否则返回 False
st = 'avd   '
print(st.rstrip())  # 删除字符末尾的空格

In [None]:
# 格式化字符：在字符串中插入变量
name = "FATBIRD"
truth = "%s is 好人" %name
print(truth)
# %s 表示我们这里要插入一个变量（字符串），%name代表这里我们插入name → 所以，两个%解决问题
x = 4   
y = "hehe"  
z = 4.2
print("this is %i" %x)
print("this is %s" %y)
print("this is %f" %z)
# %s的s有什么含义：%s %z %f都是格式化字符串，s/i/f分别代表插入字符串的源数据类型：整型/字符型/浮点型

In [None]:
# 格式化字符：数字格式化的那些坑
m = 3.1415926 
print("pi is %f"  %m)
print("pi is %.2f" %m)
# 我只想输出2位小数:%.2f，此处是四舍五入！
m = 10.6
print("pi is %i"  %m)
print("pi is %.0f" %m)
# 区别：%i 不四舍五入，直接切掉小数部分
m = 100 
print("have fun %+i"  %m)
print("have fun %.2f"  % -0.01)
# 显示正号，负号根据数字直接显示
m = 100 
print("have fun % i"  %m)
print("have fun % +i"  %m)
print("have fun % .2f"  %-0.01)
# 加空格，空格和正好只能显示一个
m = 123.123123123 
print("have fun %.2e"  %m)
print("have fun %.4E"  %m)
# 科学计数法 %e  %E
m1 = 123.123123123
m2 = 1.2
print("have fun %g"  %m1)
print("have fun %g"  %m2)
# 小数位数少的时候自动识别用浮点数，数据复杂的时候自动识别用科学计数法

In [None]:
# 更强大的格式化方法.format
print("User ID: {0}".format("root"))
print("{} 呵呵 {}".format("a","b"))
# {} 这里代表占位符，其中可以有数字也可以没有
print("{}{}{}".format('a','b','c'),'\n',
     "{0}{1}{2}{0}".format('a','b','c'),'\n')
#print("{}{}{}{}".format('a','b','c'))
# {}和{0}的区别:都是占位符，后者有了明确指定
print("我的工作是{work}".format(work = '设计'))
# 也可以用变量来指示
x="abc{}"
a = x.format("def")
print(a,x)
# .format()生成新的值吗？？
print("{:f}".format(4.123),'\n',
 "{:.2f}".format(4.123),'\n',
 "{:e}".format(4.123),'\n',
 "{:.0f}".format(99.9),'\n',
 "{:%}".format(4.123),'\n',
 "{:d}".format(10))

## 字典
字典是另一种可变容器模型，且可存储任意类型对象。
字典的每个键值(key=>value)对用冒号(:)分割，每个对之间用逗号(,)分割，整个字典包括在花括号({})中
键必须是唯一的，但值则不必。

In [None]:
# 什么是映射？什么是字典dict？

name = ['大头儿子','小头爸爸','隔壁老王']
age = [6,35,37]
# 首先虽然序列是有顺序的，但还是不能直接把名字和年龄关联起来，这里只是顺序对上，且并没有一对一的关系

dic = {'大头儿子':6, '小头爸爸': 35, '隔壁老王':37}
print(dic,type(dic))
# 用{}来表示，按照key：value来表示字典中的元素，其中key是键，value是值，key-value也就是键值对
# 这里dic就是一个字典类型的变量

dic = [{'name':'Tom', 'age':18},{'name':'Jack', 'age':19},{'name':'Alex', "age":17}]
print(dic)
# 一个以字典为元素的列表，有没有觉得键值对很像数据中的字段和字段值？

In [None]:
# 字典的特点

dic = {'a':1,'b':2,'c':3}
# 键值对，一定共同出现，不能只有一个

dic = {'a':1,'a':2}
print(dic)
# 不允许同一个键出现两次：创建时如果同一个键被赋值两次，后一个值会被记住

dic = {'var1':1, 'var2':'hello', 'var3':[1,2,3], 'var4':{'a':1,'b':2}}
# key必须是字符串，value则可以是任意对象：数值，字符串，序列，字典

print(dic)
# 字典是一个无序集合,序列由于没有key来做对应，所以以顺序来对应值
# 序列有顺序，字典没有！

dic['var5'] = '添加一个值'  # 任意添加元素
dic['var4'] = '任意修改其中一个值'  # 任意修改元素
del dic['var1']  # 任意删除元素
print(dic)

dic.clear()  # 清空词典所有条目
print(dic)

del dic  # 删除词典
#print(dic)  

In [None]:
# 申明一个字典

dic = {'a':1,'b':2}
# 最简单直接的方式，手动书写申明一个字典变量，注意是：不是=

dic = dict(m = 10 ,n = 'aa', h = [1,2,3])
print(dic)
# dict()函数

lst1=[("a","fff"),("b","ggg")]
lst2=[["c",1],["d",2]]
lst3=(("e",[1,2]),("f",[3,4]))
dic1 = dict(lst1)
dic2 = dict(lst2)
dic3 = dict(lst3)
print(dic1,dic2,dic3)
# dict()由序列生成一个字典，嵌套序列，可以是list或者tuple

keys = ["a", "b", "c"]
dic1 = dict.fromkeys(keys)
dic2 = dict.fromkeys(keys, 'hello')
print(dic1,dic2)
# 只有key，直接生成一个字典

In [None]:
# 字典常用操作

dic1 = {"a":1, "b":2}
dic2 = {"c":3, "d":4}
dic1.update(dic2)
print(dic1,dic2)
# dict.update()方法：更新/合并一个字典，把第二个字典合并到第一个字典，改变了第一个字典

a = {'m':1 , 'n':2 , 'p':3}
b = a
a.update({'q':4})
print(a,b)
# 和序列的原理一样，a和b指向同一个字典，所以会一起更新

a = {'m':1 , 'n':2 , 'p':3}
b = a.copy()
a.update({'q':4})
print(a,b)
# 通过.copy()方法，复制一个新的字典

print(len(a))
# 查看字典元素个数

print('m' in a)
print(1 in a)
# in / not in ：判断是否包含，这里的判断对象是key

In [None]:
# 字典的元素访问

dic = {'a':1, "b":2, "c":3}
print(dic['a'])
#print(dic[1])  # 不能用序列的索引方式
# 字典里面也就同样的意思，但字典没有顺序，以key来作为指向，所以指向的key必须存在

poi = {'name':'shop', 'city':'shanghai', 'information':{'address':'somewhere', 'num':66663333}}
print(poi['information']['address'])
# 对于嵌套字典，输出嵌套内容，通过重复指向来输出

print(poi.get('name'))
print(poi.get('type',print('nothing')))
# .get(key)方法：直接查看key的value，如果没有相应key则返回None，添加print参数可以多返回一个值

print(poi.keys(),type(poi.keys()))
print(list(poi.keys()))
# .keys()方法：输出字典所有key，注意这里的输出内容格式是视图，可以用list()得到key的列表，类似range()

print(poi.values(),type(poi.values()))
print(list(poi.values()))
# .values()方法：输出字典所有values，原理同.keys()方法

print(poi.items(),type(poi.items()))
print(list(poi.items()))
# .items()方法：输出字典所有items（元素），原理同.keys()方法

In [None]:
# 字典的元素遍历

poi = {'name':'shop', 'city':'shanghai', 'information':{'address':'somewhere', 'num':66663333}}
for key in poi.keys():
    print(key)
print('-------')

for value in poi.values():
    print(value)
print('-------')

for (k,v) in poi.items():
    print('key为 %s, value为 %s' %(k,v))
print('-------')  
# for函数遍历