# 推导式

包含：

- 列表推导式
- 字典推导式
- 集合推导式
- 元组推导式（生成器表达式）

In [1]:
a = list([1, 2, 3, 4, 5])
b = dict({'a': 10, 'b': 11, 'c': 12, 'd': 13, 'e': 14, 'f': 15})
c = set({6, 7, 8, 9, 10})
d = tuple(('apple', 'banana', 'cherry', 'durian', 'elderberry'))

In [2]:
new_a = [x for x in a]
new_a_2 = [x for x in a if x > 2]
new_a_3 = [x if x > 3 else -x for x in a]
new_a, new_a_2, new_a_3

([1, 2, 3, 4, 5], [3, 4, 5], [-1, -2, -3, 4, 5])

In [3]:
new_b = {k: v+1 for k, v in b.items()}
new_b_2 = {k: v+1 for k, v in b.items() if v > 12}
new_b_3 = {k: v+2 if v > 12 else v-2 for k, v in b.items()}
new_b, new_b_2, new_b_3

({'a': 11, 'b': 12, 'c': 13, 'd': 14, 'e': 15, 'f': 16},
 {'d': 14, 'e': 15, 'f': 16},
 {'a': 8, 'b': 9, 'c': 10, 'd': 15, 'e': 16, 'f': 17})

In [4]:
new_c = {x+2 for x in c}
new_c_2 = {x+2 for x in c if x > 8}
new_c_3 = {x+2 if x > 8 else x-2 for x in c}
new_c, new_c_2, new_c_3

({8, 9, 10, 11, 12}, {11, 12}, {4, 5, 6, 11, 12})

In [5]:
new_d = (x for x in d)
new_d_2 = (x +'_'for x in d if x != 'apple')
new_d_3 = (x + '_' if x == 'apple' else '_' + x for x in d)
# 返回的是生成器对象
print(new_d, new_d_2, new_d_3, end='\n')
# 使用 tuple() 函数，可以直接将生成器对象转换成元组
tuple(new_d), tuple(new_d_2), tuple(new_d_3)

<generator object <genexpr> at 0x7f87406527d0> <generator object <genexpr> at 0x7f8740652550> <generator object <genexpr> at 0x7f87406528d0>


(('apple', 'banana', 'cherry', 'durian', 'elderberry'),
 ('banana_', 'cherry_', 'durian_', 'elderberry_'),
 ('apple_', '_banana', '_cherry', '_durian', '_elderberry'))

# 迭代器与生成器

## 使用迭代器

迭代器有两个基本的方法：iter() 和 next()。
字符串，列表或元组对象都可用于创建迭代器

In [6]:
it_a = iter(a)
print(it_a)
print(next(it_a))
print(next(it_a))

<list_iterator object at 0x7f872b281110>
1
2


## 遍历迭代器

In [7]:
it_a = iter(a)

# 常规for循环
for x in it_a:
    print(x, end=',')
print()

it_a = iter(a)

# 常规while循环
while True:
    try:
        print(next(it_a), end=' ')
    except StopIteration:
        break

1,2,3,4,5,
1 2 3 4 5 

## 创建迭代器类

把一个类作为一个迭代器使用需要在类中实现两个方法 __iter__() 与 __next__() 。

StopIteration 异常用于标识迭代的完成，防止出现无限循环的情况。
在 __next__() 方法中我们可以设置在完成指定循环次数后触发 StopIteration 异常来结束迭代。

In [8]:
class MyNumber:
    def __iter__(self):
        self.a = 1
        return self

    def __next__(self):
        if self.a <20:
            x = self.a
            self.a += 1
            return x
        else:
            raise StopIteration
    
my = MyNumber()
my_it = iter(my)
for x in my_it:
    print(x, end=' ')

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 

## 使用生成器

在 Python 中，使用了 yield 的函数被称为生成器（generator）。
yield 是一个关键字，用于定义生成器函数，生成器函数是一种特殊的函数，可以在迭代过程中逐步产生值，而不是一次性返回所有结果。
跟普通函数不同的是，生成器是一个返回迭代器的函数，只能用于迭代操作，更简单点理解生成器就是一个迭代器。

当在生成器函数中使用 yield 语句时，函数的执行将会暂停，并将 yield 后面的表达式作为当前迭代的值返回。
然后，每次调用生成器的 next() 方法或使用 for 循环进行迭代时，函数会从上次暂停的地方继续执行，直到再次遇到 yield 语句。
这样，生成器函数可以逐步产生值，而不需要一次性计算并返回所有结果。

调用一个生成器函数，返回的是一个迭代器对象。

In [9]:
def count_down(n):
    while n > 0:
        yield n
        n -= 1

# 创建生成器对象
gen = count_down(10)

# for循环迭代生成器
for x in gen:
    print(x, end=' ')

10 9 8 7 6 5 4 3 2 1 

# 函数的参数传递

在 python 中，类型属于对象，对象有不同类型的区分，变量是没有类型的：

## 可更改(mutable)与不可更改(immutable)对象

在 python 中，strings, tuples, 和 numbers 是不可更改的对象，而 list,dict 等则是可以修改的对象。

- 不可变类型：变量赋值 a=5 后再赋值 a=10，这里实际是新生成一个 int 值对象 10，再让 a 指向它，而 5 被丢弃，不是改变 a 的值，相当于新生成了 a。
- 可变类型：变量赋值 la=[1,2,3,4] 后再赋值 la[2]=5 则是将 list la 的第三个元素值更改，本身la没有动，只是其内部的一部分值被修改了。

python 函数的参数传递：

- 不可变类型：类似 C++ 的值传递，如整数、字符串、元组。如 fun(a)，传递的只是 a 的值，没有影响 a 对象本身。如果在 fun(a) 内部修改 a 的值，则是新生成一个 a 的对象。
- 可变类型：类似 C++ 的引用传递，如 列表，字典。如 fun(la)，则是将 la 真正的传过去，修改后 fun 外部的 la 也会受影响

python 中一切都是对象，严格意义我们不能说值传递还是引用传递，我们应该说传不可变对象和传可变对象。

## python 传不可变对象实例

通过 id() 函数来查看内存地址变化：

In [10]:
def change(a):
    print(id(a))
    a = 10
    print(id(a))
    
a = 25
print(id(a))
change(a)

94848928359936
94848928359936
94848928359456


可以看见在调用函数前后，形参和实参指向的是同一个对象（对象 id 相同），在函数内部修改形参后，形参指向的是不同的 id。

## 传可变对象实例

可变对象在函数里修改了参数，那么在调用这个函数的函数里，原始的参数也被改变了。例如：

In [11]:
# 可写函数说明
def change_me(my_list):
    """修改传入的列表"""
    print(id(my_list))
    my_list.append([1,2,3,4])
    print(id(my_list))
    print ("函数内取值: ", my_list)
    return

# 调用change_me函数
mylist = [10,20,30]
print(id(mylist))
change_me(mylist)
print(id(mylist))
print ("函数外取值: ", mylist)

140218877829920
140218877829920
140218877829920
函数内取值:  [10, 20, 30, [1, 2, 3, 4]]
140218877829920
函数外取值:  [10, 20, 30, [1, 2, 3, 4]]


# 函数的参数

## 函数的不定长参数

你可能需要一个函数能处理比当初声明时更多的参数。这些参数叫做不定长参数，声明时不会命名。基本语法如下：

```txt
def functionname([formal_args,] *var_args_tuple ):
   "函数_文档字符串"
   function_suite
   return [expression]
```

加了星号 * 的参数会以元组(tuple)的形式导入，存放所有未命名的变量参数。
如果在函数调用时没有指定参数，它就是一个空元组。我们也可以不向函数传递未命名的变量。

In [12]:
def print_info(arg1, *infos):
    """可以打印任意多个输入的参数"""
    print(arg1)
    print(infos)
    
print_info(0, 1, 5, 2, 3, 4)
print_info(0)

0
(1, 5, 2, 3, 4)
0
()


还有一种就是参数带两个星号 **基本语法如下：

```txt
def functionname([formal_args,] **var_args_dict ):
   "函数_文档字符串"
   function_suite
   return [expression]
```

加了两个星号 ** 的参数会以字典的形式导入。

In [13]:
def print_infos(arg1, **infos):
    """可以打印任意多输入的参数"""
    print(arg1)
    print(infos)
    
print_infos(0, a=1, b=2, c=3)
print_infos(0)

0
{'a': 1, 'b': 2, 'c': 3}
0
{}


声明函数时，参数中星号 * 可以单独出现，例如:

```python
def f(a,b,*,c):
    return a+b+c
```

如果参数定义中单独出现星号 *，则表示星号 * 后的参数必须用关键字传入

In [14]:
def f(a, b, *, c):
    print(a+b+c)

try:
    f(1, 2, 3)
except TypeError:
    print("调用方法出错")
    
f(1, 2, c=3)

调用方法出错
6


## 匿名函数（lambda）

Python 使用 lambda 来创建匿名函数。

所谓匿名，意即不再使用 def 语句这样标准的形式定义一个函数。

- lambda 只是一个表达式，函数体比 def 简单很多。
- lambda 的主体是一个表达式，而不是一个代码块。仅仅能在 lambda 表达式中封装有限的逻辑进去。
- lambda 函数拥有自己的命名空间，且不能访问自己参数列表之外或全局命名空间里的参数。
- 虽然 lambda 函数看起来只能写一行，却不等同于 C 或 C++ 的内联函数，内联函数的目的是调用小函数时不占用栈内存从而减少函数调用的开销，提高代码的执行速度。

In [15]:
add_5 = lambda x: x+5

add_5(1)

6

In [16]:
add = lambda x, y: x+y

add(1, 2)

3

In [17]:
def create_lambda(n):
    return lambda x: x*n

two_mul = create_lambda(2)
three_mul = create_lambda(3)

two_mul(2), three_mul(2)

(4, 6)

## 强制位置参数

Python3.8 新增了一个函数形参语法 / 用来指明函数形参必须使用指定位置参数，不能使用关键字参数的形式。

在以下的例子中，形参 a 和 b 必须使用指定位置参数，c 或 d 可以是位置形参或关键字形参，而 e 和 f 要求为关键字形参:

```python
def f(a, b, /, c, d, *, e, f):
    print(a, b, c, d, e, f)
```

以下使用方法是正确的:

```python
f(10, 20, 30, d=40, e=50, f=60)
```

以下使用方法会发生错误:

```python
f(10, b=20, c=30, d=40, e=50, f=60)   # b 不能使用关键字参数的形式
f(10, 20, 30, 40, 50, f=60)           # e 必须使用关键字参数的形式
```

# 数据结构

## 列表

Python中列表是可变的，这是它区别于字符串和元组的最重要的特点，一句话概括即：列表可以修改，而字符串和元组不能。

以下是 Python 中列表的方法：

| 方法                 | 描述                                  |
|--------------------|-------------------------------------|
| list.append(x)     | 把一个元素添加到列表的结尾，相当于 a[len(a):] = [x]。 |
| list.extend(L)     |	通过添加指定列表的所有元素来扩充列表，相当于 a[len(a):] = L。|
| list.insert(i, x)  |	在指定位置插入一个元素。第一个参数是准备插入到其前面的那个元素的索引，例如 a.insert(0, x) 会插入到整个列表之前，而 a.insert(len(a), x) 相当于 a.append(x) 。|
| list.remove(x)     |	删除列表中值为 x 的第一个元素。如果没有这样的元素，就会返回一个错误。|
| list.pop([i])      |	从列表的指定位置移除元素，并将其返回。如果没有指定索引，a.pop()返回最后一个元素。元素随即从列表中被移除。（方法中 i 两边的方括号表示这个参数是可选的，而不是要求你输入一对方括号，你会经常在 Python 库参考手册中遇到这样的标记。）|
| list.clear()       |	移除列表中的所有项，等于del a[:]。|
| list.index(x)      |	返回列表中第一个值为 x 的元素的索引。如果没有匹配的元素就会返回一个错误。|
| list.count(x)      |	返回 x 在列表中出现的次数。|
| list.sort()        |	对列表中的元素进行排序。|
| list.reverse()     |	倒排列表中的元素。|
| list.copy()        |	返回列表的浅复制，等于a[:]。|

In [18]:
# 堆栈用法
stack = [3, 4, 5]
stack.append(6)
stack.append(7)
print(stack)
print(stack.pop())
print(stack)
print(stack.pop())
print(stack.pop())
print(stack)

[3, 4, 5, 6, 7]
7
[3, 4, 5, 6]
6
5
[3, 4]


In [19]:
# 队列用法
from collections import deque
queue = deque(["Eric", "John", "Michael"])
print(queue)
queue.append("Terry") # Terry arrives
queue.append("Graham") # Graham arrives
print(queue)
print(queue.popleft()) # The first to arrive now leaves
print(queue.popleft()) # The second to arrive now leaves
print(queue) # Remaining queue in order of arrival

deque(['Eric', 'John', 'Michael'])
deque(['Eric', 'John', 'Michael', 'Terry', 'Graham'])
Eric
John
deque(['Michael', 'Terry', 'Graham'])


## 嵌套列表解析

In [20]:
matrix = [
    [1, 2, 3, 4],
    [5, 6, 7, 8],
    [9, 10, 11, 12],
]

[[row[i] for row in matrix] for i in range(4)]

[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

## 元组和序列
元组由若干逗号分隔的值组成

元组在输出时总是有括号的，以便于正确表达嵌套结构。在输入时可能有或没有括号，不过括号通常是必须的（如果元组是更大的表达式的一部分）。

In [21]:
t = 12345, 54321, 'hello!'
print(t)

# 元组嵌套
u = t, (1, 2, 3, 4, 5)
print(u)

(12345, 54321, 'hello!')
((12345, 54321, 'hello!'), (1, 2, 3, 4, 5))



## 集合

集合是一个无序不重复元素的集。基本功能包括关系测试和消除重复元素。

可以用大括号({})创建集合。
注意：如果要创建一个空集合，你必须用 set() 而不是 {} ；后者创建一个空的字典。

In [22]:
basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
print(basket)

print('orange' in basket) # 成员检测
print('crabgrass' in basket)

a = set('abracadabra')
b = set('alacazam')
print('a:', a, 'b:', b)
print()

# 集合运算
print(a - b)
print(a | b)
print(a & b)
print(a ^ b)

{'pear', 'banana', 'apple', 'orange'}
True
False
a: {'c', 'b', 'a', 'r', 'd'} b: {'c', 'l', 'a', 'z', 'm'}

{'r', 'b', 'd'}
{'b', 'c', 'l', 'a', 'r', 'z', 'm', 'd'}
{'a', 'c'}
{'r', 'm', 'z', 'b', 'l', 'd'}



## 字典

另一个非常有用的 Python 内建数据类型是字典。

序列是以连续的整数为索引，与此不同的是，字典以关键字为索引，关键字可以是任意不可变类型，通常用字符串或数值。

理解字典的最佳方式是把它看做无序的键=>值对集合。在同一个字典之内，关键字必须是互不相同。

创建字典：
- 一对大括号创建一个空的字典：{}。
- 构造函数 dict() 直接从键值对元组列表中构建字典。如果有固定的模式，列表推导式指定特定的键值对。
- 此外，字典推导可以用来创建任意键和值的表达式词典：
- 如果关键字只是简单的字符串，使用关键字参数指定键值对有时候更方便：

In [23]:
tel = {'jack': 4098, 'sape': 4139}
print(tel)

{'jack': 4098, 'sape': 4139}


In [24]:
# 访问
print(tel['jack'])
# 修改
tel['guido'] = 4127
print(tel['guido'])
# 删除
tel['sape']=4139
print(tel)
del tel['sape']
print(tel)

4098
4127
{'jack': 4098, 'sape': 4139, 'guido': 4127}
{'jack': 4098, 'guido': 4127}


In [25]:
# 转换
print(list(tel.keys()))
print(sorted(tel.keys()))

['jack', 'guido']
['guido', 'jack']


In [26]:
# 搜索
print('guido' in tel)
print('jack' not in tel)

True
False


In [27]:
# 创建
print({x: x**2 for x in (2, 4, 6)})
print(dict(sape=4139, guido=4127, jack=4098))

{2: 4, 4: 16, 6: 36}
{'sape': 4139, 'guido': 4127, 'jack': 4098}


## 遍历技巧

In [28]:
ad = dict(sape=4139, guido=4127, jack=4098)

在字典中遍历时，关键字和对应的值可以使用 items() 方法同时解读出来：

In [29]:
for k,v in ad.items():
    print('%s: %d' % (k, v))

sape: 4139
guido: 4127
jack: 4098


在序列中遍历时，索引位置和对应值可以使用 enumerate() 函数同时得到：

In [30]:
for i, v in enumerate(['tic', 'tac', 'toe']):
    print(i, v)

0 tic
1 tac
2 toe


同时遍历两个或更多的序列，可以使用 zip() 组合：

In [31]:
questions = ['name', 'quest', 'favorite color']
answers = ['lancelot', 'the holy grail', 'blue']
for q, a in zip(questions, answers):
    print('questions: {0}, answers: {1}'.format(q, a))

questions: name, answers: lancelot
questions: quest, answers: the holy grail
questions: favorite color, answers: blue


要反向遍历一个序列，首先指定这个序列，然后调用 reversed() 函数：

In [32]:
for i in reversed(range(1, 10, 2)):
    print(i, end=' ')

9 7 5 3 1 

要按顺序遍历一个序列，使用 sorted() 函数返回一个已排序的序列，并不修改原值：

In [33]:
for f in sorted(set(basket)):
    print(f, end=' ')

apple banana orange pear 

# 模块

## 主模块

主模块的名字永远是"\_\_main\_\_"，一个Python应用程序的主模块，应当总是使用绝对路径引用。

## dir()函数

内置的函数 dir() 可以找到模块内定义的所有名称。以一个字符串列表的形式返回。
如果没有给定参数(模块名)，那么 dir() 函数会罗列出当前定义的所有名称。

In [34]:
import datetime
dir(datetime)

['MAXYEAR',
 'MINYEAR',
 '__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 'date',
 'datetime',
 'datetime_CAPI',
 'sys',
 'time',
 'timedelta',
 'timezone',
 'tzinfo']

In [35]:
dir()

['In',
 'MyNumber',
 'Out',
 '_',
 '_15',
 '_16',
 '_17',
 '_2',
 '_20',
 '_3',
 '_34',
 '_4',
 '_5',
 '__',
 '___',
 '__builtin__',
 '__builtins__',
 '__doc__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 '__vsc_ipynb_file__',
 '_dh',
 '_i',
 '_i1',
 '_i10',
 '_i11',
 '_i12',
 '_i13',
 '_i14',
 '_i15',
 '_i16',
 '_i17',
 '_i18',
 '_i19',
 '_i2',
 '_i20',
 '_i21',
 '_i22',
 '_i23',
 '_i24',
 '_i25',
 '_i26',
 '_i27',
 '_i28',
 '_i29',
 '_i3',
 '_i30',
 '_i31',
 '_i32',
 '_i33',
 '_i34',
 '_i35',
 '_i4',
 '_i5',
 '_i6',
 '_i7',
 '_i8',
 '_i9',
 '_ih',
 '_ii',
 '_iii',
 '_oh',
 'a',
 'ad',
 'add',
 'add_5',
 'answers',
 'b',
 'basket',
 'c',
 'change',
 'change_me',
 'count_down',
 'create_lambda',
 'd',
 'datetime',
 'deque',
 'exit',
 'f',
 'gen',
 'get_ipython',
 'i',
 'it_a',
 'k',
 'matrix',
 'my',
 'my_it',
 'mylist',
 'new_a',
 'new_a_2',
 'new_a_3',
 'new_b',
 'new_b_2',
 'new_b_3',
 'new_c',
 'new_c_2',
 'new_c_3',
 'new_d',
 'new_d_2',
 'new_d_3',
 'print_info',
 

## 额外功能

包还提供一个额外的属性__path__。这是一个目录列表，里面每一个包含的目录都有为这个包服务的__init__.py，你得在其他__init__.py被执行前定义哦。可以修改这个变量，用来影响包含在包里面的模块和子包。

这个功能并不常用，一般用来扩展包里面的模块。

## 标准模块

如sys，os，math，datetime等

# 输入和输出

## 输出格式美化

Python两种输出值的方式: 表达式语句和 print() 函数。
第三种方式是使用文件对象的 write() 方法，标准输出文件可以用 sys.stdout 引用。

如果你希望输出的形式更加多样，可以使用 str.format() 函数来格式化输出值。

如果你希望将输出的值转成字符串，可以使用 repr() 或 str() 函数来实现。

- str()： 函数返回一个用户易读的表达形式。
- repr()： 产生一个解释器易读的表达形式。

repr() 函数可以转义字符串中的特殊字符
repr() 的参数可以是 Python 的任何对象

In [36]:
hello = 'hello, runoob\n'
hellos = repr(hello)
print(hellos)

'hello, runoob\n'


In [37]:
x = 37.5
y = 40000
helloss = repr((x, y, ('Google', 'Runoob')))
print(helloss)

(37.5, 40000, ('Google', 'Runoob'))


两种方式输出一个平方与立方的表:

这个例子展示了字符串对象的 rjust() 方法, 它可以将字符串靠右, 并在左边填充空格。
还有类似的方法, 如 ljust() 和 center()。 这些方法并不会写任何东西, 它们仅仅返回新的字符串。
另一个方法 zfill(), 它会在数字的左边填充 0

In [38]:
for x in range(1, 11):
    print(repr(x).rjust(2), repr(x**2).rjust(3), end=' ')
    print(repr(x**3).rjust(4))

 1   1    1
 2   4    8
 3   9   27
 4  16   64
 5  25  125
 6  36  216
 7  49  343
 8  64  512
 9  81  729
10 100 1000


In [39]:
for x in range(1, 11):
    print('{0:2d} {1:3d} {2:4d}'.format(x, x**2, x**3))

 1   1    1
 2   4    8
 3   9   27
 4  16   64
 5  25  125
 6  36  216
 7  49  343
 8  64  512
 9  81  729
10 100 1000


# str.format()用法

In [40]:
print('{}网址： "{}!"'.format('菜鸟教程', 'www.runoob.com'))

菜鸟教程网址： "www.runoob.com!"


In [41]:
print('{0} 和 {1}'.format('Google', 'Runoob'))
print('{1} 和 {0}'.format('Google', 'Runoob'))

Google 和 Runoob
Runoob 和 Google


In [42]:
print('{name}网址： {site}'.format(name='菜鸟教程', site='www.runoob.com'))

菜鸟教程网址： www.runoob.com


In [43]:
print('站点列表 {0}, {1}, 和 {other}。'.format('Google', 'Runoob', other='Taobao'))

站点列表 Google, Runoob, 和 Taobao。


!a (使用 ascii()), !s (使用 str()) 和 !r (使用 repr()) 可以用于在格式化某个值之前对其进行转化:

In [44]:
import math
print('常量 PI 的值近似为： {}。'.format(math.pi))
print('常量 PI 的值近似为： {!r}。'.format(math.pi))

常量 PI 的值近似为： 3.141592653589793。
常量 PI 的值近似为： 3.141592653589793。


可选项 : 和格式标识符可以跟着字段名。 这就允许对值进行更好的格式化。

In [45]:
print('常量 PI 的值近似为 {0:.3f}。'.format(math.pi))

常量 PI 的值近似为 3.142。


在 : 后传入一个整数, 可以保证该域至少有这么多的宽度。 用于美化表格时很有用。

In [46]:
table = {'Google': 1, 'Runoob': 2, 'Taobao': 3}
for name, number in table.items():
    print('{0:10} ==> {1:10d}'.format(name, number))

Google     ==>          1
Runoob     ==>          2
Taobao     ==>          3


如果你有一个很长的格式化字符串, 而你不想将它们分开, 那么在格式化时通过变量名而非位置会是很好的事情。
最简单的就是传入一个字典, 然后使用方括号 [] 来访问键值 :

In [47]:
print('Runoob: {0[Runoob]:d}; Google: {0[Google]:d}; Taobao: {0[Taobao]:d}'.format(table))

Runoob: 2; Google: 1; Taobao: 3


也可以通过在 table 变量前使用 ** 来实现相同的功能：

In [48]:
print('Runoob: {Runoob:d}; Google: {Google:d}; Taobao: {Taobao:d}'.format(**table))

Runoob: 2; Google: 1; Taobao: 3


## 旧式字符串格式化

% 操作符也可以实现字符串格式化。 它将左边的参数作为类似 sprintf() 式的格式化字符串, 而将右边的代入, 然后返回格式化后的字符串

In [49]:
print('常量 PI 的值近似为：%5.3f。' % math.pi)

常量 PI 的值近似为：3.142。


## 读取键盘输入

Python 提供了 input() 内置函数从标准输入读入一行文本，默认的标准输入是键盘。

## 读和写文件

open() 将会返回一个 file 对象，基本语法格式如下:

```python
open(filename, mode)
```

- filename：包含了你要访问的文件名称的字符串值。
- mode：决定了打开文件的模式：只读，写入，追加等。所有可取值见如下的完全列表。这个参数是非强制的，默认文件访问模式为只读(r)。

不同模式打开文件的完全列表：

| 模式  | 描述                                                                                |
|-----|-----------------------------------------------------------------------------------|
| r   | 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。                                                  |
| rb  | 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。                                                   |
| r+  | 打开一个文件用于读写。文件指针将会放在文件的开头。                                                         |
| rb+ | 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。                                                   |
| w   | 打开一个文件只用于写入。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。                      |
| wb  | 以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。                |
| w+  | 打开一个文件用于读写。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。                       |
| wb+ | 以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件，并从开头开始编辑，即原有内容会被删除。如果该文件不存在，创建新文件。                 |
| a   | 打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，新的内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。       |
| ab  | 以二进制格式打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，新的内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。 |
| a+  | 打开一个文件用于读写。如果该文件已存在，文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在，创建新文件用于读写。                 |
| ab+ | 以二进制格式打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。如果该文件不存在，创建新文件用于读写。                       |


下图很好的总结了这几种模式：
![文件访问方式](./learn_python_img/openfile.png)

| 模式	   | r	 | r+	 | w	  | w+	 | a	  | a+  |
|-------|----|-----|-----|-----|-----|-----|
| 读     | 	+ | 	+  | 		  | +   | 		  | +   |
| 写     | 	  | 	+  | 	+  | 	+  | 	+  | 	+  |
| 创建    | 	  | 	   | 	+  | 	+  | 	+  | 	+  |
| 覆盖    | 	  | 	   | 	+  | 	+  | 	   | 	   |
| 指针在开始 | 	+ | 	+  | 	+  | 	+  | 	   | 	   |
| 指针在结尾 | 	  | 	   | 	   | 	   | 	+  | 	+  |

以下实例将字符串写入到文件 foo.txt 中：

In [50]:
# 打开一个文件
f = open('./data/foo.txt', 'w')

f.write("Python是一门好语言，我正在学习！\n希望大家也能喜欢！\n")

# 关闭打开的文件
f.close()

FileNotFoundError: [Errno 2] No such file or directory: './data/foo.txt'

## readline函数和readlines函数

f.readline() 会从文件中读取单独的一行。换行符为 '\n'。f.readline() 如果返回一个空字符串, 说明已经已经读取到最后一行。

f.readlines() 将返回该文件中包含的所有行。
如果设置可选参数 sizehint, 则读取指定长度的字节, 并且将这些字节按行分割。

In [None]:
# 打开一个文件
f = open("./data/foo.txt", "r")

string = f.readline()
print(str)

string = f.readlines()
print(string)

# 关闭打开的文件
f.close()

<class 'str'>
['希望大家也能喜欢！\n']


## 通过迭代的方式读取文件

这个方法很简单, 但是并没有提供一个很好的控制。 因为两者的处理机制不同, 最好不要混用。

In [None]:
# 打开一个文件
f = open("./data/foo.txt", "r")

for line in f:
    print(line, end='')

# 关闭打开的文件
f.close()

Python是一门好语言，我正在学习！
希望大家也能喜欢！


# write函数

f.write(string) 将 string 写入到文件中, 然后返回写入的字符数。

如果要写入一些不是字符串的东西, 那么将需要先进行转换

In [None]:
# 打开一个文件
f = open("./data/foo.txt", "w")

num = f.write( "Python 是一个非常好的语言。\n是的，的确非常好!!\n" )
print(num)

tup = ('www.runoob.com', 14)
# s = ''.join([str(i) for i in value])
print(tup)
s = str(tup)
print(s)
f.write(s)

# 关闭打开的文件
f.close()

29
('www.runoob.com', 14)
('www.runoob.com', 14)


## 操作文件

### f.tell()
f.tell() 返回文件对象当前所处的位置, 它是从文件开头开始算起的字节数。

### f.seek()
如果要改变文件指针当前的位置, 可以使用 f.seek(offset, from_what) 函数。

from_what 的值, 如果是 0 表示开头, 如果是 1 表示当前位置, 2 表示文件的结尾，例如：

- seek(x,0) ： 从起始位置即文件首行首字符开始移动 x 个字符
- seek(x,1) ： 表示从当前位置往后移动x个字符
- seek(-x,2)：表示从文件的结尾往前移动x个字符

from_what 值为默认为0，即文件开头。下面给出一个完整的例子：

In [None]:
f = open('./data/foo.txt', 'rb+')

a = f.write(b'0123456789abcdef')
print(a)

a = f.seek(5)
print(a)

a = f.read(1)
print(a)

a = f.seek(-3, 2)
print(a)

a = f.read(1)
print(a)

16
5
b'5'
68
b'1'


### f.close()

在文本文件中 (那些打开文件的模式下没有 b 的), 只会相对于文件起始位置进行定位。

当你处理完一个文件后, 调用 f.close() 来关闭文件并释放系统的资源，如果尝试再调用该文件，则会抛出异常。

当处理一个文件对象时, 使用 with 关键字是非常好的方式。在结束后, 它会帮你正确的关闭文件。 而且写起来也比 try - finally 语句块要简短:

In [None]:
with open('./data/foo.txt', 'r') as f:
    read_data = f.read()
f.closed

UnicodeDecodeError: 'gbk' codec can't decode byte 0xa3 in position 26: illegal multibyte sequence

### 其他

文件对象还有其他方法, 如 isatty() 和 trucate(), 但这些通常比较少用。

# pickle 模块

python的pickle模块实现了基本的数据序列和反序列化。

通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去，永久存储。

通过pickle模块的反序列化操作，我们能够从文件中创建上一次程序保存的对象。

基本接口：

```text
pickle.dump(obj, file, [,protocol])
```

有了 pickle 这个对象, 就能对 file 以读取的形式打开:

```python
x = pickle.load(file)
```

注解：从 file 中读取一个字符串，并将它重构为原来的python对象。
file: 类文件对象，有read()和readline()接口。

In [None]:
# 保存数据
import pickle

data1 = {
    'a': [1, 2.0, 3, 4 + 5j, 6],
    'b': ('string', u'Unicode string'),
    'c': None
}

selfref_list = [1, 2, 3]
selfref_list.append(selfref_list)
print(selfref_list)

output = open('./data/data.pkl', 'wb')

# Pickle dictionary using protocol 0.
pickle.dump(data1, output)

# Pickle the list using the highest protocol available.
pickle.dump(selfref_list, output, -1)

output.close()

In [None]:
# 读取数据
import pprint, pickle

#使用pickle模块从文件中重构python对象
pkl_file = open('./data/data.pkl', 'rb')

data1 = pickle.load(pkl_file)
pprint.pprint(data1)

data2 = pickle.load(pkl_file)
pprint.pprint(data2)

pkl_file.close()

# 异常处理

## try...except...else子句:

使用 else 子句比把所有的语句都放在 try 子句里面要好，这样可以避免一些意想不到，而 except 又无法捕获的异常。
异常处理并不仅仅处理那些直接发生在 try 子句中的异常，而且还能处理子句中调用的函数（甚至间接调用的函数）里抛出的异常。

```text
try:
    执行代码
except:
    发生异常时执行的代码
else:
    没有异常时执行的代码
```

## try...finally子句：

try-finally 语句无论是否发生异常都将执行最后的代码。

```text
try:
    执行代码
except:
    发生异常时执行的代码
else:
    没有异常时执行的代码
finally:
    无论是否有异常都会执行的代码
```

## 抛出异常

Python 使用 raise 语句抛出一个指定的异常。

raise语法格式如下：

```text
raise [Exception [, args [, traceback]]]
```

raise 唯一的一个参数指定了要被抛出的异常。它必须是一个异常的实例或者是异常的类（也就是 Exception 的子类）。

如果你只想知道这是否抛出了一个异常，并不想去处理它，那么一个简单的 raise 语句就可以再次把它抛出。

## 用户自定义异常

你可以通过创建一个新的异常类来拥有自己的异常。异常类继承自 Exception 类，可以直接继承，或者间接继承，例如: 

In [None]:
class MyError(Exception):
    def __init__(self, value):
        self.value = value
    def __str__(self):
        return repr(self.value)

try:
    raise MyError(2*2)
except MyError as e:
    print('My exception occurred, value:', e.value)

当创建一个模块有可能抛出多种不同的异常时，一种通常的做法是:
    为这个包建立一个基础异常类，然后基于这个基础类为不同的错误情况创建不同的子类。

大多数的异常的名字都以"Error"结尾，就跟标准的异常命名一样:

In [None]:
class Error(Exception):
    """Base class for exceptions in this module."""
    pass

class InputError(Error):
    """Exception raised for errors in the input.

    Attributes:
        expression -- input expression in which the error occurred
        message -- explanation of the error
    """
    def __init__(self, expression, message):
        self.expression = expression
        self.message = message

class TransitionError(Error):
    """Raised when an operation attempts a state transition that's not
    allowed.

    Attributes:
        previous -- state at beginning of transition
        next -- attempted new state
        message -- explanation of why the specific transition is not allowed
    """
    def __init__(self, previous, next, message):
        self.previous = previous
        self.next = next
        self.message = message

## 定义清理行为

如果一个异常在 try 子句里（或者在 except 和 else 子句里）被抛出，而又没有任何的 except 把它截住，那么这个异常会在 finally 子句执行后被抛出。

In [None]:
def divide(x, y):
    try:
        result = x / y
    except ZeroDivisionError:
        print("division by zero!")
    else:
        print("result is", result)
    finally:
        print("executing finally clause")

divide(2, 1)
divide(2, 0)
divide('2', '1')


## 预定义的清理行为

一些对象定义了标准的清理行为，无论系统是否成功的使用了它，一旦不需要它了，那么这个标准的清理行为就会执行。

比如：
    关键词 with 语句就可以保证诸如文件之类的对象在使用完之后一定会正确的执行他的清理方法

# assert 断言

Python assert（断言）用于判断一个表达式，在表达式条件为 false 的时候触发异常。

断言可以在条件不满足程序运行的情况下直接返回错误，而不必等待程序运行后出现崩溃的情况，例如我们的代码只能在 Linux 系统下运行，可以先判断当前系统是否符合条件。

语法格式如下：

```text
assert expression
```

等价于：

```text
if not expression:
    raise AssertionError
```

assert 后面也可以紧跟参数:

```text
assert expression [, arguments]
```

等价于：

```text
if not expression:
    raise AssertionError(arguments)
```

In [None]:
assert True

In [None]:
assert False

In [None]:
assert ('linux' in sys.platform), "该代码只能在 Linux 下执行"

# Python中的面向对象

## Python 子类继承父类构造函数说明

子类不重写__init__()方法，实例化子类后，会自动调用父类的__init__()的方法。

子类重写__init__()方法，实例化子类后，将不会自动调用父类的__init__()的方法。

子类重写__init__()方法又需要调用父类的方法：使用super关键词：

```text
super(子类，self).__init__(参数1，参数2，....)
```

## 类属性和方法

### 类的私有属性

__private_attrs：两个下划线开头，声明该属性为私有，不能在类的外部被使用或直接访问。在类内部的方法中使用时 self.__private_attrs。

### 类的方法

在类的内部，使用 def 关键字来定义一个方法，与一般函数定义不同，类方法必须包含参数 self，且为第一个参数，self 代表的是类的实例。

self 的名字并不是规定死的，也可以使用 this，但是最好还是按照约定使用 self。

### 类的私有方法

__private_method：两个下划线开头，声明该方法为私有方法，只能在类的内部调用 ，不能在类的外部调用。self.__private_methods。

### 类的专有方法

- \_\_init__ : 构造函数，在生成对象时调用
- \_\_del__ : 析构函数，释放对象时使用
- \_\_repr__ : 打印，转换
- \_\_setitem__ : 按照索引赋值
- \_\_getitem__: 按照索引获取值
- \_\_len__: 获得长度
- \_\_cmp__: 比较运算
- \_\_call__: 函数调用
- \_\_add__: 加运算
- \_\_sub__: 减运算
- \_\_mul__: 乘运算
- \_\_truediv__: 除运算
- \_\_mod__: 求余运算
- \_\_pow__: 乘方

### 运算符重载

Python同样支持运算符重载，我们可以对类的专有方法进行重载。

即，在类中实现\_\_add__等方法，例如：

In [None]:
class Vector:
    def __init__(self, a, b):
        self.a = a
        self.b = b

    def __str__(self):
        return 'Vector (%d, %d)' % (self.a, self.b)

    def __add__(self,other):
        return Vector(self.a + other.a, self.b + other.b)

v1 = Vector(2,10)
v2 = Vector(5,-2)
print (v1 + v2)

# 命名空间/作用域

## global 和 nonlocal关键字

当内部作用域想修改外部作用域的变量时，就要用到 global 和 nonlocal 关键字了。

In [None]:
num = 1
def fun1():
    global num  # 需要使用 global 关键字声明
    print(num)
    num = 123
    print(num)
fun1()
print(num)

如果要修改嵌套作用域（enclosing 作用域，外层非全局作用域）中的变量则需要 nonlocal 关键字了，如下实例：

In [None]:
def outer():
    num = 10
    def inner():
        nonlocal num   # nonlocal关键字声明
        num = 100
        print(num)
    inner()
    print(num)
outer()

# Python3 标准库概览

Python 标准库非常庞大，所提供的组件涉及范围十分广泛，使用标准库我们可以让您轻松地完成各种任务。

以下是一些 Python3 标准库中的模块：

- os 模块：os 模块提供了许多与操作系统交互的函数，例如创建、移动和删除文件和目录，以及访问环境变量等。
- sys 模块：sys 模块提供了与 Python 解释器和系统相关的功能，例如解释器的版本和路径，以及与 stdin、stdout 和 stderr 相关的信息。
- time 模块：time 模块提供了处理时间的函数，例如获取当前时间、格式化日期和时间、计时等。
- datetime 模块：datetime 模块提供了更高级的日期和时间处理函数，例如处理时区、计算时间差、计算日期差等。
- random 模块：random 模块提供了生成随机数的函数，例如生成随机整数、浮点数、序列等。
- math 模块：math 模块提供了数学函数，例如三角函数、对数函数、指数函数、常数等。
- re 模块：re 模块提供了正则表达式处理函数，可以用于文本搜索、替换、分割等。
- json 模块：json 模块提供了 JSON 编码和解码函数，可以将 Python 对象转换为 JSON 格式，并从 JSON 格式中解析出 Python 对象。
- urllib 模块：urllib 模块提供了访问网页和处理 URL 的功能，包括下载文件、发送 POST 请求、处理 cookies 等。

## 操作系统接口——os

在使用 os 这样的大型模块时内置的 dir() 和 help() 函数非常有用：

```python
import os

dir(os)

help(os)
```

建议使用 "import os" 风格而非 "from os import *"。这样可以保证随操作系统不同而有所变化的 os.open() 不会覆盖内置函数 open()。

```python
import os
os.getcwd()      # 返回当前的工作目录
# 'C:\\Python34'

os.chdir('/server/accesslogs')   # 修改当前的工作目录
os.system('mkdir today')   # 执行系统命令 mkdir 
# 0
```

## 文件处理包——shutil

针对日常的文件和目录管理任务，:mod:shutil 模块提供了一个易于使用的高级接口:

```python
import shutil
shutil.copyfile('data.db', 'archive.db')
shutil.move('/build/executables', 'installdir')
```

## 文件通配符——glob

glob模块提供了一个函数用于从目录通配符搜索中生成文件列表:

```python
import glob
glob.glob('*.py')
# ['primes.py', 'random.py', 'quote.py']
```

### 命令行参数——sys

获得命令行参数：
    通用工具脚本经常调用命令行参数。这些命令行参数以链表形式存储于 sys 模块的 argv 变量。例如在命令行中执行 "python demo.py one two three" 后可以得到以下输出结果:
```python
import sys
print(sys.argv)
# ['demo.py', 'one', 'two', 'three']
```

错误输出重定向和程序终止:
    sys 还有 stdin，stdout 和 stderr 属性，即使在 stdout 被重定向时，后者也可以用于显示警告和错误信息。

```python
sys.stderr.write('Warning, log file not found starting a new one\n')
# Warning, log file not found starting a new one
```

大多脚本的定向终止都使用 "sys.exit()"。

### 字符串正则匹配

re模块为高级字符串处理提供了正则表达式工具。对于复杂的匹配和处理，正则表达式提供了简洁、优化的解决方案:

```python
import re
re.findall(r'\bf[a-z]*', 'which foot or hand fell fastest')
# ['foot', 'fell', 'fastest']

re.sub(r'(\b[a-z]+) \1', r'\1', 'cat in the the hat')
# 'cat in the hat'
```

如果只需要简单的功能，应该首先考虑字符串方法，因为它们非常简单，易于阅读和调试:

```python
'tea for too'.replace('too', 'two')
# 'tea for two'
```

### 数学——math

math模块为浮点运算提供了对底层C函数库的访问:

```python
import math
math.cos(math.pi / 4)
# 0.70710678118654757
math.log(1024, 2)
# 10.0
```

### 随机数——random

random提供了生成随机数的工具。

```python
import random
random.choice(['apple', 'pear', 'banana'])
# 'apple'
random.sample(range(100), 10)   # sampling without replacement
# [30, 83, 16, 4, 8, 81, 41, 50, 18, 33]
random.random()    # random float
# 0.17970987693706186
random.randrange(6)    # random integer chosen from range(6)
# 4
```

### 访问互联网——urllib, smtplib

有几个模块用于访问互联网以及处理网络通信协议。其中最简单的两个是用于处理从 urls 接收的数据的 urllib.request 以及用于发送电子邮件的 smtplib:

```python
from urllib.request import urlopen
for line in urlopen('http://tycho.usno.navy.mil/cgi-bin/timer.pl'):
    line = line.decode('utf-8')  # Decoding the binary data to text.
    if 'EST' in line or 'EDT' in line:  # look for Eastern Time
        print(line)

# <BR>Nov. 25, 09:43:32 PM EST
```

注意：以下例子需要本地有一个在运行的邮件服务器。
```python
import smtplib
server = smtplib.SMTP('localhost')
server.sendmail('soothsayer@example.org', 'jcaesar@example.org',
"""To: jcaesar@example.org
From: soothsayer@example.org

Beware the Ides of March.
""")
server.quit()
```

### 日期和时间

datetime 模块为日期和时间处理同时提供了简单和复杂的方法。

支持日期和时间算法的同时，实现的重点放在更有效的处理和格式化输出。

```python
import datetime

#获取当前日期和时间
current_datetime = datetime.datetime.now()
print(current_datetime)

# 获取当前日期
current_date = datetime.date.today()
print(current_date)

# 格式化日期
formatted_datetime = current_datetime.strftime("%Y-%m-%d %H:%M:%S")
print(formatted_datetime) 
# 输出：2023-07-17 15:30:45
```

输出结果为：

```text
2023-07-17 18:37:56.036914
2023-07-17
2023-07-17 18:37:56
```

该模块还支持时区处理:

```python
# 导入了 datetime 模块中的 date 类
from datetime import date
now = date.today()    # 当前日期
now
# datetime.date(2023, 7, 17)

now.strftime("%m-%d-%y. %d %b %Y is a %A on the %d day of %B.")
# '07-17-23. 17 Jul 2023 is a Monday on the 17 day of July.'

# 创建了一个表示生日的日期对象
birthday = date(1964, 7, 31)
age = now - birthday   # 计算两个日期之间的时间差
age.days             # 变量age的days属性，表示时间差的天数
# 21535
```

### 数据压缩——zlib, gzip, bz2, zipfile, tarfile。

以下模块直接支持通用的数据打包和压缩格式：zlib，gzip，bz2，zipfile，以及 tarfile。

```python
import zlib
s = b'witch which has which witches wrist watch'
len(s)
# 41

t = zlib.compress(s)
len(t)
# 37

zlib.decompress(t)
# b'witch which has which witches wrist watch'

zlib.crc32(s)
# 226805979
```

### 性能度量——timeit,pstats

有些用户对了解解决同一问题的不同方法之间的性能差异很感兴趣。Python 提供了一个度量工具，为这些问题提供了直接答案。

例如，使用元组封装和拆封来交换元素看起来要比使用传统的方法要诱人的多,timeit 证明了现代的方法更快一些。

```python
from timeit import Timer
Timer('t=a; a=b; b=t', 'a=1; b=2').timeit()
# 0.57535828626024577

Timer('a,b = b,a', 'a=1; b=2').timeit()
# 0.54962537085770791
```

相对于 timeit 的细粒度，profile 和 pstats 模块提供了针对更大代码块的时间度量工具。

### 测试模块——doctest, unittest

开发高质量软件的方法之一是为每一个函数开发测试代码，并且在开发过程中经常进行测试

doctest模块提供了一个工具，扫描模块并根据程序中内嵌的文档字符串执行测试。

测试构造如同简单的将它的输出结果剪切并粘贴到文档字符串中。

通过用户提供的例子，它强化了文档，允许 doctest 模块确认代码的结果是否与文档一致:

```python
def average(values):
    """Computes the arithmetic mean of a list of numbers.

    >>> print(average([20, 30, 70]))
    40.0
    """
    return sum(values) / len(values)

import doctest
doctest.testmod()   # 自动验证嵌入测试
```

unittest模块不像 doctest模块那么容易使用，不过它可以在一个独立的文件里提供一个更全面的测试集:

```python
import unittest

class TestStatisticalFunctions(unittest.TestCase):

    def test_average(self):
        self.assertEqual(average([20, 30, 70]), 40.0)
        self.assertEqual(round(average([1, 5, 7]), 1), 4.3)
        self.assertRaises(ZeroDivisionError, average, [])
        self.assertRaises(TypeError, average, 20, 30, 70)

unittest.main() # Calling from the command line invokes all tests
```

以上我们看到的只是 Python3 标准库中的一部分模块，还有很多其他模块可以在官方文档中查看完整的标准库文档：
    https://docs.python.org/zh-cn/3/library/index.html