#    闭包(closure) 
闭包简单说就是生成函数的函数  
作用：使代码更简洁，可读性更强

In [6]:
#闭包函数，其中 exponent 称为自由变量
def nth_power(exponent):
    def exponent_of(base):
        return base ** exponent
    return exponent_of # 返回值是 exponent_of 函数

square = nth_power(2) # 计算一个数的平方
cube = nth_power(3) # 计算一个数的立方
print(square(2))  # 计算 2 的平方
print(cube(2)) # 计算 2 的立方

4
8


In [5]:
def fun_gen():
    count = 0
    def fun(var):
        nonlocal count
        print(f'got {var}')
        count += 1
        print(f'invoked {count} times')
    return fun

fun1 = fun_gen()
fun2 = fun_gen()

fun1(1.1)
fun1(1.2)
fun1(1.3)
fun2(2.1)
fun2(2.2)
fun2(2.3)

got 1.1
invoked 1 times
got 1.2
invoked 2 times
got 1.3
invoked 3 times
got 2.1
invoked 1 times
got 2.2
invoked 2 times
got 2.3
invoked 3 times


# 装饰器 (decorator)
**作用**： 在不改变原函数代码的基础上，给原函数加功能  
**存在的问题**：会改变原函数的__name__和__doc__属性  
**解决办法**：  
* 方法1：使用functools库中的wraps装饰器
* 方法2：手动给返回的函数的__name__和__doc__属性赋值为原来函数的相应属性

### 示例：用装饰器给方法加上统计运算时间的功能

In [13]:
import time
import functools

# 
def showRunTimeDec1(func, *args, **kwds): 
    '''
    这样的装饰器虽然不会改变被装饰函数的函数名和函数doc，但原函数并没有变
    只在第一次调用被装饰函数时，会显示运行时间
    '''
    
    st = time.time()

    func(*args, **kwds)

    ed = time.time()
    print(f"{func.__name__} function run {ed-st} second")
    return func

def showRunTimeDec2(f):
    '''
    这是装饰器的正确使用方法
    但问题是，被装饰的函数，函数名name和帮助文档doc被改变了
    '''

    def func(*args, **kwds):
        st = time.time()

        f(*args, **kwds)

        ed = time.time()
        print(f"{func.__name__} function run {ed-st} second")
        
    return func

def showRunTimeDec3(f):
    '''
    正确使用装饰器
    并保留原有被装饰函数的信息
    2种方法：
        1. 使用functools.wraps()装饰器 （推荐）
        2. 手动为包装函数改name和doc
    '''

    @functools.wraps(f)
    def func(*args, **kwds):
        st = time.time()

        f(*args, **kwds)

        ed = time.time()
        print(f"{func.__name__} function run {ed-st} second")
        
    # 手动赋值
#     func.__name__ = f.__name__
#     func.__doc__ = f.__doc__
    return func

@showRunTimeDec1
def test1():
    '''test decorator'''
    time.sleep(0.5)

@showRunTimeDec2
def test2():
    '''test decorator'''
    time.sleep(0.5)

@showRunTimeDec3
def test3():
    '''test decorator'''
    time.sleep(0.5)
    
test1()
test1()
test1()
print(test1.__name__)
print(test1.__doc__)
print()

test2()
test2()
test2()
print(test2.__name__)
print(test2.__doc__)
print()

test3()
test3()
test3()
print(test3.__name__)
print(test3.__doc__)
print()

test1 function run 0.5007157325744629 second
test1
test decorator

func function run 0.5018458366394043 second
func function run 0.5012469291687012 second
func function run 0.5011284351348877 second
func
None

test3 function run 0.500777006149292 second
test3 function run 0.5007297992706299 second
test3 function run 0.5009357929229736 second
test3
test decorator



# 魔术方法(Magic Method)

魔法方法是python内置方法，不需要主动调用，存在的目的是为了给python的解释器进行调用，几乎每个魔法方法都有一个对应的内置函数，或者运算符，当我们对这个对象使用这些函数或者运算符时就会调用类中的对应魔法方法，我们可以重写魔术方法达到想要的目的

魔术方法以 **‘__’** 双下划线包起来，例如类的初始化方法 __init__   
Python中所有的魔术方法均在官方文档中有相应描述

示例：  
__new__(cls[, ...])	1. __new__ 是在一个对象实例化的时候所调用的第一个方法  
__init__(self[, ...])	构造器，当一个实例被创建的时候调用的初始化方法  
__del__(self)	析构器，当一个实例被销毁的时候调用的方法

# 迭代器

迭代器是一个可以记住遍历的位置的对象。

迭代器对象从集合的第一个元素开始访问，直到所有的元素被访问完结束。迭代器只能往前不会后退。

迭代器有两个基本的方法：iter() 和 next()。 

In [4]:
li = [2,3,5,7]

# 创建迭代器
it = iter(li)

# 遍历迭代器 方法1 用next(), 并捕捉StopIteration异常
while True:
    try:
        print(next(it))
    except StopIteration:
        break
        
it = iter(li)
 # 遍历迭代器 方法2 用for循环
for i in it:
    print(i)

2
3
5
7
2
3
5
7


# 生成器(Generator)

在 Python 中，使用了 yield 的函数被称为生成器（generator）。

跟普通函数不同的是，生成器是一个返回迭代器的函数，只能用于迭代操作，更简单点理解生成器就是一个迭代器。 

在调用生成器运行的过程中，每次遇到 yield 时函数会暂停并保存当前所有的运行信息，返回 yield 的值, 并在下一次执行 next() 方法时从当前位置继续运行。

调用一个生成器函数，返回的是一个迭代器对象。

以下实例使用 yield 实现斐波那契数列：

In [1]:
#!/usr/bin/python3
 
import sys
 
def fibonacci(n): # 生成器函数 - 斐波那契
    a, b, counter = 0, 1, 0
    while True:
        if (counter > n): 
            return
        yield a
        a, b = b, a + b
        counter += 1
f = fibonacci(10) # f 是一个迭代器，由生成器返回生成
 
while True:
    try:
        print (next(f), end=" ")
    except StopIteration:
        break

0 1 1 2 3 5 8 13 21 34 55 

In [3]:
# list(fibonacci(10))
[i for i in fibonacci(5)]

[0, 1, 1, 2, 3, 5]

# 异常处理

In [15]:
import traceback
import sys
a=0
b=1
try:
    c=a/b
#     d=a/NotExist
    raise ValueError("This is a exception")
except ZeroDivisionError as ex:
    print(f"Failed,caused by ZeroDivisionError,details:[{ex}]")
except NameError as ex:
    print(f"Failed,caused by NameError,details:[{ex}]")
except Exception as ex:
    ex_type,ex_val,ex_stack = sys.exc_info()
    print(ex_type,ex_val,ex.args,sep="\n")
    for stack in traceback.extract_tb(ex_stack):
        print(stack)
except:
    print(
'''
Failed,but I do not know why!
Can't handlethis error,so I decided to raise it again!
''')
    raise
finally:
    print('Whether failed or not, this line will be executed')

<class 'ValueError'>
This is a exception
('This is a exception',)
<FrameSummary file <ipython-input-15-64983c9377b4>, line 8 in <module>>
Whether failed or not, this line will be executed


# 文件I/O

In [20]:
# 写文件
f = open('test.txt',mode='w')
f.write('111\n')
f.write('222\n')
f.writelines('333')
f.writelines(['5','5','5'])
f.close()

In [29]:
# 读文件

# readlines()
f = open('test.txt')
print(f.readlines())
f.close()
print('\n------\n')

# read()
f = open('test.txt')
print(f.read())
f.close()
print('\n------\n')

# 迭代器
f = open('test.txt')
for l in f:
    print(l)

['111\n', '222\n', '333555']

------

111
222
333555

------

111

222

333555


In [2]:
# with语法 （自动关闭文件）
with open('test.txt') as f:
    print(f.read())

111
222
333555


# 上下文管理器(context manager)

简单的理解，同时包含 __enter__() 和 __exit__() 方法的对象就是上下文管理器。常见构建上下文管理器的方式有 2 种，分别是基于类实现和基于生成器实现  
使用 with as 语句操作上下文管理器（context manager），能够帮助我们自动分配，释放资源，处理异常

In [8]:
class cm_test:
    def __init__(self,handle_exception=False):
        print('TAG: __init__')
        self.handle_exception = handle_exception
        
    def fail(self):
        print('TAG: fail')
        print('Try raise a error')
        raise ValueError
        
    def __enter__(self):
        print('TAG: __enter__')
        return self
    
    def __exit__(self,exc_type,exc_value,exc_tb):
        print('TAG: __exit__')
        print(f'exc_type: {exc_type}')
        print(f'exc_value: {exc_value}')
        print(f'exc_tb: {exc_tb}')
        if self.handle_exception:
            print(f'exception {exc_type} has been handled')
        else:
            print(f'exception {exc_type} will be raised')
        return self.handle_exception
    
with cm_test(handle_exception = True) as c:
    c.fail()
    
print('-----------------------')
    
with cm_test() as c:
    c.fail()
    

TAG: __init__
TAG: __enter__
TAG: fail
Try raise a error
TAG: __exit__
exc_type: <class 'ValueError'>
exc_value: 
exc_tb: <traceback object at 0x00000274C496FC88>
exception <class 'ValueError'> has been handled
-----------------------
TAG: __init__
TAG: __enter__
TAG: fail
Try raise a error
TAG: __exit__
exc_type: <class 'ValueError'>
exc_value: 
exc_tb: <traceback object at 0x00000274C496FC88>
exception <class 'ValueError'> will be raised


ValueError: 

# list comprehension,map,filter,reduce

In [2]:
l = [1,2,3,4,5,6,7,8]

# 列表推导式 (list comphension) 获取列表内容的平方
print([e**2 for e in l])

[1, 4, 9, 16, 25, 36, 49, 64]


In [20]:
# map 获取列表内容的平方
print(list(map(lambda e:e**2,l)))

[1, 4, 9, 16, 25, 36, 49, 64]


In [None]:
# 列表推导式 (list comphension) 获取列表中的偶数
print([e for e in l if (e%2==0)])

In [25]:
# filter 获取列表中的偶数
print(list(filter(lambda e:e%2==0,l)))

[2, 4, 6, 8]


In [1]:
# reduce 计算列表中所有元素的乘积
from functools import reduce
l = [1,2,3]
print(reduce(lambda x,y:x*y,l))

6


In [6]:
# reduce 不用int()方法将str转换成int
s = '123'
i = reduce(lambda num,v: num*10+ord(v)-ord('0'), s, 0)
print(type(i))
print(i)

<class 'int'>
123


# 多线程，多进程

## 全局解释器锁 GIL(global interpreter lock)  

## 多线程

### multiprocessing 模块实现多线程

In [2]:
import time
import random

# 首先定义一个函数
def run_func(num):
    #打印开始时间
    nowstr = time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time()))
    print(f'{nowstr}: start run_func({num} pid: {os.getpid()} ')
    
    #休眠随机秒数
    random_float = random.random().0.3
    print(f'sleep {random_float} second ...\n')
    time.sleep(random_int)
     
    #打印结束时间
    nowstr = time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time()))
    print(f'{nowstr}: end run_func({num}) pid: {os.getpid()} \n')
    
    return f'run_func({num}): sleep {random_int}s'


In [None]:

# 创建线程池
from multiprocessing.dummy import Pool as ThreadPool
pool = ThreadPool()
# 把任务放入线程池
results = pool.map(run_func,range(10))
# 关闭线程池（关闭就不能再继续放任务了）
pool.close()
# 等待线程池的所有任务完成（若不等待，由于主线程结束子线程也会被结束）
pool.join()
# 输出结果
print(results)


### threading.Thread 继承线程基类 -- 自由度更高的方法

In [1]:
import time
import random
from threading import Thread

class myThread(Thread):
    def run(self):
        #打印开始时间
        nowstr = time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time()))
        print(f'{nowstr}: start myThread ')

        #休眠随机秒数
        random_int = random.randint(3,8)
        print(f'sleep {random_int}s\n')
        time.sleep(random_int)

        #打印结束时间
        nowstr = time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time()))
        print(f'{nowstr}: end myThread\n')

# 创建自定义线程的示例
my_thread = myThread()
# 注意不是调用run来启动线程，而是调用start
my_thread.start()

# 打印线程是否还在执行
print(f'is alive: {my_thread.is_alive()}\n')
# 等待子线程退出，若不这样做，主线程退出了子线程也会被退出
my_thread.join()
print('Child process exit')

2019-11-17 16:55:12: start myThread 
sleep 4s

is alive: True

2019-11-17 16:55:16: end myThread

Child process exit


## 多进程

### multiprocessing 模块实现多进程

#### 进程类 Process

In [None]:
from multiprocessing import Process
import os

# 子进程要执行的代码
def run_proc(num):
    print('Child process start.')
    print(f'Child process pid: {os.getpid()}')
    print(f'Child process ppid: {os.getppid()}')
    
    print(f'Sleeping {num} second\n')
    time.sleep(num)
    
    print('Child process end.')

print('Parent process %s.' % os.getpid())
p = Process(target=run_proc, args=(3,))
p.start()
p.join()
print('Parent process end.')

#### 进程池 Pool 批量创建子进程

In [None]:
# 把线程换成进程，很简单导包改一下就好

# 创建进程池
from multiprocessing import Pool as ProcessPool
pool = ProcessPool()

# 把任务放入进程池
results = pool.map(run_func,range(10))

# 关闭进程池（关闭就不能再继续放任务了）
pool.close()

# 等待进程池的所有任务完成（若不等待，由于主进程结束子进程也会被结束）
pool.join()

# 输出结果
print(results)

### os.fork() 实现多进程 （仅适用于Linux系统）

In [2]:
import os
import time
import random

def get_time()->str:
    return time.strftime('%H:%M:%S', time.localtime())

print("Main process start")
print("pid:", os.getpid())

pid = os.fork()
if pid == 0:
    # 这是在子进程中
    print("Child process start")
    print("pid:", os.getpid())
    print("ppid:", os.getppid())
    
    # 休眠随机1~3秒
    t = random.randint(1,3)
    print(f"Sleep {t} second ...")
    time.sleep(t)
    
    # 子进程结束
    print("Child process end")
else:
    # 这是在父进程中
    print("Parent process start")
    print("pid:", os.getpid())
    
    # 等待子进程结束，若父进程先结束，子进程将无法得到原父进程的pid，子进程将被pid为1的进程接管
    print("Wait for the child process end ...")
    os.wait()
    
    # 父进程继续运行
    print("Parent process consume")
    print("pid:", os.getpid())
    
    # 父进程结束
    print("Parent process end")

Main process start
pid: 17616


AttributeError: module 'os' has no attribute 'fork'

# package和import

如果一个目录下包含一个__init__.py的话（即使这个文件是空的），那么这个目录就是一个package

# 综合示例

### 给定一个目录，计算该目录极其字目录下所有文件的总大小

#### 1. 基础版本（递归）

In [9]:
# 基础版本
# 仅仅使用递归实现
import os
def dir_size1(pathStr):
    # 如果是文件则直接返回大小
    if os.path.isfile(pathStr):
        return os.path.getsize(pathStr)
    # 读取目录下的文件或子目录
    dirlist = os.listdir(pathStr)
    # 遍历所有内容,计算大小
    allsize = 0
    for i in dirlist:
        # 为遍历的文件添加目录
        file = os.path.join(pathStr,i)
        # 判断是否是文件
        if os.path.isfile(file):
            m = os.path.getsize(file)
            allsize += m
        # 判断是否是目录
        if os.path.isdir(file):
            # 递归调用自己
            allsize += dir_size1(file)
    return allsize

print(dir_size1('./test.txt'))
print(dir_size1('./人工智能工程师课程'))

16
6094089


#### 2. 列表推导式版本（列表推导式+递归）

In [None]:
def dir_size2(pathStr):
    return

#### 3. 列表推导式浓缩版本（列表推导式+递归 浓缩成一句）

In [None]:
def dir_size3(pathStr):
    return

#### 4. map,filter版本 （map+filter+递归）

In [12]:
def dir_size4(pathStr):
    return

#### 5. 多线程递归版本 （多线程+递归）

In [13]:
def dir_size5(pathStr):
    return

#### 6. walk版本 （walk）

In [14]:
def dir_size6(pathStr):
    return