## Python的解释器机制，Python的字节码，Cython，Python与C/C++如何进行加速

## 程序的瓶颈分析，内存，基于运行时间的优化

## 并发编程和并行编程

## Ray：分布式的机器学习框架

## Python的解释器机制

源代码 -> 机器运行（只能运行二进制命令）

解释型的语言：会有一个解释器，逐行将代码翻译成二进制，送给CPU执行

编译型的语言：Complied Lanuage: 送给机器运行之前，全部变成二进制。

## Cython 把源代码变成一段二进制，然后运行，而且支持相关的c语言的语法操作

In [1]:
%load_ext Cython

In [13]:
%%cython -a

def simple_loop():
    acc = 0
    for i in range(1000):
        acc += i
    
    return acc

In [17]:
%%cython -a
from functools import reduce

def cc_simple_loop():
    cdef int acc = 0
    
    cdef int i = 0
    
    for i in range(1000):
        acc += i
    
    #mul = reduce(lambda x, y: x * y, range(acc))
    
    return acc

In [5]:
%timeit simple_loop()

44.4 µs ± 705 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)


In [12]:
%timeit cc_simple_loop()

49.4 ns ± 6.21 ns per loop (mean ± std. dev. of 7 runs, 10000000 loops each)


![image.png](attachment:image.png)

No，项目中，并不经常要打包成so。 除非是一定要隐藏源代码，否则，so包，对代码的任意一次修改，都需要重新打包。

关于程序的运行时间，常常会听到如下的声音： 

1. C语言比Python快
2. Java比Python，所以做大项目要用Java： 
- 不同语言之间的速度10 - 100倍

3. 机器比较老旧，我用的是i3处理，我需要一个i7的处理器


对于程序运行时间：

1. 非IO密集型的程序，影响最大的是，时间复杂度：

$$ O(n^2), O(nlgn) $$

$$ lim_{x \rightarrow \infty }\left[ \frac{O(n^2)}{O(nlgn)} \right] \sim \frac{n}{lgn
} \sim n $$

当程序运行非常缓慢的时候，第一反应：检查计算程序的时间复杂度，思考能否优化时间复杂度，带来的时间提升是$10^3 - 10^6$


2. 非IO密集型的程序，影响第二大的是，性能瓶颈：不到20%的代码，花费了超过80%的运行时间；确定效率瓶颈在哪里；$10^ 2 - 100^3$

3. 语言相关的, $10 - 100$

4. 不同版本的CPU，影响是多少呢？ 不超过10



## Next: python 字节码机制，Cython的相关基础知识

## 虚拟机

Java，Python等都有虚拟机

1. dis
2. ast
3. eval
4. exec

In [18]:
def simple_loop():
    acc = 0
    for i in range(1000):
        acc += i
    
    return acc

In [41]:
compile("""
def some_new_simple_loop():
    acc = 0
    for i in range(1000):
        acc += i
    
    return acc
""", "", "exec").co_code

b'd\x00d\x01\x84\x00Z\x00d\x02S\x00'

In [30]:
type(compile("1 + 1", "", "eval"))

code

In [31]:
def func(n): return n + 1

In [54]:
for byte in func.__code__.co_code:
    print(byte, end=' ')

124 0 100 1 23 0 83 0 

In [56]:
import dis

In [57]:
dis.opname[124]

'LOAD_FAST'

In [58]:
for i, byte in enumerate(func.__code__.co_code):
    if i % 2 == 0:
        byte = dis.opname[byte]
    print(byte, end=' ')

LOAD_FAST 0 LOAD_CONST 1 BINARY_ADD 0 RETURN_VALUE 0 

In [66]:
NAME = 'test'
def nested(n):
    n += 1
    def _wrap(m):
        print(NAME)
        for i in range(n):
            m = m + 1
            m += n
        NAME = '1'
        return m
    return _wrap

In [67]:
dis.dis(nested)

  3           0 LOAD_DEREF               0 (n)
              2 LOAD_CONST               1 (1)
              4 INPLACE_ADD
              6 STORE_DEREF              0 (n)

  4           8 LOAD_CLOSURE             0 (n)
             10 BUILD_TUPLE              1
             12 LOAD_CONST               2 (<code object _wrap at 0x7f849866e6f0, file "<ipython-input-66-589200a62355>", line 4>)
             14 LOAD_CONST               3 ('nested.<locals>._wrap')
             16 MAKE_FUNCTION            8
             18 STORE_FAST               1 (_wrap)

 11          20 LOAD_FAST                1 (_wrap)
             22 RETURN_VALUE

Disassembly of <code object _wrap at 0x7f849866e6f0, file "<ipython-input-66-589200a62355>", line 4>:
  5           0 LOAD_GLOBAL              0 (print)
              2 LOAD_FAST                1 (NAME)
              4 CALL_FUNCTION            1
              6 POP_TOP

  6           8 SETUP_LOOP              32 (to 42)
             10 LOAD_GLOBAL              1

## eval, exec

In [74]:
"1 + 3 + 4 + 5"
"1 + 1 * (3 - 4)"
"1 + 1 * 3 - 4"

'1 + 1 * 3 - 4'

+ * - 3 4 1 1 ==> 怎么求解？ 

In [70]:
eval('(lambda n: n + 1)(10)')

11

In [76]:
'+ 1 3'.split()[1:-1]

['1']

In [83]:
def parse_prefix(formula):
    tokens = formula.split()
    
    if len(tokens) == 1: return tokens[0]
    
    mid = ' '.join(tokens[1:-1])
    
    return '(' + parse_prefix(mid) + tokens[0] + tokens[-1] + ')'

In [87]:
eval(parse_prefix("- + + * - 3 4 1 1 10 91"))

-81

In [73]:
eval("1 + 3 + 4 + 5")

13

In [None]:
"+ 3 - 9 10"