# GIL

## GIL 限制

单核处理器上只有一个线程处理完才能处理下一个线程

多核处理器由于GIL限制也很难并行处理

释放GIL的情况：

1. 运行完毕进入IO操作之前

2. 运行超时，python3为15毫秒后

**由于古老GIL机制，如果线程2需要在CPU 2 上执行，它需要先等待在CPU 1 上执行的线程1释放GIL（记住：GIL是全局的）。\
如果线程1是因为 i/o 阻塞让出的GIL，那么线程2必定拿到Gil。\
但如果线程1是因为timer ticks计数满100让出GIL，那么这个时候线程1和线程2公平竞争。\
但要命的是，在Python 2.x, 线程1不会动态的调整自身的优先级，所以很大概率下次被选中执行的还是线程1，\
在很多个这样的选举周期内，线程2只能安静的看着线程1拿着GIL在CPU 1上欢快的执行**

![image.png](attachment:image.png)

## 线程不安全

分别用线程1和线程2对全局变量n进行了1000000次的加和减操作。如果线程安全的话，那么最终的结果n应该还是为0

线程并不安全

In [3]:
import threading
n = 0

def add():
    global n
    for i in range(1000000):
        n = n + 1

def sub():
    global n
    for i in range(1000000):
        n = n - 1

if __name__ == "__main__":
    t1 = threading.Thread(target=add)
    t2 = threading.Thread(target=sub)

    t1.start()
    t2.start()

    t1.join()
    t2.join()

    print("n的值为:", n)


n的值为: 42641


## 分析线程不安全原因
**dis模块中的dis方法可以打印出一个函数对应的字节码执行过程**

以加法为例，\
第一步是LOAD_GLOBAL(加载全局变量n)，\
第二步LOAD_CONST(加载常量1)，\
第三步进行二进制的加法，\
第四步将计算结果存储到全局变量n中，加法计算结束。\
**这四个指令如果能够保证被作为一个整体完整地运行，那么是不会产生问题的，\
但根据前面说的线程释放GIL的原则，那么很有可能在线程正在执行这四步中的任何一步的时候释放掉GIL而进入等待状态**

In [4]:
import dis
n = 0

def add():
    global n
    n = n + 1

print(dis.dis(add))

def sub():
    global n
    n = n - 1
print(dis.dis(sub))

  6           0 LOAD_GLOBAL              0 (n)
              2 LOAD_CONST               1 (1)
              4 BINARY_ADD
              6 STORE_GLOBAL             0 (n)
              8 LOAD_CONST               0 (None)
             10 RETURN_VALUE
None
 12           0 LOAD_GLOBAL              0 (n)
              2 LOAD_CONST               1 (1)
              4 BINARY_SUBTRACT
              6 STORE_GLOBAL             0 (n)
              8 LOAD_CONST               0 (None)
             10 RETURN_VALUE
None


## 如何避免GIL的影响

1. IO密集型计算使用多线程

原因在于即使在Python中有GIL锁的存在，由于线程中的IO操作会使得线程立即释放GIL，\
切换到其他非IO线程继续操作，提高程序执行效率。相比进程操作，线程操作更加轻量级，线程之间的通讯复杂度更低，建议使用多线程。

2. 如果是计算密集型的应用，尽量使用多进程或者协程来代替多线程

# \*args, \**kwargs

当我们在写程序时，不确定将来要往函数中传入多少个参数，即可使用可变参数（即不定长参数），用*args,**kwargs表示。

*args称之为Non-keyword Variable Arguments，无关键字参数；

**kwargs称之为keyword Variable Arguments，有关键字参数；

当函数中以列表或者元组的形式传参时，就要使用*args；

当传入字典形式的参数时，就要使用**kwargs。

# 简述面向对象中\__new__和\__init__区别

\__new__方法接受的参数虽然也是和\__init__一样，但\__init__是在类实例创建之后调用，而 \__new__方法正是创建这个类实例的方法

\__new__是用来创造一个类的实例的（constructor）

\__init__是用来初始化一个实例的（initializer）


1. \__new__和\__init__参数的不同

__new__所接收的第一个参数是cls，而__init__所接收的第一个参数是self。\
这是因为当我们调用__new__的时候，该类的实例还并不存在（也就是self所引用的对象还不存在），\
所以需要接收一个类作为参数，从而产生一个实例。而当我们调用__init__的时候，实例已经存在，\
因此__init__接受self作为第一个参数并对该实例进行必要的初始化操作。这也意味着__init__是在__new__之后被调用的。

In [7]:
class newStyleClass(object): 
    # In Python2, we need to specify the object as the base.
    # In Python3 it's default.

    def __new__(cls):
        print("__new__ is called")
        return super(newStyleClass, cls).__new__(cls)

    def __init__(self):
        print("__init__ is called")
        print("self is: ", self)

newStyleClass()

__new__ is called
__init__ is called
self is:  <__main__.newStyleClass object at 0x7f98f7f62850>


<__main__.newStyleClass at 0x7f98f7f62850>

# map

In [21]:
l=[1,2,3,4]
def fc(l):
    return l**2
list(map(fc,l))

[1, 4, 9, 16]

# 随机数

In [53]:
import random
# 生成[a,b]间随机整数
random.randint(1,2)

1

In [55]:
# 生成0～1之间的随机小数
random.random()

0.709931816040641

In [25]:
import numpy as np
# 生成n个随机小数
np.random.randn(4)

array([-1.14086738,  0.11663696,  0.07981154, -0.52305775])

# python中断言方法

### assert（）方法，断言成功，则程序继续执行，断言失败，则程序报错

In [27]:
a=3
assert(a>4)

AssertionError: 

### 自定义异常用raise抛出异常

In [118]:
i=6
try:
    if i>5:
        raise ValueError('i>5')
except ValueError as e:
    print(repr(e))
    raise

ValueError('i>5')


ValueError: i>5

# python中可变数据类型和不可变数据类型

### 不可变数据类型：数值型、字符串型string和元组tuple
**不允许变量的值发生变化，如果改变了变量的值，相当于是新建了一个对象，而对于相同的值的对象，在内存中则只有一个对象（一个地址），如下图用id()方法可以打印对象的id**

In [28]:
a=3
b=3
print(id(a))
print(id(b))

4460468640
4460468640


### 可变数据类型：列表list和字典dict；

**允许变量的值发生变化，即如果对变量进行append、+=等这种操作后，只是改变了变量的值，而不会新建一个对象，变量引用的对象的地址也不会变化，不过对于相同的值的不同对象，在内存中则会存在不同的对象，即每个对象都有自己的地址，相当于内存中对于同值的对象保存了多份，这里不存在引用计数，是实实在在的对象。**

In [29]:
a=[1,2,3]
b=[1,2,3]
print(id(a))
print(id(b))

140294976188224
140294976250048


# lambda

**func=lambda 变量:计算**

In [41]:
f=lambda a,b:a*b
f(2,3)

6

### filter

**过滤掉不符合函数的元素**

In [52]:
foo = [2, 18, 9, 22, 17, 24, 8, 12, 27]
res=[i for i in filter(lambda x:x%3 == 0,foo)]
res

[18, 9, 24, 12, 27]

### sorted

**按照元素和5的距离排序**

In [62]:
sorted(foo, key=lambda x: abs(5-x))

[2, 8, 9, 12, 17, 18, 22, 24, 27]

**正数在前面从小到大，负数在后面从大到小**

In [38]:
foo = [-5,8,0,4,9,-4,-20,-2,8,2,-4]
sorted(foo,key=lambda x: -x*max(foo) if x<0 else x)

[0, 2, 4, 8, 8, 9, -2, -4, -4, -5, -20]

### map

**批量修改list**

In [60]:
[i for i in map(lambda x:x+1,foo)]

[3, 19, 10, 23, 18, 25, 9, 13, 28]

# 字典排序

In [67]:
dic={"b":1,"a":8,"c":0}

sorted(dic.items(),key=lambda x:x[0])

[('a', 8), ('b', 1), ('c', 0)]

In [68]:
sorted(dic.items(),key=lambda x:x[1])

[('c', 0), ('b', 1), ('a', 8)]

**列表嵌套字典的排序，分别根据年龄和姓名排序**

In [40]:
foo = [{"name":"zs","age":19},{"name":"ll","age":54},{"name":"wa","age":17},{"name":"df","age":23}]
sorted(foo,key=lambda x:x['age'])

[{'name': 'wa', 'age': 17},
 {'name': 'zs', 'age': 19},
 {'name': 'df', 'age': 23},
 {'name': 'll', 'age': 54}]

In [49]:
int(1.9)

1

# collections库

In [73]:
from collections import Counter
a="kjalfj;ldsjafl;hdsllfdhg;lahfbl;hl;ahlf;h"
b=[1,1,1,1,3,3,4,2]
Counter(a)

Counter({'k': 1,
         'j': 3,
         'a': 4,
         'l': 9,
         'f': 5,
         ';': 6,
         'd': 3,
         's': 2,
         'h': 6,
         'g': 1,
         'b': 1})

# 字符串判断

### 是否是整数

In [88]:
a ='1'
a.isdigit()

True

### 是否是字母

In [79]:
a='abC'
a.isalpha()

True

### 是否是小数

In [86]:
a ='1.1'
if a.count('.')==1:
    b=a.split('.')
    for i in b:
        if not i.isdigit():
            print(False)
            break
    else:
        print(True)
else:
    print(True)

True


# 处理字符串正则运算

In [94]:
test='-1+2/3*8'
print(eval(test))

4.333333333333333


In [110]:
import datetime

datetime.date.today()

datetime.date(2021, 1, 2)

# join()

x.join(y): 将x插入y

In [126]:
'ccc'.join('123')

'1ccc2ccc3'

# 编码成bytes类型

In [133]:
a=b"hello"
c="hello".encode()
a==c

True

# 迭代器

In [3]:
it=iter('asd')
while True:
    try:
        print(next(it))
    except:
        print('done')
        break

a
s
d
done


# 保留小数

In [14]:
a=1.245
print('{:.2f}'.format(a))
import numpy as np
np.floor(a)

1.25


1.0

# 异常表示

IOError：输入输出异常

AttributeError：试图访问一个对象没有的属性

ImportError：无法引入模块或包，基本是路径问题

IndentationError：语法错误，代码没有正确的对齐

IndexError：下标索引超出序列边界

KeyError:试图访问你字典里不存在的键

SyntaxError:Python代码逻辑语法出错，不能执行

NameError:使用一个还未赋予对象的变量



# 集合

In [51]:
x = set('runoob')
y = set('google')
# 交集
print(x & y)
# 并集
print(x | y)
# 差集
print(x - y)

{'o'}
{'r', 'o', 'n', 'l', 'g', 'b', 'e', 'u'}
{'n', 'r', 'b', 'u'}


# 正则表达式

In [3]:
import re
s='hello world'
# 找到所有‘o‘
re.findall('o',s)

['o', 'o']

In [4]:
# 以h开头的5字单词
re.findall('h....',s)

['hello']

In [11]:
re.findall('[a-z]o',s)

['lo', 'wo']

# Python中的类型转换

int（）  - 将任何数据类型转换为整数类型

float（）  - 将任何数据类型转换为float类型

ord（）  - 将字符转换为整数

hex（） - 将整数转换为十六进制

oct（）  - 将整数转换为八进制

tuple（） - 此函数用于转换为元组。

set（） - 此函数在转换为set后返回类型。

list（） - 此函数用于将任何数据类型转换为列表类型。

dict（） - 此函数用于将顺序元组（键，值）转换为字典。

str（） - 用于将整数转换为字符串。

complex（real，imag）  - 此函数将实数转换为复数（实数，图像）数。

# 装饰器

**把逻辑和计时分开，使用装饰器**

In [83]:
import time
def time_counter(func):
    def wrapper(*args):
        t1=time.time()
        res=func(*args)
        t2=time.time()
        print('{}{:.5f}{}'.format('time = ',t2-t1,'s'))
        return res
    return wrapper


def is_prime(num):
    """
    判断是否为质数
    """
    if num<2:
        return False
    elif num==2:
        return True
    else:
        for i in range(2,num):
            if num%i==0:
                return False
        return True

@time_counter
def prime(n):
    """
    打印2-100所有质数
    并返回总数
    """
    count=0
    for i in range(2,n):
        if is_prime(i):
            print(i,end=" ")
            count+=1
    return count

In [85]:
count=prime(100)
count

2 3 5 7 11 13 17 19 23 29 31 37 41 43 47 53 59 61 67 71 73 79 83 89 97 time = 0.00108s


25

# 简述Django的orm

# sql语句

# 简述mysql和redis区别

redis： 内存型非关系数据库，数据保存在内存中，速度快

mysql：关系型数据库，数据保存在磁盘中，检索的话，会有一定的Io操作，访问速度相对慢

# 单列模式

### 单例是一种设计模式，应用该模式的类只会生成一个实例

### 使用函数装饰器实现单例