# 经典面试题

In [1]:
# Q: 列举5个python标准库

In [2]:
# os：提供了不少与操作系统相关联的函数
# sys: 通常用于命令行参数
# re: 正则匹配
# math: 数学运算
# datetime: 处理日期时间
# random

In [5]:
# Q: python2和python3的range(100)的区别

In [6]:
# python2返回列表，python3返回迭代器，节约内存

In [9]:
# Q: python中生成随机整数、随机小数、0--1之间小数方法

In [10]:
# 随机整数：random.randint(a,b),生成区间内的整数
# 随机小数：习惯用numpy库，利用np.random.randn(5)生成5个随机小数
# 0-1随机小数：random.random(),括号中不传参

In [36]:
# Q: 函数和方法的区别

In [39]:
# 实例化出来的去调用，叫做方法。直接使用类名去调用，叫做函数。
# 这只是在 python3 中才有的区分，python2 中全部称为方法。
from types import FunctionType, MethodType

class Foo(object):
    def func(self):
        pass

obj = Foo()  # 实例化

# 执行方式一: 调用的func是方法
obj.func() # 方法

# 执行方式二：调用的func是函数
Foo.func(123) # 函数

print(isinstance(obj.func,MethodType))
print(isinstance(Foo.func,FunctionType)) 

True
True


# re: (.*)和(.*?)

In [11]:
# Q: <div class="nam">中国</div>，用正则匹配出标签里面的内容（“中国”），其中class的类名是不确定的

In [3]:
import re

str = '<div class="nam">中国</div>'
res = re.findall(r'<div class=".*">(.*?)</div>', str)
print(res)
# . 表示匹配任何单个字符
# * 表示匹配0或多个正好在它之前的那个字符
# ? 表示匹配0或1个正好在它之前的那个字符
# .* 表示匹配除换行符之外的所有字符
# .*？表示匹配任意字符到下一个符合条件的字符
# .* 具有贪婪的性质，首先匹配到不能匹配为止，根据后面的正则表达式，会进行回溯。
# .*？则相反，一个匹配以后，就往下进行，所以不会进行回溯，具有最小匹配的性质。

# (.*?) 提取文本

['"中国"']


# callable()、__call__

In [20]:
# callable() 函数用于检查一个对象是否是可调用的。
# 如果返回 True，object 仍然可能调用失败；但如果返回 False，调用对象 object 绝对不会成功。
# 对于函数、方法、lambda 函式、 类以及实现了 __call__ 方法的类实例, 它都返回 True

In [27]:
print(callable(0))
print(callable("runoob"))

False
False


In [28]:
def add(a, b):
    return a + b

print(callable(add))  # 函数返回 True
print(callable(lambda a, b: a + b))  # lambda返回 True

True
True


In [30]:
class A:
    def method(self):
        pass

class B:
    def __call__(self):
        pass
print(callable(A))  # 类
a = A()
b = B()
print(callable(a))  # 没有实现__call__，类的实例
print(callable(b))  # 实现了__call__，类的实例

True
False
True


In [40]:
# __call__
class Role:
    def __init__ (self, name):
        self.name = name

    def __call__(self):
        print('执行Role对象')
r = Role('管理员')
# 使用调用函数的语法来调用对象，这看上去似乎是错误的，
# 但由于该 Role 类提供了 __call__ 方法，因此调用对象的本质就是执行该对象的 __call__ 方法
r()

执行Role对象


In [48]:
class Entity:
    '''调用实体来改变实体的位置。'''

    def __init__(self, size, x, y):
        self.x, self.y = x, y
        self.size = size

    def __call__(self, x, y):
        self.x, self.y = y, x  # 改变实体的位置
        print(self.x, self.y)

e = Entity(1, 2, 3) # 创建实例
e(4, 5)  # 实例可以象函数那样执行，并传入x y值，修改对象的x y 
# e(1, 2, 3)  # TypeError: __call__() takes 3 positional arguments but 4 were given

5 4


# GIL

In [31]:
# Q: 谈下python的GIL(Global Interpreter Lock)

In [32]:
# GIL是python的全局解释器锁，同一进程中假如有多个线程运行，
# 一个线程在运行python程序的时候会霸占python解释器（加了一把锁即GIL），
# 使该进程内的其他线程无法运行，等该线程运行完后其他线程才能运行。
# 如果线程运行过程中遇到耗时操作，则解释器锁解开，使其他线程运行。
# 所以在多线程中，线程的运行仍是有先后顺序的，并不是同时进行。
# 多进程中因为每个进程都能被系统分配资源，相当于每个进程有了一个python解释器，
# 所以多进程可以实现多个进程的同时运行，缺点是进程系统资源开销大。

# 尽管Python完全支持多线程编程， 但是解释器的C语言实现部分在完全并行执行时并不是线程安全的，所以这时候才引入了GIL
# 解释器被一个全局解释器锁保护着，它确保任何时候都只有一个Python线程执行(保证C实现部分能线程安全)
# GIL最大的问题就是Python的多线程程序并不能利用多核CPU的优势 （比如一个使用了多个线程的计算密集型程序只会在一个单CPU上面运行）
# 注意：GIL只会影响到那些严重依赖CPU的程序（比如计算型的）如果你的程序大部分只会涉及到I/O，比如网络交互，
# 那么使用多线程就很合适 ~ 因为它们大部分时间都在等待（线程被限制到同一时刻只允许一个线程执行这样一个执行模型。
# GIL会根据执行的字节码行数和时间片来释放GIL，在遇到IO操作的时候会主动释放权限给其他线程）
# 所以Python的线程更适用于处理I/O和其他需要并发执行的阻塞操作，而不是需要多处理器并行的计算密集型任务
# （对于IO操作来说，多进程和多线程性能差别不大）【计算密集现在可以用Python的Ray框架】