In [1]:
import sys
sys.version # 3.8.5

'3.8.5 (default, Sep  3 2020, 21:29:08) [MSC v.1916 64 bit (AMD64)]'

# Python高级编程 笔记
## 第2章 语法最佳实践 —— 类级别以下
* Python3 只有一种能够保存文本信息的数据类型，就是`str(string)` , 编码为`Unicode`, Unicode字符串中包含无法用字节表示的“抽象”文本
* 每当需要修改过的字符串时，都需要创建一个全新的字符串实例
* 字符串拼接最好用 `str.join()` (速度更快)

In [91]:
# 将字符串对象编码为字节序列的方法
new_str = "hello world!"
str_encode = new_str.encode(encoding='UTF-8',errors='strict')
str_encode

b'hello world!'

In [None]:
# 字符串拼接
str_list = ['apple', 'boy', 'cat', 'dog']
s = ", ".join(str_list)
s

### 集合类型
列表 list，元组 tuple，字典 dictionary，集合 set
* 列表是动态的，其大小可变；而元组是不可变的，一旦创建就不能修改。
* tuple是不可变的，因此也是可哈希的。
* Python在内置的collections模块中提供了deque（双端队列）
* collections模块也提供了名为`OrderDict`的有序字典

In [27]:
# collections的deque
# https://www.geeksforgeeks.org/deque-in-python/
from collections import deque
de = deque(str_list)
de.append('apple')   # 同理de.pop()
de.appendleft('zero') # de.popleft()
print(de)
_index = de.index('apple',1,5) # 索引第一个
_count = de.count('cat') # 数量
_index, _count

deque(['zero', 'apple', 'boy', 'cat', 'dog', 'apple'])


(1, 1)

* 列表（也可以是字典，集合等）推导

In [30]:
new_list = [i for i in range(1, 10) if i % 2 == 0]
new_list

[2, 4, 6, 8]

* enumerate() 与 zip()

In [31]:
for i, element in enumerate(str_list):
    print(i, element)

0 apple
1 boy
2 cat
3 dog
('apple', 2)
('boy', 4)
('cat', 6)
('dog', 8)


In [32]:
# zip需要两个列表都是大小相等
for item in zip(str_list, new_list):
    print(item)

('apple', 2)
('boy', 4)
('cat', 6)
('dog', 8)


* 只要赋值运算符左边的变量数目与序列中的元素数目相等，你都可以用这种方法将元素序列解包到另一组变量中
* 解包还可以利用**带星号的表达式**获取单个变量中的多个元素


In [36]:
first, second, *rest = 0, 1, 2, 3, 4  # 带星号的表达式可以获取序列的剩余部分
first, *inner, last = 0, 1, 2, 3      # 也可以获得中间部分
rest, inner

([2, 3, 4], [1, 2])

* 字典的keys(),values(),items() 返回值类型不是列表,返回的*视图对象* - dict_keys
* 视图对象可以动态查看字典的内容，因此每次字典发生变化时，视图就会相应改变。

In [40]:
new_dict = {'apple':'A', 'boy':'B'}
items= new_dict.items()
print(items)
new_dict['cat'] = 'C'
print(items)

dict_items([('apple', 'A'), ('boy', 'B')])
dict_items([('apple', 'A'), ('boy', 'B'), ('cat', 'C')])


* 集合
    * set() 可变的、无序的、有限的集合
    * frozenset() 不可变的、可哈希的、无序的集合
* 由于frozenset()可以用作其他set()的元素

In [41]:
new_set = set([frozenset([1,2,3]), frozenset([2,3,4])])
new_set


{frozenset({1, 2, 3}), frozenset({2, 3, 4})}

### 高级语法
迭代器（iterator），生成器（generator），装饰器（decorator），上下文管理器（context manager）


* 迭代器
    * `__next__`：返回容器的下一个元素
    * `__iter__`：返回迭代器本身
* 生成器：当你需要返回一个序列的函数或在循环中运行的函数时，都应该考虑使用生成器。当序列元素被传递到另一个函数中以进行后续处理时，一次返回一个元素
可以提高整体性能。
    * 生成器函数：使用`yield`， 暂停函数并返回一个中间结果
    * 生成器表达式：将列表推导的中括号，替换成圆括号，就是一个生成器表达式
* 装饰器：使函数包装与方法包装变得更加容易阅读核理解 @~
* 上下文管理器: `with`
    * 关闭一个文件、释放一个锁、创建一个临时的代码补丁、在特殊环境中运行受保护的代码

In [48]:
# 使用迭代器 可以是任何集合类型
new_iter = iter(str_list)
new_iter, next(new_iter),next(new_iter)   # 返回下一个元素

(<list_iterator at 0x280a92067c0>, 'apple', 'boy')

In [54]:
# 使用生成器函数
def gen_fun(N):
    for i in range(N):
        yield i ** 2

# 这样就不用定义一个列表，保存并返回了
for item in gen_fun(5):
    print(item)

# 使用生成器表达式
gen_exp = (i**2 for i in range(5))
gen_exp, next(gen_exp)

0
1
4
9
16


(<generator object <genexpr> at 0x00000280A9EF5900>, 0)

In [62]:
# 装饰器
class WithDecorators:
    @staticmethod
    def some_static_method(self):
        print("this is static method")
    @classmethod
    def some_class_method(self):
        print("this is class method")

import logging
# 自定义装饰品
def use_logging(func):
    def wrapper(*args, **kwargs):
        logging.warning("%s is running" % func.__name__)
        return func(*args, **kwargs)
    return wrapper

# Aspect-Oriented Programming
@use_logging
def bar():
    print("I am bar")

bar()



I am bar


In [76]:
# 利用装饰器计算函数运行时间
import time
def calc_time(func):
    def wrapper(*args, **kwargs):
        start_time = time.time()
        res = func(*args, **kwargs)
        end_time = time.time()
        logging.warning(f"[{func.__name__}]'s running time is {end_time-start_time}")
        return res
    return wrapper

@calc_time
def sum_square(T):
    res = 0
    for i in range(T):
        res += i ** 2
    return res

sum_square(10000)



333283335000

### 不太常见的语法元素
* for ... else 语句: 删除一些“哨兵”变量
    * for循环之后else字句的含义是“没有break”
* 函数注解(function annotation)：没有任何语法的意义，可以为函数定义注解，并在运行时获取这些注解

In [80]:
# for ... else
def for_else_func(N):
    for number in range(N):
        if number > 10:
            break
    else:
        print("no break")   # 如果出现提前中止的情况，就不会运行到这里

for_else_func(5)


no break


In [92]:
# 函数注解
def new_fun(ham:list, eggs:str='eggs') -> set:
    pass

new_fun.__annotations__

{'ham': list, 'eggs': 'hello world!', 'return': set}

### 上下文管理器
```
with context_manager as context:
    # code block

with A() as a, B() as b:
    ...
```
#### 作为类
* `__enter__(self)`
* `__exit__(self,...)`

#### 作为函数
contextlib模块

In [5]:
# 作为类的例子
class ContextIllustration:
    def __enter__(self):
        print('entering context')

    def __exit__(self, exc_type, exc_val, exc_tb):
        print('leaving context')
        if exc_type is None:
            print('with no error')
        else:
            print('with an error (%s)' % exc_val)

print("正常运行时......")
with ContextIllustration():
    print("inside")

print("运行错误时......")
with ContextIllustration():
    raise RuntimeError("raised within 'with")

正常运行时......
entering context
inside
leaving context
with no error
运行错误时......
entering context
leaving context
with an error (raised within 'with)


RuntimeError: raised within 'with

## 第3章 语法最佳实践 —— 类级别以上
### 子类化内置类型
其实就是java的继承机制
> 如果打算创一个与序列或映射类似的新类，应考虑其特性并查看现有的内置类型。除了基本内置类型，collections模块还额外提供了许多有用的容器。
> 大部分情况下最终会使用它们。

In [16]:
# list 类型用来管理序列，如果一个类需要在内部处理序列，那么就可以对 list 进行子类化
class Folder(list):
    def __init__(self, name):
        self.name = name

    def dir(self, nesting=0):
        """显示为文件夹目录的形式"""
        offset = " " * nesting
        print('%s %s/' %(offset, self.name))

        for ele in self:
            if hasattr(ele, 'dir'):
                ele.dir(nesting+1)
            else:
                print("%s  %s" %(offset, ele))
    def test(self):
        return self

tree = Folder('project')
tree.append('README.md')
tree.dir()

com = Folder('com')
com.append('init.config')
tree.append(com)

src = Folder('src')
src.append('script.py')
com.append(src)
tree.dir()


 project/
  README.md
 project/
  README.md
  com/
   init.config
   src/
    script.py


### 访问超类中的方法
super是一个内置类，可用于访问属于某个对象的超类的属性
* 应该避免多重继承
* super的使用必须一致
* 调用父类时必须查看类的层次结构

### 高级属性访问模式
#### 名称修饰
python里没有`private`关键字，类似的功能是在一个属性前面加上`__`前缀来代替。
> 这一特性可用于保护某些属性的访问，这并不是真正的锁定，而是将这种属性加上**类名为前缀**的成名，比如`__secret_value`更改为`_MyClass__secret_value`。
> 在实践中，永远不要使用`__`的前缀的变量。如果一个属性不是公有的，约定使用`_`前缀。但这只是说明这个属性是该类的私有元素，没有真正的约束你访问。

如果使用通配符从模块中导入所有名称`from my_module import *`，则Python不会导入带有**前导下划线**的名称

In [23]:
class MyClass:
    __secret_value = 1

mc = MyClass()
# mc.__secret_value
dir(MyClass)
# 'MyClass' object has no attribute '__secret_value'

['_MyClass__secret_value',
 '__class__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__module__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '__weakref__']

#### 描述符
允许你自定义在引用一个对象的属性时应该完成的事情，它在内部被用于实现property、方法、类方法、静态方法和super类型。
描述符类基于3个特殊方法，描述符协议：
* `__set__`, `__get__`, `__delete__`
* 数据描述符：同时实现了`__get__, __set__`
* 非数据描述符：只实现了`__get__`。

每次属性查找中，实际上由对象的特殊方法`__getattribute__()`调用。每次通过*点号(instance.attribute形式)*函数调用来执行这样的查找，
都会隐式地调用`__getattribute__()`
> 数据描述符优先于`__dict__`查找，而`__dict__`查找优先于非数据描述符。

In [27]:
# https://zhuanlan.zhihu.com/p/67586184 各种get的区别

class A(object):
  def __init__(self, x):
    self.x = x

  def hello(self):
    return 'hello func'

  def __getattr__(self, item):
    print('in __getattr__')
    return 100

  def __getattribute__(self, item):
    print('in __getattribute__')
    return super(A, self).__getattribute__(item)

a = A(10)
print(a.x)
print(a.y)

in __getattribute__
10
in __getattribute__
in __getattr__
100


`__getattribute__` 必定调用，属性不存在时，`__getattr__`才会调用，通过这个方法设置属性不存在时的默认值。

### property
property提供了一个内置的描述符类型，他知道如何将一个属性连接到一组方法上。其4个可选参数:`fget` `fset` `fdel` `doc` 。
最后一个参数可以用来定义一个链接到属性的`decstring`。

创建property的最佳语法是使用property作为装饰品。其使用场景：

1. 修饰方法，使方法可以像属性一样访问
2. 与所定义的属性配合使用，这样可以防止属性被修改。
> https://zhuanlan.zhihu.com/p/64487092

### 槽 slots
能节省空间
> https://wiki.jikexueyuan.com/project/explore-python/Class/slots.html

## 元编程
### `__new__`方法 与 `__init__` 方法
 `__new__` 是在我们调用类名进行实例化时自动调用的，`__init__` 是在这个类的每一次实例化对象之后调用的。
 `__new__` 方法创建一个实例之后返回这个实例对象并传递给 `__init__`方法的 self 参数。

new方法主要是当你继承一些不可变的class时(比如int, str, tuple)， 提供给你一个自定义这些类的实例化过程的途径。
还有就是实现java中的单例模式

In [34]:
# 重载
class PositiveIntegerValid(int):
    def __new__(cls, value):
        return super(PositiveIntegerValid, cls).__new__(cls, abs(value))

p_i_v = PositiveIntegerValid(-3)
p_i_v

3

In [35]:
# 单例模式
class Singleton(object):
    def __new__(cls):
        # 关键在于这，每一次实例化的时候，我们都只会返回这同一个instance对象
        if not hasattr(cls, 'instance'):
            cls.instance = super(Singleton, cls).__new__(cls)
        return cls.instance

obj1 = Singleton()
obj2 = Singleton()

obj1.attr1 = 'value1'
obj1.attr1, obj2.attr1, obj1 is obj2


('value1', 'value1', True)

### exec、eval和compile
手动执行、求值、编译
* exec(object, globals, locals): 这一函数允许你动态执行Python代码。
* eval(expression, globals, locals): 这一函数对给定表达式进行求值并返回其结果
* compile(source, filename, mode): 这一函数将源代码编译成代码对象或AST对象
> https://www.cnblogs.com/yyds/p/6276746.html

### 抽象语法树
Python语法首先被转换成抽象语法树，然后才被编译成字节码。利用内置的AST模块，可以得到对Python语法的处理过程。

In [37]:
import ast
tree = ast.parse('print("hello world!")')
ast.dump(tree) # 语法树

"Module(body=[Expr(value=Call(func=Name(id='print', ctx=Load()), args=[Constant(value='hello world!', kind=None)], keywords=[]))], type_ignores=[])"

## 第4章 选择好的名称
### 命名风格
* CamelCase
* mixedCase
* UPPERCASE, UPPER_CASE_WITH_UNDERSCORES
* _
### 变量
#### 常量
对于常量全局变量,使用大写加下划线。常量用来定义程序所依赖的一组值，例如默认配置文件名。所以，对于项目来说最好将所有常量
集中放在包中的一个文件内。例如`Django`的`Settings.py`的模块提供所有常量。
#### 公有和私有变量
对于可变的且可以通过导入自由访问的全局变量，如果它们需要被保护，那么应该使用带一个下划线的小写字母。
一个前缀下划线可以将变量标记为包的私有元素。
> 位于函数和方法中的变量对于上下文来说是局部变量（相当于私有元素）。
> 对于类或实例变量而言，只在变量作为公有签名的一部分不会带来任何有用信息或冗余的情况下，才必须使用私有标记符。
> 换句话说，如果变量在方法内部使用，用来提供公有功能，并且只具有这个功能，那么最好将其设为私有。

### 函数和方法
函数和方法的名称应该使用**小写加下划线**，遵守PEP 8风格。
参数名称应该使用小写，如果需要的话可以加下划线。
### 类
类名称始终采用驼峰式命名法，如果它们是模块的私有类，还可能有一个前缀下划线。类和实例变量通常是名词短语，与用动词短语命名的方法名称构成使用逻辑。
### 模块
除了特殊模块`__init__`之外，模块名称都是用小写，不带下划线。如果模块是包的私有模块，则添加一个前缀下划线。

### 命名指南
#### 用 `has`,`is` 前缀命名bool元素
`is_connnected=False`, `has_cache=False`
#### 用复数形式命名集合变量
`connected_users = []`
#### 用显示名称命名字典
如果一个变量保存的是映射，那么你应该尽可能使用显示名称。`persons_addresses={ }`
#### 避免通用名称
类似于`list,dict,sequence,elements`等专用名词尽量避免。还有 `manageer,object,do,handle,..`这类含义模糊、模棱两可的词。
#### 避免现有名称
加入后缀_也是避免冲突的方法。`class`通常被替换为`klass`或`cls`

### 参数的最佳实践
函数和方法的签名是代码完整性的保证，它们驱动函数和方法的使用并构建其API。除了命名规则外，对参数也要特别小心。
#### 通过迭代设计构建参数
#### 信任参数和测试
在顶部使用断言(asserting)来确保参数具有正确的内容。唯一的使用场景就是保护代码不被无意义地调用。
#### 小心使用 `*args, **kwargs`魔法参数
可能会破坏函数或方法的robust，使签名变得模糊。
* 如果*args被用于处理元素序列`[]`，那么要求传入唯一的容器参数会更好些
* 如果**kwargs适用于同样的规则，最好固定命名参数，使方法签名更有意义

In [16]:
def division(dividend, divisor):
    assert isinstance(dividend, (int, float)), "分子不为int或float类型"
    assert isinstance(divisor, (int, float)) , "分母不为int或float类型"
    assert divisor!=0 , "分母不能为0"
    return dividend / divisor

division(2, 0)

AssertionError: 分母不能为0

In [23]:
# 魔法参数的利用
def log(**context):
    logging.warning('Context is :  %s \n' % str(context))

log(get='request.get',post='request.post')


