## 海象运算符

In [1]:
a = "wtf_python"
print(a)

wtf_python


In [2]:
a := "wtf_python"
print(a)

SyntaxError: invalid syntax (3498900548.py, line 1)

In [3]:
( b := "wtf_python")
print(b)
print(type(b))

wtf_python
<class 'str'>


In [4]:
a = 6, 9
print(a)
print(type(a))

(6, 9)
<class 'tuple'>


In [5]:
a, b = 6, 9
print(a, b)

6 9


In [6]:
(a, b) = 16, 19
print(a, b)

16 19


In [7]:
(a,b = 16, 19)

SyntaxError: invalid syntax. Maybe you meant '==' or ':=' instead of '='? (1392913385.py, line 1)

In [8]:
res = (a, b := 26, 29)
print(res)
print(type(res))
print(a, b)

(16, 26, 29)
<class 'tuple'>
16 26


In [9]:
res = (a:= 6,9)
print(res)
print(a)
res = (a := 6, 9) == ((a := 6), 9)
print(res)
# (a := 6, 9) 等价于 ((a := 6), 9) ，最终得到 (a, 9)  (其中 a 的值为6)
x = (a := 696, 9)
print(x)
print(x[0])
print(x[0] is a)

(6, 9)
6
True
(696, 9)
696
True


In [10]:
a = 1000
res = (a, b := 16, 19)
print(a, b, res)

flag = (a, b := 16, 19) == ((a, (b := 16), 19))
print(flag)

1000 16 (1000, 16, 19)
True


总结

- 在顶层的无括号赋值操作（使用“海象”运算符）被限制，此例1中的 `a := "wtf_walrus"` 出现了 `SyntaxError` 。用括号括起来。它就能正常工作了。
- 一般的，包含 `=` 操作的表达式是不能用括号括起来的，因此 `(a, b = 6, 9)` 中出现了语法错误。
- “海象”运算符的语法形式为：`NAME:= expr` ，`NAME` 是一个有效的标识符，而 `expr` 是一个有效的表达式。 因此，这意味着它不支持可迭代的打包和拆包。
   - `(a := 6, 9)` 等价于 `((a := 6), 9)` ，最终得到 `(a, 9)`  (其中 `a` 的值为6)
   - 类似的， `(a, b := 16, 19)` 等价于 `(a, (b := 16), 19)` ，只是一个三元组。 

## 字符串

In [116]:
a = "some_string"
print(id(a))
b = "some" + "_" + "string"
print(id(b))
print(id(a) == id(b))
print(a is b )

140531937057968
140531937057968
True
True


In [118]:
a = "wtf"
b = "wtf"
print(a is b)

a = "wtf!"
b = "wtf!"
print(a is b)

a, b = "wtf!", "wtf!"
print(a is b)

True
False
True


In [119]:
b = 'a' * 20
print(b)
c = "aaaaaaaaaaaaaaaaaaaa"
print(id(b))
print(id(c))
print(b is c)

aaaaaaaaaaaaaaaaaaaa
140531676709072
140531676709072
True


In [14]:
b = 'a' * 100
c = "a" * 99 + "a"
print(id(b))
print(id(c))
print(b is c)

140531937116208
140531937116208
True


In [15]:
def compare(length=2):
    b = 'a' * length
    c = 'a' * (length -1) + "a"
    print(b, id(b))
    print(c, id(c))
    res = b is c
    return res

print(compare(length=100))

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa 140531937116368
aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa 140531937116528
False


In [122]:
def comp():
    b = 'a' * 4097
    print(id(b))
    c = "a" * 4096 + "a"
    print(id(c))
    print(f"b == c: { b == c }")
    print(f"b is c: { b is c }")
    return b is c
print(comp())

94681785734640
94681785749680
b == c: True
b is c: False
False


In [17]:
import dis

dis.dis(compare)


  1           0 RESUME                   0

  2           2 LOAD_CONST               1 ('a')
              4 LOAD_FAST                0 (length)
              6 BINARY_OP                5 (*)
             10 STORE_FAST               1 (b)

  3          12 LOAD_CONST               1 ('a')
             14 LOAD_FAST                0 (length)
             16 LOAD_CONST               2 (1)
             18 BINARY_OP               10 (-)
             22 BINARY_OP                5 (*)
             26 LOAD_CONST               1 ('a')
             28 BINARY_OP                0 (+)
             32 STORE_FAST               2 (c)

  4          34 LOAD_GLOBAL              1 (NULL + print)
             46 LOAD_FAST                1 (b)
             48 LOAD_GLOBAL              3 (NULL + id)
             60 LOAD_FAST                1 (b)
             62 PRECALL                  1
             66 CALL                     1
             76 PRECALL                  2
             80 CALL                  

In [18]:
dis.dis(comp)

  1           0 RESUME                   0

  2           2 LOAD_CONST               1 ('aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa')
              4 STORE_FAST               1 (b)

  3           6 LOAD_GLOBAL              1 (NULL + print)
             18 LOAD_FAST                1 (b)
             20 LOAD_GLOBAL              3 (NULL + id)
             32 LOAD_FAST                1 (b)
             34 PRECALL                  1
             38 CALL                     1
             48 PRECALL                  2
             52 CALL                     2
             62 POP_TOP

  4          64 LOAD_CONST               1 ('aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa')
             66 STORE_FAST               2 (c)

  5          68 LOAD_GLOBAL              1 (NULL + print)
             80 LOAD_FAST                2 (c)
             82 LOAD_GLOBAL              3 (NULL + id)


In [20]:
a, b = "wtf!", "wtf!"
print(f"id(a): {id(a)}, id(b): {id(b)}, a is b: {a is b}")
dis.dis("a, b = 'wtf!', 'wtf!'")

id(a): 140531937059376, id(b): 140531937059376, a is b: True
  0           0 RESUME                   0

  1           2 LOAD_CONST               0 (('wtf!', 'wtf!'))
              4 UNPACK_SEQUENCE          2
              8 STORE_NAME               0 (a)
             10 STORE_NAME               1 (b)
             12 LOAD_CONST               1 (None)
             14 RETURN_VALUE


In [21]:
a = "wtf!"
b = "wtf!"
print(f"id(a): {id(a)}")
print(f"id(b): {id(b)}")
print(f"a is b: {a is b}")
dis.dis("""a = "wtf!"
b = "wtf!\"""")

id(a): 140531937066608
id(b): 140531937066928
a is b: False
  0           0 RESUME                   0

  1           2 LOAD_CONST               0 ('wtf!')
              4 STORE_NAME               0 (a)

  2           6 LOAD_CONST               0 ('wtf!')
              8 STORE_NAME               1 (b)
             10 LOAD_CONST               1 (None)
             12 RETURN_VALUE


总结：

- 这些行为是由于 `Cpython` 在编译优化时, 某些情况下会尝试使用已经存在的不可变对象而不是每次都创建一个新对象. (这种行为被称作字符串的驻留[string interning])
- 发生驻留之后, 许多变量可能指向内存中的相同字符串对象. (从而节省内存)
- 在上面的代码中, 字符串是隐式驻留的. 何时发生隐式驻留则取决于具体的实现. 这里有一些方法可以用来猜测字符串是否会被驻留:
    - 所有长度为 0 和长度为 1 的字符串都被驻留.
    - 字符串在编译时被实现 (`'wtf'` 将被驻留, 但是 `''.join(['w', 't', 'f'])` 将不会被驻留)
    - 字符串中只包含字母，数字或下划线时将会驻留. 所以 `'wtf!'` 由于包含 `!` 而未被驻留. 可以在[这里](https://github.com/python/cpython/blob/3.6/Objects/codeobject.c#L19)找到 CPython 对此规则的实现.
- 当在同一行将 `a` 和 `b` 的值设置为 `"wtf!"` 的时候, `Python` 解释器会创建一个新对象, 然后同时引用第二个变量(译: 仅适用于3.7以下, 详细情况请看[这里](https://github.com/leisurelicht/wtfpython-cn/issues/13)). 如果你在不同的行上进行赋值操作, 它就不会“知道”已经有一个 `wtf!` 对象 (因为 `"wtf!"` 不是按照上面提到的方式被隐式驻留的). 它是一种编译器优化, 特别适用于交互式环境.    
- 常量折叠(constant folding) 是 Python 中的一种 窥孔优化(peephole optimization) 技术. 这意味着在编译时表达式 'a'*20 会被替换为 'aaaaaaaaaaaaaaaaaaaa' 以减少运行时的时钟周期. 只有长度小于 20 的字符串才会发生常量折叠. (为啥? 想象一下由于表达式 `'a'*10**10` 而生成的 .pyc 文件的大小). 相关的源码实现在[这里](https://github.com/python/cpython/blob/3.6/Python/peephole.c#L288). 在python3.10开始就找不到这个了。可能是迁移到了AST优化器，参考资料： [bpo-29469](https://bugs.python.org/issue29469) 和 [bpo-11549](https://bugs.python.org/issue11549)



## 链式操作

In [29]:
a = (False == False)
print(a)
print(type(a))
res = (False == False) in [False]
print(res)
dis.dis("(False == False) in [False]")

True
<class 'bool'>
False
  0           0 RESUME                   0

  1           2 LOAD_CONST               0 (False)
              4 LOAD_CONST               0 (False)
              6 COMPARE_OP               2 (==)
             12 LOAD_CONST               1 ((False,))
             14 CONTAINS_OP              0
             16 RETURN_VALUE


In [24]:
res = False == (False in [False])
print(res)
dis.dis("False == (False in [False])")

False
  0           0 RESUME                   0

  1           2 LOAD_CONST               0 (False)
              4 LOAD_CONST               0 (False)
              6 LOAD_CONST               1 ((False,))
              8 CONTAINS_OP              0
             10 COMPARE_OP               2 (==)
             16 RETURN_VALUE


In [27]:
res = False == False in [False] # 等价于 (False == False) and (False in [False])
print(res)
dis.dis("False == False in [False]")

True
  0           0 RESUME                   0

  1           2 LOAD_CONST               0 (False)
              4 LOAD_CONST               0 (False)
              6 SWAP                     2
              8 COPY                     2
             10 COMPARE_OP               2 (==)
             16 JUMP_IF_FALSE_OR_POP     3 (to 24)
             18 LOAD_CONST               1 ((False,))
             20 CONTAINS_OP              0
             22 RETURN_VALUE
        >>   24 SWAP                     2
             26 POP_TOP
             28 RETURN_VALUE


说明：
根据 [https://docs.python.org/3/reference/expressions.html#comparisons](https://docs.python.org/3/reference/expressions.html#comparisons)

> 形式上, 如果 a, b, c, ..., y, z 是表达式, 而 op1, op2, ..., opN 是比较运算符, 那么除了每个表达式最多只出现一次以外 a op1 b op2 c ... y opN z 就等于 a op1 b and b op2 c and ... y opN z.

例如 `a op1 b op2 c` 等价于 `a op1 b and b op2 c`， 

如 `False is False is False` 等价于 `(False is False) and (False and False)`
如 `True is False == False` 等价于 `(True is False) and (False == False)` 因为Python的短路特性，第一部分为`False`所以结果为`False`。

    


## is 操作符

In [41]:
a = 256
b = 256
print(a is b)

True


In [40]:
a = 257
b = 257
print(a is b)

False


In [42]:
a = -6
b = -6
print(a is b)

False


In [43]:
a = -5
b = -5
print(a is b)

True


In [44]:
a = []
b = []
print(a is b)

False


In [45]:
a = tuple()
b = tuple()
print(a is b)

True


In [46]:
a = set()
b = set()
print(a is b)

False


In [47]:
a = dict()
b = dict()
print(a is b)

False


In [48]:
a, b = 257, 257
print(a is b)

True


In [50]:
a, b = 3.2, 3.2
print(a is b)

True


In [51]:
a, b = "hello world!", "hello world!"
print(a is b)

True


说明

**is和==的区别**

- `is` 运算符检查两个运算对象是否引用自同一对象 (即, 它检查两个运算对象是否相同).
- `==` 运算符比较两个运算对象的值是否相等.
因此 `is` 代表引用相同, `==` 代表值相等. 下面的例子可以很好的说明这点,

```python
>>> [] == []
True
>>> [] is [] # 这两个空列表位于不同的内存地址.
False
```

**小整数池**

`256` 是一个已经存在的对象, 而 `257` 不是

当你启动Python 的时候, 数值为 `-5` 到 `256` 的对象就已经被分配好了. 这些数字因为经常被使用, 所以会被提前准备好.

Python 通过这种创建小整数池的方式来避免小整数频繁的申请和销毁内存空间.

引用自 [https://docs.python.org/3/c-api/long.html](https://docs.python.org/3/c-api/long.html)


> 当前的实现为-5到256之间的所有整数保留一个整数对象数组, 当你创建了一个该范围内的整数时, 你只需要返回现有对象的引用.

**当 `a` 和 `b` 在同一行中使用相同的值初始化时，会指向同一个对象.**

```python
>>> a, b = 257, 257
>>> id(a)
140640774013296
>>> id(b)
140640774013296
>>> a = 257
>>> b = 257
>>> id(a)
140640774013392
>>> id(b)
140640774013488
```

- 当 `a` 和 `b` 在同一行中被设置为 `257` 时, Python 解释器会创建一个新对象, 然后同时引用第二个变量. 如果你在不同的行上进行, 它就不会 "知道" 已经存在一个 `257` 对象了.

- 这是一种特别为交互式环境做的编译器优化. 当你在实时解释器中输入两行的时候, 他们会单独编译, 因此也会单独进行优化. 如果你在 `.py` 文件中尝试这个例子, 则不会看到相同的行为, 因为文件是一次性编译的。这种优化不仅限于整数，它也适用于其他不可变数据类型.


## 哈希

In [60]:
d = {}
d[5.5] = "aaa"
d[5.0] = "bbb"
d[5] = "ccc"
print(d)
print(d[5.5])
print(d[5.0])
print(d[5])

res = (5 == 5.0 == 5 + 0j)
print(res)
print(5.0 in d)
print(5 in d)
print(5 + 0j in d)
res = (hash(5) == hash(5.0) == hash(5 + 0j))
print(f"hash(5): {hash(5)}, hash(5.0): {hash(5.0)}, hash(5 + 0j): {hash(5 + 0j)}, is equal: {res}")

{5.5: 'aaa', 5.0: 'ccc'}
aaa
ccc
ccc
True
True
True
True
hash(5): 5, hash(5.0): 5, hash(5 + 0j): 5, is equal: True


说明

- 这个 StackOverflow的 [回答](https://stackoverflow.com/questions/32209155/why-can-a-floating-point-dictionary-key-overwrite-an-integer-key-with-the-same-v/32211042#32211042) 漂亮地解释了这背后的基本原理.
- Python 字典中键的唯一性是根据 等价性，而不是同一性。 因此，即使 5、5.0 和 5 + 0j 是不同类型的不同对象，由于它们是相等的，它们不能都在同一个 dict（或 set）中。 只要您插入其中任何一个，尝试查找任何不同但等价的键都将使用原始映射值成功（而不是因“KeyError”而失败。
- 这在赋值的时候也会生效。
- 那么我们如何将键值更新为5（而不是5.0）？ 我们实际上不能原地更新，但是我们可以先删除键（del d[5.0]），然后重新赋值（d[5]）得到整数5 作为键而不是浮点数 5.0，尽管这属于极少数情况。
- Python 是如何在包含 5.0 的字典中找到 5 的？ Python 只需要花费常数时间，而无需使用哈希函数遍历每一项。当 Python 在 dict 中查找键 foo 时，它首先计算 hash(foo)（以常数时间运行）。因为在 Python 中，要求相等的对象具有相同的哈希值（此处为[文档](https://docs.python.org/3/reference/datamodel.html#object.__hash__)），`5` 、`5.0` 和 `5 + 0j` 具有相同的哈希值。

**注意： 反之不一定正确：具有相等哈希值的对象本身可能不相等。**（这是[哈希冲突](https://en.wikipedia.org/wiki/Collision_(computer_science)）造成的，这也会降低哈希运算的性能。）

## 对象相等

In [64]:
class WTF:
    pass


dis.dis("""
class WTF:
    pass
    """
)

  0           0 RESUME                   0

  2           2 PUSH_NULL
              4 LOAD_BUILD_CLASS
              6 LOAD_CONST               0 (<code object WTF at 0x7fd026c6af50, file "<dis>", line 2>)
              8 MAKE_FUNCTION            0
             10 LOAD_CONST               1 ('WTF')
             12 PRECALL                  2
             16 CALL                     2
             26 STORE_NAME               0 (WTF)
             28 LOAD_CONST               2 (None)
             30 RETURN_VALUE

Disassembly of <code object WTF at 0x7fd026c6af50, file "<dis>", line 2>:
  2           0 RESUME                   0
              2 LOAD_NAME                0 (__name__)
              4 STORE_NAME               1 (__module__)
              6 LOAD_CONST               0 ('WTF')
              8 STORE_NAME               2 (__qualname__)

  3          10 LOAD_CONST               1 (None)
             12 RETURN_VALUE


In [69]:
print(WTF() == WTF()) # 结果为False
print(WTF() is WTF()) # 结果为False
print(hash(WTF()) == hash(WTF())) # 结果也应该False,实际上为True
print(id(WTF()) == id(WTF())) # 结果为True

False
False
True
True


说明 

- 当调用 `id` 函数时, Python 创建了一个 `WTF` 类的对象并传给 `id` 函数. 然后 `id` 函数获取其id值 (也就是内存地址), 然后丢弃该对象. 该对象就被销毁了.

- 当我们连续两次进行这个操作时, Python会将相同的内存地址分配给第二个对象. 因为 (在CPython中) id 函数使用对象的内存地址作为对象的id值, 所以两个对象的id值是相同的.

- 综上, 对象的id值仅仅在对象的生命周期内唯一. 在对象被销毁之后, 或被创建之前, 其他对象可以具有相同的id值.

In [73]:
class WTF(object):
    def __init__(self): print("I")
    def __del__(self): print("D")
    
print(WTF() is WTF())
print(id(WTF()) == id(WTF()))

dis.dis("""
class WTF(object):
    def __init__(self): print("I")
    def __del__(self): print("D")

print(WTF() is WTF())
"""
)

print("*"* 100)

dis.dis("""
class WTF(object):
    def __init__(self): print("I")
    def __del__(self): print("D")

print(id(WTF()) == id(WTF()))
"""
)

I
I
D
D
False
I
D
I
D
True
  0           0 RESUME                   0

  2           2 PUSH_NULL
              4 LOAD_BUILD_CLASS
              6 LOAD_CONST               0 (<code object WTF at 0x7fd014c983b0, file "<dis>", line 2>)
              8 MAKE_FUNCTION            0
             10 LOAD_CONST               1 ('WTF')
             12 LOAD_NAME                0 (object)
             14 PRECALL                  3
             18 CALL                     3
             28 STORE_NAME               1 (WTF)

  6          30 PUSH_NULL
             32 LOAD_NAME                2 (print)
             34 PUSH_NULL
             36 LOAD_NAME                1 (WTF)
             38 PRECALL                  0
             42 CALL                     0
             52 PUSH_NULL
             54 LOAD_NAME                1 (WTF)
             56 PRECALL                  0
             60 CALL                     0
             70 IS_OP                    0
             72 PRECALL                  1


In [82]:
a = WTF()
b = WTF()
print(id(a))
print(id(b))
print(a is b)

I
I
140531937280400
140531937290960
False


In [84]:
c = id(WTF())
d = id(WTF())
print(c)
print(d)
print(c == d)

I
D
I
D
140531937229968
140531937226896
False


## 有序字典

In [86]:
from collections import OrderedDict

dictionary = dict()
dictionary[1] = 'a'
dictionary[2] = 'b'

ordered_dict = OrderedDict()
ordered_dict[1] = 'a'
ordered_dict[2] = 'b';

another_ordered_dict = OrderedDict()
another_ordered_dict[2] = 'b'
another_ordered_dict[1] = 'a';
    
print(dictionary == ordered_dict)
print(dictionary == another_ordered_dict)
print(ordered_dict == another_ordered_dict)

True
True
False


In [87]:
 len({dictionary, ordered_dict, another_ordered_dict})

TypeError: unhashable type: 'dict'

In [88]:
class DictWithHash(dict):
    """
    实现了 __hash__ 魔法方法的dict类
    """
    __hash__ = lambda self: 0

class OrderedDictWithHash(OrderedDict):
    """
    实现了 __hash__ 魔法方法的OrderedDict类
    """
    __hash__ = lambda self: 0
    
    
dictionary = DictWithHash()
dictionary[1] = 'a'
dictionary[2] = 'b'

ordered_dict = OrderedDictWithHash()
ordered_dict[1] = 'a'
ordered_dict[2] = 'b';

another_ordered_dict = OrderedDictWithHash()
another_ordered_dict[2] = 'b'
another_ordered_dict[1] = 'a';
    
print(dictionary == ordered_dict)
print(dictionary == another_ordered_dict)
print(ordered_dict == another_ordered_dict)

print(len({dictionary, ordered_dict, another_ordered_dict}))
print(len({ordered_dict, another_ordered_dict, dictionary}))

True
True
False
1
2


说明

- 等号的传递性没有在 `dictionary`, `ordered_dict` 和 `another_ordered_dict` 之间生效是 `OrderedDict` 类中 `__eq__` 方法的实现方式造成的。根据[文档](https://docs.python.org/zh-cn/3/library/collections.html#ordereddict-objects)以下部分:

> 对于 `OrderedDict` 类之间，相等性的判定是位置敏感的，实现类似于 `list(od1.items())==list(od2.items())`。对于 `OrderedDict` 类与其他 `Mapping` 对象（例如dict 类），相等性的判定是非位置敏感的。

- 这是为了任何使用常规 dict 类的地方能够直接使用 OrderedDict 对象代替。

## 不停的try

In [91]:
def some_func():
    try:
        return 'from_try'
    finally:
        return 'from_finally'

def another_func(): 
    for _ in range(3):
        try:
            continue
        finally:
            print("Finally!")

def one_more_func(): # A gotcha!
    try:
        for i in range(3):
            try:
                1 / i
            except ZeroDivisionError:
                # Let's throw it here and handle it outside for loop
                raise ZeroDivisionError("A trivial divide by zero error")
            finally:
                print("Iteration", i)
                break
    except ZeroDivisionError as e:
        print("Zero division error occurred", e)
        
print(some_func())
another_func()
one_more_func()

from_finally
Finally!
Finally!
Finally!
Iteration 0


说明

- 当在 "try...finally" 语句的 `try` 中执行 `return`, `break` 或 `continue` 后, `finally` 子句依然会执行.
- 函数的返回值由最后执行的 `return` 语句决定. 由于 `finally` 子句一定会执行, 所以 `finally` 子句中的 `return` 将始终是最后执行的语句.
- 这里需要注意的是，如果 `finally` 子句执行 `return` 或 `break` 语句，临时保存的异常将被丢弃

## for循环

In [92]:
some_string = "wtf"
some_dict = {}
for i, some_dict[i] in enumerate(some_string):
    pass

print(some_dict)

{0: 'w', 1: 't', 2: 'f'}


说明

- [Python 语法](https://docs.python.org/3/reference/grammar.html) 中对 `for` 的定义是:
```
for_stmt: 'for' exprlist 'in' testlist ':' suite ['else' ':' suite]
```
其中 exprlist 指分配目标. 这意味着对可迭代对象中的每一项都会执行类似 {exprlist} = {next_value} 的操作.

一个有趣的例子说明了这一点:
```python
for i in range(4):
    print(i)
    i = 10
```
Output:
```
0
1
2
3
```

由于循环在Python中工作方式, 赋值语句 `i = 10` 并不会影响迭代循环, 在每次迭代开始之前, 迭代器(这里指 `range(4)`) 生成的下一个元素就被解包并赋值给目标列表的变量(这里指 `i`)了.
    

## 生成器

In [93]:
array = [1, 8, 15]
# 一个典型的生成器表达式
g = (x for x in array if array.count(x) > 0)
print(list(g))

[1, 8, 15]


In [95]:
array = [1, 8, 15]
# 一个典型的生成器表达式
g = (x for x in array if array.count(x) > 0)
array = [2, 8, 22] # 将array的内容修改 结果只有8一个元素了
print(list(g))

[8]


In [96]:
array_1 = [1,2,3,4]
g1 = (x for x in array_1)
array_1 = [1,2,3,4,5]

array_2 = [1,2,3,4]
g2 = (x for x in array_2)
array_2[:] = [1,2,3,4,5]
print(list(g1))
print(list(g2))

[1, 2, 3, 4]
[1, 2, 3, 4, 5]


In [100]:
array_3 = [1, 2, 3]
array_4 = [10, 20, 30]
gen = (i + j for i in array_3 for j in array_4)

array_3 = [4, 5, 6] 
array_4 = [400, 500, 600]
print(list(gen))

[401, 501, 601, 402, 502, 602, 403, 503, 603]


说明
- 在生成器表达式中, `in` 子句在声明时执行, 而条件子句则是在运行时执行.
    - 所以在运行前, `array` 已经被重新赋值为 `[2, 8, 22]`, 因此对于之前的 `1`, `8` 和 `15`, 只有 `count(8)` 的结果是大于 `0` 的, 所以生成器只会生成 8.
- 第二部分中 `g1` 和 `g2` 的输出差异则是由于变量 `array_1` 和 `array_2` 被重新赋值的方式导致的.
    - 在第一种情况下, `array_1` 被绑定到新对象 `[1,2,3,4,5]`, 因为 `in` 子句是在声明时被执行的， 所以它仍然引用旧对象 `[1,2,3,4]`(并没有被销毁).
    - 在第二种情况下, 对 `array_2` 的切片赋值将相同的旧对象 `[1,2,3,4]` 原地更新为 `[1,2,3,4,5]`. 因此 `g2` 和 `array_2` 仍然引用同一个对象(这个对象现在已经更新为 `[1,2,3,4,5]`).
- 按照目前讨论的逻辑，第三个代码段中的 `list(gen)` 的值不应该是 `[11, 21, 31, 12, 22, 32, 13, 23, 33]` 吗? （毕竟 `array_3` 和 `array_4` 的行为与 `array_1` 一样）。 [PEP-289](https://www.python.org/dev/peps/pep-0289/#the-details) 中解释了（只有）`array_4` 值更新的原因

> 只有最外层的 for 表达式会立即计算，其他表达式会延迟到生成器运行。

## is not xxx 不是 is (not xxx)

## *号用法

## object和type

## 子类

## 方法的相等性和唯一性

In [110]:
class SomeClass:
    def method(self):
        pass

    @classmethod
    def classm(cls):
        pass

    @staticmethod
    def staticm():
        pass
    
print(SomeClass.method is SomeClass.method)
print(SomeClass.classm is SomeClass.classm)
print(SomeClass.classm == SomeClass.classm)
print(SomeClass.staticm is SomeClass.staticm)

a = SomeClass.method
b = SomeClass.method
print(f"a: {a}, b: {b}, id(a): {id(a)}, id(b): {id(b)}")

a = SomeClass.classm
b = SomeClass.classm
print(f"a: {a}, b: {b}, id(a): {id(a)}, id(b): {id(b)}")

a = SomeClass.staticm
b = SomeClass.staticm
print(f"a: {a}, b: {b}, id(a): {id(a)}, id(b): {id(b)}")

True
False
True
True
a: <function SomeClass.method at 0x7fd0148d1940>, b: <function SomeClass.method at 0x7fd0148d1940>, id(a): 140531674716480, id(b): 140531674716480
a: <bound method SomeClass.classm of <class '__main__.SomeClass'>>, b: <bound method SomeClass.classm of <class '__main__.SomeClass'>>, id(a): 140531677812160, id(b): 140531677817216
a: <function SomeClass.staticm at 0x7fd0148d0040>, b: <function SomeClass.staticm at 0x7fd0148d0040>, id(a): 140531674710080, id(b): 140531674710080


In [115]:
o1 = SomeClass()
o2 = SomeClass()

a = o1.method
b = o2.method
print(f"a: {a}, b: {b}, a == b: {a==b}, a is b: {a is b}, id(a): {id(a)}, id(b): {id(b)}")

a = o1.method
b = o1.method
print(f"a: {a}, b: {b}, a == b: {a==b}, a is b: {a is b}, id(a): {id(a)}, id(b): {id(b)}")

a = o1.classm
b = o1.classm
print(f"a: {a}, b: {b}, a == b: {a==b}, a is b: {a is b}, id(a): {id(a)}, id(b): {id(b)}")


a = o1.classm
b = o1.classm
c = o2.classm
d = SomeClass.classm
print(f"a == b == c == d: {a == b == c == d}")
print(f"a is b is c is d: {a is b is c is d}")

a = o1.staticm
b = o1.staticm
c = o2.staticm
d = SomeClass.staticm
print(f"a is b is c is d: {a is b is c is d}")

a: <bound method SomeClass.method of <__main__.SomeClass object at 0x7fd014b7d1d0>>, b: <bound method SomeClass.method of <__main__.SomeClass object at 0x7fd014b7fb50>>, a == b: False, a is b: False, id(a): 140531936927232, id(b): 140531677519616
a: <bound method SomeClass.method of <__main__.SomeClass object at 0x7fd014b7d1d0>>, b: <bound method SomeClass.method of <__main__.SomeClass object at 0x7fd014b7d1d0>>, a == b: True, a is b: False, id(a): 140531677518912, id(b): 140531936927232
a: <bound method SomeClass.classm of <class '__main__.SomeClass'>>, b: <bound method SomeClass.classm of <class '__main__.SomeClass'>>, a == b: True, a is b: False, id(a): 140531677512512, id(b): 140531677513472
a == b == c == d: True
a is b is c is d: False
a is b is c is d: True


说明

- 访问  `classm` or `method` 两次, 为 `SomeClass` 的同一个实例创建了相等但是不同的对象。 
```python
a = o1.method
b = o1.method
print(f"a: {a}, b: {b}, a == b: {a==b}, a is b: {a is b}, id(a): {id(a)}, id(b): {id(b)}")
```
输出
```
a: <bound method SomeClass.method of <__main__.SomeClass object at 0x7fd014b7d1d0>>, b: <bound method SomeClass.method of <__main__.SomeClass object at 0x7fd014b7d1d0>>, a == b: True, a is b: False, id(a): 140531677518912, id(b): 140531936927232
```

- 函数是描述符。每当将函数作为属性访问时，就会调用描述符，创建一个方法对象，该对象将函数与拥有该属性的对象“绑定”。如果被调用，该方法调用函数，隐式传递绑定对象作为第一个参数（这就是我们如何将 `self` 作为第一个参数获取，尽管没有显式传递它）。

```python
>>> o1.method
<bound method SomeClass.method of <__main__.SomeClass object at ...>>
```

- 多次访问该属性，每次都会创建一个方法对象！ 因此，`o1.method is o1.method` 永远不会是真的。但是，将函数作为类属性（而不是实例）访问并不会创建方法对象，所以 `SomeClass.method is SomeClass.method` 是真的。
```python
>>> SomeClass.method
<function SomeClass.method at ...>
```

- `classmethod` 将函数转换为类方法。 类方法是描述符，当被访问时，它会创建一个绑定类本身的方法对象，而不是对象本身。
```python
>>> o1.classm
<bound method SomeClass.classm of <class '__main__.SomeClass'>>
```

- 与函数不同，`classmethod` 在作为类属性访问时也会创建一个方法（在这种情况下，它们绑定类，而不是类的类型）。 所以 `SomeClass.classm is SomeClass.classm` 是假的。
```python
>>> SomeClass.classm
<bound method SomeClass.classm of <class '__main__.SomeClass'>>
```

- 当两个函数相等并且绑定的对象相同时，方法对象比较相等。 所以`o1.method == o1.method` 为真，尽管它们在内存中是两个不同的对象。

- `staticmethod` 将函数转换为“无操作”描述符，它按原样返回函数。没有方法对象被创建，所以 `is` 的比较运算为真。
```python
>>> o1.staticm
<function SomeClass.staticm at ...>
>>> SomeClass.staticm
<function SomeClass.staticm at ...>
```

- 每次 Python 调用实例方法时都必须创建新的“方法”对象，并且每次都必须修改参数以插入 `self` 严重影响性能。`CPython 3.7` [解决了这个问题](https://bugs.python.org/issue26110) 。通过引入新的操作码来处理调用方法而不创建临时方法对象。这仅在实际调用访问的函数时使用，因此这里的代码片段不受影响，仍然会生成方法:)

In [134]:
def multipliers():
    return [lambda x : i * x for i in range(4)]
    
print([m(2) for m in multipliers()]) # [6,6,6,6]

# import inspect
# res = multipliers()
# for item in res:
#     print(inspect.getclosurevars(item))
    
    
def foo(name, age=2, sex=1):
    print(name)
    
print(inspect.getfullargspec(foo))


[6, 6, 6, 6]
FullArgSpec(args=['name', 'age', 'sex'], varargs=None, varkw=None, defaults=(2, 1), kwonlyargs=[], kwonlydefaults=None, annotations={})


In [3]:

# 一个简单的例子, 统计下面可迭代对象中的布尔型值的个数和整型值的个数
mixed_list = [False, 1.0, "some_string", 3, True, [], False]
integers_found_so_far = 0
booleans_found_so_far = 0

for item in mixed_list:
    if isinstance(item, int):
        integers_found_so_far += 1
    if isinstance(item, bool):
        booleans_found_so_far += 1
print(integers_found_so_far)
print(booleans_found_so_far)

4
3


In [5]:
print(issubclass(bool, int))
print(isinstance(True, int))
print(isinstance(False, int))
print(isinstance(True, bool))
print(isinstance(False, bool))

True
True
True
True
True


In [8]:
class Persion(object):
    x = 1
    
class Man(Persion):
    pass

class Woman(Persion):
    pass

print(Persion.x, Man.x, Woman.x)
print(id(Persion.x), id(Man.x), id(Woman.x))

Man.x = 2
print(Persion.x, Man.x, Woman.x)
print(id(Persion.x), id(Man.x), id(Woman.x))

Woman.x = 3
print(Persion.x, Man.x, Woman.x)
print(id(Persion.x), id(Man.x), id(Woman.x))

1 1 1
94701593490024 94701593490024 94701593490024
1 2 1
94701593490024 94701593490056 94701593490024
1 2 3
94701593490024 94701593490056 94701593490088


In [18]:
A0 = dict(zip(('a','b','c','d','e'),(1,2,3,4,5)))
print(A0)
A1 = list(range(10))
print(A1)
A2 = [i for i in A1 if i in A0] # []
print(A2)
A3 = [A0[s] for s in A0]  # [1,2,3,4,5]
print(A3)
A4 = [i for i in A1 if i in A3] # [1,2,3,4,5]
print(A4)
A5 = {i: i*i for i in A1} # {0:0, 1:1, 2:4, 3:9, ...... ,9:81}
print(A5)
A6 = [[i, i*i] for i in A1]  # [[0,0],[1,1],[2,4], ...... , [9,81]]
print(A6)

{'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5}
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[]
[1, 2, 3, 4, 5]
[1, 2, 3, 4, 5]
{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81}
[[0, 0], [1, 1], [2, 4], [3, 9], [4, 16], [5, 25], [6, 36], [7, 49], [8, 64], [9, 81]]


In [20]:
l = []
for i in range(10):
    l.append({"num":i})
print(l)

[{'num': 0}, {'num': 1}, {'num': 2}, {'num': 3}, {'num': 4}, {'num': 5}, {'num': 6}, {'num': 7}, {'num': 8}, {'num': 9}]


In [21]:
l = []
a = {"num": 0}
for i in range(10):
    a["num"] = i
    l.append(a)
print(l)

[{'num': 9}, {'num': 9}, {'num': 9}, {'num': 9}, {'num': 9}, {'num': 9}, {'num': 9}, {'num': 9}, {'num': 9}, {'num': 9}]


In [30]:
class Persion(object):
    def __init__(self, name, age, sex):
        print("__init__")
        self.name = name
        self.age = age
        self.sex = sex
    
    def __new__(cls, *args, **kwargs):
        print("__new__")
        obj = super().__new__(cls)
        return obj
        
    def say(self):
        print("hello world")
        
        
p = Persion("hello", 18, "man")
p.say()
print(p.name, p.age, p.sex)

__new__
__init__
hello world
hello 18 man


In [37]:
import random

print(random.random())
print(random.uniform(0, 10))
print(random.randint(0, 10))
print(random.randrange(0, 10, 2))
print(random.choice([1,2,4,5,6]))

0.644882972614516
9.95203691893735
1
0
6


In [39]:
import datetime

now = datetime.datetime.now()
start = now.replace(month=1).replace(day=1)

print(start)
print(now)
diff = now - start
print(diff)
days = diff.days
print(days)

2023-01-01 14:05:17.651136
2023-11-03 14:05:17.651136
306 days, 0:00:00
306


In [46]:
import os

res = os.walk(".")
print(type(res))

print(res)

<class 'generator'>
<generator object _walk at 0x7fd79d5dab60>


In [57]:
import dis
def foo():
    print("foo")
    while True:
        res = yield 4
        print(f"{res=}")
            
dis.dis(foo)

gen = foo()
print(type(gen), gen)

n = next(gen)
print(f"{n=}")
n = next(gen)
print(f"{n=}")

  2           0 RETURN_GENERATOR
              2 POP_TOP
              4 RESUME                   0

  3           6 LOAD_GLOBAL              1 (NULL + print)
             18 LOAD_CONST               1 ('foo')
             20 PRECALL                  1
             24 CALL                     1
             34 POP_TOP

  4          36 NOP

  5     >>   38 LOAD_CONST               3 (4)
             40 YIELD_VALUE
             42 RESUME                   1
             44 STORE_FAST               0 (res)

  6          46 LOAD_GLOBAL              1 (NULL + print)
             58 LOAD_CONST               4 ('res=')
             60 LOAD_FAST                0 (res)
             62 FORMAT_VALUE             2 (repr)
             64 BUILD_STRING             2
             66 PRECALL                  1
             70 CALL                     1
             80 POP_TOP

  4          82 JUMP_BACKWARD           23 (to 38)
<class 'generator'> <generator object foo at 0x7fd77e76d490>
foo
n=4
res=Non

In [67]:
def f1(a_list):
    l1 = sorted(a_list)
    l2 = [i for i in l1 if i < 0.5]
    res = [i*i for i in l2]
    return res

def f2(a_list):
    l1 = [i for i in a_list if i < 0.5]
    l2 = sorted(l1)
    res = [i * i for i in l2]
    return res

import random
a_list = [random.random() for i in range(100000)]
import cProfile

cProfile.run('f1(a_list)')
cProfile.run('f2(a_list)')

         7 function calls in 0.051 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.050    0.050 1653989491.py:1(f1)
        1    0.011    0.011    0.011    0.011 1653989491.py:3(<listcomp>)
        1    0.006    0.006    0.006    0.006 1653989491.py:4(<listcomp>)
        1    0.001    0.001    0.051    0.051 <string>:1(<module>)
        1    0.000    0.000    0.051    0.051 {built-in method builtins.exec}
        1    0.034    0.034    0.034    0.034 {built-in method builtins.sorted}
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}


         7 function calls in 0.027 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.005    0.005    0.005    0.005 1653989491.py:10(<listcomp>)
        1    0.000    0.000    0.026    0.026 1653989491.py:7(f2)
        1    0.009    0.009    