In [1]:
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"

# 运算符
## 运算符的本质：调用对应数据类型实现的的魔术方法
Python 中的**魔术方法**（Magic Methods，或称特殊方法 Special Methods）是以双下划线` __ `包围的特殊方法。这些方法由 Python 解释器自动调用，不需要显式调用。Python 设计时强调"一切皆对象"，运算符（如 `+, -, *, /, ==` 等）并不是像 C/C++ 那样的固定符号，而是对应对象上的方法调用。

## 运算符优先级

优先级从高到低
|运算符名称|Python表示|优先级|结合性|对应魔术方法|
|---------|----------|------|-----|--------------|
|小括号|()|19||（函数调用时调用 `__call__`）|
|索引|x[i][j]|18|左|`__getitem__`|
|属性访问|x.attr1.attr2|17|左|`__getattr__`, `__getattribute__`|
|乘方|**|16|**右**|`__pow__`|
|按位取反|~|15|右|`__invert__`|
|正负号|+、-|14|右|`__pos__`, `__neg__`|
|乘除|*、/、//、%|13|左|`__mul__`, `__truediv__`, `__floordiv__`, `__mod__`|
|加减|+、-|12|左|`__add__`, `__sub__`|
|移位|>>、<<|11|左|`__rshift__`, `__lshift__`|
|按位与|&|10|右|`__and__`|
|按位异或|^|9|左|`__xor__`|
|按位或|\||8|左|`__or__`|
|比较运算符|==、!=、>、>=、<、<=|7|左|`__eq__`, `__ne__`, `__gt__`, `__ge__`, `__lt__`, `__le__`|
|id运算符|is、is not|6|左|（不调用魔术方法，比较对象 id）|
|成员运算符|in、not in|5|左|`__contains__`|
|逻辑非|not|4|右|`__bool__`, `__len__`（用于判断真假）|
|逻辑与|and|3|左|（不调用魔术方法，短路求值）|
|逻辑或|or|2|左|（不调用魔术方法，短路求值）|
|逗号|exp1, exp2|1|左|（不调用魔术方法，仅用于表达式分隔）|



In [57]:
2**2**3  # **右结合，先计算2**3=8，再计算2**8=256

256

## 算术运算符（+、-、*、/、%、//、**）
| 数据类型 | `+` | `-` | `*` | `/` | `%` | `//` | `**` |
|----------|----|----|----|----|----|----|----|
| `int`、`float` | ✅加法| ✅减法 | ✅乘法 | ✅浮点除法 | ✅取余 | ✅整除（向下取整） | ✅幂运算 |
| `complex` | ✅复数加法 | ✅复数减法 | ✅复数乘法 | ✅复数除法 | ❌ | ❌ | ✅复数幂运算 |
| `str`、`list`、 `tuple` | ✅拼接 | ❌ | ✅重复 | ❌ | ❌（仅`str`可用于旧风格格式化） | ❌ | ❌ |
| `set` | ❌ | ✅差集 | ❌ | ❌ | ❌ | ❌ | ❌ |
| `dict` | ❌ | ❌ | ❌ | ❌ | ❌ | ❌ | ✅（关键字参数展开） |

In [5]:
a, b = 21, 10

In [6]:
a + b  # 加
a - b  # 减
a * b  # 乘
a / b  # 除以  <- 结果是float类型
a % b  # 取余数
a // b # 取整除
a ** b # 幂（乘方）

31

11

210

2.1

1

2

16679880978201

取模 % 遵循：
$$ a \% b = a - (a // b) \times b $$

In [4]:
5 % 2
# 取模结果始终与除数（%后面的数）符号相同
-5 % 2
5 % -2

1

1

-1

In [7]:
# 其中取整除是向小的方向取整
9 // 2
-9 // 2

4

-5

In [11]:
# + 和 * 在str、tuple、list中代表连接和重复
"Hello" + "World"
"Hello" * 3
(1, 2) + (3, 4)
(1, 2) * 3
[1, 2] + [3, 4]
[1, 2] * 3

'HelloWorld'

'HelloHelloHello'

(1, 2, 3, 4)

(1, 2, 1, 2, 1, 2)

[1, 2, 3, 4]

[1, 2, 1, 2, 1, 2]

In [10]:
# + 不能用于dict、set的连接，要用update
d1 = {"a":1, "b":2}
d2 = {"c":3, "d":4}

d1.update(d2)  # 正常更新
d1

d1 + d2  # TypeError

{'a': 1, 'b': 2, 'c': 3, 'd': 4}

TypeError: unsupported operand type(s) for +: 'dict' and 'dict'

In [12]:
t1 = {1, 2}
t2 = {3, 4}

t1.update(t2)  # 正常更新
t1

t1 + t2  # TypeError

{1, 2, 3, 4}

TypeError: unsupported operand type(s) for +: 'set' and 'set'

## 赋值运算符（+=、-=、*=、/=、%=、//=、**=）
赋值运算符本质上并不能等同于对应的赋值运算，如 `a = a + b` 和 `a += b` 有本质上的不同。
- 赋值（`=`）并不会调用魔术方法，只是改变变量名的引用，本质上的过程是：调用`a.__add__(b)`并将返回值的引用赋给`a`，即`a = a.__add__(b)`
- 赋值运算符（`+=`）会先尝试调用`a.__iadd__(b)`，若`a`对象实现了该魔术方法，则可以直接**就地修改**，若没有实现，则会退回`a = a.__add__(b)`，**创建新对象**。

这样的区别在不可变类型上没有实际的差异，因为不可变类型无法就地修改，没有实现`__iadd__`方法，实际上都是进行了`a = a.__add__(b)`。

而部分可变类型会实现`__iadd__`方法，实际行为取决于其具体实现逻辑。如list的+运算要求后面的对象必须为list，而+=运算仅要求后面的对象为可迭代对象。

In [2]:
a, b, c= 21, 10, 0

In [3]:
c += a
c
c -= a
c
c *= a
c
c /= a
c

c = 2
c %= a
c
c **= a
c
c //= a
c

21

0

0

0.0

2

2097152

99864

In [3]:
# += 和 *= 在str、tuple中代表连接和重复，等效于 a = a + b 或 a = a * b
a = "Hello"
a += "World"
a
a *= 3
a

a = (1, 2)
a += (3, 4)
a
a *= 3
a
a += [5, 6]
a

'HelloWorld'

'HelloWorldHelloWorldHelloWorld'

(1, 2, 3, 4)

(1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4)

TypeError: can only concatenate tuple (not "list") to tuple

In [None]:
# list 的 + 和 += 行为有很大差异

a = [1, 2]
id(a)
a += [3, 4]
id(a)  # list的+=相当于.expand()，不影响a的id
a = a + [5, 6]
id(a)  # 而 + 运算符等于创建了一个list再赋值给a，会改变a的id
# *=和*的区别与上面的类似

# list中 += 与.expand()功能一致，都会把其他组合数据类型自动转换为list再连接，而str和tuple的+=不能自动转换为对应的类型
a = [1, 2]
a += (3, 4)
a
a += {5, 6}
a
a += "Hello"
a
a += {"a": 1, "b": 2}
a

# list中 + 运算符也不能自动转换
a = [1, 2]
a = a + (3, 4)


2099695167808

2099695167808

2099694586496

[1, 2, 3, 4]

[1, 2, 3, 4, 5, 6]

[1, 2, 3, 4, 5, 6, 'H', 'e', 'l', 'l', 'o']

[1, 2, 3, 4, 5, 6, 'H', 'e', 'l', 'l', 'o', 'a', 'b']

TypeError: can only concatenate list (not "tuple") to list

## 比较运算符（==、!=、<、>、<=、>=）

### 数值类型（int、float、complex）
数值类型的比较运算遵循数学上的大小关系。

In [4]:
3 > 2
2.5 < 3
2 == 2
2.0 == 2 # int 和 float 进行数值比较，2.0 与 2 相等
3 >= 3
4 <= 5
5 != 6

True

True

True

True

True

True

True

复数不能进行大小比较，只能用 == 和 != 进行相等性判断。

In [15]:
1 + 2j == complex(1, 2)
1 + 2j != 1 + 3j
1 + 2j > 1 + 3j  # TypeError: unorderable types
1 + 2j > 1  # TypeError: unorderable types

True

True

TypeError: unorderable types: complex() > complex()

### 字符串（str）
Python 通过 **字典序（lexicographical order）** 比较字符串，即按照 **Unicode 码点顺序** 进行逐字符比较：
- 逐字符按 Unicode 码点大小进行比较 (ord() 获取字符的 Unicode 码)。
- 如果前面的字符相等，则继续比较后续字符，直到比较出差异。
- 如果一个字符串是另一个字符串的**前缀**，则**短的字符串更小**。

In [14]:
"A" < "a"           # True，因为 'A' 的 Unicode 值是 65，'a' 的 Unicode 值是 97
"apple" < "banana"  # True，因为 'a' < 'b'
"cat" > "apple"     # True，虽然 'cat' 比 'apple' 长度短，但是 c > a， 比较之后直接返回结果
"abc" < "abd"       # True，因为 'c' < 'd'
"hello" > "hell"    # True，因为 "hello" 比 "hell" 长

True

True

True

True

True

### 列表（list）、元组（tuple）
逐元素比较，但对应位置的元素必须是可比较的

In [18]:
[1, 2, 3] < [1, 2, 4]  # 3 < 4
[1, 2] < [1, 2, 0]  # 对应位相等且前者比后者短
(1, 2, 3) > (1, 2)  # 对应位相等且前者比后者长
["apple", "banana"] > ["apple", "Banana"]  # "banana" > "Banana"

[1, 2] < [1, "2"]  # 对应位置不可比较，报 TypeError

True

True

True

True

TypeError: unorderable types: int() < str()

### 集合（set）

用于比较集合是否为子集/真子集/超集/真超集

In [2]:
(1, 2) < (1, 2, 3)
(1, 2) <= (1, 2)
(1, 2) > (1, 2, 3)
(1, 2) >= (1, 2)
(1, 2) == (1, 2)
(1, 2) != (1, 2, 3)

True

True

False

True

True

True

### 字典（dict）
字典仅能判断全等/非全等

In [24]:
{"a":1, "b":2} == {"a":1, "b":2}
{"a":1, "b":2} != {"a":1, "b":3}

True

True

## 逻辑运算符（and、or、not）

In [None]:
# Python 当中如下值都会被判断为False，除此之外，其他值都会认为是True

# 空值
bool(None)
# 数值类型的0
bool(0)  # 整数
bool(0.0)  # 浮点数
bool(0j)  # 复数
# 空的序列和集合
bool('')  # 空字符串，完全没有内容的，空格不算
bool([])  # 空列表
bool(())  # 空元组
bool({})  # 空字典
bool(set())  # 空集合
# 空范围
bool(range(0))  # 空范围

False

False

False

False

False

False

False

False

False

False

Python 中 `and` 运算符不直接返回 `True` 或 `False`，而是返回值，并让 `if` 语句来判断真假，`a and b` 的计算方法是：
- 先计算 `bool(a)`，如果为假，则直接返回 `a`。（`a` 已经是假了，`and` 不可能真，所以不再计算 `b`，节省运算量）
- 如果 `bool(a)` 为真，则直接返回 `b`。（已知 `a` 是真，那么 `and` 的结果只取决于 `b`，`b` 是真那么 `and` 也是真，`b` 是假那么`and`也是假）

In [34]:
a , b = 0, 12
a and b

0

`a or b` 的计算思路类似：
- 先计算 `bool(a)`，如果为真，则直接返回 `a`。（`a` 已经是真了，`or` 一定是真，所以不再计算 `b`，节省运算量）
- 如果 `bool(a)` 为假，则直接返回 `b`。（已知 `a` 是假，那么 `or` 的结果只取决于 `b`，`b` 是真那么 `or` 也是真，`b` 是假那么 `or` 也是假）

In [35]:
a or b

12

`not` 则是直接返回 `True` 或 `False`

In [36]:
not a

True

## 按位运算符（&、|、^、<<、>>）

In [45]:
a = 0b_0011_1100
b = 0b_0000_1101

In [53]:
"{:0>8b}".format(a & b)  # 按位与
"{:0>8b}".format(a | b)  # 按位或
"{:0>8b}".format(a ^ b)  # 按位异或
bin(~ a)  # 按位取反
"{:0>8b}".format(a << 2)  # 左移位
"{:0>8b}".format(a >> 2)  # 右移位


'00001100'

'00111101'

'00110001'

'-0b111101'

'11110000'

'00001111'

## 成员运算符（in、not in）

In [37]:
a, b = 1, 6
l = [1, 2, 3, 4, 5]

In [38]:
a in l
a not in l
b in l

True

False

False

## id运算符（is、is not）

id运算符比较两个标识符是否指向同一个对象，即判断其id()是否相等

In [None]:
# 对于不可变类型，一旦被创建，其值的id就是固定的
a = 10
b = 10
c = [10, 20, 30]
d = "Hello"
e = ["Hello", "World"]

a is b
a is c[0]
d is e[0]

True

True

True

In [None]:
# 对于不可变类型，即使两个值一样，也是两个不同的对象
a = ["Hello", "World"]
b = ["Hello", "World"]
a == b
a is b

True

False

### is None 和 == None 是有区别的
`None` 是 `Python` 的 单例对象，意味着所有的 `None` 值都共享相同的内存地址，`x is None` 是判断 x 是否是 `None` 的最佳方式。

而 `== None` 的问题是，某些类可能会重载 `__eq__` 方法，使得 `x == None` 可能返回 `True`，即使 **x 不是 None**。

In [3]:
class Custom:
    def __eq__(self, other):
        return True  # 任何比较都返回 True

obj = Custom()
print(obj == None)  # ⚠️ True，但 obj 不是 None
print(obj is None)  # ✅ False，obj 不是 None

True
False
