# Python基本语法

## 0. Python特性

### 语言特性

- 缩进敏感：Python使用缩进来表示代码块，不是用大括号
- 下标从0开始：列表、字符串等序列的第一个元素索引是0
- 区间前闭后开：range(0,5) 产生 [0,1,2,3,4]，不包含5 切片也是前闭后开
- Python中的等号不是数学中的等号：= 是赋值运算符，== 才是相等比较
- 类型转换：int(), float(), str() 进行类型转换
- 什么是面向对象
- 如何阅读程序报错信息

### 一些坑点

In [34]:
# 浮点数相等比较 （为什么？）

a = 0.1 + 0.2
b = 0.3

# False
print(a == b)

# 推荐写法：引入一个极小值 EPS (epsilon)
EPS = 1e-9  # 10的-9次方
if abs(a - b) < EPS:
    print("相等")

False
相等


In [39]:
# is（对象同一性） 和 == （比较相等）
# 建议不要使用is
a = [1, 2, 3]
b = [1, 2, 3]

print(a == b) # True (内容一样)
print(a is b) # False (这是两个不同的列表对象)

# 使用is有可能出现一些令人困惑的结果 下面是一个例子
# 如果在本地python中执行 应该输出True和False 浏览器环境的内核实现有所差异 观察不到这个结果
a = 256; b = 256;
print(a is b)
a = 257; b = 257;
print(a is b)

# 特例：判断是否为 None 推荐使用is
x = None
if x is None:
    pass

True
False
True
True


In [54]:
# 浅拷贝和深拷贝（面向对象）
a = [1,2,3]
b = a
a.append(4)
print(b)

[1, 2, 3, 4]


In [57]:
# 错误的二维列表创建方式
arr = [[0]*3]*3
arr[1][1] = 2
print(arr)

# 正确方法：使用列表推导式：
arr = [[0]*3 for _ in range(3)]
arr[1][1] = 2
print(arr)

[[0, 2, 0], [0, 2, 0], [0, 2, 0]]
[[0, 0, 0], [0, 2, 0], [0, 0, 0]]


## 1. 基本输入输出

### 基本输出

In [3]:
a = 10
b = 20

# print 默认输出以换行符结尾
print()

# sep: 控制多个元素之间的分隔符 (默认是空格)
print(a, b, sep=",")   # 输出: 10,20

# end: 控制打印结束后的字符 (默认是换行符 \n)
print(a, end=" ")      # 输出: 10 (后面跟一个空格，不换行)
print(b)               # 输出: 20 (紧接着上面的输出)


10,20
10 20


### 格式化输出 （f-string）
推荐使用f-string 格式化输出 不必了解其他的格式化方式

In [6]:
# 保留小数
pi = 3.1415926
print(f"{pi:.2f}")     # 输出: 3.14 (保留2位小数，默认四舍五入)
print(f"{pi:.4f}")     # 输出: 3.1416

3.14
3.1416


In [40]:
# 嵌入变量
a = 2.7456
print(f"pi is {pi} and a is {a}")

pi is 3.1415926 and a is 2.7456


In [13]:
# 补0和对齐 (大概率考试不会出现)
x = 5
print(f"{x:03d}")      # 输出: 005 (宽度为3，不足补0)
print(f"{x:5d}")       # 输出:     5 (宽度为5，默认右对齐空格填充)
# 这里用的字体非等宽 所以看不出来
print(f"{x:<5d}")      # 输出: 5     (宽度为5，左对齐)

005
    5
5    


In [17]:
# 进制转换 (十进制 to X进制)
n = 255
print(f"{n:b}")        # 二进制: 11111111
print(f"{n:x}")        # 十六进制 (小写): ff
print(f"{n:X}")        # 十六进制 (大写): FF
print(f"{n:o}")        # 八进制: 377

11111111
ff
FF
377


### 列表输出

In [19]:
arr = [1, 2, 3, 4, 5]

# 必须先用 map 将数字转为 str，再 join
result = " ".join(map(str, arr))
print(result)
# 输出: 1 2 3 4 5

# 场景举例：用 "->" 连接路径
path = [1, 5, 9]
print("->".join(map(str, path)))
# 输出: 1->5->9

1 2 3 4 5
1->5->9


In [20]:
# 用空格分隔时的简单方法
# 直接用 * 解包
print(*arr)
print(*arr, sep=",")

1 2 3 4 5
1,2,3,4,5


### 基本输入

In [16]:
# 读取单个整数
n = int(input()) 

# 读取两个或确定数量的整数 (一行内，用空格分隔 )
# 输入示例: 10 20
a, b = map(int, input().split())

# 你可以在split(函数中指定输入的分隔符

5
10 20


In [None]:
# 读取一行数组

# 方法一:注意要加上list()
arr = list(map(int, input().split()))

# 方法二:列表推导式
arr = [int(x) for x in input().split()]

In [None]:
# 读取二维数组
n = int(input()) # 行数
# 读取 N 行，生成二维列表
grid = [list(map(int, input().split())) for _ in range(n)]

## 2. 条件语句和分支结构

**Python是缩进敏感型的语言，完全依赖缩进来区分代码块**

你可以通过键盘上的Tab键来缩进（4个空格）

In [22]:
score = 85

if score >= 90:
    print("A")
elif score >= 80:
    print("B")  # 只有上面的 if 不满足，才会判断这里
else:
    print("C")

B


In [25]:
# 链式比较
n = 10
x = 5

# 推荐写法 (极快，易读)
if 0 <= x < n:
    print("x 在合法索引范围内")

a,b,c,d = 2,3,3,5
    
# 甚至支持更复杂的链式
if a < b == c < d:
    print("Cool")

x 在合法索引范围内
Cool


In [27]:
# 三元运算符 一行写下if ... else ...
a, b = 10, 20

# 传统写法
# if a > b:
#     max_val = a
# else:
#     max_val = b

# 三元运算符写法 (赋值时常用)
max_val = a if a > b else b

# 输出时常用
# 如果 n 是偶数输出 "Even"，否则 "Odd"
print("Even" if n % 2 == 0 else "Odd")

Even


**隐式布尔值**

在 Python 中，不需要显式判断 != 0 或 len() > 0。以下值在 if 中会被自动视为 False

- 数字 0, 0.0

- 空容器 [], (), {}, set(), "" (空字符串)

- None

In [32]:
# 逻辑运算符 and or not
# 注意区分位运算 与&、或|、按位取反~

# 短路运算
# 逻辑运算符 and 和 or 具有短路特性
index = 5
arr = [1, 2, 3]

# 假设我们要判断 arr[index] 是否等于 1
# 如果直接写 if arr[index] == 1，当 index=5 时会报错 IndexError

# 正确写法：利用短路
# 如果 index < len(arr) 为 False，后面直接跳过，不会执行 arr[index]
if index < len(arr) and arr[index] == 1:
    print("Found!")

In [86]:
# 联合条件判断 all 和 any

nums = [2, 4, 6, 8]

# 笨写法
is_all_positive = True
for x in nums:
    if x <= 0:
        is_all_positive = False
        break

# 竞赛写法 (一行搞定)
if all(x > 0 for x in nums):
    print("全是正数")

全是正数


In [87]:
nums = [10, 20, -5, 30]

if any(x < 0 for x in nums):
    print("警告：发现了负数！")

警告：发现了负数！


核心技巧：生成器表达式 (Generator Expression)

在 all() 和 any() 里面写的是 x > 0 for x in nums，而不是 [x > 0 for x in nums]。注意少了一对中括号 []。

这是算法题中的性能关键点：

带 [] (列表推导式)： 会先算出所有结果，生成一个完整的 [True, True, False, ...] 列表，占用内存，且无法利用短路特性提前结束。

不带 [] (生成器)： 一边循环一边判断。如果是 all()，遇到第一个 False 马上停；如果是 any()，遇到第一个 True 马上停。速度更快，空间更省！

## 3. 循环语句 循环结构

### for 循环 

计数循环

In [60]:
# 1. 基础用法：0 到 n-1
n = 5
for i in range(n):
    print(i, end=' ') # 输出: 0 1 2 3 4
    
print()

# 2. 指定区间：start 到 end-1
for i in range(2, 6):
    print(i, end=' ') # 输出: 2 3 4 5

print()
    
# 3. 指定步长 (Step)：每隔 2 个取一次
for i in range(1, 10, 2):
    print(i, end=' ') # 输出: 1 3 5 7 9

0 1 2 3 4 
2 3 4 5 
1 3 5 7 9 

In [63]:
# 倒序循环
# 写法 A: 利用 range 的步长为 -1
# 逻辑：从 5 开始，到 0 结束(不包含0)，每次 -1
for i in range(5, 0, -1):
    print(i, end=' ') # 输出: 5 4 3 2 1

print()
    
# 写法 B: 使用 reversed() 函数 (更直观，但在索引计算时不如 A 灵活)
for i in reversed(range(1, 6)):
    print(i, end=' ') # 输出: 5 4 3 2 1

5 4 3 2 1 
5 4 3 2 1 

In [65]:
arr = ['a', 'b', 'c', 'd']

# 方式 1: 直接遍历元素 (不需要索引时使用，最快)
for x in arr:
    print(x)

# 方式 2: 通过索引遍历 (需要修改原数组或访问相邻元素时使用)
for i in range(len(arr)):
    # 比如：判断当前元素和下一个元素
    if i < len(arr) - 1 and arr[i] == arr[i+1]:
        pass

a
b
c
d


### while循环

条件循环

不知道具体要循环多少次，只知道停止条件时使用（典型场景：迭代算法）

**循环一定要想着终止条件演进 不然很容易导致死循环**

In [66]:
n = 10
while n > 0:
    print(n, end=' ')
    n //= 2  # 每次减半
# 输出: 10 5 2 1

10 5 2 1 

### continue和break

- break: 直接跳出当前所在的最内层循环。

- continue: 跳过本次循环剩余代码，直接进入下一次迭代。

In [71]:
# 打印 10 以内的奇数，但遇到 7 停止
for i in range(10):
    if i == 7:
        break    # 遇到7彻底结束
    if i % 2 == 0:
        continue # 偶数跳过
    print(i, end=' ')
# 输出: 1 3 5

1 3 5 

### 高级技巧

In [68]:
# enumerate
scores = [90, 80, 75, 95]

# i 是索引，score 是值
for i, score in enumerate(scores):
    if score == 95:
        print(f"在第 {i} 个位置找到了最高分{score}")

在第 3 个位置找到了最高分95


In [69]:
# zip 并行遍历
names = ["Alice", "Bob", "Charlie"]
ages = [24, 30, 18]

# 同时遍历两个列表
for name, age in zip(names, ages):
    print(f"{name} is {age} years old.")

Alice is 24 years old.
Bob is 30 years old.
Charlie is 18 years old.


**循环中的 else：**

Python 的循环（for/while）可以带一个 else 块。 执行逻辑：只有当循环正常结束（即没有被 break 打断）时，才会执行 else 中的代码。 这在“查找并判断是否存在”的逻辑中非常省事，不需要额外的 flag 变量。

In [70]:
# 案例：判断 n 是否为素数
n = 13
if n > 1:
    for i in range(2, int(n**0.5) + 1):
        if n % i == 0:
            print(f"{n} 不是素数")
            break  # 触发 break，跳过 else
    else:
        # 循环走完了都没触发 break，说明是素数
        print(f"{n} 是素数")

13 是素数


## 4. 位运算

- & ： 按位与
- | ：  按位或
- ~ ：按位取反
- ^：按位异或
- <<： 左移 相当于乘2
- \>\>： 右移 相当于整除2

In [42]:
# 快速判断奇偶数
x = 7
if x & 1:
    print("奇数")
else:
    print("偶数")

奇数


In [44]:
# 快速乘除 (<<, >>)
# 乘 2：n << 1
# 除 2：n >> 1 
# 求 $2^n$：1 << n (比如 1 << 10 就是 1024)
x = 10
print(x << 3)  # 等价于 x * (2**3) = 10 * 8 = 80
print(x >> 1)  # 等价于 x // 2 = 5

80
5


In [48]:
# 消去二进制最后一位的 1
n = 12       # 二进制 1100
n = n & (n-1) 
# 1100 & 1011 = 1000 (消掉了最右边的1)
print(n)     # 输出 8

8


- 原码 (Sign-Magnitude)

    定义：最高位表示符号位（0正1负），其余位表示数值的绝对值
    
    特点：直观但存在+0和-0的问题，加减运算复杂

- 反码 (Ones' Complement)

    定义：

    正数：与原码相同

    负数：符号位不变，数值位按位取反

    特点：解决了+0和-0的问题，但仍有边界情况

- 补码 (Two's Complement)

    定义：

    正数：与原码相同

    负数：反码 + 1

    特点：现代计算机普遍使用，解决了±0问题，运算简单

In [51]:
"""
举例：
数字: 5
原码: 00000101
反码: 00000101
补码: 00000101
------------------------------
数字: -5
原码: 10000101
反码: 11111010
补码: 11111011
"""

'\n举例：\n数字: 5\n原码: 00000101\n反码: 00000101\n补码: 00000101\n------------------------------\n数字: -5\n原码: 10000101\n反码: 11111010\n补码: 11111011\n'

In [52]:
# 获取二进制最后一位的 1
x = 12          # 二进制 ...00001100
# -x (补码)      # 二进制 ...11110100
lowbit = x & -x # 结果   ...00000100 -> 4
print(lowbit)

4


**异或的性质**

- 交换律、结合律（怎么证明？）
- `a^a = 0`
- `a^0 = a`
- 自反性（`a^b^b = a`）

In [46]:
# 交换两个数（不借助第三个变量）
a, b = 10, 20
a ^= b
b ^= a
a ^= b
print(a, b) # 输出 20 10

20 10


#### 例题：只出现一次的数字

题目：给定一个非空整数数组，除了某个元素只出现一次以外，其余每个元素均出现两次。找出那个只出现了一次的元素。 思路：利用异或性质 a ^ a = 0。

In [47]:
nums = [4, 1, 2, 1, 2]
ans = 0

for num in nums:
    ans ^= num # 相同的数字会抵消变为0

print(ans) # 输出 4

4


## 5. 数据结构

### 可变vs不可变数据类型

不可变 (Immutable)	❌ 否	int, float, str, tuple, bool	修改值 = 创建新对象 (内存地址变)

可变 (Mutable)	✅ 是	list, dict, set	修改值 = 原地修改 (内存地址不变)

所以对于可变类型 会出现如下的问题：

In [89]:
# 直接赋值
a = [1,2,3]
b = a
a.append(4)
print(b)


def modify(nums):
    nums.append(999) # 原地修改

a = [1, 2, 3]
modify(a)
print(a)  # 输出: [1, 2, 3, 999] -> 外部的 a 被污染了！

[1, 2, 3, 4]


In [90]:
# 正确解决方案：创建一个全新的对象
a = [1,2,3]
b = list(a)
a.append(4)
print(b)

[1, 2, 3]


In [94]:
# 字符串类型是不可变的 不能直接修改某一位
s = "hello"
# s[0] = 'H'  # ❌ 报错：TypeError: 'str' object does not support item assignment

# 正确做法：切片 + 拼接 (生成了新字符串)
s = 'H' + s[1:]
print(s)

Hello


In [95]:
# 只有不可变类型才能做字典的 Key
# 字典的 Key 和 集合（Set）的元素必须是可哈希的（Hashable），意味着它必须是不可变类型。

seen = set()

# ❌ 错误：试图把 list 放进 set
# seen.add([1, 2]) # TypeError: unhashable type: 'list'

# ✅ 正确：先转为 tuple (不可变)
seen.add(tuple([1, 2]))

In [99]:
# 排序与原处修改
# s.sort(): 可变操作。直接修改原列表，没有返回值
# sorted(s): 不可变逻辑。原列表不动，返回一个新的排序后的列表。

a = [3, 1, 2]

b = sorted(a) 
# a 还是 [3, 1, 2], b 是 [1, 2, 3]

print(a)
print(b)

a.sort()
# a 变成了 [1, 2, 3]
print(a)

[3, 1, 2]
[1, 2, 3]
[1, 2, 3]


### int, float, str

In [72]:
a = 10
b = 3

# 1. 向下取整的除法 (Floor Division)
print(a // b)   # 输出: 3
print(a / b)    # 输出: 3.3333... (变成了 float)

# 2. 幂运算 (Power)
print(2 ** 10)  # 输出: 1024

# 3. 同时求商和余数 (divmod)
# 在做进制转换或网格坐标计算时非常有用
q, r = divmod(10, 3) 
print(q, r)     # 输出: 3 1 (即 10 // 3 = 3, 10 % 3 = 1)

3
3.3333333333333335
1024
3 1


In [73]:
inf = float('inf')   # 正无穷大 (用于求最小值的初始变量)
neg_inf = float('-inf') # 负无穷大

x = 1.5e9            # 1.5 * 10^9
y = 1e-6             # 10^-6 (常用于精度判断 EPS)

In [74]:
x = int(3.99) # 结果是 3 (直接截断，不是四舍五入)
# 如何将3.1415926直接截断四位小数输出，而非四舍五入？（f-string默认四舍五入）

In [81]:
# 字符串切片
s = "0123456789"

print(len(s))

print()
# 基础截取
print(s[2:5])   # "234" (下标2到4)
print(s[:3])    # "012" (从头开始取3个)
print(s[5:])    # "56789" (从下标5取到最后)

# 负索引 (倒数第几个)
print(s[-1])    # "9" (最后一个字符)
print(s[-3:])   # "789" (最后三个字符)

# 高级用法
print(s[::2])   # "02468" (隔一个取一个)
print(s[::-1])  # "9876543210" (字符串反转，竞赛超高频！)

# 判断回文串（正读反读都一样）只需一行： if s == s[::-1]:

10

234
012
56789
9
789
02468
9876543210


In [78]:
c = 'a'
# 获取 'a' 的 ASCII 码
code = ord(c)   # 97

# 转换回字符
print(chr(code + 1)) # 'b'

# 实战：计算字母在字母表中的位置 (0-25)
offset = ord('e') - ord('a') # 4
print(offset)

b
4


In [82]:
# 大小写转换
s = "Hello World"

print(s.lower())      # "hello world" (全小写)
print(s.upper())      # "HELLO WORLD" (全大写)
print(s.swapcase())   # "hELLO wORLD" (大小写互换)
print(s.capitalize()) # "Hello world" (首字母大写，其余小写)
print(s.title())      # "Hello World" (每个单词首字母大写)

hello world
HELLO WORLD
hELLO wORLD
Hello world
Hello World


In [84]:
s = "banana"

# 1. 计数 (Count)
print(s.count("a"))   # 3 (有3个a)

# 2. 查找 (Find vs Index)
print(s.find("na"))   # 2 (第一次出现的位置，找不到返回 -1)
# print(s.index("x")) # 找不到会报错！建议用 find

# 3. 替换 (Replace)
# 注意：因为字符串不可变，replace 会生成新字符串，必须赋值回去
s = s.replace("na", "XYZ") 
print(s)              # "baXYZXYZ"

3
2
baXYZXYZ


In [100]:
s = "12345"
print(s.isdigit())  # True (是否全为数字)

s = "abc"
print(s.isalpha())  # True (是否全为字母)

s = "123a"
print(s.isalnum())  # True (是否全为 字母 或 数字)

True
True
True


### 列表List

In [102]:
n = 10
# 生成长度为 10，全为 0 的数组
arr = [0] * n

n, m = 3, 3 # 3行3列

# ❌ 错误写法 (每一行都指向同一个内存地址)
# grid = [[0] * m] * n 

# ✅ 正确写法 (列表推导式)
grid = [[0] * m for _ in range(n)]

In [104]:
nums = [0, 1, 2, 3, 4, 5]

# 1. 复制列表 (浅拷贝)
# 如果直接 b = nums，只是引用赋值。用切片才是复制。
copy_nums = nums[:] 

# 2. 替换一段数据
# 将索引 1 到 3 (不含) 替换为 [9, 9]
nums[1:3] = [9, 9] 
print(nums) # [0, 9, 9, 3, 4, 5]

# 3. 删除一段数据
nums[1:3] = [] # 把这一段替换为空，相当于删除

[0, 9, 9, 3, 4, 5]


In [107]:
# 自定义排序
students = [(18, 90), (20, 80), (18, 95)]

# 需求：先按年龄从小到大排；年龄相同的，按分数从大到小排。

# key 参数接收一个函数。这里用 lambda 定义规则。
# 技巧：想倒序排的属性，加个负号 - (仅限数字)
students.sort(key=lambda x: (x[0], -x[1]))

print(students)
# 输出: [(18, 95), (18, 90), (20, 80)]

[(18, 95), (18, 90), (20, 80)]


In [110]:
# 常用内置方法
arr = [1, 2, 3, 2, 1]

# 1. 计数
cnt = arr.count(2) # 结果: 2 (有2个2) -> O(N)

# 2. 找索引
idx = arr.index(3) # 结果: 2 (3在索引2的位置) -> O(N)
# 注意：如果找不到会报错！建议先判断 if 3 in arr: ...

# 3. 反转
arr.reverse() # 原地反转 -> O(N)
# 或者用切片: arr[::-1] (生成新列表)

In [114]:
stack = []
stack.append(1)
stack.append(2)
stack.insert(1,4) # 在位置1插入元素4 慎用  会后移后边所有的元素
print(stack.pop()) # 移除最后一个元素 返回这个元素 输出 2
print(stack[-1])   # 输出 4 (栈顶)

2
4


### 元组

不可变类型

In [115]:
# 1. 定义
point = (10, 20)
print(point[0])  # 输出: 10 (像列表一样通过索引访问)

# 2. 尝试修改 (报错!)
# point[0] = 99  # ❌ TypeError: 'tuple' object does not support item assignment

# 3. 单个元素的坑 (必须加逗号)
x = (5)    # 这是整数 5
y = (5,)   # 这才是元组 (5,)
print(type(x), type(y)) # <class 'int'> <class 'tuple'>

10
<class 'int'> <class 'tuple'>


In [117]:
# 用途：作为set/dict的key
visited = set()

# 坐标
x, y = 5, 3

# ❌ 错误：列表不能做 Key
# visited.add([x, y]) # TypeError: unhashable type: 'list'

# ✅ 正确：使用元组记录状态
visited.add((x, y))

# 检查是否访问过
if (x, y) in visited:
    print("这个点走过了")

这个点走过了


### 集合 Set

In [119]:
# 自动去重
s = {1, 2, 2, 3}
print(s)  # 输出: {1, 2, 3} (2 只保留了一个)

{1, 2, 3}


In [121]:
# ❌ 错误：这创建的是一个空字典 (dict)
bad_set = {} 
print(type(bad_set)) # <class 'dict'>

# ✅ 正确：使用 set() 函数
good_set = set()
print(type(good_set)) # <class 'set'>

<class 'dict'>
<class 'set'>


In [131]:
# 初始化集合
A = {1, 2, 3, 4}
B = {3, 4, 5, 6}

print(f"集合 A: {A}")
print(f"集合 B: {B}")
print("-" * 40)

# 1. 交集 (Intersection)
# 方法: .intersection()
# 运算符: &
res_method = A.intersection(B)
res_op = A & B
print(f"1. 交集 A.intersection(B): {res_method}")
# 输出: {3, 4}


# 2. 并集 (Union)
# 方法: .union()
# 运算符: |
res_method = A.union(B)
res_op = A | B
print(f"2. 并集 A.union(B):        {res_method}")
# 输出: {1, 2, 3, 4, 5, 6}


# 3. 差集 (Difference)
# 方法: .difference()
# 运算符: -
res_method = A.difference(B)
res_op = A - B
print(f"3. 差集 A.difference(B):   {res_method}")
# 输出: {1, 2} (A 里有，B 里没有的)


# 4. 对称差集 (Symmetric Difference)
# 方法: .symmetric_difference()
# 运算符: ^
res_method = A.symmetric_difference(B)
res_op = A ^ B
print(f"4. 对称差 A.symmetric_difference(B): {res_method}")
# 输出: {1, 2, 5, 6} (只属于 A 或 只属于 B 的)


print("-" * 40)

集合 A: {1, 2, 3, 4}
集合 B: {3, 4, 5, 6}
----------------------------------------
1. 交集 A.intersection(B): {3, 4}
2. 并集 A.union(B):        {1, 2, 3, 4, 5, 6}
3. 差集 A.difference(B):   {1, 2}
4. 对称差 A.symmetric_difference(B): {1, 2, 5, 6}
----------------------------------------


In [129]:
# 判断是否为子集
A = {1, 2}
B = {1, 2, 3}

print(A.issubset(B)) # True
# 或者写成
print(A <= B)        # True

True
True


In [124]:
s = set()
s.add(1)       # 添加单个元素
s.update([2, 3, 4]) # 批量添加 (传入列表)
print(s) # {1, 2, 3, 4}

{1, 2, 3, 4}


In [127]:
s = {1, 2, 3}

s.discard(99) # 安全，不会报错
# s.remove(99)  # ❌ 报错！如果 x 不存在，会报错 (KeyError

s.discard(1)  # 删除 1

In [130]:
# 集合的优势：快速查找
# 假设 list_data 有 100万个数据
# if x in list_data:  -> 非常慢，O(N)

set_data = set(list_data)
if x in set_data:     # -> 极快，O(1) (瞬间完成)
    pass

Traceback (most recent call last):
  File "<input>", line 5, in <module>
NameError: name 'list_data' is not defined


Error: 

### 字典

In [133]:
scores = {
    "Problem_A": 100,
    "Problem_B": 0,
    "Problem_C": 50
}

In [140]:
# 如果 key 不存在，返回 0 (默认值)
val = scores.get("Problem_C", 0) 
print(val)

50


In [135]:
# 获取所有题目名称
print(scores.keys()) 
# 输出: dict_keys(['Problem_A', 'Problem_B', 'Problem_C'])

# 遍历
for k in scores.keys():
    print(k)

dict_keys(['Problem_A', 'Problem_B', 'Problem_C'])
Problem_A
Problem_B
Problem_C


In [137]:
# 判断是否有满分
if 100 in scores.values():
    print("太强了，AK了一题！")

# 计算总分
total = sum(scores.values()) # 150

太强了，AK了一题！


In [141]:
# 找出所有没拿满分的题目
for name, score in scores.items():
    if score < 100:
        print(f"{name} 还需要努力，目前得分: {score}")

Problem_B 还需要努力，目前得分: 0
Problem_C 还需要努力，目前得分: 50


In [144]:
# collections的小技巧
from collections import defaultdict, Counter

# defaultdict：不需要每次都判断key是否在字典中 自动创建并赋值
# 默认每个 key 对应整数 0
cnt = defaultdict(int)

s = "banana"
for char in s:
    cnt[char] += 1 # 也不需要初始化，直接 +1
    
# Counter 频率统计
nums = [1, 2, 1, 3, 2, 1]

# 直接把列表丢进去，它自动帮你数好了
c = Counter(nums)
print(c) 
# 输出: Counter({1: 3, 2: 2, 3: 1})
# 含义: 1出现了3次，2出现了2次...

# 找出出现次数最多的 2 个数字
top_two = c.most_common(2)
print(top_two)
# 输出: [(1, 3), (2, 2)] 
# 解读: 第1名是数字1(3次)，第2名是数字2(2次)

Counter({1: 3, 2: 2, 3: 1})
[(1, 3), (2, 2)]


In [146]:
# 例子：字典排序
scores = {
    "Alice": 85,
    "Bob": 95,
    "Charlie": 85,
    "David": 60
}

# 规则：(-x[1], x[0])
# 第一关键字: -x[1] (分数取反，越大的数变得越小，所以排前面 -> 实现降序)
# 第二关键字: x[0] (名字，默认字典序 -> 实现升序)

sorted_complex = sorted(scores.items(), key=lambda x: (-x[1], x[0]))

print(sorted_complex)

[('Bob', 95), ('Alice', 85), ('Charlie', 85), ('David', 60)]


## 6. 函数

In [148]:
# 定义函数使用 def 关键字
def calculate(a, b):
    sum_val = a + b
    diff_val = a - b
    # 返回多个值，自动打包成元组 (sum_val, diff_val)
    return sum_val, diff_val

# 调用
x, y = 10, 5
s, d = calculate(x, y) # 自动解包
print(s, d) # 15 5

15 5


#### 作用域与 global 关键字 

这是最容易晕的地方。 在函数内部，你可以读取函数外部的变量，但如果想修改不可变类型（int/str）的全局变量，必须声明 global。

In [150]:
ans = 0  # 全局变量

def dfs(u):
    # 如果这里直接写 ans += 1，会报错！
    # 因为 Python 会认为你想定义一个新的局部变量 ans，但在赋值前引用了它。
    
    global ans  # 声明：我要修改外面那个 ans
    ans += 1
    
    # 继续递归...
    pass

dfs(1)
print(ans)

1


In [152]:
# Nested Function
def solve():
    # 数据准备
    n = 5
    graph = [[1, 2], [3], [], [], []]
    visited = [False] * n
    
    # 定义内部函数
    def dfs(u):
        # 它可以直接读取 graph 和 visited，不用作为参数传进来！
        visited[u] = True
        print(f"访问了 {u}")
        for v in graph[u]:
            if not visited[v]:
                dfs(v)
    
    # 启动
    dfs(0)

solve()

访问了 0
访问了 1
访问了 3
访问了 2


In [156]:
# 不要用可变对象（如列表）作为默认参数
# 意图：如果不传 path，就默认是空列表
def dfs(node, path=[]): 
    path.append(node)
    print(path)

dfs(1) # 输出 [1]
dfs(2) # 输出 [1, 2] -> 居然保留了上一次的结果！

# 正确做法
def dfs(node, path=None):
    if path is None:
        path = []
    path.append(node)
    print(path)
dfs(1)
dfs(2)

[1]
[1, 2]
[1]
[2]


In [158]:
# 递归深度
import sys

# 将递归深度设置为更大，例如 10万 或 20万
sys.setrecursionlimit(200000)

In [160]:
# lambda 匿名函数
# 语法: lambda 参数: 表达式 (自动return)
square = lambda x: x * x
print(square(5)) # 25

# 常用：自定义排序规则
pairs = [(1, 2), (3, 1), (5, 0)]
# 按第二个元素排序
pairs.sort(key=lambda x: x[1])

25


### 杂项

In [162]:
# math
import math

# 1. 最大公约数 (GCD)
print(math.gcd(12, 18))  # 6

# 2. 最小公倍数 (LCM) (Python 3.9+)
print(math.lcm(12, 18))  # 36
# 如果版本老，用公式: (a * b) // math.gcd(a, b)

# 3. 组合数 (Combinations) C(n, k)
# 从 5 个里选 2 个的方法数
print(math.comb(5, 2))   # 10

# 4. 整数平方根 (Integer Square Root)
# 比 int(n**0.5) 更精确，不会有浮点误差
print(math.isqrt(10))    # 3

# 5. 上取整 (Ceiling)
# 也就是 (a + b - 1) // b 的逻辑
print(math.ceil(2.3))    # 3

6
36
10
3
3


In [164]:
# bisect 二分查找
import bisect

arr = [1, 3, 3, 3, 5, 7]

# 1. bisect_left (相当于 C++ lower_bound)
# 查找第一个 >= x 的位置
idx1 = bisect.bisect_left(arr, 3)
print(idx1)  # 1 (第一个 3 的下标)

# 2. bisect_right (相当于 C++ upper_bound)
# 查找第一个 > x 的位置
idx2 = bisect.bisect_right(arr, 3)
print(idx2)  # 4 (最后一个 3 的后面)

# 实战技巧：统计区间 [L, R] 内有多少个数
# 数量 = bisect_right(R) - bisect_left(L)

1
4


In [166]:
# deque 双端队列（BFS）
from collections import deque

# 初始化
q = deque([1, 2, 3])

# 1. 头部操作 O(1)
q.appendleft(0)   # [0, 1, 2, 3]
first = q.popleft() # 0

# 2. 尾部操作 O(1)
q.append(4)       # [1, 2, 3, 4]
last = q.pop()    # 4

# 3. 旋转 (滑动窗口常用)
q.rotate(1) # 所有元素向右移动1格，末尾的跑到开头

In [168]:
# itertool 暴力枚举
import itertools

nums = [1, 2, 3]

# 1. 全排列 (Permutations) -> A(n, n)
# 这里的 list() 是为了把迭代器转为列表打印出来
print(list(itertools.permutations(nums)))
# [(1, 2, 3), (1, 3, 2), (2, 1, 3)... 共6种]

# 2. 组合 (Combinations) -> C(n, k)
# 选2个，不考虑顺序
print(list(itertools.combinations(nums, 2)))
# [(1, 2), (1, 3), (2, 3)]

# 3. 笛卡尔积 (Product) -> 替代多层 for 循环
# 相当于 for x in A: for y in B:
A = [1, 2]
B = ['a', 'b']
print(list(itertools.product(A, B)))
# [(1, 'a'), (1, 'b'), (2, 'a'), (2, 'b')]

# 4. 前缀和 (Accumulate)
# 简单的 arr[i] += arr[i-1]
vals = [1, 2, 3, 4]
print(list(itertools.accumulate(vals)))
# [1, 3, 6, 10]

[(1, 2, 3), (1, 3, 2), (2, 1, 3), (2, 3, 1), (3, 1, 2), (3, 2, 1)]
[(1, 2), (1, 3), (2, 3)]
[(1, 'a'), (1, 'b'), (2, 'a'), (2, 'b')]
[1, 3, 6, 10]


In [170]:
# functool 记忆化搜索 lru_cache装饰器
from functools import lru_cache

# maxsize=None 表示缓存大小不限制
@lru_cache(maxsize=None)
def fib(n):
    if n < 2:
        return n
    return fib(n-1) + fib(n-2)

# 如果不加 @lru_cache，计算 fib(40) 会跑好几秒
# 加了之后，瞬间完成！
print(fib(50))

12586269025
