# Python语法基础

## 1. 变量与数据类型

### 1.1 变量定义与内存管理

Python变量的本质：
- 变量是对象的引用（类似于指针）
- 变量本身没有类型，类型属于对象
- 赋值操作实际上是建立引用关系

内存管理机制：

In [None]:
# 示例：变量引用
a = 10  # 创建整数对象10，变量a引用它
b = a   # 变量b也引用同一个对象
a = 20  # 创建新对象20，a改为引用它，b仍引用10
print(f"a: {a}, b: {b}")

# 查看对象内存地址
print(f"a的id: {id(a)}, b的id: {id(b)}")

### 1.2 数据类型详解

#### 数字类型
- 整数(int)：不限大小（仅受内存限制）
- 浮点数(float)：双精度浮点，注意精度问题
- 复数(complex)：包含实部和虚部

#### 字符串(str)
- 不可变序列
- 三种表示方式：单引号、双引号、三引号
- 原始字符串（忽略转义）：r'...'

#### 布尔(bool)
- True和False
- 实际上是整数子类：True==1，False==0
- 假值包括：False, None, 0, "", [], {}, ()等

In [None]:
# 数字类型示例
big_num = 999999999999999999999999999999999999999999999999999999999999
print(0.1 + 0.2 == 0.3)  # 浮点精度问题
c = 3 + 4j
print(f"复数: {c}, 实部: {c.real}, 虚部: {c.imag}")

# 字符串示例
s1 = '单引号'
s2 = "双引号"
s3 = """多行
字符串"""
path = r'C:\new_folder'  # 原始字符串

# 布尔类型示例
print(bool(""))  # 空字符串为False
print(bool([]))  # 空列表为False

## 2. 运算符全面解析

### 2.1 算术运算符

| 运算符 | 名称   | 描述                  | 示例       | 结果  |
|--------|--------|-----------------------|------------|-------|
| `+`    | 加     | 数值相加/字符串拼接    | `3 + 2`    | `5`   |
| `-`    | 减     | 数值相减              | `5 - 3`    | `2`   |
| `*`    | 乘     | 数值相乘/字符串重复    | `3 * 2`    | `6`   |
| `/`    | 除     | 总是返回浮点数        | `6 / 3`    | `2.0` |
| `//`   | 整除   | 向下取整              | `7 // 3`   | `2`   |
| `%`    | 取模   | 返回除法余数          | `7 % 3`    | `1`   |
| `**`   | 幂运算 | 计算次方              | `2 ** 3`   | `8`   |

In [None]:
# 特殊行为示例
print("Hello" + "World")  # HelloWorld
print("Hi" * 3)          # HiHiHi
print(5 + 3.14)          # 8.14

### 2.2 比较运算符

| 运算符 | 描述       | 示例         | 结果  |
|--------|------------|--------------|-------|
| `==`   | 等于       | `3 == '3'`   | False |
| `!=`   | 不等于     | `5 != 3`     | True  |
| `>`    | 大于       | `5 > 3.5`    | True  |
| `<`    | 小于       | `'a' < 'b'`  | True  |
| `>=`   | 大于等于   | `5 >= 5`     | True  |
| `<=`   | 小于等于   | `3.0 <= 3`   | True  |

In [None]:
# 链式比较特性
x = 5
print(1 < x < 10)        # True
print(3 <= x*2 <= 12)    # True

### 2.3 逻辑运算符

| 运算符 | 描述   | 示例                   | 结果  |
|--------|--------|------------------------|-------|
| `and`  | 逻辑与 | `True and False`       | False |
| `or`   | 逻辑或 | `False or 3`          | 3     |
| `not`  | 逻辑非 | `not 0`               | True  |

In [None]:
# 短路特性验证
def check():
    print("函数被调用")
    return True

False and check()  # 无输出
True or check()    # 无输出

### 2.4 位运算符

| 运算符 | 描述       | 示例           | 结果（十进制） |
|--------|------------|----------------|---------------|
| `&`    | 按位与     | `0b1100 & 0b1010` | 8            |
| `|`    | 按位或     | `0b1100 | 0b1010` | 14           |
| `^`    | 按位异或   | `0b1100 ^ 0b1010` | 6            |
| `~`    | 按位取反   | `~0b0011`        | -4           |
| `<<`   | 左移       | `5 << 2`         | 20           |
| `>>`   | 右移       | `16 >> 2`        | 4            |

In [None]:
# 位操作应用
print(1 << 4)        # 16
num = 7
print(num & 1)       # 1（奇数）

### 2.5 赋值运算符

| 运算符 | 等价表达式 | 示例        | 效果           |
|--------|------------|-------------|----------------|
| `=`    | -          | `x = 5`     | 基本赋值       |
| `+=`   | `x = x + y`| `x += 3`    | 增量赋值       |
| `-=`   | `x = x - y`| `x -= 2`    | 减量赋值       |
| `*=`   | `x = x * y`| `x *= 1.5`  | 乘量赋值       |
| `/=`   | `x = x / y`| `x /= 2`    | 浮点除赋值     |
| `//=`  | `x = x // y`| `x //= 2`  | 整除赋值       |
| `%=`   | `x = x % y`| `x %= 3`    | 取模赋值       |
| `**=`  | `x = x ** y`| `x **= 2`  | 幂运算赋值     |

In [None]:
# 可变对象陷阱
lst1 = [1,2]
lst2 = lst1
lst1 += [3]
print("lst2:", lst2)  # [1,2,3]

lst1 = lst1 + [4]
print("lst2:", lst2)  # [1,2,3]

### 2.6 成员与身份运算符

| 类型       | 运算符 | 描述                  | 示例              | 结果  |
|------------|--------|-----------------------|-------------------|-------|
| 成员运算符 | `in`   | 元素存在性            | `3 in [1,2,3]`    | True  |
|            | `not in` | 元素不存在性         | `'a' not in 'xyz'`| True  |
| 身份运算符 | `is`   | 对象标识相同          | `x = [1]; y = [1]; x is y` | False |
|            | `is not` | 对象标识不同        | `3 is not None`   | True  |

In [None]:
a = 256
b = 256
print(a is b)  # True

x = 257
y = 257
print(x is y)  # False

lst = [1,2,3]
print([2] in lst)  # False

### 2.7 运算符优先级

| 优先级 | 运算符                              |
|--------|-------------------------------------|
| 1      | `()`                                |
| 2      | `**`                                |
| 3      | `~` `+` `-`                         |
| 4      | `*` `/` `%` `//`                    |
| 5      | `+` `-`                             |
| 6      | `<<` `>>`                           |
| 7      | `&`                                 |
| 8      | `^`                                 |
| 9      | `|`                                 |
| 10     | `==` `!=` `>` `<` `>=` `<=`         |
| 11     | `is` `is not`                       |
| 12     | `in` `not in`                       |
| 13     | `not`                               |
| 14     | `and`                               |
| 15     | `or`                                |

In [None]:
result = 3 + 4 * 2 ** 2 // (1 + 1)
print(result)  # 11

### 综合练习
**练习1**：使用位运算交换两个变量
**练习2**：判断闰年（能被4整除但不能被100整除，或能被400整除）
**练习3**：计算 `(True or False) and (not (5 <= 3))`

In [None]:
# 练习1答案
a = 5
b = 3
a ^= b
b ^= a
a ^= b
print(f"a={a}, b={b}")

In [None]:
# 练习2答案
year = 2024
is_leap = (year % 4 == 0 and year % 100 != 0) or (year % 400 == 0)
print(f"{year}是闰年: {is_leap}")

In [None]:
# 练习3答案
print((True or False) and (not (5 <= 3)))  # True

## 3. 控制流程深度解析

### 3.1 条件表达式详解

#### 条件语句的本质
Python中的条件控制结构基于布尔逻辑进行分支判断，其核心特点是：
- **缩进定义代码块**：Python使用严格的缩进（通常4个空格）来界定代码块
- **灵活的表达式**：条件表达式可以是比较运算、成员测试、身份测试或布尔组合

#### 多分支决策模式
```python
if condition1:
    # 当condition1为True时执行
elif condition2:
    # 当condition1为False且condition2为True时执行
else:
    # 当所有条件都为False时执行
```

#### 模式匹配（Python 3.10+）
结构化模式匹配比传统的if-elif-else更清晰，适用于：
- 处理复杂数据结构
- 实现状态机
- 解析命令行参数

In [None]:
# 模式匹配示例
def handle_http_status(status):
    match status:
        case 200:
            return "成功"
        case 404:
            return "未找到"
        case 500 | 502 | 503:  # 多值匹配
            return "服务器错误"
        case _ if 400 <= status < 500:  # 带条件的匹配
            return "客户端错误"
        case _:
            return "未知状态码"

print(handle_http_status(404))  # 输出"未找到"
print(handle_http_status(403))  # 输出"客户端错误"

### 3.2 循环控制进阶

#### 循环结构类型
Python提供两种循环结构：
1. **while循环**：基于条件重复执行
2. **for循环**：迭代序列或可迭代对象

#### 循环控制语句
| 语句      | 作用                           |
|-----------|------------------------------|
| `break`   | 立即退出整个循环                 |
| `continue`| 跳过当前迭代，进入下一次循环        |
| `else`    | 循环正常结束（非break退出）时执行   |

#### 高效迭代技巧
- `enumerate`：同时获取索引和值
- `zip`：并行迭代多个序列
- `itertools`模块：提供高级迭代工具

In [None]:
# 循环高级用法示例
names = ['Alice', 'Bob', 'Charlie']
scores = [85, 92, 78]

# 使用enumerate和zip
for idx, (name, score) in enumerate(zip(names, scores), start=1):
    print(f"{idx}. {name}: {score}")
else:
    print("成绩统计结束")

# 自定义可迭代对象
class CountDown:
    def __init__(self, start):
        self.current = start
    
    def __iter__(self):
        return self
    
    def __next__(self):
        if self.current <= 0:
            raise StopIteration
        num = self.current
        self.current -= 1
        return num

print("倒计时:")
for num in CountDown(3):
    print(num)

#### 循环性能优化
1. 避免在循环内进行不必要的计算
2. 使用生成器表达式替代列表推导式（大数据量时）
3. 考虑使用内置函数如`map()`, `filter()`

#### 循环中的异常处理
正确处理循环中的异常保证程序健壮性：

In [None]:
# 循环异常处理示例
urls = ['https://example.com', 'invalid_url', 'https://example.org']

for url in urls:
    try:
        print(f"正在处理: {url}")
        if 'invalid' in url:
            raise ValueError("无效URL")
        # 模拟成功处理
        print(f"成功处理 {url}")
    except ValueError as e:
        print(f"跳过 {url}, 错误: {e}")
        continue
    except Exception as e:
        print(f"严重错误: {e}")
        break
    else:
        print(f"{url} 处理完成")
    finally:
        print("清理临时资源\n")

#### 循环与函数式编程
Python支持部分函数式编程风格：
- `map()`: 对可迭代对象应用函数
- `filter()`: 过滤元素
- `functools.reduce()`: 累积计算

In [None]:
from functools import reduce

# 函数式编程示例
numbers = [1, 2, 3, 4, 5]

# map示例
squared = list(map(lambda x: x**2, numbers))
print(f"平方: {squared}")

# filter示例
evens = list(filter(lambda x: x%2==0, numbers))
print(f"偶数: {evens}")

# reduce示例
product = reduce(lambda x,y: x*y, numbers)
print(f"乘积: {product}")

#### 控制流程最佳实践
1. 避免过深的嵌套（一般不超过3层）
2. 复杂条件提取为变量或函数
3. 使用生成器处理大数据集
4. 优先使用for循环而非while循环（当迭代次数明确时）
5. 适当使用`itertools`模块提高效率

In [None]:
# 控制流程综合示例
import itertools

def process_data(data):
    """处理数据的最佳实践示例"""
    # 条件判断
    if not data:
        print("警告: 空数据集")
        return []
    
    # 使用生成器表达式
    filtered = (x for x in data if x > 0)
    
    # 使用itertools.islice限制处理数量
    results = []
    for idx, value in enumerate(itertools.islice(filtered, 100)):
        try:
            # 复杂处理逻辑
            result = value ** 0.5
            if result > 10:
                continue  # 跳过过大值
            results.append(result)
        except Exception as e:
            print(f"处理错误: {e}")
    
    return results

data = [1, 4, -5, 9, 16, 0, 25, -1, 36]
print("处理结果:", process_data(data))

## 控制流程练习

**练习1**：使用模式匹配实现一个简单的命令行解析器

**练习2**：使用生成器实现斐波那契数列

**练习3**：使用itertools.groupby对数据进行分组统计

In [None]:
# 练习1：命令行解析器
def parse_command(command):
    match command.split():
        case ["exit"]:
            print("退出程序")
        case ["load", filename]:
            print(f"加载文件: {filename}")
        case ["save", filename] if '.' in filename:
            print(f"保存文件: {filename}")
        case _:
            print("未知命令")

# 在此测试您的代码
parse_command("load data.txt")

In [None]:
# 练习2：斐波那契生成器
def fibonacci(limit):
    a, b = 0, 1
    while a < limit:
        yield a
        a, b = b, a + b

# 在此测试您的代码
print("斐波那契数列:", list(fibonacci(100)))

In [None]:
# 练习3：数据分组
from itertools import groupby

data = [('A', 85), ('B', 92), ('A', 78), ('C', 90), ('B', 88)]

# 按字母分组计算平均分
# 提示：需要先排序再分组
# 在此编写您的代码

## 4. 数据结构高级特性

### 4.1 列表推导式与生成器

列表推导式：

In [None]:
squares = [x**2 for x in range(10) if x % 2 == 0]
print(squares)

# 生成器表达式
sum_of_squares = sum(x**2 for x in range(1000000))
print(f"前1000000个数的平方和: {sum_of_squares}")

### 4.2 字典高级操作

字典推导式：

In [None]:
square_dict = {x: x**2 for x in range(5)}
print(square_dict)

# setdefault()方法
d = {}
for k, v in [('a', 1), ('b', 2), ('a', 3)]:
    d.setdefault(k, []).append(v)
print(d)

## 4. 数据结构

### 4.1 列表操作

列表是Python中最常用的数据结构，特点：
- **有序的集合**：元素按插入顺序存储
- **可变性**：可以修改内容
- **异构元素**：可以包含不同类型的元素
- **索引支持**：支持正负索引（-1表示最后一个元素）

#### 常用列表方法：

In [None]:
# 列表基础操作示例
fruits = ['apple', 'banana']

# 添加元素
fruits.append('orange')        # 末尾添加
fruits.insert(1, 'pear')      # 索引1处插入
print("添加后:", fruits)      # ['apple', 'pear', 'banana', 'orange']

# 删除元素
fruits.remove('banana')       # 删除第一个匹配项
popped = fruits.pop(2)        # 移除并返回索引2的元素
print(f"删除后: {fruits}, 弹出元素: {popped}")

# 排序与反转
nums = [3, 1, 4, 2]
nums.sort()                   # 原地排序
nums.reverse()                # 原地反转
print("排序结果:", nums)      # [4, 3, 2, 1]

# 负索引访问
print("最后一个元素:", fruits[-1])  # orange

#### 列表切片操作
**语法规则**：
```python
list[start:end:step]
```
- start：起始索引（包含），默认0
- end：结束索引（不包含），默认到末尾
- step：步长，默认1

**重要特性**：
- 返回新列表
- 支持负数索引
- 不会修改原列表

In [None]:
# 切片操作示例
letters = ['a', 'b', 'c', 'd', 'e', 'f']

print("前三个元素:", letters[0:3])    # ['a', 'b', 'c']
print("每隔一个取元素:", letters[::2]) # ['a', 'c', 'e']
print("反向切片:", letters[-3:-1])   # ['d', 'e']
print("反转列表:", letters[::-1])    # ['f', 'e', 'd', 'c', 'b', 'a']

# 修改原列表的切片
letters[1:3] = ['x', 'y']
print("修改后:", letters)           # ['a', 'x', 'y', 'd', 'e', 'f']

### 4.2 字典操作

字典是键值对的集合，特点：
- **无序性**（Python 3.7+保持插入顺序）
- **键不可变**：键必须是字符串、数字或元组等不可变类型
- **值任意类型**：值可以是任意Python对象
- **高效查找**：基于哈希表实现，查找时间复杂度O(1)

#### 常用字典方法：

In [None]:
# 字典基础操作示例
student = {"name": "Alice", "age": 20}

# 增删改查
student["score"] = 85       # 添加新键值对
student["age"] = 21         # 修改已有键
del student["score"]        # 删除键
print("当前字典:", student)  # {'name': 'Alice', 'age': 21}

# 常用方法
print("所有键:", student.keys())    # dict_keys(['name', 'age'])
print("所有值:", student.values())  # dict_values(['Alice', 21])
print("键值对:", student.items())   # dict_items([('name', 'Alice'), ('age', 21)])

# 安全访问
print("获取成绩:", student.get("score", "N/A"))  # N/A

# 合并字典
extra_info = {"gender": "female", "age": 22}
student.update(extra_info)
print("合并后:", student)  # {'name': 'Alice', 'age': 22, 'gender': 'female'}

#### 字典视图对象
Python 3中的特殊特性：
- `keys()`, `values()`, `items()`返回视图对象
- 视图对象动态反映字典变化
- 支持集合操作（交集、并集等）

In [None]:
# 视图对象示例
d = {'a': 1, 'b': 2}
keys = d.keys()
values = d.values()

# 动态变化演示
d['c'] = 3
print("更新后的键视图:", list(keys))    # ['a', 'b', 'c']
print("更新后的值视图:", list(values))  # [1, 2, 3]

# 集合操作
d2 = {'b': 3, 'c': 4}
common_keys = d.keys() & d2.keys()
print("共有键:", common_keys)  # {'b', 'c'}

### 4.1 列表推导式与生成器

#### 列表推导式（List Comprehension）
**语法结构**：
```python
[expression for item in iterable if condition]
```

**核心特性**：
1. 快速创建新列表的简洁语法
2. 可包含条件过滤（if子句）
3. 支持多层嵌套循环

**应用场景**：
- 数据转换（如类型转换、数值计算）
- 数据过滤（如筛选满足条件的元素）
- 矩阵操作（如二维列表处理）

**注意事项**：
- 避免过度复杂的嵌套（超过2层建议改用常规循环）
- 处理大数据时注意内存消耗
- 无法处理异常（需在外部处理）

In [None]:
# 列表推导式示例
# 基本形式
squares = [x**2 for x in range(10)]
print("平方列表:", squares)

# 带条件过滤
even_squares = [x**2 for x in range(10) if x % 2 == 0]
print("偶数平方:", even_squares)

# 多层嵌套
matrix = [[1,2,3], [4,5,6], [7,8,9]]
flatten = [num for row in matrix for num in row]
print("扁平化矩阵:", flatten)

#### 生成器表达式（Generator Expression）
**语法结构**：
```python
(expression for item in iterable if condition)
```

**核心特性**：
1. 惰性求值：按需生成元素，节省内存
2. 单向迭代：只能迭代一次
3. 可与多数内置函数配合使用（sum、max等）

**最佳实践**：
- 处理大型数据集时优先使用
- 管道式数据处理（多个生成器串联）
- 需要多次使用时转换为其他数据结构

In [None]:
# 生成器示例
# 基本生成器
gen = (x**3 for x in range(5))
print("生成器类型:", type(gen))
print("生成器内容:", list(gen))

# 管道处理
data = range(1000000)
sum_squares = sum(x**2 for x in data if x % 3 == 0)
print("能被3整除的平方和:", sum_squares)

# 生成器与列表对比
import sys
list_size = sys.getsizeof([x for x in range(1000000)])
gen_size = sys.getsizeof((x for x in range(1000000)))
print(f"列表内存: {list_size} bytes")
print(f"生成器内存: {gen_size} bytes")

### 4.2 字典高级操作

#### 字典推导式（Dict Comprehension）
**语法结构**：
```python
{key_expr: value_expr for item in iterable if condition}
```

**典型应用**：
- 转换现有字典（键值变换）
- 从其他数据结构构建字典
- 数据分组预处理

**特殊方法**：
- `setdefault(key, default)`：安全获取并设置默认值
- `update()`：合并字典（原地修改）
- `get(key, default)`：安全获取值

In [None]:
# 字典操作示例
# 字典推导式
square_dict = {x: x**2 for x in range(5)}
print("平方字典:", square_dict)

# 键值转换
original = {'a': 1, 'b': 2}
inverted = {v: k for k, v in original.items()}
print("反转字典:", inverted)

# setdefault应用
word_counts = {}
words = ['apple', 'banana', 'apple', 'cherry']
for word in words:
    word_counts.setdefault(word, 0)
    word_counts[word] += 1
print("词频统计:", word_counts)

#### 字典合并方法
1. **update()方法**：
```python
dict1.update(dict2)  # 原地修改dict1
```

2. **解包操作符（Python 3.5+）**：
```python
merged = {**dict1, **dict2}
```

3. **collections.ChainMap**：
```python
from collections import ChainMap
combined = ChainMap(dict1, dict2)
```

**选择建议**：
- 需要新字典时使用解包操作符
- 需要动态更新时用ChainMap
- 需要原地修改时用update()

In [None]:
# 字典合并示例
d1 = {'a': 1, 'b': 2}
d2 = {'b': 3, 'c': 4}

# 方法1：解包操作符（优先）
merged = {**d1, **d2}
print("解包合并:", merged)  # {'a':1, 'b':3, 'c':4}

# 方法2：update()
d1.update(d2)
print("update合并:", d1)  # 原地修改d1

# 方法3：ChainMap
from collections import ChainMap
combined = ChainMap(d1, d2)
print("ChainMap获取b:", combined['b'])  # 显示第一个字典中的值

### 4.3 集合操作（Set Operations）

**核心特性**：
- 无序的唯一元素集合
- 支持数学集合运算
- 基于哈希表实现，查找效率O(1)

**运算类型**：
| 运算符 | 方法          | 描述                |
|--------|---------------|--------------------|
| `|`    | union()       | 并集                |
| `&`    | intersection()| 交集                |
| `-`    | difference()  | 差集                |
| `^`    | symmetric_diff() | 对称差集         |

**特殊类型**：
- `frozenset`：不可变集合（可哈希，可用作字典键）
- `collections.Counter`：带计数器的多重集合

In [None]:
# 集合操作示例
A = {1, 2, 3, 4}
B = {3, 4, 5, 6}

print("并集:", A | B)       # {1,2,3,4,5,6}
print("交集:", A & B)       # {3,4}
print("差集:", A - B)       # {1,2}
print("对称差集:", A ^ B)   # {1,2,5,6}

# 集合推导式
words = ['apple', 'banana', 'cherry']
unique_lengths = {len(word) for word in words}
print("唯一长度集合:", unique_lengths)

# 冻结集合
fs = frozenset([1,2,3])
try:
    fs.add(4)  # 会抛出AttributeError
except AttributeError as e:
    print("错误:", e)

#### 集合应用场景
1. **快速去重**：
```python
unique_items = list(set(duplicate_list))
```

2. **成员检测优化**：
```python
if item in large_set:  # 比列表快得多
    ...
```

3. **数据关系分析**：
- 共同好友（交集）
- 独特特征（差集）
- 组合特征（并集）

**性能对比**：
| 操作        | 列表    | 集合    |
|------------|---------|---------|
| 成员检测    | O(n)    | O(1)    |
| 去重        | O(n²)   | O(n)    |
| 交/并/差集  | O(n*m)  | O(len(s)) |

In [None]:
# 性能对比示例
import timeit

# 成员检测
list_time = timeit.timeit('"99999" in lst', 
    setup='lst = list(map(str, range(100000)))', 
    number=1000)

set_time = timeit.timeit('"99999" in s', 
    setup='s = set(map(str, range(100000)))', 
    number=1000)

print(f"列表检测耗时: {list_time:.4f}s")
print(f"集合检测耗时: {set_time:.4f}s")

## 综合练习

In [None]:
# 练习：实现一个支持加减乘除的计算器类
class Calculator:
    def __init__(self, initial_value=0):
        self.value = initial_value
    
    def add(self, x):
        self.value += x
        return self
    
    def subtract(self, x):
        self.value -= x
        return self
    
    def multiply(self, x):
        self.value *= x
        return self
    
    def divide(self, x):
        try:
            self.value /= x
        except ZeroDivisionError:
            print("错误：除数不能为零")
        return self
    
    def __str__(self):
        return str(self.value)

# 链式调用
calc = Calculator(10)
calc.add(5).multiply(3).subtract(2).divide(4)
print(f"计算结果: {calc}")