# 第8课：字典与集合

## 学习目标
- 掌握字典的创建和操作
- 掌握字典的常用方法
- 理解字典推导式
- 掌握集合的使用
- 了解集合运算

## 1. 字典基础

字典是键值对的集合，键必须是不可变类型（字符串、数字、元组）。

In [None]:
# 创建字典
empty_dict = {}
person = {"name": "小明", "age": 18, "city": "北京"}
scores = dict(math=90, english=85, chinese=92)

print(f"空字典: {empty_dict}")
print(f"person: {person}")
print(f"scores: {scores}")

In [None]:
# 从键值对列表创建
pairs = [("a", 1), ("b", 2), ("c", 3)]
d = dict(pairs)
print(d)

# 使用 fromkeys
keys = ["a", "b", "c"]
d = dict.fromkeys(keys, 0)  # 所有键初始值为 0
print(d)

## 2. 访问和修改字典

In [None]:
person = {"name": "小明", "age": 18, "city": "北京"}

# 访问值
print(f"姓名: {person['name']}")

# 使用 get（键不存在时返回默认值）
print(f"邮箱: {person.get('email', '未设置')}")

# 修改值
person['age'] = 19
print(f"修改后: {person}")

# 添加新键值对
person['email'] = "xiaoming@example.com"
print(f"添加后: {person}")

In [None]:
# 删除键值对
person = {"name": "小明", "age": 18, "city": "北京"}

# del 删除
del person['city']
print(f"del 后: {person}")

# pop 删除并返回
age = person.pop('age')
print(f"pop 返回: {age}, 字典: {person}")

# pop 带默认值
email = person.pop('email', None)
print(f"pop 不存在的键: {email}")

## 3. 字典常用方法

In [None]:
person = {"name": "小明", "age": 18, "city": "北京"}

# 获取所有键、值、键值对
print(f"keys: {list(person.keys())}")
print(f"values: {list(person.values())}")
print(f"items: {list(person.items())}")

# 检查键是否存在
print(f"'name' in person: {'name' in person}")
print(f"'email' in person: {'email' in person}")

In [None]:
# 遍历字典
person = {"name": "小明", "age": 18, "city": "北京"}

# 遍历键
for key in person:
    print(f"{key}: {person[key]}")

print()

# 遍历键值对（推荐）
for key, value in person.items():
    print(f"{key}: {value}")

In [None]:
# update 更新/合并字典
d1 = {"a": 1, "b": 2}
d2 = {"b": 3, "c": 4}

d1.update(d2)
print(f"update 后: {d1}")

# Python 3.9+ 可以使用 | 合并
d1 = {"a": 1, "b": 2}
d2 = {"b": 3, "c": 4}
merged = d1 | d2
print(f"| 合并: {merged}")

In [None]:
# setdefault - 获取键值，不存在则设置默认值
d = {"a": 1}

# 键存在，返回现有值
val = d.setdefault("a", 100)
print(f"a: {val}, d: {d}")

# 键不存在，设置并返回默认值
val = d.setdefault("b", 200)
print(f"b: {val}, d: {d}")

## 4. 字典推导式

In [None]:
# 基本字典推导式
squares = {x: x**2 for x in range(1, 6)}
print(f"平方: {squares}")

# 带条件
even_squares = {x: x**2 for x in range(10) if x % 2 == 0}
print(f"偶数平方: {even_squares}")

In [None]:
# 交换键值
original = {"a": 1, "b": 2, "c": 3}
swapped = {v: k for k, v in original.items()}
print(f"原始: {original}")
print(f"交换: {swapped}")

# 从两个列表创建字典
keys = ["name", "age", "city"]
values = ["小明", 18, "北京"]
person = {k: v for k, v in zip(keys, values)}
print(f"person: {person}")

## 5. 集合基础

集合是**无序**、**不重复**元素的集合。

In [None]:
# 创建集合
empty_set = set()  # 注意：{} 创建的是空字典
numbers = {1, 2, 3, 4, 5}
from_list = set([1, 2, 2, 3, 3, 3])  # 自动去重

print(f"空集合: {empty_set}")
print(f"numbers: {numbers}")
print(f"从列表创建（去重）: {from_list}")

In [None]:
# 集合操作
s = {1, 2, 3}

# 添加元素
s.add(4)
print(f"add 后: {s}")

# 添加多个元素
s.update([5, 6, 7])
print(f"update 后: {s}")

# 删除元素
s.remove(7)  # 元素不存在会报错
s.discard(10)  # 元素不存在不报错
print(f"删除后: {s}")

# pop 随机删除
elem = s.pop()
print(f"pop 返回: {elem}, 集合: {s}")

## 6. 集合运算

In [None]:
a = {1, 2, 3, 4, 5}
b = {4, 5, 6, 7, 8}

# 并集
print(f"并集 a | b: {a | b}")
print(f"并集 a.union(b): {a.union(b)}")

# 交集
print(f"交集 a & b: {a & b}")
print(f"交集 a.intersection(b): {a.intersection(b)}")

# 差集
print(f"差集 a - b: {a - b}")
print(f"差集 a.difference(b): {a.difference(b)}")

# 对称差集（不同时在两个集合中的元素）
print(f"对称差集 a ^ b: {a ^ b}")

In [None]:
# 子集和超集判断
a = {1, 2, 3}
b = {1, 2, 3, 4, 5}

print(f"a 是 b 的子集: {a.issubset(b)}")
print(f"b 是 a 的超集: {b.issuperset(a)}")
print(f"a 和 b 是否不相交: {a.isdisjoint({6, 7})}")

## 7. 实际应用

In [None]:
# 统计词频
text = "apple banana apple orange banana apple"
words = text.split()

word_count = {}
for word in words:
    word_count[word] = word_count.get(word, 0) + 1

print(f"词频: {word_count}")

# 使用 Counter（更简洁）
from collections import Counter
word_count = Counter(words)
print(f"Counter: {word_count}")
print(f"最常见的2个词: {word_count.most_common(2)}")

In [None]:
# 使用集合去重
numbers = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4]
unique = list(set(numbers))
print(f"去重: {unique}")

# 找两个列表的共同元素
list1 = [1, 2, 3, 4, 5]
list2 = [4, 5, 6, 7, 8]
common = list(set(list1) & set(list2))
print(f"共同元素: {common}")

In [None]:
# 嵌套字典
students = {
    "001": {"name": "小明", "scores": {"math": 90, "english": 85}},
    "002": {"name": "小红", "scores": {"math": 95, "english": 92}}
}

# 访问嵌套数据
print(f"小明的数学成绩: {students['001']['scores']['math']}")

# 遍历
for sid, info in students.items():
    print(f"学号: {sid}, 姓名: {info['name']}")

## 8. 练习题

### 练习 1：合并字典
合并两个字典，相同键的值相加

In [None]:
d1 = {"a": 1, "b": 2, "c": 3}
d2 = {"b": 3, "c": 4, "d": 5}
# 期望结果: {"a": 1, "b": 5, "c": 7, "d": 5}
# 在这里编写代码


### 练习 2：找唯一元素
给定一个列表，找出只出现一次的元素

In [None]:
numbers = [1, 2, 2, 3, 3, 4, 5, 5]
# 在这里编写代码


### 练习 3：分组统计
按首字母对单词进行分组

In [None]:
words = ["apple", "banana", "apricot", "blueberry", "cherry", "avocado"]
# 期望: {"a": ["apple", "apricot", "avocado"], "b": ["banana", "blueberry"], "c": ["cherry"]}
# 在这里编写代码


## 9. 本课小结

1. **字典**：键值对集合，用 `{}` 或 `dict()` 创建
2. **字典方法**：get、keys、values、items、update、pop、setdefault
3. **字典推导式**：`{k: v for k, v in iterable}`
4. **集合**：无序不重复元素，用 `set()` 创建
5. **集合运算**：并集 `|`、交集 `&`、差集 `-`、对称差集 `^`

下一课我们将学习字符串处理！