# 复习
- 列表
- 元组

# Quiz
给定下面的具名元组，表示二维空间中的点：

```python
from collections import namedtuple

Point = namedtuple('Point', ['x', 'y'])
```

已知`x`可能的选择是1,2,6,8,9,10，而`y`可能的选择是2,3,4,5,6,11，并且`x`和`y`不能相等。请使用列表推导式得到所有可能的点，并打印这些点的数量。

## 思考

给定一个列表或元组`a`，如何使用判断它是否为非空？

参考阅读[Python Booleans: Use Truth Values in Your Code](https://realpython.com/python-boolean/)


![python collection](images/python_collection.svg)

# 集合（set）

集合就是数学意义上的集合，具备两个重要特征：无序、无重复。

>  A set is an unordered collection with no duplicate elements. 

## 基本操作

```
>>> basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
>>> basket
>>> 'orange' in basket
>>> len(basket)
>>> set("hello")
>>> set() # 空集合不能使用{}
>>> set([1, 3, 9, 5, 7, 7])
>>> basket.add('kiwifruit')
>>> basket.remove('orange') # 前提是orange必须存在，否则报错
```

### 集合推导式

集合也支持推导式（注意元组不支持）：

```python
names = ["Alice", "Bob", "Charlie", "David", "Eve"]

name_lengths = {len(name) for name in names}
```

### 应用

补全下面的代码：

```python
def get_favorite_colors():
    favorite_colors = set()

    while True:
        color = input("Enter a favorite color (or 'quit' to exit): ")
        if color.lower() == "quit":
            _______
        ___________________________
    return favorite_colors

colors = get_favorite_colors()
for c in colors:
    print(c)
```

## 基本操作（续）

集合就是数学意义上的集合。因此支持并、交、差。

![set](https://i.stack.imgur.com/uH6cL.png)

```
>>> a = set('abracadabra')
>>> b = set('alacazam')
>>> a                                  # unique letters in a
{'a', 'r', 'b', 'c', 'd'}
>>> a - b                              # letters in a but not in b
{'r', 'd', 'b'}
>>> a | b                              # letters in a or b or both
{'a', 'c', 'r', 'd', 'b', 'm', 'z', 'l'}
>>> a & b                              # letters in both a and b
{'a', 'c'}
>>> a ^ b                              # letters in a or b but not both
{'r', 'd', 'b', 'm', 'z', 'l'}
>>> box = {'apple', 'banana'}
>>> box.issubset(basket)
>>> basket.issuperset(box)
```

----

- `a - b`等价于`a.difference(b)`
- `a | b`等价于`a.union(b)`
- `a & b`等价于`a.intersection(b)`
- `a ^ b`等价于`a.symmetric_difference(b)`

## 可哈希（hashable）

下面的代码是否正确：

```python
data = {1, 'hello', [1, 2, 3], 3.14}
```

> 集合中的元素必须是可哈希的。

- 不可变的类型都是可哈希的
- 可变的类型都是不可哈希的

可以使用`hash()`得到一个元素的哈希值。参考[hashable](https://docs.python.org/3/glossary.html#term-hashable)。

# 字典（dict）
字典在其他编程语言中称为关联数组（associative arrays）、或`map`。该集合的元素是将一个值**映射**（mapping）到另外一个值。

考虑不同国家/地区在成都大运会所获的金牌数量：

| 国家/地区 |  金牌数量 |
| ---- | ----- |
| 中国 | 103 |
| 日本 | 21 |
| 韩国 | 17 |
| 意大利 | 17 |

```python
# key, value
>>> medals = {'中国': 103, '日本': 21, '韩国': 17, '意大利': 16}
>>> medals['中国']
>>> medals['意大利'] = 17 # 修改
>>> medals['印度'] = 11 # 新增
>>> data = {} # 空字典 或者 dict()
>>> len(medals)
```

![dict](images/dict.svg)

### 测试
测试下面的代码，你有什么结论？

```python
>>> medals['朝鲜']
>>> medals.get('朝鲜') # 查阅help(dict.get)或dict.get?
```

## del
`del`语句可以用来删除容器中的元素：

```python
>>> a = [1, 2, 3, 4, 5, 6]
>>> del a[0]
>>> del a[2:4]
```

----

```python
>>> del medals['意大利']
>>> len(medals)
```

## key和value

```python
>>> medals.keys()
>>> medals.values()
>>> list(medals)
>>> '中国' in medals # 判定key是否在字典中
```

### 对字典迭代

```python
for country in medals.keys():
     print(country, medals[country])

for country in medals:
     print(country, medals[country])
```

---

```python
# 同时获得key和value
for country, cnt in medals.items():
    print(country, cnt)
```

### 字典与可哈希
下面的代码是否正确？

```python
data = {[1]: 1, [1, 3]: 2, [2, 3, 4]: 3}
```

> 字典的key必须是可哈希的！

## 字典推导式
考虑下面的列表：

```python
fruits = ['apple', 'orange', 'pear', 'banana']
```

请计算每种水果名称的长度保存在一个字典中，其中key是水果名称，value是名称的长度。

> 列表、集合和字典均支持推导式，但没有元组推导式。

## 应用
设计一个大运会金牌统计系统。我们假设数据保存在一个列表中，每个元素表示某国家/地区获得金牌一次。请统计每个国家/地区获得的金牌总数，保存在一个字典中。

```python
raw_data = [
    "China",
    "China",
    "Japan",
    "China",
    "Italy",
    "Korea",
    "China",
    "Japan",
    "India",
    "UK",
    "Korea",
]

medals = {}

for country in raw_data:
    if country not in medals:
        ____________________
    else:
        ____________________

print(medals)
```

### defaultdict
如果key在字典中不存在，那么是无法直接获取其对应的value，也无法对其value进行修改。因此，**需要判定key是否存在**。

而Python的`collections`模块的`defaultdict`使得上述场景变得简单：

```python
from collections import defaultdict

# Create a defaultdict with default value 0
my_dict = defaultdict(int)

my_dict["a"] = 1
my_dict["b"] = 2

print(my_dict["a"])  # Output: 1
print(my_dict["b"])  # Output: 2
print(my_dict["c"])  # Output: 0 (default value)

print(my_dict)
```

### 练习
请使用`defaultdict`重写上面大运会金牌统计系统。

# 异常处理
程序中可能有多种错误，比如语法错误：`length('hello')`、`for i inside vec`。还有一种错误叫异常（exception），其语法正确，但语义不正确。

```python
>>> 1 / 0
>>> a + 1

>>> fruits = ['apple', 'orange', 'pear', 'banana']
>>> fruits[4]
>>> fruites.remove('grapes')
>>> medals = {'中国': 103, '日本': 21, '韩国': 17, '意大利': 17}
>>> medals['朝鲜']
```

## try except结构

```python
try:
    可能有异常的语句
except 异常类型：
    自定义异常处理方法
```

-----

```python
try:
    1 / 0
except ZeroDivisionError:
    print('ERROR')
```

----

```python
fruits = ['apple', 'orange', 'pear', 'banana']
try:
    fruits[4]
except:
    print('列表越界错误')
```

## EAFP

考虑`a/b`的问题。一种常用处理错误的哲学是LBYL（look before you leap），被翻译成“三思而后行”。

```python
a, b = 1, 0
if b != 0:
    a / b
else:
    print('ERROR')
```

而Python中更推荐的方式是EAFP（easier to ask for forgiveness than permission），可直译为“获取原谅比许可简单”。

```python
a, b = 1, 0
try:
    1 / 0
except ZeroDivisionError:
    print('ERROR')
```

第一种类似“如果天气预报说会下雨，那么我就不出门”；而第二种更像“出门前不看天气预报，如果淋雨了，就回家后洗澡吃感冒药”。

## 应用
使用异常处理来解决字典访问时key不存在的问题。

```python
medals = {}

for country in raw_data:
    try:
        medals[country] += 1
    except _______:
        medals[country] = 1
```

这个方法更高效，也更加Pythonic。

## 练习

考虑下面的代码：

```python
import math

def is_prime(n):
    for i in range(2, int(math.sqrt(n)) + 1):
        if n % i == 0:
            return False
        i += 1
    return True

number = int(input('Input an integer'))
print(is_prime(number))
```

显然，如果用户输入了非整数（如abc），上面的代码会报错。请为上面的代码加入异常处理。