集合的本质是许多唯一对象的聚集。因此，集合可以用于去重

In [2]:
l = ['spam', 'spam', 'eggs', 'spam']
list(set(l))

['spam', 'eggs']

集合中的元素必须是可散列的，set 类型本身是不可散列的，但是
frozenset 可以。因此可以创建一个包含不同 frozenset 的 set。
除了保证唯一性，集合还实现了很多基础的中缀运算符。给定两个集合
a 和 b，a | b 返回的是它们的合集，a & b 得到的是交集，而 a - b
得到的是差集。合理地利用这些操作，不仅能够让代码的行数变少，还
能减少 Python 程序的运行时间。这样做同时也是为了让代码更易读，从
而更容易判断程序的正确性，因为利用这些运算符可以省去不必要的循
环和逻辑操作。
例如，我们有一个电子邮件地址的集合（haystack），还要维护一个
较小的电子邮件地址集合（needles），然后求出 needles 中有多少地
址同时也出现在了 heystack 里。借助集合操作，我们只需要一行代码
就可以了

In [None]:
found = len(needles & haystack)

### 集合字面量
除空集之外，集合的字面量——{1}、{1, 2}，等等——看起来跟它的
数学形式一模一样。如果是空集，那么必须写成 set() 的形式
像 {1, 2, 3} 这种字面量句法相比于构造方法（set([1, 2, 3])）要
更快且更易读。后者的速度要慢一些，因为 Python 必须先从 set 这个
名字来查询构造方法，然后新建一个列表，最后再把这个列表传入到构
造方法里。但是如果是像 {1, 2, 3} 这样的字面量，Python 会利用一
个专门的叫作 BUILD_SET 的字节码来创建集合

用 dis.dis（反汇编函数）来看看两个方法的字节码的不同

In [3]:
from dis import dis
dis('{1}')

  1           0 LOAD_CONST               0 (1)
              3 BUILD_SET                1
              6 RETURN_VALUE


In [4]:
dis('set([1])')

  1           0 LOAD_NAME                0 (set)
              3 LOAD_CONST               0 (1)
              6 BUILD_LIST               1
              9 CALL_FUNCTION            1 (1 positional, 0 keyword pair)
             12 RETURN_VALUE


➊ 检查 {1} 字面量背后的字节码。  
➋ 特殊的字节码 BUILD_SET 几乎完成了所有的工作。  
➌ set([1]) 的字节码。  
➍ 3 种不同的操作代替了上面的  
BUILD_SET：LOAD_NAME、BUILD_LIST 和 CALL_FUNCTION。  

### dict和set的背后