# 算法和数据结构
## 序列分解为单独的变量

In [4]:
data = [ 'ACME', 50, 91.1, (2012, 12, 21) ]
name, shares, price, (year, mon, day) = data

# 元素数量一定要匹配
# 不仅仅只是元组或列表，只要对象是可迭代的，就可以执行分解操作。 包括字符串，文件对象，迭代器和生成器。
tmp_str = 'Sean'
x,y,z,o = tmp_str

# 有时候，你可能只想解压一部分，丢弃其他的值。但是你可以使用任意变量名_去占位，到时候丢掉这些变量就行了。
_,_, price, _ = data


## 解压可迭代对象赋值给多个变量
如果一个可迭代对象的元素个数超过变量个数时，会抛出一个 ValueError 。 那么怎样才能从这个可迭代对象中解压出 N 个元素出来？  
***python的星号表达式***可以解决这个问题


In [5]:
record = ('Dave', 'dave@example.com', '773-555-1212', '847-555-1212')
name, email, *phone_numbers = record

In [6]:
phone_numbers
# 值得注意的是上面解压出的 phone_numbers 变量永远都是列表类型，不管解压的电话号码数量是多少（包括 0 个）。 
# 所以，任何使用到 phone_numbers 变量的代码就不需要做多余的类型检查去确认它是否是列表类型了

['773-555-1212', '847-555-1212']

## 字典的数据结构和算法
### 字典排序
你想创建一个字典，并且在迭代或序列化这个字典的时候能够控制元素的顺序。

为了能控制一个字典中元素的顺序，你可以使用 `collections` 模块中的 `OrderedDict` 类。 在迭代操作的时候它会保持元素被插入时的顺序，示例如下：

In [19]:
from collections import OrderedDict

d = OrderedDict()
d['foo'] = 1
d['bar'] = 2
d['spam'] = 3
d['grok'] = 4
# Outputs "foo 1", "bar 2", "spam 3", "grok 4"
for key in d:
    print(key, d[key])

foo 1
bar 2
spam 3
grok 4


当你想要构建一个将来需要序列化或编码成其他格式的映射的时候， OrderedDict 是非常有用的。 比如，你想精确控制以 JSON 编码后字段的顺序，你可以先使用 OrderedDict 来构建这样的数据：

In [20]:
import json
json.dumps(d)

'{"foo": 1, "bar": 2, "spam": 3, "grok": 4}'

### 字典的运算
为了对字典值执行计算操作，通常需要使用 zip() 函数先将键和值反转过来。 比如，下面是查找最小和最大股票价格和股票值的代码：

In [21]:
prices = {
    'ACME': 45.23,
    'AAPL': 612.78,
    'IBM': 205.55,
    'HPQ': 37.20,
    'FB': 10.75
}

min_price = min(zip(prices.values(), prices.keys()))
# min_price is (10.75, 'FB')
max_price = max(zip(prices.values(), prices.keys()))
# max_price is (612.78, 'AAPL')


执行这些计算的时候，需要注意的是 `zip() `函数创建的是一个只能访问一次的迭代器。 比如，下面的代码就会产生错误：

In [22]:
prices_and_names = zip(prices.values(), prices.keys())
print(min(prices_and_names)) # OK
print(max(prices_and_names)) # ValueError: max() arg is an empty sequence

(10.75, 'FB')


ValueError: max() arg is an empty sequence

### 从字典中提取子集
最简单的方式是使用字典推导。比如

In [23]:
# Make a dictionary of all prices over 200
p1 = {key: value for key, value in prices.items() if value > 200}

# Make a dictionary of tech stocks
tech_names = {'AAPL', 'IBM', 'HPQ', 'MSFT'}
p2 = {key: value for key, value in prices.items() if key in tech_names}

In [26]:
p1

{'AAPL': 612.78, 'IBM': 205.55}

### 合并多个字典或映射
现在有多个字典或者映射，你想将它们从逻辑上合并为一个单一的映射后执行某些操作， 比如查找值或者检查某些键是否存在。



In [27]:
a = {'x': 1, 'z': 3 }
b = {'y': 2, 'z': 4 }

在假设你必须在两个字典中执行查找操作（比如先从 a 中找，如果找不到再在 b 中找）。 一个非常简单的解决方案就是使用 collections 模块中的 ChainMap 类。比如：

In [28]:
from collections import ChainMap
c = ChainMap(a,b)
print(c['x']) # Outputs 1 (from a)
print(c['y']) # Outputs 2 (from b)
print(c['z']) # Outputs 3 (from a)

1
2
3


作为 ChainMap 的替代，你可能会考虑使用 update() 方法将两个字典合并。比如：

In [30]:
a = {'x': 1, 'z': 3 }
b = {'y': 2, 'z': 4 }
merged = dict(b)
merged.update(a)

这样也能行得通，但是它需要你创建一个完全不同的字典对象（或者是破坏现有字典结构）。 同时，如果原字典做了更新，这种改变不会反应到新的合并字典中去。

###  查找两字典的相同点

In [33]:
a = {
    'x' : 1,
    'y' : 2,
    'z' : 3
}

b = {
    'w' : 10,
    'x' : 11,
    'y' : 2
}

In [34]:
# Find keys in common
a.keys() & b.keys() # { 'x', 'y' }
# Find keys in a that are not in b
a.keys() - b.keys() # { 'z' }
# Find (key,value) pairs in common
a.items() & b.items() # { ('y', 2) }

{('y', 2)}

这些操作也可以用于修改或者过滤字典元素。 比如，假如你想以现有字典构造一个排除几个指定键的新字典。 下面利用字典推导来实现这样的需求：

In [35]:
# Make a new dictionary with certain keys removed
c = {key:a[key] for key in a.keys() - {'z', 'w'}}
# c is {'x': 1, 'y': 2}

### 字典key映射多个值
很实用!!!

In [50]:
from collections import defaultdict

d = defaultdict(list)
d['a'].append('i')
d['a'].append('love')
d['a'].append('you')
print(d)
d = defaultdict(set)
d['b'].add('i')
d['b'].add('hate')
d['b'].add('you')
print(d)

defaultdict(<class 'list'>, {'a': ['i', 'love', 'you']})
defaultdict(<class 'set'>, {'b': {'you', 'i', 'hate'}})


```python
d = {}
for key, value in pairs:
    if key not in d:
        d[key] = []
    d[key].append(value)
 
d = defaultdict(list)
for key, value in pairs:
    d[key].append(value)

```



## 查找最大或者最小的N个元素

怎样从一个集合中获得最大或者最小的 N 个元素列表？

heapq 模块有两个函数：nlargest() 和 nsmallest() 可以完美解决这个问题。


In [3]:
import heapq
nums = [1, 8, 2, 23, 7, -4, 18, 23, 42, 37, 2]
print(heapq.nlargest(3, nums))
print(heapq.nsmallest(3, nums))

[42, 37, 23]
[-4, 1, 2]


In [4]:
#两个函数都能接受一个关键字参数，用于更复杂的数据结构中：

portfolio = [
    {'name': 'IBM', 'shares': 100, 'price': 91.1},
    {'name': 'AAPL', 'shares': 50, 'price': 543.22},
    {'name': 'FB', 'shares': 200, 'price': 21.09},
    {'name': 'HPQ', 'shares': 35, 'price': 31.75},
    {'name': 'YHOO', 'shares': 45, 'price': 16.35},
    {'name': 'ACME', 'shares': 75, 'price': 115.65}
]
cheap = heapq.nsmallest(3, portfolio, key=lambda s: s['price'])
expensive = heapq.nlargest(3, portfolio, key=lambda s: s['price'])

## 删除序列相同元素并保持顺序

***怎样在一个序列上面保持元素顺序的同时消除重复的值？***

以下这种方法，既可以对序列元素为`hashable`进行处理，也可以对不可哈希（比如 `dict` 类型）的序列

In [57]:
def dedupe(items, key=None):
    seen = set()
    for item in items:
        val = item if key is None else key(item)
        if val not in seen:
            yield item
            seen.add(val)

In [62]:
a = [1, 5, 2, 1, 9, 1, 5, 10]
list(dedupe(a))

# 对于简单列表可以用 list(set(list_example))

[1, 5, 2, 9, 10]

In [71]:
a = [ {'x':1, 'y':2}, {'x':1, 'y':3}, {'x':1, 'y':2}, {'x':2, 'y':4}]
print('消除重复的键x对应的值',list(dedupe(a, key = lambda d: d['x'])))
print('消除重复的键x,y对应的字典',list(dedupe(a, key = lambda d: (d['x'], d['y']))))

消除重复的键x对应的值 [{'x': 1, 'y': 2}, {'x': 2, 'y': 4}]
消除重复的键x,y对应的字典 [{'x': 1, 'y': 2}, {'x': 1, 'y': 3}, {'x': 2, 'y': 4}]
