# 1.1解压序列赋值给多个变量

In [6]:
p = (4,5)
x, y = p
x


4

In [7]:
y

5

In [8]:
data = ['ACME', 50, 91.1, (2012, 12, 21)]
name, shares, price, date = data
name

'ACME'

In [9]:
shares

50

In [11]:
date

(2012, 12, 21)

In [15]:
[year, mon, day] = date #[]换成元组()也可以，两者都是序列且()不可变
year

2012

In [16]:
s = 'Hello' #字符串也可以进行序列赋值
a, b, c, d, e = s
a

'H'

In [19]:
#有时想只解压一部分，可以采用任意变量名去占位然后丢弃即可
data = ['ACME', 50, 91.1]
_, shares, _ = data
shares


50

# 1.2解压可迭代对象赋值给多个变量

In [4]:
# 使用*号表达式自动将中间部分归为一个list,同时去除最高分和最低分
def drop_first_last(grades):
    grades.sort()
    first, *middle, last = grades
 
    return sum(middle) / len(middle)
    
drop_first_last([25,20,20,20,15])
    
    

20.0

In [5]:
# 另一种情况，存储倒数任意组数据。同理也可存储列表开始部分数据
record = ['Dave', 'dave@bupt.edu.cn', '123124', '67689']
name , email, *phone = record
phone

['123124', '67689']

In [8]:
# *用于可变长元组序列
records = [
    ('foo',1,2),
    ('bar','hello','hi'),
    ('foo',9,3)]

def do_foo(x,y):
    print('foo', x, y)

def do_bar(x,y):
    print('bar', x, y)
    
for tag, *args in records:
    do_foo(*args) if tag == 'foo' else do_bar(*args)

foo 1 2
bar hello hi
foo 9 3


In [10]:
# *可用于字符串
line = 'nobody:*:-2:-2:Unprivileged User:/var/empty:/usr/bin/false'
uname, *_, homedir, sh = line.split(':')
print(uname, '\n', homedir, '\n', sh)

nobody 
 /var/empty 
 /usr/bin/false


# 1.3保留最后N个元素

In [1]:
#在多行上面做简单的文本匹配。并只返回在前N行中匹配成功的行
from collections import deque

def search(lines, pattern, history = 5):
    previous_lines = deque(maxlen = history)
    for li in lines:
        if pattern in li:
            yield li, previous_lines
        previous_lines.append(li)

# # Example use on a file
# if __name__ == '__main__':
#     with open('README.md') as f:
#        for line, prevlines in search(f, 'python', 5):
#            for pline in prevlines:
#                print(pline, end='')
#             print(line, end='')
#             print('-' * 20)
    



In [6]:
#deque是队列，先进先出
q = deque(maxlen=3)
q.append(1)
q.append(2)
q.append(3)
q

deque([1, 2, 3])

In [7]:
q.append(4)
q

deque([2, 3, 4])

In [14]:
#不设置最大长度时，得到的是一个无限大小队列
q = deque()
q.append(1)
q.append(2)
q.append(3)
q

deque([1, 2, 3])

In [15]:
q.appendleft(4)
q

deque([4, 1, 2, 3])

In [16]:
q.pop()

3

In [17]:
q

deque([4, 1, 2])

In [18]:
#在队列两端插入或删除元素时间复杂度都是O(1)，而在列表的开头插入或删除元素的时间复杂度为O(N)
q.popleft()

4

# 1.4查找最大或最小的N个元素

In [29]:
#使用heapq模块的两个函数解决这个问题
import heapq
nums = [1, 8, 2, 23, 7, -4, 42, 2 ,32]
print(heapq.nlargest(3, nums))
print(heapq.nsmallest(3,nums))

[42, 32, 23]
[-4, 1, 2]


In [23]:
portfolio = [
{'name': 'IBM', 'shares': 100, 'price': 91.1},
{'name': 'AAPL', 'shares': 50, 'price': 543.22},
{'name': 'FB', 'shares': 200, 'price': 21.09},
{'name': 'HPQ', 'shares': 35, 'price': 31.75},
{'name': 'YHOO', 'shares': 45, 'price': 16.35},
{'name': 'ACME', 'shares': 75, 'price': 115.65}
]
#用于更复杂的数据结构中，使用关键字参数
cheap = heapq.nsmallest(3, portfolio, key=lambda x: x['price'])
expensive = heapq.nlargest(3, portfolio, key=lambda x: x['price'])
print(cheap)
print(expensive)

[{'name': 'YHOO', 'shares': 45, 'price': 16.35}, {'name': 'FB', 'shares': 200, 'price': 21.09}, {'name': 'HPQ', 'shares': 35, 'price': 31.75}]
[{'name': 'AAPL', 'shares': 50, 'price': 543.22}, {'name': 'ACME', 'shares': 75, 'price': 115.65}, {'name': 'IBM', 'shares': 100, 'price': 91.1}]


In [30]:
heapq.heapify(nums)
print(nums)
#堆的特征是heap[0]永远是最小的元素，剩余元素可以从小到大用heappop()依次取出
for i in range(0,3):
    print(heapq.heappop(nums))

[-4, 2, 1, 8, 7, 2, 42, 23, 32]
-4
1
2


#1.5实现一个优先级队列

In [18]:
import heapq
class PriorityQueue():
    def __init__(self):
        self._queue = []
        self._index = 0
    def push(self, item, priority):
        #优先级取负数，这样优先级最大的值会位于最前列，heappop时先取出第一个数
        heapq.heappush(self._queue, (-priority, self._index, item))
        self._index += 1
    def pop(self):
        #[-1]表示元组中的最后一位，即name值
        return heapq.heappop(self._queue)[-1]

class Item0():
    def __init__(self, name):
        self.name = name
    def __repr__(self):
        #自定义输出实例化对象时的信息
        #下文pop的内容即为Item0('XXX'),因此输出自定义的字符串
        #return 'Item({!r})'.format(self.name) #这两种方式均可,r和s的区别可以看有道云笔记
        #return 'Item({x})'.format(x=self.name) #这样写的话会直接返回字符串内容，不带‘’引号
        #return 'Item({})'.format(self.name) #这样写的话会直接返回字符串内容，不带‘’引号
        return 'Item({%r%s})'%(self.name,self.name) #r带''因为打印的更详细,s不带''

In [19]:
q = PriorityQueue()
q.push(Item0('foo'), 1)
q.push(Item0('bar'), 5)
q.push(Item0('spam'), 4)
q.push(Item0('grok'), 1)
q.pop()

Item({'bar'bar})

In [57]:
#index变量的作用是保证同等优先级元素的正确排序。 通过保存一个不断增加的index下标变量， 可以确保
#元素安装它们插入的顺序排序。 而且， index变量也在相同优先级元素比较的时候起到重要作用。
a = (1, Item0('foo'))
b = (2, Item0('bar'))
print(a < b) 
a = (1, Item0('foo'))
b = (1, Item0('bar'))
a < b


True


TypeError: '<' not supported between instances of 'Item0' and 'Item0'

In [55]:
a = (1, 0,Item0('foo'))
b = (1, 1,Item0('bar'))
a < b

True

#1.6字典中的键映射多个值

In [29]:
from collections import defaultdict
#defaultdict会自动为将要访问的键(即使目前字典并不存在这样的key)创建映射实体，如果不需要可以使用setdefault
d = defaultdict(list)
d['a'].append(1)
d['a'].append(2)
d['b'].append(4)
d

defaultdict(list, {'a': [1, 2], 'b': [4]})

In [2]:
d = {} 
d.setdefault('a',[]).append(1)
d.setdefault('a',[]).append(2)
d.setdefault('b',[]).append(1)
d

{'a': [1, 2], 'b': [1]}

In [30]:
#创建多值映射字典我们可以
pairs = [('a',1), ('a',1), ('b',1)]
d = defaultdict(list)

#我们自己写可能这样
# for k, v in pairs:
#     if k not in d:
#         d[k] = []      #创建这个键的列表
#         d[k].append(v) #将值存入这个键的列表
#使用collections更简洁
for key, value in pairs:
    d[key].append(value)
d

defaultdict(list, {'a': [1, 1], 'b': [1]})

#1.7字典排序

In [24]:
from collections import OrderedDict
#OrderedDict会保持元素被插入时的顺序
def ordered_dict():
    d = OrderedDict()
    d['foo'] = 1
    d['bar'] = 2
    d['spam'] = 3
    d['grok'] = 4
    # 输出

    for key in d:
        print(key, d[key])
        #print(('{!r}, {!r}').format(key, d[key])) #format前面的引用要加{}
        #print(('%r, %r') % (key, d[key]))
    return d
x = ordered_dict()

foo 1
bar 2
spam 3
grok 4


In [25]:
#当我们需要控制以json编码后字段的顺序我们可以使用OrderedDict来构建字典
import json
json.dumps(x)


'{"foo": 1, "bar": 2, "spam": 3, "grok": 4}'

#1.8字典的运算

In [26]:
#如何在字典中进行计算操作（最小值，最大值，排序等等）
prices = {
'ACME': 45.23,
'AAPL': 612.78,
'IBM': 205.55,
'HPQ': 37.20,
'FB': 10.75
}

In [30]:
#进行计算操作时，通常需要使用zip()函数先将键和值反转过来,否则无法比较
min_price = min(zip(prices.values(), prices.keys()))
max_price = max(zip(prices.values(), prices.keys()))
print(min_price)
print(max_price)

(10.75, 'FB')
(612.78, 'AAPL')


In [31]:
#类似地使用zip()进行排序
prices_sorted = sorted(zip(prices.values(), prices.keys()))
prices_sorted



[(10.75, 'FB'),
 (37.2, 'HPQ'),
 (45.23, 'ACME'),
 (205.55, 'IBM'),
 (612.78, 'AAPL')]

In [32]:
# 注意zip()函数创建的是一个只能访问一次的迭代器，即zip要放在函数内操作而不能进行变量赋值
prices_and_names = zip(prices.values(), prices.key())
print(min(prices_and_names))
print(max(prices_and_names))


AttributeError: 'dict' object has no attribute 'key'

In [38]:
#直接使用min和max查找最小值value无法同时看到key值
print(min(prices.values()))
print(max(prices.values()))

#如果不使用zip，我们可以使用lambda闭包来获取最值的key，再使用查找字典来获取最值
print(min(prices, key=lambda x: prices[x]), prices[min(prices, key=lambda x: prices[x])])
print(max(prices, key=lambda x: prices[x]), prices[max(prices, key=lambda x: prices[x])])


10.75
612.78
FB 10.75
AAPL 612.78


#1.9查找两字典的相同点

In [39]:
a = {
'x' : 1,
'y' : 2,
'z' : 3
} 
b = {
'w' : 10,
'x' : 11,
'y' : 2
}

In [40]:
#直接在keys()或items()上进行集合操作
# &是两者都有的内容，-是前者有后者没有的内容
print(a.keys() & b.keys())
print(a.keys() - b.keys())
print(a.items() & b.items())


{'x', 'y'}
{'z'}
{('y', 2)}


In [41]:
#过滤字典元素
c = {k: a[k] for k in a.keys() - {'z', 'w'}}
c
#如果你硬要在值上面执行这些集合操作的话， 可以先将值集合转换成set去重， 然后再执行集合运算

{'x': 1, 'y': 2}

#1.10删除序列相同元素并保持顺序

In [2]:
def dedupe(items):
    seen = set()
    for item in items:
        if item not in seen:
            yield item
            #set()用add，list()用append
            seen.add(item)

a = [1, 5, 2, 1, 9, 1, 5, 10]
list(deque(a))

[1, 5, 2, 9, 10]

In [13]:
#上述方法仅在序列元素可哈希化的时候使用，如果想消除元素不可哈希的序列比如dict，需要做修改
def dedupe(items, key=None):
    seen = set()
    for item in items:
        #如果key不存在则val = item，若存在则val = key(item)
        #key(item)详细解释看下文lambda
        val = item if key is None else key(item)
        if val not in seen:
            yield item
            seen.add(val)
  
# 那句if else写完整是这样子，很累赘，日后不需要这样写代码          
# def dedupe(items, key=None):
#     seen = set()
#     for item in items:
#         #如果key不存在则直接用item，若存在则用key替换item
#         # val = item if key is None else key(item)
#         if key is None:
#             val = item
#             if val not in seen:
#                 yield item
#                 seen.add(val)
#         else:
#             val = key(item)
#             print(val)
#             if val not in seen:
#                 yield item
#                 seen.add(val)

#lambda匿名函数用法，在末尾加上(输入参数变量)，就可以执行
#因此上文函数中的key关键词实际上是一个匿名函数！！
#用这个lambda提取出我们需要去重的数据值元组，在进行set比较
#print((lambda d: (d['x'],d['y']))(a[0]))


a = [ {'x':1, 'y':2}, {'x':1, 'y':3}, {'x':1, 'y':2}, {'x':2, 'y':4}]
list(dedupe(a, key=lambda d: (d['x'],d['y'])))



[{'x': 1, 'y': 2}, {'x': 1, 'y': 3}, {'x': 2, 'y': 4}]

#1.11命名切片

In [16]:
#硬编码切片下标
record = '0123456789012345678901234567890123456789012345678901234567890'
SHARES = slice(20, 23)
PRICE = slice(31, 37)
print(record[SHARES])
print(record[PRICE])

cost = int(record[SHARES]) * float(record[PRICE])
cost

012
123456


1481472.0

In [20]:
items = [0, 1, 2, 3, 4, 5, 6]
a = slice(2, 4)

items[a] = [10, 11]
print(items)
del items[a]

items

[0, 1, 10, 11, 4, 5, 6]


[0, 1, 4, 5, 6]

In [31]:
b = slice(5, 50, 2)
print(b.start)
print(b.stop)
print(b.step)


s = 'HelloWorld'
#使用indices(size)可以自动调整映射范围大小
b.indices(len(s))
#加*号将tuple类型转化为int 5, 10, 2
for i in range(*b.indices(len(s))):
    print(*b.indices(len(s)))
    print(s[i])
b.indices(len(s)) 

5
50
2
5 10 2
W
5 10 2
r
5 10 2
d


(5, 10, 2)

#1.12序列中出现次数最多的元素

In [42]:
from collections import Counter

words = [
'look', 'into', 'my', 'eyes', 'look', 'into', 'my', 'eyes',
'the', 'eyes', 'the', 'eyes', 'the', 'eyes', 'not', 'around', 'the',
'eyes', "don't", 'look', 'around', 'the', 'eyes', 'look', 'into',
'my', 'eyes', "you're", 'under'
]

word_counts = Counter(words)
# 出现频率最高的三个单词
top_three = word_counts.most_common(3)
print(top_three)
word_counts['look']

[('eyes', 8), ('the', 5), ('look', 4)]


4

In [44]:
# 手动增加计数
more_words = ['why','are','you','not','looking','in','my','eyes']
for word in more_words:
    word_counts[word] += 1
word_counts['eyes']

10

In [46]:
# 或者使用update方法，手动增加计数
word_counts.update(more_words)
word_counts['eyes']


12

In [49]:
# Counter可以很容易的跟数学运算操作相结合
a = Counter(words)
b = Counter(more_words)
print(a)
print(b)

# 和运算结合
c = a + b
print(c)
d = a - b
print(d)



Counter({'eyes': 8, 'the': 5, 'look': 4, 'into': 3, 'my': 3, 'around': 2, 'not': 1, "don't": 1, "you're": 1, 'under': 1})
Counter({'why': 1, 'are': 1, 'you': 1, 'not': 1, 'looking': 1, 'in': 1, 'my': 1, 'eyes': 1})
Counter({'eyes': 9, 'the': 5, 'look': 4, 'my': 4, 'into': 3, 'not': 2, 'around': 2, "don't": 1, "you're": 1, 'under': 1, 'why': 1, 'are': 1, 'you': 1, 'looking': 1, 'in': 1})
Counter({'eyes': 7, 'the': 5, 'look': 4, 'into': 3, 'my': 2, 'around': 2, "don't": 1, "you're": 1, 'under': 1})


#1.13通过某个关键字排序一个字典列表

In [50]:
from operator import itemgetter
rows = [
{'fname': 'Brian', 'lname': 'Jones', 'uid': 1003},
{'fname': 'David', 'lname': 'Beazley', 'uid': 1002},
{'fname': 'John', 'lname': 'Cleese', 'uid': 1001},
{'fname': 'Big', 'lname': 'Jones', 'uid': 1004}
]

rows_by_fname = sorted(rows, key=itemgetter('fname'))
rows_by_uid = sorted(rows, key=itemgetter('uid'))

print(rows_by_fname)
print(rows_by_uid)


[{'fname': 'Big', 'lname': 'Jones', 'uid': 1004}, {'fname': 'Brian', 'lname': 'Jones', 'uid': 1003}, {'fname': 'David', 'lname': 'Beazley', 'uid': 1002}, {'fname': 'John', 'lname': 'Cleese', 'uid': 1001}]
[{'fname': 'John', 'lname': 'Cleese', 'uid': 1001}, {'fname': 'David', 'lname': 'Beazley', 'uid': 1002}, {'fname': 'Brian', 'lname': 'Jones', 'uid': 1003}, {'fname': 'Big', 'lname': 'Jones', 'uid': 1004}]


In [51]:
rows_by_lfname = sorted(rows, key=itemgetter('lname', 'fname'))
print(rows_by_lfname)



[{'fname': 'David', 'lname': 'Beazley', 'uid': 1002}, {'fname': 'John', 'lname': 'Cleese', 'uid': 1001}, {'fname': 'Big', 'lname': 'Jones', 'uid': 1004}, {'fname': 'Brian', 'lname': 'Jones', 'uid': 1003}]


In [52]:
# itemgetter()有时候可以用lambda表达式代替
rows_by_lfname = sorted(rows, key=lambda r: (r['lname'],r['fname']))
print(rows_by_lfname)
#如下写法必报错
# rows_by_lfname = sorted(rows, key=rows['lname'])
# print(rows_by_lfname)

[{'fname': 'David', 'lname': 'Beazley', 'uid': 1002}, {'fname': 'John', 'lname': 'Cleese', 'uid': 1001}, {'fname': 'Big', 'lname': 'Jones', 'uid': 1004}, {'fname': 'Brian', 'lname': 'Jones', 'uid': 1003}]


TypeError: list indices must be integers or slices, not str

In [55]:
#itemgetter()稍微快些，但别忘了min，max也适用这个方法
print(min(rows, key=itemgetter('uid')))
print(max(rows, key=itemgetter('uid')))


{'fname': 'John', 'lname': 'Cleese', 'uid': 1001}
{'fname': 'Big', 'lname': 'Jones', 'uid': 1004}


#1.14排序不支持原生比较的对象

In [21]:
from operator import attrgetter
class User:
    def __init__(self, user_id):
        self.user_id = user_id
        
    def __repr__(self):
        return 'User({})'.format(self.user_id)

def sort_not_compare():
    users = [User(23), User(3), User(99)]
    print(users)
    print(sorted(users, key=lambda u: u.user_id, reverse=True))
    #print(sorted(users, key=attrgetter('user_id') #或者使用attrgetter，与itemgetter类似
    
sort_not_compare()

[User(23), User(3), User(99)]
[User(99), User(23), User(3)]


#1.15通过某个字段将记录分组

In [44]:
from operator import itemgetter
from itertools import groupby

#我们想在按date分组后进行迭代
rows = [
    {'address': '5412 N CLARK', 'date': '07/01/2012'},
    {'address': '5148 N CLARK', 'date': '07/04/2012'},
    {'address': '5800 E 58TH', 'date': '07/02/2012'},
    {'address': '2122 N CLARK', 'date': '07/03/2012'},
    {'address': '5645 N RAVENSWOOD', 'date': '07/02/2012'},
    {'address': '1060 W ADDISON', 'date': '07/02/2012'},
    {'address': '4801 N BROADWAY', 'date': '07/01/2012'},
    {'address': '1039 W GRANVILLE', 'date': '07/04/2012'},
]
#首先按照date排序
#rows.sort(key=itemgetter('date'))
rows.sort(key=lambda x: x['date'])
#在群组中迭代,前者是分组标志，后者是分组内容
#groupby函数扫描整个序列并且查找连续相同值(或者根据指定key函数返回值相同)的元素序列。 在每次迭代的时候， 
#它会返回一个值和一个迭代器对象， 这个迭代器对象可以生成元素值全部等于上面那个值的组中所有对象

#注意一个非常重要的准备步骤是要根据指定的字段将数据排序。 因为 groupby() 仅仅检查连续的元素， 如
#果事先并没有排序完成的话， 分组函数将得不到想要的结果。
for date, items in groupby(rows, key=itemgetter('date')):
    print(date)
    for i in items:
        print(' ', i)


07/01/2012
  {'address': '5412 N CLARK', 'date': '07/01/2012'}
  {'address': '4801 N BROADWAY', 'date': '07/01/2012'}
07/02/2012
  {'address': '5800 E 58TH', 'date': '07/02/2012'}
  {'address': '5645 N RAVENSWOOD', 'date': '07/02/2012'}
  {'address': '1060 W ADDISON', 'date': '07/02/2012'}
07/03/2012
  {'address': '2122 N CLARK', 'date': '07/03/2012'}
07/04/2012
  {'address': '5148 N CLARK', 'date': '07/04/2012'}
  {'address': '1039 W GRANVILLE', 'date': '07/04/2012'}


In [45]:
#将date字段分组后的内容存到大的数据结构内
from collections import defaultdict

rows_by_date = defaultdict(list)
for row in rows:
    date_temp = row['date']
    #del row['date'] #这两种删除方法都可以
    row.pop('date')
    rows_by_date[date_temp].append(row)
print(rows_by_date)

defaultdict(<class 'list'>, {'07/01/2012': [{'address': '5412 N CLARK'}, {'address': '4801 N BROADWAY'}], '07/02/2012': [{'address': '5800 E 58TH'}, {'address': '5645 N RAVENSWOOD'}, {'address': '1060 W ADDISON'}], '07/03/2012': [{'address': '2122 N CLARK'}], '07/04/2012': [{'address': '5148 N CLARK'}, {'address': '1039 W GRANVILLE'}]})


#1.16过滤序列元素

In [47]:
#利用一些规则从中提出需要的值或者是缩短序列
my_list = [1, 4, -5, 10, -7, 2, 3, -1]
print([n for n in my_list if n > 0])
print([n for n in my_list if n < 0])



[1, 4, 10, 2, 3]
[-5, -7, -1]


In [51]:
#使用列表推导的一个潜在缺陷就是如果输入非常大的时候会产生一个非常大的结果集， 占用大量内存。 
#如果你对内存比较敏感， 那么你可以使用生成器表达式迭代产生过滤的元素
pos = (n for n in my_list if n > 0)
print(type(pos))

for x in pos:
    print(x)


<class 'generator'>
1
4
10
2
3


In [55]:
#过滤规则复杂时，我们用内建filter()函数
values = ['1', '2', '-3', '-', '4', 'N/A', '5']
def is_int(val):
    try:
        x = int(val)
        return True
    except ValueError:
        return False


is_vals = list(filter(is_int, values))
print(is_vals)


['1', '2', '-3', '-', '4', 'N/A', '5']


In [56]:
#列表推导或生成器表达式是过滤数据最简单的方式，甚至还可以操作数据运算
import math
[math.sqrt(x) for x in my_list if x > 0]


[1.0, 2.0, 3.1622776601683795, 1.4142135623730951, 1.7320508075688772]

In [59]:
#将不符合的值用新值代替
clip_neg = [n if n > 0 else 0 for n in my_list]
print(clip_neg)


[1, 4, 0, 10, 0, 2, 3, 0]


In [60]:
addresses = [
'5412 N CLARK',
'5148 N CLARK',
'5800 E 58TH',
'2122 N CLARK'
'5645 N RAVENSWOOD',
'1060 W ADDISON',
'4801 N BROADWAY',
'1039 W GRANVILLE',
]
counts = [ 0, 3, 10, 4, 1, 7, 6, 1]


In [62]:
#过滤工具itertools.compress()
from itertools import compress
more5 = [n > 5 for n in counts]
print(more5)
list(compress(addresses, more5))



[False, False, True, False, False, True, True, False]


['5800 E 58TH', '4801 N BROADWAY', '1039 W GRANVILLE']

#1.17从字典中提取子集

In [3]:
prices = {
'ACME': 45.23,
'AAPL': 612.78,
'IBM': 205.55,
'HPQ': 37.20,
'FB': 10.75
}
p1 = {key: value for key, value in prices.items() if value > 200}
print(p1)
tech_names = {'AAPL', 'IBM', 'HPQ', 'MSFT'}
p2 = {key: value for key, value in prices.items() if key in tech_names}
print(p2)


{'AAPL': 612.78, 'IBM': 205.55}
{'AAPL': 612.78, 'IBM': 205.55, 'HPQ': 37.2}


In [4]:
#上述第二个可以写为,但是这样会花费较多时间
p2 = dict((key, prices[key]) for key in prices.keys() & tech_names)
p2

{'AAPL': 612.78, 'HPQ': 37.2, 'IBM': 205.55}

#1.18映射名称到序列元素

In [6]:
#这个函数实际上是一个返回Python中标准元组类型子类的一个工厂方法。 你需要传递一个类型名和你需要的字段给它，
#然后它就会返回一个类， 你可以初始化这个类， 为你定义的字段传递值
from collections import namedtuple
Subscriber = namedtuple('Subscriber', ['addr', 'joined'])
sub = Subscriber('joinsy@example.com', '2012-10-09')

sub

subscriber(addr='joinsy@example.com', joined='2012-10-09')

In [3]:
from collections import namedtuple
Stock = namedtuple('Stock', ['name', 'shares', 'price'])

def compute_cost(records):
    total = 0.0
    for record in records:
        s = Stock(*record.values())
        print(s)
        total += s.shares * s.price
    return total

records = [{'name':'nao', 'shares':9, 'price':10},
           {'name':'nao', 'shares':8, 'price':10},
           {'name':'nao', 'shares':7, 'price':10}]

print(compute_cost(records))

Stock(name='nao', shares=9, price=10)
Stock(name='nao', shares=8, price=10)
Stock(name='nao', shares=7, price=10)
240.0


In [4]:
#命名元组作为字典的替代
s = Stock('ACME', 100, 123.45)
s


Stock(name='ACME', shares=100, price=123.45)

In [11]:
#但是命名元组不支持直接修改属性值，需要用_replace()方法
from collections import namedtuple
Stock = namedtuple('Stock', ['name', 'shares', 'price', 'date', 'time'])
a = {'name':'ACME', 'shares':100, 'price':123.45}
stock_prototype = Stock('', 0, 0.0, None, None)

def dict_to_stock(s):
    #这个地方用**是因为_replace仅接收键值对(形如shares=7)
    #_replace() argument after ** must be a mapping
    return stock_prototype._replace(**s)


dict_to_stock(a)


Stock(name='ACME', shares=100, price=123.45, date=None, time=None)

#1.19转换并同时计算数据

In [16]:
#使用生成器表达式
portfolio = [
{'name':'GOOG', 'shares': 50},
{'name':'YHOO', 'shares': 75},
{'name':'AOL', 'shares': 20},
{'name':'SCOX', 'shares': 65}
]
#如下返回元组值
min_shares = min((s['shares'], s['name']) for s in portfolio)
#也可以这样实现返回一个整dict字典 
#min_shares = min(portfolio, key=lambda x: x['shares'])
min_shares

(20, 'AOL')

#1.20合并多个字典或映射

In [21]:
a = {'x': 1, 'z': 3 }
b = {'y': 2, 'z': 4 }
#ChainMap会随着原字典更新而更新
from collections import ChainMap
c = ChainMap(a, b)
print(c)
a['x'] = 2
c

ChainMap({'x': 1, 'z': 3}, {'y': 2, 'z': 4})


ChainMap({'x': 2, 'z': 3}, {'y': 2, 'z': 4})

In [20]:
#使用update方法也可以实现两字典合并,但不会随着原字典更新而更新。同时会破坏字典结构
d = dict(b)
d.update(a)
d

{'y': 2, 'z': 3, 'x': 1}