In [5]:
"""实现字典中的键映射多个值

实现思路是把要映射的多个值放在一个列表或集合中
通常用于处理数据分析中的记录归类问题
"""

from collections import defaultdict

# 列表
dd = defaultdict(list)
dd['colors'].append('red')
dd['colors'].append('green')
dd['colors'].append('blue')
dd['nums'].append(1)
dd['nums'].append(2)
dd['nums'].append(3)

# 集合
dd = defaultdict(set)
dd['colors'].add('red')
dd['colors'].add('green')
dd['colors'].add('blue')
dd['nums'].add(1)
dd['nums'].add(2)
dd['nums'].add(3)

dd

defaultdict(set, {'colors': {'blue', 'green', 'red'}, 'nums': {1, 2, 3}})

In [7]:
"""使用OrderedDict类控制字典元素的顺序

OrderedDict类内部维护着一个根据键值对插入顺序排序的双向链表
一个OrderedDict的大小是一个普通字典的两倍
"""

from collections import OrderedDict

od = OrderedDict()
od['one'] = 1
od['two'] = 2
od['three'] = 3
od['four'] = 4

for k in od:
    print(k, od[k])

one 1
two 2
three 3
four 4


In [15]:
"""zip(*iterable)函数的基本使用

将可迭代对象作为参数，将对象中对应的元素打包成元祖，然后返回由这些元祖组成的新的可迭代对象
使用list()转换来输出列表
如果参数中各个可迭代对象的元素个数不一致，则返回列表长度与最短的对象相同
使用*操作符，可以将元祖解压为列表
"""

colors = ['red', 'green', 'blue', 'black', 'white']
codes = ['ff0000', '00ff00', '0000ff']
names = ['红', '绿', '蓝']

# 压缩
zipped = zip(colors, codes, names)
print('Zip: ', list(zipped))

Zip:  [('red', 'ff0000', '红'), ('green', '00ff00', '绿'), ('blue', '0000ff', '蓝')]


In [28]:
"""在字典上执行数学运算

作用于键，而不是值
使用zip()函数将字典的键和值反转
"""

phones = {
    'Apple': 9999,
    'Hua Wei': 8888,
    'OPPO': 7777,
    'MI': 6666,
    'vivo': 5555
}

# 键值反转
print('Keys: ', phones.keys())
print('Values: ', phones.values())
print('Zipped: ', list(zip(phones.values(), phones.keys())))

# 按价格排序
sorted_phones = sorted(zip(phones.values(), phones.keys()))
print('Sorted: ', sorted_phones)

# 价格最高
max_phone = max(zip(phones.values(), phones.keys()))
print('Max: ', max_phone)

# 价格最低
min_phone = min(zip(phones.values(), phones.keys()))
print('Min: ', min_phone)

Keys:  dict_keys(['Apple', 'Hua Wei', 'OPPO', 'MI', 'vivo'])
Values:  dict_values([9999, 8888, 7777, 6666, 5555])
Zipped:  [(9999, 'Apple'), (8888, 'Hua Wei'), (7777, 'OPPO'), (6666, 'MI'), (5555, 'vivo')]
Sorted:  [(5555, 'vivo'), (6666, 'MI'), (7777, 'OPPO'), (8888, 'Hua Wei'), (9999, 'Apple')]
Max:  (9999, 'Apple')
Min:  (5555, 'vivo')


In [12]:
"""字典的keys()方法

返回一个展现键集合的键视图对象
键视图直接支持集合操作
"""

colors1 = {
    'red': 'ff0000',
    'green': '00ff00',
    'blue': '0000ff',
    'yellow': 'ffff00'
}

colors2 = {
    'black': '黑',
    'white': 'ffffff',
    'red': '红',
    'green': '00ff00'
}

# key的交集
print(colors1.keys() & colors2.keys())
# key的差集
print(colors1.keys() - colors2.keys())
# item的交集
print(colors1.items() & colors2.items())
# item的差集
print(colors1.items() - colors2.items())

# 过滤字典元素，构建一个新的字典
colors = {k: colors1[k] for k in colors1.keys() - {'blue', 'yellow'}}
print(colors)

{'red', 'green'}
{'blue', 'yellow'}
{('green', '00ff00')}
{('blue', '0000ff'), ('red', 'ff0000'), ('yellow', 'ffff00')}
{'red': 'ff0000', 'green': '00ff00'}


In [18]:
"""在一个序列上消除重复元素并按原顺序保存"""

# 序列中的值是可哈希hashable类型
def dedupe1(items):
    seen = set()
    for item in items:
        if item not in seen:
            yield item
            seen.add(item)
            
nums = [1, 3, 5, 3, 7, 5, 9, 7, 9]
print(list(dedupe1(nums)))


# 序列中的值是不可哈希的
def dedupe2(items, key=None):
    seen = set()
    for item in items:
        val = item if key is None else key(item)
        if val not in seen:
            yield item
            seen.add(val)
            
points = [{'x': 1, 'y': 1}, {'x': 1, 'y': 2}, {'x': 1, 'y': 1}, {'x': 2, 'y': 2}, {'x': 2, 'y': 1}]
print(list(dedupe2(points, key=lambda p: p['x'])))
print(list(dedupe2(points, key=lambda p: (p['x'], p['y']))))

[1, 3, 5, 7, 9]
[{'x': 1, 'y': 1}, {'x': 2, 'y': 2}]
[{'x': 1, 'y': 1}, {'x': 1, 'y': 2}, {'x': 2, 'y': 2}, {'x': 2, 'y': 1}]


In [23]:
"""命名切片

避免硬编码下标
"""

# 命名切片的属性
s = slice(1, 10, 2)
print('Start: ', s.start)
print('Stop: ', s.stop)
print('Step: ', s.step)

# 使用命名切片
msg = 'X is 2 Y is 3'
x = slice(5, 6)
y = slice(12, 13)
print('X * Y = ', int(msg[x]) * int(msg[y]))

Start:  1
Stop:  10
Step:  2
X * Y =  6


In [29]:
"""统计序列中元素出现的次数

作为输入，Counter对象可以接受任意的由可哈希元素构成的序列对象
一个Counter对象就是一个字典，将元素映射到它出现的次数上
"""

from collections import Counter

# Counter的基本使用
colors = ['red', 'green', 'blue', 'blue', 'red', 'yellow', 'green', 'red', 'blue', 'red', 'black', 'yellow']
color_counter = Counter(colors)
print(color_counter)

# 出现次数最多的3个元素
print(color_counter.most_common(3))

# 单独查看某个元素的出现次数
print(color_counter['red'])

# 更新计数
colors2 = ['yellow', 'black', 'white']
color_counter.update(colors2)
print(color_counter)

# Counter实例直接进行数学运算
c1 = Counter(colors)
c2 = Counter(colors2)
print(c1 - c2)

Counter({'red': 4, 'blue': 3, 'green': 2, 'yellow': 2, 'black': 1})
[('red', 4), ('blue', 3), ('green', 2)]
4
Counter({'red': 4, 'blue': 3, 'yellow': 3, 'green': 2, 'black': 2, 'white': 1})
Counter({'red': 4, 'blue': 3, 'green': 2, 'yellow': 1})


In [35]:
"""通过特定关键字对字典进行排序

itemgetter()方法创建一个callable对象，返回用来排序的值
itemgetter()方式比lambda方式稍快
"""

from operator import itemgetter

rows = [
    {'uid': 1005, 'fname': 'David', 'lname': 'Lee'},
    {'uid': 1003, 'fname': 'Brian', 'lname': 'Jones'},
    {'uid': 1002, 'fname': 'David', 'lname': 'Beazley'},
    {'uid': 1004, 'fname': 'John', 'lname': 'Cleese'},
    {'uid': 1001, 'fname': 'Big', 'lname': 'Jones'}
]

# 按指定字段进行排序，可同时指定多个排序字段
rows_by_uid = sorted(rows, key=itemgetter('uid'))
print('按uid排序：', rows_by_uid)

rows_by_fname = sorted(rows, key=itemgetter('fname'))
print('按fname排序：', rows_by_fname)

rows_by_name = sorted(rows, key=itemgetter('fname', 'lname'))
print('按fname + lname排序：', rows_by_name)

# 使用max()和min()
print('Max: ', max(rows, key=itemgetter('uid')))
print('Min: ', min(rows, key=itemgetter('uid')))

按uid排序： [{'uid': 1001, 'fname': 'Big', 'lname': 'Jones'}, {'uid': 1002, 'fname': 'David', 'lname': 'Beazley'}, {'uid': 1003, 'fname': 'Brian', 'lname': 'Jones'}, {'uid': 1004, 'fname': 'John', 'lname': 'Cleese'}, {'uid': 1005, 'fname': 'David', 'lname': 'Lee'}]
按fname排序： [{'uid': 1001, 'fname': 'Big', 'lname': 'Jones'}, {'uid': 1003, 'fname': 'Brian', 'lname': 'Jones'}, {'uid': 1005, 'fname': 'David', 'lname': 'Lee'}, {'uid': 1002, 'fname': 'David', 'lname': 'Beazley'}, {'uid': 1004, 'fname': 'John', 'lname': 'Cleese'}]
按fname + lname排序： [{'uid': 1001, 'fname': 'Big', 'lname': 'Jones'}, {'uid': 1003, 'fname': 'Brian', 'lname': 'Jones'}, {'uid': 1002, 'fname': 'David', 'lname': 'Beazley'}, {'uid': 1005, 'fname': 'David', 'lname': 'Lee'}, {'uid': 1004, 'fname': 'John', 'lname': 'Cleese'}]
Max:  {'uid': 1005, 'fname': 'David', 'lname': 'Lee'}
Min:  {'uid': 1001, 'fname': 'Big', 'lname': 'Jones'}
