# Python Tips 2

author@snowhyzhang

- [sorted函数按照指定值排序](#sorted_key)
- [对list中元素计数](#list_count)
- [保留最后N个元素](#retain_last_n)
- [反转list](#reverse_list)

---
<a name='sorted_key'></a>

## sorted函数按照指定值排序

Python中的`sorted`函数可以对进行排序

In [1]:
l = [5, 4, 1, 2, 3]
l = sorted(l)
l

[1, 2, 3, 4, 5]

如果`list`中对象是`dict`并且想通过`dict`的公共键来排序，那么可以将`sorted`函数中的`key`参数指定为公共键的值  
例如有5个`dict`组成`list`的数据，其中每个`dict`包含`name`和`id`2个`key`，通过`id`进行排序

In [2]:
l = [{'name': 'dog', 'id': 4}, {'name': 'bag', 'id': 2}, {'name': 'apple', 'id': 1}, 
     {'name': 'cat', 'id': 3}, {'name': 'egg', 'id': 5}]
l = sorted(l, key=lambda x: x['id'])
l

[{'id': 1, 'name': 'apple'},
 {'id': 2, 'name': 'bag'},
 {'id': 3, 'name': 'cat'},
 {'id': 4, 'name': 'dog'},
 {'id': 5, 'name': 'egg'}]

这里传入`key`的参数是`lambda`表达式，表示取`id`的`value`来进行排序，我们也可以调用`operator`模块中的`itemgetter`来实现

In [3]:
from operator import itemgetter

l = [{'name': 'dog', 'id': 4}, {'name': 'bag', 'id': 2}, {'name': 'apple', 'id': 1}, 
     {'name': 'cat', 'id': 3}, {'name': 'egg', 'id': 5}, {'name': 'flag', 'id': 6}]

In [4]:
%timeit sorted(l, key=lambda x: x['id'])

1.75 µs ± 35.4 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


In [5]:
%timeit sorted(l, key=itemgetter('id'))

1.48 µs ± 31.3 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


执行效率上，使用`itemgetter`的速度更为快些，因此考虑到性能的话，推荐使用`itemgetter`

同样，`key`参数也可以用于对按照`类`中的某个属性进行排序  
例如创建一个User类，其中有`name`和`user_id`两个属性，创建包含5个User对象的列表，并按照`user_id`对列表进行排序

In [6]:
class User:
    def __init__(self, name, user_id):
        self.name = name
        self.user_id = user_id
    
    # 打印类信息
    def __repr__(self):
        return 'name@{}\tuser_id@{}'.format(self.name, self.user_id)

l = [User('dog', 4), User('bag', 2), User('apple', 1), User('cat', 3), User('egg', 5)]
l

[name@dog	user_id@4,
 name@bag	user_id@2,
 name@apple	user_id@1,
 name@cat	user_id@3,
 name@egg	user_id@5]

In [7]:
l = sorted(l, key=lambda x: x.user_id)
l

[name@apple	user_id@1,
 name@bag	user_id@2,
 name@cat	user_id@3,
 name@dog	user_id@4,
 name@egg	user_id@5]

同样，也可以使用`operator`模块中的`attrgetter`

In [8]:
from operator import attrgetter

l = [User('dog', 4), User('bag', 2), User('apple', 1), User('cat', 3), User('egg', 5)]
l = sorted(l, key=attrgetter('user_id'))
l

[name@apple	user_id@1,
 name@bag	user_id@2,
 name@cat	user_id@3,
 name@dog	user_id@4,
 name@egg	user_id@5]

---
<a name='list_count'></a>

## 对list中元素计数

Python的`collections`模块中`Counter`类可以帮助我们实现对于`list`中元素进行计数

In [9]:
import random
from collections import Counter

l = [random.choice(['red', 'blue', 'green', 'yellow', 'pink', 'purple']) for _ in range(20)]
color_count = Counter(l)
color_count

Counter({'blue': 3, 'green': 6, 'pink': 4, 'purple': 2, 'red': 4, 'yellow': 1})

我们可以利用上节中提到的`sorted`函数对`color_count`按出现的次数进行排序

In [10]:
l = sorted(color_count.items(), key=lambda x: x[1], reverse=True)
print('# of color:')
print(*[color for color, _ in l], sep=' >= ')

# of color:
green >= red >= pink >= blue >= purple >= yellow


`Counter`类还提供了一个`most_common`函数方便选取出现次数排前n个的元素

In [11]:
color_count.most_common(1)

[('green', 6)]

---
<a name='retain_last_n'></a>

## 保留最后的N个元素

Python的`collections`模块还有个`deque`的容器也非常有用，可以通过设置`maxlen`参数来保留最后加入的N个元素

In [12]:
from collections import deque

dq = deque(maxlen=5)
for i in range(10):
    dq.append(i)
dq

deque([5, 6, 7, 8, 9])

---
<a name='reverse_list'></a>

## 反转list

`list`中常用的反转方法是设置步长为-1，对list进行反转

In [13]:
l = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
l_rev = l[::-1]
l_rev

[10, 9, 8, 7, 6, 5, 4, 3, 2, 1]

也可以使用`reversed`来生成一个反向的迭代器

In [14]:
for e in reversed(l):
    print(e, end=' ')

10 9 8 7 6 5 4 3 2 1 