Source: https://manhhomienbienthuy.bitbucket.io/2017/Jul/24/python-tricks-you-have-to-know-when-you-go-pro.html

## Unpack

In [1]:
a, b, c = 1, 2, 3
a, b, c

(1, 2, 3)

In [2]:
a

1

In [3]:
b

2

In [4]:
c

3

In [6]:
a, b, c = (2 * i + 1 for i in range(3))
a, b, c

(1, 3, 5)

In [9]:
a, (b, c), d = (1, (2, 3), 4)
a, b, c, d

(1, 2, 3, 4)

## Swap hai biến

In [10]:
a, b = 1, 2
a, b = b, a
a, b

(2, 1)

## Sử dụng toán tử `*` đại diện cho "phần còn lại"

In [11]:
a, *b, c = [1, 2, 3, 4, 5]

In [12]:
a

1

In [13]:
b

[2, 3, 4]

In [14]:
c

5

## Index âm

In [15]:
a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [16]:
a[-1]

10

In [17]:
a[-3]

8

## Slice

In [18]:
a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [19]:
a[2:8]

[2, 3, 4, 5, 6, 7]

## Slice với index âm

In [20]:
a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [21]:
a[-4:-2]

[7, 8]

## Slice nhảy bước

In [22]:
a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [23]:
a[::2]

[0, 2, 4, 6, 8, 10]

In [24]:
a[::3]

[0, 3, 6, 9]

In [25]:
a[2:8:2]

[2, 4, 6]

## Slice nhảy bước âm

In [26]:
a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [27]:
a[::-1]

[10, 9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

In [28]:
a[::-2]

[10, 8, 6, 4, 2, 0]

## Slice kết hợp gán với list

In [29]:
a = [1, 2, 3, 4, 5]
a[2:3] = [0, 0]
a

[1, 2, 0, 0, 4, 5]

In [30]:
a[1] = [8, 9]
a

[1, [8, 9], 0, 0, 4, 5]

In [31]:
a[1:1] = [8, 9]
a

[1, 8, 9, [8, 9], 0, 0, 4, 5]

## Slice đặt tên

In [34]:
a = [0, 1, 2, 3, 4, 5]
LASTTHREE = slice(-3, None)
LASTTHREE

slice(-3, None, None)

In [35]:
a[LASTTHREE]

[3, 4, 5]

In [36]:
a = [0, 1]
a[LASTTHREE]

[0, 1]

# Duyệt iterable

## Dùng `enumerate` duyệt qua cả index và giá trị

In [37]:
a = ['Hello', 'world', '!']

for i, x in enumerate(a):
    print('{}: {}'.format(i, x))

0: Hello
1: world
2: !


In [38]:
a = "hello"

for i, x in enumerate(a):
    print('{}: {}'.format(i, x))

0: h
1: e
2: l
3: l
4: o


## Duyệt qua key và value của dict

In [39]:
m = {'a': 1, 'b': 2, 'c': 3, 'd': 4}

for k, v in m.items():
    print('{}: {}'.format(k, v))

a: 1
b: 2
c: 3
d: 4


## Zip và ứng dụng

In [40]:
a = [1, 2, 3]
b = ['a', 'b', 'c']
z = list(zip(a, b))
z

[(1, 'a'), (2, 'b'), (3, 'c')]

In [41]:
list(zip(*z))

[(1, 2, 3), ('a', 'b', 'c')]

# Nhóm các phần tử liền nhau

## Dùng itertools

In [42]:
a = [1, 2, 3, 4, 5, 6]
group_adjacent = lambda a, k: list(zip(*([iter(a)] * k)))

In [43]:
group_adjacent(a, 3)

[(1, 2, 3), (4, 5, 6)]

In [44]:
group_adjacent(a, 2)

[(1, 2), (3, 4), (5, 6)]

In [45]:
group_adjacent(a, 1)

[(1,), (2,), (3,), (4,), (5,), (6,)]

## Dùng slice

In [46]:
from itertools import islice

a = [1, 2, 3, 4, 5, 6]
group_adjacent = lambda a, k: list(zip(*(islice(a, i, None, k) 
                                         for i in range(k))))

In [47]:
group_adjacent(a, 3)

[(1, 2, 3), (4, 5, 6)]

In [48]:
group_adjacent(a, 2)

[(1, 2), (3, 4), (5, 6)]

In [49]:
group_adjacent(a, 1)

[(1,), (2,), (3,), (4,), (5,), (6,)]

## Chuyển đổi dict

In [50]:
m = {'a': 1, 'b': 2, 'c': 3, 'd': 4}
m.items()

dict_items([('a', 1), ('b', 2), ('c', 3), ('d', 4)])

In [51]:
list(zip(m.values(), m.keys()))

[(1, 'a'), (2, 'b'), (3, 'c'), (4, 'd')]

In [52]:
mi = dict(zip(m.values(), m.keys()))
mi

{1: 'a', 2: 'b', 3: 'c', 4: 'd'}

# Làm phẳng list

## Dùng itertools

In [53]:
import itertools
a = [[1, 2], [3, 4], [5, 6]]
list(itertools.chain.from_iterable(a))

[1, 2, 3, 4, 5, 6]

## Dùng `sum`

In [54]:
a = [[1, 2], [3, 4], [5, 6]]
sum(a, [])

[1, 2, 3, 4, 5, 6]

## Dùng list comprehension

In [55]:
a = [[1, 2], [3, 4], [5, 6]]
[x for l in a for x in l]

[1, 2, 3, 4, 5, 6]

In [56]:
a = [[[1, 2], [3, 4]], [[5, 6], [7, 8]]]
[x for l1 in a for l2 in l1 for x in l2]

[1, 2, 3, 4, 5, 6, 7, 8]

## Nâng cao: list với các phần tử bất kỳ

In [57]:
a = [1, 2, [3, 4], [[5, 6], [7, 8]]]
flatten = lambda x: [y for l in x for y in flatten(l)] \
                    if type(x) is list else [x]
flatten(a)

[1, 2, 3, 4, 5, 6, 7, 8]

# Sử dụng comprehensions

## Biểu thứ generator

In [58]:
g = (x ** 2 for x in range(10))

next(g)

0

In [59]:
next(g)

1

In [60]:
next(g)

4

In [61]:
next(g)

9

In [None]:
sum(x ** 3 for x in range(10))

In [63]:
sum(x ** 3 for x in range(10) if x % 3 == 1)

408

## Dict comprehension

In [64]:
m = {x: x ** 2 for x in range(5)}
m

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16}

In [65]:
m = {x: 'A' + str(x) for x in range(10)}
m

{0: 'A0',
 1: 'A1',
 2: 'A2',
 3: 'A3',
 4: 'A4',
 5: 'A5',
 6: 'A6',
 7: 'A7',
 8: 'A8',
 9: 'A9'}

## Chuyển đổi dict dùng comprehension

In [66]:
m = {'a': 1, 'b': 2, 'c': 3, 'd': 4}
m

{'a': 1, 'b': 2, 'c': 3, 'd': 4}

In [67]:
{v: k for k, v in m.items()}

{1: 'a', 2: 'b', 3: 'c', 4: 'd'}

## Tập hợp và các phép toán liên quan

In [68]:
A = {1, 2, 3, 3}
B = {3, 4, 5, 6, 7}

In [69]:
A | B

{1, 2, 3, 4, 5, 6, 7}

In [70]:
A & B

{3}

In [71]:
A - B

{1, 2}

In [72]:
B - A

{4, 5, 6, 7}

In [73]:
A ^ B

{1, 2, 4, 5, 6, 7}

In [74]:
A ^ B == ((A - B) | (B - A))

True

# Sự vi diệu của `collections`

## `namedtupple`

In [75]:
import collections

Point = collections.namedtuple('Point', ['x', 'y'])
p = Point(x=1.0, y=2.0)

In [76]:
p

Point(x=1.0, y=2.0)

In [77]:
p.x

1.0

In [78]:
p.y

2.0

In [79]:
class Point(collections.namedtuple('PointBase', ['x', 'y'])):
    __slots__ = ()
    def __add__(self, other):
        return Point(x=self.x + other.x, y=self.y + other.y)

p = Point(x=1.0, y=2.0)
q = Point(x=2.0, y=3.0)
p + q

Point(x=3.0, y=5.0)

## Tập hợp cùng tuần số xuất hiện

In [80]:
import collections
A = collections.Counter([1, 2, 2])
B = collections.Counter([2, 2, 3])

In [81]:
A

Counter({1: 1, 2: 2})

In [82]:
B

Counter({2: 2, 3: 1})

In [83]:
A | B

Counter({1: 1, 2: 2, 3: 1})

In [84]:
A & B

Counter({2: 2})

In [85]:
A + B

Counter({1: 1, 2: 4, 3: 1})

In [86]:
A - B

Counter({1: 1})

In [87]:
B - A

Counter({3: 1})

## Phần tử xuất hiện nhiều nhất

In [88]:
import collections

A = collections.Counter([1, 1, 2, 2, 3, 3, 3, 3, 4, 5, 6, 7])
A

Counter({1: 2, 2: 2, 3: 4, 4: 1, 5: 1, 6: 1, 7: 1})

In [89]:
A.most_common(1)

[(3, 4)]

In [90]:
A.most_common(3)

[(3, 4), (1, 2), (2, 2)]

## Hàng đợi hai đầu

In [91]:
import collections

Q = collections.deque()
Q.append(1)
Q.appendleft(2)
Q.extend([3, 4])
Q.extendleft([5, 6])
Q

deque([6, 5, 2, 1, 3, 4])

In [92]:
Q.pop()

4

In [93]:
Q.popleft()

6

In [94]:
Q

deque([5, 2, 1, 3])

In [95]:
Q.rotate(3)
Q

deque([2, 1, 3, 5])

In [96]:
Q.rotate(-3)
Q

deque([5, 2, 1, 3])

## Hàng đợi hai đầu có giới hạn độ dài

In [97]:
import collections

last_three = collections.deque(maxlen=3)
for i in range(10):
    last_three.append(i)
    print(', '.join(str(x) for x in last_three))

0
0, 1
0, 1, 2
1, 2, 3
2, 3, 4
3, 4, 5
4, 5, 6
5, 6, 7
6, 7, 8
7, 8, 9


## Dict có thứ tự

In [98]:
m = dict((str(x), x) for x in range(10))
print(', '.join(m.keys()))

0, 1, 2, 3, 4, 5, 6, 7, 8, 9


In [99]:
import collections
m = collections.OrderedDict((str(x), x) for x in range(10))
print(', '.join(m.keys()))

0, 1, 2, 3, 4, 5, 6, 7, 8, 9


In [100]:
m = collections.OrderedDict((str(x), x) for x in range(10, 0, -1))
print(', '.join(m.keys()))

10, 9, 8, 7, 6, 5, 4, 3, 2, 1


## Dict với giá trị mặc định

In [101]:
m = dict()
m['a']

KeyError: 'a'

In [102]:
import collections
m = collections.defaultdict(int)
m['a']

0

In [103]:
m['b']

0

In [104]:
m = collections.defaultdict(str)
m['a']

''

In [105]:
m['b'] += 'a'
m

defaultdict(str, {'a': '', 'b': 'a'})

In [106]:
m = collections.defaultdict(lambda: '[default value]')
m['a']

'[default value]'

## Cấu trúc cây với default dict

In [107]:
import collections
import json

tree = lambda: collections.defaultdict(tree)
root = tree()
root['menu']['id'] = 'file'
root['menu']['value'] = 'File'
root['menu']['menuitems']['new']['value'] = 'New'
root['menu']['menuitems']['new']['onclick'] = 'new();'
root['menu']['menuitems']['open']['value'] = 'Open'
root['menu']['menuitems']['open']['onclick'] = 'open();'
root['menu']['menuitems']['close']['value'] = 'Close'
root['menu']['menuitems']['close']['onclick'] = 'close();'
root
defaultdict(<function <lambda> at 0x7f5ce09e4488>, \
    {'menu': defaultdict(<function <lambda> at 0x7f5ce09e4488>, \
    {'value': 'File', 'menuitems': defaultdict(<function <lambda> at 0x7f5ce09e4488>, \
    {'new': defaultdict(<function <lambda> at 0x7f5ce09e4488>, \
    {'value': 'New', 'onclick': 'new();'}), 'close': defaultdict(<function <lambda> at 0x7f5ce09e4488>, \
    {'value': 'Close', 'onclick': 'close();'}), 'open': defaultdict(<function <lambda> at 0x7f5ce09e4488>, \
    {'value': 'Open', 'onclick': 'open();'})}), 'id': 'file'})})
print(json.dumps(root, sort_keys=True, indent=4, separators=(',', ': ')))

SyntaxError: invalid syntax (<ipython-input-107-f3d698d52a93>, line 15)

## Sinh uniqe id cho từng giá trị

In [108]:
import collections
import itertools
value_to_numeric_map = collections.defaultdict(itertools.count().__next__)
value_to_numeric_map['a']

0

In [109]:
value_to_numeric_map['b']

1

In [110]:
value_to_numeric_map['c']

2

In [111]:
value_to_numeric_map['a']

0

In [112]:
value_to_numeric_map['b']

1

## Những phần tử lớn nhất và nhỏ nhất trong 1 list

In [113]:
import heapq
import random
a = [random.randint(0, 100) for __ in range(20)]
a

[5, 55, 38, 74, 78, 48, 86, 76, 15, 53, 81, 82, 85, 9, 18, 53, 53, 43, 32, 86]

In [114]:
heapq.nsmallest(5, a)

[5, 9, 15, 18, 32]

In [115]:
heapq.nlargest(5, a)

[86, 86, 85, 82, 81]

# Ứng dụng của itertools

## Tích Descartes

In [116]:
import itertools

for p in itertools.product('123', '45'):
    print(''.join(p))

14
15
24
25
34
35


In [117]:
for p in itertools.product('12', repeat=4):
    print(''.join(p))

1111
1112
1121
1122
1211
1212
1221
1222
2111
2112
2121
2122
2211
2212
2221
2222


## Tổ hợp

In [118]:
import itertools
for c in itertools.combinations('12345', 3):
    print(''.join(c))

123
124
125
134
135
145
234
235
245
345


In [119]:
for c in itertools.combinations_with_replacement('12345', 3):
    print(''.join(c))

111
112
113
114
115
122
123
124
125
133
134
135
144
145
155
222
223
224
225
233
234
235
244
245
255
333
334
335
344
345
355
444
445
455
555


## Chỉnh hợp

In [120]:
import itertools

for p in itertools.permutations('12345', 3):
    print(''.join(p))
    

123
124
125
132
134
135
142
143
145
152
153
154
213
214
215
231
234
235
241
243
245
251
253
254
312
314
315
321
324
325
341
342
345
351
352
354
412
413
415
421
423
425
431
432
435
451
452
453
512
513
514
521
523
524
531
532
534
541
542
543


## Ghép các iterable

In [121]:
import itertools
a = [1, 2, 3, 4]
for p in itertools.chain(itertools.combinations(a, 2), itertools.combinations(a, 3)):
    print(p)

(1, 2)
(1, 3)
(1, 4)
(2, 3)
(2, 4)
(3, 4)
(1, 2, 3)
(1, 2, 4)
(1, 3, 4)
(2, 3, 4)


## Nhóm các phần tử theo một tiêu chí

In [122]:
import itertools
for k, g in itertools.groupby('122333444455555'):
    print(k, ''.join(g))

1 1
2 22
3 333
4 4444
5 55555


In [123]:
m = {'a': 1, 'b': 2, 'c': 1, 'd': 2}

sorted_m = dict(sorted(m.items(), key=lambda x: x[1]))

for k, g in itertools.groupby(sorted_m, lambda x: x[1]):
    print(k, ', '.join(e[0] for e in g))

IndexError: string index out of range

## Tham số của `startswith`

In [124]:
s = 'http://google.com'
s.startswith('http://') or s.startswith('https://')

True

In [125]:
s.startswith(('http://', 'https://'))

True

In [126]:
s.endswith('.com') or s.endswith('.net')

True

In [127]:
s.endswith(('.com', '.net'))

True

In [128]:
isinstance(1, (int, float))

True

## Trong trình thông dịch,  `_` sẽ lưu giá trị phép tính cuối cùng

In [129]:
1 + 2

3

In [130]:
_

3

In [131]:
foo = 'bar'

In [132]:
foo

'bar'

In [133]:
_ + 'foo'

'barfoo'

## Tham số mặc định là mutable thì phải cẩn thận
Điều này đã được nhắc nhiều khi nói đến "Idiomatic Python"

In [134]:
def foo(l=[]):
    l.append(1)
    print(l)

In [135]:
foo()

[1]


In [136]:
foo()

[1, 1]


In [137]:
foo()

[1, 1, 1]


## Mở một server HTTP đơn giản

In [138]:
python3 -m http.server 8000
Serving HTTP on 0.0.0.0 port 8000 ...
127.0.0.1 - - [24/Jul/2017 13:56:51] "GET / HTTP/1.1" 200 -

SyntaxError: invalid syntax (<ipython-input-138-245267756d66>, line 1)

## So sánh theo phong cách "toán học"

In [139]:
x = 2
3 > x == 1

False

In [140]:
1 < x < 3

True

In [141]:
10 < 10*x < 30

True

In [142]:
10 < x**5 < 30

False

In [143]:
100 < x*100 >= x**6 + 34 > x <= 2*x < 5

True

## Đảo ngược list

In [144]:
list(reversed([1, 2, 3, 4]))

[4, 3, 2, 1]

In [145]:
[1, 2, 3, 4][::-1]

[4, 3, 2, 1]

In [146]:
tuple(reversed((1, 2, 3, 4)))

(4, 3, 2, 1)

In [147]:
(1, 2, 3, 4)[::-1]

(4, 3, 2, 1)

## Chuyển iterable thành string

In [148]:
x = ['Hello', 'world', '!']
' '.join(x)

'Hello world !'

## Class của Python có thể thay đổi tùy ý

In [149]:
class Foo:
    def one(self):
        return 1

In [150]:
c = Foo()
c.one()

1

In [151]:
def two(self):
    return 2

In [152]:
Foo.two = two

In [153]:
c.two()

2

## Hiển thị thuộc tính của 1 đối tượng

In [154]:
x = [1, 2, 3]
dir(x)

['__add__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__delitem__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__gt__',
 '__hash__',
 '__iadd__',
 '__imul__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__reversed__',
 '__rmul__',
 '__setattr__',
 '__setitem__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'append',
 'clear',
 'copy',
 'count',
 'extend',
 'index',
 'insert',
 'pop',
 'remove',
 'reverse',
 'sort']

## Check dung lượng bộ nhớ mà đối tượng chiếm giữ

In [155]:
import sys

x = [1, 2, 3]
sys.getsizeof(x)

88

## Đặt breakpoint để debug

In [156]:
import pdb

for i in range(10):
    if i == 5:
        pdb.set_trace()

> <ipython-input-156-44991095048d>(3)<module>()
-> for i in range(10):
(Pdb) q


BdbQuit: 