### Глава 1. Структуры данных и алгоритмы

In [6]:
import numpy as np
import statistics
import heapq
from collections import deque

### 1.1. Распаковка последовательности в отдельные переменные

Задача. У вас есть кортеж из N элементов или последовательность, которую вы хотите рас-
паковать в коллекцию из N переменных.

In [78]:
p = (4, 5) 
x, y = p
print("x =", x, "y =", y)

x = 4 y = 5


In [86]:
data = ['ACME', 50, 91.1, (2012, 12, 21)]
a, b, c, d = data
x, y, z = d

2012

In [89]:
name, shares, price, (year, mon, day) = data
print("name =",name)
print("shares =",shares)
print("price =",price)
print("year =",year)
print("mon =",mon)
print("day =",day)

name = ACME
shares = 50
price = 91.1
year = 2012
mon = 12
day = 21


In [90]:
s = "Hello"
a,b,c,d,e = s
print("a =", a)
print("b =",b)
print("c =",c)
print("d =",d)
print("e =",e)

a = H
b = e
c = l
d = l
e = o


In [94]:
data = ['ACME', 50, 91.1, (2012, 12, 21) ]
_, shares, price, _ = data
print("shares =", shares)
print("price =", price)

shares = 50
price = 91.1


### 1.2. Распаковка элементов из последовательностей произвольной длины

Задача. Вам нужно распаковать N элементов из итерируемого объекта, но этот объект мо-
жет содержать больше N элементов, что вызывает исключение «too many values to
unpack» («слишком много значений для распаковки»).

Для решения этой задачи можно использовать «выражения со звездочкой». Пред-
положим, например, что вы ведете учебный курс. В конце семестра вы решаете,
что не будете принимать во внимание оценки за первое и последнее домашние
задания, а по остальным оценкам посчитаете среднее значение. Если у вас было
четыре задания, то можно просто распаковать все четыре. Но что делать, если их
24? Выражение со звездочкой позволит легко решить эту задачу:

In [78]:
a = [2,4,5,2]
def drop_first_last(grades):
    first, *middle, last = grades
    return np.mean(middle)

drop_first_last(a)

4.5

Рассмотрим еще один пример: предположим, что у вас есть записи о пользова-
телях, которые состоят из имени и адреса электронной почты, за которыми следу-
ет произвольное количество телефонных номеров. Вы можете распаковать записи
так:

In [77]:
record = ('Dave', 'dave@example.com', '773-555-1212', '847-555-1212', 'abc')
name, email, *phone_numbers, tmp = record
phone_numbers

['773-555-1212', '847-555-1212']

Переменная со звездочкой также может быть первой в списке. Например, у вас
есть последовательность значений, представляющая продажи вашей компании за
последние восемь кварталов. Если вы хотите посмотреть, как последний квартал
соотносится со средним значением по первым семи, вы можете сделать так:

In [79]:
sales_record = [10, 8, 7, 1, 9, 5, 10, 3]
def unpack_sales(sales):
    *trailing_qtrs, current_qtr = sales
    trailing_avg = sum(trailing_qtrs) / len(trailing_qtrs)
    
    return np.mean(trailing_avg), current_qtr

unpack_sales(sales_record)

(7.142857142857143, 3)

Расширенная распаковка отлично подходит для распаковки итерируемых объек-
тов неизвестной или произвольной длины. Часто эти объекты имеют некоторые
известные элементы или шаблоны (например, «все, что после элемента 1, явля-
ется телефонным номером»). Распаковка со звездочкой позволяет программисту
легко использовать эти шаблоны – вместо того чтобы исполнять акробатические
трюки для извлечения нужных элементов из итерируемого объекта.
Стоит отметить, что синтаксис звездочки может быть особенно полезен при
итерировании по последовательности кортежей переменной длины. Например,
возможна такая последовательность кортежей с тегами:

In [63]:
records = [
    ('foo', 1, 2),
    ('bar', 'hello'),
    ('foo', 3, 4),
]

def do_foo(x, y):
    print('foo', x, y)
    
def do_bar(s):
    print('bar', s)
    
for tag, *args in records:
    if tag == 'foo':
        do_foo(*args)
    elif tag == 'bar':
        do_bar(*args)

foo 1 2
bar hello
foo 3 4


Распаковка со звездочкой также может быть полезна в комбинации с опера
циями обработки строк, такими как разрезание. Например:

In [80]:
line = 'nobody:*:-2:-2:Unprivileged User:/var/empty:/usr/bin/false'
uname, *fields, homedir, sh = line.split(':')
print("РаспаковОчка= ", line.split(":"))
print("-----------------------")

print("uname =", uname)
print("fields =", fields)
print("homedir =", homedir)
print("sh =", sh)

РаспаковОчка=  ['nobody', '*', '-2', '-2', 'Unprivileged User', '/var/empty', '/usr/bin/false']
-----------------------
uname = nobody
fields = ['*', '-2', '-2', 'Unprivileged User']
homedir = /var/empty
sh = /usr/bin/false


Иногда вам может быть нужно распаковать значения и отбросить их. Вы не мо-
жете просто определить голую * при распаковке, но можно использовать обычное
для отбрасывания имя переменной, такое как _ или ign (ignored). Например:

In [81]:
record = ('ACME', 50, 123.45, (12, 18, 2012))
name, *all, (*_, year) = record

print("name =", name)
print("all =", all)
print("year =", year)

name = ACME
all = [50, 123.45]
year = 2012


Есть некоторое сходство между распаковкой со звездочкой и обработкой спис
ков в функциональных языках. Например, если у вас есть список, то вы можете
легко разделить его на «хвост» и «голову»:

In [82]:
items = [1, 10, 7, 4, 5, 9]
head, *tail = items
print("head =", head)
print("tail =", tail)

head = 1
tail = [10, 7, 4, 5, 9]


Можно представить себе функцию, которая произведет такое разрезание с помощью хитрого рекурсивного алгоритма. Например:

In [83]:
def sum_(items):
    head, *tail = items
    return head + sum(tail) if tail else head

sum_(items)

36

### 1.3. оставляем N последних элементов

In [103]:
from collections import deque

In [66]:
# Задача хранения ограниченной истории – отличный повод применить collections.
# deque. Например, следующий фрагмент кода производит простое сопоставление 
# текста с последовательностью строк, а при совпадении выдает совпавшие строки 
# вместе с N предыдущими строками контекста:

In [174]:
def search(lines, pattern, history=5):
    previous_lines = deque(maxlen=history)
    for line in lines:
        if pattern in line:
            yield line, previous_lines
        previous_lines.append(line)

In [175]:
# Пример использования
if __name__ == '__main__':
    with open('somefile.txt') as f:
        for line, prevlines in search(f, 'python', 5):
            for pline in prevlines:
                print(pline, end='')
            print(line, end='')
            print('-'*20)

python
--------------------
python
python
--------------------
python
python
pypypyrgregerberpython
--------------------
python
python
pypypyrgregerberpython
abdbabpython
--------------------
python
python
pypypyrgregerberpython
abdbabpython
asfasfd
python
--------------------
pypypyrgregerberpython
abdbabpython
asfasfd
python
asfasfd
python
--------------------
abdbabpython
asfasfd
python
asfasfd
python
python
--------------------


Класс collections.deque() это обобщение стеков и очередей и представляет собой двустороннюю очередь. Двусторонняя очередь deque() поддерживает поточно-ориентированные, эффективные по памяти операции добавления и извлечения элементов последовательности с любой стороны с примерно одинаковой производительностью в любом направлении.

: deque может быть использована в любом случае, когда вам нужна простая очередь. 
Если вы не зададите максимальную длину, то получите бесконечную очередь, которая позволит вам добавлять и  удалять элементы с  обоих концов.

In [159]:
q = deque(maxlen=5)

In [166]:
q.append(1)
q.append(2)
q.append(3)
q.append(4)
q.append(5)
q

deque([1, 2, 3, 4, 5])

In [169]:
q.append(6)
q

deque([2, 3, 4, 5, 6])

In [170]:
q.appendleft(7)
q

deque([7, 2, 3, 4, 5])

In [171]:
q.pop()

5

In [172]:
q.popleft()

7

In [173]:
q

deque([2, 3, 4])

### 1.4. Поиск N максимальных и минимальных элементов nlargest() и nsmallest()

In [28]:
import heapq
from heapq import *

In [29]:
nums = [1, 8, 2, 23, 7, -4, 18, 23, 42, 37, 2]
print(heapq.nlargest(3, nums)) # Выведет [42, 37, 23]
print(heapq.nsmallest(3, nums)) # Выведет [-4, 1, 2]

[42, 37, 23]
[-4, 1, 2]


In [31]:
portfolio = [
 {'name': 'IBM', 'shares': 100, 'price': 91.1},
 {'name': 'AAPL', 'shares': 50, 'price': 543.22},
 {'name': 'FB', 'shares': 200, 'price': 21.09},
 {'name': 'HPQ', 'shares': 35, 'price': 31.75},
 {'name': 'YHOO', 'shares': 45, 'price': 16.35},
 {'name': 'ACME', 'shares': 75, 'price': 115.65}
]
cheap = heapq.nsmallest(3, portfolio, key=lambda s: s['price'])
expensive = heapq.nlargest(3, portfolio, key=lambda s: s['price'])

print("Дорогой : ", expensive)
print("Дешёвый : ", cheap)

Дорогой :  [{'name': 'AAPL', 'shares': 50, 'price': 543.22}, {'name': 'ACME', 'shares': 75, 'price': 115.65}, {'name': 'IBM', 'shares': 100, 'price': 91.1}]
Дешёвый :  [{'name': 'YHOO', 'shares': 45, 'price': 16.35}, {'name': 'FB', 'shares': 200, 'price': 21.09}, {'name': 'HPQ', 'shares': 35, 'price': 31.75}]


In [32]:
nums = [1, 8, 2, 23, 7, -4, 18, 23, 42, 37, 2]
heap = list(nums)
print("list: ", heap)
heapq.heapify(heap) #Функция heapify() модуля heapq преобразовывает список x в кучу на месте за линейное время.
heap

list:  [1, 8, 2, 23, 7, -4, 18, 23, 42, 37, 2]


[-4, 2, 1, 23, 7, 2, 18, 23, 42, 37, 8]

In [33]:
heapq.heappop(heap)

-4

In [34]:
heapq.heappop(heap)

1

In [35]:
heapq.heappop(heap)

2

In [36]:
heap

[2, 7, 8, 23, 42, 37, 18, 23]

### 1.5. Реализация очереди с приоритетом

In [32]:
import heapq

In [33]:
class PriorityQueue:
    
    def __init__(self):
        self._queue = []
        self._index = 0
    
    def push(self, item, priority):
        heapq.heappush(self._queue, (-priority, self._index, item))
        self._index += 1
    
    def pop(self):
        return heapq.heappop(self._queue)[-1]

    
class Item:
    def __init__(self, name):
        self.name = name
    def __repr__(self):
        return 'Item({!r})'.format(self.name)

In [34]:
q = PriorityQueue()
q.push(Item('foo'), 1)
q.push(Item('bar'), 5)
q.push(Item('spam'), 4)
q.push(Item('grok'), 1)

In [35]:
q.pop()
# Item('bar')
q.pop()
# Item('spam')
q.pop()
# Item('foo')
q.pop()
# Item('grok')

Item('grok')

In [36]:
# (priority, item)
a = (1, Item('foo'))
b = (5, Item('bar'))
a < b

True

In [38]:
c = (1, Item('grok'))
a < c

TypeError: '<' not supported between instances of 'Item' and 'Item'

In [39]:
# (priority, index, item)
a = (1, 0, Item('foo'))
b = (5, 1, Item('bar'))
c = (1, 2, Item('grok'))
a < b

True

In [40]:
a < c

True

### 1.6. Отображение ключей на несколько значений в словаре

In [41]:
from collections import defaultdict

In [42]:
d = {
 'a' : [1, 2, 3],
 'b' : [4, 5]
}

e = {
 'a' : {1, 2, 3},
 'b' : {4, 5}
}

In [43]:
d = defaultdict(list)
d['a'].append(1)
d['a'].append(2)
d['b'].append(4)

In [3]:
d

defaultdict(list, {'a': [1, 2], 'b': [4]})

In [44]:
d = defaultdict(set)
d['a'].add(1)
d['a'].add(2)
d['b'].add(4)

In [5]:
d

defaultdict(set, {'a': {1, 2}, 'b': {4}})

In [45]:
d = {} # Обычный словарь
d.setdefault('a', []).append(1)
d.setdefault('a', []).append(2)
d.setdefault('b', []).append(4)

In [15]:
d

{'a': [1, 2], 'b': [4]}

In [46]:
pairs = [('a', 1), ('b', 2), ('a', 3), ('b', 4), ('c', 5)]
d = {}
for key, value in pairs:
    if key not in d:
        d[key] = []
    d[key].append(value)
    
d

{'a': [1, 3], 'b': [2, 4], 'c': [5]}

In [47]:
pairs = [('a', 1), ('b', 2), ('a', 3), ('b', 4), ('c', 5)]
d = defaultdict(list)
for key, value in pairs:
    d[key].append(value)
d

defaultdict(list, {'a': [1, 3], 'b': [2, 4], 'c': [5]})

### 1.7. Поддержание порядка в словарях

In [68]:
from collections import OrderedDict
import json

In [69]:
d = OrderedDict()
d['foo'] = 1
d['bar'] = 2
d['spam'] = 3
d['grok'] = 4
d

OrderedDict([('foo', 1), ('bar', 2), ('spam', 3), ('grok', 4)])

In [70]:
for key in d:
    print(key, d[key])

foo 1
bar 2
spam 3
grok 4


In [71]:
json.dumps(d)

'{"foo": 1, "bar": 2, "spam": 3, "grok": 4}'

### 1.8. Вычисления со словарями

In [92]:
prices = {
 'ACME': 45.23,
 'AAPL': 612.78,
 'IBM': 205.55,
 'HPQ': 37.20,
 'FB': 10.75
}

In [93]:
min_price = min(zip(prices.values(), prices.keys()))
# min_price – (10.75, 'FB')
max_price = max(zip(prices.values(), prices.keys()))
# max_price – (612.78, 'AAPL')

In [94]:
prices_sorted = sorted(zip(prices.values(), prices.keys()))
# prices_sorted – [(10.75, 'FB'), (37.2, 'HPQ'),
# (45.23, 'ACME'), (205.55, 'IBM'),
# (612.78, 'AAPL')
prices_sorted

[(10.75, 'FB'),
 (37.2, 'HPQ'),
 (45.23, 'ACME'),
 (205.55, 'IBM'),
 (612.78, 'AAPL')]

In [95]:
prices_and_names = zip(prices.values(), prices.keys())
print(min(prices_and_names)) # OK

(10.75, 'FB')


In [96]:
print(max(prices_and_names)) # ValueError: max() arg is an empty sequence

ValueError: max() arg is an empty sequence

In [97]:
min(prices) # Вернет 'AAPL'
max(prices) # Вернет 'IBM'

'AAPL'

In [101]:
min(prices.values()) # Вернет 10.75
max(prices.values()) # Вернет 612.78

612.78

In [102]:
min(prices, key=lambda k: prices[k]) # Вернет 'FB'
max(prices, key=lambda k: prices[k]) # Вернет 'AAPL

'AAPL'

In [103]:
min_value = prices[min(prices, key=lambda k: prices[k])]
min_value

10.75

In [91]:
prices = { 'AAA' : 45.23, 'ZZZ': 45.23 }
min(zip(prices.values(), prices.keys()))
# (45.23, 'AAA')
max(zip(prices.values(), prices.keys()))
# (45.23, 'ZZZ')

(45.23, 'ZZZ')

### 1.9. Поиск общих элементов в двух словарях

In [116]:
a = {
 'x' : 1,
 'y' : 2,
 'z' : 3
}
b = {
 'w' : 10,
 'x' : 11,
 'y' : 2
}

In [118]:
# Находим общие ключи
a.keys() & b.keys() # { 'x', 'y' }

{'x', 'y'}

In [120]:
# Находим ключи, которые есть в a, но которых нет в b
b.keys() - a.keys() # { 'z' }

{'w'}

In [121]:
# Находим общие пары (key,value)
a.items() & b.items() # { ('y', 2) }

{('y', 2)}

In [124]:
# Создаем новый словарь, из которого удалены некоторые ключи
c = {key:a[key] for key in a.keys() - {'z', 'w'}}
# c – это {'x': 1, 'y': 2}
c

{'x': 1, 'y': 2}

### 1.10. Удаление дубликатов из последовательности с сохранением порядка элементов

In [18]:
def dedupe(items):
    seen = set()
    for item in items:
        if item not in seen:
            yield item
            seen.add(item)

In [19]:
a = [1, 5, 2, 1, 9, 1, 5, 10]
list(dedupe(a))

[1, 5, 2, 9, 10]

In [20]:
def dedupe(items, key=None):
    seen = set()
    for item in items:
        val = item if key is None else key(item)
        if val not in seen:
            yield item
            seen.add(val)

In [22]:
a = [{'x':1, 'y':2}, {'x':1, 'y':3}, {'x':1, 'y':2}, {'x':2, 'y':4}]

In [23]:
list(dedupe(a, key=lambda d: (d['x'],d['y'])))

[{'x': 1, 'y': 2}, {'x': 1, 'y': 3}, {'x': 2, 'y': 4}]

In [24]:
list(dedupe(a, key=lambda d: d['x']))

[{'x': 1, 'y': 2}, {'x': 2, 'y': 4}]

In [26]:
a = [1, 5, 2, 1, 9, 1, 5, 10]
list(set(a))

[1, 2, 5, 9, 10]