# Урок 5. Коллекции. Модуль Collections

### `collections.Counter`
\- подкласс словаря в python (`dict`). Неупорядоченная коллекция пар "ключ-значение", где значение - частота вхлждения ключа

In [1]:
from pprint import pprint
from collections import Counter

In [3]:
a = Counter()
b = Counter('abrakadabra')
c = Counter({'red': 2, 'blue': 4})
d = Counter(cats=4, dogs=5)
 
print(a, b, c, d, sep='\n')

Counter()
Counter({'a': 5, 'b': 2, 'r': 2, 'k': 1, 'd': 1})
Counter({'blue': 4, 'red': 2})
Counter({'dogs': 5, 'cats': 4})


##### Вывод по индексу

In [4]:
b['z']
# Т.е. символ 'z' встречается в коллекции 0 раз

0

In [5]:
b['z'] = 0
b

Counter({'a': 5, 'b': 2, 'r': 2, 'k': 1, 'd': 1, 'z': 0})

##### Метод `elements`

In [6]:
list(b.elements())  # выводит только те значения, встречаемость > 0

['a', 'a', 'a', 'a', 'a', 'b', 'b', 'r', 'r', 'k', 'd']

##### Получить наиболее часто встречающиеся элементы

In [8]:
b.most_common(n=2)

[('a', 5), ('b', 2)]

##### Вычитание из коллекции `g`, коллекции `f`

In [9]:
g = Counter(a=4, b=6, c=-2, d=0)
f = Counter(a=1, b=2, c=3, d=-2)
g.subtract(f)
g

Counter({'a': 3, 'b': 4, 'c': -5, 'd': 2})

##### Получение словаря или множества

In [11]:
display(set(g), dict(g))

{'a', 'b', 'c', 'd'}

{'a': 3, 'b': 4, 'c': -5, 'd': 2}

##### Очистка колекции

In [12]:
g.clear()
g

Counter()

##### С коллекциями можно производить математические и логические операции

In [14]:
x = Counter(a=3, b=1)
y = Counter(a=1, b=2)

In [18]:
x + y

Counter({'a': 4, 'b': 3})

In [19]:
x - y

Counter({'a': 2})

In [20]:
x & y  # выдает значения, кторые есть и в первом и во втором коде

Counter({'a': 1, 'b': 1})

In [21]:
x | y  # выдает значения, кторые есть или в первом или во втором коде

Counter({'a': 3, 'b': 2})

##### Унарное сложение (вычитание)

In [23]:
z = Counter(a=2, b=-4)

In [24]:
+z  # оставляет только положительные элементы

Counter({'a': 2})

In [25]:
-z  # оставляет только отрицателные элементы и меняет их знак

Counter({'b': 4})

### `collections.Deque`
\- очередь. Очередь имеет свойство самоорганизации. 2 свойство - произвольное расположение, а порядок поддерживается за счет связей. Пример - очередь в поликлинике.

In [26]:
from collections import deque

##### Внутрь очереди можно передать все, что можно обработать чиклом `for`

In [28]:
a = deque()
b = deque('abcdef')
c = deque([1, 2, 3, 4, 5])

print(a,b,c, sep='\n')

deque([])
deque(['a', 'b', 'c', 'd', 'e', 'f'])
deque([1, 2, 3, 4, 5])


In [29]:
b = deque('abcdef', maxlen=3)
c = deque([1, 2, 3, 4, 5], maxlen=4)

print(b, c, sep='\n')

deque(['d', 'e', 'f'], maxlen=3)
deque([2, 3, 4, 5], maxlen=4)


In [30]:
c.clear()
print(b, c, sep='\n')

deque(['d', 'e', 'f'], maxlen=3)
deque([], maxlen=4)


##### Добавление элементов в начало или конец очереди. `append()` / `appendleft()`

In [40]:
d = deque([i for i in range(5)])
d.append(5)  # добавить элемент в конец очереди
d.appendleft(6)  # добавить элемент в начало очереди
d

deque([6, 0, 1, 2, 3, 4, 5])

##### Добавление сразу нескольких элементов. `extend()` / `extendleft()`

In [41]:
d.extend([7, 8, 9])
d.extendleft([10, 11, 12])
d

deque([12, 11, 10, 6, 0, 1, 2, 3, 4, 5, 7, 8, 9])

In [42]:
d = deque([i for i in range(5)], maxlen=7)
d.extend([7, 8, 9])
d.extendleft([10, 11, 12])
d

deque([12, 11, 10, 1, 2, 3, 4])

##### Удаление элементов из очереди. `pop()` / `popleft()`

In [43]:
f = deque([i for i in range(5)], maxlen=7)
x = f.pop()
y = f.popleft()
print(f, x, y, sep='\n')

deque([1, 2, 3], maxlen=7)
4
0


##### Количество вхождений элемента в очередь. `count()`

In [44]:
g = deque([i for i in range(5)], maxlen=7)
g.count(2)

1

##### Позиция элемента в очереди. `index()`

In [45]:
g.index(3)

3

##### Добавлвение элеметна в середину очереди. `insert()`

In [49]:
g.insert(2, 6)  # добавить на позицию 2 число 6
g

deque([0, 1, 6, 2, 3, 4])

##### Разворот очереди. `reverse()`

In [52]:
print(g)
g.reverse()
print(g)

deque([0, 1, 6, 2, 3, 4], maxlen=7)
deque([4, 3, 2, 6, 1, 0], maxlen=7)


###### Ротация
\- перемещение n элементов из правой части очереди в левую, или из левой в правую, если n - отрицательное

In [53]:
print(g)
g.rotate(3)
print(g)

deque([4, 3, 2, 6, 1, 0], maxlen=7)
deque([6, 1, 0, 4, 3, 2], maxlen=7)


#### Задача. Разложить список на положительные и отрицательные числа

In [54]:
from collections import deque
import random

array = [random.randint(-100, 100) for _ in range(10)]
print(f'original array: {array}')

deq = deque()

for item in array:
    if item > 0:
        deq.append(item)
    elif item < 0:
        deq.appendleft(item)
print('-' * 50)
print(f'transform array: {list(deq)}')

original array: [99, -64, 92, -27, 89, -55, 27, 81, -88, 93]
--------------------------------------------------
transform array: [-88, -55, -27, -64, 99, 92, 89, 27, 81, 93]


#### Задача. Прочитать последние 10 строк IP-адресов

In [67]:
from collections import deque
from pprint import pprint

path = './big_log.txt'

with open(path, 'r', encoding='utf-8') as f:
    last_ten_IP = deque(f, maxlen=10)

print(last_ten_IP)

deque(['186.161.5.31\n', '193.165.3.22\n', '182.167.4.24\n', '196.165.7.17\n', '180.166.6.25\n', '182.161.4.4\n', '195.168.6.29\n', '195.161.6.20\n', '194.163.1.26\n', '198.162.7.14\n'], maxlen=10)


---

### `collections.Defaultdict`
\- это подкласс словаря (`dict`). Отличие от обычного словаря одно - при создании объекта в него нужно передать какую-нибудь функцию - определить `default_factory`

In [69]:
from collections import defaultdict

In [71]:
a = defaultdict()
a

defaultdict(None, {})

In [59]:
s = 'dthlrdihrz.jrhjnjrz.n.rkhz.hz'
b = defaultdict(int)
for i in s:
    b[i] += 1
print(b)

defaultdict(<class 'int'>, {'d': 2, 't': 1, 'h': 5, 'l': 1, 'r': 5, 'i': 1, 'z': 4, '.': 4, 'j': 3, 'n': 2, 'k': 1})


In [60]:
list_1 = [('cat', 1), ('dog', 5), ('cat', 2), ('mouse', 1), ('dog', 1)]
c = defaultdict(list)
for k, v in list_1:
    c[k].append(v)
print(c)

defaultdict(<class 'list'>, {'cat': [1, 2], 'dog': [5, 1], 'mouse': [1]})


In [62]:
list_2 = [('cat', 1), ('dog', 5), ('cat', 2), ('cat', 1), ('dog', 1), ('dog', 5)]
d = defaultdict(set)
for k, v in list_2:
    d[k].add(v)
print(d)
# Остались только уникальные значения

defaultdict(<class 'set'>, {'cat': {1, 2}, 'dog': {1, 5}})


In [64]:
f = defaultdict(lambda: 'unknown')
f.update(rex='dog', tomas='cat')
print(f)

defaultdict(<function <lambda> at 0x000001B127C834C8>, {'rex': 'dog', 'tomas': 'cat'})


In [65]:
print(f['rex'])

dog


In [68]:
print(f['jerry'])

unknown


---

# OrderedDict

`OrderedDict` - это подкласс словаря `dict`, в котором элементы (пары ключ-значение) упорядочены.

OrderedDict запоминает порядок, в которм были добавлены "ключи"

In [69]:
from collections import OrderedDict

### - Сортировка словаря

In [72]:
a = {'cat': 5, 'dog': 2, 'mouse': 4}
new_a = OrderedDict(sorted(a.items(), key=lambda x: x[0]))
print(new_a)

OrderedDict([('cat', 5), ('dog', 2), ('mouse', 4)])


### - Сортировка словаря по-значению

In [75]:
b = {'cat': 5, 'dog': 2, 'mouse': 4}
new_b = OrderedDict(sorted(b.items(), key=lambda x: x[1]))
print(new_b)

OrderedDict([('dog', 2), ('mouse', 4), ('cat', 5)])


In [76]:
new_a == new_b
# Порядок элементов важен

False

### - Изменяем порядок

In [79]:
new_b.move_to_end('mouse')
new_b

OrderedDict([('dog', 2), ('cat', 5), ('mouse', 4)])

In [80]:
new_b.move_to_end('mouse', last=False)  # теперь 'mouse' перенесен не в конец, а в начало
new_b

OrderedDict([('mouse', 4), ('dog', 2), ('cat', 5)])

### - Удаление элемента


In [81]:
# удаление последнего элемента
new_b.popitem()
new_b

OrderedDict([('mouse', 4), ('dog', 2)])

In [82]:
# удаление первого элемента
new_b.popitem(last=False)
new_b

OrderedDict([('dog', 2)])

### - Добавление

In [83]:
new_b['cow'] = 1
new_b

OrderedDict([('dog', 2), ('cow', 1)])

### - Изменение

In [84]:
new_b['dog'] = 8
new_b

OrderedDict([('dog', 8), ('cow', 1)])

### Разное

#### Сортировка

In [85]:
new_c = OrderedDict(sorted(a.items(), key=lambda x: len(x[0])))
new_c

OrderedDict([('cat', 5), ('dog', 2), ('mouse', 4)])

#### Выведение элементов в обратном порядке

In [86]:
for key in reversed(new_c):
    print(key, new_c[key])

mouse 4
dog 2
cat 5


In [87]:
reversed(new_c)

<odict_iterator at 0x1b12763ed08>

## Задача.

В лог-файл сервер добавляет ip-адреса, с которых пришел запрос.

Проанализоровать последние N адресов и сохранить в новый файл пары значений "ip-адрес - кол-во запросов".
- исключить локальные адреса (192.168.*.*)
- сохранить исходный порядок адресов

In [91]:
from collections import OrderedDict, defaultdict, deque

# берем последние 3000 адресов

N = 3000
with open('big_log.txt', 'r', encoding='utf-8') as f:
    log = deque(f, N)  # сохраняем в очередь последние N значений

# print(log)

# объявляем переменные
data = OrderedDict()
spam = defaultdict(int)

# избавляемся от символа перенова строки
for item in log:
    ip = item[:-1]  # для каждой строки оставляем все, кроме последнего символа

    if not ip.startswith('192.168'):
        spam[ip] += 1
        data[ip] = 1

# print(spam)
# print(data)

data.update(spam)  # добавляет в `data` ключи из `spam`
# print(data)

with open ('data.txt', 'w', encoding='utf-8') as f:
    for key, value in data.items():
        f.write(f'{key} - {value}\n')

---

# Namedtuple
\- это именованый кортеж, обеспечивающий доступ к содержимому по имени

In [1]:
from collections import namedtuple

## Задача 1

In [1]:
# начнем с обычного кортежа
# создадим персонажа игры
# имя, раса, здоровье, мана, сила
hero_1 = ('Aaz', 'Izverg', 100, 0.0, 250)
print(hero_1[4])

250


In [2]:
# это неудобно, так как всегда нужно помнить названия параметров

In [4]:
# создадим класс персонаж
class Person:
    def __init__(self, name, race, heath, mana, streinght):
        self.name = name
        self.race = race
        self.heath = heath
        self.mana = mana
        self.stereinght = streinght


hero_2 = Person('Aaz', 'Izverg', 100, 0.0, 250)
print(hero_2.heath)

100


In [5]:
New_person = namedtuple('New_person', 'name, race, heath, mana, streinght')
hero_3 = New_person('Aaz', 'Izverg', 100, 0.0, 250)
print(hero_3.race)

Izverg


In [6]:
# или
prop = ['name', 'race', 'heath', 'mana', 'streinght']
New_person_1 = namedtuple('New_person_1', prop)
hero_4 = New_person_1('Aaz', 'Izverg', 100, 0.0, 250)
print(hero_4.race)

Izverg


In [11]:
prop = ['name', '3race', 'heath', '_mana', 'streinght']
New_person_1 = namedtuple('New_person_1', prop, rename=True)
hero_4 = New_person_1('Aaz', 'Izverg', 100, 0.0, 250)
print(hero_4)

New_person_1(name='Aaz', _1='Izverg', heath=100, _3=0.0, streinght=250)


## Задача 2

In [12]:
Point = namedtuple('Point', 'x, y, z')

p1 = Point(2, z=3, y=4)
print(p1)

Point(x=2, y=4, z=3)


## 5 интересных методов

In [14]:
# 1
t = [5, 10, 15]
p2 = Point._make(t)
print(p2)

Point(x=5, y=10, z=15)


In [16]:
# 2
d2 = p2._asdict()
print(d2)

OrderedDict([('x', 5), ('y', 10), ('z', 15)])


In [17]:
# 3
p3 = p2._replace(x=6)
print(p3)

Point(x=6, y=10, z=15)


In [48]:
# 4
print(p3._fields)

('x', 'y', 'z')


In [54]:
# 5 значение по-умолчанию
New_point = namedtuple('New_point', 'x, y, z', defaults=[0,0])
p4 = New_point(5)
print(p4)

New_point(x=5, y=0, z=0)


In [55]:
print(p4._field_defaults)

{'y': 0, 'z': 0}


In [56]:
dct = {'x': 10,'y': 20,'z': 30}
p5 = New_point(**dct)
print(p5)

New_point(x=10, y=20, z=30)


# ChainMap
\- (цепочка отображений) - позволяет организовать работу с несколькими словарями(`dict`)

Поиск "ключа" осуществляется посредовательно в каждом из словарей цепочки, пока ключ не будет найден.

In [57]:
from collections import ChainMap

# сначала построим несколько словарей
# у нас будет возможность построить из них цепочку
d1 = {'a': 2, 'b': 4, 'c': 5}
d2 = {'a': 10, 'b': 20, 'd': 40}

d_map = ChainMap(d1, d2)  # важен порядок элементов
print(d_map)

ChainMap({'a': 2, 'b': 4, 'c': 5}, {'a': 10, 'b': 20, 'd': 40})


In [58]:
d2['a'] = 100
print(d_map)

ChainMap({'a': 2, 'b': 4, 'c': 5}, {'a': 100, 'b': 20, 'd': 40})


In [59]:
print(d_map['a'])
print(d_map['d'])

2
40


In [61]:
# дабавление
x = d_map.new_child()
print(x)

ChainMap({}, {'a': 2, 'b': 4, 'c': 5}, {'a': 100, 'b': 20, 'd': 40})


In [64]:
# ображение к словарям
print(x.maps[0])
print(x.maps[-1])

{}
{'a': 100, 'b': 20, 'd': 40}


In [65]:
print(x.parents)

ChainMap({'a': 2, 'b': 4, 'c': 5}, {'a': 100, 'b': 20, 'd': 40})


In [68]:
x = d_map.new_child({'a': 111, 'b': 222, 'c': 333, 'd': 444})
print(x)
# ображение к словарям
print(x.maps[0])
print(x.maps[-1])
print(x.parents)

ChainMap({'a': 111, 'b': 222, 'c': 333, 'd': 444}, {'a': 2, 'b': 4, 'c': 5}, {'a': 100, 'b': 20, 'd': 40})
{'a': 111, 'b': 222, 'c': 333, 'd': 444}
{'a': 100, 'b': 20, 'd': 40}
ChainMap({'a': 2, 'b': 4, 'c': 5}, {'a': 100, 'b': 20, 'd': 40})


In [70]:
y = d_map.new_child()
print(y)

ChainMap({}, {'a': 2, 'b': 4, 'c': 5}, {'a': 100, 'b': 20, 'd': 40})


In [71]:
print(y['a'])

2


In [72]:
y['a'] = 1
print(y)

ChainMap({'a': 1}, {'a': 2, 'b': 4, 'c': 5}, {'a': 100, 'b': 20, 'd': 40})


In [74]:
print(list(y))
print(list(y.values()))

['a', 'b', 'd', 'c']
[1, 4, 40, 5]


## Задача

In [76]:
import argparse
from collections import ChainMap

'''
Напишем программу, которая будет хранить значения ip-адреса и порта по-умолчанию
'''

defaults = {'ip': 'localhost', 'port': 7777}
parser = argparse.ArgumentParser()
parser.add_argument('-i', '--ip',)
parser.add_argument('-p', '--port')

args = parser.parse_args()
new_dict = {key: value for key, value in vars(args).items() if value}

settings = ChainMap(new_dict, defaults)
print(settings['ip'])
print(settings['port'])
exit

usage: ipykernel_launcher.py [-h] [-i IP] [-p PORT]
ipykernel_launcher.py: error: unrecognized arguments: -f C:\Users\carne\AppData\Roaming\jupyter\runtime\kernel-9d1acfd6-2b3b-4123-b40d-03992edc474a.json


SystemExit: 2