# Moduł collections
+ date: 2018-01-12
+ categoty: python
+ tags: module, collections

Moduł collections jest wbudowanym modułem, który implementuje wyspecjalizowane typy danych kontenera, zapewniając alternatywę dla wbudowanych kontenerów ogólnego przeznaczenia Pythona. Poznaliśmy już podstawowe: dictionary, list, set and tuple.

Teraz dowiemy się o alternatywach dostarczanych przez moduł collections.

## Counter

*Counter* jest podklasą *dictionary*, która pomaga liczyć obiekty. Wewnątrz tego elementu elementy są przechowywane jako key, a liczba obiektów jest zapisywana jako value.

Zobaczmy, jak można go użyć:

In [2]:
from collections import Counter

**Counter() with lists** 

In [4]:

l = [1,2,2,2,2,3,3,3,1,2,1,12,3,2,32,1,21,1,223,1]

Counter(l)

Counter({1: 6, 2: 6, 3: 4, 12: 1, 21: 1, 32: 1, 223: 1})

**Counter with strings**

In [5]:
Counter('aabsbsbsbhshhbbsbs')

Counter({'a': 2, 'b': 7, 'h': 3, 's': 6})

**Counter with words in a sentence**

In [7]:
s = 'How many times does each word show up in this sentence word times each each word'

words = s.split()

Counter(words)

Counter({'How': 1,
         'does': 1,
         'each': 3,
         'in': 1,
         'many': 1,
         'sentence': 1,
         'show': 1,
         'this': 1,
         'times': 2,
         'up': 1,
         'word': 3})

In [8]:
# Methods with Counter()
c = Counter(words)

c.most_common(2)

[('word', 3), ('each', 3)]

## Typowe wzorce podczas używania obiektu Counter()

In [None]:
sum(c.values())                 # suma wszytkich zliczeń
c.clear()                       # resetowanie zliczeń
list(c)                         # lista unikalnych elementów
set(c)                          # konwertowanie do set
dict(c)                         # konwertowanie do normalnego słownika
c.items()                       # konwertowanie do listy z parami (elem, zliczenie)
Counter(dict(list_of_pairs))    # konwertowanie z listy z parami (elem, zliczenie)

## defaultdict
defaultdict jest słownikiem podobnym do obiektu, który dostarcza wszystkich metod dostępnych w słowniku, ale przyjmuje pierwszy argument (default_factory) jako domyślny typ danych dla słownika. Używanie defaultdict jest szybsze niż wykonanie tego samego przy pomocy metody dict.set_default.

** Defaultdict nigdy nie podniesie KeyError. Każdy klucz, który nie istnieje, otrzymuje wartość zwróconą przez default_factory. **

In [10]:
from collections import defaultdict

In [11]:
d = {}

In [12]:
d['one'] 

KeyError: 'one'

In [13]:
d  = defaultdict(object)

In [14]:
d['one'] 

<object at 0x7f3cf07e7e40>

In [15]:
for item in d:
    print item

one


Można również zainicjować za pomocą wrtości domyślnych:

In [16]:
d = defaultdict(lambda: 0)

In [17]:
d['one']

0

## OrderedDict
OrderedDict jest podklasą dictionary, która zapamiętuje kolejność, w której dodano jej zawartość.

Na przykład zwykły słownik:

In [23]:
from collections import OrderedDict

In [27]:
print 'Normalny dictionary:'

d = {}

d['a'] = 'A'
d['b'] = 'B'
d['c'] = 'C'
d['d'] = 'D'
d['e'] = 'E'

for k, v in d.items():
    print k, v

Normalny dictionary:
a A
c C
b B
e E
d D


An Ordered Dictionary:

In [28]:
print 'OrderedDict:'

d = OrderedDict()

d['a'] = 'A'
d['b'] = 'B'
d['c'] = 'C'
d['d'] = 'D'
d['e'] = 'E'

for k, v in d.items():
    print k, v

OrderedDict:
a A
b B
c C
d D
e E


## Równość z Ordered Dictionary
Normalny dictionary analizuje jego zawartość podczas testowania pod kątem równości. OrderedDict uwzględnia także kolejność dodawania elementów.

In [21]:
print 'Dictionaries są równe? '

d1 = {}
d1['a'] = 'A'
d1['b'] = 'B'

d2 = {}
d2['b'] = 'B'
d2['a'] = 'A'

print d1 == d2

Dictionaries są równe? 
True


Ordered Dictionary:

In [30]:
print 'Dictionaries są równe? '

d1 = OrderedDict()
d1['a'] = 'A'
d1['b'] = 'B'


d2 = OrderedDict()

d2['b'] = 'B'
d2['a'] = 'A'

print d1 == d2

Dictionaries są równe? 
False


## namedtuple
Standardowa krotka używa indeksów numerycznych, aby uzyskać dostęp do jej elemntów, na przykład:

In [31]:
t = (12,13,14)

In [32]:
t[0]

12

W prostych przypadkach to zazwyczaj wystarcza. Z drugiej strony, pamiętanie, który indeks powinien być użyty dla każdej wartości, może prowadzić do błędów, szczególnie jeśli krotka ma wiele pól i jest skonstruowana z dala od miejsca, w którym jest używana. **Namedtuple** przypisuje imiona, a także indeks numeryczny do każdego elementu.

Każdy rodzaj nazwanego pakietu jest reprezentowany przez jego własną klasę, utworzoną przy użyciu funkcji fabryki namedtuple(). Argumenty są nazwą nowej klasy i ciągiem zawierającym nazwy elementów.

Zasadniczo można myśleć o namedtuples jako o bardzo szybkim sposobie tworzenia nowego typu obiektu/klasy z kilkoma polami atrybutów.

Na przykład:

In [33]:
from collections import namedtuple

In [34]:
Dog = namedtuple('Dog','age breed name')

sam = Dog(age=2,breed='Lab',name='Sammy')

frank = Dog(age=2,breed='Shepard',name="Frankie")

Skonstuowaliśmy namedtuple, najpierw przekazując nazwę typu obiektu (Dog), a następnie przekazując ciąg znaków z różnymi polami jako ciąg z odstępami między nazwami pól. Możemy wtedy wywołać różne atrybuty:

In [35]:
sam

Dog(age=2, breed='Lab', name='Sammy')

In [36]:
sam.age

2

In [37]:
sam.breed

'Lab'

In [38]:
sam[0]

2

## Podsumowanie
Mam nadzieję, że teraz przekonaliście się, jak niesamowicie przydatny jest moduł collections w Pythonie i powinien to być wasz moduł do wielu typowych zadań!