    Τμήμα Πληροφορικής και Τηλεπικοινωνιών - Άρτα 
    Πανεπιστήμιο Ιωαννίνων 

    Γκόγκος Χρήστος 
    http://chgogos.github.io/
    Εαρινό εξάμηνο 2020-2021

# Collections module

Πέρα από containers όπως τα list, tuple, dict και set, το module collections (πρωτοεμφανίστηκε στην Python 2.4) παρέχει τη δυνατότητα χρήσης επιπλέον δομών δεδομένων. Τέτοιες δομές είναι οι ακόλουθες:

* Counter
* ChainMap
* defaultdict
* deque
* namedtuple
* OrderedDict

## Counter

In [11]:
from collections import Counter

a_list = [4,1,3,4,5,7,8,3,2,4,5,7,8,4,4]
counts = Counter(a_list)
print(counts)
print(counts[4])
print(counts.most_common(2))
print(list(counts.elements()))

Counter({4: 5, 3: 2, 5: 2, 7: 2, 8: 2, 1: 1, 2: 1})
5
[(4, 5), (3, 2)]
[4, 4, 4, 4, 4, 1, 3, 3, 5, 5, 7, 7, 8, 8, 2]


## ChainMap

Συνδυάζει πολλά λεξικά σε μια δομή.


In [52]:
from collections import ChainMap

a_dict1 = {'a':1, 'b':1}
a_dict2 = {'c':1, 'd':1}
a_chain_map = ChainMap(a_dict1, a_dict2) # δημιουργία ενός ChainMap με δύο λεξικά
print(a_chain_map)
print('#'* 40)
print(list(a_chain_map.keys())) # τα κλειδιά από όλα τα λεξικά
print('#'* 40)
print(list(a_chain_map.values())) # οι τιμές από όλα τα λεξικά
print('#'* 40)
a_dict3 = {'e':1}
a_chain_map = a_chain_map.new_child(a_dict3) # προσθήκη ενός ακόμα λεξικού και δημιουργία νέου ChainMap
print(a_chain_map)
a_dict1['a'] = 100 # αλλαγές στα λεξικά που χρησιμοποιούνται στο ChainMap αντικατοπτρίζονται και στο ChainMap
print('#'* 40)
print(a_chain_map)

ChainMap({'a': 1, 'b': 1}, {'c': 1, 'd': 1})
########################################
['c', 'd', 'a', 'b']
########################################
[1, 1, 1, 1]
########################################
ChainMap({'e': 1}, {'a': 1, 'b': 1}, {'c': 1, 'd': 1})
########################################
ChainMap({'e': 1}, {'a': 100, 'b': 1}, {'c': 1, 'd': 1})


## defaultdict

Επιτρέπει την αποφυγή KeyError αν γίνεται προσπάθεια αναφοράς σε στοιχείο λεξικού με κλειδί που δεν υπάρχει στο λεξικό.

In [1]:
from collections import defaultdict

a_list = ['a', 'b', 'c', 'a']

# αντιμετώπιση πιθανού KeyError σε "απλό" λεξικό
a_dict = {}
for x in a_list:
    if x not in a_dict: # έτσι ώστε να αποφευχθεί KeyError
        a_dict[x] = 1  
    else:
        a_dict[x] += 1

print(a_dict)

print('#'* 40)

# a_ddict = defaultdict(lambda: 0)
a_ddict = defaultdict(int)
for x in a_list:
    a_ddict[x] += 1

print(a_ddict)

{'a': 2, 'b': 1, 'c': 1}
########################################
defaultdict(<class 'int'>, {'a': 2, 'b': 1, 'c': 1})


In [2]:
# ορισμός της προκαθορισμένης συμπεριφοράς με ειδική συνάρτηση

def default_value():
    return "Not found"

a_ddict = defaultdict(default_value)

a_ddict["Nikos"] = 22
a_ddict["Maria"] = 25

for x in ("Nikos", "Maria", "Petros"):
    print(f'Name:{x} Age:{a_ddict[x]}')

Name:Nikos Age:22
Name:Maria Age:25
Name:Petros Age:Not found


In [4]:
# ορισμός της προκαθορισμένης συμπεριφοράς με lambda

a_ddict = defaultdict(lambda: "NOT FOUND")

a_ddict["Nikos"] = 22
a_ddict["Maria"] = 25

for x in ("Nikos", "Maria", "Petros"):
    print(f'Name:{x} Age:{a_ddict[x]}')

Name:Nikos Age:22
Name:Maria Age:25
Name:Petros Age:NOT FOUND


## Deque

Ένα deque δημιουργείται περνώντας του μια λίστα ως παράμετρο. Στη συνέχεια μπορεί να χρησιμοποιηθεί για γρήγορες εισαγωγές και διαγραφές στοιχείων

In [42]:
# δημιουργία deque, προσθήκη στοιχείων στο τέλος ή στην αρχή του deque, αφαίρεση στοιχείων από το τέλος ή την αρχή του deque

from collections import deque

a_list = ["Nikos", "Maria"]
a_deque = deque(a_list)
print(a_deque)

print("#"*40)

a_deque.append("Kostas")
a_deque.appendleft("Petros")
print(a_deque)

print("#"*40)

a_deque.pop()
a_deque.popleft()
a_deque.popleft()
print(a_deque)


deque(['Nikos', 'Maria'])
########################################
deque(['Petros', 'Nikos', 'Maria', 'Kostas'])
########################################
deque(['Maria'])


In [43]:
# καταμέτρηση στοιχείου deque

a_deque = [1,1,1,2,2,1]
print(a_deque.count(1))

4


## namedtuple

Τα namedtuples αντιστοιχούν ένα όνομα με κάθε θέση ενός tuple, έτσι ώστε να μπορεί να γίνεται η αναφορά σε επιμέρους στοιχεία του tuple ευκολότερα (χωρίς τη χρήση αριθμητικών δεικτών)

In [60]:
from collections import namedtuple

Point = namedtuple('point', 'x,y,z,color')

p1 = Point(1,5,6, 'RED')
print(p1)
print(p1.x, p1.y, p1.z, p1.color)
p2 = p1._replace(color='BLUE') # δημιουγία νέου tuple με αλλαγή στο πεδίο color
print(p1.x, p1.y, p1.z, p2.color)

point(x=1, y=5, z=6, color='RED')
1 5 6 RED
1 5 6 BLUE


## OrderedDict

Τα OrderedDict εγγυώνται ότι η σειρά με την οποία θα διανύονται τα περιεχόμενα ενός λεξικού θα είναι η ίδια με την σειρά με την οποία τα ζεύγη (κλειδί, τιμή) έχουν εισαχθεί στο λεξικό.

In [61]:
from collections import OrderedDict

# από την έκδοση 3.7 της python και τα dictionaries της python είναι ordered (διατεταγμένα)
a_dict = {'a':7, 'c': 3, 'b':2 }
for k in a_dict:
    print(k, a_dict[k])

print('#'* 40)

an_odict = OrderedDict(a_dict)
for k in an_odict:
    print(k, an_odict[k])

print('#'* 40)

an_odict.move_to_end('a')
an_odict.move_to_end('b', last=False)
for k in an_odict:
    print(k, an_odict[k])

a 7
c 3
b 2
########################################
a 7
c 3
b 2
########################################
b 2
c 3
a 7
