## Rečnici (dictionaries)

Među osnovnim Python strukturama podataka nalazi se i dictionary, to jest rečnik. Znamo šta su rečnici u svakodnevnom životu, pa po toj analogiji možete pretpostaviti kako oni izgledaju u Pythonu. Sastoje se od parova ključa (key) i vrednosti (value). 

### Kreiranje

In [1]:
emptyDict = {} #kreiranje praznog
emptyDict

{}

In [18]:
simpleDict = {
    'rice' : 'a cereal grass'
}
simpleDict # jednostavan sa jednim parom, value moze biti bilo koji drugi tip, npr string

{'rice': 'a cereal grass'}

In [6]:
goodInstructors = {
    'dimi' : True, # value moze biti bool
    'dekiSimic' : False
}
goodInstructors

{'dimi': True, 'dekiSimic': False}

In [8]:
cities = { # value moze biti niz
    'Serbia' : ['Belgrade', 'Novi Sad'],
    'China': ['Shanghai', 'Beijing'],
    'USA': ['New York', 'Los Angeles'],
    'Spain': ['Madrid', 'Barcelona']
}
cities

{'Serbia': ['Belgrade', 'Novi Sad'],
 'China': ['Shanghai', 'Beijing'],
 'USA': ['New York', 'Los Angeles'],
 'Spain': ['Madrid', 'Barcelona']}

In [11]:
cities['Serbia']

['Belgrade', 'Novi Sad']

In [13]:
data = [(1, 'one'), (2, 'two'), (3, 'three')] # kreiranje dicta na osnovu niza tuplesa
names = dict(data)
print(names)

{1: 'one', 2: 'two', 3: 'three'}


### Pristupanje

In [21]:
# u dictu vrednosti mogu biti karakteri
cipher = {'p': 'o', 'y': 'h', 't': 'n',
          'h': 't', 'o': 'y', 'n': 'p'} 
cipher['t'] # pristupamo vrednosti na osnovu kljuca

'n'

In [25]:
# dict karaktera mozemo koristiti kako bi ekriptovali, tj sifrovali neku poruku
# napravicemo funkciju koja bi to radila na osnovu cipher dicta
def encrypt(cipher, word):
    """encrypt word using cipher"""
    encrypted = ""
    for char in word:
        encrypted += cipher[char]
    return encrypted
encryptedWord = encrypt(cipher, 'python')
encryptedWord

'ohntyp'

In [28]:
# ako koristimo nepostojeci key -> KeyError
cipher[1]

KeyError: 1

In [32]:
# zato je bolje da ako nismo sigurni da li postoji key
# da to proverimo funkcijom get
cipher.get('t'), cipher.get('d')

('n', None)

### Ažuriranje

In [33]:
cipher

{'p': 'o', 'y': 'h', 't': 'n', 'h': 't', 'o': 'y', 'n': 'p'}

In [34]:
cipher['p'] = 'q'
cipher

{'p': 'q', 'y': 'h', 't': 'n', 'h': 't', 'o': 'y', 'n': 'p'}

In [39]:
cipher['r'] = 'z'
encryptedWord2 = encrypt(cipher, 'python')
encryptedWord, encryptedWord2

('ohntyp', 'qhntyp')

### Brisanje

In [40]:
del cipher['p']
cipher

{'y': 'h', 't': 'n', 'h': 't', 'o': 'y', 'n': 'p', 'r': 'z'}

Primetimo da rečnici liče na liste, međutim glavna razlika je što elementima liste možemo pristupiti samo preko indeksa, dok ovde pristupamo preko ključa.

### Problemi s kljucevima

Pricamo o dva tipa problema sa kljucevima koji se pojavljuju:
- nismo sigurni da li key postoji u recniku
- u ključevima su i babe i žabe

In [41]:
cities

{'Serbia': ['Belgrade', 'Novi Sad'],
 'China': ['Shanghai', 'Beijing'],
 'USA': ['New York', 'Los Angeles'],
 'Spain': ['Madrid', 'Barcelona']}

In [42]:
'Serbia' in cities

True

In [43]:
'Montenegro' in cities

False

In [45]:
# kako se zastiti od gresaka kada radimo sa kljucevima iz recnika?
keys = ['Serbia', 'China', 'Germany']
for key in keys:
    print(key, cities[key])

Serbia ['Belgrade', 'Novi Sad']
China ['Shanghai', 'Beijing']


KeyError: 'Germany'

In [47]:
for key in keys:
    if key in cities:
        print(key, cities[key])
    else:
        print("{} not in mapping".format(key))

Serbia ['Belgrade', 'Novi Sad']
China ['Shanghai', 'Beijing']
Germany not in mapping


Kada pravimo rečnike, preporučljivo je da keys budu svi istog tipa, međutim Python to ne forsira pa zato završiti sa mnogo različitih tipova u ključevima, to jest pomešati babe i žabe. To nije preporučljivo uraditi, ali ajmo da vidimo i zbog čega:

In [48]:
babeZabe = {4.0: 2, 'a': 3, True: 'true', False: 9}
babeZabe

{4.0: 2, 'a': 3, True: 'true', False: 9}

In [52]:
# Ajmo da dodamo sada novi par sa kljucem 1
babeZabe[1] = 7 
# nemamo kljuc 1, ali Python koristi jednakost da bi video da li postoji taj
# kljuc. True == 1, False == 0, tako da smo uspeli da pristupimo tim vrednostima
# i zamenimo ih umesto da dodamo novu
babeZabe

{4.0: 2, 'a': 3, True: 7, False: 9}

In [57]:
babeZabe[0] = 'false'
babeZabe

{4.0: 2, 'a': 3, True: 7, False: 'false'}

In [61]:
# ocu da napravim novi sa integerom, on mi updateuje doble
babeZabe[4] = 7
babeZabe

{4.0: 7, 'a': 3, True: 7, False: 'false', 4.3: 7}

In [63]:
babeZabe['A'] = 'abc' # string nije jednak nikakvom broju tako da dodaje nov
babeZabe

{4.0: 7, 'a': 3, True: 7, False: 'false', 4.3: 7, 'A': 'abc'}

Poenta: Nemojte da mesate tipove u kljucevima kako bi vas kod bio sigurniji i jasniji.

### Primer

Rečnici su jako moćan tip podataka. Omogućavaju nam da mapiramo ključ proizvodnom vrednošću. Glavno ograničenje je to da je ključ nepromenljiv. 

Implementirajmo jednostavnu listu konktakta koja mapira imena telefonskim brojevima.

In [64]:
contacts = {'Scott Rixner': '1-101-555-1234',
            'Joe Warren': '1-102-555-5678',
            'Jane Doe': '1-103-555-9012'}

Rečnici se sastoje od niza ključ-vrednost parova, ograđenog vitičastim zagradama ({}). Parovi su odvojeni zarezom.
Ajmo da napravimo funkciju koja vraća telefonski broj određenog korisnika na osnovu imena.

In [70]:
def lookup(contacts, name):
    if name in contacts:
        return contacts[name]
    else:
        return 'Non-existent contact'
lookup(contacts, 'Jane Doe'), lookup(contacts, 'JaneDoe')

('1-103-555-9012', 'Non-existent contact')

In [73]:
def lookup2(contacts, name):
    return contacts.get(name, 'Non-existent contact')
lookup2(contacts, 'Jane Doe'), lookup(contacts, 'JaneDoe')

('1-103-555-9012', 'Non-existent contact')

Napraviti funkcije koje ispisuju sve kontakte u formi:
- samo imena svih kontakta
- ceo kontakt u formi: "ime : broj"

In [75]:
def print_contacts(contacts):
    for name in contacts:
        print(name)
print_contacts(contacts)

Scott Rixner
Joe Warren
Jane Doe


In [76]:
def print_contact_list(contacts):
    for name, number in contacts.items():
        print(name, ":", number)
print_contact_list(contacts)

Scott Rixner : 1-101-555-1234
Joe Warren : 1-102-555-5678
Jane Doe : 1-103-555-9012


Python recnici nisu sortirani. Napraviti funkciju koja bi ih ispisala sortirane:

In [77]:
def print_ordered(contacts):
    keys = contacts.keys()
    names = sorted(keys)
    for name in names:
        print(name, ":", contacts[name])
print_ordered(contacts)

Jane Doe : 1-103-555-9012
Joe Warren : 1-102-555-5678
Scott Rixner : 1-101-555-1234


Funkcija keys vraca listu kljuceva, a funkcija sorted vraca sortiranu listu koja joj prosledjena.

Dodavanje i izmena kontakta su jako slicni, pogledajmo kako oni izgledaju odvojeno, a zatim i zajedno:

In [82]:
def add_contact(contacts, name, number):
    if name in contacts:
        print(name, "is already in contacts list!")
    else:
        contacts[name] = number
        
def update_contact(contacts, name, newnumber):
    if name in contacts:
        contacts[name] = newnumber
    else:
        print(name, "is not in contacts list!")
add_contact(contacts, 'Dimi', '062-222'), add_contact(contacts, 'Jane Doe', '062-222'), update_contact(contacts, 'DimiM', '062-222'), update_contact(contacts, 'Jane Doe', '062-222')
contacts

Dimi is already in contacts list!
Jane Doe is already in contacts list!
DimiM is not in contacts list!


{'Scott Rixner': '1-101-555-1234',
 'Joe Warren': '1-102-555-5678',
 'Jane Doe': '062-222',
 'Dimi': '062-222'}

In [84]:
# cesto je prakticnije da se ove dve metode spoje
def add_or_update_contact(contacts, name, number):
    contacts[name] = number
add_or_update_contact(contacts, 'DimiM', '062-222')
contacts

{'Scott Rixner': '1-101-555-1234',
 'Joe Warren': '1-102-555-5678',
 'Jane Doe': '062-222',
 'Dimi': '062-222',
 'DimiM': '062-222'}

### Rad sa greskama u recnicima

Za brz pristup parovima recnika, Python koristi hesiranje. Iz tog razloga, jako je bitno da kljucevi budu nepromenljivi (immutable).

Ako zelimo da u kljucu imamo vise vrednosti, mozda cemo pomisliti  da je okej da nam list bude kluc. Medjutim, kako smo naucili lista je promenljiva struktura:

In [89]:
bad_dict = {["Joe", "Warren"] : 1, ["Scott", "Rixner"] : 2, ["John", "Greiner"] : 3}
print(bad_dict)

TypeError: unhashable type: 'list'

U ovom slucaju je okej da koristimo tuples:

In [92]:
good_dict = {("Joe", "Warren") : 1, ("Scott", "Rixner") : 2, ("John", "Greiner") : 3}
good_dict

{('Joe', 'Warren'): 1, ('Scott', 'Rixner'): 2, ('John', 'Greiner'): 3}

In [93]:
good_dict[("Joe", "Warren")]

1

In [95]:
# pitanje implmentirati ovo
"""
    Given dictionary my_dict and key my_key, 
    return my_dict[my_key] if my_key is in my_dict
    otherwise return default_value
"""
def lookup(my_dict, my_key, default_value=None):
    
    if my_key in my_dict:
        return my_dict[my_key]
    else:
        return default_value
lookup(good_dict, ("Joe", "Warren"), "Non-existent"), lookup(good_dict, ("Dimitrije", "Milenkovic"), "Non-existent")

(1, 'Non-existent')

In [97]:
# pitanje: koja ugradjena funkcija se ovako ponasa
good_dict.get(("Joe", "Warren"), "Non-existent"), good_dict.get(("D", "M"), "Non-existent")

(1, 'Non-existent')

Zadaci:https://www.coursera.org/learn/python-analysis/supplement/wCkyw/practice-exercises-for-dictionaries