# Fonis Datageeks
## Wokshop: Exploratory Data Analysis
### 2. Rečnici
Pripremio: [Dimitrije Milenković](https://www.linkedin.com/in/dimitrijemilenkovicdm/)
<br>dimitrijemilenkovic.dm@gmail.com
***

Iako je tema radionice EDA, pre toga imamo dva kratka tutorijala koje pokrivaju koncepte koje tematski pripadaju prvoj radionici ali na njoj nismo stigli da pričamo o tome.
***

Među osnovnim Python strukturama podataka nalazi se i dictionary, to jest rečnik. Znamo šta su rečnici u svakodnevnom životu, pa po toj analogiji možemo pretpostaviti kako oni izgledaju u Pythonu. 
<br>Rečnici su indeksirana i promenljiva struktura podataka koja nema redosled. Rečnik se sastoji od parova ključa i vrednosti (key-value pairs). 

### Kreiranje rečnika

In [1]:
prazan = {} 
prazan

{}

Iznad je prikazano kreiranje praznog rečnika u kom naknadno možemo da ubacujemo parove. Međutim možemo napuniti rečnik pri kreiranju:

In [2]:
recnik = {
    'rice' : 'a cereal grass'
}
recnik

{'rice': 'a cereal grass'}

Vrednosti u rečniku mogu biti bilo kog tipa.

In [3]:
good_instructors = {
    'dimi' : True, 
    'dekiSimic' : False
}
good_instructors

{'dimi': True, 'dekiSimic': False}

In [4]:
cities = { 
    'Serbia' : ['Belgrade', 'Novi Sad'], # value moze biti lista
    'China': ['Shanghai', 'Beijing'],
    'USA': ['New York', 'Los Angeles'],
    'Spain': ['Madrid', 'Barcelona']
}
cities

{'Serbia': ['Belgrade', 'Novi Sad'],
 'China': ['Shanghai', 'Beijing'],
 'USA': ['New York', 'Los Angeles'],
 'Spain': ['Madrid', 'Barcelona']}

Rečnik možemo kreirati i na osnovu prosleđenog niza tuplova kroišćenjem funkcije dist:

In [5]:
data = [(1, 'one'), (2, 'two'), (3, 'three')]
names = dict(data)
print(names)

{1: 'one', 2: 'two', 3: 'three'}


### Pristupanje elementima rečnika

Elementima rečnika pristupamo na intuitivan način: potrebno je u uglastim zagradama navesti ključ:

In [6]:
cities['Serbia']

['Belgrade', 'Novi Sad']

`Zadatak 1:` Dat je rečnik kodova: 

In [7]:
cipher = {'p': 'o', 'y': 'h', 't': 'n',
          'h': 't', 'o': 'y', 'n': 'p'} 

Cipher rečnik može se koristiti za šifrovanje (enkriptovanje poruka) tako što bi se svako slovo poruke prevodilo u novo slovo definisano vrednošću tog kluča. Napisati funkciju koja kao parametre prima ovaj rečnik i drugu reč koju je potrebno šifrovati (ekriptovati) i vraća ekriptovanu reč. 

In [8]:
def encrypt(cipher, word):
    ''' enkriptuje word koristeći cipher '''
    encrypted = ''
    for char in word:
        encrypted += cipher[char]
    return encrypted
encrypt(cipher, 'python')

'ohntyp'

Ako probamo da iskoristimo nepostojeći ključ dogodiće se KeyError:

In [9]:
cipher[1]

KeyError: 1

Tako da u slučajevima kada nismo sigurni da postoji ključ u rečniku, bolje je to proveriti funkcijom get:

In [10]:
cipher.get('t'), cipher.get('d')

('n', None)

### Ažuriranje rečnika

In [11]:
cipher

{'p': 'o', 'y': 'h', 't': 'n', 'h': 't', 'o': 'y', 'n': 'p'}

Pri ažuriranju rečnika, u slučaju da ključ postoji u rečniku mi ažuriramo njegovu vrednost, a u slučaju da ne postoji dodajemo novi key-value par:

In [12]:
cipher['p'] = 'q'
cipher['r'] = 'z'
cipher

{'p': 'q', 'y': 'h', 't': 'n', 'h': 't', 'o': 'y', 'n': 'p', 'r': 'z'}

In [13]:
encrypt(cipher, 'python')

'qhntyp'

### Brisanje parova iz rečnika

In [14]:
del cipher['p']
cipher

{'y': 'h', 't': 'n', 'h': 't', 'o': 'y', 'n': 'p', 'r': 'z'}

Primetimo da rečnici liče na liste, međutim glavna razlika je što elementima liste možemo pristupiti samo preko indeksa, dok ovde pristupamo preko ključa.

### Još par korisnih sitnica
Kada želimo proveriti da li ključ postoji u rečniku, koristimo in:

In [15]:
'Serbia' in cities

True

In [16]:
'Montenegro' in cities

False

`Zadatak 2.` Data je lista ključeva:

In [17]:
keys = ['Serbia', 'China', 'Germany']

Ispisati poruku u formatu:

In [18]:
for key in keys:
    print(key, cities[key]) # bacice gresku

Serbia ['Belgrade', 'Novi Sad']
China ['Shanghai', 'Beijing']


KeyError: 'Germany'

In [19]:
for key in keys:
    if key in cities:
        print(key, ':', cities[key])
    else:
        print('{}: ne postoji u ovom recniku'.format(key)) # C-like formatiranje stringa

Serbia : ['Belgrade', 'Novi Sad']
China : ['Shanghai', 'Beijing']
Germany: ne postoji u ovom recniku


Kada pravimo rečnike, preporučljivo je da svi ključevi budu svi istog tipa. Međutim u Pythonu nije greška ako nisu, pa tako je moguće završiti sa babama i žabama u ključevima. To nije preporučljivo raditi, ali 'ajmo da vidimo i zbog čega:

In [20]:
babeZabe = {4.0: 2, 'a': 3, True: 'true', False: 9}
babeZabe

{4.0: 2, 'a': 3, True: 'true', False: 9}

Probajmo sada da dodamo novi ključ 1:

In [21]:
babeZabe[1] = 7 
babeZabe

{4.0: 2, 'a': 3, True: 7, False: 9}

Python koristi jednakost da bi video da li postoji određeni ključ. Ranije smo radili da je True == 1, a False == 0, tako da smo uspeli da pristupimo tim vrednostima i zamenimo ih umesto da dodamo novu:

In [22]:
babeZabe[0] = 'false'
babeZabe

{4.0: 2, 'a': 3, True: 7, False: 'false'}

Iz istog razloga kada želim da dodam novi ključ integera 4, desiće se ažuriranje ključa double 4:

In [23]:
babeZabe[4] = 7
babeZabe

{4.0: 7, 'a': 3, True: 7, False: 'false'}

Jasna je **poenta**: Kako bi kod bio sigurniji i jasniji, ne treba mešati tipove u ključevima.