# 1.1 Tipovi podataka u Pythonu

U Pythonu postoji nekoliko osnovnih tipova podataka. Iako ih ne moramo navoditi kad definiramo varijablu, svejedno je bitno znati nešto o njima.

Ugrađeni tipovi podataka u Pythonu su:

- tekstualni tip - `str`
- brojčani tipovi - `int`, `float`, `complex`
- nizovni tipovi - `list`, `tuple`, `range`
- mapirajući tip - `dict`
- skupovni tipovi - `set`, `frozenset`
- boolean tip - `bool`
- binarni tipovi - `bytes`, `bytearray`, `memoryview`

U ovom poglavlju proći ćemo kroz tekstualni tip, brojčane tipove i boolean, a zatim i kroz nizovne tipove, mapirajući tip i skupovni tip `set`.

### Tekstualni tip

Tekstualni tip su tzv. stringovi, odnosno nizovi znakova. Definiramo ih unutar navodnika ili apostrofa.

In [99]:
my_str_1 = "Pozdrav!"
my_str_2 = 'Zivjeli!'
print(my_str_1)
print(my_str_2)

Pozdrav!
Zivjeli!


Prilikom čitanja podataka sa standardnog ulaza naredbom `input()`, čitamo tip podataka `str`. Korištenjem ugrađene funkcije `type()` možemo provjeriti tip nekog podatka.

In [100]:
my_input_str = input()

ABCDE


In [101]:
my_input_num = input()

1620


In [102]:
print(type(my_input_str))
print(type(my_input_num))

<class 'str'>
<class 'str'>


Vidimo da je, iako smo upisali broj, njegov tip svejedno `str`. Pokušamo li podijeliti `my_input_num` s $2$, dobit ćemo grešku:

In [103]:
print(my_input_num / 2)

TypeError: unsupported operand type(s) for /: 'str' and 'int'

Neke od operacija nad stringovima koje ćete često koristiti su:

- provjera duljine stringa (`int`)
- `lower()` i `upper()` - malo i veliko slovo
- `ord()`- vraća ascii vrijednost znaka (`int`)
- `chr()` - vraća znak za zadanu ascii vrijednost
- usporedba leksikografskog poretka stringova
- pristup pojedinim znakovima 
- traženje podnizova
- `split()` podjela stringa na listu manjih stringova (`list`)
- povezivanje više stringova u jedan

Također, bitno je i znati za tzv. *escape* znakove, poput:

- prelaska u novi red - `\n`
- tabulatora - `\t`
- apostrofa - `\'`
- *backslash* - `\\`

Ako želimo koristiti neki drugi tip podataka kao string, moramo ga pretvoriti u string funkcijom `str()`.

In [104]:
my_test_str_1 = 'Dobro jutro'
my_test_str_2 = 'Laku noc'

print("len:", len(my_test_str_1))
print("lower:", my_test_str_1.lower())
print("upper:", my_test_str_1.upper())

print("ord:", ord('a'))
print("chr:", chr(97)) # 97 je 'a', 98 je 'b' itd.

print("leks. usporedba:", my_test_str_1 < my_test_str_2)
print("jedn. usporedba:", my_test_str_1 == my_test_str_2)

print("pristup znaku:", my_test_str_1[0])
print("pristup podnizu:", my_test_str_2[5:8]) # znak 8 nije ukljucen

print("podjela po razmacima:", my_test_str_1.split())
print("povezivanje vise stringova:", my_test_str_1 + " i " + my_test_str_2)

len: 11
lower: dobro jutro
upper: DOBRO JUTRO
ord: 97
chr: a
leks. usporedba: True
jedn. usporedba: False
pristup znaku: D
pristup podnizu: noc
podjela po razmacima: ['Dobro', 'jutro']
povezivanje vise stringova: Dobro jutro i Laku noc


*Nota bene*: Nema smisla učiti sve ove stvari napamet, ali je bitno znati koje stvari postoje. Ako koristite neki "pametniji" uređivač teksta koji nudi *autocomplete* programskog koda, npr. Visual Studio Code ili PyCharm, on će vam puno olakšati i ubrzati posao.

### Brojčani tipovi

Brojčani tipovi u Pythonu su `int` - cijeli brojevi, `float` - brojevi s točkom i `complex` - [kompleksni brojevi](https://hr.wikipedia.org/wiki/Kompleksni_broj). U ovom poglavlju obradit ćemo `int` i `float`, a `complex` ćemo ostaviti za neki drugi put.

U sljedećem isječku koda možete vidjeti neke osnovne operacije s brojčanim tipovima.

In [105]:
x = 7
y = 3.14

print("x:", x)
print("y:", y)

print("")
print("tip varijable x:", type(x))
print("tip varijable y:", type(y))

print("")
print("zbrajanje:", x + y)
print("mnozenje:", x * y)
print("dijeljenje:", x / 3)
print("cjelobrojno dijeljenje:", x // 3)
print("ostatak pri cj. dijeljenju:", x % 3)
print("potenciranje:", x ** y)
print("usporedba:", x < y)

print("")
print("pretvorba iz float u int:", int(y))
print("pretvorba iz int u float:", float(x))


x: 7
y: 3.14

tip varijable x: <class 'int'>
tip varijable y: <class 'float'>

zbrajanje: 10.14
mnozenje: 21.98
dijeljenje: 2.3333333333333335
cjelobrojno dijeljenje: 2
ostatak pri cj. dijeljenju: 1
potenciranje: 450.4098148671133
usporedba: False

pretvorba iz float u int: 3
pretvorba iz int u float: 7.0


Primijetite da dijeljenje nije baš skroz točno - računala imaju problema sa zapisom nekih brojeva, slično kao i ljudi, npr. mi ne možemo zapisati broj $\frac{1}{3}$ s konačnim brojem dekadskih znamenki, a računalo u memoriji ne može dosta brojeva napisati s konačnim brojem binarnih znamenki. Više o tome možete pročitati [ovdje](https://www.geeksforgeeks.org/floating-point-error-in-python/).

### Boolean tip

Sljedeći tip koji ćemo proučiti je `bool` tip. Varijable tog tipa mogu poprimiti dvije vrijednosti - `True` ili `False`, a koriste se kako bismo upravljali tokom programa (npr. u `if` izrazima. Operatori uspoređivanja (npr. `<`, `>=`, `==`) rezultiraju boolean vrijednošću, neke funkcije vraćaju boolean vrijednost, a možemo i *castati* bilo koji drugi tip u boolean, iako često nije dobro to raditi.


In [106]:
my_bool = True
print(type(my_bool))

print("")
print("operator ili:", True or False)
print("operator i:", True and False)
print("operator ne:", not True)

print("")
print("usporedivanje:", 2 < 3)
print("provjera jednakosti:", 'a' == 'b')

print("")
print("pretvaranje cijelih brojeva u bool:")
print(bool(2))
print(bool(-1))
print(bool(0))

print("")
print("pretvaranje stringova u bool:")
print(bool('aaa'))
print(bool(''))

print("")
print("pretvaranje boola u brojeve:")
print(float(True))
print(int(False))

<class 'bool'>

operator ili: True
operator i: False
operator ne: False

usporedivanje: True
provjera jednakosti: False

pretvaranje cijelih brojeva u bool:
True
True
False

pretvaranje stringova u bool:
True
False

pretvaranje boola u brojeve:
1.0
0


### Nizovni tipovi

#### Lista

Prvi nizovni tip o kojem ćemo pričati je `list`. Radi se o nizu podataka od kojih svaki ima svoj redni broj. Tipovi podataka elemenata niza ne moraju biti jednaki (iako će najčešće biti), a sami podaci se mogu ponavljati unutar liste. Definiramo ih kao podatke odvojene zarezima unutar uglatih zagrada, a pristup podacima, podnizovima, broju elemenata liste radi se slično kao i kod stringova.

In [107]:
my_list = [1, 1, 2, 3, 6, 'evo i string', False]

print(my_list[3])
print(my_list[2:6])
print(len(my_list))

3
[2, 3, 6, 'evo i string']
7


Možemo mijenjati elemente liste na razne načine:

In [108]:
my_list[4] = 5
my_list[5:7] = [13, 21]

my_list.append(34)
my_list.extend([55, 89])
my_list.insert(5, 8) # Prvi parametar je pozicija, drugi je vrijednost
print(my_list)

[1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89]


Kroz elemente iteriramo običnom for petljom:

In [109]:
for elem in my_list:
    print(elem, end=" ")

1 1 2 3 5 8 13 21 34 55 89 

Provjeru nalazi li se ili ne neki broj u listi možemo napraviti operatorima `in` ili `not in` koji vraćaju boolean vrijednost:

In [110]:
if 55 in my_list:
    print("55 se nalazi u listi!")
    
if 65 not in my_list:
    print("65 se ne nalazi u listi!")

55 se nalazi u listi!
65 se ne nalazi u listi!


Elemente možemo ukloniti korištenjem funkcija `remove()`, `pop()` i `clear()`. `remove()` uklanja zadani element iz liste, `pop()` uklanja element na zadanom indeksu, ili posljednji element ako ne zadamo indeks, a `clear()` briše sve elemente iz liste.

In [111]:
my_list_fruit = ['jabuka', 'banana', 'naranca', 'sljiva', 'tresnja', 'visnja', 'marelica', 'breskva']

my_list_fruit.remove('banana') # brise bananu
print(my_list_fruit)

my_list_fruit.pop() # brise breskvu
my_list_fruit.pop(2) # brise sljivu

print(my_list_fruit)

my_list_fruit.clear() # brise sve sto je ostalo

print(my_list_fruit)

['jabuka', 'naranca', 'sljiva', 'tresnja', 'visnja', 'marelica', 'breskva']
['jabuka', 'naranca', 'tresnja', 'visnja', 'marelica']
[]


Recimo da želimo napraviti novu listu, koja sadrži kvadrate svih parnih brojeva iz liste `my_list`. To možemo napraviti na sljedeći način:

In [112]:
even_nums_squared_1 = [] # prazna lista

for elem in my_list:
    if elem % 2 == 0: # ako je paran, odnosno nema ostatka pri dijeljenju s 2
        even_nums_squared_1.append(elem * elem) # dodaj kvadrat tog broja u listu
        
print(even_nums_squared_1)

[4, 64, 1156]


Ovaj način je OK, međutim, postoji i jednostavniji način, a to je korištenjem tzv. *list comprehensiona*:

In [113]:
even_nums_squared_2 = [elem * elem for elem in my_list if elem % 2 == 0]

print(even_nums_squared_2)

[4, 64, 1156]


#### Tuple

Sljedeći tip o kojem ćemo pričati je `tuple`. Tuple je sličan listi po tome što svaki element ima redni broj, može sadržavati duplikate, može sadržavati elemente različitih tipova, ali se razlikuje po tome što se njegove vrijednosti ne mogu mijenjati. Definira se kao popis vrijednosti odvojenih zarezom unutar oblih zagrada, a ostale operacije su slične kao kod lista. U sljedećem isječku koda pokazane su osnovne operacije s tim tipom.

In [114]:
# Recimo da spremamo vrijednosti ime, prezime, godine, polozio/nije polozio predmet Natjecateljsko programiranje
my_tuple = ('Ivan', 'Vlahov', 22, True)

print(my_tuple[0])
print(my_tuple[1:3])

Ivan
('Vlahov', 22)


Kao što smo rekli, vrijednosti se ne mogu mijenjati:

In [115]:
my_tuple[0] = 'Ante'

TypeError: 'tuple' object does not support item assignment

Kroz elemente možemo iterirati kao i kod lista:

In [116]:
for elem in my_tuple:
    print(elem)

Ivan
Vlahov
22
True


S tupleom možemo koristiti tzv. *unpacking* kako bismo njegove vrijednosti spremili u više varijabli:

In [117]:
ime, prezime, godine, polozio = my_tuple

print(ime, "ima", godine, "godine i", "polozio je" if polozio else "nije polozio", "Natjecateljsko programiranje")

Ivan ima 22 godine i polozio je Natjecateljsko programiranje


#### Range

Range koristimo kad želimo napraviti nekakav aritmetički niz te iterirati po njemu. Npr. ako želimo ispisati brojeve od $0$ do $10$, to možemo napraviti sljedećim kodom:

In [118]:
for num in range(11):
    print(num, end=" ")

0 1 2 3 4 5 6 7 8 9 10 

Primijetite da smo za gornju granicu postavili $11$ - range ne uključuje gornju granicu.
Možemo odrediti i donju granicu:

In [119]:
for num in range(3, 10):
    print(num, end=" ")

3 4 5 6 7 8 9 

Još jedan parametar koji možemo dati rangeu jest korak, odnosno razliku između dvije vrijednosti koje idu jedna za drugom:

In [120]:
for num in range(2, 20, 2):
    print(num, end=" ")

2 4 6 8 10 12 14 16 18 

Pomoću tipa `range` možemo kreirati liste i druge tipove koji spremaju više elemenata:

In [121]:
my_range_list = list(range(10))
print(my_range_list)

my_range_tuple = tuple(range(10))
print(my_range_tuple)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
(0, 1, 2, 3, 4, 5, 6, 7, 8, 9)


U kombinaciji s *list comprehensionom*, možemo koristiti range za generiranje svakakvih lista:

In [122]:
my_2d_list = [[x*5+y for y in range(5)] for x in range(5)]
print(my_2d_list)

my_square_list = [x**2 for x in range(15)]
print(my_square_list)

[[0, 1, 2, 3, 4], [5, 6, 7, 8, 9], [10, 11, 12, 13, 14], [15, 16, 17, 18, 19], [20, 21, 22, 23, 24]]
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81, 100, 121, 144, 169, 196]


### Mapirajući tip

#### Dictionary

Tip `dict` je struktura u koju možemo spremati parove ključ-vrijednost. Ključevi su znakovni nizovi, a vrijednosti mogu biti bilo kojeg tipa. Elementima pristupamo imenovanjem ključa unutar uglatih zagrada, ili funkcijom `get()`. Podatke unutar dictionaryja možemo mijenjati, dodavati i brisati.

In [123]:
my_dict = {
    "ime": "Ivan",
    "prezime": "Vlahov",
    "godine": 22,
    "polozio": True
}

print(my_dict["ime"])
print(my_dict.get("prezime"))

my_dict["ime"] = "Pero" # mijenjanje
my_dict["ocjena"] = 5 # dodavanje

print(my_dict)

my_dict_new = {
    "prezime": "Peric",
    "godine": 23,
    "polozio": False,
    "ocjena": 1,
    "godina": 2022
}

my_dict.update(my_dict_new) # mijenjanje i dodavanje

print(my_dict)

my_dict.pop("godina") # brisanje kljuca

print(my_dict)

my_dict.clear() # brisanje svih kljuceva

print(my_dict)

Ivan
Vlahov
{'ime': 'Pero', 'prezime': 'Vlahov', 'godine': 22, 'polozio': True, 'ocjena': 5}
{'ime': 'Pero', 'prezime': 'Peric', 'godine': 23, 'polozio': False, 'ocjena': 1, 'godina': 2022}
{'ime': 'Pero', 'prezime': 'Peric', 'godine': 23, 'polozio': False, 'ocjena': 1}
{}


Iteriranje kroz dictionary se može raditi na više načina:

In [124]:
my_dict_2 = {
    "ime": "Pero",
    "prezime": "Peric",
    "visina": 185,
    "masa": 80,
    "boja_kose": "smeda",
    "boja_ociju": "smeda"
}


# Iteriranje kroz kljuceve
for elem in my_dict_2:
    print(elem, end=" ")
    
print("")

# Iteriranje kroz vrijednosti
for elem in my_dict_2.values():
    print(elem, end=" ")
    
print("")

# Iteriranje kroz parove kljuc-vrijednost
for key, value in my_dict_2.items():
    print(key, "->", value, end=", ")

ime prezime visina masa boja_kose boja_ociju 
Pero Peric 185 80 smeda smeda 
ime -> Pero, prezime -> Peric, visina -> 185, masa -> 80, boja_kose -> smeda, boja_ociju -> smeda, 

### Skupovni tip

#### Set

Set je tip podataka u kojem elementi nemaju redni broj, a duplikati nisu dozvoljeni. Iako se možda na prvu ovo čini beskorisnim, `set` omogućava puno bržu provjeru nalazi li se neki element u njemu nego lista. Više o tome što "puno brža provjera" znači ćemo pričati u dijelu o asimptotskoj složenosti algoritama i veliko O notaciji. Definira se popisom vrijednosti odvojenih zarezom unutar vitičastih zagrada, a kroz elemente se iterira kao i kod liste. Zbog toga što elementi nemaju redni broj, ne možemo biti sigurni u poredak prilikom iteriranja, pa nemojte računati na neki specifičan poredak (npr. da su elementi sortirani uzlazno, kao u donjim primjerima).

In [125]:
my_set = {1, 3, 3, 4, 5, 6, 6, 2, 8, 7}

print(my_set)

for elem in my_set:
    print(elem, end=" ")

{1, 2, 3, 4, 5, 6, 7, 8}
1 2 3 4 5 6 7 8 

Elemente možemo dodati korištenjem funkcija `add()` i `update()`:

In [126]:
my_set.add(17)
my_set.update([19, 21, 23])
print(my_set)

{1, 2, 3, 4, 5, 6, 7, 8, 17, 19, 21, 23}


Elemente možemo uklanjati korištenjem funkcija `remove()`, `discard()` i `clear()`. Ako funkcijom `remove()` pokušamo ukloniti neki element koji nije u setu, dobit ćemo grešku, a ako isto pokušamo funkcijom `discard()`, nećemo dobiti grešku.

In [127]:
my_set.remove(17)
# my_set.remove(25) - ovo ce izazvati grešku
my_set.discard(19)
my_set.discard(25) # ovo nece

print(my_set)

my_set.clear()

print(my_set) # prazan set

{1, 2, 3, 4, 5, 6, 7, 8, 21, 23}
set()


Kako bismo pokazali razliku provjere nalazi li se neki element u listi i u setu, napravit ćemo listu i set sa $10000$ elemenata, te ćemo $10000$ puta provjeriti nalazi li se neki element u listi, pa u setu, i izmjeriti vrijeme potrebno za te operacije.

In [128]:
import time

# Provjera vremena za listu
comparison_list = list(range(10000))
cnt = 0

start = time.time()
for i in range(10000):
    if i in comparison_list:
        cnt += 1
end = time.time()

print("Vrijeme za listu:", end - start)

# Provjera vremena za set
comparison_set = set(range(10000))
cnt = 0

start = time.time()
for i in range(10000):
    if i in comparison_set:
        cnt += 1
end = time.time()

print("Vrijeme za set:", end - start)

Vrijeme za listu: 0.6822857856750488
Vrijeme za set: 0.0017285346984863281


Vidimo da je set za ovaj primjer nekoliko stotina puta brži.