# Jupyter Notebook IDE

## Struktura Jupyter Notebook datoteke

Osnovna jedinica za unos koda ili teksta u Jupyter Notebook je ćelija. Ovisno o sadržaju, ćelije mogu imati nekoliko tipova, nama su **najvažnija dva**:
1. *Code cell* (ćelija za unos koda)
2. *Markdown Cell* (ćelija za unos teksta, fotografija, videa...)

In [1]:
# Ovo je CODE CELL u Jupyter Notebooku. To je ćelija u kojoj pišemo kod
# Tekst iznad ćelije je MARKDOWN CELL, prostor u kojem pišemo tekst

print('Pozdrav iz Jupyter Notebooka') # Kombinacija tipki SHIFT + ENTER pokreće kod u ćeliji

Pozdrav iz Jupyter Notebooka


**NAPOMENA** Za razliku od klasičnih IDE-ova, u Jupyter Notebooku kod se izvršava ćeliju po ćeliju. To znači da ćemo izvršiti kod samo onih ćelija koje smo pokrenuli.

## Stanja u kojima se nalaze ćelije

U Jupyter Notebooku uvijek je **samo jedna** ćelija aktivna. Svaka ćelija može biti u dva stanja, ovisno o tome što želimo sa sadržajem ćelije. Ako želimo mijenjati sadržaj, onda ćelija mora biti u **EDIT MODE** (zelena boja) stanju, a ako želimo pokretati sadržaj ili mijenjati tip sadržaja (kod ili tekst) onda ćelija treba biti u **COMMAND MODE** (plava boja) stanju.

## Prečaci na tipkovnici

**NAPOMENA - prečac na tipkovnici ovisi o stanju u kojem je ćelija.** Promjenu stanja ćelije na kojoj trenutno radimo, možemo napraviti pomoću tipke **ESC** koja prebacuje ćeliju u **COMMAND MODE**, a ako želimo ćeliju prebaciti u **EDIT MODE**, tada pritisnemo tipku **ENTER**

### Pokretanje ili aktiviranje sadržaja ćelije

Svaku ćeliju možemo pokrenuti tako da kliknemo na gumb run ili na jednostavniji način: kombinacijom tipki **SHIFT + ENTER**. Ova kombinacija vrijedi za oba stanja ćelije. 

### Promjena tipa sadržaja - **CODE CELL <-> MARKDOWN CELL**

Za prebacivanje ćelije u CODE CELL u kojem možemo pisati programski kod pritisnemo tipku **Y**, a ako pritisnemo **M**, prebacit ćemo ćeliju u MARKDOWN CELL

### Drugi korisni prečaci

**Ćelija mora biti u COMMAND MODE-u**:
- A - ubaci novu ćeliju iznad (above)
- B - ubaci novu ćeliju ispod (below)
- 2 x D - izbriši aktivnu ćeliju
- X - izreži aktivnu ćeliju
- V - zalijepi ćeliju ispod aktivne ćelije
- Z - poništi zadnji korak/aktivnost
- S - pohrani izmjene na dokumentu

### Format zapisa (ekstenzija datoteke) Jupyter Notebook datoteke
- osnovni format Jupyter Notebook datoteke je **.ipynb**

### Tab
Jupyter Notebook kao i ostali IDE alati intenzivno koristi tipku TAB za automatsko popunjavanje naziva. Sljede neki primjeri kako koristiti TAB:
- nakon što upišemo točku nakon naziva varijable, pomoću TAB-a ćemo dobiti listu dostupnih metoda za tu varijablu ili objekt
- nakon otvorene zagrade u funkciji / metodi, TAB prikazuje listu argumenata
- kada prikazuje klase i svojstva nekog modula, jednako kao i za varijable / objekte, nakon unosa naziva modula upišemo točku i pomoću TAB tipke dobijemo listu svojstava i klasa u modulu 
- kada dopunjava putanju do datoteke tako što na kraju mape, pomoću tipke TAB, dobijete popis datoteka, možete početi i pisati naziv datoteke pa pomoću TAB tipke dobijete listu svih datoteka koje počinju tim slovom

### Znak "?"

Znak "?" možete korisiti nakon naziva varijable, metode, ali i za pretraživanje metoda i klasa unutar nekog modula.

Ako koristite dvostruki znak "?", dobit ćete i prikaz koda metode.

In [7]:
lista = [1, 2, 3]
lista?

In [8]:
import datetime
datetime.*at*?

In [9]:
datetime.date??

### Magic Commands

Jupyter Notebook koristi Magic Commands pomoću kojih imamo mogućnost interakcije s datotekama i operacijskim sustavom na računalu na kojem se pokreće Juypter Notebook skripta. Magic naredbe nisu dio Pythona i specifične su zato jer počinju sa znakom za postotak "%" pa slijedi naziv naredbe:
- %run naziv_skripe.py - pokreće Python skripte unutar Jupyter notebooka datoteke
- %pwd - vraća putanju mape u kojoj se trenutno izvršava kod
- %timeit python_naredba - mjeri vrijeme izvršavanja neke python naredbe


In [13]:
trenutna_lokacija = %pwd
print(trenutna_lokacija)

C:\Users\fskendrovic\Desktop\Uvod_u_podatkovnu_znanost


In [15]:
# Detaljna dokumentacija o magic naredbama
%magic

In [16]:
# Kratke informacije o Magic naredbama
%quickref

# Python ponavljanje

## Python osnove

### Računanje u Pythonu
**PITANJE**
**Kojim će se redoslijedom izvršavati matematički izraz prikazan dolje?**

In [17]:
5 * (8 - 4) / 2

10.0

**POJAŠNJENJE** Python slijedi pravila kao u matematici pa zagrade imaju prednost

#### Varijable

In [18]:
varijabla = 5
print(varijabla, type(varijabla))

varijabla = 'Tekstualni tip'
print(varijabla, type(varijabla))

5 <class 'int'>
Tekstualni tip <class 'str'>


In [19]:
varijabla += 5

TypeError: can only concatenate str (not "int") to str

**Python kreira reference na varijablu**

In [20]:
a = [1, 2, 3]
b = a

In [21]:
a.append(4)

In [22]:
print(b)

[1, 2, 3, 4]


In [23]:
# Probajmo iskoristiti slice
b = a[::]
a.append(5)

print(f'Lista a: {a}')
print(f'Lista b: {b}')

Lista a: [1, 2, 3, 4, 5]
Lista b: [1, 2, 3, 4]


Slice **kreira** novu listu koju smo pohranili u **zasebnu** varijablu "b". Sada promjene na jednoj varijabli **neće** biti propagirane na drugu jer više nisu reference na istu memorijsku lokaciju.

#### Print() funkcija
Funkcija koja služi za ispis podataka u konzolu. Funkcija kao argument prima jednu ili više tekstualnih varijablu

Najčešće korišteni dodatni argumenti:
- end='\n' - argument koji definira koji znak dolazi na kraju izvršavanje funkcije print()
- sep='' - argument koji definira separator između tekstualnih varijabli

In [25]:
a = 5
print(f'Varijabla a ima vrijednost {a}')

Varijabla a ima vrijednost 5


In [28]:
print('tekst', 'tekst', 'tekst', sep = ' proba ')

tekst proba tekst proba tekst


#### Input() funkcija
Služi za unos podataka s konzole, odnosno tastature u aplikaciju

In [29]:
varijabla_1 = input('Upisite vrijednost varijable 1:\t')
varijabla_2 = input('Upisite vrijednost varijable 2:\t')
varijabla_3 = input('Upisite vrijednost varijable 3:\t')

print(varijabla_1)
print(varijabla_2 - varijabla_3)

Upisite vrijednost varijable 1:	5
Upisite vrijednost varijable 2:	10
Upisite vrijednost varijable 3:	4
5


TypeError: unsupported operand type(s) for -: 'str' and 'str'

Upravo zbog činjenice da input() funkcija **UVIJEK** vraća string, kreirane su funkcije za konverziju podataka između različitih tipova.

Neke od funkcija za konverziju:
- int() - pretvara u dekadski broj
- float() - pretvara u decimalni broj
- ord() - pretvara u ASCII kod
- hex() - pretvara u heksadekadski broj
- set() - pretvara dobiveni podatak u set (lista koja ima **JEDINSTVENE ČLANOVE**, nema duplikata)
- list() - pretvara dobiveni podatak u listu
- dict() - pretvara podatak u rječnik

In [33]:
a = [1, 1, 2, 2, 3, 3]

print(set(a))

{1, 2, 3}


**VJEŽBA 1**
Napravite zaseban primjer za svaku od navedenih funkcija za konverziju. Za svaku konverziju kreirajte novi podatak.

Osmislite aplikaciju u kojoj ćete iskoristiti sve gore navedene funkcije za konverziju.

#### Kolekcije podataka - List, Dict, Tuple, Set

- List
- Dictionary - kolekcija podataka koju čine ključ i vrijednost pohranjena pod tim ključem
- Tuple - kolekcija podataka slična List kolekciji, ALI nije moguće dodavati ili brisati članove
- Set - kolekcija podataka slična List kolekciji u kojoj su svi podaci jedinstveni

##### List

List je varijabilna, promjenjiva kolekcija podataka

In [38]:
dnevne_temperature = [20.2, 21.5, 23.4, 25.6, 21.3]
dnevne_temperature

[20.2, 21.5, 23.4, 25.6, 21.3]

Dekompozicija liste (kolekcije podataka) ili pridruživanje vrijednosti elemenata liste varijablama

In [41]:
lista = ['Filip', 'Skendrović', 'Samobor']
ime, prezime, grad = lista

print(f'Ime:\t\t{ime}')
print(f'Prezime:\t{prezime}')
print(f'Grad:\t\t{grad}')

Ime:		Filip
Prezime:	Skendrović
Grad:		Samobor


In [42]:
brojevi = range(10)
brojevi

range(0, 10)

In [43]:
brojevi = list(brojevi)
brojevi

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

##### Dodavanje i brisanje elemenata liste
- append() - dodaje element na kraj liste
- insert(index, element) - umeće element na poziciju navedenog indeksa
- extend(lista) - kao append() samo dodaje više elemenata odjednom

In [44]:
brojevi.append(12)
brojevi

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 12]

In [45]:
brojevi.insert(4, 'Novi element')
brojevi

[0, 1, 2, 3, 'Novi element', 4, 5, 6, 7, 8, 9, 12]

In [46]:
b2 = list(range(50, 55))
brojevi.extend(b2)
brojevi

[0, 1, 2, 3, 'Novi element', 4, 5, 6, 7, 8, 9, 12, 50, 51, 52, 53, 54]

In [47]:
brojevi.pop(4)
brojevi

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 12, 50, 51, 52, 53, 54]

In [48]:
brojevi.remove(12)
brojevi

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 50, 51, 52, 53, 54]

In [49]:
5 in brojevi

True

In [50]:
999 in brojevi

False

Slice liste

In [51]:
brojevi_b2 = brojevi[:-6:-1]
brojevi_b2

[54, 53, 52, 51, 50]

Sortiranje

In [52]:
sorted(dnevne_temperature)

[20.2, 21.3, 21.5, 23.4, 25.6]

In [53]:
dnevne_temperature

[20.2, 21.5, 23.4, 25.6, 21.3]

In [54]:
dnevne_temperature.sort()
dnevne_temperature

[20.2, 21.3, 21.5, 23.4, 25.6]

Reversed - suprotno od sorted()

**NAPOMENA: reversed() generira novu listu tako da ju je potrebno pohraniti u varijablu ili samo objekt pretvoriti metodom u listu**

In [55]:
reversed(dnevne_temperature)

<list_reverseiterator at 0x186a5b32c10>

In [56]:
list(reversed(dnevne_temperature))

[25.6, 23.4, 21.5, 21.3, 20.2]

In [57]:
dnevne_temperature = list(reversed(dnevne_temperature))
dnevne_temperature

[25.6, 23.4, 21.5, 21.3, 20.2]

In [58]:
dnevne_temperature.sort()
dnevne_temperature

[20.2, 21.3, 21.5, 23.4, 25.6]

#### Dict ili Dictionary ili Rječnik

Kolekcija podataka spceifična po tome što umjesto indeksa koristi par ključ / vrijednost.

In [59]:
senzori = {1: ['Senzor pokreta', 'Aktivan', 'Ulazna vrata'],
          2: ['Senzor pokreta', 'Neaktivan', 'Vrata na terasi'],
          3: ['Senzor plinova', 'Aktivan', 'Ulaz u garazu']}
senzori

{1: ['Senzor pokreta', 'Aktivan', 'Ulazna vrata'],
 2: ['Senzor pokreta', 'Neaktivan', 'Vrata na terasi'],
 3: ['Senzor plinova', 'Aktivan', 'Ulaz u garazu']}

Većina metoda koja vrijedi za liste, vrijedi i za rječnik.

Neke su ipak specifične:
- keys() - tuple s kolekcijom svih ključeva
- values() - tuple s kolecijom svih vrijednosti
- items() - tuple s kolekcijom svih ključeva i vrijednosti

In [60]:
senzori.keys()

dict_keys([1, 2, 3])

In [61]:
senzori.values()

dict_values([['Senzor pokreta', 'Aktivan', 'Ulazna vrata'], ['Senzor pokreta', 'Neaktivan', 'Vrata na terasi'], ['Senzor plinova', 'Aktivan', 'Ulaz u garazu']])

In [62]:
senzori.items()

dict_items([(1, ['Senzor pokreta', 'Aktivan', 'Ulazna vrata']), (2, ['Senzor pokreta', 'Neaktivan', 'Vrata na terasi']), (3, ['Senzor plinova', 'Aktivan', 'Ulaz u garazu'])])

In [65]:
print(f'Stanje senzora pod ključem 2 je: {senzori[2][1]}')

Stanje senzora pod ključem 2 je: Neaktivan


#### Tuple
Tuple ili n-terac kolekcija je podataka fiksne dužine, dakle **fiksnog broja elemenata**. To znači kako tuple nije moguće mijenjati.

Sve što smo koristili u vezi lista, možemo koristiti uz tuple, osim metoda koje dodaju, uklanjaju ili mijenjaju elemente.

Tuple je jako koristan kod učitavanja podataka iz baze podataka zato jer želimo imati kolekciju podataka kakvi se nalaze u bazi i želimo se osigurati da se to neće promijeniti.

In [67]:
dnevne_temperature = (20.2, 21.5, 23.4, 25.6, 21.3)
dnevne_temperature_zakljucano_prvih_tri = dnevne_temperature[:3]
dnevne_temperature_zakljucano_prvih_tri

(20.2, 21.5, 23.4)

**PITANJE**
**Možemo li izvršiti kod u donjoj ćeliji?**

In [68]:
nterac = ([1, 2, 3], 4)
nterac[0].append(4)

In [69]:
nterac

([1, 2, 3, 4], 4)

**ODGOVOR**
**Nismo mijenjali tuple, nego listu koja je element tuplea. Dakle, tuple kao kolekcija elemenata NIJE promjenjiva, ali ako je neki element tuplea promjenjiv, kao na primjer lista, onda tu listu možemo mijenjati.**

#### Set
Set je nesortirana kolekcija jedinstvenih podataka

In [70]:
lista = [2, 2, 3, 1, 5, 4, 5, 6]
lista

[2, 2, 3, 1, 5, 4, 5, 6]

In [71]:
set(lista)

{1, 2, 3, 4, 5, 6}

#### String
String je ustvari kolekcija znakova koju NE možemo mijenjati i koju jednostavno možemo pretvoriti u neku listu!

In [72]:
naslov = 'Lista dnevnih temperatura'
list(naslov)

['L',
 'i',
 's',
 't',
 'a',
 ' ',
 'd',
 'n',
 'e',
 'v',
 'n',
 'i',
 'h',
 ' ',
 't',
 'e',
 'm',
 'p',
 'e',
 'r',
 'a',
 't',
 'u',
 'r',
 'a']

In [73]:
set(naslov)

{' ', 'L', 'a', 'd', 'e', 'h', 'i', 'm', 'n', 'p', 'r', 's', 't', 'u', 'v'}

Ako je string kolekcija znakova, onda bismo trebali moći koristiti slice naredbu

In [74]:
naslov[:9]

'Lista dne'

Kako se tekstualni podaci najčešće pohranjuju kao string, onda je jako korisno poznavati mogućnosti toga kako se može formatirati prikaz tog teksta.

Posebni znakovi, koje nazivamo escape characters:
- \n - novi red
- \t - tab 
- \\" - dvostruki navodnici
- \\' - jednostruki navodnici
- \ - kosa crta (backslash)

In [76]:
print('Filip\'s cake')

Filip's cake


In [77]:
naslov = 'Lista\nDnevnih\nTemperatura'
print(naslov)

Lista
Dnevnih
Temperatura


Ako ispred navodnika unutar kojih upisujemo znakove koji čine string, napišemo slovo **r**, poništit ćemo svo formatiranje koje smo postigli uporabom escape znakova (r - od eng. raw (sirovo))

In [78]:
naslov = r'Lista\nDnevnih\nTemperatura'
print(naslov)

Lista\nDnevnih\nTemperatura


.format() metoda je dostupna nad str objektom i koristimo je kada želimo izravno, unutar rečenice, umetnuti vrijednosti varijabli. 

Osim toga, postoje još modifikatori koji služe za promjenu prikaza vrijednosti varijable:
- {0:.2f} - koristi se za formatiranje decimalnih brojeva, a broj decimalnih mjesta je definiran nakon točke (broj 2). Nula koja je prvi znak unutar vitičastih zagrada, označava indeks elementa unutar liste varijabli koje se prosljueđuju kao argument metode .format()
- {1:s} - formatiraj vrijednost varijable kao tekst
- {2:d} - formatiraj vrijednost varijable kao broj

In [79]:
predlozak_teksta = '{0:.2f} {1:s} vrijedi {2:d} EUR'
predlozak_teksta.format(7.5, 'kn (Hrvatska kuna)', 1)

'7.50 kn (Hrvatska kuna) vrijedi 1 EUR'

#### Boolean kao istina ili laž
Tip varijable boolean označava je li izraz True ili False. Koristi se kod uvjetnog grananja koda, ali i kod raznih provjera ima li neka varijable traženu vrijednost ili ne !

#### None kao podatak bez vrijednosti
None je Python oznaka toga da varijabla **NEMA vrijednost**


### Kontrola toka izvršavanja programa

if, for, while

**if...else**

In [81]:
temperatura = 22

if temperatura >= 25:
    print('Klima je uključena !')
else:
    print('Nema potrebe za uključivanjem klime !')

Nema potrebe za uključivanjem klime !


**if...elif...else**

In [87]:
temperatura = 25

if temperatura <= 18:
    print('Grijanje je uključeno')
    print(f'Trenutna temperatura je {temperatura}')
elif temperatura == 22:
    print('Grijanje je isključeno')
    print(f'Trenutna temperatura je {temperatura}')
elif temperatura >= 27:
    print('Klima je uključena')
    print(f'Trenutna temperatura je {temperatura}')
elif temperatura == 24:
    print('Hlađenje je isključeno')
    print(f'Trenutna temperatura je {temperatura}')
else:
    print(f'Trenutna temperatura je {temperatura}')

Trenutna temperatura je 25


**while**

In [89]:
vlaznost_tla = 25

while vlaznost_tla < 65:
    print(f'Vlaznost tla je {vlaznost_tla}%, što je manje od 65%- Ventil je OTVOREN')
    vlaznost_tla += 5

print(f'Vlaznost tla je {vlaznost_tla}%, što je više ili jednako od 65%- Ventil je ZATVOREN')

Vlaznost tla je 25%, što je manje od 65%- Ventil je OTVOREN
Vlaznost tla je 30%, što je manje od 65%- Ventil je OTVOREN
Vlaznost tla je 35%, što je manje od 65%- Ventil je OTVOREN
Vlaznost tla je 40%, što je manje od 65%- Ventil je OTVOREN
Vlaznost tla je 45%, što je manje od 65%- Ventil je OTVOREN
Vlaznost tla je 50%, što je manje od 65%- Ventil je OTVOREN
Vlaznost tla je 55%, što je manje od 65%- Ventil je OTVOREN
Vlaznost tla je 60%, što je manje od 65%- Ventil je OTVOREN
Vlaznost tla je 65%, što je više ili jednako od 65%- Ventil je ZATVOREN


**for**

In [91]:
senzori = {1: ['Senzor pokreta', 'Aktivan', 'Ulazna vrata'],
          2: ['Senzor pokreta', 'Neaktivan', 'Vrata na terasi'],
          3: ['Senzor plinova', 'Aktivan', 'Ulaz u garazu']}

for id_senzora, senzor in senzori.items():
    print(f'ID: {id_senzora}\tTip: {senzor[0]}\tStatus: {senzor[1]}\t\tLokacija: {senzor[2]}')

ID: 1	Tip: Senzor pokreta	Status: Aktivan		Lokacija: Ulazna vrata
ID: 2	Tip: Senzor pokreta	Status: Neaktivan		Lokacija: Vrata na terasi
ID: 3	Tip: Senzor plinova	Status: Aktivan		Lokacija: Ulaz u garazu


### Python način kraćeg pisanja koda

In [94]:
rijeci = ['Senzor pokreta', 'Aktivan', 'Ulazna vrata', 'k', 'rk']
rezultat = []

for rijec in rijeci:
    if len(rijec) > 2:
        rezultat.append(rijec.upper())

rezultat

['SENZOR POKRETA', 'AKTIVAN', 'ULAZNA VRATA']

**kraći način**

In [96]:
[x.upper() for x in rijeci if len(x) > 2]

['SENZOR POKRETA', 'AKTIVAN', 'ULAZNA VRATA']

Sve stavimo u uglate zagrade kako bismo kreirali listu. Zatim navedemo što želimo raditi. U našem slučaju: slova iz varijable X pretvori u velika slova. Varijablu x dobit ćete tako što ćete FOR petljom proći kroz listu RIJECI i jedan po jedan element dodijeliti varijabli x, ali samo ako zadovoljava uvjet da je dužina te riječi veća od 2!

**Konstrukcija DICT kolekcije**

dict_konstrukcija = {kljuc_naredba : vrijednost_naredba for vrijednost in kolekcija if uvjet}
kljuc_naredba -> predstavlja jednu liniju kao što smo imali u x.upper(), dakle predstavlja kako ćemo dobiti ključ. Isto se odnosi i na vrijednost

**Konstrukcija SET kolekcije**

set_construction = {naredba for vrijednost in kolekcija if uvjet}

In [99]:
stringovi = ['a', 'b', 'ab', 'bc', 'abc', 'def', 'ghj', 'qwertz', 'asdfg']

duzine_stringova = {len(x) for x in stringovi}
duzine_stringova

{1, 2, 3, 5, 6}

**ZADATAK**

Kreirajte program koji će prikazati:
- minimalnu dnevnu temp
- maksimalnu dnevnu temp
- prosječnu dnevnu temp
- broj mjerenja temp

### Python moduli

### Python integrirani moduli

Uz programski jezik Python, prilikom same instalacije isporučuju se moduli koji su potrebni za programiranje većine aplikacija. Ovi moduli se nazivaju **Python Standard Library** moduli. Neke od njih smo već koristili, a neke ćemo obraditi u ovom seminaru.

- **collections** - modul s dodatnim kolekcijama podataka, osim lista, nteraca, rječnika i setova
- **csv** - modul za procesiranje sadržaja CSV datoteka
- **datetime, time** - rad s vremenom i datumima kao tipovima podataka
- **decimal** - računanje s fiksnim i promjenjivim decimalnim mjestima, uključujući i monetarne izračune
- **json** - modul za procesiranje json datoteka (Javascript Object Notation)
- **math** - najčešće matematičke konstante i operacije vezane uz njih
- **os** - modul za interakciju s operacijskim sustavom računala
- **timeit** - modul za analizu performansi algoritma (cilj je da obrada podataka bude brza)
- **random** - generator nasumičnih brojeva
- **re** - modul za rad s "Regular expressions", odnosno za provjeru unesenih podataka na osnovu prethodno definiranih predložaka
- **sqlite3** - modul za rad s SQLite bazom podataka
- **statistics** - statističke matematičke funkcije kao prosjek, medijan, varijanca, mod
- **string** - obrada tekstualnih tipova podataka
- **sys** - prilikom pokretanja Python skripti u konzoli možemo proslijediti neke podatke koji će se iskoristiti kod pokretanja skripte