# Fonis Datageeks
## Wokshop: Intro to Python and Data Science
### 2. Ugrađene funkcije, metode i paketi
Pripremio: [Dimitrije Milenković](https://www.linkedin.com/in/dimitrijemilenkovicdm/)
<br>dimitrijemilenkovic.dm@gmail.com

Kao i u svakom drugom programskom jeziku, i u Pythonu postoje već napisane linije i linije koda koje nam olakšavaju rad i čine jezik moćnim. Mi taj kod ne moramo tumačiti, već možemo koristiti gotove funkcionalnosti kroz izložen interfejs. Ovaj deo radionice se bavi upravo tim interfejsom, koji predstavljaju funkcije i metode, organizovane u paketima. 

## Funkcije

Vec smo koristili funkcije, poput type(), str(), float(). Kao što je već rečeno iznad, **Funkcije** su delovi koda koji rešavaju određeni zadatak organizovani tako da ih lako možemo ponovo koristiti. Korisne su jer uvek kada naiđemo na isti zadatak, možemo pozvati funkciju umesto da pišemo isti kod.
<br>Interfejs funkcija, to jest njihov poziv, izgleda ovako:
<br>**output = function_name(input)**
<br>![function](img/function.jpg)

In [1]:
areas = [12.5, 34.7, 23.5, 16]
print(areas)

[12.5, 34.7, 23.5, 16]


In [2]:
min(areas)

12.5

In [3]:
max(areas)

34.7

In [4]:
largest = max(areas)
largest

34.7

U ovom primeru, input funkcije je lista areas, a output je 34.7. 

In [5]:
round(1.68,1)

1.7

Funkcija **round()** služi za zaokruživanje brojeva. Ona ima više input parametara. Prvi je float broj koji želimo da zaokružimo, a drugi je broj decimala na koji želimo da ga zaokružimo. Kako možemo znati to šta funkcija očekuje od nas? Možemo guglati, a možemo koristiti i ugrađenu dokumentaciju. Pogledajmo funkciju **help()**:

In [6]:
help(round)

Help on built-in function round in module builtins:

round(...)
    round(number[, ndigits]) -> number
    
    Round a number to a given precision in decimal digits (default 0 digits).
    This returns an int when called with one argument, otherwise the
    same type as the number. ndigits may be negative.



u Jupyteru, dokumentaciju za funkciju možemo videti i navođenjem upitnika ispred naziva funkcije.

In [7]:
?round

[0;31mDocstring:[0m
round(number[, ndigits]) -> number

Round a number to a given precision in decimal digits (default 0 digits).
This returns an int when called with one argument, otherwise the
same type as the number. ndigits may be negative.
[0;31mType:[0m      builtin_function_or_method


In [8]:
len(areas), type(areas)

(4, list)

In [9]:
print(areas)

[12.5, 34.7, 23.5, 16]


In [10]:
largest, int(largest), round(largest)

(34.7, 34, 35)

In [11]:
?complex

[0;31mInit signature:[0m [0mcomplex[0m[0;34m([0m[0mself[0m[0;34m,[0m [0;34m/[0m[0;34m,[0m [0;34m*[0m[0margs[0m[0;34m,[0m [0;34m**[0m[0mkwargs[0m[0;34m)[0m[0;34m[0m[0m
[0;31mDocstring:[0m     
complex(real[, imag]) -> complex number

Create a complex number from a real part and an optional imaginary part.
This is equivalent to (real + imag*1j) where imag defaults to 0.
[0;31mType:[0m           type


In [12]:
complex(2, -1)

(2-1j)

In [13]:
?sorted

[0;31mSignature:[0m [0msorted[0m[0;34m([0m[0miterable[0m[0;34m,[0m [0;34m/[0m[0;34m,[0m [0;34m*[0m[0;34m,[0m [0mkey[0m[0;34m=[0m[0;32mNone[0m[0;34m,[0m [0mreverse[0m[0;34m=[0m[0;32mFalse[0m[0;34m)[0m[0;34m[0m[0m
[0;31mDocstring:[0m
Return a new list containing all items from the iterable in ascending order.

A custom key function can be supplied to customize the sort order, and the
reverse flag can be set to request the result in descending order.
[0;31mType:[0m      builtin_function_or_method


In [14]:
bedrooms = [10.75, 19.50]
full = areas + bedrooms
full_sorted = sorted(full, reverse = True)
full_sorted

[34.7, 23.5, 19.5, 16, 12.5, 10.75]

Okej, za početak dosta ugrađenih funkcija. Na početku smo pomenuli i metode, pa 'ajmo da vidimo kako se one razlikuju od funkcija.

## Metode

Vratimo se na početak i definišimo nekoliko promenljivih:

In [15]:
data_geek = 'dimi'
height = 1.95
transaction = ['milk', 'cola', 'burger', 'whiskey']

Iznad su navedene promenljive, odnosno Python objekti određenog tipa. Python sve posmatra kao objekte, a svaki objekat ima odgovarajuće **metode** zavisno od toga kog je tipa. Metode posmatramo kao funkcije koje se pozivaju nad objektima. Evo primera:

In [16]:
# metoda nad listama
transaction.index('whiskey')

3

In [17]:
transaction.count('whiskey')

1

In [18]:
transaction = transaction + ['whiskey']
transaction.count('whiskey')

2

In [19]:
# metode nad stringovima
data_geek.capitalize()

'Dimi'

In [20]:
data_geek.replace('mi', 'mitrije')

'dimitrije'

In [21]:
data_geek.index('m')

2

In [22]:
transaction.index('whiskey')

3

Kao što vidite, različiti tipovi mogu imati iste metode ali se one ponašaju drugačije. Takođe, različiti tipovi ne moraju da imaju iste metode:

In [23]:
transaction.replace('milk', 'beer') 

AttributeError: 'list' object has no attribute 'replace'

Sve ove metode kao output vracaju rezultat njihovog izvrsenja dok objekat nad kojim su pozvane ostaje nepromenjen. Za razliku od njih, postoje metode koje menjaju objekat nad kojim su pozvane.

In [24]:
transaction.append('beer')
transaction

['milk', 'cola', 'burger', 'whiskey', 'whiskey', 'beer']

In [25]:
transaction.reverse()
transaction

['beer', 'whiskey', 'whiskey', 'burger', 'cola', 'milk']

Koliko je kul ovo toliko i nije. Može biti opasno jer neke metode menjaju stanje a mi možemo podrazumevati da nije tako. Zato je najbolje proveriti dokumentaciju pre koriscenja.

In [26]:
help(list.append)

Help on method_descriptor:

append(...)
    L.append(object) -> None -- append object to end



In [27]:
place = 'poolhouse'
place_up = place.upper()
place_up, place.count('o')

('POOLHOUSE', 3)

`Zadatak 1.` Saznati koji indeks u listi transakcija ima burger korišćenjem odgovarajuće metode. Nakon toga dodeliti burger novoj string promenljivoj, korišćenjem indeksiranog pristupa elementu iz liste. Izmeniti reč burger u hamburger. Povećati prvo slovo i prebrojati koliko r ima u ovoj reči.

In [28]:
ind = transaction.index('burger')
b = transaction[ind]
b = b.replace('b', 'hamb')
b = b.capitalize()
b, b.count('r')

('Hamburger', 2)

## Paketi

Već kapiramo da je Python veoma moćan jezik. Sve ove funkcije i metode je neko napisao za nas kako bismo mogli da ih koristimo. Dakle, negde iza postoji gomila koda, koja je na neki način organizovana. To je urađeno pomoću **paketa**. 
<br>Paketi su direktorijumi Py skripti. Svaka skripta predstavlja modul, i u njoj su definisane funkcije, metode i tipovi za rešavanje konkretnog problema.
<br>Takvih paketa je na hiljade na Internetu, jako su korisni, a uskoro će nama postati omiljeni:
- numpy
- scipy
- matplotlib
- pandas
- seaborn
- scikit-learn

### Uključivanje paketa

Da bi koristili neki paket, potrebno ga je prvo instalirati. Na ovom kursu koristimo **Condu**, sjajan package & environment manager, koji nam to olakšava. Kada instaliramo Condu, ona nam stigne sa preinstaliranim osnovnim paketima za data science. Za svaki slučaj, svaki put kada koristimo novi paket, biće dodat link gde možete videti kako se instalira u slučaju da ga nemate.
<br>Kada je paket instaliran, ostaje nam još samo da ga učitamo i da krenemo da ga koristimo. Paket se može učitati (importovati) na više načina:

In [29]:
import math

Modul (paket) math obezbeđuje pristup matematičkim funkcija definisanim C standardom. Najjednostavniji način za učitavanje paketa je samo korišćenjenjem naredbe **import**. Nadalje kada želimo da koristimo nešto iz ovog paketa, moramo uvek navoditi njegovo puno ime:

In [30]:
# pi ne radi
math.pi # radi

3.141592653589793

`Zadatak 2.` Izračunati obim i površinu kruga prečnika 0.5. Odštampati rezultate zaokružene na 2 decimale.

In [31]:
r = 0.5

C = 2 * r * math.pi
A = math.pi * r ** 2

print("Circumference: " + str(round(C,2)))
print("Area: " + str(round(A,2)))

Circumference: 3.14
Area: 0.79


Pri importovanju paketa, možemo mu dati alias kako ne bismo morali da navodimo pun naziv svaki put kada koristimo nešto iz njega. Za to nam služi **as**. 

In [32]:
import numpy as np

<br>Upravo smo učitali [Numpy](http://www.numpy.org/), paket za standardni račun i rad sa multidimenzionalnim nizovima. U Numpy-u je implementirana čitava linearna algebra, Furijeve transformacije i slični koncepti kako bi bili na poziv fukcije od nas. O ovom paketu ćemo dosta pričati ubuduće.

In [33]:
array([1,2,3])

NameError: name 'array' is not defined

Niti navođenjem čitavog paketa:

In [34]:
numpy.array([1,2,3]) # ne radi

NameError: name 'numpy' is not defined

In [35]:
np.array([1,2,3]) # moze :D

array([1, 2, 3])

Još jedan popularan način za učitavanje je **učitavanje konkretne funkcije**. Dakle, umesto što bi importovali sve stvari iz paketa, možemo importovati konkretnu funkciju koja nam treba i izbeći importovanje gomile ostalih stvari koje ne koristimo. Ovo je velika prednost kada se radi sa ogromnim paketima. Mana ovog pristupa je što, u slučaju da koristimo veliki broj funkcija iz jednog paketa, moramo često kucati import naredbe.

In [36]:
from numpy import array
np_areas = array(areas) # sada konacno moze :D
np_areas

array([12.5, 34.7, 23.5, 16. ])

In [38]:
ime = 'ma daj sta mlatis'
ime = ime.replace('m', 'mam')
ime

'mama daj sta mamlatis'