
**Created by:**

__[Viktor Varga](https://github.com/vvarga90)__

<br>

<img src="https://docs.google.com/uc?export=download&id=1WzgXsCoz8O-NeBlJTbuLPC1iIFDmgYt1" style="display:inline-block">
<hr>

# Python tutorial - Numpy gyakorlófeladatok

A feladatok megoldását a `# Tests` sor alatti assert utasítások tesztelik. A megoldást írd ezen sor fölé! A megoldás _vélhetően_ helyes, ha megjelenik a `Tests were successful.` felirat a kódblokk lefuttatásakor. A megoldásokhoz nem szükséges a numpy-on kívül semmilyen csomag importálása.

A 0. feladatban egy lehetséges megoldást megadunk.





In [None]:
import numpy as np

## **0. feladat**

Definiáld a `relu` függvényt, ami egy tetszőleges méretű tömb elemein a ReLU (Rectified Linear Unit) műveletet hajtja végre elemenként függetlenül.

ReLU(z) = max(0,z)

Pl.:
```
a = np.array([[1., -3.], [0.5, -0.5], [0., 2.]])
relu(a) -> ndarray([[1., 0.], [0.5, 0.], [0., 2.]])
```

In [None]:
# place of solution

def relu(a):
  return np.maximum(a, 0)   # elementwise maximum, not to be confused with np.amax()

# Tests
a = np.array([[1., -3.], [0.5, -0.5], [0., 2.]])
a1 = relu(a)
assert np.array_equal(a1, np.array([[1., 0.], [0.5, 0.], [0., 2.]]))
print("Tests were successful.")

Tests were successful.


# Alapszintű feladatok

## **1. feladat**

Definiáld a `split_array` függvényt, ami egy 2 dimenziós tömböt vág ketté a 0. tengelyen (axis#0) a megadott arányban. A függvény első, paramétere a tömb, második paramétere egy 0 és 1 közti lebegőpontos (float) `ratio` szám, visszatérési értéke pedig a kettévágott tömb két szelete. Az első szelet hossza a 0. tengely mentén az eredeti tömb hossza szorozva a `ratio` aránnyal, lefelé kerekítve.

Pl.:
```
a = np.array([[0.5, 1.2], [2.2, 1.0], [1.3, 0.9]])
a1, a2 = split_array(a, 0.5)
a1 -> ndarray([[0.5, 1.2]])
a2 -> ndarray([[2.2, 1.0], [1.3, 0.9]])
```

In [None]:
# place of solution



# Tests
a = np.array([[0.5, 1.2], [2.2, 1.0], [1.3, 0.9]])
a1, a2 = split_array(a, 0.5)
assert np.array_equal(np.concatenate([a1, a2], axis=0), a)
a3, a4 = split_array(a, 0.)
assert a3.shape == (0,2)
assert np.array_equal(a4, a)
a5, a6 = split_array(a, 1.)
assert np.array_equal(a5, a)
assert a6.shape == (0,2)
print("Tests were successful.")

## **2. feladat**

Definiáld a `rescale` függvényt, ami az első paraméterként kapott tömböt lineárisan a második és harmadik paraméterként kapott `a` és `b` számok közé skálázza úgy, hogy a tömb legkisebb eleme `a`-val, a legnagyobb eleme `b`-vel lesz egyenlő.

Pl.:
```
arr = np.array([[2., 1.], [-2., 0.]])
rescale(arr, -1., 1.) -> ndarray([[1., 0.5], [-1., 0.]])
```

In [None]:
# place of solution



# Tests
arr = np.array([[0.5, 1.2], [2.2, 1.0], [1.3, 0.9]])
arr1 = rescale(arr, -2., 3.)
assert np.allclose(arr1, np.array([[-2., 0.0588], [3., -0.529], [0.352, -0.823]]), atol=0.01)
print("Tests were successful.")

## **3. feladat**

Definiáld a `rescale_independently` függvényt, ami az első paraméterként kapott tömb #1 indexű tengelye mentén vett szeleteket egymástól függetlenül lineárisan a második és harmadik paraméterként kapott `a` és `b` számok közé skálázza úgy, hogy a tömb legkisebb eleme `a`-val, a legnagyobb eleme `b`-vel lesz egyenlő.
Azaz, pl. az eredmény 'r' tömbre minden `r[i,:]`, (i=1, ...) szelet minimuma `a`, maximuma `b` lesz.

Pl.:
```
arr = np.array([[2., 1., 0.], [-2., 0., 0.5]])
rescale_independently(arr, -1., 1.) -> ndarray([[1., 0., -1.], [-1., 0.6, 1.]])
```

In [None]:
# place of solution



# Tests
arr = np.array([[2., 1., 0.], [-2., 0., 0.5]])
arr1 = rescale_independently(arr, -1., 1.)
assert np.allclose(arr1, np.array([[1., 0., -1.], [-1., .6, 1.]]), atol=0.01)
print("Tests were successful.")

## **4. feladat**

Definiáld a `standardize_independently` függvényt, ami a paraméterként kapott tömb #1 indexű tengelye mentén vett szeleteket egymástól függetlenül sztenderdizálja. Ehhez, minden szelet minden eleméből az adott szelet átlagát kivonjuk és leosztunk a szelet szórásával.
Azaz, pl. az eredmény 'r' tömbre minden `r[i,:]`, (i=1, ...) szelet átlaga 0, szórása 1 lesz.

Pl.:
```
arr = np.array([[2., 1., 0.], [-2., 0., 0.5]])
standardize_independently(arr) -> ndarray([[1.224, 0., -1.224], [-1.388, 0.462, 0.925]])
```

In [None]:
# place of solution



# Tests
arr = np.array([[2., 1., 0.], [-2., 0., 0.5]])
arr1 = standardize_independently(arr)
assert np.allclose(arr1, np.array([[1.224, 0., -1.224], [-1.388, 0.462, 0.925]]), atol=0.01)
print("Tests were successful.")

## **5. feladat**

Definiáld a `one_hot` függvényt, ami kategóriacímkéket alakít one-hot kódolású címkékké.

A one-hot kódolás során a `k` kategóriacímkét (ami egy egész szám) egy `n` hosszú vektorrá alakítjuk, ahol a kategóriák száma `n`. A vektorban minden elem 0 lesz, kivétel a k. elem, ami 1. A one-hot kódolást multiclass klasszifikáció esetén használjuk: például fényképekről szeretnénk megmondani, hogy mit ábrázolnak. Tegyük fel, hogy 3 kategóriánk van: kutya, macska, papagáj. Minden fénykép pontosan az egyiket ábrázolja, így a fényképekhez egy-egy kategóriacímkét rendelhetünk, például kutya esetén 0-t, macska esetén 1-et, papagáj esetén 2-t. Ha gépi tanulási módszerekkel klasszifikálunk fényképeket, tipikusan nem közvetlenül a kategóriacímkét becsüljük, hanem azt a valószínűséget, hogy az adott fénykép kutyát, macskát, vagy papagájt ábrázol. One-hot kódolással állítjuk elő a ground truth (igazi) címke vektorokat, amelyekkel a modellt betanítjuk. Ha például a képünkön papgáj található, akkor a hozzátartozó igazi címkevektor `[0., 0., 1.]`, ugyanis 0 valószínűséggel kutya és macska, de 1 valószínűséggel papagáj a kép.

A `one_hot` függvény az első `arr` paraméterként kapott, képek kategóriacímkéit tartalmazó 1 dimenziós tömböt alakítja át úgy, hogy minden kategóriacímkéhez elkészíti annak one-hot kódolását. A kategóriák száma az `n` paraméterben adott. Az output egy 2 dimenziós tömb, ahol az `[i,:]` szelet az input tömb i. elemének one-hot kódolása lesz.

Pl.:
```
arr = np.array([0, 2, 2, 1])
one_hot(arr, 3) -> ndarray([[1., 0., 0.], [0., 0., 1.], [0., 0., 1.], [0., 1., 0.]])
```

In [None]:
# place of solution



# Tests
arr = np.array([1, 2, 2, 1])
arr1 = one_hot(arr, 3)
assert np.allclose(arr1, np.array([[0., 1., 0.], [0., 0., 1.], [0., 0., 1.], [0., 1., 0.]]), atol=0.01)
arr2 = one_hot(arr, 4)
assert np.allclose(arr2, np.array([[0., 1., 0., 0.], [0., 0., 1., 0.], [0., 0., 1., 0.], [0., 1., 0., 0.]]), atol=0.01)
print("Tests were successful.")

## **6. feladat**

Definiáld a `category_label` függvényt, ami egyszerre több valószínűségi vektorról adja meg, hogy melyek a legvalószínűbb kategóriaindexek az egyes vektorokban.

Multiclass klasszifikáció esetén a mintaelemeink címkéjét `k` kategória egyikébe becsüljük. Ha a becsléshez neuronhálót használunk, tipikusan egy k elemű, valószínűségeket tartalmazó vektort becslünk, melyek a mintaelem egyes kategóriákba tartozásának valószínűségét reprezentálják. Ha szeretnénk ezekből a vektorokból megmondani, hogy egy-egy mintaelem melyik kategóriába tartozik a legnagyobb valószínűség szerint, akkor elég megmondani minden egyes vektorban a maximális elem indexét. A `category_label` függvény a `one_hot` függvény kimenetét kapva visszaállítja annak bementét.

A `category_label` függvény paraméterként valószínűségi vektorokat tartalmazó 2 dimenziós tömböt kap. Megadja minden egyes valószínűségi vektorra a legavalószínűbb kategória indexét (azaz legnagyobb elem indexét). Az eredményt egy 1 dimenziós tömbben adja vissza.

Pl.:
```
arr = np.array([[1., 0., 0.], [0., 0., 1.], [0., 0., 1.], [0., 1., 0.]])
category_label(arr) -> ndarray([0, 2, 2, 1])
```

In [None]:
# place of solution



# Tests
arr = np.array([[0., 1., 0.], [0., 0., 1.], [0., 0., 1.], [0., 1., 0.]])
arr1 = category_label(arr)
assert np.allclose(arr1, np.array([1, 2, 2, 1]), atol=0.01)
arr = np.array([[0.5, 0.3, 0.2], [0.09, 0.9, 0.01]])
arr2 = category_label(arr)
assert np.allclose(arr2, np.array([0., 1.]), atol=0.01)
print("Tests were successful.")

## **7. feladat**

Definiáld a `my_clip` függvényt, ami az első paraméterként kapott tetszőleges méretű és formájú `arr` tömbben az adott `a` számnál kisebb értékeket `a`-ra állítja, míg az adott `b` számnál nagyobb értékeket `b`-re állítja. Az `a` és `b` számokat a függvény második, illetve harmadik paraméterként várja.

Pl.:
```
arr = np.array([[[5., 2., -5.], [4., 3., 1.]]])
my_clip(arr, -2., 2.) -> ndarray([[[2., 2., -2.], [2., 2., 1.]]])
```

In [None]:
# place of solution



# Tests
arr = np.array([[[5., 2., -5.], [4., 3., 1.]]])
arr1 = my_clip(arr, -2., 2.)
assert np.allclose(arr1, np.array([[[2., 2., -2.], [2., 2., 1.]]]), atol=0.01)
print("Tests were successful.")

## **8. feladat**

Definiáld az `overwrite_interval` függvényt, ami az első paraméterként kapott tetszőleges méretű és formájú `arr` tömbben az adott [a, b] zárt intervallumban levő értékeket egy megadott `c` értékre állítja. Az `a`, `b`, `c` számokat a függvény paraméterként várja.

Pl.:
```
arr = np.array([[[5., 2., -5.], [4., 3., 1.]]])
overwrite_interval(arr, -2., 2., 100.) -> ndarray([[[5., 100., -5.], [4., 3., 100.]]])
```

In [None]:
# place of solution



# Tests
arr = np.array([[[5., 2., -5.], [4., 3., 1.]]])
arr1 = overwrite_interval(arr, -2., 2., 100.)
assert np.allclose(arr1, np.array([[[5., 100., -5.], [4., 3., 100.]]]), atol=0.01)
print("Tests were successful.")

## **9. feladat**

Definiáld a `get_elements_not_in_interval` függvényt, ami az első paraméterként kapott tetszőleges méretű és formájú `arr` tömbben az adott [a, b] zárt intervallumon kívül eső értékeket adja vissza egy 1 dimenziós tömbben, növekvő sorrendben. Az `a` és `b` számokat a függvény paraméterként várja.

Pl.:
```
arr = np.array([[5.1, 2., -5.], [4., 3., 1.], [-2.5, 0., -0.1]])
get_elements_not_in_interval(arr, -3., 3.) -> ndarray([-5., 4., 5.1])
```

In [None]:
# place of solution



# Tests
arr = np.array([[5.1, 2., -5.], [4., 3., 1.], [-2.5, 0., -0.1]])
arr1 = get_elements_not_in_interval(arr, -3., 3.)
assert np.allclose(arr1, np.array([-5., 4., 5.1]), atol=0.01)
arr2 = get_elements_not_in_interval(arr, -10., 10.)
assert arr2.shape == (0,)
print("Tests were successful.")

## **10. feladat**

Definiáld a `sort_first_by_second` függvényt, ami egy számpárokat tartalmazó kétdimenziós tömböt kap paraméterként, melynek mérete (n, 2). A függvény visszadja a számpárok első tagjait egy 1 dimenziós tömbben, a számpárok második tagjai szerint növekvő sorrendben rendezve.

Pl.:
```
arr = np.array([[5.1, 2.], [4., 3.], [-2.5, 0.], [3.1, 7.], [1., -3.], [0., 6.]])
sort_first_by_second(arr) -> ndarray([1., -2.5, 5.1, 4., 0., 3.1])
```

In [None]:
# place of solution



# Tests
arr = np.array([[5.1, 2.], [4., 3.], [-2.5, 0.], [3.1, 7.], [1., -3.], [0., 6.]])
arr1 = sort_first_by_second(arr)
assert np.allclose(arr1, np.array([1., -2.5, 5.1, 4., 0., 3.1]), atol=0.01)
print("Tests were successful.")

## **11. feladat**

Definiáld a `get_local_extrema_idxs` függvényt, ami egy egydimenziós tömböt kap paraméterként. A tömb elemeit sorozatként tekintve, visszadja azoknak az elemeknek az indexeit, melyek szigorú lokális szélsőértékek. Szigorú lokális szélsőértékek azok az elemek, melyek szigorúan kisebbek, mint mindkét szomszédjuk, vagy szigorúan nagyobbak, mint mindkét szomszédjuk és mindkét oldalról van szomszédjuk.

Pl.:
```
arr = np.array([1.2, 3.4, 2.5, 5.5, 6.7, 7.7, 7.7, 6.5, 5.2, 3.1, 4.4, 2.2, 1.1, 0.1])
get_local_extrema_idxs(arr) -> ndarray([1, 2, 9, 10])
```

In [None]:
# place of solution



# Tests
arr = np.array([1.2, 3.4, 2.5, 5.5, 6.7, 7.7, 7.7, 6.5, 5.2, 3.1, 4.4, 2.2, 1.1, 0.1])
arr1 = get_local_extrema_idxs(arr)
assert np.array_equal(np.sort(arr1), np.array([1, 2, 9, 10]))
print("Tests were successful.")

## **12. feladat**

Adott egy `ts` idősor, ami két év havi csapadékösszegeit tartalmazza. Az idősor egy (24,) méretű tömbben van tárolva.

Definiáld a `most_rainy_month_avg()` függvényt, ami az idősort paraméterként kapva, visszadja annak a hónapnak az indexét (0 és 11 közt), mely átlagosan a legcsapadékosabb volt a két év során.

Definiáld a `least_rainy_year()` függvényt, ami az idősort paraméterként kapva, visszadja annak az évnek az indexét (0 vagy 1), mely összességében a legkevésbé volt csapadékos.


In [None]:
# place of solution



# Tests
ts = np.array([15,30,62,93,77,61,45,32,16,34,28,14,9,22,82,115,65,75,38,19,26,47,22,31])
assert most_rainy_month_avg(ts) == 4
assert least_rainy_year(ts) == 1
print("Tests were successful.")

# Haladó szintű feladatok

## **1. feladat**

Definiáld a `mult_table` függvényt, ami paraméterként az `n` számot kapja, visszatérési értéke egy 2 dimenziós, (n+1, n+1) méretű tömb, melynek `[i, j]` indexű eleme az `i*j` értéket tárolja.

Pl.:
```
mult_table(0) -> ndarray([[0]])
mult_table(1) -> ndarray([[0, 0], [0, 1]])
mult_table(2) -> ndarray([[0, 0, 0], [0, 1, 2], [0, 2, 4]])

mult_table(6)[4][5] -> 20
```

In [None]:
# place of solution



# Tests
arr = np.array([1.2, 3.4, 2.5, 5.5, 6.7, 7.7, 7.7, 6.5, 5.2, 3.1, 4.4, 2.2, 1.1, 0.1])
arr0 = mult_table(0)
arr1 = mult_table(1)
arr2 = mult_table(2)
arr6 = mult_table(6)
assert np.array_equal(arr0, np.array([[0]]))
assert np.array_equal(arr1, np.array([[0,0],[0,1]]))
assert np.array_equal(arr2, np.array([[0, 0, 0], [0, 1, 2], [0, 2, 4]]))
assert arr6[4,5] == 20
print("Tests were successful.")

## **2. feladat**

Definiáld a `my_histogram` függvényt, ami előállítja egy tömb hisztogramját. A függvény két paramétert kap. A `data` tömb számokat tartalmaz. A rendezett `buckets` tömb a számegyenest lefedő, diszjunkt intervallumokat ad meg: az i. eleme az i. intervallum felső határát (exkluzív), illetve az i+1. intervallum alsó határát (inkluzív) adja meg. Az utolsó intervallum felső határa pozitív végtelen. A függvény visszatér egy `len(buckets)+1` hosszú tömbbel, melyben minden intervallumra megadja, hogy hány elem esik bele a `data` tömbből.

Megjegyzés: a `np.histogram()` függvény ezt a problémát oldja meg, azonban érdemes lehet megpróbálni más úton is megoldani a feladatot.

Pl.:
```
data = ndarray([1.5, 3.2, 2.2, 4.5, -6.1, 0.2, 18., 3.14, 1.12, 17.5, -4.6])
buckets = ndarray([1., 2., 5., 10.])

my_histogram(data, buckets) -> ndarray([[3, 2, 4, 0, 2]])
```

In [None]:
# place of solution



# Tests
data = np.array([1.5, 3.2, 2.2, 4.5, -6.1, 0.2, 18., 3.14, 1.12, 17.5, -4.6])
buckets = np.array([1., 2., 5., 10.])
hist = my_histogram(data, buckets)
assert np.array_equal(hist, np.array([3,2,4,0,2]))
print("Tests were successful.")

## **3. feladat**

Írd meg a `triangle_area_perimeter` függvényt. A függvény számhármasokat kap és azon számhármas indexeket adja vissza, melyeket élhosszakként értelmezve háromszögek alkothatók. Az indexek mellett a megfelelő számhármasokból alkotott háromszögek kerületét és területét is visszaadja a függvény.

Paraméterként egy `edges` nevű, (n_triples, 3) méretű lebegőpontos számokat (float) tartalmazó tömböt kap, mely *n_triples* darab számhármast tárol. A számhármasok háromszögek oldalhosszaiként értelmezendőek.

A függvény a `valid_triangle_idxs, area_perimeter` tömbökkel tér vissza. A `valid_triangle_idxs` egy int típusú 1D tömb, ami azoknak a számhármasoknak az indexét tárolja, melyek élhosszakként értelmezve háromszögeket alkotnak, azaz az `edges` paraméter tömb 0. tengelyét indexeli. Az `area_perimeter` 2 dimenziós tömb a `valid_triangle_idxs` tömbben megadott indexű számhármasokból alkotott háromszögek területét és kerületét tárolja. Az `area_perimeter` mérete tehát a 0. tengely mentén egyezik a `valid_triangle_idxs` hosszával, az 1. tengely hossza pedig 2, mely mentén sorban a háromszög területét, valamint kerületét tárolja.

A háromszögek területe az oldalhosszakból a Hérón-képlet segítségével számolható.

Pl.:
```
edges = np.array([[1., 2., -2.],
                  [5., 3., 4.],
                  [4., 2., 3.]])
valid_triangle_idxs, area_perimeter = triangle_area_perimeter(edges)

valid_triangle_idxs -> [1, 2]
area_perimeter -> [[6., 12.], [2.904, 9.]]
```

In [None]:
# place of solution



# Tests
edges = np.array([[1., 2., 0.],
                  [0., 2., 1.],
                  [2.3, -2., -5.5],
                  [0., 0., 0.],
                  [4., 2., 3.],
                  [2., 3.01, 1.],
                  [1., 1., 1.],
                  [1., 1.99, 1.]])

valid_triangle_idxs, area_perimeter = triangle_area_perimeter(edges)

assert valid_triangle_idxs.shape == (3,)
assert np.all(valid_triangle_idxs == np.array([4,6,7]))
assert area_perimeter.shape == (3,2)
assert np.allclose(area_perimeter, np.array([[2.90473751, 9.],
                                             [0.4330127, 3.],
                                             [0.09937555, 3.99]]))
print("Tests were successful.")


## **4. feladat**

Adott egy `ts` idősor, ami két év havi csapadékösszegeit tartalmazza. Az idősor egy (2, 12) méretű tömbben van tárolva: a 0. tengely az éveket, az 1. tengely a hónapokat indexeli.

Definiáld a `most_rainy_month` függvényt, ami az idősort paraméterként kapva, visszadja a legcsapadékosabb hónapnak az évek szerinti (0 vagy 1) és a hónapok szerinti (0 és 11 közt) indexét. Például, ha a legcsapadékosabb hónap a két év során második év októbere, úgy a függvény az 1 és 9 számokkal tér vissza.

Definiáld a `rainy_months` függvényt, ami azoknak a hónapoknak az évek szerinti (0 vagy 1) és a hónapok szerinti (0 és 11 közt) indexét adja vissza, melyek során a két év átlagos havi csapadékösszegénél több eső esett. Az index párokat a függvény egy 2 dimenziós, (n_rainy_months, 2) méretű tömbben adja vissza, ahol `n_rainy_months` a fenti feltételnek megfelelő hónapok száma a két év során.


In [None]:
# place of solution



# Tests
ts = np.array([[15,30,62,93,77,61,45,32,16,34,28,14], [9,22,82,115,65,75,38,19,26,47,22,31]])
assert most_rainy_month(ts) == (1, 3)
arr1 = rainy_months(ts)
assert np.array_equal(arr1, np.array([[0,2], [0,3], [0,4], [0,5], [0,6],\
                                      [1,2], [1,3], [1,4], [1,5], [1,9]]))
print("Tests were successful.")

## **5. feladat**

Definiáld a `find_closests` függvényt, ami két egydimenziós tömböt vár paraméterként. A függvény egy harmadik egydimenziós tömbbel tér vissza, amiben a paraméterként kapott második tömb (`to_replace`) minden egyes elemére megadja a hozzá legközelebbi értéket az első tömbből (`to_select`).

Pl.:
```
to_select = np.array([10, 17, 31])
to_replace = np.array([-2, 5, 34, -18, 21, 10, 14])

find_closests(to_select, to_replace) -> ndarray([10, 10, 31, 10, 17, 10, 17])

```


In [None]:
# place of solution



# Tests
my_to_select = np.array([15,23,17,8,9,2,31])
my_to_replace = np.array([10,27,23,11,11,22,-2,51,23,10])
my_closests = find_closests(my_to_select, my_to_replace)
assert np.array_equal(my_closests, np.array([9, 23, 23, 9, 9, 23, 2, 31, 23, 9], dtype=np.int32))

print("Tests were successful.")