# Szorgalmi házi feladat (Haladó NumPy)

A szorgalmi házi feladat keretében három feldatot kell megoldanod a NumPy könyvtár segítségével. A cél, hogy minél hatékonyabb megoldásokat adj a feladatokra.

Az egyes feladatok alatt tesztek találhatók, melyek kisméretű példákon ellenőrzik a megoldás helyességét. A notebook végén, a "Benchmark tesztek" blokkban olyan további tesztek vannak, melyek a megoldások futásidejét mérik le nagyméretű példákon. Kérjük, hogy **ne változtasd meg a notebook struktúráját**, ne szedd több részre, illetve ne módosítsd a megírt részeket, csak a megoldásaidat írd be a megfelelő helyre, az `# Implement your solution BELOW` feliratok alá közvetlenül. A beadott házi feladatok gépi tanulás alapú plágiumellenőrzésen esnek át. Másolás gyanújának felmerülése esetén mind a másolat(ok), mind az azt/azokat ihlető eredeti megoldások visszautasíthatók.

**!!! A feladatok megoldását, vagy az arra mutató linkeket bárhol közzétenni tilos !!!**

**Kikötések:**

- Kizárólag a NumPy könyvtár használható, illetve olyan modulok, melyek a sztenderd Python disztribúció részei. Kizárólag Python nyelven írt saját kód használható.

**Megoldás és beküldés menete:**

A közzétett, feladatokat tartalmazó Jupyter notebook a Google Drive-on keresztül lett megosztva, így a Google saját Jupyter notebook szerkesztője és futtatókörnyezete nyílik meg a linkre kattintáskor, a Google Colab. Ennek segítségével online szerkeszthető és futtatható a megosztott notebook. Mivel a notebook csak "view" jogosultságokkal van megosztva, a Google Colab az úgynevezett "Playground" módban nyitja azt meg, ahol bár szerkeszthető és futtatható a notebook, de a változtatások nem lesznek automatikusan mentve. A notebook maradandó hatásokkal járó szerkesztése az alábbi módokon lehetséges:
- Ha online szeretnénk a notebookot szerkeszteni és futtatni a Google Colab segítségével, akkor le kell másolni azt a saját Drive tárhelyre (Google Colab file menü -> Save a copy to Drive), majd a másolatot kell megnyitni szerkesztésre.

A kész megoldást tartalmazó notebookot (.ipynb) fájlként kell feltölteni a Canvas-ban, a házi feladat beadási felületén.
**Kérjük a notebook szerkezetét nem módosítani és nem szétszedni külön feladatok szerint!**

**Határidő:** 2024. május 21., kedd, 23:59.

**Értékelés:**

A feladatok megoldásáért egyenként 5-5 pont szerezhető, azaz összesen 15 pont a három feladatért. Az egyes feladatok megoldása abban az esetben ér 5 pontot, ha
- A megoldás teljesen vektorizált, azaz egyáltalán nincs benne Python ciklus, rekurzió, vagy hasonló, nem hatékony konstrukció, ahol a Python interpreter nagyszámú utasítást hajt végre. Ide tartoznak a list/set/dict comprehension-ök, és a `map(), filter()` függvények is. Nem hatékony konstrukciók NumPy-ban a `np.vectorize, np.apply_along_axis, np.frompyfunc` függvények is (lásd NumPy útmutató, 5. fejezet legvége: "Tetszőleges Python kód vektorizálása").
- Az adott feladathoz tartozó benchmark tesztek közül, legalább a "Benchmark #1" teszt sikeresen lefut, kevesebb, mint 10 másodperc alatt, a Google Colab futtatási környezetén (CPU mód).

**Verseny:**

A hallgatók által beadott megoldások egymással is összehasonlításra kerülnek, a benchmark futási idők szerint. A beadott megoldásokat feladatonként rangsoroljuk a futási idők alapján a #2 és #3 sorszámú benchmark teszteken, majd az egyes hallgatók esetén összegezzük a három feladatra kapott, összesen hat darab rangsor helyezést. **A három legalacsonyabb rangsor-helyezés összeget elérő hallgató jeles érdemjegyet kap a tárgyra, amennyiben a minimum feltételeket teljesíti** (elégséges vizsga és a ZH-kon 20-20 pont). Ha egy teszt nem fut le 30 másodpercen belül, az azon elért rangsor helyezés az arra a feladatra beadott megoldások számával lesz egyenlő. Ha elfogy a futtatókörnyezet által biztosított memória és emiatt a futtatókörnyezet leáll/újraindul, az egyenértékű azzal, hogy a teszt nem futott le időben.

## **A**: Buszparkolás

_Egy budapesti utazási iroda informatikusaként tengeted mindennapjaidat. A szokásos weblap karbantartási feladatok helyett, ezúttal egyedi, sürgős kéréssel fordulnak hozzád. Az iroda megkeresést kapott: nagyszámú, az ország különböző szegleteiből származó turista látogatná meg a Nemzeti Múzeumot a nemzeti ünnep alkalmából. Turistabuszokkal érkeznének délelőtt, majd a nap végén azokkal is mennének haza, azonban gondot okoz ennyi busz elhelyezése egyidejűleg a belvárosban. A munkatársaid azzal az ötlettel álltak elő, hogy a Múzeum körút két oldalára, a járda mellé állítanák sorban a buszokat, így oldva meg a parkolást. Meg is tették az előkészületeket, hogy a parkolóhelyek szabadok legyenek aznapra. A nemzeti ünnep reggelén viszont kollégáid váratlan felfedezést tettek: az éjszaka folyamán, ismeretlen tettesek amerikai rendszámú roncsautókat parkoltak le, szétszórva a körút két oldalán, galibát okozva ezzel a szervezőknek és a látogatóknak - az autók elszállítására már nincs elegendő idő. Munkatársaid felmérték a helyzetet, rögzítették digitális formában is, hogy melyik parkolóhelyen áll autó és melyik üres. Jól tudják, hogy te remekül programozol és nem mész a múzeumba, így téged bíznak meg annak a kiszámításával, hogy mennyi busz fog tudni a roncsautók közt parkolni a körút két oldalán. Nagyon sürgős a feladat és mivel gyakran be-beragadnak a régi billentyűzeteden a gombok, tudod, hogy csak kevéssé verbózus nyelveken lenne esélyed időben megoldani a feladatot, így a NumPy-t választod._

Implementáld a `n_of_bus_parking_spaces` nevű függvényt, mely paraméterként a `parking_map` nevű, `(2, n)` alakú boolean tömböt kapja meg, ahol `n` pozitív! A tömb két sora a Múzeum körút két oldalán található, autók méretére szabott parkolóhelyeket reprezentálja sorban. A tömbben ott találhatók igaz értékek, ahol autó áll és hamis értékek jelzik a szabad helyeket. Egy busz elhelyezéséhez három egymást követő szabad parkolóhelyre van szükség. A függvény egy egész számmal kell, hogy visszatérjen, mely megadja, hogy hány buszt lehet elhelyezni az útszakasz két oldalán összesen!

In [187]:
import numpy as np

# implement your solution BELOW
def n_of_bus_parking_spaces(parking_map):
    kernel = np.array([1, 1, 1])

    parking_map_padded = np.pad(parking_map, ((0, 0), (1, 1)), constant_values=True)

    conv_left = np.convolve(~parking_map_padded[0], kernel, mode='valid')
    conv_right = np.convolve(~parking_map_padded[1], kernel, mode='valid')

    buses_left = count_buses(conv_left)
    buses_right = count_buses(conv_right)

    return buses_left + buses_right

def count_buses(conv):
    bus_indices = np.where(conv == 3)[0]
    bus_indices = bus_indices[::2]
    return len(bus_indices)

### Tesztek

In [174]:
import unittest

class TestBusParking(unittest.TestCase):
    def test1(self):
        parking_map = np.array([[0,0,1,0,0],
                                [1,0,0,1,0]], dtype=np.bool_)
        self.assertEqual(n_of_bus_parking_spaces(parking_map=parking_map), 0)

    def test2(self):
        parking_map = np.array([[0],
                                [0]], dtype=np.bool_)
        self.assertEqual(n_of_bus_parking_spaces(parking_map=parking_map), 0)

    def test3(self):
        parking_map = np.array([[1,0,0,0,1,0,0,0],
                                [0,0,0,0,0,0,0,0]], dtype=np.bool_)
        self.assertEqual(n_of_bus_parking_spaces(parking_map=parking_map), 4)

    def test4(self):
        parking_map = np.array([[1,0,1,1,1,0,1,1],
                                [0,0,1,0,0,0,0,1]], dtype=np.bool_)
        self.assertEqual(n_of_bus_parking_spaces(parking_map=parking_map), 1)

    def test5(self):
        parking_map = np.array([[0,0,0,1,0,0,1,0,1,0,0,0,0,0,1,1,0,0,0,0,1,0,0,0],
                                [0,0,0,0,0,0,0,0,1,1,1,1,1,0,0,0,1,0,0,0,1,0,1,0]], dtype=np.bool_)
        self.assertEqual(n_of_bus_parking_spaces(parking_map=parking_map), 8)

def suite():
    suite = unittest.TestSuite()
    testfuns = ["test1", "test2", "test3", "test4", "test5"]
    [suite.addTest(TestBusParking(fun)) for fun in testfuns]
    return suite

runner = unittest.TextTestRunner(verbosity=2)
runner.run(suite())

test1 (__main__.TestBusParking) ... ok
test2 (__main__.TestBusParking) ... ok
test3 (__main__.TestBusParking) ... ok
test4 (__main__.TestBusParking) ... ok
test5 (__main__.TestBusParking) ... ok

----------------------------------------------------------------------
Ran 5 tests in 0.023s

OK


<unittest.runner.TextTestResult run=5 errors=0 failures=0>

## **B**: Multi-class recall (szenzitivitás) metrika

_Multi-class klasszifikáció esetén a mintaelemeink címkéjét k (k > 2) kategória egyikébe becsüljük (például kutya, macska, papagáj, stb.). Ha a becsléshez neuronhálót használunk (a végén egy softmax aktivációs függvénnyel), mintaelemenként egy-egy k elemű, valószínűségeket tartalmazó vektort kapunk, ahol az egyes valószínűségek a mintaelem egyes kategóriákba tartozásának valószínűségét reprezentálják. Ha szeretnénk ezekből a vektorokból megmondani, hogy egy-egy mintaelem melyik kategóriába tartozik a legnagyobb valószínűség szerint, akkor elég megmondani minden egyes vektorban a maximális elem indexét. Így megkapjuk a becsült kategóriákat._

_Klasszifikációs modellek teljesítményének mérésére különböző metrikák léteznek (pl. pontosság - accuracy, precizitás - precision, szenzitivitás - recall, stb.). Az egyes metrikák a teljesítményt csak bizonyos szempontok szerint értékelik, jellemzően, egy modell egyetlen metrikával történő kiértékelése nem ad teljes képet a modell klasszifikációs teljesítményéről._

Ebben a feladatban a **recall (szenzitivitás)** metrikát kell implementálnod a **multi-class** (kettőnél több kategóriás) **klasszifikáció esetére.** A multiclass recall, az összes kategória felett átlagolva, azt adja meg, hogy egy-egy választott kategóriába valójában tartozó egyedeket milyen arányban sikerült a megfelelő címkével ellátnunk.

Számolásához a bináris (két kategóriás) esetből indulhatunk ki. Ilyenkor az egyik, választott kategóriánk a pozitív kategória, míg a másik a negatív kategória. A bináris recall metrika így a következő:

$$ Recall = \dfrac{VP}{VP+FN} $$

ahol VP a valós pozitívok száma (azaz ahol a pozitív kategóriát helyesen becsültük), FN pedig a fals negatívok száma (ahol helytelenül a negatív kategóriába soroltuk a mintaelemet). A nevező tehát egyenlő azzal, hogy hány mintaelem tartozik a pozitív kategóriába, maga a hányados pedig azzal, hogy milyen arányban találtuk el a valójáan pozitív kategóriába tartozó elemeket.

Multi-class esetben minden kategóriára számoljuk a fenti arányt úgy, hogy az aktuális kategória a pozitív kategória és mindegyik másik kategória együttvéve a negatív kategória. Az így, kategóriánként kapott recall értékeknek az átlaga adja meg a multi-class recall metrikát.

A feladat, hogy implementáld a `multiclass_recall` függvényt, ami két paramétert kap:
*   `y_pred` tartalmazza becsült valószínűségeket (ez egy (m, k) alakú, `np.float32` adattípusú tömb, ahol  m  a mintaelemek és  k  a kategóriák száma, m >= 1, k >= 3)
*   `y_true` tartalmazza az igazi kategóriacímkéket (ez egy (m,) alakú, `np.int32` adattípusú tömb)

A függvény egy lebegőpontos számot ad vissza, a kategóriákra egyenként számolt bináris recall értékek átlagát.


In [180]:
import numpy as np

# implement your solution BELOW

def multiclass_recall(y_pred, y_true):
    y_pred_labels = np.argmax(y_pred, axis=1)
    k = y_pred.shape[1]
    range_k = np.arange(k)

    y_true_broadcasted = y_true[:, None] == range_k
    y_pred_labels_broadcasted = y_pred_labels[:, None] == range_k

    true_positives = np.sum(y_true_broadcasted & y_pred_labels_broadcasted, axis=0)
    false_negatives = np.sum(y_true_broadcasted & ~y_pred_labels_broadcasted, axis=0)

    recalls = np.divide(true_positives, true_positives + false_negatives, out=np.zeros_like(true_positives, dtype=float), where=(true_positives + false_negatives)!=0)

    average_recall = np.mean(recalls)

    return average_recall


### Tesztek

In [178]:
import unittest

class TestMulticlassRecall(unittest.TestCase):

    def test_three_classes1(self):
        three_class_preds = np.array([[0.4, 0.3, 0.3], [0.1, 0.5, 0.4],
                                    [0.3, 0.2, 0.5], [0.4, 0.25, 0.35]], dtype=np.float32)
        three_class_labels = np.array([2, 1, 0, 1], dtype=np.int32)
        self.assertAlmostEqual(multiclass_recall(y_pred=three_class_preds, y_true=three_class_labels), 1/6)

    def test_three_classes2(self):
        three_class_preds = np.array([[0.1, 0.8, 0.1], [0.1, 0.5, 0.4],
                                    [0.7, 0.2, 0.1], [0.25, 0.4, 0.35]], dtype=np.float32)
        three_class_labels = np.array([1, 1, 1, 0], dtype=np.int32)
        self.assertAlmostEqual(multiclass_recall(y_pred=three_class_preds, y_true=three_class_labels), 2/9)

    def test_four_classes(self):
        four_class_preds = np.array([[1., 0., 0., 0.], [1., 0., 0., 0.],
                                     [0., 0., 1., 0.], [0., 0., 1., 0.],
                                     [0., 1., 0., 0.], [0., 0., 0., 1.],
                                     ], dtype=np.float32)  # [0,0,2,2,1,3]
        four_class_labels = np.array([0, 2, 1, 1, 1, 3], dtype=np.int32)
        self.assertAlmostEqual(multiclass_recall(y_pred=four_class_preds, y_true=four_class_labels), 7/12)

def suite():
    suite = unittest.TestSuite()
    testfuns = ["test_three_classes1", "test_three_classes2", "test_four_classes"]
    [suite.addTest(TestMulticlassRecall(fun)) for fun in testfuns]
    return suite

runner = unittest.TextTestRunner(verbosity=2)
runner.run(suite())

test_three_classes1 (__main__.TestMulticlassRecall) ... ok
test_three_classes2 (__main__.TestMulticlassRecall) ... ok
test_four_classes (__main__.TestMulticlassRecall) ... ok

----------------------------------------------------------------------
Ran 3 tests in 0.018s

OK


<unittest.runner.TextTestResult run=3 errors=0 failures=0>

## **C**: Bounding box-ok

_A számítógépes látás egyik fontos alkalmazása objektumok felismerése és elhelyezkedésük meghatározása fényképeken. A gépi tanulás alapú objektum-detektorokat nagyrészt felügyelt tanulás keretében tanítják be, fénykép-címke párokon. A címkék ebben az esetben, gyakran téglalapok adatai szoktak lenni. Ezek a téglalapok (más néven "bounding box"-ok), a fényképeken elhelyezve megadják, hogy egy adott objektum hol található meg a képen és mekkora a kiterjedése. A téglalapok oldalai párhuzamosak a kép oldalaival. Például, ha egy fényképen öt kutya található és ezúttal kizárólag a kutyák felismerésével szeretnénk foglalkozni, akkor az ehhez a képhez kapcsolódó címke öt téglalap méretét és elhelyezkedését adja meg, melyek az öt kutyát egyenként, a teljes terjedelmükben, a lehető legszorosabban magukban foglalják. Az objektum-detektor célja, hogy ezeket a téglalapokat minél kisebb hibával megbecsülje. Az igazi és becsült téglalpok közti hiba mérésére több fajta módszer létezik. A becslés módjától függően felmerülhet olyan kérdés is, hogy hogyan kezeljünk olyan eseteket, amikor az igazi téglalapok száma és a becsült téglalapok száma nem azonos. Ebben a feladatban egy ilyen metrikához felhasználható segédfüggvényt kell megvalósítani, mely minden igazi téglalapra megadja a hozzá a becsült téglalapok közül a legjobban illeszkedőt az Intersection-over-Union (IoU) metrikát követve._

Definiáld a `best_matching_bboxes(bboxes_true, bboxes_pred)` függvényt! `bboxes_true` és `bboxes_pred` két NumPy tömb, `(n, 4)` és `(m, 4)` alakkal, ahol `n` az igazi téglalapok száma, `m` pedig a becsült téglalapok száma. Az egyes téglalapok négy darab egész számmal vannak ábrázolva, ezek sorban: a téglalap tetejének függőleges koordinátája, a téglalap bal oldalának vízszintes koordinátája, a téglalap aljának függőleges koordinátája és a téglalap jobb oldalának vízszintes koordinátája lesznek ("tlbr" formátum: top-left-bottom-right). A függvény egy `(n,)` alakú tömbbel tér vissza, melyben minden igazi téglalaphoz (tehát a `bboxes_true` tömb minden sorához) megadja annak a téglalapnak az indexét a `bboxes_pred` tömbből, amelyikkel annak a legnagyobb az átfedési aránya az IoU metrika szerint. Ha holtversenyben több ilyen téglalap van, az egyik tetszőleges téglalapot tekinti a maximális átfedési arányúak közül. Amennyiben egy igazi téglalappal egyetlen becsült téglalapnak sincs pozitív területű metszete (azaz az IoU érték 0), úgy a visszaadott tömb megfelelő helyén `-1` értéket kell visszaadni.

$A$ és $B$ téglalapok átfedési aránya az IoU metrika szerint mérve a következő:

$\displaystyle \qquad\mathrm{IoU}(A, B) = \frac{A \cap B}{A \cup B}$

azaz, a két téglalap egymást átfedő területének és a két téglalap által együttesen lefedett területnek az aránya.

Feltételezhetjük, hogy mindkét tömbben a számnégyesek pozitív területű téglalapokat határoznak meg. Feltételezhetjük továbbá, hogy az igazi téglalapok száma (`n`) nagyobb, mint nulla, azonban a becsült téglalapok száma (`m`) lehet nulla is. A téglalapokat meghatározó értékek egész számok, a bemeneti tömbök adattípusa `np.int32`.

**Vizuális példa:**

Az alábbi ábrán a világoskék téglalapok az igazi bounding box-ok, a narancssárgák pedig a becsült bounding box-ok. Az indexeik az input tömbökben a téglalapok alatt/felett vannak jelölve. Ezekre az inputokra a `best_matching_bboxes` függvény az `[1, -1]` tömböt adja vissza.

<br>
<img src="https://docs.google.com/uc?export=download&id=1zC7DgaE-a3IKnZJZ3HiUhlA4nVAnA9r-" style="display:inline-block" width='40%'>


In [122]:
import numpy as np

# implement your solution BELOW
def best_matching_bboxes(bboxes_true, bboxes_pred):
    if bboxes_pred.size == 0:
        return np.full(bboxes_true.shape[0], -1, dtype=np.int32)

    box1_area = (bboxes_true[:, 2] - bboxes_true[:, 0]) * (bboxes_true[:, 3] - bboxes_true[:, 1])
    box2_area = (bboxes_pred[:, 2] - bboxes_pred[:, 0]) * (bboxes_pred[:, 3] - bboxes_pred[:, 1])

    intersect_top = np.maximum(bboxes_true[:, None, 0], bboxes_pred[:, 0])
    intersect_left = np.maximum(bboxes_true[:, None, 1], bboxes_pred[:, 1])
    intersect_bottom = np.minimum(bboxes_true[:, None, 2], bboxes_pred[:, 2])
    intersect_right = np.minimum(bboxes_true[:, None, 3], bboxes_pred[:, 3])

    intersect_area = np.maximum(0, intersect_bottom - intersect_top) * np.maximum(0, intersect_right - intersect_left)

    union_area = box1_area[:, None] + box2_area - intersect_area

    iou = np.divide(intersect_area, union_area, out=np.zeros_like(intersect_area, dtype=float), where=union_area!=0)

    best_matches = np.argmax(iou, axis=1)
    best_matches[iou.max(axis=1) == 0] = -1

    return best_matches


### Tesztek

In [116]:
import unittest

class TestBestMatchingBBoxes(unittest.TestCase):
    def test1(self):
        bboxes_true = np.array([[-4, 7, -2, 13], [-3, 8, 5, 11]], dtype=np.int32)
        bboxes_pred = np.zeros((0, 4), dtype=np.int32)
        ret = best_matching_bboxes(bboxes_true=bboxes_true, bboxes_pred=bboxes_pred)
        self.assertEqual(ret.tolist(), [-1, -1])

    def test2(self):
        bboxes_true = np.array([[-4, 7, -2, 13], [-3, 8, 5, 11], [7, 0, 12, 1]], dtype=np.int32)
        bboxes_pred = np.array([[-3, 8, -2, 11], [-4, 8, -2, 11], [-2, 8, 4, 12], [6, -1, 12, 0]], dtype=np.int32)
        ret = best_matching_bboxes(bboxes_true=bboxes_true, bboxes_pred=bboxes_pred)
        self.assertEqual(ret.tolist(), [1, 2, -1])

    def test3(self):
        bboxes_true = np.array([[1, 1, 2, 2], [2, 2, 3, 3]], dtype=np.int32)
        bboxes_pred = np.array([[1, 2, 2, 3], [2, 1, 3, 2]], dtype=np.int32)
        ret = best_matching_bboxes(bboxes_true=bboxes_true, bboxes_pred=bboxes_pred)
        self.assertEqual(ret.tolist(), [-1, -1])

    def test4(self):
        bboxes_true = np.array([[-3, -13, 0, -10], [-2, -12, 1, -9]], dtype=np.int32)
        bboxes_pred = np.array([[-2, -12, 0, -10], [-3, -13, -1, -11], [-2, -12, 1, -9]], dtype=np.int32)
        ret_ls = best_matching_bboxes(bboxes_true=bboxes_true, bboxes_pred=bboxes_pred).tolist()
        self.assertIn(ret_ls[0], {0, 1})
        self.assertEqual(ret_ls[1], 2)

    def test5(self):
        bboxes_true = np.array([[-3, -13, 0, -10], [-2, -12, 1, -9]], dtype=np.int32)
        bboxes_pred = np.array([[-2, -12, 1, -9], [-3, -13, 0, -10], [-2, -12, 1, -9], [-3, -13, 0, -10]], dtype=np.int32)
        ret_ls = best_matching_bboxes(bboxes_true=bboxes_true, bboxes_pred=bboxes_pred).tolist()
        self.assertIn(ret_ls[0], {1, 3})
        self.assertIn(ret_ls[1], {0, 2})

def suite():
    suite = unittest.TestSuite()
    testfuns = ["test1", "test2", "test3", "test4", "test5"]
    [suite.addTest(TestBestMatchingBBoxes(fun)) for fun in testfuns]
    return suite

runner = unittest.TextTestRunner(verbosity=2)
runner.run(suite())

test1 (__main__.TestBestMatchingBBoxes) ... ok
test2 (__main__.TestBestMatchingBBoxes) ... ok
test3 (__main__.TestBestMatchingBBoxes) ... ok
test4 (__main__.TestBestMatchingBBoxes) ... ok
test5 (__main__.TestBestMatchingBBoxes) ... ok

----------------------------------------------------------------------
Ran 5 tests in 0.020s

OK


<unittest.runner.TextTestResult run=5 errors=0 failures=0>

## Benchmark tesztek

A NumPy megoldásaid futási idejét az alábbi kódblokk méri le. A kód különböző hardvereken futhat (a Colab futtatókörnyezethez is különböző processzorok társulhatnak), ezért különböző futtatási környezetekben mért futási idők nem hasonlíthatók össze.

In [188]:
# Random test argument generation functions for the three exercises

def gen_benchmark_args_A(size1, p_car):
  # -> (2, n) bool_
  assert 1 <= size1
  assert 0. <= p_car <= 1.
  return np.random.rand(2, size1) < p_car

def gen_benchmark_args_B(n_samples, n_cat, accuracy):
  # -> (n_samples, n_cat) fl32, (n_samples,) i32
  assert 1 <= n_samples
  assert 3 <= n_cat
  y_true = np.random.randint(n_cat, size=(n_samples,), dtype=np.int32)   # (n_samples,)
  y_pred_cat = y_true.copy()
  miscat_mask = np.random.rand(n_samples) >= accuracy                    # (n_samples,) bool_
  y_pred_miscat = np.random.randint(n_cat-1, size=np.count_nonzero(miscat_mask))

  # make sure miscategorized samples do not get the correct label to ensure specified accuracy
  y_pred_miscat = np.where(y_pred_miscat < y_true[miscat_mask], y_pred_miscat, y_pred_miscat+1)
  y_pred_cat[miscat_mask] = y_pred_miscat
  y_pred = np.full((n_samples, n_cat), dtype=np.float32, fill_value=-1.)                # (n_samples, n_cat)
  y_pred[np.arange(n_samples), y_pred_cat] = 1

  # randomly scale logits and apply softmax to get various probability values
  y_pred *= np.fabs(np.random.normal(scale=5., size=(n_samples, 1)))  # scale logits within a sample uniformly
  y_pred_exp = np.exp(y_pred)
  y_pred = y_pred_exp / np.sum(y_pred_exp, axis=1, keepdims=True) + 1e-10

  return y_pred, y_true

def gen_benchmark_args_C(n_true_bboxes, n_pred_bboxes, tl_range, size_range):
  # -> (n_true_bboxes, 4), (n_pred_bboxes, 4)
  assert n_true_bboxes >= 1
  assert n_pred_bboxes >= 0
  assert tl_range >= 1
  assert size_range >= 1
  true_tl = np.random.randint(tl_range+1, size=(n_true_bboxes, 2)) - tl_range // 2
  pred_tl = np.random.randint(tl_range+1, size=(n_pred_bboxes, 2)) - tl_range // 2
  true_size = np.random.randint(size_range, size=(n_true_bboxes, 2))+1
  pred_size = np.random.randint(size_range, size=(n_pred_bboxes, 2))+1
  bboxes_true = np.concatenate([true_tl, true_tl+true_size], axis=1)
  bboxes_pred = np.concatenate([pred_tl, pred_tl+pred_size], axis=1)
  return bboxes_true, bboxes_pred

# defining benchmarks test cases
#    smaller "warmup" benchmarks are used to avoid including the time taken to load numpy functions for the first time in main benchmarks

benchmarks = [
              ('task_A, Benchmark #0 (warmup)', n_of_bus_parking_spaces, gen_benchmark_args_A, {'size1': 100000, 'p_car': 0.5}),
              ('task_A, Benchmark #1', n_of_bus_parking_spaces, gen_benchmark_args_A, {'size1': 10000000, 'p_car': 0.5}),
              ('task_A, Benchmark #2', n_of_bus_parking_spaces, gen_benchmark_args_A, {'size1': 200000000, 'p_car': 0.01}),
              ('task_A, Benchmark #3', n_of_bus_parking_spaces, gen_benchmark_args_A, {'size1': 50000000, 'p_car': 0.5}),
              ('task_B, Benchmark #0 (warmup)', multiclass_recall, gen_benchmark_args_B, {'n_samples': 100000, 'n_cat': 10, 'accuracy': 0.5}),
              ('task_B, Benchmark #1', multiclass_recall, gen_benchmark_args_B, {'n_samples': 1000000, 'n_cat': 50, 'accuracy': 0.4}),
              ('task_B, Benchmark #2', multiclass_recall, gen_benchmark_args_B, {'n_samples': 100000000, 'n_cat': 3, 'accuracy': 0.8}),
              ('task_B, Benchmark #3', multiclass_recall, gen_benchmark_args_B, {'n_samples': 300000, 'n_cat': 1000, 'accuracy': 0.2}),
              ('task_C, Benchmark #0 (warmup)', best_matching_bboxes, gen_benchmark_args_C, {'n_true_bboxes': 1000, 'n_pred_bboxes': 500, 'tl_range': 100, 'size_range': 10}),
              ('task_C, Benchmark #1', best_matching_bboxes, gen_benchmark_args_C, {'n_true_bboxes': 3000, 'n_pred_bboxes': 2000, 'tl_range': 300, 'size_range': 10}),
              ('task_C, Benchmark #2', best_matching_bboxes, gen_benchmark_args_C, {'n_true_bboxes': 5000, 'n_pred_bboxes': 10000, 'tl_range': 100, 'size_range': 10}),
              ('task_C, Benchmark #3', best_matching_bboxes, gen_benchmark_args_C, {'n_true_bboxes': 10000, 'n_pred_bboxes': 5000, 'tl_range': 10000, 'size_range': 30})
              ]  # list of (name - str, target_fn: Callable, gen_fn: Callable, gen_kwargs: dict)

# run benchmarks test cases

import time
np.random.seed(0)

print("Running benchmarks...")
for benchmark_item_tup in benchmarks:
  benchmark_name, target_fn, gen_fn, gen_kwargs = benchmark_item_tup
  benchmark_args = gen_fn(**gen_kwargs)
  benchmark_args = benchmark_args if type(benchmark_args) is tuple else (benchmark_args,)
  t0, t1 = None, None
  try:
    t0 = time.time()
    ret = target_fn(*benchmark_args)
    t1 = time.time()
    del ret, benchmark_args
  except:
    pass   # uncomment except clause to see error in case a benchmark failed.
  finally:
    t_delta_str = f"<failed>" if (t0 is None) or (t1 is None) else f"{t1-t0} seconds"
    print(f"    {benchmark_name}: {t_delta_str}. ")


Running benchmarks...
    task_A, Benchmark #0 (warmup): 0.002065420150756836 seconds. 
    task_A, Benchmark #1: 0.26412153244018555 seconds. 
    task_A, Benchmark #2: 6.464077949523926 seconds. 
    task_A, Benchmark #3: 2.0035135746002197 seconds. 
    task_B, Benchmark #0 (warmup): 0.026187419891357422 seconds. 
    task_B, Benchmark #1: 0.6212987899780273 seconds. 
    task_B, Benchmark #2: 11.547792434692383 seconds. 
    task_B, Benchmark #3: 2.0553221702575684 seconds. 
    task_C, Benchmark #0 (warmup): 0.016889572143554688 seconds. 
    task_C, Benchmark #1: 0.3587002754211426 seconds. 
    task_C, Benchmark #2: 2.706800937652588 seconds. 
    task_C, Benchmark #3: 3.368978977203369 seconds. 
