# 1. házi feladat


## A/3

**RPGCharacterKeeper**

A karantén szabályok miatt online kellett folytatnotok a szerepjátékos alkalmakat, ezért kell készítened egy osztályt (**RPGCharacterKeeper**), amely a játékosok karaktereit és azok különböző képességeihez rendelt pontszámait tárolja. Az egyes játékos-karakterekhez hat darab képesség-pontszám tartozik, melyeket egész számokkal reprezentálunk.

Az osztály neve legyen **RPGCharacterKeeper**. Öt publikus metódusa van:
* ``get_all_characters() -> [str]``: Visszaadja az eltárolt játékos-karakterek neveit egy listában.
* ``add_character(name, stats)``: Eltárolja a ``name`` elnevezésű játékos-karakter nevét és a hozzátartozó képességpontokat. Utóbbiakat a ``stats`` paraméteren keresztül adjuk meg: a függvény egy hat hosszúságú integer elemeket tartalmazó listát vár. Ha a ``stats`` argumentum nem hat elemű, *InvalidStatlineException* hibát vált ki.
* ``get_max_stats() -> [int] OR [None]``: Egy hat elemű listában visszaadja a különböző képességek szerinti képességpontok maximumát az összes eddig hozzáadott játékos-karakter felett. Ha nincsenek még eltárolt játékos-karakterek, egy hat darab `None`-t tartalmazó listát kell visszaadnia.
* ``get_stat_sums() -> {str: int}``: Visszaad egy szótárt, melynek kulcsai az eddig hozzáadott játékos-karakterek nevei, értékei pedig az adott játékos-karakterek képességpontjainak összegei.
* ``get_average_joes() -> [str]``: Visszaadja azon játékos-karakterek neveit, akiknek a hatból legalább négy képesség-pontszámuk éppen 10.

### Megoldás

In [1]:

# Your solution ->
class InvalidStatlineException(Exception):
    pass

class RPGCharacterKeeper:
    STAT_LIST_SIZE = 6

    def __init__(self):
        self.data = []

    def get_all_characters(self):
        return [entry[0] for entry in self.data]

    def add_character(self, name, stats):
        if len(stats) != RPGCharacterKeeper.STAT_LIST_SIZE:
            raise InvalidStatlineException()

        self.data.append((name, stats))

    def get_max_stats(self):
        if not self.data:
            return [None] * RPGCharacterKeeper.STAT_LIST_SIZE

        return [max(column) for column in zip(*(entry[1] for entry in self.data))]

    def get_stat_sums(self):
        return {entry[0] : sum(entry[1]) for entry in self.data}

    def get_average_joes(self):
        return [entry[0]
                for entry in self.data
                if len([ind for (ind, score) in enumerate(entry[1]) if score == 10]) >= 4]


### Tesztek

In [2]:
import unittest

class TestRPGCharacterKeeper(unittest.TestCase):
    def test_add_get_characters(self):
        rk = RPGCharacterKeeper()
        self.assertEqual(rk.get_all_characters(), [])

        self.assertRaises(InvalidStatlineException, rk.add_character, "Vex", [10]*5)

        rk.add_character("Vex", [7, 20, 10, 14, 16, 17])
        self.assertEqual(rk.get_all_characters(), ["Vex"])

        rk.add_character("Grog", [19, 15, 20, 6, 10, 13])
        rk.add_character("Percy", [12, 22, 14, 20, 16, 14])
        characters = rk.get_all_characters()
        self.assertEqual(len(characters), 3)
        self.assertTrue("Vex" in characters)
        self.assertTrue("Grog" in characters)
        self.assertTrue("Percy" in characters)

    def test_get_max_stats(self):
        rk = RPGCharacterKeeper()
        self.assertTrue(all(stat is None for stat in rk.get_max_stats()))

        frontline_stats = [20, 19, 18, 8, 8, 8]
        rk.add_character("mr fighter", frontline_stats)
        self.assertEqual(rk.get_max_stats(), frontline_stats)

        mental_stats = [8, 8, 8, 18, 19, 20]
        rk.add_character("mr caster", mental_stats)
        self.assertEqual(rk.get_max_stats(), [20, 19, 18, 18, 19, 20])
        

    def test_get_stat_sums(self):
        rk = RPGCharacterKeeper()
        self.assertEqual(rk.get_stat_sums(), {})

        rk.add_character("Vex", [7, 20, 10, 14, 16, 17])
        self.assertEqual(rk.get_stat_sums(), {"Vex": 84})

        rk.add_character("Grog", [19, 15, 20, 6, 10, 13])
        rk.add_character("Percy", [12, 22, 14, 20, 16, 14])
        stat_sums = rk.get_stat_sums()
        self.assertEqual(stat_sums["Vex"], 84)
        self.assertEqual(stat_sums["Grog"], 83)
        self.assertEqual(stat_sums["Percy"], 98)


    def test_get_average_joes(self):
        rk = RPGCharacterKeeper()
        self.assertEqual(rk.get_average_joes(), [])

        rk.add_character("Grog", [19, 15, 20, 6, 10, 13])
        rk.add_character("Percy", [12, 22, 14, 20, 16, 14])
        self.assertEqual(rk.get_average_joes(), [])

        rk.add_character("Jacob Plaster", [10]*6)
        self.assertEqual(rk.get_average_joes(), ["Jacob Plaster"])
        
        rk.add_character("Bob", [14, 14] + [10]*4)
        joes = rk.get_average_joes()
        self.assertEqual(len(joes), 2)
        self.assertTrue("Bob" in  joes)
        self.assertTrue("Jacob Plaster" in  joes)
       

def suite():
    suite = unittest.TestSuite()
    testfuns = ["test_add_get_characters", "test_get_max_stats", "test_get_stat_sums",
                "test_get_average_joes"]
    [suite.addTest(TestRPGCharacterKeeper(fun)) for fun in testfuns]
    return suite

runner = unittest.TextTestRunner(verbosity=2)
runner.run(suite())

test_add_get_characters (__main__.TestRPGCharacterKeeper) ... ok
test_get_max_stats (__main__.TestRPGCharacterKeeper) ... ok
test_get_stat_sums (__main__.TestRPGCharacterKeeper) ... ok
test_get_average_joes (__main__.TestRPGCharacterKeeper) ... ok

----------------------------------------------------------------------
Ran 4 tests in 0.021s

OK


<unittest.runner.TextTestResult run=4 errors=0 failures=0>

## B/2 

**Fals negatív arány** (False negative rate)

Multiclass klasszifikáció esetén a mintaelemeink címkéjét k kategória egyikébe becsüljük (például kutya, macska, papagáj, stb.). Ha a becsléshez neuronhálót használunk, tipikusan, mintaelemenként egy-egy k elemű, valószínűségeket tartalmazó vektort kapunk, ahol az egyes valószínűségek a mintaelem egyes kategóriákba tartozásának valószínűségét reprezentálják. Ha szeretnénk ezekből a vektorokból megmondani, hogy egy-egy mintaelem melyik kategóriába tartozik a legnagyobb valószínűség szerint, akkor elég megmondani minden egyes vektorban a maximális elem indexét. Így megkapjuk a becsült kategóriákat.

Klasszifikációs modellek teljesítményének mérésére különböző metrikák léteznek (pl. pontosság - accuracy, precizitás - precision, szenzitivitás - recall, stb.). Az egyes metrikák a teljesítményt csak bizonyos szempontok szerint értékelik, jellemzően, egy modell egyetlen metrikával történő kiértékelése nem ad teljes képet a modell klasszifikációs teljesítményéről.

Ebben a feladatban a **Fals negatív arány** (False negative rate, miss rate, FNR) metrikát kell implementálnod a **multiclass** (kettőnél több kategóriás) **klasszifikáció esetére.** A multiclass fals negatív arány, kategóriák felett átlagolva, azt adja meg, hogy egy választott kategóriába valójában tartozó elemeket milyen arányban soroltunk mégis, (hibásan) bármelyik eltérő kategóriába. Minél nagyobb ez az érték, annál rosszabbak a becsléseink.

Számolásához a bináris (két kategóriás) esetből indulhatunk ki. Ilyenkor az egyik, választott kategóriánk a pozitív kategória, míg a másik a negatív kategória. A bináris fals negatív arány így a következő:

$$ FNR = \dfrac{FN}{VP+FN} $$

ahol VP a valódi pozitívok (azaz ahol a pozitív kategóriát helyesen becsültük) száma, FN pedig a fals negatívok száma (azaz ahol a negatív kategóriát helytelenül becsültük).  A nevező tehát egyenlő azzal, hogy hány elem tartozik valójában a pozitív kategóriába.

Multiclass esetben minden kategóriára számoljuk a fenti arányt úgy, hogy az aktuális kategória a pozitív kategória és mindegyik másik kategória együttvéve a negatív kategória. Az így, kategóriánként kapott FNR értékeknek az átlaga adja meg a multiclass FNR metrikát.

A feladat, hogy implementáld a `false_negative_rate` függvényt, ami két paramétert kap:
*   `y_pred` tartalmazza becsült valószínűségeket (ez egy (m, k) alakú tömb, ahol  m  a mintaelemek és  k  a kategóriák száma) 
*   `y_true` tartalmazza az igazi kategóriacímkéket (ez egy (m,) alakú tömb)

A függvény egy számot ad vissza, a kategóriákra egyenként számolt bináris FNR értékek átlagát.

**Kikötés:**  Az implementációt vektoros módon, NumPy-ban, ciklusok és egyéb, annak megfelelő Python konstrukciók használata nélkül kell elkészíteni. További részletek a notebook végén.

### Megoldás

In [3]:
import numpy as np

# Your solution ->
def false_negative_rate(y_pred, y_true):
    pred_classes = np.argmax(y_pred, axis=1)
    class_cnt = y_pred.shape[1]

    # https://www.mdpi.com/2227-7080/9/4/81/htm
    counts = np.bincount(y_true * class_cnt + pred_classes)
    # pads only if we haven't predicted the last category (it is not in y_true) or
    # if it is not in pred_classes
    confusion_mx = np.pad(counts, (0, class_cnt * class_cnt - len(counts)), 'constant').reshape((class_cnt, class_cnt))

    per_class_true_pos = np.diagonal(confusion_mx)
    per_class_true_pos_plus_false_neg = np.sum(confusion_mx, axis=1)
    per_class_false_neg = per_class_true_pos_plus_false_neg - per_class_true_pos

    # to avoid warning when dividing with 0 in case of 0/0
    summed = np.sum(np.divide(per_class_false_neg,
                              per_class_true_pos_plus_false_neg,
                              out=np.zeros(per_class_false_neg.shape),
                              where=per_class_true_pos_plus_false_neg!=0))

    return summed / class_cnt


### Tesztek

In [4]:
import unittest

class TestFNR(unittest.TestCase):

    def test_two_classes(self):
        two_class_preds = np.array([[0.4, 0.6], [0.8, 0.2], [0.55, 0.45], [0.1, 0.9]])
        two_class_labels = np.array([0,0,1,1])
        self.assertAlmostEqual(false_negative_rate(two_class_preds, two_class_labels), 0.5)

    def test_three_classes(self):
        three_class_preds = np.array([[0.4, 0.3, 0.3], [0.1, 0.5, 0.4], 
                                    [0.3, 0.2, 0.5], [0.4, 0.25, 0.35]])
        three_class_labels = np.array([0, 1, 2, 2])
        self.assertAlmostEqual(false_negative_rate(three_class_preds, three_class_labels), 1/6)

    def test_four_classes(self):
        four_class_preds = np.array([[1., 0., 0., 0.], [1., 0., 0., 0.], 
                                     [0., 0., 1., 0.], [0., 0., 1., 0.],
                                     [0., 1., 0., 0.], [0., 0., 0., 1.],
                                     ])  # [0,0,2,2,1,3]
        four_class_labels = np.array([0, 2, 1, 1, 1, 3])
        self.assertAlmostEqual(false_negative_rate(four_class_preds, four_class_labels), 5/12)

def suite():
    suite = unittest.TestSuite()
    testfuns = ["test_two_classes", "test_three_classes", "test_four_classes"]
    [suite.addTest(TestFNR(fun)) for fun in testfuns]
    return suite

runner = unittest.TextTestRunner(verbosity=2)
runner.run(suite())

test_two_classes (__main__.TestFNR) ... ok
test_three_classes (__main__.TestFNR) ... ok
test_four_classes (__main__.TestFNR) ... ok

----------------------------------------------------------------------
Ran 3 tests in 0.010s

OK


<unittest.runner.TextTestResult run=3 errors=0 failures=0>

## C/1

**Sudoku**

Készíts egy **SudokuBoard** nevű osztályt, ami a Sudoku táblát reprezentálja! A Sudoku egy 9x9-es tábla, ami 3x3-as blokkokra van osztva a sorok és oszlopok mentén. 1-től 9-ig kell elhelyeznünk a számokat úgy, hogy minden sorban, oszlopban, és blokkban a számok egyszer szerepeljenek.

Emellett az osztály a következő tagfüggvényekkel kell, hogy rendelkezzen:

*   `can_place(row_idx, col_idx, number) -> bool` : a függvény egy logikai értéket ad vissza, mely megadja, hogy a Sudoku szabályai szerint elhelyezhető-e a `number` szám a tábla `col_idx`, `row_idx` pozícióján. A sorok és oszlopok indexelése nullától kezdődik.
*   `place(row_idx, col_idx, number) -> bool` : a függvény működése azonos az előző függvényével, azt leszámítva, hogy ha a megadott szám elhelyezhető a tábla megadott pozícióján, akkor ez a függvény el is helyezi azt.
*   `get_row_idx_with_highest_sum() -> int` : a függvény megadja annak a sornak az indexét, melyben a beírt számok összege maximális. Ha több ilyen van, az egyiket kell visszadni közülük.
*   `get_num_cols_where_number_is_present(number) -> int` : a függvény megadja hány darab olyan oszlop van, amiben a paraméterben megadott `number` szám szerepel.
*   `get_empty_block_idxs() -> ndarray(n_blocks_ret, 2) of int32` : a függvény egy (n_blocks_ret, 2) alakú tömbben visszaadja azoknak a 3x3-as blokkoknak az indexét, melyekbe még nem került szám. A blokkok pozícióját darabonként két index adja meg. Ha mátrixokként tekintünk a táblára, akkor például a bal alsó blokk indexe ``[2, 0]`` lesz.
*   `get_max_of_rows_where_num_is_present(number) -> int` : a függvény visszadja azoknak a soroknak az együttesen vett maximumát, melyekben szerepel a ``number`` szám. Amennyiben a ``number`` szám nem szerpel a táblában, adjon 0 értéket vissza a függvény!

**Kikötés:**  Az implementációt vektoros módon, NumPy-ban, ciklusok és egyéb, annak megfelelő Python konstrukciók használata nélkül kell elkészíteni. További részletek a notebook végén.



### Megoldás

In [5]:
import numpy as np

# Your solution ->
class SudokuBoard:
    SIZE = 9
    BLOCK_SIZE = 3
    assert SIZE % BLOCK_SIZE == 0

    def __init__(self):
        # Note: 0 represents the empty field
        #self.board = np.arange(1,82).reshape((9,9))
        self.board = np.zeros(shape=(SudokuBoard.SIZE, SudokuBoard.SIZE), dtype=np.int32)

    """ :returns a slice tuple, that can be used to index the block that contains the given index """
    def __get_block_indices(self, row_idx, col_idx):
        block_row_start = np.int32(np.trunc(row_idx / SudokuBoard.BLOCK_SIZE)) * 3
        block_col_start = np.int32(np.trunc(col_idx / SudokuBoard.BLOCK_SIZE)) * 3

        return np.s_[block_row_start:(block_row_start + SudokuBoard.BLOCK_SIZE),
                     block_col_start:(block_col_start + SudokuBoard.BLOCK_SIZE)]

    def can_place(self, row_idx, col_idx, number):
        # can't overwrite value
        if self.board[row_idx, col_idx] != 0:
            return False

        # check according to the game rules
        mask = np.full_like(self.board, dtype=np.bool_, fill_value=False)
        mask[row_idx], mask[:,col_idx], mask[self.__get_block_indices(row_idx, col_idx)] = True, True, True

        return not np.any(self.board[mask] == number)

    def place(self, row_idx, col_idx, number):
        if not self.can_place(row_idx, col_idx, number):
            return False

        self.board[row_idx, col_idx] = number

        return True

    def get_row_idx_with_highest_sum(self):
        return np.argmax(self.board.sum(axis=1))

    def get_num_cols_where_number_is_present(self, number):
        return np.count_nonzero(np.isin(self.board, number).any(axis=0))

    def get_empty_block_idxs(self):
        h_splits = np.hsplit(self.board, SudokuBoard.BLOCK_SIZE)
        empty_blocks = np.all(np.array(h_splits).flatten().reshape(SudokuBoard.SIZE,-1) == 0, axis=1)
        indices = np.indices((SudokuBoard.BLOCK_SIZE,SudokuBoard.BLOCK_SIZE)).transpose(2,1,0).reshape(SudokuBoard.SIZE,-1)

        return indices[empty_blocks]

    def get_max_of_rows_where_num_is_present(self, number):
        mask = np.isin(self.board, number).any(axis=1)
        
        return self.board[mask].max(initial=0)


### Tesztek

In [6]:
import unittest

class TestSudoku(unittest.TestCase):
    def test_can_place(self):
        sb = SudokuBoard()
        self.assertTrue(sb.can_place(0, 0, 5))
        self.assertTrue(sb.can_place(8, 0, 5))
        self.assertTrue(sb.can_place(0, 8, 5))
        self.assertTrue(sb.can_place(4, 6, 5))
        self.assertTrue(sb.can_place(8, 8, 5))

        sb.place(3, 3, 5)
        self.assertFalse(sb.can_place(3, 3, 7))
        self.assertFalse(sb.can_place(5, 4, 5))
        self.assertFalse(sb.can_place(7, 3, 5))
        self.assertFalse(sb.can_place(3, 7, 5))
        
        self.assertTrue(sb.can_place(2, 4, 5))
        self.assertTrue(sb.can_place(3, 4, 6))

    def test_place(self):
        sb = SudokuBoard()
        self.assertTrue(sb.place(2, 7, 4))
        self.assertFalse(sb.place(2, 7, 4))
        self.assertFalse(sb.place(2, 7, 5))
        self.assertTrue(sb.place(2, 0, 5))
        self.assertFalse(sb.place(2, 8, 5))

    def test_get_row_idx_with_highest_sum(self):
        sb = SudokuBoard()
        sb.place(5, 6, 3)
        self.assertEqual(sb.get_row_idx_with_highest_sum(), 5)
        
        to_insert = [(1, 0, 3), (1, 7, 6), (2, 1, 4), (2, 2, 2), (2, 8, 1), (3, 7, 8)]
        [sb.place(*t) for t in to_insert]
        self.assertEqual(sb.get_row_idx_with_highest_sum(), 1)
        
        to_insert = [(2, 3, 5), (5, 8, 4), (5, 1, 6)]
        [sb.place(*t) for t in to_insert]
        self.assertEqual(sb.get_row_idx_with_highest_sum(), 5)

    def test_get_num_cols_where_number_is_present(self):
        sb = SudokuBoard()
        self.assertEqual(sb.get_num_cols_where_number_is_present(9), 0)
        self.assertEqual(sb.get_num_cols_where_number_is_present(1), 0)
        
        to_insert = [(1, 0, 3), (2, 7, 3), (2, 1, 4), (5, 8, 4), (8, 0, 4), (3, 7, 8)]
        [sb.place(*t) for t in to_insert]
        self.assertEqual(sb.get_num_cols_where_number_is_present(9), 0)
        self.assertEqual(sb.get_num_cols_where_number_is_present(3), 2)
        self.assertEqual(sb.get_num_cols_where_number_is_present(4), 3)
        self.assertEqual(sb.get_num_cols_where_number_is_present(8), 1)

    def test_get_empty_block_idxs(self):
        sb = SudokuBoard()
        ret = sb.get_empty_block_idxs()
        self.assertEqual(ret.shape, (9, 2))
        self.assertEqual(tuple(np.sum(ret, axis=0)), (9, 9))

        to_insert = [(1, 0, 3), (2, 7, 3), (2, 1, 4), (5, 8, 4), (8, 0, 4), (3, 7, 8)]
        [sb.place(*t) for t in to_insert]
        ret = sb.get_empty_block_idxs()
        self.assertEqual(ret.shape, (5, 2))
        self.assertEqual(tuple(np.sum(ret, axis=0)), (6, 5))

        to_insert = [(1, 4, 9), (3, 2, 6), (3, 3, 7), (8, 5, 1), (8, 8, 2)]
        [sb.place(*t) for t in to_insert]
        ret = sb.get_empty_block_idxs()
        self.assertEqual(ret.shape, (0, 2))

    def test_get_max_of_rows_where_num_is_present(self):
        sb = SudokuBoard()
        self.assertEqual(sb.get_max_of_rows_where_num_is_present(4), 0)
        self.assertEqual(sb.get_max_of_rows_where_num_is_present(9), 0)

        to_insert = [(1, 0, 3), (2, 7, 3), (2, 1, 4), (5, 8, 4), (8, 0, 4), (3, 7, 8)]
        [sb.place(*t) for t in to_insert]
        self.assertEqual(sb.get_max_of_rows_where_num_is_present(4), 4)
        self.assertEqual(sb.get_max_of_rows_where_num_is_present(3), 4)
        self.assertEqual(sb.get_max_of_rows_where_num_is_present(8), 8)
        self.assertEqual(sb.get_max_of_rows_where_num_is_present(7), 0)

        to_insert = [(1, 4, 9), (3, 2, 6), (3, 3, 7), (8, 5, 1), (8, 8, 2)]
        [sb.place(*t) for t in to_insert]
        self.assertEqual(sb.get_max_of_rows_where_num_is_present(5), 0)
        self.assertEqual(sb.get_max_of_rows_where_num_is_present(3), 9)
        self.assertEqual(sb.get_max_of_rows_where_num_is_present(4), 4)
        self.assertEqual(sb.get_max_of_rows_where_num_is_present(6), 8)
        self.assertEqual(sb.get_max_of_rows_where_num_is_present(1), 4)
        
def suite():
    suite = unittest.TestSuite()
    testfuns = ["test_can_place", "test_place", "test_get_row_idx_with_highest_sum",
                "test_get_num_cols_where_number_is_present", "test_get_empty_block_idxs",
                "test_get_max_of_rows_where_num_is_present"]
    [suite.addTest(TestSudoku(fun)) for fun in testfuns]
    return suite

runner = unittest.TextTestRunner(verbosity=2)
runner.run(suite())

test_can_place (__main__.TestSudoku) ... ok
test_place (__main__.TestSudoku) ... ok
test_get_row_idx_with_highest_sum (__main__.TestSudoku) ... ok
test_get_num_cols_where_number_is_present (__main__.TestSudoku) ... ok
test_get_empty_block_idxs (__main__.TestSudoku) ... ok
test_get_max_of_rows_where_num_is_present (__main__.TestSudoku) ... ok

----------------------------------------------------------------------
Ran 6 tests in 0.035s

OK


<unittest.runner.TextTestResult run=6 errors=0 failures=0>