[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/prokaj/elte-python-2024/blob/main/2024-10-02.ipynb)   

# Házi feladatok



## Feladat




Írjunk egy függvényt `max_sum` névvel, ami a bemenetként kap egy számokból álló listát valamint egy `k`
pozitív egész számot és kiszámolja azt a maximális értéket, amit a sorozat `k` egymást követő elemének összegzésével kaphatunk.


pl. `max_sum(list(range(10)), 2)` értéke 17.

Feltehető, hogy a bemenetként kapott számlista hossza legalább `k`

In [None]:
def max_sum(lst, k):
    max_value = 0
    for i in range(k):
        max_value += lst[i]
    for i in range(k, len(lst)):
        value = 0
        for j in range(k):
            value += lst[i-j]
        if value > max_value:
            max_value = value
    return max_value


Néhány teszt eset:

In [None]:
print(f"{max_sum([1,2,3,4], 1)=}")
print(f"{max_sum([1,2,3,4], 2)=}")
print(f"{max_sum([1,2,-3,-4], 1)=}")



max_sum([1,2,3,4], 1)=4
max_sum([1,2,3,4], 2)=7
max_sum([1,2,-3,-4], 1)=2


Mi történik, ha a lista hosszú, pl. `n = 100_000`, `k` szintén nagy `k = 50_000`.

A szükséges műveletek száma a naív megoldásnál $(n-k)*k$, ami az előző beállításnál `50_000^2 = 2.5e9`.

Nézzük meg a futási időt, `n = 100, 500, 1000, 5_000, 10_000` és `k = n//2`-vel.

In [None]:
import time
import random

running_times = []
for n in [100, 500, 1000, 5000, 10000]:
    k = n//2
    lst = [random.randint(0, 2_000_000_000) for _ in range(n)]
    start_time = time.perf_counter_ns()
    max_sum(lst, k)
    running_times.append([n, time.perf_counter_ns()-start_time])

print(*running_times, sep="\n")


[100, 542195]
[500, 13040516]
[1000, 56547980]
[5000, 853217277]
[10000, 4552431166]


Lehet-e optimalizálni a megoldást?

In [None]:
def max_sum_fast(lst, k):
    max_value = 0
    for i in range(k):
        max_value += lst[i]
    value = max_value
    for i in range(k, len(lst)):
        value += lst[i] - lst[i-k]
        if value > max_value:
            max_value = value
    return max_value


Két megoldásunk van ugyanarra a feladatra, az egyik egyszerű és lassú, de megbizható, mert szó szerint leprogramoztuk a feladatot, a másik optimalizált.

Tesztelés:

Ha ugyanazt kapjuk mindkettővel, akkor valószínűleg mindkettő jó, ha nem akkor keressük meg az eltérés okát, javítsuk ki és teszteljünk újra.

In [None]:
max_sum([1,2,3,4], 1) == max_sum_fast([1,2,3,4], 1)

True

In [None]:
max_sum([1,2,3,4], 2) == max_sum_fast([1,2,3,4], 2)

True

In [None]:
max_sum([1,2,-3,-4], 1) == max_sum_fast([1,2,-3,-4], 1)

True

Lehet-e ügyesebben csinálni?

In [None]:
test_cases = [([1, 2, 3, 4], 1), ([1, 2, 3, 4], 2), ([1,2,-3,-4], 1)]
for lst, k in test_cases:
    result = max_sum(lst, k)
    result_fast = max_sum_fast(lst, k)
    if result != result_fast:
        print(f"{lst=}, {k=} esetén a két függvényérték eltér:\n\tmax_sum: {result}\n\tmax_sum_fast: {result_fast}")

Az egyes teszt esetekhez írhatunk külön függvényeket is.

In [None]:
def test_short_list():
    test_cases = [([1, 2, 3, 4], 1), ([1, 2, 3, 4], 2), ([1,2,-3,-4], 1)]
    for lst, k in test_cases:
        assert max_sum(lst, k) == max_sum_fast(lst, k)

n = 100
max_int = 1<<31

def test_random_list():
    k = random.randint(1, n)
    lst = [random.randint(-max_int, max_int) for _ in range(n)]
    assert max_sum(lst, k) == max_sum_fast(lst, k)



In [None]:
test_short_list()
test_random_list()
test_random_list()
test_random_list()
print('Test passed')

Test passed


Most minden működött. Hiba esetén beszédesebb üzenetet kapunk, ha `pytest` modult használjuk. Jupyter notebookban ezt az `ipytest` modullal érjük el.
Ezt külön telepíteni kell, nem része a Pythonnak.

In [None]:
import importlib

In [None]:
if importlib.util.find_spec('ipytest') is None:
    ! pip install ipytest
import ipytest
ipytest.autoconfig()

Collecting ipytest
  Downloading ipytest-0.13.3-py3-none-any.whl (14 kB)
Collecting jedi>=0.16 (from ipython->ipytest)
  Downloading jedi-0.19.0-py2.py3-none-any.whl (1.6 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.6/1.6 MB[0m [31m18.8 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: jedi, ipytest
Successfully installed ipytest-0.13.3 jedi-0.19.0


In [None]:
%%ipytest

def test_short_list():
    test_cases = [([1, 2, 3, 4], 1), ([1, 2, 3, 4], 2), ([1,2,-3,-4], 1)]
    for lst, k in test_cases:
        assert max_sum(lst, k) == max_sum_fast(lst, k)

n = 100
max_int = 1<<31

def test_random_list():
    for _ in range(10):
        k = random.randint(1, n)
        lst = [random.randint(-max_int, max_int) for _ in range(n)]
        assert max_sum(lst, k) == max_sum_fast(lst, k)


[32m.[0m[32m.[0m[32m                                                                                           [100%][0m
[32m[32m[1m2 passed[0m[32m in 0.02s[0m[0m


## Feladat


Írjunk egy függvényt `min_prod` névvel, ami a bemenetként kap egy számokból álló listát valamint egy `k` pozitív egész számot és kiszámolja azt a minimális értéket, amit a sorozat `k` egymást követő elemének összeszorzásával kaphatunk.

pl. `min_prod(list(range(10)), 2)` értéke 0.

Feltehető, hogy a bemenetként kapott számlista hossza legalább `k`.

Itt is kezdhetjük a nem optimalizált megoldással, csak az összeadást kell szorzásra cserélni és az üres szorzat 1 nem pedig 0.

In [None]:
def min_prod(lst, k):
    min_prod = 1
    for i in range(k):
        min_prod *= lst[i]

    for i in range(k, len(lst)):
        prod_value = 1
        for j in range(k):
            prod_value *= lst[i-j]
        if prod_value < min_prod:
            min_prod = prod_value

    return min_prod

Néhány teszt eset:

In [None]:
print(f"{min_prod([1,2,3,4], 1)=}")
print(f"{min_prod([1,2,3,4], 2)=}")
print(f"{min_prod([1,2,-3,-4], 1)=}")
print(f"{min_prod([1,2,-3,-4], 2)=}")
print(f"{min_prod([1,2,0,-3,-4,0], 3)=}")



min_prod([1,2,3,4], 1)=1
min_prod([1,2,3,4], 2)=2
min_prod([1,2,-3,-4], 1)=-4
min_prod([1,2,-3,-4], 2)=-6
min_prod([1,2,0,-3,-4,0], 3)=0


Optimalizált változat.

Jó-e a következő?

In [None]:
def min_prod_fast(lst, k):
    min_prod = 1
    for i in range(k):
        min_prod *= lst[i]

    prod_value = min_prod
    for i in range(k, len(lst)):
        prod_value = (prod_value//lst[i-k])*lst[i]
        if prod_value < min_prod:
            min_prod = prod_value

    return min_prod


In [None]:
%%ipytest

def test_min_prod_short_list():
    test_cases = [([1, 2, 3, 4], 1), ([1, 2, 3, 4], 2), ([1,2,-3,-4], 1)]
    for lst, k in test_cases:
        assert min_prod(lst, k) == min_prod_fast(lst, k)




[32m.[0m[32m                                                                                            [100%][0m
[32m[32m[1m1 passed[0m[32m in 0.01s[0m[0m


Nyugodtak lehetünk-e, hogy jó a függvényünk?

In [None]:
%%ipytest

n = 100
max_int = 1<<31

def test_random_list():
    for _ in range(10):
        k = random.randint(1, n)
        lst = [random.randint(-max_int, max_int) for _ in range(n)]
        assert min_prod(lst, k) == min_prod_fast(lst, k)



[32m.[0m[32m                                                                                            [100%][0m
[32m[32m[1m1 passed[0m[32m in 0.02s[0m[0m


In [None]:
%%ipytest

n = 100
max_int = 100

def test_random_list():
    for _ in range(10):
        k = random.randint(1, n)
        lst = [random.randint(-max_int, max_int) for _ in range(n)]
        assert min_prod(lst, k) == min_prod_fast(lst, k)


[32m.[0m[32m                                                                                            [100%][0m
[32m[32m[1m1 passed[0m[32m in 0.02s[0m[0m


### Feladat

Hogy lehetne kijavítani az optimalizált kódot?

In [None]:
def min_prod_fast(lst, k):
    min_prod = 1
    for i in range(k):
        min_prod *= lst[i]

    prod_value = min_prod
    for i in range(k, len(lst)):
        prod_value = (prod_value//lst[i-k])*lst[i]
        if prod_value < min_prod:
            min_prod = prod_value

    return min_prod

### Szorgalmi hf.

Prímtényezős felbontás.

In [None]:
def prime_factors(n):
    factors = []
    for i in range(2, n+1):
        while n % i == 0:
            factors.append(i)
            n //= i
    return factors

Az előző kód a copilot javaslata a név alapján. Javítsuk ki, és gyorsítsunk rajta.

# További feladatok a múlt óráról megmaradtakon kívül

### Feladat

Adott egy dictionary, amiben hallgatók adatai szerepelnek. Minden neptun kódhoz két adat van feljegyezve, a név (`name`) és az előző félév tanulmányi átlaga (`avg`).

Írjunk egy függvényt `list_students` névvel, aminek első paramétere a hallgatók adatait tartalmazó dictionary `students` névvel, a második pedig egy lebegő pontos szám a [1,5] intervallumból `min_avg` névvel, végül a visszatérési értéke azon hallgatók listája `name (neptun kód)` formátumban, akiknek az átlaga a megadott értéket elérte.

A függvényünket lássuk el típus annotációval és adjuk hozzá a következő dokumentációs sztringet:

```text
list of students having at least min_avg result
```

A hallgatók neveit rendezzük lexikografikus sorrendbe.
Pl.

```python
students = {
    "ACF234": {"name": "Kiss Lajos", "avg": 3.5},
    "NBF4DF": {"name": "Nagy Blanka" , "avg": 4.5},
    "KUDFGE": {"name": "Kiss Lajos", "avg": 4.75},
    "BNDF23": {"name": "Boros Attila", "avg": 2.75},
    "ADGTLE": {"name": "Poros Elek", "avg": 2.0},
}
list_students(students, 4)
# -> ["Kiss Lajos (KUDFGE)", "Nagy Blanka (NBF4DF)"]
```

A fenti függvény mellett írjunk teszt függvényt is, ami legalább az alábbi esetekre ellenőrzi a helyes működést.

- A hallgatók adatait tartalmazó dictionary üres.

- Legalább öt hallgatót tartalmazó adatsorból senki sincs aki eléri a megadott küszöböt.

- Legalább öt hallgatót tartalmazó adatsorból mindenki eléri a megadott küszöböt.

- Legalább öt hallgatót tartalmazó adatsorból körülbelül a hallgatók fele éri el a megadott küszöböt.

- Van olyan hallgató, akinek tanulmányi átlaga pont a megadott küszöb.

In [None]:
def list_students(students: dict, min_avg: float) -> list:
    """list of students having at least min_avg result"""
    pass

In [None]:
%%ipytest

def test_empty():
    assert list_students({}, 2.0) == []

def test_min_avg_high():
    students = {
        "ACF234": {"name": "Kiss Lajos", "avg": 3.5},
        "NBF4DF": {"name": "Nagy Blanka" , "avg": 4.5},
        "KUDFGE": {"name": "Kiss Lajos", "avg": 4.75},
        "BNDF23": {"name": "Boros Attila", "avg": 2.75},
        "ADGTLE": {"name": "Poros Elek", "avg": 2.0},
    }
    assert list_students(students, 4.8) == []

def test_min_avg_low():
    students = {
        "ACF234": {"name": "Kiss Lajos", "avg": 3.5},
        "NBF4DF": {"name": "Nagy Blanka" , "avg": 4.5},
        "KUDFGE": {"name": "Kiss Lajos", "avg": 4.75},
        "BNDF23": {"name": "Boros Attila", "avg": 2.75},
        "ADGTLE": {"name": "Poros Elek", "avg": 2.0},
    }
    list_of_students = sorted((student['name'], neptun_id) for neptun_id, student in students.items())

    assert list_students(students, 1.8) == [f"{name} ({neptun})" for name, neptun in list_of_students]


def test_half():
    students = {
        "ACF234": {"name": "Kiss Lajos", "avg": 3.5},
        "NBF4DF": {"name": "Nagy Blanka" , "avg": 4.5},
        "KUDFGE": {"name": "Kiss Lajos", "avg": 4.75},
        "BNDF23": {"name": "Boros Attila", "avg": 2.75},
        "ADGTLE": {"name": "Poros Elek", "avg": 2.0},
    }
    assert list_students(students, 3.2) == [
        "Kiss Lajos (ACF234)",
        "Kiss Lajos (KUDFGE)",
        "Nagy Blanka (NBF4DF)"
        ]

def test_equal():
    students = {
        "ACF234": {"name": "Kiss Lajos", "avg": 3.5},
        "NBF4DF": {"name": "Nagy Blanka" , "avg": 4.5},
        "KUDFGE": {"name": "Kiss Lajos", "avg": 4.75},
        "BNDF23": {"name": "Boros Attila", "avg": 2.75},
        "ADGTLE": {"name": "Poros Elek", "avg": 2.0},
    }
    assert list_students(students, 3.5) == [
        "Kiss Lajos (ACF234)",
        "Kiss Lajos (KUDFGE)",
        "Nagy Blanka (NBF4DF)"
        ]



[32m.[0m[32m.[0m[32m.[0m[32m.[0m[32m.[0m[32m                                                                                        [100%][0m
[32m[32m[1m5 passed[0m[32m in 0.03s[0m[0m


### Feladat

Gráfok csúcsait gyakran rövid sztringekkel címkézik. Írjunk egy függvényt, aminek egyetlen paramétere az élek listája, visszatérési értéke pedig egy dictionary, ami minden csúcshoz egy listát tárol a szomszédos csúcsok címkéivel.

Többszörös él esetén is minden csúcs legfeljebb egyszer szerepeljen a listában. A szomszédokat lexikografikusan rendezve soroljuk fel!

Pl. ha

```python
edges = [("A", "B"), ("C", "A"), ("A", "D"), ("C","D"), ("D", "C"), ("E", "E")]
```

és a függvényünk neve `neighbors`, akkor a `neighbors(edges)` hívás eredménye:

```
{
    "A" : ["B", "C", "D"],
    "B" : ["A"],
    "C" : ["A", "D"],
    "D" : ["A", "C"],
    "E" : ["E"],
}
```

Lássuk el a függvényt típus annotációval és adjuk hozzá a következő dokumentációs sztringet:

```text
sparse adjacency matrix of a graph given by edges
```

A fenti függvény mellett írjunk teszt függvényt is, ami legalább az alábbi esetekre ellenőrzi a helyes működést.

- Az élek listája üres.

- Legalább öt él esetén minden él hurok él.

- Legalább négy pont esetén bármely két pont között megy él.

- Legalább öt él esetén nem összefüggő a gráf.

- Legalább öt él esetén van többszörös él.

In [None]:
def neighbors(edges: list) -> dict:
    """sparse adjacency matrix of a graph given by edges"""
    pass

In [None]:
%%ipytest

import itertools

def test_empty():
    assert neighbors([]) == {}

def test_loops():
    edges = [("A", "A"), ("B", "B"), ("C", "C"), ("D", "D"), ("E", "E")]
    assert neighbors(edges) == {
        "A": ["A"],
        "B": ["B"],
        "C": ["C"],
        "D": ["D"],
        "E": ["E"]
    }

def test_complete():
    nodes = "ABCDE"
    edges = [(a, b) for a, b in itertools.combinations(nodes, r=2)]
    result = {a: [b for b in nodes if b != a] for a in nodes}
    assert neighbors(edges) == result

def test_not_connected():
    nodes = "ABC"
    edges = [(a, b) for a, b in itertools.combinations(nodes, r=2)]
    result = {a: [b for b in nodes if b != a] for a in nodes}

    nodes = "DEF"
    edges.extend((a, b) for a, b in itertools.combinations(nodes, r=2))
    result.update({a: [b for b in nodes if b != a] for a in nodes})

    assert neighbors(edges) == result

def test_multiple_edge():
    edges = [("A", "B"), ("C", "A"), ("A", "D"), ("C","D"), ("D", "C"), ("E", "E")]
    assert neighbors(edges) == {
        "A" : ["B", "C", "D"],
        "B" : ["A"],
        "C" : ["A", "D"],
        "D" : ["A", "C"],
        "E" : ["E"],
    }

[32m.[0m[32m.[0m[32m.[0m[32m.[0m[32m.[0m[32m                                                                                        [100%][0m
[32m[32m[1m5 passed[0m[32m in 0.03s[0m[0m


### Feladat

Éleivel adott egy élsúlyozott gráf. Írjunk egy függvényt, ami minden csúcsra kiszámolja a hozzá csatlakozó élek összsúlyát. A függvény egyetlen argumentuma egy lista, aminek elemei számhármasok `(a, b, w)` alakban. `a` és `b` az él két végpontja, `w` az `(a,b)` él súlya. Többszörös élek előfordulhatnak.

A függvény visszatérési értéke egy dictionary, csúcsok a hozzájuk tartozó összsúllyal.
pl. ha

```python
edges =  [(100, 200, 1), (100, 200, 2), (100, 1, -1), (1, 1, 5)]
```

és a függvényt `node_weight`-nek hívjuk, akkor

```python
node_weight(edges)
```

eredménye a következő dictionary

```
{100: 2, 200: 3, 1: 4}
```

Vegyük észre a hurok él hatását.

Lássuk el a függvényt típus annotációval és adjuk hozzá a következő dokumentációs sztringet:

```text
node weights from edge weights
```

A fenti függvény mellett írjunk teszt függvényt is, ami legalább az alábbi esetekre ellenőrzi a helyes működést.

- Az élek listája üres.

- Legalább öt él esetén van hurok él.

- Legalább öt él esetén minden élsúly 1.

- Legalább öt él esetén az élsúlyok ,,véletlenszerűek”.

- Legalább öt él esetén van többszörös él.

In [None]:
def node_weight(edges: list) -> dict:
    """node weights from edge weights"""
    pass

In [None]:
%%ipytest

def test_empty():
    assert node_weight([]) == {}

def test_loop():
    edges =  [(100, 200, 1), (100, 200, 2), (100, 1, -1), (1, 1, 5), (100, 3, 1)]
    assert node_weight(edges) == {
        100: 3,
        200: 3,
        1: 4,
        3: 1
    }


def test_unit_weight():
    edges =  [(100, 200, 1), (100, 200, 1), (100, 1, 1), (1, 1, 1), (100, 3, 1)]
    assert node_weight(edges) == {
        100: 4,
        200: 2,
        1: 2,
        3: 1
    }




[32m.[0m[32m.[0m[32m.[0m[32m                                                                                          [100%][0m
[32m[32m[1m3 passed[0m[32m in 0.05s[0m[0m


### Feladat

Tegyük fel, hogy adott egy irányítatlan gráf két adattal a csúcsok számával, és az élek listájával.

Ha a csúcsok száma $n$ akkor a gárf csúcsai $0,1,\dots, n-1$. Az élek listája pedig csúcs párokból álló lista.

Írjunk egy függvényt, ami a csúcs számból és az élek listájából visszaadja a szomszédsági mátrixot. Ez a mátrix $n\times n$ méretű és az $a$. sor $b$. eleme az $a$ és $b$ csúcs közötti élek száma.

In [None]:
def adj_matrix(n, edges):
    pass

### Feladat.

A bemenő adat ugyanaz mint az előbb, de a kimenet egy lista (listák listája), ami minden csúcsra felsorolja a szomszédait.

In [None]:
def adj_list(n, edges):
    pass    


### Feladat

A feladat hasonló az előzőhöz, de a csúcsok szöveges címkékkel vannak megadva. Milyen típus lehetne használni a szomszédok listájának tárolásához. Mit használhatnánk, ha a töbsszörös élek érdektelenek?

In [None]:
def adj_list(edges):
    pass

### Feladat **

Adott egy gráf a csúcshalmazzal és az élek listájával. Hogyan tudnánk az összefüggő komponenseket megkeresni, ábrázolni?

### Feladat

Hogyan tudnánk kisméretű halmazt $\{0,\dots,31\}$ egészszámok segítségével reprezentálni? 
Írjuk meg az unió, metszet, különbség képzés műveleteket ehhez a ,,típushoz''!

Írjunk egy `str_set` függvényt is, ami a halmazunkat a szokásos alakban kiírja.
Ha az `x` egész az $\{1, 5, 16\}$ halmazt reprezentálja, akkor az `str_set(x)` visszatérési értéke legyen
`"{1, 5, 16}"`.

### Feladat *

Tekintsük az első $n$ szám $\{0,\dots,n-1\}$ permutációit. A $p$ permutáció kisebb, mint $q$ ha $p\neq q$ és az első helyen ahol eltérés van $p$ értéke kisebb mint $q$-é.
$$
    i_0 = \min\{i\colon p_i\neq q_i\}, \quad\text{és}\quad p_{i_0}<q_{i_0}
$$

Adott $p$ permutációra számoljuk a nagyságszerinti sorban következőt, ha nincs ilyen, mert $p$ legnagyobb permutáció, akkor a visszatérési érték `None`

In [None]:
def next_permutation(p):
    pass

### Feladat **

Előadáson láttuk, hogy `list` típusnál az `.append` és `.pop` gyors műveletek. A háttérben az áll, hogy ha kimerítjük az előre lefoglalt helyeket, akkor nem egy új elemnek foglal helyet a python, hanem a lista hosszával arányos számú új elemnek. A lefoglalt memóriába kb 1.1-szer annyi elem fér le, mint ami éppen a listában van.

Hogyan oldanánk meg a törlést. Van egy hosszú listánk. `.pop` művelettel elfogyasztjuk az elemeit. Hogyan érdemes a felszabadítani a memóriát?

### Feladat

Adott egy számokból álló lista. Az elemek sorba vannak rendezve. Írjunk egy függvényt, ami megszámolja hogy egy adott értéknél hány kisebb egyenlő érték fordul elő a listánkban. 

Írjuk meg lassú és az optimalizált változatot. Ne használjuk a Python beépített moduljait. 

In [None]:
def count_not_greater(nums, value):
    pass

### Feladat

Azonos hosszúságú sztringkekből álló listánk van. Számoljuk meg azon $i<j$ index  párok számát, ahol az $i$. és $j$. sztring legfeljebb 1 karakterben tér el egymástól.