[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/prokaj/elte-python-2024/blob/main/2024-10-09.ipynb)   

## Házi feladatok

### Feladat

Írjunk egy függvényt, aminek két paramétere van egy `string`-ekből álló lista és pozitív egész 
küszöbérték. A függvény visszatérési értéke azon karakterek listája, amelyek legalább a küszöbértékben megadott
számú sztringben előfordulnak.

Pl. ha a függvényünk neve `frequent_chars`, akkor

```python
frequent_chars(["alma", "malna","golya"], 3)
```

értéke `["a","l"]`. Ha a küszöbérték három helyett kettő lenne, akkor még az `"m"` is bekerülne a listába.
A visszaadott lista legyen sorba rendezve. Lássuk el a függvényt típus annotációval, írjunk hozzá docstring-et (magyarul vagy angolul, ahogy kényelmesebb). 

Írjunk teszt függvényt, ami ellenőrzi, legalább az alábbi esetkre ellenőrzi a helyes működést:

• Az eredmény nem függ a stringek sorrendjétől az argumentumként kapott listában.

• A stringek listája üres.

• Véletlenszerű stringekből álló lista.

• Ugyanaz a string ismétlődik sokszor.



In [1]:
def frequent_chars(words: list, k: int) -> list:
    """
    Return a list of characters that appear in at least k words in the list.

    :param words: A list of words.
    :param k: The minimum number of words a character must appear in to be
              included in the result.
    :return: A list of characters that appear in at least k words in the list.
    """
    freq = {}
    for word in words:
        for char in set(word):
            if char in freq:
                freq[char] += 1
            else:
                freq[char] = 1
    return sorted(char for char in freq if freq[char] >= k)


In [2]:
import ipytest
ipytest.autoconfig()

In [None]:
%%ipytest


def test_frequent_chars():
    assert frequent_chars(['hello', 'world'], 1) == ['d', 'e', 'h', 'l', 'o', 'r', 'w']
    assert frequent_chars(['hello', 'world'], 2) == ['l', 'o']
    assert frequent_chars(['hello', 'world'], 3) == []
    assert frequent_chars([], 2) == []
    assert frequent_chars(['asat', 'adwrt', 'aefwr'], 2) == ['a', 'r', 't', 'w']
    assert frequent_chars(['hello', 'hello', 'hello',  'hello' ], 4) == ['e', 'h', 'l', 'o']
    

### Feladat.

Írjunk egy függvényt, ami egy sorozatból kigyűjti a különböző elemeket és mindegyikhez feljegyzi hol fordulnak elő. Feltehető, hogy a sorozat elemei használhatóak kulcsként egy szótárban.

Pl. Ha függvény neve `collect_positions`, akkor

```python
collect_positions("ababcda")
```

hívás eredménye:

```python
{"a": [0, 2, 6], "b":[1, 3], "c": [4], "d": [5]}
```

A visszaadott szótárban az értékek legyenek nagyság szerinti sorba rendezve.
Lássuk el a függvényt  docstring-gel (magyarul vagy angolul, ahogy kényelmesebb).

Teszteljük a munkánkat az ipytest modullal, legalább az alábbi esetekre:

- Az argumentum legalább 10 hosszú sztring.

- Az argumentum sztringek legalább 10 hosszú listája.

- Az argumentum map hivás eredménye, pl. ha az előző pontban használt lista lst, akkor map(str.upper, lst), vagy map(str.lower, lst)

- A sorozat üres.

- A sorozat elemei számok.

A megoldásban jól jöhet az `enumerate` függvény. Ha nem muszáj, ne konvertáljuk a bemenő paramétert listává.

In [None]:
def collect_positions(seq):
    pos = {}
    for i, item in enumerate(seq):
        if item not in pos:
            pos[item] = []
        pos[item].append(i)
    return pos

In [None]:
import collections

def collect_positions(seq):
    pos = collections.defaultdict(list)
    for i, item in enumerate(seq):
        pos[item].append(i)
    return dict(pos)

In [None]:
%%ipytest

def test_positions_a():
    "10 hosszú sztring"
    seq = "abracadabra"
    positions = {'a': [0, 3, 5, 7, 10], 'b': [1, 8], 'c': [4], 'd': [6], 'r': [2, 9]}
    assert collect_positions(seq) == positions

def test_positions_b():
    "sztringek legalább 10 hosszú listája"
    seq = list("abracadabra")
    positions = {'a': [0, 3, 5, 7, 10], 'b': [1, 8], 'c': [4], 'd': [6], 'r': [2, 9]}
    assert collect_positions(seq) == positions

def test_positions_c():
    "map objektum"
    seq = map(str.upper, "abracadabra")
    positions = {'A': [0, 3, 5, 7, 10], 'B': [1, 8], 'C': [4], 'D': [6], 'R': [2, 9]}
    assert collect_positions(seq) == positions


def test_positions_d():
    "üres sorozat"
    assert collect_positions("") == {}
    assert collect_positions([]) == {}
    assert collect_positions(map(int, "")) == {}


def test_positions_e():
    "számok sorozata"
    seq = [ord(x) for x in "abracadabra"]
    positions = {ord('a'): [0, 3, 5, 7, 10], ord('b'): [1, 8], ord('c'): [4], ord('d'): [6], ord('r'): [2, 9]}
    assert collect_positions(seq) == positions

Lehet-e másképp?

In [None]:

def check_positions(positions, seq):
    for key, key_positions in positions.items():
        ## all positions are different
        assert len(set(key_positions)) == len(key_positions) 
        ## all positions are valid
        for pos in key_positions:
            assert seq[pos] == key
    ## all positions are covered
    assert sum(map(len, positions.values())) == len(seq)


In [None]:
%%ipytest

texts = ["abracadabra",
"One foot in front of the other, "
"One more step, and then one more. "
"Jack's only thoughts were to keep moving "
"no matter how much his body screamed to "
"stop and rest. He's lost almost all his "
"energy and his entire body ached beyond "
"belief, but he forced himself to take "
"another step. Then another. And then one more."]

def test_positions_a():
    "10 hosszú sztring"
    for seq in texts:
        check_positions(collect_positions(seq), seq)

def test_positions_b():
    "sztringek legalább 10 hosszú listája"
    for seq in texts:
        seq = seq.split()
        check_positions(collect_positions(seq), seq)

def test_positions_c():
    "map objektum"
    for seq in texts:
        seq = seq.split()
        seq_orig = map(str.upper, seq)
        seq_copy = list(map(str.upper, seq))
        check_positions(collect_positions(seq_orig), seq_copy)

def test_positions_d():
    "üres sorozat"
    assert collect_positions("") == {}
    assert collect_positions([]) == {}
    assert collect_positions(map(int, "")) == {}

def test_positions_e():
    "számok sorozata"
    for seq in texts:
        seq = seq.split()
        seq = [len(x) for x in seq]
        check_positions(collect_positions(seq), seq)

In [None]:
texts

## Szorgalmi feladat.

Harmonikus sor alatt, az $\sum_{n=1}^\infty
  \frac1n$ sort értjük. Ennek a részletösszegeit szeretnénk kiszámítani
legalább $10^{-8}$ pontossággal. Ehhez használhatnánk, a definíciót:

```python
def harmonic_sum_slow(n: int) -> float:
    return sum(1/k for k in reversed(range(1, n+1)))
```

azonban ez túlságosan lassú. A művelet igény lineáris $n$-ben és
körülbelül $n=25*10^6$ esetén már egy másodperc körüli a futási idő.

A kiindulást a következő ötlet szolgáltathatja, $n\geq 1$-re:
$$
\begin{aligned}
    \log\left({n+\frac12}\right) - \log\left({n-\frac12}\right)
    &=\int_{n-\frac1{2}}^{n+\frac1{2}} \frac1{x} dx\\
    &= \int_{-\frac1{2}}^{\frac1{2}} \frac1{n+x} dx\\
    & = \frac1n +\int_{-\frac1{2}}^{\frac1{2}} \frac1{(n+x)}
      -\frac1ndx\\
    & = \frac1n +\int_{-\frac1{2}}^{\frac1{2}} \frac{x}{(n+x)n}dx\\
    & = \frac1n +\int_{0}^{\frac1{2}} \frac{2x^2}{(n^2-x^2)n}dx    
\end{aligned}
$$ Ebből becsüljük meg $\frac1n$ és a bal oldal eltérését.
Végül az összeg első néhány tagját megtartva, a többit közelítve a
logaritmus megváltozásával próbáljunk gyorsabb és az előírt pontosságú
módszert találni.

Egy másik lehetőség $1/n+1/(n+1)$ és $2\log(1+1/n)$ összehasonlítása.

In [1]:
import math

In [None]:

def harmonic_sum_slow(n: int) -> float:
    return math.fsum(1/k for k in range(1, n+1))

In [None]:
%%time
harmonic_sum_slow((10**8))

A megadott formula alapján
$$
\begin{aligned}
\left|\frac1n - \int_{n-1/2}^{n+1/2} \frac1{x}dx\right|
&= \int_0^{1/2} \frac{2x^2}{(n^2-x^2)n}dx\\
&\leq \frac1{(n^2-1)n}\int_0^{1/2} 2x^2dx=\frac1{12(n^2-1)n}
\end{aligned}
$$
Ha $n_0$-tól összegzünk, akkor
$$
\begin{aligned}
\sum_{n=n_0}^\infty \frac1{(n^2-1)n}& =
\sum_{n=n_0}^\infty \frac1{(n-1)(n+1)n}\\
&= \frac12\sum_{n=n_0}^\infty \frac1{n-1}+\frac1{n+1} -\frac{2}{n}\\
&=\frac12\left\{\sum_{n=n_0-1}\frac{1}{n}+\sum_{n=n_0+1}\frac1n-2\sum_{n=n_0}\frac1n\right\}\\
&=\frac12\left\{\frac1{n_0-1}-\frac1{n_0}\right\}=\frac{1}{2n_0(n_0-1)}
\end{aligned}
$$

Ebből az adódik, hogy
$$
\left|\sum_{n=n_0}^{n_1} \frac1n - \log\left(\frac{n_1+1/2}{n_0-1/2}\right)\right|
\leq \frac{1}{24(n_0(n_0-1))}
$$

A logaritmus értékét pontosnak vehetjük, így a közelítés hibája akkor lesz kisebb, mint $10^{-8}$, ha
$$
    24*n_0(n_0-1)>10^8
$$

In [None]:
print(f"{((1e8)/24)**0.5=}")
n0 = 2500


In [None]:
import math

def harmonic_sum_faster(n: int) -> float:
    n0 = min(n, 2500)
    return math.fsum(1/k for k in range(1, n0+1)) + math.log((n+0.5)/(n0+0.5))

In [None]:
%%ipytest

def test_hs():
    for n in range(1, 1000):
        assert harmonic_sum_slow(n) == harmonic_sum_faster(n)

    for n in range(5000, 100_001, 2_500):
        assert abs(harmonic_sum_slow(n)-harmonic_sum_faster(n))<1e-8

    for n in range(500_000, 1_000_001, 50_000):
        assert abs(harmonic_sum_slow(n)-harmonic_sum_faster(n))<1e-8


In [None]:
%%time
harmonic_sum_faster((10**8))

# Feladatok

Az előző hétek feladatai mellett az alábbi néhány feladattal is foglakozhatunk.

1. Írjunk egy `Polinom` osztályt. Az `__init__` metódus megkapja az együtthatók sorozatát. Az `__str__` metódus a polinom következő szöveges alakját adja vissza. Pl. Ha az együtthatók `(1, 2, 1)`, akkor
```pyhton
p = Polinom(1, 2, 1)
print(str(p)) 
```

eredménye legyen:
```text
x^2 +  2x + 1
```

Ha az együtthatók sorozata üres, akkor a nulla polinomról van szó:
```python
p = Polinom()
print(str(p))
```
eredménye:
```text
0
```

2. Írjuk meg az előadáson szerepelt `Temperature` osztályt.

In [5]:
class Temperature:
    
    def __init__(self, celsius=0): 
        self.celsius = celsius
    
    def __repr__(self): 
        return f"{self.celsius} ℃ [{self.fahrenheit} ℉]"
    
    @property
    def celsius(self): 
        pass
    
    @celsius.setter
    def celsius(self, value): 
        pass
    
    @property
    def fahrenheit(self): 
        pass
    
    @fahrenheit.setter
    def fahrenheit(self, value): 
        pass

3. Írjunk egy generátor függvényt, ami a prímszámok sorozatát állítja elő. Most kivételesen csak mérsékelten aggódjunk a hatékonyság miatt.
