[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/prokaj/elte-python-2023/blob/main/2023-10-16.ipynb)   

Néhány import amit később használni fogunk:

In [None]:
import importlib
import math

if importlib.util.find_spec('ipytest') is None:
    ! pip install --quiet ipytest

import ipytest

ipytest.autoconfig()

# Házi feladat

Írjunk egy függvényt, ami egy sorozatból kigyűjti a különböző elemeket és mindegyikhez feljegyzi hol fordulnak elő. Feltehető, hogy a sorozat elemei használhatóak kulcsként egy szótárban.

Pl. Ha függvény neve `collect_positions`, akkor

```python
collect_positions("ababcda")
```

hívás eredménye:

```python
{"a": [0, 2, 6], "b":[1, 3], "c": [4], "d": [5]}
```

A visszaadott szótárban az értékek legyenek nagyság szerinti sorba rendezve. 
Lássuk el a függvényt  docstring-gel (magyarul vagy angolul, ahogy kényelmesebb).

Teszteljük a munkánkat az ipytest modullal, legalább az alábbi esetekre:

- Az argumentum legalább 10 hosszú sztring.

- Az argumentum sztringek legalább 10 hosszú listája.

- Az argumentum map hivás eredménye, pl. ha az előző pontban használt lista lst, akkor map(str.upper, lst), vagy map(str.lower, lst)

- A sorozat üres.

- A sorozat elemei számok.

A megoldásban jól jöhet az `enumerate` függvény. Ha nem muszáj, ne konvertáljuk a bemenő paramétert listává.

In [None]:
def collect_positions(seq):
    pos = {}
    for i, item in enumerate(seq):
        if item not in pos:
            pos[item] = []
        pos[item].append(i)
    return pos

In [None]:
import collections

def collect_positions(seq):
    pos = collections.defaultdict(list)
    for i, item in enumerate(seq):
        pos[item].append(i)   
    return dict(pos)

In [None]:
%%ipytest

def test_positions_a():
    "10 hosszú sztring"
    seq = "abracadabra"
    positions = {'a': [0, 3, 5, 7, 10], 'b': [1, 8], 'c': [4], 'd': [6], 'r': [2, 9]}
    assert collect_positions(seq) == positions

def test_positions_b():
    "sztringek legalább 10 hosszú listája"
    seq = list("abracadabra")
    positions = {'a': [0, 3, 5, 7, 10], 'b': [1, 8], 'c': [4], 'd': [6], 'r': [2, 9]}
    assert collect_positions(seq) == positions

def test_positions_c():
    "map objektum"
    seq = map(str.upper, "abracadabra")
    positions = {'A': [0, 3, 5, 7, 10], 'B': [1, 8], 'C': [4], 'D': [6], 'R': [2, 9]}
    assert collect_positions(seq) == positions


def test_positions_d():
    "üres sorozat"
    assert collect_positions("") == {}
    assert collect_positions([]) == {}
    assert collect_positions(map(int, "")) == {}
    

def test_positions_e():
    "számok sorozata"
    seq = [ord(x) for x in "abracadabra"]
    positions = {ord('a'): [0, 3, 5, 7, 10], ord('b'): [1, 8], ord('c'): [4], ord('d'): [6], ord('r'): [2, 9]}
    assert collect_positions(seq) == positions

Lehet-e másképp?

In [None]:

def check_positions(positions, seq):
    for key, key_positions in positions.items():
        for pos in key_positions:
            assert seq[pos] == key
    assert sum(map(len, positions.values())) == len(seq)


In [None]:
%%ipytest

texts = ["abracadabra", 
"One foot in front of the other, "
"One more step, and then one more. "
"Jack's only thoughts were to keep moving "
"no matter how much his body screamed to "
"stop and rest. He's lost almost all his "
"energy and his entire body ached beyond "
"belief, but he forced himself to take "
"another step. Then another. And then one more."]

def test_positions_a():
    "10 hosszú sztring"
    for seq in texts:
        check_positions(collect_positions(seq), seq)

def test_positions_b():
    "sztringek legalább 10 hosszú listája"
    for seq in texts:
        seq = seq.split()
        check_positions(collect_positions(seq), seq)

def test_positions_c():
    "map objektum"
    for seq in texts:
        seq = seq.split()
        seq_orig = map(str.upper, seq)
        seq_copy = list(map(str.upper, seq))
        check_positions(collect_positions(seq_orig), seq_copy)

def test_positions_d():
    "üres sorozat"
    assert collect_positions("") == {}
    assert collect_positions([]) == {}
    assert collect_positions(map(int, "")) == {}
    
def test_positions_e():
    "számok sorozata"
    for seq in texts:
        seq = seq.split()
        seq = [len(x) for x in seq]
        check_positions(collect_positions(seq), seq)

In [None]:
(
    f"{test_positions_a.__name__} "
    f"{test_positions_b.__name__} "
)

In [None]:
texts

# Rendezett $n$-es (`tuple`), szótár (`dict`),  halmaz (`set`)

## Rendezett $n$-es (`tuple`)

In [None]:
print(tuple.__doc__)

Legfontosabb metódus:

- összeadás (concatenation)

indexelés ugyanolyan mint listánál.

Ha egy függvény több értéket add vissza, akkor valójában tuple-t kapunk.


A metódusok teljes listája:

In [None]:
[method for method in dir(tuple) if not method.startswith("__")]

Összehasonlításképpen a `list` típus metódusainak a listája:

In [None]:
[method for method in dir(list) if not method.startswith("__")]

### Tuple létrehozása, módosítása:

In [None]:
code = """
tuple()
()
(1, 2, 3)
1, 2, 3
1,
(1)
(1,)
tuple(range(10))
tuple("karakterlánc")
(1, ) + (1, 2, 3)
(1, )*5
"""

for line in code.split("\n"):
    if line.strip():
        result = eval(line)
        result_type = type(result).__name__
        print(f"{line:>30} -> ({result_type:>5}): {result}")

### Szótár, dictionary (`dict`)

In [None]:
print(dict.__doc__)

Legfontosabb metódusok:

- `get`. pl. `d.get(key, default)` lényegében ugyanaz, mint
```python
        if key in d:
            return d[key]
        else:
            return default
```

- `pop`. pl. `d.pop(key, default)` lényegében ugyanaz, mint
```python
        if key in d:
            value = d[key]
            del d["key"]
            return value
        else:
            return default
```

- `values`, `items`.  `For` ciklusban, ha végig akarunk iterálni a dictionary értékein ill. kulcs, érték párjain.

   Pl.
```python
        for key in d:
            pass
        for value in d.values():
            pass
        for key, value in d.items():
            pass
```
   

A metódusok teljes listája:

In [None]:
[method for method in dir(dict) if not method.startswith("__")]


In [None]:
d = {"a": 1, "b": 2}
print(f"Ezt kapjuk, ha végig iterálunk d-n:        {list(d)}")
print(f"Ezt kapjuk, ha végig iterálunk d értékein: {list(d.values())}")
print(f"Ezt kapjuk, ha végig iterálunk d elemein:  {list(d.items())}")

Valami hasonló for ciklusban.

In [None]:
print("iteráció d-n")
for x in d:
    print(x)

print("iteráció d értékein")
for x in d.values():
    print(x)

print("iteráció d elemein (items)")
for key, value in d.items():
    print(key, value)

Egy dictionary-nak szinte tetszőlegesen bonyolult kulcsa és értéke lehet.

Próbáljuk ki a következőket:

  - A kulcs string, egész, lebegőpontos szám, függvény ilyenekből képzett tuple
  - Az érték srting, szám, függvény, lista, tuple, dictionary
  - Működik-e, ha a kulcs lista, vagy olyan tuple, aminek legalább az egyik eleme lista

In [None]:
def f(): pass
a = 1
b = 3.14
c = "szöveg teszteléshez"

d = {
    a: a,
    b: (a, b),
    c: f,
    (a,b): f(),
    f: "ez egy függvény kulcs"
    ## próbáljunk ki további variációk
}

d

Tudunk-e a fentihez hasonlót a `dict` függvény segítségével létrehozni.

In [None]:
dict(a=a, b=(a,b), c=f, f="ez egy függvény kulcs")

Legfeljebb úgy, ha kulcs érték párok sorozatát adjunk meg! De akkor már a fenti alak kényelmesebb!

In [None]:
dict(((a, a), (b, (a, b)), ((a,b), f), (f, "ez egy függvény kulcs")))

### Halmaz `set`

In [None]:
print(set.__doc__)

Legfontosabb műveletek:

- új elem hozzáadása: `add`
  pl.
  ```python
    s = {1, 2, 3}
    s.add(3)
  ```
  `s` értéke nem változik, mert 3 már benne volt.

- törlés: `discard`
  pl.
  ```python
    s = {1, 2, 3}
    s.discard(3)
    s.discard(4)
  ```

- bővítés egy sorozat elemeivel: `update`

  ```python
    s = {1, 2, 3}
    s.update([2, 4, 5])
  ```

- metszet, unió különbség, szimmetrikus differencia: `intersection`, `union`, `difference`, `symmetric_difference` és ezek `update` változata.


Nem minden lehet egy halmaz eleme, csak olyan aminek az értéke futás közben nem változhat: szám, sztring, tuple. Pl dictionary, vagy list nem lehet halmaz eleme!


A metódusok teljes listája:

In [None]:
[method for method in dir(set) if not method.startswith("__")]

# Feladatok előadásról

## Fibonacci számok:


$f_0=0$, $f_1=1$ és
$$
    f_{n} = f_{n-1} + f_{n-2},\quad\text{ha $n\geq 2$} 
$$
A sorozat első néhány tagja: 
```
0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89, ...
```

Implementáció előadásról

In [None]:
def fibonacci(n):
    a, b = 1, 0
    for _ in range(n):
        a, b = a+b, a
    return b

In [None]:
[fibonacci(i) for i in range(15)]

## Fibonacci zárt alakban

Ötlet. $f_{n} = f_{n-1}+f_{n-2}$ megoldását keressük $f_n=x^n$ alakban, alkalmas $x$-szel. Azaz oldjuk meg a
$$
    x^{n} = x^{n-1}+x^{n-2},\quad n\geq 2
$$
egyenletet. Az azonosan nulla sorozat nem érdekel minket. Ha $x\neq0$, akkor átosztás és átrendezés után
$$
    x^2-x-1=0\quad x_{1,2}=\frac{1\pm\sqrt{(-1)^2-4\cdot(-1)}}{2}=\frac{1\pm\sqrt{5}}2
$$
Tetszőleges $c_1,c_2\in\mathbb{R}$ számokra
$$
    f_n=c_1 x_1^n +c_2x_2^n
$$ 
kielégíti a Fibinacci sorozat rekurzióját. Ahhoz, hogy $f_0=0$, $f_1=1$ is teljesüljön,
$$
    f_0 = c_1+c_2 = 0,\quad f_1=c_1x_1+c_2x_2=c_1(x_1-x_2)=1
$$
is kell. $x_1-x_2=\sqrt{5}$, azaz $c_1=\frac{\sqrt{5}}{5}$ és $c_2=-\frac{\sqrt{5}}{5}$.

A $f_0=0$, $f_1=1$ kezdeti értékekből induló sorozat $n$. tagja zárt alakban tehát:
$$
    f_0=0,\quad
    f_1=1,\quad
    f_n = \frac{1}{\sqrt{5}}\left(\left(\frac{1+\sqrt{5}}{2}\right)^n- \left(\frac{1-\sqrt{5}}{2}\right)^n\right)
$$


Előadás a sorozatot $f_0=1$, $f_1=1$-ből indítottuk. Ez csak az index eltolását jelenti, ha ugyanis $f_0=0$, $f_1=1$, akkor $f_2=1$ és megkapjuk az elődáson szereplő értékeket az eggyel nagyobb indexű helyen.

Előadás változatra a zárt alak:
$$
    f_0=1,\quad
    f_1=1,\quad
    f_n = \frac{1}{\sqrt{5}}\left(\left(\frac{1+\sqrt{5}}{2}\right)^{n+1}- \left(\frac{1-\sqrt{5}}{2}\right)^{n+1}\right)
$$

**Próbáljuk ki, hogy működik-e?**

Egészítsük ki a következő függvény definíciót!

In [None]:
import math

sqrt5 = math.sqrt(5)

def fibonacci_super_fast(n):
    pass

In [None]:
%%ipytest

def test_fibonacci():
    assert fibonacci(0) == 0
    assert fibonacci(1) == 1
    assert fibonacci(2) == 1
    assert fibonacci(3) == 2
    assert fibonacci(4) == 3
    assert fibonacci(5) == 5
    
    
def test_super_fibonacci_fast():
    for n in range(100):
        assert fibonacci(n) == fibonacci_super_fast(n)

Mi okozza a hibát? Meg lehet oldani?

Ötletek:

1. $a+b\sqrt{5}$ alakú számokkal dolgozunk, ahol $a$, $b$ racionális. A python képes kezelni racionális számokat.
   
   A `Fraction` típus szolgál erre. 
   Erre építve definálhatunk egy osztályt, ami a $\mathbb(Q)(\sqrt{5})=\left\{a+b\sqrt{5}\colon a,b\in\mathbb{Q}\right\}$ testet implementálja: Összeadás, kivonás, szorzás, osztás, hatványozás és akkor a kerekítési hibáktól megszabadulunk. (potenciális későbbi HF.)

2. Újra gondoljuk a zárt alakot.
   
   Ha $v_n=(f_{n+1},f_n)^T$, akkor $n>0$-re
   $$
      v_n = \begin{pmatrix}f_{n+1}\\f_{n}\end{pmatrix} = 
      \underbrace{\begin{pmatrix}1 & 1\\ 1 & 0\end{pmatrix}}_{=A}\begin{pmatrix}f_{n}\\f_{n-1}\end{pmatrix} = A v_{n-1}
   $$
   Itt $v_0=(1,0)^T$ és iterálva az összefüggést:
   $$
      v_n=Av_{n-1}=A(A v_{n-2})=\cdots= A^n v_0
   $$
   Az $A$ mátrix elemei egészek, $A^n$ is ilyen, azaz elég az (egész értékű) $A$ mátrix $n$. hatványát kiszámolni.
   $$
      f_n = (0, 1) A^n v_0
   $$

   Ha $n = \sum_{i} r_i 2^i$, ahol $r_i\in\{0,1\}$ a diakikus jegyek sorozata, akkor
   $$
      A^n = \prod_{i: r_i=1} A^{2^i}
   $$ 

   Írjunk egy függvényt, ami $2\times 2$ mátrixok szorzatát számolja ki! Ennek segítségével implementáljuk a mátrix hatványozást!

   Mátrixokat kényelmesen ábrázolhatunk listákkal, pl. `A = [A_11, A_12, A_21, A_22]`. Ráadásul a mi esetünkben, a mátrix szimmetrikus, az hatványozásnál megmarad, akár ezt is kihasználhatjuk.


#### Mi köze a két zárt alaknak egymáshoz?

Otthon gondolkodjunk rajta!

In [None]:

def mat_mul(A, B):
    """
    product of self-adjoint 2x2 matrices
    given in the following format
    A = [A_11, A_12, A_22]
    
    The return value has the same format!
    """
    return [A[0]*B[0]+A[1]*B[1], A[0]*B[1]+A[1]*B[2], A[1]*B[1]+A[2]*B[2]]

def mat_pow(A, n):
    n, r = divmod(n, 2)
    B =  A if r==1 else [1, 0, 1]## identity matrix 
    while n>0:
        A = mat_mul(A, A)
        n, r = divmod(n, 2)
        if r==1:
            B = mat_mul(B, A)
    return B
    

def mat_str(A):
    a = [str(ai) for ai in A]
    max_width = max(len(ai) for ai in a)
    format_str = f">{max_width}"
    return  f"\n⎡{a[0]:{format_str}} {a[1]:{format_str}}⎤\n⎣{a[1]:{format_str}} {a[2]:{format_str}}⎦"


In [None]:
A = [1,1,0]
print(f"A=\n{mat_str([1,1,0])}\n---")

B = mat_mul(A, A)
exponent=2
print(f"A^{exponent}=\n{mat_str(B)}\n---")

for _ in range(5):
    B = mat_mul(B, B)
    exponent *= 2
    print(f"A^{exponent}=\n{mat_str(B)}\n---")


In [None]:
%%ipytest

def test_mat_exp():
    A = [1,1,1]
    assert mat_pow(A, 0) == [1, 0, 1]
    assert mat_pow(A, 1) == A
    B = A
    for k in range(2, 10):
        B = mat_mul(B, A)
        assert mat_pow(A, k) == B

In [None]:
def fibonacci_fast(n):
    A = [1, 1, 0]
    B = mat_pow(A, n)
    # B = A**n
    # (0, 1) B (1, 0)^T = B_21
    return B[1]

In [None]:
%%ipytest

def test_fibonacci_fast():
    for n in range(100):
        assert fibonacci(n) == fibonacci_fast(n)


Melyik változat a gyorsabb?

In [None]:
for n in [10, 100, 1000, 10_000]:
    for f in [fibonacci, fibonacci_fast]:
        txt = f"{f.__name__}({n}):"
        print(f"{txt:>25}", end=" ")
        %timeit f(n)



### Mátrix class



Néhány műveletet defináltunk 2x2 szimmetrikus mátrixokra. Ezt elegánsabban is megtehetjük. 

Amikor azt írjuk  `python`-ban, hogy
```
b*c
```
Az értelmező csak annyit tud, hogy szorzás műveletet kell végrehajtani. 

Honnan derül ki, hogy 
- ez az egész számok szorzása ha `b` és `c` egész, 
- lebegőpontos szorzás, ha legalább az egyik lebegő pontos szám
- `c`-szer egymás után fűzése a `b`-nek, ha `c` egész és `b` sorozat (`list`, `tuple`, `str`)

Ha az adott típusra értelmes a szorzás, akkor annak a szorzás műveletét hajta végre az python interpreter, különben hibát dob!

In [None]:
a = {1: 2}
a*2

Előadáson láttuk, hogy saját típust (osztályt) létrehozhatunk.

Hogyan adhatjuk meg, hogy mit jelent az összeadás, szorzás, `<`, stb. az adott típusra?

Erre szolgálnak a ,,dunder'' metódusok:
- `__add__` összeadás
- `__mul__` szorzás
- `__pow__` hatványozás
- `__truediv__` osztás (`/`)
- `__floordiv__` egészosztás (`//`)
- `__mod__` maradék (`%`)
stb.

Hasonló az előadáson látottakhoz:
- `__str__` az `str` függvény ezt keresi, ennek az eredményét kapjuk amikor ki`print`elünk valamit.
- `__repr__` a  `repr` függvény ezt keresi, ennek az eredménye a cella utolsó értéke.

In [None]:
s = "alma"
print("`s` értéke printtel:")
print(s)
print("`s` értéke ha a cella utolsó kifejezése:")
s

Vegyük észre, hogy a `print(s)`-nél nincs szimpla aposztróf, míg a másik esetben igen. 

In [None]:
s = "alma"
print(f"{str(s)=}, {repr(s)=}")
print(s.__str__(), s.__repr__())

Az általános elv az, hogy 
- `__str__` eredménye egy ,,emberi'' fogyasztásra szánt szöveges alak, 
- `__repr__` eredménye egy olyan sztring, amit kiértékelve visszakapjuk az eredeti objektumot

In [None]:
s = "alma"
alma = 1
s0 = eval(repr(s))
s1 = eval(str(s))
s0, s1

In [None]:
class SymmetricMatrix:
    """Symmetric 2x2 matrix"""
    
    def __init__(self, values):
        self.values = list(values)
    
    def __mul__(self, other):
        A = self.values
        B = other.values 
        result = [A[0]*B[0]+A[1]*B[1], A[0]*B[1]+A[1]*B[2], A[1]*B[1]+A[2]*B[2]]
        return type(self)(result)

    def __add__(self, other):
        return type(self)(ai+bi for ai, bi in zip(self.values, other.values))
    
    def __pow__(self, n):
        n, r = divmod(n, 2)
        B = self if r==1 else type(self)([1, 0, 1]) ## identity matrix
        A = self 
        while n>0:
            A = A * A
            n, r = divmod(n, 2)
            if r==1:
                B = B * A
        return B

    def __repr__(self):
        return f"{type(self).__name__}({self.values})"

    def __str__(self):
        a = [str(ai) for ai in self.values]
        max_width = max(len(ai) for ai in a)
        format_str = f">{max_width}"
        return  f"\n⎡{a[0]:{format_str}} {a[1]:{format_str}}⎤\n⎣{a[1]:{format_str}} {a[2]:{format_str}}⎦"


In [None]:
A = SymmetricMatrix([1,1,0])
print(f"{A=}")
print(f"{A=!s}")

In [None]:
def fibonacci_fast2(n):
    B = SymmetricMatrix([1, 1, 0])**n
    # B = A**n
    # (0, 1) B (1, 0)^T = B_21
    return B.values[1]
    

In [None]:
%%ipytest

def test_fibonacci_fast():
    for n in range(100):
        assert fibonacci(n) == fibonacci_fast2(n)


In [None]:
for n in [100, 1000]:
    for f in [fibonacci, fibonacci_fast, fibonacci_fast2]:
        txt = f"{f.__name__}({n}):"
        print(f"{txt:>25}", end=" ")
        %timeit f(n)


Az eleganciának ára van. Lehetne optimalizálni a hatványozást úgy, 
hogy csak a végén hozzuk létre a SymmetricMatrix típust.

### Hatványozás ügyesebben

A Fibonacci számokhoz nem kell a mátrix hatványozás általános alakja $2\times2$ mátrixokra. Igazából csak
az
$$
    A = \begin{pmatrix}
    1 & 1 \\ 1 & 0
    \end{pmatrix}
$$
mátrix hatványait szeretnénk számolni!

Az első néhány hatvány:

In [None]:
A = SymmetricMatrix([1,1,0])
for i in range(5):
    print(f"A^{i}={A**i!s}\n===")
    

Azaz 
$$
A^2=A+I, \quad A^3 =2A+I\quad A^4 = 3A + 2
$$
és teljes indukcióval
$$
    A^n = f_n A + f_{n-1}I
$$
Azaz:
$$
\begin{aligned}
    A^{n + m} 
    & = f_{n+m}A+f_{n+m-1} = A^nA^m \\
    & =(f_nA+f_{n-1}I)(f_mA+f_{m-1}I) \\
    & = f_nf_m A^2 +(f_nf_{m-1} +f_mf_{n-1}) A + f_{n-1}f_{m-1} I\\ 
    & = f_nf_m (A+I) +(f_nf_{m-1} +f_mf_{n-1}) A + f_{n-1}f_{m-1} I\\
    & = (f_nf_m + f_nf_{m-1} +f_mf_{n-1}) A + (f_nf_m+ f_{n-1}f_{m-1}) I
\end{aligned} 
$$

In [None]:

def fib_mul(a, b, c, d):
    ac = a*c
    return ac+a*d+b*c, ac+b*d

def fib_square(a, b):
    a2 = a*a
    return a2+2*a*b, a2+b*b

class Fib:
    def __init__(self, a=0, b=0):
        self.coeff = [a, b]


    def __mul__(self, other):
        return type(self)(*fib_mul(*self.coeff, *other.coeff))

    def __add__(self, other):
        a, b = self.coeff
        c, d = other.coeff
        return type(self)(a+c, b+d)
    
    def __pow__(self, n):
        a, b = self.coeff
        c, d = 0, 1
        while n > 0:
            if n&1:
                ac = a*c
                c, d = ac+a*d+b*c, ac+b*d
            a2 = a*a
            a, b = a2+2*a*b, a2+b*b
            n >>= 1
        return type(self)(c, d) 
    
    def __str__(self):
        a, b = self.coeff
        return f"{a}*A + {b}*I"
    
    def __repr__(self):
        return f"{type(self).__name__}({', '.join(map(str, self.coeff))})"

In [None]:
def fibonacci_fast3(n):
    return (Fib(1, 0)**n).coeff[0]


In [None]:
{i:fibonacci_fast3(i) for i in range(15)}

In [None]:
for n in [100, 1000]:
    for f in [fibonacci_fast, fibonacci_fast2, fibonacci_fast3]:
        txt = f"{f.__name__}({n}):"
        print(f"{txt:>25}", end=" ")
        %timeit f(n)


### Tanulság.

### Kódolás.


Ha meg akarunk oldani egy feladatot, bontsuk kisebb részekre. A részfeladatok megoldásaiból rakjuk össze az eredeti feladat megoldását.

Ezt **dinamikus programozás**nak hívják. 

A Fibonacci sorozatnál a kézenfekvő felbontást a definíció adja. 
Ez vezet a rekurzív megoldásra. 
```python
def fib(n):
    if n < 2:
        return n
    else:
        return fib(n-1)+fib(n-2)
```

Itt ugyanazt a részfeladatot sokszor kell újra és újra kiszámolni, ezért ebben a formában nem szerencsés használni.

Javítási lehetőségek:

- Memorizálás. Ez sok dinamikus programozásra vezető feladatban használható. Eltároljuk a kiszámolt értékeket és ha már egyszer kiszámoltuk az használjuk.
  ```python
  memo = {}
  def f(x):
    if x not in memo:
        ## compute f(x)
        value = ...
        memo[x] = value
    return memo[x]
  ```
  Ahhoz, hogy ilyen formában használhassuk az szükséges hogy `f` paramétere kulcs lehessen a `dict` típusban!

- Olyan sorrendben megyünk végig a részfeladatokon, hogy a szükséges részeredmény rendelkezésre álljon:
  
  ```python
  def f(n):
    dp = [0]*(n+1)
    ## első néhány elem inicializálása
    for i in range(n+1):
        dp[i] = ... # számolás a már meglévő értékeke alapján
    return dp[-1]
  ```  

  Például a Fibonacci-ra:
  ```python
  def fib(n):
    dp = [0]*(n+1)
    ## első néhány elem inicializálása
    dp[1] = 1
    for i in range(2, n+1):
        dp[i] = dp[i-1] + dp[i-2] # számolás a már meglévő értékeke alapján
    return dp[-1]
  ```
Optimalizáslás: csak `dp` utolsó két eleme kell. Ez vezet az előadáson látott függvényre.

## Matek

Egy lineáris rekurzió:
$$
    a_n =\sum_{i=1}^ r b_i a_{n-i}, \quad n\geq r
$$
megoldása mátrix szorzással is leírható.
$$
    v_n = (a_n, a_{n-1},\dots,a_{n-r+1})^T\quad v_{n+1} = A v_n
$$
ahol
$$
    A = \begin{pmatrix}
    b_1& b_2 &b_3 & \dots &b_r\\
    1 & 0 & 0 & \dots& 0\\
    0 & 1 & 0 & \dots& 0\\
    0 & 0 & 1 & \dots& 0\\
    \vdots&&&&\vdots\\
    0 & 0& 0& \dots& 1
    
    \end{pmatrix}
$$
Így a sorozat $n$-eleme: $a_n= v_{n,1} = (1,0, \dots 0)\cdot v_n = (1,0,\dots,0)\cdot A^{n-r} v_r$

Egy $r\times r$ mátrix hatványai vektorok az $\mathbb{R}^{r\times r}$ véges dimenziós térben.
$$
    I, A, \dots, A^{r^2}
$$
nem lehet lineárisan független, azaz létezik legfeljebb $r^2$ fokú 1 főegyütthatós polinom $p$, amire
$$
    p(A) = 0,\quad\Rightarrow\quad A^{r^2} = \sum_{i=0}^{r^2-1} c_i A^i
$$
Ha $A$ Fibonacci számok kapcsán előjött $2\times 2$ mátrix, akkor másodfokú ($r=2$) polinomot is találtunk.

Általában is igaz, ha $A$ $r\times r$ mátrix, akkor
$$
    A^r = \sum_{i=0}^{r-1} c_i A^i
$$
Lineáris algebrában úgy fog szerepelni, hogy $A$ kielégíti a **karakterisztikus** polinomját!
Ebből az is látszik majd, hogy ha $A$ elemei egészek akkor a $c_i$ együtthatók is egészek.

Mátrixok hasonlósági transzformációval ($UAU^{-1}$) egyszerűbb alakra hozhatóak.
$$
    A^n = U^{-1}(UAU^{-1})^n U
$$
pl. 
$$
    A = 
    \begin{pmatrix}
    1 & 1 \\ 1 & 0
    \end{pmatrix},
    \qquad
    u = 
    \begin{pmatrix}
    \frac{1+\sqrt{5}}{2}\\ 1
    \end{pmatrix},
    \qquad
    v = 
    \begin{pmatrix}
    \frac{1-\sqrt{5}}{2}\\ 1
    \end{pmatrix}
$$
esetén 
$$
    Au = 
    \begin{pmatrix}
    \frac{3+\sqrt{5}}{2}\\ \frac{1+\sqrt{5}}{2}
    \end{pmatrix} = 
    \begin{pmatrix}
    \left(\frac{1+\sqrt{5}}{2}\right)^2\\ \frac{1+\sqrt{5}}{2}
    \end{pmatrix} = 
    \frac{1+\sqrt{5}}{2} u
$$
Hasonlóan $v$-re:
$$
    Av = 
    \begin{pmatrix}
    \frac{3-\sqrt{5}}{2}\\ \frac{1-\sqrt{5}}{2}
    \end{pmatrix} = 
    \begin{pmatrix}
    \left(\frac{1-\sqrt{5}}{2}\right)^2\\ \frac{1-\sqrt{5}}{2}
    \end{pmatrix} = 
    \frac{1-\sqrt{5}}{2} v
$$
Legyen $U$ az a mátrix, aminek oszlopai $\frac{1}{\|u\|} u$ és $\frac{1}{\|v\|}v$. $U^T$ jelöli a transzponált mátrixot.
Ezzel a választással
$$
    U^T U = 
    \begin{pmatrix}
    \frac{\langle u, u\rangle}{\|u\|^2} & \frac{\langle u, v\rangle}{\|u\|\|v\|}\\
    \frac{\langle v u\rangle}{\|u\|\|v\|} & \frac{\langle v, v\rangle}{\|v\|^2}
    \end{pmatrix}
    =
    \begin{pmatrix}
    1& 0\\
    0 & 1
    \end{pmatrix}
$$
és
$$
    U A U^T = \begin{pmatrix}
    \frac{1+\sqrt{5}}{2}& 0\\
    0 & \frac{1-\sqrt5}{2}
    \end{pmatrix}
$$
Azaz
$$
    A^n = U^T \begin{pmatrix}
    \frac{1+\sqrt{5}}{2}& 0\\
    0 & \frac{1-\sqrt5}{2}
    \end{pmatrix}^n U
$$
Az $A$ mátrixot *diagonalizáltuk* és ennek segítségével számoltuk a hatványt! Ez vezet a zárt formulára!

Lineáris algebrában az erre vonatkozó összefüggés a **Jordan felbontás**. 

## 2-sum

Adott egy $n\leq 10^5$ szám és egy $n$ hosszú $a$ lista, melynek elemeire $-10^{5} \leq a_i \leq 10^5$ teljesül.

Keressünk olyan $1\leq p<q\leq n$ indexpárt, hogy $a[p] = −a[q]$, ha ilyen létezik.


Például:
```
5
5 4 -5 6 8
```

itt egy lehetséges válasz `(0, 2)`

**Ötlet**: iteráljunk végig az indexpárokon és vizsgáljuk meg minden esetben, hogy teljesíti-e a feltételeket.

Ezt a megoldási módszert, amiben potenciálisan minden lehetséges jelöltet kipróbálunk, **brute force**-alapú (nyers erő) megoldásnak nevezünk. A brute force megoldás mindig működik, a kérdés inkább az, hogy vajon nem tudunk-e ennél jobbat kitalálni.

In [None]:
from itertools import combinations

def solve_2_sum(seq):
    for (i1, x1), (i2, x2) in combinations(enumerate(seq), 2):
        if x1 == -x2:
            return i1, i2
                
    return None


In [None]:
def format_ns(t):
    for unit in ['ns', 'μs', 'ms']:
        if t<1000:
            return f"{t:.2f} {unit}"
        t /= 1000
    return f"{t:.2f} s"

In [None]:
import random
import time

random.seed(2112)

xss = [[random.randint(-10**5, 10**5) for _ in range(50_000)],
       list(range(1,51)),
       list(range(1,501)),
       list(range(1,5_001))]

for xs in xss:
    t = time.perf_counter_ns()
    res = solve_2_sum(xs)
    print(f"run time: {format_ns(time.perf_counter_ns() - t)}")
    print(f"solution: {res}, check xs[res]={tuple(xs[i] for i in res) if res else res}")



A futási idő négyzetes a sorozat hosszában. Ha a bemenet 50_000 hosszúságú, akkor várhatóan
$$
    550*100~\text{ms} = 55~000~\text{ms} = 55~\text{s} 
$$
a futási idő

Milyen típus lenne alkalmas a már látott értékek és legalább egy hozzájuk tartozó index tárolására?

Egészítsük ki a következő függvényt

In [None]:
def solve_2_sum_better(seq):
    
    for i, x in enumerate(seq):
        ## ha -x volt korábban return 
        pass
    return None

In [None]:
random.seed(2112)

xss = [
       [random.randint(-10**5, 10**5) for _ in range(50_000)], 
       list(range(1,51)),list(range(1,501)),
       list(range(1,5_001)),
       list(range(1,50_001)),
       [1]*50, [1]*500, [1]*5_000, [1]*50_000
       ]
       

for xs in xss:
    print(f"---xs min={min(xs)}, max={max(xs)}, len(xs)={len(xs)}")

    t = time.perf_counter_ns()
    res = solve_2_sum_better(xs)
    print(f"   run time: {format_ns(time.perf_counter_ns() - t)}")
    print(f"   solution: {res}, check xs[res]={tuple(xs[i] for i in res) if res else res}")
    print("---")

# Egy gráfelméleti algoritmus

## Feladat

Adott egy `n` csúcsú irányítatlan gráf az élek listájával. A gráf csúcsait `0`-tól `n-1`-ig címkéztük meg, az éleket pedig a végpontokkal.

Emellett adott egy kiindulási pont és egy végpont. Azt szeretnénk eldönteni, hogy el lehet-e jutni a kiindulási pontból a végpontba a gráf éleit használva.

Gondolhatunk arra, hogy a gráf egy úthálózatot ír le és a kérdés az, hogy el tudunk-e jutni `A`-ból `B`-be.

Pl. `n = 3`, élek `edges = [[0,1], [1,2], [2,0]]`, `A =  0`, `B = 2`.

Gráfok megjelenítésére egy hasznos könyvtár a `graphviz`.

In [None]:
import importlib
if importlib.util.find_spec('graphviz') is None:
    ! pip install graphviz
import graphviz

In [None]:
edges = [[0,1], [1,2], [2,0]]
g0 = graphviz.Graph()

g0.edges([(str(a), str(b)) for a, b in edges])
g0

A gráf összefüggő, tetszőleges `A`, `B` esetén a válasz: `True`

In [None]:
n = 6
edges = [[0,1],[0,2],[3,5],[5,4],[4,3]]
A = 0
B = 5

g1 = graphviz.Graph()
g1.edges([(str(a), str(b)) for a, b in edges])
g1

Nincs út 0 és 5 között. A válasz: `False`

Összefüggőségi komponenseket szeretnénk számolni.



## Ötlet.

Az él nélküli gráfból indulunk ki. Itt egy elemű komponensek vannak.

Minden komponensből válasszunk egy reprezentáns és minden $i$ pontra feljegyezzük, melyik komponensben van.




In [None]:
def show_graph(roots, direction = 'LR'):
    g = graphviz.Digraph(graph_attr={'rankdir': direction})
    g.edges((str(i), str(r)) for i, r in enumerate(roots))
    return g

In [None]:
n = 5
roots = [i for i in range(n)]
display(show_graph(roots, 'TD'))

ha behúzzuk a $(0, 1)$ élet, akkor $0$ és $1$ azonos komponensbe kerül. Választhatunk a két összeuniózott komponens reprezentánsa között, legyen pl. 1

In [None]:
roots[0] = 1
display(show_graph(roots, 'TD'))

Ha most a (0, 2) élet akarjuk behúzni, akkor nem állíthatjuk át `roots[0]`. Meg kell keresnünk `0` komponensének reprezentását, ez 1 és vagy `roots[1]`-et állítjuk 2 -re, vagy `roots[2]`-t 1-re.

In [None]:
def find(roots, a):
    while a != roots[a]:
        a = roots[a]
    return a

In [None]:
find(roots, 0), find(roots, 2)

In [None]:
def union(roots, a, b):
    ra = find(roots, a)
    rb = find(roots, b)
    roots[ra] = rb

In [None]:
union(roots, 0, 2)
print(f"After union(0, 2) {roots=}")
display(show_graph(roots))

union(roots, 3, 4)
print(f"After union(3, 4) {roots=}")
print(roots)
display(show_graph(roots))

union(roots, 3, 2)
print(f"After union(3, 2) {roots=}")
print(roots)
display(show_graph(roots))

Ezután az a kérdés, hogy el lehet-e jutni `A`-ból, `B`-be könnyen eldönthető. Ha `A` és `B` azonos komponensben van, akkor `A` és `B` között megy út az eredeti gráfban, különben nem.

1. példa
`n = 3`, élek `edges = [[0,1], [1,2], [2,0]]`, `A =  0`, `B = 2`.

In [None]:
def show_edges(edges, direction='LR'):
    g = graphviz.Graph(graph_attr={'rankdir': direction})
    g.edges([(str(a), str(b)) for a, b in edges])
    return g

In [None]:
n = 3
edges = [[0,1], [1,2], [2,0]]
A =  0
B = 2

display(show_edges(edges, 'TD'))
print(f"Eredeti gráf")
print("="*50)

roots = [i for i in range(n)]
for a, b in edges:
    union(roots, a, b)

display(show_graph(roots))
print(f"{A=} és {B=} {'azonos' if find(roots, A)==find(roots, B) else 'különböző'} komponensben van")

2. példa

In [None]:
n = 6
edges = [[0,1],[0,2],[3,5],[5,4],[4,3]]
A = 0
B = 5

display(show_edges(edges))
print(f"Eredeti gráf")
print("="*50)

roots = [i for i in range(n)]
for a, b in edges:
    union(roots, a, b)

display(show_graph(roots))
print(f"{A=} és {B=} {'azonos' if find(roots, A)==find(roots, B) else 'különböző'} komponensben van")


Mi történik, ha nagyobb gráfunk van?

In [None]:
n = 10
edges = [(0,i+1) for i in range(n-1)]
display(show_edges(edges, 'TD'))

roots = [i for i in range(n)]
for a, b in edges:
    union(roots, a, b)

display(show_graph(roots))


Valahányszor behúzzuk a $(0, i)$ élet, meg kell keresni $0$ reprezentánsát. $k$ él behúzása után $k$-lépéssel találjuk meg. Ha 10 helyett 10_000 méretű a gráf ez nem fog működni.

### Javítási lehetőségek.

- Amikor megkeressük $i$ reprezentánsát végig megyünk a reprezentánshoz vezető úton. Minden meglátogatott csúcsra ismerté válik a reprezentáns értéke. Ezt beírhatjuk a `roots` tömbe. (path compression)

- A nagyobb komponensbe kössük be a kisebbet és ne fordítva. Ehhez  a ,,méretet'' nyilván kell tartani.

In [None]:
def find_better(roots, a):
    ra = roots[a]
    if a != ra:
        ra = find_better(roots, ra)
        roots[a] = ra
    return ra

def find_better_without_recursion(roots, a):
    stack = []

    ra = roots[a]
    while a != ra:
        stack.append(a)
        a = ra
        ra = roots[a]

    while stack:
        roots[stack.pop()] = ra

    return ra


def union_sizes(roots, sizes, a, b):
    ra = find_better(roots, a)
    rb = find_better(roots, b)
    if ra != rb:
        if sizes[ra] < sizes[rb]:
            ra, rb = rb, ra
        roots[rb] = ra
        sizes[ra] += sizes[rb]

def union_ranks(roots, ranks, a, b):
    ra = find_better(roots, a)
    rb = find_better(roots, b)
    if ra != rb:
        if ranks[ra] < ranks[rb]:
            ra, rb = rb, ra
        roots[rb] = ra
        if ranks[ra] == ranks[rb]:
            ranks[ra] += 1




In [None]:
n = 10
edges = [(0, i) for i in range(1, n)]
display(show_edges(edges, 'TD'))

roots = [i for i in range(n)]

for a, b in edges:
    ra = find_better(roots, a)
    rb = find_better(roots, b)
    roots[ra] = rb

display(show_graph(roots, 'LR'))


In [None]:
n = 10
edges = [(0, i) for i in range(1, n)]
display(show_edges(edges, 'TD'))

roots = [i for i in range(n)]

for a, b in edges:
    ra = find_better(roots, a)
    rb = find_better(roots, b)
    roots[rb] = ra

display(show_graph(roots, 'TD'))


In [None]:
n = 10
edges = [(0, i) for i in range(1, n)]
display(show_edges(edges, 'TD'))

roots = [i for i in range(n)]
sizes = [1]*n

for a, b in edges:
    union_sizes(roots, sizes, a, b)

display(show_graph(roots, 'TD'))


In [None]:
n = 10
edges = [(0, i) for i in range(1, n)]
display(show_edges(edges, 'TD'))

roots = [i for i in range(n)]
ranks = [0]*n

for a, b in edges:
    union_ranks(roots, ranks, a, b)

display(show_graph(roots, 'TD'))


### Szokásos implementáció

In [None]:
class UnionFind:
    def __init__(self, n):
        self.roots = [i for i in range(n)]
        self.sizes = [1]*n 

    def find(self, a):
        ra = self.roots[a]
        if a != ra:
            ra = self.find( ra)
            self.roots[a] = ra
        return ra
    
    def union(self, a, b):
        ra = self.find(a)
        rb = self.find(b)
        if ra != rb:
            if self.sizes[ra] < self.sizes[rb]:
                ra, rb = rb, ra
            self.roots[rb] = ra
            self.sizes[ra] += self.sizes[rb]


In [None]:
uf = UnionFind(10)
print(uf)
uf.union(1, 2)
print(uf)
uf.union(5, 9)
uf.union(6, 7)
print(uf)

uf

`__str__` és `__repr__` metódusok

In [None]:
def as_set(seq):
    return f"{{{', '.join(map(str, seq))}}}"

def uf_str(self):
    components = {}
    for a in range(len(self.roots)):
        ra = self.find(a)
        if ra not in components:
            components[ra] = []
        components[ra].append(a)
    return f"{{{ ', '.join(map(as_set, components.values()))}}}"

def uf_repr(self):
    return f"{type(self).__name__}({len(self.roots)})"

# Így is lehet:
UnionFind.__str__ = uf_str
UnionFind.__repr__ = uf_repr

In [None]:
uf = UnionFind(10)
print(uf)
uf.union(1, 2)
print(uf)
uf.union(5, 9)
uf.union(6, 7)
print(uf)

uf

### További kérdések

- Tegyük fel, hogy a komponensek száma érdekel minket. Hogyan oldanánk, meg, hogy konstans idő alatt megkaphassuk.
- Tegyük fel, hogy a legnagyobb komponens méretet érdekel minket. Hogyan oldanánk, meg, hogy konstans idő alatt megkaphassuk.
- Hogyan ellenőriznénk, hogy két partíció azonos?

## Feladat

Írjunk egy függvényt, ami kiszámolja az első $n$ természetes szám $p$-ik hatványösszegét.

pl. `p = 0`-ra

```Python
def f0(n):
    return n
```

jó, mert $k^0=1$ ha $k=1,\dots,n$ és ezek összege pont $n$.

Ha `p = 1`, akkor

```Python
def f1(n):
    return n*(n+1)//2
```

jó, mert $\sum_{k=1}^n k = n(n+1)/2$.

Még `p = 2`-t is tanultuk

```Python
def f2(n):
    return n*(n+1)*(2*n+1)//6
```

Általános $p$-re tudunk-e ilyen függvényt írni?

In [None]:
def mk_power_sum(p):
    def f(n):
        total = 0
        for k in range(1, n+1):
            total += k**p
        return total

    f.__doc__ = f"""
        {p}-ik hatványok összegét számolja
        """

    return f

In [None]:
f2_slow = mk_power_sum(2)

In [None]:
f2_slow?

In [None]:
[f2_slow(i) for i in range(0, 10)]

In [None]:
def f2_fast(n):
    return n*(n+1)*(2*n+1)//6

In [None]:
%timeit f2_slow(10_000)
%timeit f2_fast(10_000)

### Ötlet

$$
    \sum_{k=r}^n  \binom{k}{r} = \binom{n+1}{r+1}
$$

**Bizonyítás.**
$\{1,2,\dots,n+1\}$-ből válasszunk ki $r+1$ különböző számot.

Összes lehetőség:
$$
\binom{n+1}{r+1}.
$$

Számoljuk meg az eseteket aszerint szétbontva is, hogy legnagyobb kiválasztott szám mivel egyenlő.

Ha a legnagyobb szám $k+1$, akkor a maradék $r$ számot $\{1,2,\dots, k\}$ közül választjuk. Így az esetek száma
$$
    \sum_{k+1=r+1}^{n+1} \binom{k}{r} =  \sum_{k=r}^{n} \binom{k}{r}
$$  
$k+1$ helyett $k$ az összegzési változó

Ugyanez másképp.

$$
\binom{k}{r} = \frac{1}{r!} k(k-1)\cdots(k-r+1) = p_r(k-r+1),\quad\text{ahol}\quad p_r(x) = \frac{x(x+1)\cdots(x+r-1)}{r!}
$$
és
$$
    \sum_{j=1}^{n-r+1} p_r(j) = p_{r+1}(n+1-(r+1)+1)= p_{r+1}(n-r+1)\quad\text{minden $n\geq r$ és $r\geq 0$-ra}
$$

Az összegzés felső határa és $p_{r+1}$ argumentuma ugyanaz, azaz

$$
\sum_{j=0}^{n} p_r(j) = p_{r+1}(n)
$$

**Lineáris algebra.**

$$
p_0\equiv 1,\quad p_1(x)=x,\quad p_2(x)=\frac12x(x+1),\quad\dots,\quad p_r(x)=\frac1{r!}x(x+1)\cdots(x+r-1)
$$

bázis a legfeljebb $r$-edfokú polinomok vektorterében.

$$
    x^r = \sum_{i=0}^r a_i p_i(x)
$$
és
$$
    \sum_{k=0}^n k^r = \sum_{k=0}^n \sum_{i=0}^r a_i p_i(k) =  \sum_{i=0}^r a_i  \sum_{k=0}^n p_i(k) = \sum_{i=0}^r a_i  p_{i+1}(n)
$$


### Összefoglalva

- Egy polinomot az együtthatókkal ábrázolhatunk.
- Kellene egy függvény, ami a természetes $1, x, x^2,\dots$ bázisban felírt polinomot a $p_0,p_1,\dots$ bázisban ír fel.
- $p_0, p_1, \dots,$ bázisban az összegzés könnyű, lényegében arrébb kell tolni az együtthatókat.
- A $p_0,p_1,\dots$ bázisban felírt polinomot vagy visszaszámoljuk a természetes bázisba, vagy megírjuk a függvényt, ami kiértékeli a függvényt egy adott pontban.

In [None]:
def poly_taylor(coeff):
    """
    returns a polinomial function
    sum coeff[i] x**i = coeff[0] + x*(coeff[1] + x*(...))
    """
    def f(x):
        value = 0
        for c in reversed(coeff):
            value = value*x+c
        return value

    return f

def poly_other(coeff):
    """
    returns a polinomial function
    sum coeff[i] x*(x+1)*...(x+i-1) = coeff[0] + x*(coeff[1] + (x+1)*(...))
    """
    def f(x):
        value = 0
        p = 1
        for i, c in enumerate(coeff):
            value += c*p
            p = p*(x+i)/(i+1)
        return value

    return f

In [None]:
f = poly_taylor([0, 0, 1])

f(0), f(1), f(2), f(0.5)


In [None]:
g = poly_other([0, 0, 1])

g(0), g(1), g(2), g(0.5)


Vegyük észre, hogy $p_0$ azonosan 1, $p_1(0)=0$, $p_2(0)=p_2(-1)=0$, stb.

Ha $f=\sum_i a_i p_i$, akkor
$$
    f(0) = \sum_i a_i p(0) = a_0, \quad f(-1) = a_0 p_0(-1) + a_1 p_1(-1),\quad f(-k) = a_0 p_0(-k) + a_1 p_1(-k) + \cdots + a_k p_k(-k).
$$
amiből

$$
\begin{align*}
    a_0 & = f(0)\\
    a_1 & = \frac{f(-1) - a_0 p_0(-1)}{p_1(-1)}\\
    \vdots\\
    a_k & = \frac{f(-k) - \sum_{j=0}^{k-1} a_j p_j(-k)}{p_{k}(-k)}\\
    \vdots
\end{align*}
$$  
Kihasználhatjuk még, hogy
$$
p_k(-k)=\frac{1}{k!}(-k)(-k+1)\cdots(-k+(k-1))=(-1)^k.
$$

In [None]:
def taylor_to_other(coeff):
    f = poly_taylor(coeff)
    new_coeff = []
    def p_value(x):
        value = 0
        p = 1
        for i, c in enumerate(new_coeff):
            value += c*p
            p = (p*(x+i))//(i+1)
        return value

    for i in range(len(coeff)):
        c = f(-i)-p_value(-i)
        if i % 2 == 1:
            c = -c
        new_coeff.append(c)

    return new_coeff

In [None]:
taylor_to_other([0, 0, 0, 1])

Gyors ellenőrzés.

In [None]:
coeff = [0,0,0,1]
f0 = poly_taylor(coeff)
f1 = poly_other(taylor_to_other(coeff))

for i in range(10):
    print(f"{i=}, {f0(i)=}, {f1(i)=}")

In [None]:
def mk_fast_power_sum(p):
    coeff = taylor_to_other([0]*p+[1])
    def f(n: int) -> int:
        value = 0
        px = n
        for i, c in enumerate(coeff, 1):
            value += c*px
            px = (px*(n+i))//(i+1)
        return value


    f.__doc__ = f"""
    Computes the sum of the p-th power of the first `n` positive integer with {p = }.
    """
    return f

In [None]:
taylor_to_other([0]*2+[1])

In [None]:
f2 = mk_fast_power_sum(2)

In [None]:
f2?

In [None]:
f2(0), f2(1), f2(2), f2(3)

In [None]:
%%ipytest

def test_fast_power_sum():
    for i in range(1, 4):
        f = mk_fast_power_sum(i)
        g = mk_power_sum(i)
        for n in range(1000):
            assert f(n) == g(n)

In [None]:
%timeit f2_slow(10_000)
%timeit f2(10_000)
%timeit f2_fast(10_000)

In [None]:
cell = f2.__closure__[0]
cell.cell_contents

# Faktoriális értékének közelítése

Mekkora $n!$, ha $n$ nagy?

Ötlet:
$$
    \log n! = \sum_{k=1}^n \log k \approx \int_1^{?} \log x dx = \left[ x(\log x-1)\right]_{x=1}^{x=?}
$$

In [None]:
import matplotlib.pyplot as plt
import math

def subdivision(a, b, n):
    d = (b-a)/n
    return [a+i*d for i in range(n+1)]

def add_function_curve(f, a, b, n=100):
    xs = subdivision(a, b, n)
    fxs = [f(x) for x in  xs]
    plt.plot(xs, fxs, "r-")

## Téglalap közelítés

In [None]:
k_values = [k for k in range(1, 11)]
for k in k_values:
    plt.fill_between([k+i for k in k_values for i in range(2)], [math.log(k) for k in k_values for i in range(2)], color='lightblue')

add_function_curve(math.log, 1, 11)


A hiba:

In [None]:
def primitive_function(x):
    return x*(math.log(x)-1)

def rectangle_error(k):
    return primitive_function(k+1)-primitive_function(k)-math.log(k)

def cummulative_error(n, error_fun=rectangle_error):
    return sum(error_fun(k) for k in range(1, n+1))

In [None]:
for n in [10, 100, 1000]:
    print(f"{n=}, {cummulative_error(n)=}")

### Javítás, trapéz összeg közelítés

Téglalapok helyett minden egység intervallumon a beírt trapézt  használjuk.

In [None]:
k_values = [k for k in range(1, 11)]
for k in k_values:
    plt.fill_between(k_values, [math.log(k) for k in k_values], color='lightblue')

add_function_curve(math.log, 1, 10)


In [None]:
def error_fun(x):
    k, t = divmod(x, 1)
    return math.log(x) - ((1-t)*math.log(k) + t*math.log(k+1))

xs = subdivision(1, 10, 100)
plt.fill_between(xs, [error_fun(x) for x in xs], color='lightblue')
add_function_curve(error_fun, 1, 10, 500)


In [None]:
def modified_error_fun(x):
    k = x//1
    return k*k*error_fun(x)

for a in [1, 100, 1000, 10000]:
    b = a+10
    xs = subdivision(a, b, 1000)

    plt.fill_between(xs, [modified_error_fun(x) for x in xs], color='lightblue')
    add_function_curve(modified_error_fun, a, b, 1000)
    plt.show()

In [None]:
def trapezoid_error(k):
    return primitive_function(k+1)-primitive_function(k)-0.5*(math.log(k)+math.log(k+1))


In [None]:
for n in [10, 100, 1000]:
    print(f"{n = :>4}, {cummulative_error(n, trapezoid_error) = :.8f}")

## Látszik, hogy a hiba lassan nő. Tudunk-e felső becslést adni rá?

$$
    \int_{k}^{k+1} \log x dx = \int_0^1 \log(k+x) dx
$$

A beírt trapéz területe integrállal

$$
    \int_0^1 x\log(k+1)+(1-x)\log(k) dx
$$

Tudjuk-e becsülni a két integrandus különbségét?
$$
    \log(k+x) - (x\log(k+1)+(1-x)\log(k))
$$

Átalakítás mindkét tagból levonunk $\log(k)$-t:
$$
    \log(k+x) - \log(k) - (x\log(k+1)+(1-x)\log(k) -\log(k)) = \log(1+\tfrac{x}{k}) - x\log(1+\tfrac1k)
$$


In [None]:
xs = subdivision(0, 1, 100)

for k in range(1, 4):
    plt.fill_between(xs, [math.log(k+x)-math.log(k) for x in xs], [math.log(k+1)*x+math.log(k)*(1-x)-math.log(k) for x in xs], color="blue")

plt.grid()

A logaritmus függvény konkáv, a derivált monoton fogy ($1/x$) és egy beírt húr mindig a végponthoz behúzott érintő egyenesek alatt van.

$$
    \log (1+x)\leq x
$$

ezért
$$
    \log(1+x/k) - x \log(1+1/k)\leq \frac xk - x\log(1+1/k) = x(1/k -\log(1+1/k))
$$

de
$$
    \log(1+1/k) = \log\frac{k+1}{k} = -\log\frac{k}{k+1} = -\log(1-1/(k+1)) \geq \frac1{k+1}
$$

Így

$$
    \log(1+x/k) - x \log(1+1/k)\leq x\left(\frac1k-\frac1{k+1}\right)
$$
és
a $k$. intervallumon elkövetett hiba legfeljebb
$$
    \int_{0}^{1} \log(k+x) - ((1-x)\log(k)+x\log(k+1))dx = \int_0^1 x dx \left(\frac1k -\frac1{k+1}\right)
$$
A hibák összege legfeljebb:
$$
    \frac12 \sum_{k=1}^\infty \frac1k -\frac1{k+1} =\frac12
$$

Összefoglalva:

$$
    \log n! = \int_1^n \log x dx + \frac12 \log n + r_n = n(\log(n) - 1) + 1 + \frac12 \log (n) + r_n
$$
ahol $r_n$ a közelítés hibája az első $n$ intervallumon
$$
    r_n = \sum_{k=1}^n \int_0^1 \log(1+x/k)-x\log(1+1/k)dx \leq 1/2
$$
$(r_n)$ monoton nő, ezért létezik limesze.

Visszaírva faktoriálisra:

$$
    n! = \sqrt{n}\left(\frac{n}{e}\right)^n c_n
$$
ahol $c_n=e^{1+r_n}\leq e^{3/2}$

Analízisben a Wallis formula következményeként szerepel

$$
\lim c_n = \sqrt{2\pi}
$$

Középiskolai tudást használva is kiszámíthatnánk:
$$
    \sqrt{n}\frac1{2^{2n}}\binom{2n}{n}
    = \sqrt{n} \frac1{2^{2n}} \frac{c_{2n} \sqrt{2n} \left(\frac{2n}{e}\right)^{2n}}{c_n^2 n\left(\frac{n}{e}\right)^{2n}}
    \to \lim_{n\to\infty} \frac{c_{2n}}{c_n^2} = \lim_{n\to\infty}\frac{\sqrt{2}}{c_n}
$$

Az
$$
    I_n = \int_{0}^{\pi/2} \cos^n(x) dx
$$
sorozatot vizsgálva,
$$
\frac1{2^{2n}}\binom{2n}{n}\approx \frac{1}{\sqrt{\pi n}}
$$
adódik,  amiből $\lim_n c_n =\sqrt{2\pi}$.

Ez a nevezetes **Stirling** formula:
$$
 \frac{n!}{\sqrt{2\pi n}\left(\frac{n}{e}\right)^n} \to 1
$$
