# A Python nyelv alapelemei

## Összefoglalás előző óráról

- Értékadás változónak példa:
  ```python
  a = 1
  ```
- Műveletek egyszerű típusokkal:
    
  * Számokkal a szokásos műveletek a szokásos jelölésekkel. Kivétel a hatványozás $2^3$: `2**3`
    
  * string: `a+b` a két string összefűzése, `a*n` `a` megismétlése `n`-szer
   
  * logikai változók: `or`, `and`
    
  * összehasonlítás: `==`, `!=`, `is`, `is not`, `<`, `<=`, `>`, `>=`.

- Kiírás, beolvasás: `print` és `input`


## Összefoglalás előző óráról

- Szövegformázás: `f-string`: `f"{n=}, {fibonacci(n)=}"`

- függvény definíció példa:
  ```python
  def cube(x):
      y = x**3 # y kiszámolása
      return y
  ```
- `for` ciklus példa:
   ```python
   for i in range(10):
       print(i)
   ```
- `while` ciklus példa:
  ```python
  i = 0
  while i < 10:
      print(i)
  ```
<!-- - Elágazás példa:
   ```python
   if condition:
       print(f"A feltétel igaz")
   else:
       print(f"A feltétel hamis")
   ``` -->

# Fibonacci példa vége előző előadásról

In [None]:
def fibonacci(n):
    sqrt5 = 5**0.5
    x_1 = (1+sqrt5)/2 
    x_2 = (1-sqrt5)/2
    f = (x_1**n - x_2**n)/sqrt5
    return int(f)

In [None]:
for n in range(5):
    print(n, fibonacci(n))

Remek! 

Kell-e `x_2**n`?

$$
    f_n = \frac{1}{\sqrt{5}} x_1^n -\frac{1}{\sqrt{5}} x_2^n \in \mathbb{Z}
$$
de itt a második tag abszolút értékben legfeljebb $1/\sqrt{5}<1/2$. Azaz simán vehetnénk az első tag kerekített értékét.

### Lehet-e szebben `print`-elni? `f-string`



Egy kényelmes módja a szöveg formázásának az ún. `f-string`. Például:  

In [None]:
n = 10
print(f"A {n}. Fibonacci szám: {fibonacci(n)}")
print(f"Ha {n=}, akkor {fibonacci(n)=}")


Mi történik itt?

Mivel a sztring előtt állt az `f` betű, a sztringen belül a kapcsos zárójel speciális szerepet kapott. 

A kapcsos zárójelek közti részeket a Python értelmező helyettesítette az ott szereplő kifejezések aktuális értékével (string interpolation). 

Az `=` jel itt nem értékadást jelöl, hanem azt, hogy azt a kifejezést is ki akarjuk írni amiből az érték adódott.

`f-string`-gel nagyon sok mindent meg lehet oldani. Gyakorlaton lesznek további példák.

### Jó eredményt ad-e a függvényünk?

In [None]:
for n in range(10):
    a = fibonacci(n)
    b = fibonacci(n+1)
    c = fibonacci(n+2)
    print(f"{n=:2}, f_{n}={a:2}, f_{n+1}={b:2}, f_{n+2}={c:2}, rekurzió teljesül {a+b==c}")
    

## Fibonacci kalkulátor


In [None]:

n = 3.1
print(f"A(z) {n}. Fibonacci szám {fibonacci(n)}")

Mi a hiba? Hogyan orvosolható? Tudjuk-e ellenőrizni, hogy egy adott változó értéke megfelelő típusú-e?

## Feltételes elágazás

A `fibonacci` függvény csak számmal működik, de igazából csak nem negatív egész számra értelmes. Tudjuk-e ezt a feltételt ellenőrizni.

Erre szolgál az `if ... else ...`, `if ... elif ... else ...` kifejezés. 

In [None]:
num = 3.1

if type(num) is int:
    print(f"{num=} egy egész")
elif type(num ) is float:
    print(f"{num=} egy valós (lebegőpontos)")
else:
    print(f"{num=} típusa {type(num)}")

## Kicsit hibatűrőbb `fibonacci`

In [6]:
def fibonacci(n):
    if type(n) is not int or n < 0:
        print(f"nem negatív egész számot várok. Ezzel szemben {type(n)=} és {n=}.")
    else:
        sqrt5 = 5**0.5
        x_1 = (1+sqrt5)/2 
        f = round(x_1**n/sqrt5)
        return int(f)


Két logikai kifejezést  `type(n) is not int` és `n < 0` az `or` művelettel kapcsoltunk össze. 

- `or` logikai vagy
- `and` logikai és.
- `is` tagadása `is not`, `==` tagadása `!=`

## Kis teszt

In [7]:
fibonacci??

[0;31mSignature:[0m [0mfibonacci[0m[0;34m([0m[0mn[0m[0;34m)[0m[0;34m[0m[0;34m[0m[0m
[0;31mDocstring:[0m <no docstring>
[0;31mSource:[0m   
[0;32mdef[0m [0mfibonacci[0m[0;34m([0m[0mn[0m[0;34m)[0m[0;34m:[0m[0;34m[0m
[0;34m[0m    [0;32mif[0m [0mtype[0m[0;34m([0m[0mn[0m[0;34m)[0m [0;32mis[0m [0;32mnot[0m [0mint[0m [0;32mor[0m [0mn[0m [0;34m<[0m [0;36m0[0m[0;34m:[0m[0;34m[0m
[0;34m[0m        [0mprint[0m[0;34m([0m[0;34mf"nem negatív egész számot várok. Ezzel szemben {type(n)=} és {n=}."[0m[0;34m)[0m[0;34m[0m
[0;34m[0m    [0;32melse[0m[0;34m:[0m[0;34m[0m
[0;34m[0m        [0msqrt5[0m [0;34m=[0m [0;36m5[0m[0;34m**[0m[0;36m0.5[0m[0;34m[0m
[0;34m[0m        [0mx_1[0m [0;34m=[0m [0;34m([0m[0;36m1[0m[0;34m+[0m[0msqrt5[0m[0;34m)[0m[0;34m/[0m[0;36m2[0m [0;34m[0m
[0;34m[0m        [0mf[0m [0;34m=[0m [0mround[0m[0;34m([0m[0mx_1[0m[0;34m**[0m[0mn[0m[0;34m/[0m[0msqrt5[0

In [None]:
fibonacci('12')
fibonacci(1.0)
fibonacci(-1)


Hf. Gondolkodjunk rajta miért nem kaptunk hibajelzést az első esetben! A `'12' < 0` kifejezés végrehajtása hibára vezetne!

## Logikai értékek (Boolean values)

Majdnem mindennek van logikai értéke. Ezt a `bool` függvénnyel kapjuk meg. Valójában típus konverzió történik, csak úgy mint az `int`, `float`, `str` alkalmazásakor.

In [None]:
print(f"{bool(0)=}, {bool(-1)=}, {bool(0.0)=}, {bool(2.0)=}")
print(f"{bool([])=}, {bool([0])=},  {bool('')=}, {bool('a')=}")
print(f"{bool(range(0))=}, {bool(range(10))=}, {bool(None)=}")

## Hogyan értékelődnek ki a logikai kifejezések?

Balról jobbra mindaddig amíg el nem dől a kifejezés értéke. Pl.

```python
a and b
```
esetén először `a` logikai értéke  `bool(a)` kerül kiszámításra. Ha ez hamis tudjuk, hogy `a and b` is hamis és a kifejezés értéke `a` értéke lesz. Ha `a` igaz, akkor a kifejezés értéke `b` értéke lesz.

Hasonlóan `or`-nál:
```python
a or b
```
esetén, ha `bool(a)` igaz, akkor az értéke `a` értéke, ha hamis akkor `b`-é.


## Példa.

In [None]:
def true0():
    print("calling true0")
    return "true0"

def true1():
    print("calling true1")
    return -2

def false0():
    print("calling false0")
    return None

In [None]:
print(f"{true0() and true1()=}", end="\n---\n")
print(f"{true0() and false0() and true1()=}", end="\n---\n")
print(f"{true0() or true1()=}", end="\n---\n")
print(f"{false0() or true0() or true1()=}", end="\n---\n")

# Kérdés a felmérőből:

`True + True`

In [None]:
True + True

In [None]:
print(f"{type(True)=}, {isinstance(True, int)=}")

In [None]:
True + 1, True*15

In [None]:
a = 10 
b = 0

a + (b==0)

## Feltételes elágazások: if - elif - else (Conditional branching)

Ha a feltétel igaz, csináljunk valamit. (Feltételes utasítás)


```python
if condition:
    do_something()
```

In [None]:
a = 2022

if a % 2 == 0:
    a = a // 2
    
print(a)    

Az `elif` ágak és az `else` ág opcionális. Amelyik feltétel először teljesül, az az ág hajtódik végre, a többi nem. Ha egyik sem teljesül és van `else` ág, akkor az `else` ág hajtódik végre.

```python
if condition_1:
    do_something_1() 
elif condition_2:
    do_something_2()   
# ...
elif condition_n:
    do_something_n()
else:
    do_something_else()
```

In [None]:
a = 10

if a % 3 == 0:
    print("A")
    
elif a % 2 == 0:
    print("B")
    
elif a % 5 == 0:
    print("C")
    
else:
    print("D")

# Hogyan ellenőriznénk le hogy egy pozitív szám prím-e?

$n>1$ prím $\iff$ nem létezik $1< a < n$ ami osztaná $n$-et.

Megjegyzés. Nem ez a definíció. $p$ prím, ha $p| ab$ esetén vagy $p|a$ vagy $p|b$. Ezt nem tudnánk ellenőrizni!

In [None]:
def is_prime(n):
    for a in range(n):
        if a > 1 and n % a == 0:
            return False
    return True

A kód végtelenül egyszerű. Jó-e?

In [None]:
i = -1
while i < 5:
    print(f"{i=}, {'nem' if not is_prime(i) else ''} prím")
    i += 1

## Javítás. 

Ha $n$ negatív nézzük az abszolút értékét és figyeljünk oda, hogy $n$ lehet nulla és egy is.

In [None]:
def is_prime(n):
    if n < 0:
        n = -n
    if n < 2:
        return False
    for a in range(n):
        if a > 1 and n % a == 0:
            return False
    return True

## Tesztelés

A Python-ban van beépített `unittest` modul és van egy külső könyvtár `pytest` néven. Mi az utóbbi Jupyter notebook-os változatát használjuk majd. 

Szükség esetén a telepítés, Jupyter notebook-on belülről indítva a
```
! pip install ipytest
```
paranccsal lehetséges. A `!` a sor elején jelzi, hogy ezt a parancsot az operációs rendszerünk parancssorában akarjuk futtatni.



In [None]:
import ipytest

ipytest.autoconfig() 

## Teszt cella

In [None]:
%%ipytest

def test_is_prime():
    assert is_prime(0) == False
    assert is_prime(1) == False
    assert is_prime(2) == True
    assert is_prime(3) == True
    assert is_prime(4) == False
    assert is_prime(5) == True
    assert is_prime(6) == False
    assert is_prime(7) == True
    assert is_prime(8) == False
    assert is_prime(9) == False
    assert is_prime(10) == False
    assert is_prime(11) == True

## Futási idő

In [None]:
import pandas as pd

def timing(p):
    timing = %timeit -n 10 -o -q is_prime(p)
    return timing.average

run_times = [(p, t:=(1000*timing(p)), t/p) for p in [997, 9973, 99991, 999983]] 
df = pd.DataFrame(run_times, columns=["p", "run time (ms)", "run time/p (ms)"])
df

Futási idő közel lineáris $p$-ben. Ha $p$ prím a futási idő közelítőleg: $p*50$ ns.

Mi lenne a futási idő $p=10^9+7$-re (ez is prím): $p\times 5\cdot 10^{-8}\approx 50$ másodperc.

In [None]:
%%time
is_prime(10**9+7)

Házi feladat. Írjunk meg prímszám tesztet úgy, hogy $p=10^9+7$-re is lefusson elfogadható időn belül.

Az a megoldás, hogy ezt az esetet külön kezeljük, nem elfogadható!

# Eratoszthenészi szita

Kiindulunk a számok listájából ($0$ és $n$) között 0 és 1 nem prímszám, ezeket kihúzzuk. Az első szám amit nem húztunk ki 2 ez prím, a többszöröseit töröljük, és így tovább.

Van-e olyan típus pythonban, amit itt használhatnánk?

`int`, `float`, `bool` csak egy értéket tud tárolni. 

# Listák

A Pythonban egy véges sorozat elemeinek tárolására a `list` típus szolgál. A sorozat elemei különböző típusúak is lehetnek, a lista hossza futási időben változhat. 

Más nyelvekben `vector` név is használatos erre a típusra.

## Lista létrehozása:

In [None]:
# list hasában egy sorozatot ,,generáló'' függvény
values = list(range(10))
print(values)

In [None]:

# elemek felsorolásával szögletes zárójelek között
values = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
print(values)

In [None]:

# list comprehension (generátor kifejezés szögletes zárójelek között)
values = [x**2 for x in range(10)]
print(values)

## Műveletek listákkal:

- aritmetikai műveletek: `+`, `*`. Sztringekhez hasonló: `+` összefűzés, `*` ismételt összefűzés önmagával.

- indexelés: hasonlóan sztringekhez: `lst[0]` a nulla indexű (azaz első) lista elem, `lst[10]` a 11. elem (hiba, ha  a lista rövidebb). `lst[-1]` az utolsó elem, `lst[-2]`  hátulról a második, stb.

- indexeléshez `slice` is használható. pl.
  ```python
  numbers = list(range(10))
  numbers[1::2]  # páratlan számok részsorozata
  ```
  Jelölés: `start : end : step` 

## Lista metódusok, függvények:

* `len`: `len(lst)` visszadja az `lst` lista elemeinek számát, azaz a hosszát.

* `append`: `lst.append(1)` új értéket (1) fűz a lista végére.

* `pop`: kivesz egy elemet a megadott helyről, alapértelmezésben a lista végéről, `lst.pop()`  

* `sort`: sorbarendezi a lista elemeit (a lista megváltozik!).  

* `extend`: kibővíti a listát a megadott sorozat elemeivel. pl. `lst.extend(range(10))`.

***** 

* `clear`: a lista minden elemét törli, pl. `lst.clear()`

* `insert`: beszúr egy elemet a megadott helyre, pl. `lst.insert(0, 'a')`

* `remove`: töröl egy elemet a listából, hiba, ha az elem nincs is a listában, pl. `lst.remove('a')`.

* `index`: visszaadja az elem helyét a listában, hiba, ha az elem nincs is a listában, pl. `lst.index('a')`. 

* `count`: megszámolja hányszor fordul elő egy érték a listában, `lst.count('a')`.



# Egy ***kerülendő*** megoldás szitálásra

In [None]:
%%time

numbers = list(range(1000))
numbers.remove(0)
numbers.remove(1)
i = 0
while i < len(numbers):
    prime = numbers[i]
    i += 1
    multiple = prime * 2
    while multiple <= numbers[-1]:
        if multiple in numbers:
            numbers.remove(multiple)
        multiple += prime


print(numbers[:20])

## Gondok

- A `remove` ,,drága'' művelet. Ha az `i.` elemet töröljük, akkor minden elemet az  `i+1.` kezdve az eggyel korábbi helyre kell másolni. 1000-ből 168 prím. 1000-168 elemet töröltünk másolások számának nagyságrendje 1000*1000
  Ha az első százezer számra alkalmaznánk a szitálást ez már elfogadhatatlan futási időt eredményezne.

- `multiple in numbers` szintén ,,drága'' művelet. A kiszámítás jobb híján úgy történik, hogy végigmegyünk a listán és ha egyik elemmel sem egyezik meg `multiple` értéke akkor `False` az eredmény egyébként `True`.

- Összességében négyzetes a futási idő a kiindulási lista hosszának függvényében.


## Futási idő

In [None]:
def sieve(n):
    numbers = list(range(n))
    numbers.remove(0)
    numbers.remove(1)
    i = 0
    while i < len(numbers):
        prime = numbers[i]
        i += 1
        multiple = prime * 2
        while multiple <= numbers[-1]:
            if multiple in numbers:
                numbers.remove(multiple)
            multiple += prime
    return numbers


In [None]:

def timing(f, n):
    timing = %timeit -n 5 -o -q f(n)
    return timing.average


In [None]:

run_times = [(n, t:=(1000*timing(sieve, n)), (10**6)*t/n**2) for n in [100, 1000, 10000]]
pd.DataFrame(run_times, columns=["n", "run time (ms)", "time/n^2 (ns)"])


## Jobb szitálás

Törlés helyett elegendő megjelölni, mi az ami nem prím.

In [None]:
def sieve_v1(n):
    markers = [True] * n # alapból minden szám lehet prím
    markers[0] = False # 0 nem prím
    markers[1] = False # 1 nem prím
    primes = []
    for num in range(len(markers)):
        if markers[num]:
            primes.append(num)
            multiple = num * 2
            while multiple < len(markers):
                markers[multiple] = False
                multiple += num
    return primes

In [None]:
run_times = [(n, t:=1000*timing(sieve_v1, n), t/n) for n in [100, 1000, 10_000, 100_000]]
pd.DataFrame(run_times, columns=["n", "run time (ms)", "time/n (ms)"])

## Az `append` miért nem ,,drága''?

- Ha egy listához új elemet fűzünk hozzá, akkor elvben mindent másolni kellene, hiszen hova rakjuk az új elemet.

- Valójában a kért hossznál nagyobb területet foglal le egyszerre a Python, ha elfogy a hely, csak akkor kell másolni.


In [None]:
import plotly.express as px
import itertools
import sys

sizes = []
list_base_size = sys.getsizeof(sizes)
print(f"{list_base_size=}")

for i in range(10000):
    num_slots = (sys.getsizeof(sizes)-list_base_size)/8
    sizes.append(num_slots)

avg_moves = []
total_moves = 0
for i, (a, b) in enumerate(itertools.pairwise(sizes), 1):
    total_moves += b if b > a else 0
    avg_moves.append(total_moves/i)


In [None]:

px.scatter(y=sizes).show()


In [None]:

px.scatter(y=avg_moves).show()




## További javítási lehetőségek

- Egy listán nem csak indexeléssel lehet végigmenni, sőt Python-ban ez a ritka eset.

```python
for marker in markers:
    pass
```
sorban végig megy az elemeken.

- Arra is szükségünk van, hogy éppen melyik számnál tartunk. Ezt az `enumerate` függvénnyel lehet elérni.
  ```python
  for index, elem in enumerate(lst):
      pass
  ```
  Ekkor a for ciklus végig megy a lista elemein és mindegyik mellé oda kerül az index is a listában.


## Indexelés helyett, `enumerate`

In [None]:
def sieve_v2(n):
    markers = [True] * n # alapból minden szám lehet prím
    markers[0] = False # 0 nem prím
    markers[1] = False # 1 nem prím
    primes = []
    for num, marker in enumerate(markers):
        if marker:
            primes.append(num)
            multiple = num * 2
            while multiple < len(markers):
                markers[multiple] = False
                multiple += num
    return primes

## `range` ügyesebb használata



A `range` függvény is többet tud, mint amit eddig használtunk belőle.

`range(start, end, step)`

azt a `start`-tal kezdődő sorozatot állítja elő, aminek a lépésköze `step` és **minden eleme kisebb mint `end`**.

A többszörösök sorozata kényelmesebben is megadható:

```python
for multiple in range(2*prime, n, prime):
    markers[multiple] = False
```

Még az is igaz, hogy nem kell `2*prime` indulni. Ha van egy nem prím szám $x$, akkor a legkisebb prím osztója legfeljebb $\sqrt{x}$. Azaz a $\text{prime}^2$-nél kisebb nem prím számokat már a korábban megtalált prímeknél megjelöltük.

## Indexelés $\sqrt{n}$-ig és a `range` ügyesebb használata a belső ciklusban 

In [None]:
import math # egész gyök függvényhez: math.isqrt

def sieve_v3(n):
    markers = [True] * n # alapból minden szám lehet prím
    markers[0] = False # 0 nem prím
    markers[1] = False # 1 nem prím

    for num in range(math.isqrt(n)+1):
        if markers[num]:
            start = num*num
            for multiple in range(start, n, num):
                markers[multiple] = False

    return [num for num, marker in enumerate(markers) if marker]

In [None]:
run_times = [
    (n, f.__name__, t:=1000*timing(f, n), t/n) 
    for n in [100, 1000, 10_000, 100_000] 
    for f in [sieve_v1, sieve_v2, sieve_v3]
]    
df = pd.DataFrame(run_times, columns=["n", "function", "run time (ms)", "time/n (ms)"])

Nem ez a legjobb módja az idő mérésének, és az eredmények megjelenítésének. Később visszatérünk rá!

In [None]:
primes = sieve_v3(1_000_000)
[max(p for p in primes if len(str(p))==i) for i in range(1, 7)]


Listát használtunk a `markers` változóhoz. Valójában a méret rögzített volt és minden érték vagy igaz, vagy hamis, ami 1 biten tárolható.


In [None]:

def sieve_v4(n):
    markers = bytearray(n)
    markers[0] = 1
    markers[1] = 1

    for num in range(math.isqrt(n)+1):
        if not markers[num]:
            start = num*num
            for multiple in range(start, n, num):
                markers[multiple] = 1 

    return [num for num, marker in enumerate(markers) if not marker]


In [None]:
%%time
primes = sieve_v4(10_000_000)


In [None]:
len(primes)

In [None]:
import sys
sys.getsizeof([True]*100_000), sys.getsizeof(bytearray(100_000))

# Összefoglaló az eddigiekről

- Sok minden előre meg van írva, de nem feltétlenül érhető el közvetlenül. Ilyenkor a megfelelő modult importálni kell.
  pl.

  ```python
  import math

  # innentől kezve használhatjuk a math könyvtár függvényeit
  print(math.isqrt(8)) # eredmény 2
  ```

  Ha nem szeretjük a ,,pontos'' jelölést, akkor használhatjuk az alábbi formát is.
  ```python
  from math import isqrt

  isqrt(8) # eredmény: 2
  ```
  

- Láttuk hogyan lehet listát létrehozni, lépésenként bővíteni, indexelni:
  ``` python
  a = [1, 2, 3, 4]
  a[1:5:2] # -> [2, 4]
  a[0] # -> 1
  a[:3] # -> [1, 2, 3]
  ```
- Egy lista elemei megváltoztathatóak, ez a típus `mutable`.


## `tuple` típus



- A listához hasonló a rendezett $n$-es (`tuple`) típus, aminek az elemei nem változtathatóak meg.
  ```python
  a = 1, 2 
  b = (1, 2)
  a == b # igaz mind a két tuple az 1 és 2 értékekből áll.
  a == [1, 2] # hamis más a típus.
  ```
  A `tuple` típus `immutable`. Ennek később lesz jelentősége.
  
- Egy `tuple` típusú változóra csak azok a függvények használhatóak, amik nem változtatják meg:
  ```python
  a = (1, 2, 3)
  len(a), a.count(1), a.index(2), a[1], a[::2]
  ``` 

Mit gondolunk a következőről? Lefut-e hiba nélkül? Ha nem, hol akad el?

In [None]:
a = ([1], "alma", (1, 2))


In [None]:
print(a[0])
print(a[2])

In [None]:
a[0][0] = 2

In [None]:
a[2][0] = 2

- Láttuk, hogy a `for` ciklusban nem csak `range`-en lehet végig iterálni. Valójában bármilyen sorozat állhat a `for` ciklusban.
  ```python
  for num in [1, 2, 3]:
    pass
  for num in (1, 2, 3):
    pass
  ```

- A sorozatot lehet módosítani. pl. `enumerate`-tel. Ez minden elem mellé odarakja az ,,indexét''. Megadható, hogy honnan induljon az indexelés. Alapértelmezésben nullától.
  ```python
  list(enumerate([1, 2, 3], -1)) # -> [(-1, 1), (0, 2), (1, 3)]
  ```

- Bizonyos sorozatok (`range`, `list`, `tuple`) megfordíthatóak a `reversed` függvénnyel:
  ```python
  [num for num in reversed(range(3))] # -> [2, 1, 0]
  ```

- Több sorozatot ,,zip''-pelhetünk, 
  ```python
  list(zip(range(10), reversed(range(3)))) # -> [(0, 2), (1, 1), (2, 0)] 
  ```

# További apróságok ciklusokról

For-ciklus: adott sorozaton megy végig, az iterációk száma általában előre ismert.

**Feladat**: hány darab 9-es számjegy van az 1 és 100 közötti számokban? Általánosabban 1 és $n$ közötti számokban?

$n=100$-ra tudjuk az eredményt: `10 + 10  = 20`

In [None]:
count = 0
# Kezdetben nincs egyetlen szamjegyunk sem
# iteraljunk vegig a szamokon 1 es 100 kozott es szamoljuk meg a 9-eseket
pass

In [None]:
count = 0
for n in range(1, 101):
    pass


print(count)

In [None]:
count = 0
for n in range(1, 101):
    string = str(n)
    for char in string:
        pass


print(count)

In [None]:
count = 0
for n in range(1, 101):
    string = str(n)
    for char in string:
        if char == "9":
            count += 1


print(count)

## Ugyanez függvénnyel

In [None]:
def number_of_nines(max_num):
    count = 0
    for num in range(1, max_num+1):
        string = str(num)
        for char in string:
            if char == "9":
                count += 1
    return count

In [None]:
number_of_nines(265897)

Egysoros változatban:

In [None]:
def number_of_nines(max_num):
    return sum(str(num).count("9") for num in range(1, max_num+1))


number_of_nines(265897)

`sum` és társai később még előjönnek.

## `while`-ciklus

Addig iterálunk, amíg valamilyen feltétel teljesül.


**Feladat**: Keressük azt a legkisebb $n$ természetes számot, hogy az 1 és $n$ közötti számok 10000 darab 9-es számjegyet tartalmaznak.

In [None]:
n = 1
count = 0

while count < 10000:
    pass
    count += 1

print(n)

In [None]:
n = 0
count = 0

while count < 10000:
    n += 1 
    count += str(n).count("9")

print(n)

## `break`, `continue`

Ciklusokból egyes lépéseket át lehet ugorni, vagy akár idő előtt ki lehet lépni belőlük. Mivel ezek a parancsok megszakítják a kód természetes futásának menetét, akkor használjuk őket, ha úgy érezzük, hogy így egyszerűbb a program logikája.

In [None]:
for x in range(10):
    if x % 3 == 0:
        # folytassuk a kovetekezo x-nel
        continue
        
    print(x)

In [None]:
for x in range(10):
    if x == 7:
        # lepjunk ki a ciklus torzsebol
        break
        
    print(x)

# HF: nézzünk utána, mit csinál a for-else konstrukció


In [None]:

limit = 10

for n in range(limit):
    print(n)
    if n > 7:
        break
        
else:
    print("Hello")

In [None]:
# HF: mit csinál az alábbi kód?

limit = 100

for n in range(2, limit+1):
    for k in range(2, n):
        if n % k == 0:
            break
    else:
        print(n)

## Összefoglaló

- Egy ciklust meg lehet szakítani a `break` kifejezés kiértékelésével.
  
  Tipikus használat, ha a megállási feltétel a ciklus törzsében derül ki.
  


In [None]:
def read_int():
    while True:
        answer = input("Adj meg egy egész számot: ")
        if answer.isdigit() or (answer[0] in "+-" and answer[1:].isdigit()):
            break
        print(f"{answer!r} nem tűnik egész számnak!")
    return int(answer)


In [None]:
read_int()

- `continue` tovább lehet lépni. Megoldható `if`-fel is, néha a `continue` olvashatóbb.

# `dict` (szótár) típus

- Egy szótár (`dict`) kulcs, érték párokból áll. Minden kulcs legfeljebb egyszer fordulhat elő. Kulcs alapján lehet értékeket visszakeresni, és megadni. Más programozási nyelvekben `hashmap`-nek is hívják.

  Matematikában azt mondhatnánk, hogy a szótár egy függvény véges értelmezési tartománnyal. 

- Szótár létrehozása pythonban:

In [None]:
# ez a ritka
dict(a=1, b=2)

In [None]:
# kis méretű dictionary gyakran így keletkezik
{"a": 1, "b": 2}

In [None]:
# dict comprehension
{key: value for key, value in zip("abc", range(3))}

## Értékadás, indexelés

- Adott kulcshoz tartozó érték kikeresése
  ```python
  colors = {"red": 1, "blue": 2, "green": 3}
  colors["red"] # -> 1
  ```

- kulcsok:
  ```python
  [key for key colors.keys()] # -> ["red", "blue", "green"]
  ```

- értékek:
  ```python
  [value for value in colors.values()] # -> [1, 2, 3]
  ```

- adott kulcs meglétének ellenőrzése:
  ```
  "red" in colors
  ```


## Mire jó a szótár?

,,Two sum'' a Leetcode oldalról:

> Given an array of integers `nums` and an integer `target`, return indices of the two numbers such that they add up to  `target`.  
>
> You may assume that each input would have exactly one solution, and you may not use the same element twice.
>  
> You can return the answer in any order.


In [None]:
# brute force megoldás

def two_sum(nums, target):
    n = len(nums)
    for i, num1 in enumerate(nums):
        for j in range(i+1, n):
            num2 = nums[j]
            if num1 + num2 == target:
                return i, j

Futási idő arányos `len(nums)` négyzetével.

Ha a lista rövid, ez nem gond. 100 ezres listánál gond lehet.

# Jobb megoldás szótárral

In [None]:

def two_sum_v2(nums, target):
    value2pos = {}
    for pos, value in enumerate(nums):
        other_value = target - value
        if other_value in value2pos:
            return value2pos[other_value], pos
        value2pos[value] = pos 

In [None]:
n = 1000
nums = list(range(n))
target = nums[-1]+nums[-2]
%timeit two_sum(nums, target) 
%timeit two_sum_v2(nums, target)

In [None]:
n = 10000
nums = list(range(n))
target = nums[-1]+nums[-2]
%time two_sum(nums, target) 
%time two_sum_v2(nums, target)

## Mitől gyors a keresés a kulcsok között?

A szótárban van egy keresést gyosító táblázat, ennek mérete általában kettő hatvány. Mondjuk legyen 128.

- A háttérben kulcsokhoz számokat rendelünk, ez a hash értéke az adott kulcsnak. 
- A hash érték maradékát vesszük a gyorsító táblázat méretével, így kapunk egy indexet. 
- A gyorsító tábla adott indexű helye megmondja hol kezdjük el keresni a kulcsot a kulcsok listájában. 
- Ha az adott helyen másik kulcs van, akkor hasonló módon kapunk egy új helyet ahol érdemes megnézni a kulcsot.

A szótár úgy van összerakva, hogy átlagban néhány lépés alatt megtaláljuk a kulcsot és így a hozzátartozó értéket is.

Szótár használatakor **átlagban konstans idő** alatt ki tudjuk olvasni az adott kulcshoz tartozó értéket.

# Szótár műveletek

- Elemek száma `len`, pl. `len({'a': 1})` értéke 1.

In [None]:
d = dict(zip("abcde", range(5)))
print(f"{d=}, {len(d)=}")

- `in` kulcs jelenlétének ellenőrzése.

In [None]:
d = dict(a=1, b=2, c=3)
print(f"{d=}, {('a' in d)=}, {('d' in d)=}")

- `copy`: Másolat (shallow)

In [None]:
a = {'a': {'b': 1}, 'c': 2}
b = a.copy()
print(f"{a=}, {b=}")
print(f"{id(a)=:x}, {id(b)=:x}, {id(a['a'])=:x}, {id(b['a'])=:x}")
b['a']['b'] = 2
b['c'] += 1
print(f"{a=}, {b=}")


- `update`: Egy másik szótárral bővíti a kulcs-érték párokat. 


In [None]:
d = dict(zip("abc", range(3)))
e = dict(zip("cdf", range(3)))
print(f"update előtt {d=}")
d.update(e)
print(f"update után {d=}")


- `pop`: az adott kulcsot törli a szótárból és visszaadja a kulcshoz tartozó értéket.


In [None]:
d = dict(zip("abc", range(3)))
print(f"pop előtt: {d=}")
print(f"{d.pop('b')=}")
print(f"pop után: {d=}")

- `popitem`: egy elemet kiemel,

In [None]:
d = dict(zip("abc", range(3)))
print(f"popitem előtt: {d=}")
print(f"{d.popitem()=}")
print(f"popitem után: {d=}")

- `clear`: Törli a szótár tartalmát.

In [None]:
d = dict(zip("abc", range(3)))
print(f"clear előtt: {d=}")
print(f"{d.clear()=}")
print(f"clear után: {d=}")

- `setdefault`: ha a kulcs nem létezik, akkor létrehozza és beállítja az értéket.

In [None]:
d = dict(zip("abc", range(3)))
print(f"setdefault előtt: {d=}")
d.setdefault('d', []).append(1)
print(f"setdefault után: {d=}")


- szótárból nyert sorozatok, ezek `for` ciklusban használhatóak:
  
  * `key()` kulcsok
  * `values()` értékek
  * `items()` kulcs érték párok

In [None]:
d = dict(zip("abc", range(3)))

In [None]:
for key in d:
    print(key, end=", ")
print()

In [None]:
for key in d.keys():
    print(key, end=", ")
print()

In [None]:
for value in d.values():
    print(value, end=", ")
print()

In [None]:
for key, value in d.items():
    print(f"{key=}, {value=}", end=", ")
print()

# Mi lehet kulcs egy szótárban?

**Bármi, aminek van `hash` értéke**. 

Az `immutable` típusú változóknak `int`, `float`, `bool`, `str`, `tuple` van `hash` értéke. 

Amiket ezek segítségével rakunk össze azoknak is van.   

pl. 
  - `(1,2)`, `(3.14, 'ez a pi értéke')` lehetséges kulcsok.
  - `[1, 2]`, `(1, [])` ezek nem jók kulcsnak.

## Talán meglepő, de függvény is lehet kulcs.

In [None]:
def f():
    pass

d = {f: 1, int: 2, print: 3}
print(f"{d=}")

# Összefoglaló a szótár (`dict`) típusról

- Létrehozás: `{}` üres szótár, `{'a': 1}`, vagy dictonary comprehension

- Használat `for` ciklusban: `for key in d:`, vagy `for value in d.values()`, vagy `for key, value in d.items()`.

- Legfontosabb függvények: `len`, `in`, `get`, `pop`, `update`, `popitem`.

- Az indexlés a kulccsal történik: `d[key]`, vagy `d.get(key, default_value)`

- Átlagban konstans idő alatt tudjunk kiolvasni és beleírni kulcs érték párokat.