<a href="https://colab.research.google.com/github/OSGeoLabBp/tutorials/blob/master/hungarian/python/loops.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Python ciklus szerkezetek és a hatékonyság

Ebben a kis anyagban arra mutatunk példákat, hogy milyen ciklus szerkezetek hatékonyabbak a Pythonban.

In [1]:
# néhány szükséges modul a futási idő mérésére és a mátrixok kezelésére
import time
import numpy as np

## Természetes számok összege

Az első példában az egész számok összegét fogjuk képezni nullától n-1-ig. Első lépésben egy while típusú ciklus készítünk erre. A későbbi futási idő mérése érdekében függvényt készítünk az összegképzésére.

In [2]:
n = 50_000_000      # eddig összegzünk

In [25]:
def while_loop(n: int) -> int:
    """ while ciklus """
    i = 0
    s = 0
    while i < n:
        s += i
        i += 1
    return s

A fenti megoldásban mindent a kezünkben tartunk a ciklus változó (i) növelését és az összeg képzését (s). A Pythonban írt kód sokkal lasabb mint a C/C++ nyelven írt kód. A Python beépített függvényeit C nyelven írják, ezért célszerűbb beépített függvény (range) és for ciklus segítségével megoldani a ciklusváltozó léptetését.

In [26]:
def for_loop(n: int) -> int:
    """ for és range  használatával"""
    s = 0
    for i in range(n):
        s += i
    return s

A *for* ciklus és a *range* függvény használatával várhatóan gyorsabb lesz a kódunk, de igazán a Pythonban írt ciklusok kihagyásával gyorsíthatjuk a kódunkat.

In [27]:
def sum_func(n: int) -> int:
    """ beépített függvényekkel """
    return sum(range(n))

A fentinél gyorsabb megoldást kaphatunk a numpy modul használatával.

In [28]:
def numpy_sum(n: int) -> int:
    """ numpy függvények használatával """
    return np.sum(np.arange(n))

Nézzük meg mennyi az egyes megoldásainknak a futási ideje!

In [29]:
import time

st = time.process_time()
s = while_loop(n)
et = time.process_time()
print(f"while:  {et - st:8.3f} másodperc")
st = time.process_time()
s = for_loop(n)
et = time.process_time()
print(f"for:    {et - st:8.3f} másodperc")
st = time.process_time()
s = sum_func(n)
et = time.process_time()
print(f"sum:    {et - st:8.3f} másodperc")
st = time.process_time()
s = numpy_sum(n)
et = time.process_time()
print(f"numpy:  {et - st:8.3f} másodperc")


while:     1.093 másodperc
for:       0.685 másodperc
sum:       0.224 másodperc
numpy:     0.059 másodperc


A fentiekből láthatjuk, hogy nagy futási idő különbség van a különböző megoldások között, ha csak a processzor végrehajtási idejét vesszük figyelembe. Változtassa meg az *n* értékét és nézze meg hogyan változnak a futási idők.

A fenti problémára létezik még gyorsabb megoldás, melyet Gauss kisiskolás korában ismert fel. Az iskolában a tanár, hogy egy kis nyugalma legyen, feladata a nebulóknak számolják ki egytől százig az egész számok összegét. A kis Gauss egy perc múlva jelentkezett az eredménnyel. Észrevette, hogy 1 + 100 = 101, 2 + 99 = 101, és így tovább. Ezek alapján zárt képletet is felírhatunk a megoldásra n * (n + 1) / 2.

Az egyszerű, zárt képletnél nincs gyorsabb.

In [8]:
st = time.process_time()
s = n * (n + 1) / 2
et = time.process_time()
print(f"képlet: {et - st:8.3f} másodperc")


képlet:    0.000 másodperc


### Tanulságok

*   Ne használjunk *while* ciklus, ha számlálással vezérelt ciklusról van szó
*   Mindig részesítsük előnybe a beépített függvények használatát



## Lista/szótár/halmaz feldolgozás

### Lista feldolgozás

A Python lista feldolgozással a szokásos *while*, *for* ciklusoknál gyorsabb megoldást kaphatunk.

Keressük ki egy egész számokat tartalmazó lista elemei közül a páros számokat. A listát véletlenszámokból állítjuk össze. A *random.choices* függvény a listából véletlenszerűen választ ki megadott számú elemet.

In [9]:
import random
random.seed()
min_val = 0
max_val = 10_000
n = 10_000_000
l1 = random.choices(list(range(min_val, max_val)), k=n)

A naiv megoldásban for ciklussal megyünk végig a listán és a páros elemeket egy új listához adjuk .

In [10]:
st = time.process_time()
l2 = []             # üres lista az eredményekhez
for l in l1:
    if l % 2 == 0:
        l2.append(l)
et = time.process_time()
print(f"naiv:   {et - st:8.3f} másodperc")


naiv:      1.376 másodperc


Pytonic megoldás lista feldolgozással.

In [11]:
st = time.process_time()
l2 = [l for l in l1 if l % 2 == 0]
et = time.process_time()
print(f"Pythonic:  {et - st:8.3f} másodperc")

Pythonic:     0.809 másodperc


A Pythonic megoldás nem csak rövidebb, hanem hatékonyabb is.

### Szótár feldolgozás

A szótár feldolgozással a lista feldolgozáshoz hasonlóan egy új szótárt állíthatunk elő. A következő példában két listából egy szótárat állítunk elő, ahol az első lista a szótár kulcsait, a második lista a kulcsokhoz tartozó értékeket tartalmazza.

In [12]:
keys = ['Peti', 'Julcsi', 'Timi', 'Bendi', 'Hédi']
values = [8, 5, 3, 3, 1]

A naiv megoldás:

In [16]:
d1 = {}
for i in range(len(keys)):
    d1[keys[i]] = values[i]
print(d1)

{'Peti': 8, 'Julcsi': 5, 'Timi': 3, 'Bendi': 3, 'Hédi': 1}


és a szótár feldolgozás:

In [17]:
d = { key: value for (key, value) in zip(keys, values)}
print(d)

{'Peti': 8, 'Julcsi': 5, 'Timi': 3, 'Bendi': 3, 'Hédi': 1}


A *zip* függvény két listából úgy készít egy újabb listát, hogy az azonos indexen lévő elemekből egy egyszerű listát hoz létre és azt teszi az eredménybe:

In [18]:
print(list(zip(keys, values)))

[('Peti', 8), ('Julcsi', 5), ('Timi', 3), ('Bendi', 3), ('Hédi', 1)]


## Halmaz feldolgozás

A lista feldolgozás példánkat módosítsuk, hogy duplikált elemeket ne engedjünk meg az eredményben.

In [23]:
s = {l for l in l1 if l % 2 == 0}
print(f"{type(s)} {len(s)} különböző elem a(z) {len(l1)} elemből.")

<class 'set'> 5000 különböző elem a(z) 10000000 elemből.
