# Python struktúragenerátorok (comprehension)

pythonban sok összetett szerkezetet (pl. listákat, halmazokat) nem csak statikus módon lehet deklarálni, hanem algoritmikusan is. Ilyenkor nem csak egyszerűen leírjuk, hogy az összetett adatstruktúrának milyen elemei legyenek,  hanem azt deklaráljuk, hogyan kell őket létrehozni.

Amikor listákat generálunk így, azt sok nyelvben általában list comprehension-nek nevezik. A python más struktúrákat is tud így generálni, tehát lehet set-comprehension is.

A lista elemeinek generálásához a for, in és if kulcsszavakat használhatjuk. A `kifejezés for valami in tároló` utasítást úgy értelmezzük, hogy a kifejezést a tároló minden egyes elemére kiszámoljuk és a kifejezésben az éppen aktuális elemet valaminek fogjuk hívni.

tehát:




In [None]:
primek = [2, 3, 5, 7, 11, 13, 17, 19]

primnégyzetek = [x*x for x in primek]

print(primnégyzetek)

[4, 9, 25, 49, 121, 169, 289, 361]


Az in kulcsszó után bármi állhat amiből elemeket lehet kivenni. Az ilyen objektumot 'iterable'-nek nevezik. (Azért hívják így mert végig lehet rajta 'iterálni' azaz lépkedni). Iterable például a list, a set, a dict vagy a generátorok.

Nézzük generátorral:

In [None]:
számok = range(10)

# pythonban a hatványozás jele **
köbök = [szám ** 3 for szám in számok]
print(köbök)

[0, 1, 8, 27, 64, 125, 216, 343, 512, 729]


A generálás során megadhatunk feltételt is, azaz mikor akarjuk beletenni a listába az elemet és mikor nem:

In [None]:
adatok = [-1, 8, 6, 12, -99, 103]

pozitív_adatok = [x for x in adatok if x > 0]

print(pozitív_adatok)

[8, 6, 12, 103]


Arra is van lehetőség, hogy ne csak egy iterátorból vegyünk elemeket, hanem egyszerre többől és az összes kombinációt kiszámítsuk:

In [None]:
jelzők = ['kicsi', 'nagy', 'szép']
állatok = ['kutya', 'cica']

[jelző + " " + állat for jelző in jelzők for állat in állatok]

['kicsi kutya',
 'kicsi cica',
 'nagy kutya',
 'nagy cica',
 'szép kutya',
 'szép cica']

A fentit valahogy úgy kéne olvasni, hogy a lista elemeit úgy állítjuk elő, hogy összefűzzük a jelzőt, egy szóközt és egy állatot úgy, hogy a jelző sorra felveszi a jelzők elemeit, az állat pedig az állatok elemeit.

In [None]:
[jelző + " " + állat
    for jelző in jelzők
    for állat in állatok
]

In [None]:

# van-e olyan szám, aminek az első és utolsó számjegye azonos
# és egy 100-nál kisebb természetes szám köbének és négyzetének összege?

számok = [x**3 + x**2 for x in range(100)]
keresett = [x for x in számok if str(x)[0] == str(x)[-1]]

print(keresett)

[0, 2, 252, 6156, 20412, 230702, 242172, 291852, 689216]


In [None]:

# van-e olyan száznál kisebb prim és száznál kisebb négyzetszám pár,
# amit ha összeadok az eredmény osztható 1234-el?

prímek = [2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97]
négyzetek = [x*x for x in range(100)]
keresett = [(n, p) for n in négyzetek for p in prímek if (n+p) % 1234 == 0]
print(keresett)




[(2401, 67), (9801, 71)]


In [None]:
# milyen számok képezhetők az a és b halmazból úgy, hogy
# egy pontosan egy elemet választunk mindkettőből és összeszorozzuk?

a = {8, 12, 9, 31, 14}
b = {2, 4, 11, 7, 6, 3}

képezhető = { x*y for x in a for y in b}

print(képezhető)

{132, 16, 18, 24, 154, 27, 28, 32, 36, 42, 48, 54, 56, 186, 62, 63, 72, 84, 341, 88, 217, 93, 98, 99, 124}


Miért használtunk itt set-et és nem list-et?

## Generátor

A for-in szerkezetet egyszerű sima zárójelben (akár függvény paramétereként) is használhatjuk. Tehát írhatunk valami ilyesmit:
```python
g = (x*x for x in elemlista)
```
A g itt nem tuple lesz (hiszen mint tudjuk a tuple lényege a vessző, nem a zárójel) hanem valami más: egy generátor. A generátor nem igazán tároló "struktúra" de valami hasonló koncepció. Elemeket tud visszaadni, de anélkül, hogy ténylegesen a memóriában valamilyen struktúra lenne mögötte.  A generátort is használhatod más struktúragenerátorokban vagy for ciklusban. Arra érdemes odafigyelni, hogy kiírni (pl print) nem nagyon érdemes, mert csak azt fogja megjeleníteni, hogy ez egy generátor a "tartalmát" nem.

A generátor nagyon ravasz egy valami, ugyanis ki tudnak fogyni belőle az elemek!
Ha például úgy hoztad létre, hogy egy véges lista elemeit "generálja" akkor sorra visszaadja a lista elemeit, aztán amikor azok elfogytak, már nem ad vissza semmit sem.

Valami hasonlót láttunk már, ilyen volt a range() függvény. Ha azt írtuk range(10000) nem volt mögötte 10000 tényleges egész szám a memóriában, csak sorra létrehozta őket és visszaadta.

In [None]:
elemek = [1, 9, 3, 2, 5]
g = (x*x for x in elemek) # nem tuple, hanem generátor
type(g)

generator

In [None]:
print(g) # ennek nem sok haszna van....

In [None]:
# de persze átalakíthatod bármivé:
list(g) # vagy set(g) vagy tuple(g) ....

[]

In [None]:
# viszont most kifogyot a generátorod és
# ha mégegyszer megpróbálod már nincs benne semmi...
list(g)

[]

Mivel ez "kifogyás" roppant zavaró, ezt a generátor szerkezetet inkább csak akkor használjuk, ha tuti, hogy csak egyszer kell. Például olyan függvény paramétereként ami iterable paramétert vár. Itt viszont nagyon hasznos (és a zárójelet sem kell még egyszer kitennünk):

In [None]:
# négyzetösszeg:
sum(x*x for x in elemek)

In [None]:
# összes betűkombináció két halmazból:
",".join(p+q for p in "abc" for q in "xyz")

In [None]:
tartomány = range(10)
list(tartomány) # átalakítjuk listává
list(tartomány) # és mégegyszer megpróbáljuk

Feladat:

A következő fokszámú fogaskerekeink vannak:
8,11,13,17,18,24,36,68,72

Pontosan két fogaskereket akarunk egymás után rakni. El tudjuk-e érni az négyszeres (4:1) áttételt? Ha igen, hogyan?

Készítsünk egy listagenerátort ami a megfelelő fogaskerékpárokat generálja le.

hint: ha két 8 fogú kerék van egymás után az 1:1-es áttétel. Ha egy 16-fogú hajtó kerék után egy 8 fogú hajtott kerék áll akkor az 8:16 azaz 1:2 áttétel, mivel amíg a 16 fogú egyszer körbefordul, a 8 fogút kétszer körbeforgatja. (kétszer olyan gyors és fele olyan erős lesz).

