# Automatiz√°l√°s √©s processzek

Ha automatiz√°lni szeretn√©nk folyamatokat (p√©ld√°ul elind√≠tani, le√°ll√≠tani valamilyen szoftvert a g√©pen) elker√ºlhetetlen, hogy a python keretein is t√∫ll√©pj√ºnk, s≈ët n√©ha p√°rhuzamosan kell dolgoznunk.

N√©zz√ºk meg hogyan tudn√°nk pythonb√≥l m√°s programokat elind√≠tani vagy (ak√°r python) programokat egyszerre futtatni.

## K√ºls≈ë programok

Kor√°bban m√°r eml√≠tettem, hogy a colab egy linux containert futtat, itt teh√°t linux parancsokat tudunk elind√≠tani, de az al√°bbiak minden oper√°ci√≥s rendszeren m≈±k√∂dnek, csak a programok nev√©t, esetleg el√©r√©si √∫tj√°t kell √©rtelemszer≈±en m√≥dos√≠tani.

Ha ilyesmivel szeretn√©nk foglalkozni, a legjobb bar√°tunk a `subprocess` csomag!

In [None]:
import subprocess

eredmeny = subprocess.run(
    ["ls", "-l"],       # vagy Windows-on: ["cmd", "/c", "dir"]
    capture_output=True, # a kimenetet is ≈ërizd meg
    text=True,
    check=False
)

print("Return code:", eredmeny.returncode)
print("STDOUT:")
print(eredmeny.stdout) # szabv√°nyos kimenet
print("STDERR:")
print(eredmeny.stderr) # szabv√°nyos hiba kimenet


Return code: 0
STDOUT:
total 4
drwxr-xr-x 1 root root 4096 Nov 20 14:30 sample_data

STDERR:



L√°that√≥, hogy nem t√∫l neh√©z programokat futtatni (az els≈ë param√©ter ut√°n minden m√°s opcion√°lis volt), egyszer≈±en csak egy list√°ban √°t kell adnunk a futtatand√≥ parancs r√©szeit. Ha nem akarunk neki param√©tereket √°tadni, akkor csak a nev√©t.

A visszat√©r√©si √©rt√©ke viszont tal√°n n√©mi magyar√°zatot ig√©nyel:


**Return code (visszat√©r√©si k√≥d)**: Minden program a fut√°sa v√©g√©n ad egy eg√©sz sz√°mot, ami jelzi, hogy sikeresen lefutott-e.  
  * 0 ‚Üí siker
  * nem 0 ‚Üí valamilyen hiba vagy rendelleness√©g t√∂rt√©nt

**Szabv√°nyos kimenet (STDOUT)**: Ezek a fut√≥ program norm√°l √ºzenetei, pl. amit "ki√≠r a k√©perny≈ëre". Ez az, amit a print() is haszn√°l Pythonban.

**Szabv√°nyos hiba (STDERR)**: A program hibajelz√©sei, figyelmeztet√©sei k√ºl√∂n csatorn√°n √©rkeznek. Ez akkor is k√ºl√∂n van, ha a program egy√©bk√©nt j√≥l fut.


## T√∂bb program futtat√°sa egym√°s ut√°n



In [None]:
import subprocess

parancsok = [
    ["python", "--version"],
    ["echo", "Hello"],
]

for cmd in parancsok:
    eredmeny = subprocess.run(cmd, capture_output=True, text=True)
    print(f"Parancs: {cmd}", end=' ')
    print("RC:", eredmeny.returncode, end=' ')
    print("OUT:", eredmeny.stdout.strip())

Parancs: ['python', '--version'] RC: 0 OUT: Python 3.12.12
Parancs: ['echo', 'Hello'] RC: 0 OUT: Hello


## T√∂bb program, de p√°rhuzamosan
Ha nem szeretn√©d megv√°rni a programok fut√°s√°t (p√©ld√°ul mert sok√°ig tart), elind√≠thatod ≈ëket "egyszerre" is.  (Figyelj, ez a k√≥dblokk "sok√°ig" fut)


In [None]:
import subprocess

parancsok = [
    ["sleep", "5"], # ez a parancs nem csin√°l semmit 5 m√°sodpercig
    ["sleep", "7"],
    ["sleep", "3"],
]

folyamatok = []

# elind√≠tjuk ≈ëket
for cmd in parancsok:
    p = subprocess.Popen(cmd)
    folyamatok.append(p)

# itt csin√°lhatunk valami m√°st...
# ...
# ...

# megv√°rjuk az √∂sszeset
for p in folyamatok:
    p.communicate()  # blokkol, am√≠g az adott folyamat be nem fejez≈ëdik



In [None]:
!ps xa | grep 'python|sleep|grep'

## T√∂bb Python processz p√°rhuzamos sz√°m√≠t√°shoz

M√°r eml√≠tett√ºk, hogy a python egy processzormagon fut. A modern 8, 16 vagy m√©g t√∂bb magos processzorok vil√°g√°ban ez n√©mik√©pp pazarl√°snak t≈±nhet, f≈ëleg, ha egy am√∫gy j√≥l p√°rhuzamos√≠that√≥ feladaton dolgozunk. (Mondjuk k√ºl√∂n√°ll√≥, egym√°st√≥l f√ºggetlen f√°jlokat kell feldolgoznunk).

A multiprocessing csomag ebben seg√≠t minket. Itt elind√≠thatunk egy nagy adag sz√°m√≠t√°st √©s megv√°rhatjuk m√≠g mindegyik v√©gez!

Minden sz√°m√≠t√°s m√°s param√©teren dolgozik (p√°rhuzamosan)! Az al√°bbi k√≥dban ezek a bemenetek egyszer≈± sz√°mok, de lehetne b√°rmi m√°s is.

In [None]:
from multiprocessing import Pool
import math

def nehez_szamitas(x: int) -> float:
    # valami CPU-ig√©nyesebb dolog
    s = 0.0
    for i in range(100_000):
        s += math.sqrt(x * i + 1)
    return s

if __name__ == "__main__":  # Windows-on ezt K√ñTELEZ≈ê haszn√°lni
    bemenetek = [1, 2, 3, 4, 5, 6, 7, 8]

    with Pool(processes=4) as pool:  # 4 p√°rhuzamos processz
        eredmenyek = pool.map(nehez_szamitas, bemenetek)

    print(eredmenyek)


J√≥, h√°t sok√°ig az√©rt gondolom nem kellett v√°rnod üòÄ Ezek a mai g√©pek pillanatok alatt v√©geznek el p√°r sz√°zezer gy√∂kvon√°st. Na de az√©rt vannak feladatok, amelyek m√°r rajtuk is kifognak. Most m√°r el tudod ind√≠tani a sz√°m√≠t√°saidat p√°rhuzamosan, egyszerre t√∂bb magon!




## T√∂bb processz k√©zzel

Az el≈ëz≈ë p√©ld√°ban a with context manager szuper m√≥don leegyszer≈±s√≠tette a dolgunkat. N√©ha el≈ëfordulhat, hogy k√©zzel szeretn√©d elind√≠tgatni √©s le√°ll√≠tani a folyamatokat. Ez sem k√ºl√∂n√∂sebben neh√©z, de az√©rt kicsit t√∂bbet kell g√©pelni:


In [None]:
from multiprocessing import Process
import time # ez nem kell csak az alv√°shoz

def worker(nev: str, n: int) -> None:
  # itt mindenf√©le bonyolult dolgot csin√°lhatn√°nk....
  print(f"{nev} indul")
  time.sleep(n) # de most csak alszunk picit.
  print(f"{nev} k√©sz")

if __name__ == "__main__":
  # l√©trehozunk k√©t folyamatot
  p1 = Process(target=worker, args=("A folyamat", 2))
  p2 = Process(target=worker, args=("B folyamat", 3))

  # elind√≠tjuk ≈ëket...
  p1.start()
  p2.start()

  # megv√°rjuk mindkett≈ët
  p1.join()
  p2.join()

print("Minden folyamat befejez≈ëd√∂tt.")


## Mikor melyiket haszn√°ld:

**subprocess** akkor hasznos, ha:
- nem Python-programot akarsz futtatni (pl. ffmpeg vid√≥k√≥dol√≥, git, statikai sz√°m√≠t√°s, stb.),
- k√ºl√∂n python script.py-ket akarsz ind√≠tani √©s azok kimenet√©t feldolgozni.

**multiprocessing** viszont sokkal k√©nyelmesebb, amikor:
- ugyanazt a Python-k√≥dot akarod p√°rhuzamos√≠tani,
- f√ºggv√©nyeket akarsz sok bemeneten futtatni,
- nem akarsz k√©zzel folyamatkezel√©ssel/kimenet-olvas√°ssal foglalkozni.

## P√°rhuzamos feldolgoz√°s egy√©b lehet≈ës√©gei

Itt most csak a legegyszer≈±bb lehet≈ës√©get eml√≠tett√ºk, ami azokhoz a probl√©m√°khoz amikkel a leggyakrabban tal√°lkozunk elegend≈ë. P√°rhuzamos feladatmegold√°sra (c√©lt√≥l f√ºgg≈ëen) m√°s lehet≈ës√©gek is vannak.
A felhasz√°l√≥i fel√ºletek programoz√°s√°n√°l gyakran alkalmazz√°k az Async megold√°sokat (amely egyetlen processzormagon / sz√°lon) is p√°rhuzamos "hat√°st kelt" √©s interakt√≠vabb felhaszn√°l√≥i √©lm√©nyt ny√∫jt, a hat√©konyabb p√°rhuzamos feldolgoz√°sn√°l pedig sz√°lakat (threads), amely kev√©sb√© pazarl√≥ √©s k√∂z√∂s mem√≥riahaszn√°latot tesz lehet≈ëv√©.

Term√©szetesen a pythonban ezekhez is van (t√∂bb) csomag (is), annak ellen√©re, hogy nem foglalkoztunk r√©szletesen vel√ºk. A python saj√°t bels≈ë ilyen csomagjai:

* Asyncio: https://docs.python.org/3/library/asyncio.html
* Threading: https://docs.python.org/3/library/threading.html