# Modulok

Eddig is nagyon sokat használtuk a modulokat, de vajon hogyan tudunk mi magunk létrehozni ilyeneket, illetve miért írjuk néha azt, hogy `import valami` néha meg azt, hogy `from akármi import valami`?

Valójában nagyon egyszerű saját python "modulokat" készíteni. Egyszerűen csak elmented a python kódodat egy új fájlba valamilyen néven és kész, van egy ilyen nevű modulod. Nem viccelek, tényleg ilyen egyszerű.

Emiatt viszont erősen javaslom, hogy a gyakran használt, ismerős csomagok nevét ne használd fájlnévként, mert aztán csúnya meglepetések érnek. Például ne adj olyan nevet a fájlodnak, hogy `numpy.py`!

Viszont mivel itt a colaban főleg kódblokkokkal dolgoztunk eddig, nem olyan triviális új fájlokat létrehozni, mivel a környezetet mindig letörli. Ezért most fel fogunk ide tölteni néhány fájlt, amihez nem árt egy rövid kitérőt tenni, hogyan is működik ez a Jupyter notebook.




## Jupyter/Colab kitérő

A Jupyter (így a Colab) is képes lokális parancsokat végrehajtani python kód helyett, ha egy felkiáltójelet írunk a szöveg elé. Mivel a Colab Linux containereket indít nekünk, itt linux parancsokat tudunk használni.

Ez itt alább tehát nem python, hanem egy unix parancs (fájl listázás):

In [None]:
!ls

In [None]:
!ls sample_data

Láthatod, hogy a Colab container minta adatokkal érkezik.
De éppen akár azt is megnézhetnénk, hogy a linux containerben milyen felhasználók vannak:

In [None]:
!cat /etc/passwd

Mivel ez most nem egy linux útmutató, minket leginkább az érdekel, hogy ha feltöltünk valamit (vagy éppen innen letöltünk valamit) akkor azt a helyi parancsokkal is tudjuk kezelni. Például kitömöríthetjük vagy letölthetjük.

Töltsünk le például az internetről:

In [None]:
!curl https://httpbin.org/json

Vagy egyből tegyük bele egy fájlba:

In [None]:
!curl https://httpbin.org/json > mintaadat.json

In [None]:
!ls # és máris itt van az is

Ha balra a menüben rákattintasz a mappa ikonra, akkor láthatod a fent lévő fájlokat (a frissen letöltöttet is), le és fel tudsz tölteni bármit. Ha pedig rákattintasz a `mintaadat.json`-re (amit most hoztunk létre) a colab meg is jeleníti neked a tartalmát.

**Töldsd fel ide a modules zipet!**

Ha sikerült, tömörítsük ki (linux paranccsal):

In [None]:
!unzip -o modules.zip

Most az oldalsó menüben látnod kéne a kibontott fájlokat (és a modules.zip-et is persze). Tehát valami ilyesmit kéne látnod:

In [None]:
!ls  # ezt kéne látnod ha futtatod:
# flowers.py  mintaadat.json  modules.zip  sample_data  test

## Saját modul használata

Ha belenézel a flowers.py nevű állományba (bal oldali menüben rá kell kattintani) láthatod, hogy három dolog van benne: egy adat (prices) egy függvény (bouquet) és egy utasítás (print).

Amikor a modulodat importálod, a benne lévő kód lefut és definiálja az adatot, a függvényt és persze végrehajtja a kódot is. Normál esetben tehát ilyet (print) ne csinálj, mert minden modul importnál ki fog írni valamit amit valószínűleg nem szeretnél. Ezt inkább arra használják, hogy alaphelyzetbe állítsanak pár dolgot ami a modulodhoz szükséges.

Tulajdonképpen olyan mintha idemásoltad volna a kódodat, egy fontos különbséggel: A fájlodban definiált adatok és függvények külön névteret (namespace) kapnak, tehát a modul nevén keresztül lehet őket elérni. Ez azért lesz nekünk jó, mert nem keveredik a modulban lévő adat a "fő" programban lévő adattal.

In [None]:
import flowers # beimportáljuk a modulunkat
# mivel van benne egy print ki is ír valamit.

In [None]:
# de ha mégegyszer beimportáljuk...
import flowers
# már nem ír ki semmit. A python tudja,
# hogy ezt már importálta, így még egyszer
# már nem teszi!

In [None]:
# máris elérjük a benne lévő adatokat
# és mivel külön névtere van ...
prices = [3,4,5] # ezzel nem fog összekevereni.

flowers.prices

Futtassuk akkor a flower modulunkból egy függvényt:

In [None]:
csokor = {
    'Lily': 22,
    'Rose': 100,
    'Iris': 31,
}

ár = flowers.bouquet(csokor)
print(ár)

Ha biztos vagy benne, hogy az importált függvény (vagy adat, vagy osztály) nem fog keveredni a programodban lévővel akkor beimportálhatod explicit módon és akkor nem fog kelleni a modul neve a függvény elé.

In [None]:
from flowers import bouquet
bouquet(csokor)

Kérdés: Mit csinál a bouquet függvény?

## Több fájlból álló "modulok" (package) használata

Bár kis programokhoz ritkán kell, de ha netán mégis egy nagyobb, újrahasznosítható csomag létrehozására adnánk a fejünket, amit már nem szívesen zsúfolnánk egyetlen fájlba, akkor készíthetünk "nagy" modult, azaz `package`-et. Ez tulajdonképpen egy könyvtár, amibe több python fájl található. Az korábban használt hasznos eszközök mind ilyen csomagok.

Azért, hogy a python meg tudja különböztetni a teljesen hagyományos könyvtárat és a "modul" könyvtárat, a modul könyvtárba mindig kell legyen egy `__init__.py` állomány. Ha van benne, akkor modul, ha nincs akkor nem modul.

A zip-ben volt egy test nevű könyvtár, abben pedig egy `__init__.py` fájl, tehát a test egy modul. A benne lévő fájlok szub-modulok, beimportálhatjuk az egészet, vagy csak egy szub modulját, vagy abból valamit, tetszés szerint.

In [None]:
from test import alpha
alpha.data

In [None]:
from test.beta import betafunction
betafunction()

In [None]:
from test import TestError
try:
  raise TestError
except TestError:
  print("Speciális Test hiba történt!")

Igazság szerinte a modern python verziókban ennél bonyolultabb un. `namespace` package rendszer is létezik, ami némiképp összetettebb, cserébe több csomag verziót is kezelni tud, de nekünk elegendő lesz ez az egyszerű variáns.


## Modulok elérése

Hol keresi a python a modulokat/csomagokat? Azt láthattuk, hogy ha az aktuális könyvtárba tesszük, akkor megtalálja és tudja modulként használni, de csak nem nézi végig mindig az egész fájlrendszert, igaz? Abszolút igaz: csak azokat a könyvtárakat nézi, amelyek fel vannak sorolva a sys.path listában:

In [None]:
import sys
sys.path
# hát itt keresi, ami olyan helyen van, ami itt nem szerepel, azt nem találja meg.