# Beveztés a Python értelmezőbe, a nyelv szintaxisába és a notebook formátumba

## A Python értelmező (Python shell) és maga a nyelv

Az elméleti háttér után térjünk át a gyakorlatra. Geofizikusként valószínűleg nagyrészt Matlab-bal van tapasztalatotok. Jó hír, hogy a Python is hasonlóan működik, mint a Matlab, azaz elindítva egy értelmezőt, azonnal elkezdhetünk kódolni.

## A Notebook formátum

A **Jupyter Notebook** egy olyan alkalmazás, mely interktív kódolást tesz lehetővé. A program a háttrében futtat egy Python értelmezőt (pontosabban egy IPython értelmezőt, az IPython értelmező tulajdonképpen egy Python értelmező, mely jónéhány további, script írást megkönnyítő, funkcióval rendelkezik).

Egy notebook cellákra van felosztva. Kétfajta cella létezik:
- az egyik an ún. *markdown* cella; ebben a cellában *markdown* szöveget, *markdown* és LaTeX kódot írhatunk, melyet a **Jupyter Notebook** értelmez, *html* kódot generál belőle és a "lefordított" html kódot megjeleníti a böngésző ablakban,
- a másik cellatípus a kódcella; ebben a cellában írhatunk és szerkeszthetünk Python kódot, amit a futtatási parancs kiadása után a **Jupyter Notebook** elküld a háttérben futó Python értelmezőnek, az lefuttatja a kódot és kinyomtatja cella alá, a kód által a terminálra nyomtatott szöveget.

A *markdown* nyelv szintaxisáról [itt](https://github.com/adam-p/markdown-here/wiki/Markdown-Cheatsheet) található egy rövid leírás.

A cellát kiválasztva az `Enter` leütésével beléphetünk a cellába, annak tartalmát szerkeszthetjük. A cellát a `Control+Enter` billentyűkombináció leütésével futtathatjuk. A cellá szerkesztését az `Escape` billentyű leütésével fejezhetjük be, ezután a felele és lefele nyilakkal tudunk navigálni a cellák között.

Ha nem szerkesztünk egy cellát a következő parancsok állnak rendelkezésünkre:
- **új cella létrehozása:** egy adott cella fölé az `a`, alá a `b` billentyű lenyomásával hozhatunk létre egy új üres cellát,
- **cella másolása:** `c` billentyű,
- **cella kivágása:** `x` billentyű,
- **cella beillesztése:** `v` billentyű - a kijelült cella alá kerül beszúrásra.
- **markdown cellává konvertálás**: `m` billentyű; az újonnan készített cellák, kódcellaként kezdik az életüket, nekünk kell őket *markdown* cellává konvertálni. 

További funkciók is rendelkezésünkre állnak, csak a legfontosabbakat emeltem ki.

Abban az esetben, ha ezt a dokumentumot a jegyzet egyik fejezeteként olvasod, amit magad előtt látsz, az nem egy interaktív *notebook*, hanem a *notebook* fájl alapjánt generált *html* dokumentum. Ha magad is futtatni vagy szerkeszteni szeretnéd a *notebook* tartalmát, kérlek töltsd le a *notebook-okat* a kurzus [github](https://github.com/bozso/python_course) oldaláról és nyisd meg őket a **Jupyter Notebook** alkalmazásban.

A következőkben tehát megismerkedünk a Python nyelv szintaxisával, néhány beépített Python tárolóval és az *IPython* értelmezővel. 

## A Python mint egyszerű számológép

Matlabhoz hasonlóan, a Python is képes egyszerű számológépként funkcionálni.

In [2]:
5 + 5

10

Változóknak így adhatunk értéket:

In [3]:
a = 5

A változó értékének kiírása:

In [9]:
print(a)

5


In [10]:
a

5

Művelet elvégzése változóval:

In [11]:
a + 5

10

Az eredmény kiírásának mellőzése:

In [12]:
a + 5;

**Figyelem!** A pontos vesszőt csak az utolsó sor esetén érdemes használni, amikor nem akarjuk kiíratni a végeredményt, tehát nem úgy működik mint a Matlab. Az értelmező csak az utolsó sor eredényét írja ki.

In [16]:
a + 3
a + 2
a + 1

6

A már felhasznált változóknak bármikor más értéket adhatunk, ekkor a korábbi értéküket elvesztik az újradefiniált változók.

In [17]:
a = "aaa"
a = 'aaa'
a

'aaa'

In [18]:
multi_line = \
"""
a
b
c
"""

In [21]:
multi_line

'\na\nb\nc\n'

In [20]:
print(multi_line)


a
b
c



## Függvények definiálása, kód blokk

A programozás egyik alap építőeleme a függvény. Függvények segítségével lehetővé tesszük a függvényen belül implementált algoritmus újrafelhasználhatóságát.

Függvények definiálás:
- a függvénytartományt nem kapcsos zárójelek között kód (`{` és `}`; pl. C) és nem a `function` és `end` kulcsszavak között kód (pl. Matlab) jelzi
- a függvénytartomány kezdetét és végét a "behúzás" (indentation) karakterek jelzik
- komment karakter `#` (Matlab `%`-el ekvivalens)

Szemléltető példa:
- függvény definiálás kulcsszava `def`
- `add` a függvény neve
- `a` és `b` a függvény argumentumai
- `:` jelzi a függvény kezdetét
- `return` visszatérés a függvényből egy adott értékkel

In [22]:
def add(a, b):
    print("a")
    return a + b

add(3, 4)

a


7

In [23]:
def add(a, b):
    """
    Első sor.
    
    Második sor.
    """
    print("In function add.")
    # komment a függvényen belül
    
    return a + b
# függvény definíció véget ért

# ez a rész már nem része a függvénynek
print("Hello!")

Hello!


In [24]:
help(add)

Help on function add in module __main__:

add(a, b)
    Első sor.
    
    Második sor.



A függvénytartományt jelen esetben 4 darab space karakterrel definiáljuk. A 4 space helyett használhattunk volna 1 db tabulátor karaktert is. A fontos az, hogy a behúzás karaktereket konzisztensen használjuk, tehát ne keverjünk tabulátor karaktert space karakterrel.

In [25]:
add(5, 6)

In function add.


11

Az ekvivalens Matlab kód:

```matlab
function [c] = add(a, b)
    display('In function add.');
    
    c = a + b;
end

add(5, 6)
```

## Feltételek kezelése - `if`, `else`, `elif`

A különböző feltételek kezelésére rendelkezésre áll az `if` és `else` kulcsszó. A függvénydefinícióhoz hasonlóan behúzás karakterek segítségével használhatóak. 

Az `and` és az `or` kulcsszavak a Matlab `&&` és `||` operátoraival ekvivalensek.

Egy szemléltető példa.

In [26]:
def condition(num):
    if num > 5 and num <= 10:
        print("Number is larger than 5 but smaller or equal to 10.")
    # if vége
    elif num > 10:
        # elif = else if
        print("Number is larger than 10.")
    else:
        print("Number is ", num)

In [27]:
condition(3)

Number is  3


In [28]:
condition(11)

Number is larger than 10.


In [29]:
condition(6)

Number is larger than 5 but smaller or equal to 10.


## Python tárolók (containers)

Részletekbe nem bocsájtkozva, röviden ismerkedjünk meg a beépített tárolókkal. Ezen tárolókra az angol nevük használatával fogok hivatkozni (nevek a zárójelben, ahol van zárójel). 

### Lista (List)

Értelemszerűen a *list* változók sorozatát tartalmazza. A *list* elemei bővíthetőek és változtathatóak.

In [23]:
# list létrehozása, a vessző karakter (,) nem hagyható el
a = [1, 2, 3]

# list létrehozása függvényhívással
a = list((1, 2, 3))
a

[1, 2, 3]

A *list* lehet heterogén, azaz különböző típusú Python objektumokat tartalmazhat (string, szám, list).

In [26]:
l = ["a", "b", 2.3, [1, 2]]

C-hez hasonlóan és a Matlab-tól eltérően a Python lista indexek 0-tól kezdődnek.

In [25]:
a[0]

1

A harmadik elem maga is egy *list* így azt azonnal indexelhetjük.

In [27]:
l[3][0]

1

Elem *list* végéhez adása:

In [28]:
a = [1, 2, 3]
a.append("lista")
a

[1, 2, 3, 'lista']

Adott elem törlése a *list*-ből:

In [29]:
a = [1, 2, 3]
del a[0]
a

[2, 3]

*List* "másolása":

In [32]:
a = [1, 2, 3]

In [33]:
b = a
b

[1, 2, 3]

In [35]:
b[0] = 0
a

[0, 2, 3]

In [36]:
a = 4
b = a
b = 2.0
a

4

A fenti példa mutatja, hogy a `b = a` parancs nem másolatot készít a *list*-ről, azaz `b` csak egy referencia lesz az `a` változóra. Tehát ha `b`-t megváltoztatjuk `a` is megváltozik.

Ha másolatot akarunk készíteni be kell importálnunk a megfelelő függvényt a megfelelő könyvtárból. A Matlab-tól eltérően nem áll rendelkezésünkre a telepített Python disztribúció összes csomagjának függvénye, azokat be kell importálnunk a megfelelő csomagból.

In [37]:
import copy
a = [1, 2, 3]

# deepcopy függvény meghívása a copy csomagból/könyvtárból
b = copy.deepcopy(a)

b[0] = 0
a

[1, 2, 3]

Hasonló viselkedést tapasztalunk, ha függvénynek adunk át argumentumnként egy *list*-et.

In [38]:
def fun(a):
    a[0] = "NaN"

In [39]:
a = [1, 2, 3]
fun(a)
a

['NaN', 2, 3]

In [40]:
len(a)

3

In [41]:
for ii in range(len(a)):
    print(a[ii])

NaN
2
3


In [42]:
for elem in a:
    print(elem)

NaN
2
3


A Python tartalmaz jónéhány könyvtárat (standard library). A standard könyvtár igen sok alkönyvtárat tartalmaz, ezeket nem fogjuk részletesen átnézni, csak azokat, amik számunkra szükségesek. 

A standard könyvtár [dokumentációja](https://docs.python.org/3/reference/index.html).

Én [ezt](https://devdocs.io/) általános dokumentáció keresőt ajánlom. A weboldal megfelelően beállítva offline is használható. Az alapbeállítások nem tartalmazzák a Python dokumentációt, azt ki kell választani a `Disabled` menüpont alatti listából és aktiválni kell.

### Tuple

Ez a tároló nagyon hasonló a *list*-hez. A tuple objektumhoz azonban nem fűzhetőek elemek, a *tuple* elemei nem változtathatóak meg.

In [43]:
# tuple létrehozása
a = (1, 2, 3)

# létrehozás függvényhívással
a = tuple((1, 2, 3))
a

(1, 2, 3)

*Tuple* indexelése.

In [44]:
a[0]

1

A *tuple* elemei nem változtathatóak meg:

In [45]:
a[0] = 0.0

TypeError: 'tuple' object does not support item assignment

In [46]:
fun(a)

TypeError: 'tuple' object does not support item assignment

*List* *tuple*-é alakítása.

In [44]:
a = [1,2,3]
a = tuple(a)
a

(1, 2, 3)

In [47]:
b = a + (5, 6)

In [48]:
a, b

((1, 2, 3), (1, 2, 3, 5, 6))

In [49]:
for elem in a:
    print(elem)

1
2
3


Angol irodalomban erre a két változótípusra szokták a *mutable* és *immutable* melléknevet használni. A list ún. *mutable* (változtatható) változó, a tuple ún. *immutable* (nem-megváltoztatható) "változó".

### Halmaz (Set)

Gyakorlatilag egy matematikai halmazt reprezentál, minden eleme egyedi.

In [50]:
# létrehozása
a = {"a", "b", "c"}
a = set(("a", "b", "c"))
a

{'a', 'b', 'c'}

Elem hozzáadása *set*-hez:

In [51]:
a.add("d")
a

{'a', 'b', 'c', 'd'}

Az `a` *set* már tartalmazza az `"a"` string-et:

In [52]:
a.add("a")
a

{'a', 'b', 'c', 'd'}

In [53]:
a = [1, 2, 2, 3, 4, 5, 4]
a

[1, 2, 2, 3, 4, 5, 4]

*Set* létrehozása listából:

In [54]:
b = set(a)
b

{1, 2, 3, 4, 5}

Az `in` operátorral le lehet kérdezni, tartalmaz-e egy adott elemet a *set*.

In [56]:
1 in b, 2 in a, 10 in b

(True, True, False)

*Megjegyzés*: Az `in` operátor *tuple*-el és *list*-el is működik, a *set* esetén gyorsabb a lekérdezés.

In [57]:
a = [1, 2, 3]
2 in a

True

### "Szótár" (dictionary, hash map, hash table, associative array)

Kulcs-elem párokat tartalmazó objektum.

In [61]:
# létrehozása
a = {"one": 1, "two": 2, 2.0: "red"}
a

{'one': 1, 'two': 2, 2.0: 'red'}

Elem lekérdezése:

In [60]:
a["one"]

1

In [62]:
a[2.0]

'red'

In [63]:
a = {
    "row": 6,
    "col": 2,
    "rank": 2
}
a

{'row': 6, 'col': 2, 'rank': 2}

Kulcs-elem pár hozzáadása:

In [64]:
a["non_zero_elements"] = 0
a

{'row': 6, 'col': 2, 'rank': 2, 'non_zero_elements': 0}

A kulcsok és elemek maguk is Python objektumok. A Python *dictionary* is egy Python objektum, tehát:

In [65]:
a = {
    "John": {"sex": "male", "age": 26},
    "Jane": {"sex": "female", "age": 22}
}
a

{'John': {'sex': 'male', 'age': 26}, 'Jane': {'sex': 'female', 'age': 22}}

In [66]:
a["Jane"]

{'sex': 'female', 'age': 22}

In [67]:
a["Jane"]["age"]

22

In [70]:
for key, value in a.items():
    print(key, value)

John {'sex': 'male', 'age': 26}
Jane {'sex': 'female', 'age': 22}


### Tárolók létrehozása - `for` ciklus

Hozzunk létre egy tárolót, mely tartalmazza az egész számokat 0-tól 9-ig. A `%%timeit` parancssal egy adott cella átlagos futási idejét mérhetjük meg.

In [3]:
%%timeit
a = []

for ii in range(10):
    a.append(ii)

1.17 µs ± 16.6 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


In [5]:
a = []

for ii in range(10):
    a.append(ii)

A `range` függvény segítségével végig tudunk járni egy adott számhalmazon. Jelen esetben a `range(10)` függvényhívással `ii` változó értéke végigjárja a `0,1,2,3,4,5,6,7,8,9` számok halmazát.

In [6]:
a

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

Ugyenezt a *list*-et elő tudjuk állítani más szintaxissal. (list comprehension)

In [7]:
%%timeit
a = [ii for ii in range(10)]

846 ns ± 22.4 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


In [8]:
a = [ii for ii in range(10)]

Ez a szintaxis (*list comprehension*) tömörebb és hatékonyabban számítja ki a *lista* elemekeit.

In [9]:
a

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

A tömör szintaxisban az `if` kulcsszó is beépíthető. Pl 5-nél kisebb elemek generálása:

In [10]:
a = [ii for ii in range(10) if ii < 5]
a

[0, 1, 2, 3, 4]

Az elemek számát a `len` függvénnyel kérhetjük le. (Működik *set*, *dictionary* és *tuple* esetén is.)

In [61]:
len(a)

10

Elemek kinyomtatása naív módón:

In [66]:
for ii in range(len(a)):
    print(a[ii])

0
1
2
3
4


Másik megoldás, egy *list* elemeinek iterálása.

In [67]:
for elem in a:
    print(elem)

0
1
2
3
4


Ha az elem indexre is szükség van:

In [13]:
a = [ii**2 for ii in range(10)]

In [14]:
for ii, elem in enumerate(a):
    print("Index: ", ii, "- Elem: ", elem)

Index:  0 - Elem:  0
Index:  1 - Elem:  1
Index:  2 - Elem:  4
Index:  3 - Elem:  9
Index:  4 - Elem:  16
Index:  5 - Elem:  25
Index:  6 - Elem:  36
Index:  7 - Elem:  49
Index:  8 - Elem:  64
Index:  9 - Elem:  81


*Dictionary* esetén a kulcs elemeken tudunk vlgigjárni.

In [15]:
d = {"a": 1, "b": 2}

for elem in d:
    print(elem)

a
b


Kulcs-elem párokon a következőképpen tudunk egyszerre végigjárni:

In [16]:
for key, val in d.items():
    print(key, val)

a 1
b 2


A következő fejezetben megismerkedünk az alapvető beviteli és kiviteli (IO = Input/Output) függvényekkel, fájlok olvasásával, string-ek kezelésével, röviden kitérünk a hibakezelésre is.