# Beveztés a python programozási nyelvhez

A python egy

- általános célú (nem csak tudományos programozásra alkalmas nyelv, lehet vele szervert, fájlkezelőt, készíteni)
- magas szintű (általános, absztrakt, algoritmusok írása könnyebb gyorsabb),
- értelmezett (nem fordított, mint C, C++ vagy Fortran),
- dinamikus típusos (a változóknak nincs típusa, mind objektumok),
- garbage collected (szemtgyűjtéses?, automatikus memóriakezelés, haladó programozóknak egy [cikk](https://stackify.com/python-garbage-collection/) a technikai részletekről)
- objektum orientált (lásd objektum orientált programozás notebook).

programozási nyelv. Ezeket a tulajdonságokat nem kell feltétlenül megjegyezni, de érdemes észben tartani. Amint látni fogjuk a python-al viszonylag könnyű programokat írni, a nyelv  szintaxisa rendkívül kifelyező. Mivel a változóknak nincs definiált típusa, a különböző függvények, algoritmusok implementálása rugalmasan elvégezhető.

Ebben a notebook-ban először röviden megvizsgáljuk azokkal a tényezőkkel, amiknek köszönhetően manapság a python nyelvet használják dominánsan tudományos programozási feladatok megoldására. Egyszerű példákon keresztül megismerkedünk a nyelv szintaxisával.

## Miért alkalmas a python nyelv tudományos programozási porblémák megoldására?

### Értelmezett és fordított programozási nyelvek

Egy rövid kitérő az értelmezőkről (intepreters) és fordítókról (compilers). A különböző programozási nyelveket többféleképpen kategorizálhatjuk. Az egyik kategorizálás szerint, az egyszerűség kedvéért nem részletezve a technikai megfontolásokat, azt mondhatjuk, hogy vannak értelmezett (interpreted) és fordított (compiled) programozási nyelvek. (A teljesség kedvéért meg kell említsem a C# és Java progrmozási nyelveket; ezek kb. a fordított és az értelmezett nyelvek közé szokták sorolni.)

Az értelmezett nyelvek esetén egy program, az értelmező (intepreter) a forráskódot soronként beolvassa, értelmezi és végrehajtja. Ilyen programnyelv pl. a Matlab vagy a Python.

A fordított programnyelveket forráskódját egy másikfajta program, a fordító (compiler), gépi kódra fordítja és futtatható programot vagy más programokban felhasználható könyvtárat készít belőle. Pl. C, C++, Fortran.

A folyamatot az alábbi ábra szemlélteti.

![interpreted_vs_compiled](https://2.bp.blogspot.com/-duV6K80iefg/V8QrNJWoAdI/AAAAAAAAB18/5DHOXl1ajnsEVRBUmB5nSXfJbsw5ScX3wCLcB/s400/img.png)

Elméleti szempontból nincsenek értelmezett és fordított programozási nyelvek, azaz bármely programozási nyelvhez készíthatő értelmező program (pl. [egy C értelmező](https://gitlab.com/zsaleeba/picoc)) vagy fordító (pl. [Cython fordító](https://cython.org/), mely először C forráskódot generál python forrásfájlokból, melyet késöbb egy C fordítóval lefordít).

Továbbá egy adott nyelvhez akár többfajta értelmező program is készíthető. Python esetén:
- a C-ben megírt referencia értelmező, a [CPython](https://github.com/python/cpython); nem összekeverendő a Cython-nal.
- Java-ban ([Jython](https://www.jython.org/)) és C#-ban ([IronPython](https://ironpython.net/)) írt értelmező

A témáről bővebben [ebben](https://www.thoughtco.com/about-compilers-and-interpreters-958276) a cikkben olvashattok.

Általánosan elmondható:
- az értelmezett nyelvek kevésbé hatákonyak (számítások több memóriát vesznek igénybe és tovább tartanak),
- fordítókat nehezebb készíteni, mint értelmezőket,
- az értelmezett nyelvekkel gyorsabb a problémamegoldás (nem mindig, erről késöbb lesz szó),
- az értelmezett nyelvek általában képesek fordított könyvtárakat (C, C++, Fortran segítségével írt könyvtárak) meghívni egy FFI (Foreign Function Interface) segítségével.

A python értelmezők általában nem hatékonyak, maga a python nyelv nem igazán alkalmas numerikus számítások elvégzésére. Akkor mégis miért terjedt el a python használata ezen a területen? Amint korábban említettem, az értelmezett nyelvek általában képesek fordított nyelven megírt könyvtárak függvényeit meghívni.

Az legelterjedtebb python-hoz készített numerikus könyvtárak (numpy, scipy) nagy részét nem python-ban írták. Ezen könyvtárakban a számításigényes feladatokhoz (pl. lineáris algebrai feladatok, differenciális egyenletek megoldása) írt függvények tipikusan C-ben, C++-ban vagy Fortran-ban vannak implementálva. Ezeket a függvényeket a python csak meghívja, maga a python kód csak "ragasztóként" (glue-code) funkcionál, mely összefűzi és könnyen használhatóvá teszi az egyébként körülményesen használható függvényeket.

## A python értelmező (python shell) és maga a nyelv

Az elméleti háttér után térjünk át a gyakorlatra. Geofizikusként valószínűleg nagyrészt Matlab-bal van tapasztalatotok. Jó hír, hogy a python is hasonlóan működik, mint a Matlab, azaz elindítva egy értelmezőt, azonnal elkezdhetünk kódolni.

### A Python mint egyszerű számológép

Matlabhoz hasonlóan, a Python is képes egyszerű számológépként funkcionálni.

In [1]:
5 + 5

10

Változóknak így adhatunk értéket:

In [2]:
a = 5

A változó értékének kiírása:

In [3]:
a

5

Művelet elvégzése változóval:

In [4]:
a + 5

10

Az eredmény kiírásának mellőzése:

In [5]:
a + 5;

**Figyelem!** A pontos vesszőt csak az utolsó sor esetén érdemes használni, amikor nem akarjuk kiíratni a végeredményt, tehát nem úgy működik mint a Matlab. Az értelmező csak az utolsó sor eredényét írja ki.

In [6]:
a + 3
a + 2
a + 1

6

A már felhasznált változóknak bármikor más értéket adhatunk, ekkor a korábbi értéküket elvesztik az újradefiniált változók.

In [8]:
a = "aaa"
a

'aaa'

### Függvények definiálása, kód blokk

A programozás egyik alap építőeleme a függvény. Függvények segítségével lehetővé tesszük a függvényen belül implementált algoritmus újrafelhasználhatóságát.

Függvények definiálás:
- a függvénytartományt nem kapcsos zárójelek között kód (`{` és `}`; pl. C) és nem a `function` és `end` kulcsszavak között kód (pl. Matlab) jelzi
- a függvénytartomány kezdetét és végét a "behúzás" (indentation) karakterek jelzik
- komment karakter `#` (Matlab `%`-el ekvivalens)

Szemléltető példa:
- függvény definiálás kulcsszava `def`
- `add` a függvény neve
- `a` és `b` a függvény argumentumai
- `:` jelzi a függvény kezdetét
- `return` visszatérés a függvényből egy adott értékkel

In [12]:
def add(a, b):
    print("In function add.")
    # komment a függvényen belül
    
    return a + b
# függvény definíció véget ért

# ez a rész már nem része a függvénynek
print("Hello!")

Hello!


A függvénytartományt jelen esetben 4 darab space karakterrel definiáljuk. A 4 space helyett használhattunk volna 1 db tabulátor karaktert is. A fontos az, hogy a behúzás karaktereket konzisztensen használjuk, tehát ne keverjünk tabulátor karaktert space karakterrel.

In [11]:
add(5, 6)

In function add.


11

Az ekvivalens Matlab kód:

```matlab
function [c] = add(a, b)
    display('In function add.');
    
    c = a + b;
end

add(5, 6)
```

### Feltételek kezelése - `if`, `else`, `elif`

A különböző feltételek kezelésére rendelkezésre áll az `if` és `else` kulcsszó. A függvénydefinícióhoz hasonlóan behúzás karakterek segítségével használhatóak. 

Az `and` és az `or` kulcsszavak a Matlab `&&` és `||` operátoraival ekvivalensek.

Egy szemléltető példa.

In [17]:
def condition(num):
    if num > 5 and num <= 10:
        print("Number is larger than 5 but smaller or equal to 10.")
    #if vége
    elif num > 10:
        # elif = else if
        print("Number is larger than 10.")
    else:
        print("Number is ", num)

In [18]:
condition(3)

Number is:  3


In [19]:
condition(11)

Number is larger than 10.


In [20]:
condition(6)

Number is larger than 5 but smaller or equal to 10.


## Python tárolók (containers)

Részletekbe nem bocsájtkozva, röviden ismerkedjünk meg a beépített tárolókkal.

### Lista (List)

Értelemszerűen a lista változók sorozatát tartalmazza. A lista elemei bővíthetőek és változtathatóak.

In [21]:
# lista létrehozása, a vessző karakter (,) nem hagyható el
a = [1, 2, 3]

# lista létrehozása függvényhívással
a = list((1, 2, 3))
a

[1, 2, 3]

A lista lehet heterogén, azaz különböző típusú Python objektumokat tartalmazhat (string, szám, list).

In [22]:
l = ["a", "b", [1, 2]]

C-hez hasonlóan és a Matlab-tól eltérően a Python lista indexek 0-tól kezdődnek.

In [23]:
a[0]

1

A harmadik elem maga is egy lista így azt azonnal indexelhetjük.

In [24]:
l[2][0]

1

Elem lista végéhez adása:

In [36]:
a = [1, 2, 3]
a.append("lista")
a

[1, 2, 3, 'lista']

Adott elem törlése a listából:

In [39]:
a = [1, 2, 3]
del a[0]
a

[2, 3]

Lista "másolása":

In [25]:
b = a
b[0] = 0
a

[0, 2, 3]

A fenti példa mutatja, hogy a `b = a` parancs nem másolatot készít a listáról, azaz `b` csak egy referencia lesz az `a` változóra. Tehát ha `b`-t megváltoztatjuk `a` is megváltozik.

Ha másolatot akarunk készíteni be kell importálnunk a megfelelő függvényt a megfelelő könyvtárból. A Matlab-tól eltérően nem áll rendelkezésünkre a telepített Python disztribúció összes csomagjának függvénye, azokat be kell importálnunk a megfelelő csomagból.

In [30]:
import copy
a = [1, 2, 3]

# deepcopy függvény meghívása a copy csomagból/könyvtárból
b = copy.deepcopy(a)

b[0] = 0
a

[1, 2, 3]

Hasonló viselkedést tapasztalunk, ha függvénynek adunk át argumentumnként egy listát.

In [31]:
def fun(a):
    a[0] = "NaN"

In [32]:
a = [1, 2, 3]
fun(a)
a

['NaN', 2, 3]

A Python tartalmaz jónéhány könyvtárat (standard library). A standard könyvtár igen sok alkönyvtárat tartalmaz, ezeket nem fogjuk részletesen átnézni, csak azokat, amik számunkra szükségesek. 

A standard könyvtár [dokumentációja](https://docs.python.org/3/reference/index.html).

Én a [ezt](https://devdocs.io/) általános dokumentáció keresőt ajánlom. A weboldal megfelelően beállítva offline is használható. Az alapbeállítások nem tartalmazzák a Python dokumentációt, azt ki kell választani a `Disabled` menüpont alatti listából és aktiválni kell.

### Tuple

Ez a tároló nagyon hasonló a listához. A tuple objektumhoz azonban nem fűzhetőek elemek, a tuple elemei nem változtathatóak meg.

In [40]:
# tuple létrehozása
a = (1, 2, 3)

# létrehozás függvényhívással
a = tuple((1, 2, 3))
a

(1, 2, 3)

Tuple indexelése.

In [41]:
a[0]

1

A tuple elemei nem változtathatóak meg:

In [42]:
a[0] = 0.0

TypeError: 'tuple' object does not support item assignment

In [43]:
fun(a)

TypeError: 'tuple' object does not support item assignment

Lista tuple-é alakítása.

In [44]:
a = [1,2,3]
a = tuple(a)
a

(1, 2, 3)

Angol irodalomban erre a két változótípusra szokták a *mutable* és *immutable* melléknevet használni. A lista ún. *mutable* (változtatható) változó, a tuple ún. *immutable* (nem-megváltoztatható) "változó".

### Halmaz (Set)

Gyakorlatilag egy matematikai halmazt reprezentál, minden eleme egyedi.

In [45]:
# létrehozása
a = {"a", "b", "c"}
a = set(("a", "b", "c"))
a

{'a', 'b', 'c'}

Elem hozzáadása halmazhoz:

In [60]:
a.add("d")
a

{'a', 'b', 'c', 'd'}

Az `a` halmaz már tartalmazza az `"a"` string-et:

In [46]:
a.add("a")
a

{'a', 'b', 'c'}

In [47]:
a = [1, 2, 2, 3, 4, 5, 4]
a

[1, 2, 2, 3, 4, 5, 4]

Halmaz létrehozása listából:

In [66]:
b = set(a)
b

{1, 2, 3, 4, 5}

Az `in` operátorral le lehet kérdezni, tartalmaz-e egy adott elemet a halamzunk.

In [68]:
1 in b, 1 in a

(True, True)

*Megjegyzés*: Az `in` operátor tuple-el és listával is működik, a halmaz esetén gyorsabb a lekérdezés.

### "Szótár" (dictionary, hash map, hash table, associative array)

Kulcs-elem párokat tartalmazó objektum.

In [48]:
# létrehozása
a = {"one": 1, "two": 2, 2.0: "red"}
a

{'one': 1, 'two': 2, 2.0: 'red'}

Elem lekérdezése:

In [49]:
a["one"]

1

In [50]:
a[2.0]

'red'

In [51]:
a = {
    "row": 6,
    "col": 2,
    "rank": 2
}
a

{'row': 6, 'col': 2, 'rank': 2}

Kulcs-elem pár hozzáadása:

In [52]:
a["non_zero_elements"] = 0
a

{'row': 6, 'col': 2, 'rank': 2, 'non_zero_elements': 0}

A kulcsok és elemek maguk is Python objektumok. Egy Python dictionary egy Python objektum, tehát:

In [53]:
a = {
    "John": {"sex": "male", "age": 26},
    "Jane": {"sex": "female", "age": 22}
}
a

{'John': {'sex': 'male', 'age': 26}, 'Jane': {'sex': 'female', 'age': 22}}

In [54]:
a["Jane"]

{'sex': 'female', 'age': 22}

In [55]:
a["Jane"]["age"]

22

### Tárolók létrehozása - `for` ciklus

Hozzunk létre egy tárolót, mely tartalmazza az egész számokat 0-tól 9-ig. A `%%timeit` parancssal egy adott cella átlagos futási idejét mérhetjük meg.

In [57]:
%%timeit
a = []

for ii in range(10):
    a.append(ii)

1.09 µs ± 11 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


A `range` függvény segítségével végig tudunk járni egy adott számhalmazon. Jelen esetben a `range(10)` függvényhívással `ii` változó értéke végigjárja a `0,1,2,3,4,5,6,7,8,9` számok halmazát.

In [59]:
a

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

Ugyenezt a listát elő tudjuk állítani más szintaxissal.

In [60]:
%%timeit
a = [ii for ii in range(10)]

798 ns ± 26.9 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


Ez a szintaxis (*list comprehension*) tömörebb és hatékonyabban számítja ki a listaelemeket.

In [99]:
a

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

A tömör szintaxisban az `if` kulcsszó is beépíthető. Pl 5-nél kisebb elemek generálása:

In [65]:
a = [ii for ii in range(10) if ii < 5]
a

[0, 1, 2, 3, 4]

Az elemek számát a `len` függvénnyel kérhetjük le. (Működik set, dictionary és tuple esetén is.)

In [61]:
len(a)

10

Elemek kinyomtatása naív módón:

In [66]:
for ii in range(len(a)):
    print(a[ii])

0
1
2
3
4


Másik megoldás, lista elemeinek iterálása.

In [67]:
for elem in a:
    print(elem)

0
1
2
3
4


Ha az elem indexre is szükség van:

In [76]:
for ii, elem in enumerate(a):
    print("Index: ", ii, "- Elem: ", elem)

Index:  0 - Elem:  0
Index:  1 - Elem:  1
Index:  2 - Elem:  2
Index:  3 - Elem:  3
Index:  4 - Elem:  4


Dictionary esetén a kulcs elemeken tudunk vlgigjárni.

In [69]:
d = {"a": 1, "b": 2}

for elem in d:
    print(elem)

a
b


Kulcs-elem párokon a következőképpen tudunk egyszerre végigjárni:

In [70]:
for key, val in d.items():
    print(key, val)

a 1
b 2
