# 4. előadás

## Tartalom
* Adatszerkezetek: ```tuple```, ```list```, ```set```
* A ```for``` ciklus
* A ```range``` függvény használata


## Alapvető adatszerkezetek

Sokszor előfordul olyan szituáció, hogy egyszerre több adattal (szöveggel, számmal stb.) kell dolgoznunk. Például több adaton szeretnénk végrehajtani ugyanolyan műveleteket, ugyanazt a számítást. Arra is sokszor van példa, hogy több adatnak csak együttesen van értelme, külön-külön nem tudunk velük mit kezdeni.

Ilyen helyzetekben szükség van arra, hogy ezeket az adatokat együttesen tudjuk kezelni, tárolni és felhasználni. Erre szolgálnak különféle adatszerkezetek. Ezekből 3 alapvetőt biztosít számunkra a Python, melyek elsőre nagyon hasonlónak tűnnek, de mindegyiknek megvan a maga szerepe. Ezek a következők:
* lista (```list```),
* rendezett n-es (```tuple```),
* halmaz (```set```).

### Lista (```list```)

A lista segítségével adatok rendezett gyűjteményét érjük el. Ez azt jelenti, hogy tetszőleges adatokat tudunk benne tárolni. A változóknál megtanultuk, hogy azok minig csak egy értéket képesek tárolni. A lista egy időben több érték tárolására is alkalmas, és az értékeket rendezetten tárolja. Azaz minden egyes elemnek megvan a pozíciója a sorban.

Nézzünk egy egyszerű példát. Készítsünk egy listát, ami a kedvenc gyümölcseinket tartalmazza!

In [1]:
fruits = ["maracuja", "szilva", "földicseresznye"]

A ```fruits``` változó most egy listát tárol el. Egy olyan listát, amelynek három eleme van, mindhárom eleme egy-egy ```str``` típusú adat.
A listát mindig szögletes zárójelpár jelöli. A zárójelpár között soroljuk fel a lista elemeit. A lista elemei bármilyen típusú adatok lehetnek.

Nézzük meg miket tudunk csinálni egy ilyen egyszerű listával!

A ```print``` függvény segítségével, más változókhoz hasonlóan ki tudjuk írni a kimenetre. Lista esetén egy felsorolást fogunk kapni annak tartalmáról.

In [2]:
print(fruits)

['maracuja', 'szilva', 'földicseresznye']


A listákat ugyanolyan módon tudjuk indexelni, mint az ```str``` típusú szövegeket. Ügyeljünk rá, hogy az első elem indexe most is 0!

Lekérhetjük egy adott indexen található elemét:

In [3]:
print(fruits[0])

maracuja


Negatív értékekkel is indexelhetünk, a módszer ugyanaz:

In [4]:
print(fruits[-1])

földicseresznye


De a szeletelés (slicing) művelet is ugyanúgy működik. Kérjük le az első két elemét:

In [5]:
print(fruits[0:2])

['maracuja', 'szilva']


A már ismert ```len``` függvénnyel lekérdezhetjük egy lista elemszámát:

In [6]:
print(len(fruits))

3


Mindezek alapján már meg tudjuk tenni azt, hogy egy ```while``` ciklus segítségével végig indexeljünk egy lista elemein. A ciklusváltozóval (```i```) a lista elemszámáig iterálunk, minden iterációban kiírjuk az ```i```-edik elemet, majd nem felejtkezünk el a ciklusváltozó inkrementálásáról sem.

In [7]:
i = 0
while i < len(fruits):
    print(fruits[i])
    i += 1

maracuja
szilva
földicseresznye


A szemléltetés kedvéért próbáljuk meg bejárni a listát a végétól az elejéig:

In [8]:
i = len(fruits) - 1
while i >= 0:
    print(fruits[i])
    i -= 1

földicseresznye
szilva
maracuja


Az ```in``` operátort listák esetén is tudjuk alkalmazni, működése nagyon hasonló, mint a string-ek esetén már láttuk! Lista esetén az ```in``` operátor megadja, hogy az operátor előtti adat szerepel e az operátor utáni listán:

In [9]:
if "banán" in fruits:
    print("Szereted a banánt!")
else:
    print("Nem szereted a banánt.")

Nem szereted a banánt.


Egy lista keverten tartalmazhat több féle adatot:

In [10]:
l = ["alma", 42, False, 1*2**3/7]
print(l)

['alma', 42, False, 1.1428571428571428]


Ritka, hogy ilyen módon használjuk a listákat, de bizonyos esetekben hasznos lehet ez a tulajdonsága.

Természetesen, ha egy lista bármit tartalmazhat, akkor ebbe maga a lista is beletartozik. Tehát egy lista tartalmazhat egy másik listát:

In [11]:
l = [1, [2, 3], [4, [5, 6]]]

i = 0
while i < len(l):
    print(l[i])
    i += 1

1
[2, 3]
[4, [5, 6]]


A fenti példában ```l``` egy 3 elemű lista. Az első eleme egy ```int```. A második eleme egy ```list```, ami 2 darab ```int``` értéket tartalmaz. A harmadik eleme ismét egy ```list``` típus, melynek szintén két eleme van. Az első eleme egy ```int```, a második azonban egy ```list```, ami további két ```int``` értékből áll.

A string-ekkel ellentétben a lista elemeit utólag is tudjuk módosítani az indexükkel történő hivatkozás által:

In [12]:
print(fruits)
fruits[0] = "passiógyümölcs"
print(fruits)

['maracuja', 'szilva', 'földicseresznye']
['passiógyümölcs', 'szilva', 'földicseresznye']


#### Feladat: Listában tárolt számok szummázása

Legyen egy listánk számokkal. Azt szeretnénk, hogy összegezzük a pozitív értékeket és ennek eredményét jelenítsük meg a kimeneten.

In [13]:
# A values lista tárolja az értékeket. Ezek alapján szeretnénk a szummát képezni.
values = [-2, 34, -61, 34, -50, -25, -4, -59, 98, 43, 46, 16, 23, -34, 0, 75, 63, -23, -40, 8]

# Ciklusváltozó
i = 0

# A szumma tárolására szolgál.
sum = 0

# A while ciklussal végig iterálunk a values lista minden elemén.
while i < len(values):
    # Eldöntjük, hogy az aktuális elem pozitív előjelű vagy sem.
    if values[i] > 0:
        # Ha pozitív az i-edik érték, akkor hozzáadjuk a sum változóhoz.
        sum += values[i]
    # Nem felejtjük el inkrementálni a ciklusváltozót.
    i += 1

# Megjelenítjük a szummázás eredményét.
print(sum)

440


Listák esetén értelmezett az összeadás és a szorzás művelete is. Nézzük meg előbb az összeadást! Két tetszőleges listát össze tudunk adni, ami azt jelenti, hogy a két listát egymáshoz fűzi és eredményül egy új listát kapunk, amely mindkét lista elemeit tartalmazza.

In [14]:
a = [1, 2, 3]
b = [5, 6, 7, 8]
c = a + b
print("a", a)
print("b", b)
print("c", c)

a [1, 2, 3]
b [5, 6, 7, 8]
c [1, 2, 3, 5, 6, 7, 8]


Láthatjuk, hogy az ősszefűzés során a két lista elemei nem keverednek. Az eredményül kapott lista elején az összeadás operátor bal oldalán álló lista elemei szerepelnek, majd ez után következnek az operátor jobb oldalán álló lista elemei.

A szorzás művelet logikája ugyanaz, mint a string-ek esetén már láttuk. Szorzást egy lista és egy egész között tudunk megfeleltetni, ami visszavezethető összeadás műveletre. Azt pedig már tudjuk, hogy mit csinál. A szorzásban szereplő listát a szorzásban szereplő egész darabszor fogja egymás után fűzni.

In [15]:
d0 = a * 2
d1 = a + a
e0 = b * 4
e1 = b + b + b + b
print("d0", d0)
print("d1", d1)
print("e0", e0)
print("e1", e1)

d0 [1, 2, 3, 1, 2, 3]
d1 [1, 2, 3, 1, 2, 3]
e0 [5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8]
e1 [5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8]


A fenti példában látjuk, hogy ```d0``` és ```d1``` eredménye ugyanaz lett, ugyanazt a műveletet hajtottuk végre, csak más módon. Ugyanez a helyzet az ```e0``` és ```e1``` változók esetén.

Ahogy az ```str``` típusnál is láttuk, úgy a ```list``` típusnak is vannak beépített függvényei. Ezek közül nézzü meg a legfontosabbakat.

* ```append```
Segítségével egy létező listához tudunk új elemet fűzni. Az új elem mindig a lista végére fog kerülni.

In [16]:
print(fruits)
fruits.append("körte")
print(fruits)

['passiógyümölcs', 'szilva', 'földicseresznye']
['passiógyümölcs', 'szilva', 'földicseresznye', 'körte']


Ezt gyakran alkalmazzuk úgy, hogy kezdetben egy üres listát hozzukn létre, majd azt bővítjük (pl. felhasználói bemenet által). Ha üres szögletes zárójelpárt adunnk meg, akkor az 0 elemű listát eredményez.

In [17]:
data = []

print("data elemszáma:", len(data))
print("data elemei:", data)

data.append(-1)
data.append(12)

print("data elemszáma:", len(data))
print("data elemei:", data)

data elemszáma: 0
data elemei: []
data elemszáma: 2
data elemei: [-1, 12]


* ```clear```

A lista összes elemét törli, üres listát kapunk.

In [18]:
print(data)

data.clear()

print(data)

[-1, 12]
[]


* ```copy```

Másolatot készít a listából, visszatérési értékként kapjuk meg a lista másolatát.

In [19]:
a = [1, 2, 3]
b = a.copy()

print(a)
print(b)

[1, 2, 3]
[1, 2, 3]


Itt egy nagyon fontos dolgot meg kell nézni! Amikor a számok (```int```, ```float```) tárolását és használatát tanultuk, akkor megnéztük, hogy számok esetén tudunk ilyet csinálni:

In [20]:
x = 10
y = x

print(x)
print(y)

10
10


Ezzel gyakorlatilag az ```x``` tartalmát átmásoltuk az ```y``` változóba. Felmerülhet a kérdés, hogy lista esetén ugyanez a mechanizmus nem működhet? Nézzük meg!

In [21]:
a = [1, 2, 3]
b = a

print(a)
print(b)

[1, 2, 3]
[1, 2, 3]


Látszólag működik, de csak látszólag! Itt egy nagyon fontos különbség van az előbbi ```y = x``` és a mostani ```b = a``` értékadások között. Amikor az ```y = x``` értékadást hajtottuk végre, akkor az ```x``` tartalmából egy másolat készült, ez lett az ```y```. Listák esetén ez nem így történik. A ```b = a``` értékadásnál nem készül másolat az ```a``` listáról, hanem ```b``` változó fizikailag is ugyanazt a listát fogja tartalmazni, mint az ```a``` változó. Gyakorlatilag egy olyan listánk lett, amit két névvel (két változóval) is elérünk. Az ilyen esetben a ```b``` változót fedőnévnek (alias) nevezzük.

Ezt a legegyszerűbb a következő kóddal tudjuk szemléltetni:

In [22]:
print("a", a)
print("b", b)

a[0] = 100

print("a", a)
print("b", b)

a [1, 2, 3]
b [1, 2, 3]
a [100, 2, 3]
b [100, 2, 3]


Azt látjuk, hogy az ```a``` listának az 0. indexű elemét átírtuk 100-ra. Azonban ez a változás a ```b``` listán is érvényben van, hiszen a két név (```a``` és ```b```) ugyanarra a fizikai listára mutat.

Ezzel szemben a ```copy``` művelet készít egy másolatot a listából, így a két lista valóban különböző lesz:

In [23]:
a = [1, 2, 3]
b = a.copy()

print("a", a)
print("b", b)

a[0] = 100

print("a", a)
print("b", b)

a [1, 2, 3]
b [1, 2, 3]
a [100, 2, 3]
b [1, 2, 3]


Látható, hogy miután módosítottuk az ```a``` lista 0. indexű elemét, ez semmilyen kihatással nem volt a ```b``` listára, hiszen az most valóban egy fizikailag különálló, önálló lista.

* ```index```

Paraméterül adott érték jobbról az első előfordulásának indexét adja eredményül.

In [24]:
print(fruits)

print(fruits.index("szilva"))

['passiógyümölcs', 'szilva', 'földicseresznye', 'körte']
1


Ha olyan elem indexét kérjük le, ami nem szerepel a listán, akkor hibát fogunk kapni.

In [25]:
print(fruits.index("alma"))

ValueError: 'alma' is not in list

Egy elágazással és az ```in``` művelettek kombinálva jól használható olyan esetben is, ha nem tudjuk, hogy a keresett elem biztosan szerepel e a listán.

In [26]:
fruit = "alma"

if fruit in fruits:
    print(fruits.index(fruit))
else:
    print(fruit, "nincs a listán!")

alma nincs a listán!


* ```insert```

Meghatározott pozícióra helyezi a megadott új elemet.

In [27]:
print(fruits)
fruits.insert(1, "eper")
print(fruits)

['passiógyümölcs', 'szilva', 'földicseresznye', 'körte']
['passiógyümölcs', 'eper', 'szilva', 'földicseresznye', 'körte']


* ```pop```

A paraméterként megadott indexen található elemet kiveszi a listáról és ez az elem lesz a visszatérési értéke. 

In [28]:
print(fruits)

fruit = fruits.pop(1)

print(fruit)
print(fruits)

['passiógyümölcs', 'eper', 'szilva', 'földicseresznye', 'körte']
eper
['passiógyümölcs', 'szilva', 'földicseresznye', 'körte']


Ha paraméter nélkül hívjuk a ```pop``` függvényt, akkor mindig az utolsó elemet veszi ki a listáról.

In [29]:
print(fruits)

fruit = fruits.pop()

print(fruit)
print(fruits)

['passiógyümölcs', 'szilva', 'földicseresznye', 'körte']
körte
['passiógyümölcs', 'szilva', 'földicseresznye']


Paraméter nélküli alkalmazása a leggyakoribb. Ezzel a művelettel, valamint az ```append``` művelettel együttesen [verem (stack)](https://en.wikipedia.org/wiki/Stack_(abstract_data_type)) adatszerkezetként tudjuk felhasználni a listát. A verem sajátossága, hogy azt úgy kezeljük, hogy csak a végére tudunk elemeket helyezni, és csak a végéről tudunk elemet kiolvasni.

Ilyen módon működik például a böngészők "vissza" gombja mögötti mechanizmus, ahol az előzmények kerülnek egy verembe és a gomb megnyomásával mindig a verem tetején található oldalt érjük csak el, azaz a legutóbbit. De verem segítségével valósítható meg a klasszikus [fordított lengyel jelölés](https://en.wikipedia.org/wiki/Reverse_Polish_notation) is, aritmetikai műveletek kiértékelése céljából.

* ```sort```

A lista elemeit rendezi.

In [30]:
nums = [7, 2, 4, 1, 45, -1, -97, 0, -2, 1, 6]
print(nums)
nums.sort()
print(nums)

[7, 2, 4, 1, 45, -1, -97, 0, -2, 1, 6]
[-97, -2, -1, 0, 1, 1, 2, 4, 6, 7, 45]


Alapértelmezetten növekvő sorrendben rendez. A ```reverse``` paramétere segítségével módosíthatunk a sorrenden.

In [31]:
nums = [7, 2, 4, 1, 45, -1, -97, 0, -2, 1, 6]
print(nums)
nums.sort(reverse=True)
print(nums)

[7, 2, 4, 1, 45, -1, -97, 0, -2, 1, 6]
[45, 7, 6, 4, 2, 1, 1, 0, -1, -2, -97]


* reverse

Segítségével a listát meg tudjuk fordítani, azaz ami eddig az első elem volt, most az lesz az utolsó, utolsó elem került az első helyre, és így tovább.

In [32]:
print("Fordítás előtt:", nums)
nums.reverse()
print("Fordítás után:", nums)

Fordítás előtt: [45, 7, 6, 4, 2, 1, 1, 0, -1, -2, -97]
Fordítás után: [-97, -2, -1, 0, 1, 1, 2, 4, 6, 7, 45]


Fontos, hogy a ```reverse``` függvény helyben fordítja meg a lista elemeit. Tehát nem a visszatérési értéke lesz egy új lista, amely az eredeti lista elemeit tartalmazza fordított sorrendben. Hanem az eredeti listán hajtja végre a módosítást.

[Bővebben a listák műveleteiről](https://docs.python.org/3/tutorial/datastructures.html#more-on-lists)

Létezik a ```list``` függvény is. Ennek segítségével nem listából listát tudunk generálni. Több objektum is létezik, amikből listát tudunk generálni. Az eddig tanultak közül még csak a string ilyen. Ha a ```list``` függvénynek átadunk egy ```str``` típust paraméterként, akkor abból visszatérési értékként készít egy olyan listát, amely a bemeneti szöveg egyes karaktereit fogja tartalmazni.

In [33]:
s = "Python"
l = list(s)
print(s)
print(l)

Python
['P', 'y', 't', 'h', 'o', 'n']


Az ```str``` típus esetén létezik a ```split``` függvény, melynek segítségével az adott szövegből listát tudunk generálni olyan módon, hogy a szóközöknél feldarabolja a szöveget és az így képzett rész-string-ek lesznek a generált lista egyes elemei.

In [34]:
t = "Python alapok informatikusoknak"
l = t.split()
print(t)
print(l)

Python alapok informatikusoknak
['Python', 'alapok', 'informatikusoknak']


Lehetőségünk van arra, hogy ne szóközök mentén, hanem tetszőleges szövegrészlet mentén szabdaljunk fel egy szöveget. Például csv formátumú, potnosvesszővel tagolt szöveget is fel tudunk ilyen módon bontani.

In [35]:
data_raw = "4;0;6;5;3;-2;-9;0;4;8;-2;4;1"
data = data_raw.split(";")
print(data)

['4', '0', '6', '5', '3', '-2', '-9', '0', '4', '8', '-2', '4', '1']


Itt amire érdemes ügyelni, hogy az ilyen módon képzett lista elemei továbbr is string-ek maradnak, akkor is, ha egyébként a feldarabolt egységek csak számokat tartalmaznak. De ez nem okoz gondot. Eddigi tudásunk alapján ezt egyszerűen tudjuk orvosolni:

In [36]:
# Ciklusváltozó
i = 0

# A ciklussal végig járjuk a data lista elemeit.
while i < len(data):
    # Az i-edik elemét az int függvénnyel egésszé konvertáljuk, majd el mentjük a listában az  eredeti pozíciójára.
    data[i] = int(data[i])
    # A ciklusváltozó inkrementálását nem felejtjük el.
    i += 1

# A kiírt lista most már csak int-eket tartalmaz.
print(data)

[4, 0, 6, 5, 3, -2, -9, 0, 4, 8, -2, 4, 1]


Előfordulhat olyan szituáció, hogy a generált lista elemeit számmá szeretnénk alakítani, de tegyük fel, hogy valamiért szükségünk van az eredeti, szöveget tartalmaző listára is. Ilyenkor tehetjük azt, hogy nem az eredeti lista elemeit változtatjuk, hanem egy új listába fűzzük össze az új értékeket.

In [37]:
# Bemenete nyers adat csv formában.
data_raw = "4;0;6;5;3;-2;-9;0;4;8;-2;4;1"
# Felszabdalt szöveg listában
data_str = data_raw.split(";")

# Üres listát hozunk létre. Itt fogjuk tárolni a data_str elemeit egésszé alakítva.
data_int = []

# Ciklusváltozó
i = 0

# A ciklussal végig járjuk a data_str lista elemeit.
while i < len(data_str):
    # A data_str i-edik elemét egésszé alakítjuk, majd hozzá fűzzük a data_int lista végére.
    data_int.append(int(data_str[i]))
    # Ciklus változó inkrementálása.
    i += 1

# Látjuk, hogy a két lista "ugyanazokat" az elemeket tartalmazza, csak más-más adattípusban tárolva.
print(data_str)
print(data_int)


['4', '0', '6', '5', '3', '-2', '-9', '0', '4', '8', '-2', '4', '1']
[4, 0, 6, 5, 3, -2, -9, 0, 4, 8, -2, 4, 1]


#### Feladat: Mátrix összeadás

Tároljunk el két mátrixot egy-egy ```list``` segítségével és képezzük a két mátrix összegét egy harmadik listában.

A mátrix két dimenziós. Ezt úgy tudjuk  megoldani, hogy ha a listánk további listákat tartalmaz. Legyenek a mátrixaink 3 szélesek és 2 magasak. Ezt tároljuk egy olyan 3 elemű listában, melynek mindhárom eleme egy-egy két elemű lista.

In [38]:
# Az A és a B a bemeneti 3*2 méretű mátrixok
A = [[1, 2], [3, 4], [5, 6]]
B = [[9, 8], [7, 6], [5, 4]]

# A C lesz a kimeneti mátrix, kezdetben üres.
C = []

# Ciklusváltozó
i = 0

# Az i-vel 0-tól 3-ig számolunk. 
# Itt a len(A) helyett lehetne len(B) is. 
# Belátható, hogy mindegy melyik mátrixnak kérdezzük le a külső dimenzióméretét.
while i < len(A):
    # A belső dimenzióhoz tartozó ciklusváltozót inicializáljuk.
    j = 0
    # A kimeneti mátrixnak létrehozzunk a következő, kezdetben üres elemét.
    C.append([])
    # A belső ciklus segítségével az előző utasítás során létrehozott belső listát töltjük fel.
    # Lássuk, hogy itt is lehetne len(A[i]) helyett len(B[i]).
    while j < len(A[i]):
        # Az A és a B mátrixok (i, j)-edik elemeit összeadjuk és hozzáadjuk  a C listához.
        C[i].append(A[i][j] + B[i][j])
        # A belső ciklus ciklusváltozóját inkrementáljuk.
        j += 1
    # A külső ciklus ciklusváltozóját inkrementáljuk.
    i += 1

print(C)

[[10, 10], [10, 10], [10, 10]]


### Rendezett n-es (```tuple```)

A rendezett n-es (a továbbiakban a egyszerűség kedvéért az angol nevén: tuple), nagyon hasonló a listához (```list```). Szintén tetszőleges típusú és menyiségű elemet tárolhatunk el benne rendezetten. A legfontosabb eltérés, hogy a ```tuple``` esetén az elemek utólag nem módosíthatók. Ilyen tekintetben kicsit hasonló az ```str```-hez. Ránézésre onnan tudjuk megkülönböztetni, hogy amíg a ```list``` elemei szögletes zárójelpárban íródnak, addig a ```tuple``` elemeit kerek zárójelpárban helyezzük el. Ezt érdems észben tartani és nem összekeverni! Akár nehezen kiszúrható hibát generálhatunk vele, ami sok bosszúságot okozhat!

In [39]:
t = (1, 2, 3)
print(t)
print(len(t))
print(t[0])
print(t[-1])
print(t[1:])
print(type(t))

(1, 2, 3)
3
1
3
(2, 3)
<class 'tuple'>


A fentiek alapján minden ugyanúgy működik, mint a listák esetén. De az értékeket módosítani nem tudjuk:

In [40]:
t[0] = -9

TypeError: 'tuple' object does not support item assignment

Ebből fakadóan új elemet hozzáfűzni sem lehet semmilyen módon. Így a ```list``` esetén ismertetett műveletek sem értelmezhetők (pl. ```append```, ```pop```, ```clear``` stb.)

Összefűzésre van lehetőségünk, hiszen ilyenkor nem a meglévő ```tuple``` objektumokat akarjuk módosítjuk, hanem a meglévőkből generálunk újat.

In [41]:
t0 = (1, 2, 3)
t1 = (4, 5, 6)
t2 = t0 + t1
print(t2)

(1, 2, 3, 4, 5, 6)


Bár ritka, de a lehetőség nyitott arra, hogy 1 elemű ```tuple```-t hozzunk létre. Az eddigiek alapján jogosan gondolhatjuk azt, hogy ezt a következő módon tehetjük meg:

In [42]:
t = (8)

De ez sajnos nem így van. Nézüzk meg ```t``` mit tartalmaz és milyen típusú lett:

In [43]:
print(t)
print(type(t))

8
<class 'int'>


A ```t``` változó a 8-as értéket tárolja és ennek megfelelően ```int``` típusú lett. De mi nem ezt szerettük volna, hanem olyan ```tuple``` adatszerkezetet szeretnénk, aminek egyetlen eleme van, a 8-as.

A fenti esettel az a gond, hogy a fordító ezt matematikai kifejezésként értelmezi és ennek megfelelően dolgozza fel. Ami jelen esetben annyit tesz, hogy a felesleges zárójelezést eltávolítja és a kifejezés eredménye a 8 lesz, ami egész  szám. Ez így tulajdonképpen logikus is.

Na de hogyan tudunk mégis egy elemű ```tuple```-t létrehozni?

Erre a következő jelölés került bevezetésre:

In [44]:
t = (8,)
print(t)
print(len(t))
print(type(t))

(8,)
1
<class 'tuple'>


A ```tuple``` egyetlen eleme után egy vesszőt teszünk. Ez látszólag feleslegesnek tűnik, de azért kell, mert különben matematikai kifejezésként értelmezné a fordító a leírtakat.

Korábban láttuk már, hogy egyszerre, egy sorban több változónak is tudunk értéket adni. Ha egy ```tuple```elemeit szeretnénk valemiért külön változókba helyezni, akkor hasonló módon itt is  alkalmazhatjuk ezt:

In [45]:
point = (10.023, -0.901, 3.012)
x, y, z = point
print(point)
print(x, y, z)

(10.023, -0.901, 3.012)
10.023 -0.901 3.012


A fenti módszer listák esetén is működik  természetesen.

A ```tuple``` függvény segítségével ```tuple``` objektumot tudunk létrehozni. A ```list``` függvénynél láttuk, hogy ```str```-ből tudunk ```list```-et gyártani. Hasonló módon a ```tuple``` függvény ```tuple``` objektumot készít tetszőleges szövegből:

In [46]:
t = tuple("python")
print(t)
print(len(t))

('p', 'y', 't', 'h', 'o', 'n')
6


A ```list``` és ```tuple``` függvényeket arra is használhatjuk, hogy ```tuple```-ből ```list```-et és ```list```-ből ```tuple```-t generáljunk.

In [47]:
t0 = tuple("python")
l0 = list(t0)
t1 = tuple(l0)

print(t0, type(t0))
print(l0, type(l0))
print(t1, type(t1))

('p', 'y', 't', 'h', 'o', 'n') <class 'tuple'>
['p', 'y', 't', 'h', 'o', 'n'] <class 'list'>
('p', 'y', 't', 'h', 'o', 'n') <class 'tuple'>


### Halmaz (```set```)

A ```set``` segítségével a listához hasonló szerkezetet tudunk kialakítani. Viszont ebben az esetben a matematikai halmazok fő jellemzőivel rendelkezik a típus. Így az elemei nem rendezettek és minden elemet csak egyszer tartalmazhat. A renndezettség itt nyilván nem valós rendezettlenséget jelent, hiszen az elemeknek fizikálisan a memóriában valamilyen módon követniük kell egymást. Viszont nincs hozzájuk index rendelve, így az indexen keresztül nem is érjük el az  elemeit.

A halmaz elemeit kapcsoszárójelpárban adjuk meg:

In [48]:
s = {1, 2, 3}
print(s)
print(type(s))

{1, 2, 3}
<class 'set'>


Minden elemet egyszer tartalmazhat csak. Így ha egy elemet többször adunk meg, akkor csak az első kerül tárolásra:

In [49]:
s = {1, 2, 1}
print(s)

{1, 2}


A halmazok esetén is értelmezve van több hasznos beépített függvény. Ezek közül nézzünk meg néhányat!

* ```add```

Új elemet adhatunk a halmazhoz.

In [50]:
s = {1, 2, 3}

print(s)

s.add(4)

print(s)

{1, 2, 3}
{1, 2, 3, 4}


Ha az elemet már tartalmazza a halmaz, akkor nem törétnik változás, de hibát sem kapunk.

In [51]:
s.add(1)
print(s)

{1, 2, 3, 4}


* ```clear```

Kiüríti a halmazt. Üres halmaz esetén nem üres kapcsoszárójelpár jelenik meg (```{}```) a kimeneten, hanem a ```set()``` felíratot láthatjuk.

In [52]:
s.clear()
print(s)
print(len(s))

set()
0


* ```copy```

A eddigiekhez hasonlóan, most is másolatot tudunk készíteni az adatszerkezetből.

In [53]:
s0 = {1, 2, 3, 4}
s1 = s0.copy()

* ```difference```

Két halmaz különbségét adja meg. A példában ```s2``` azokat az ```s0```-beli elemeket tartalmazza, melyek ```s1```-ben nem találhatók meg. Az ```s3``` pedig azokból az ```s1```-beli elemekből áll, melyek ```s0```-ban nincsenek jelen.

In [54]:
s0 = {1, 2, 3, 4}
s1 = {4, 5, 6, 7}

print("s0", s0)
print("s1", s1)

s2 = s0.difference(s1)
print("s2", s2)

s3 = s1.difference(s0)
print("s3", s3)


s0 {1, 2, 3, 4}
s1 {4, 5, 6, 7}
s2 {1, 2, 3}
s3 {5, 6, 7}


* ```discard```

Paraméterül adott elemet eltávolítja a listából. Ha az elem nincs a listában, akkor nem történik semmi. 

In [55]:
s = {1, 2, 3, 4, 5}
print(s)
s.discard(2)
print(s)
s.discard(-1)
print(s)

{1, 2, 3, 4, 5}
{1, 3, 4, 5}
{1, 3, 4, 5}


* ```intersection```

Két halmaz metszetét adja meg. Ha a metszet üres halmaz, akkor most is azt látjuk, hogy a kimeneten a ```set()``` felírat jelenik meg.

In [56]:
s0 = {1, 2, 3, 4}
s1 = {4, 5, 6, 7}

print("s0", s0)
print("s1", s1)

s2 = s0.intersection(s1)

print("s2", s2)

s3 = {1, 2, 3}

s4 = s3.intersection(s2)

print("s4", s4)

s0 {1, 2, 3, 4}
s1 {4, 5, 6, 7}
s2 {4}
s4 set()


* ```union```

Két halmaz unióját adja meg.

In [57]:
s0 = {1, 2, 3, 4}
s1 = {4, 5, 6, 7}

print("s0", s0)
print("s1", s1)

s2 = s0.union(s1)

print("s2", s2)

s0 {1, 2, 3, 4}
s1 {4, 5, 6, 7}
s2 {1, 2, 3, 4, 5, 6, 7}


[Bővebben a halmazműveletekről.](https://www.w3schools.com/python/python_ref_set.asp)

A listáknál láttuk, hogy üres listát úgy tudunk generálni, ha elemek felsorolása nélkül, csak egy zárójelpárt adunk meg. Gondolhatnánk, hogy ez a halmaz esetén is így van, de nem! A nagyobb problémát az okozza, hogy a ```{}``` művelet érvényes, de nem üres halmazt fog generálni, hanem üres szótárat (dictionary). A szótár adatszerkezetről később lesz szó.

Ha üres halmazt szeretnénk létrehozni, akkor azt az alábbi módon tehetjük meg a ```set``` függvény segítségével:

In [58]:
s = set()
print(s)
print(len(s))

set()
0


## For ciklus

A ciklusok közül eddig csak a ```while``` ciklust használtuk. Most ismerkedjünk meg a ciklusok másik fajtájával, a ```for``` ciklussal. A ```for``` ciklus tulajdonképpen a ```while``` egyszerűsítésére lett bevezetve. A legtöbb esetben a ```while``` ciklust arra használtuk, hogy valamettől valameddig elszámoljunk vele. Tettük ezt például azért, mert meghatározott mennyiségű értéket be kellett kérni a felhasználótól, vagy mert egy lista elemein végig szerettünk volna iterálni. Ezt az esetet egyszerüsíti le a ```for``` ciklus.

A ```for``` ciklus segítségével egy tetszőleges iterálható objektum elemein tudunk végig menni. Tipikusan ilyen a lista vagy tuple. Nézzünk rá egy példát!

In [59]:
for fruit in fruits:
    print(fruit)

passiógyümölcs
szilva
földicseresznye


A fenti ```for``` ciklussal a ```fruits``` listán iteráltunk végig. A ```fruit in fruits``` kifejezés azt jelenti, hogy a ```fruits``` lista elemein szeretnénk végig menni, és minden egyes iteráció során a következő elem a ```fruit``` nevű változóba kerüljön bele. Ezt a változót a cikluson belül fel tudjuk használni. A példában egyszerűen kiírattuk az értékét a ```print``` függvénnyel.

A szemléltetés végett nézzük meg ugyanennek a megoldását ```while``` ciklus segítségével!

In [60]:
i = 0

while i < len(fruits):
    print(fruits[i])
    i += 1

passiógyümölcs
szilva
földicseresznye


A fenti ```while``` ciklus pontosan ugyanazt teszi, mint az előtte szereplő ```for``` ciklus. Mindkettő esetén a ```fruits``` listán mentünk végig.

Vegyük észre, hogy mi a ```for``` ciklus előnye az ilyen jellegű feladatoknál!
* Nincs szükségünk ciklusváltozóra. Itt a "ciklusváltozó" a ```fruit``` változó lesz, de ez már a konkrét elemet tartalmazza, nem kell indexelni a listát.
* Mivel nincs ciklusváltozó, így azt inkrementálni sem kell. Ezzel ezt a hibalehetőséget kizártuk.
* Ugyancsak a ciklusváltozó hiánya miatt azt inicializálni sem kell. Így még egy hibázási lehetőségtől megváltunk.



Felmerül a kérdés, hogy mi van akkor, ha nem egy konkrét lista vagy más iterálható objektum elemein szeretnénk végig iterálni, hanem egyszerűen csak n darab lépést szeretnénk végrehajtani. Erre is van megoldás a ```range``` függvény segítségével.

In [61]:
range(10)

range(0, 10)

A ```range``` függvény egy iterálható szekvenciát állít elő, amit arra tudunk használni, hogy egy listához hasonlóan, végig iteráljunk rajta. A szekvencia 0-tól a paraméterig megadott értékig fogja tartalmazni az egész számokat olyan módon, hogy a felső határérték már nem tartozik bele. Tehát a fenti példa esetén 0-tól 9-ig tudunk egyesével iterálni a ```range``` függvénnyel. Ezt a  következő módon használjuk fel:

In [62]:
for i in range(10):
    print(i)

0
1
2
3
4
5
6
7
8
9


A fenti kód azt csinálja, mintha azt mondtuk volna:

In [63]:
nums = (0, 1, 2, 3, 4, 5, 6, 7, 8, 9)

for i in nums:
    print(i)

0
1
2
3
4
5
6
7
8
9


Tehát a ```range``` használata olyan, mintha generálnánk egy listát, ami a kívánt kezdőértéktől a kívánt végértékig tartalmazza az indexeket, és ezen a listán iterálnánk végig. Nyilván ez sokkal egyszerűbb és kézenfekvőbb a ```range``` segítségével, mint "kézzel" létrehozni ezt a listát.

Ezzel a módszerrel a ```fruits``` listán így tudunk végig iterálni:

In [64]:
for i in range(len(fruits)):
    print(fruits[i])

passiógyümölcs
szilva
földicseresznye


Persze a fenti példa esetén nincs értelme a ```range``` függvényt használni, egyszerűbb lett volna pusztán a ```fruits``` listán bejárni.

A ```range``` függvény használata akkor lehet célszerű, ha nem egy konkrét lista elemein szeretnénk végig menni, hanem fixen tudjuk előre, hogy egy meghatározott műveletet n-szer végre kell hajtani.

Egyszerű példa: Kérjünk be ```n``` darab számot a felhasználótól és tároljuk el egy listában. A végén a lista tartalmát írjuk a képernyőre.

In [65]:
n = 3

nums = []

print("Kérem adjon meg " + str(n) + " darab egész számot!")

for i in range(n):
     nums.append(int(input("Kérem az " + str(i+1) + ". értéket:")))

print("A megadott számok:")

for num in nums:
    print(num)
    

Kérem adjon meg 3 darab egész számot!


Kérem az 1. értéket: 4
Kérem az 2. értéket: 9
Kérem az 3. értéket: 3


A megadott számok:
4
9
3


A fenti példánál látjuk, hogy az első ```for``` ciklussal nem egy listán iteráltunk végig, hanem meghatározott mennyiségszer végre kellett hajtani valamit. Jelen esetben ```n```-szer be kellett kérni a felhasználótól egy értéket, amit rögtön egésszé alakítottunk az ```int``` függvénnyel, majd az ```append``` segítségével hozzá is adtuk  a ```nums``` lista végére.

A második ```for``` ciklusnál már más a helyzet. Itt arra használtuk, hogy a ```nums``` listát végig járjuk és kiírjuk minden elemét. Ugyan itt is lehetett volna használni a ```range``` függvényt, de vegyük észre, hogy feleslegesen bonyolítja a helyzetet:

In [66]:
for i in range(len(nums)):
    print(nums[i])

4
9
3


A ```range``` függvényt további két módon tudjuk paraméterezni. Eddig láttuk, hogy segítségével 0-tól a paraméterként megadott értékig tudunk iterálni egyesével. Felmerülhet a kérdés, hogy mi van, ha nem 0-tól szeretnénk iterálni? És mi van, ha nem egyesével? Szerencsére mindkettőre nyújt megoldást a ```range``` függvény.

Ha nem 0-tól, hanem egy általunk meghatározott kezdő értéktől szeretnénk iterálni, akkor két paraméterrel kell ellátni a ```range``` függvényt. Az első paraméter lesz az intervallum alsó fele, a második pedig a záró oldala.

In [67]:
for i in range(5, 10):
    print(i)

5
6
7
8
9


In [68]:
for i in range(100, 110):
    print(i)

100
101
102
103
104
105
106
107
108
109


Fontos, hogy most is az intervallum alulról zárt, felülről nyitott. Azaz a kezdő érték bele tartozik az iterálásba, de a záró érték már nem.

A ```range``` függvény harmadik felhasználási esete, amikor a lépésközt is meg szeretnénk adni. Ez lesz a harmadik paramétere:

In [69]:
for i in range(10, 20, 2):
    print(i)

10
12
14
16
18


In [70]:
for i in range(0, 10, 3):
    print(i)

0
3
6
9


Ezt a módszert felhasználva lehetőségünk van arra is, hogy egy nagyobb értéktől iteráljunk egy kisebb értékig. Ilyenkor természetesen a lépésköz negatív előjelet kap:

In [71]:
for i in range(10, 0, -1):
    print(i)

10
9
8
7
6
5
4
3
2
1


A range függvény eredményét alapvetően arra használjuk, hogy egy ```for``` ciklussal iteráljunk végig az elemein. Néha szükségünk lehet arra, hogy ezekből listát, tuple-t, vagy halmazt generáljunk. Ezt meg tehetjük a ```list```, ```tuple``` és ```set``` függvények segítségével, ha paraméterül egy ```range``` függvényt adunk nekik.

In [72]:
l = list(range(10))
t = tuple(range(10))
s = set(range(10))
print(l)
print(t)
print(s)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
(0, 1, 2, 3, 4, 5, 6, 7, 8, 9)
{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}


#### Feladat: Statisztika

Kérjünk be a felhasználótól ```n```  darab számot, de előtte a felhasználó határozza meg a bekérendő számok mennyiségét is. A számokat tároljuk el egy listában. A bekérés után határozzuk meg a következő értékeket: maximum érték, minimum érték, átlag, medián.

In [73]:
n = int(input("Hány számot szeretne feldolgozni?"))

data = []

for i in range(n):
    data.append(float(input("Kérem az " + str(i + 1) + ". értéket:")))

min_value = data[0]
max_value = data[0]
avg_value = 0

for d in data:
    if d < min_value:
        min_value = d
    if d > max_value:
        max_value = d
    avg_value += d

avg_value /= len(data)

print("Minimum:", min_value)
print("Maximum:", max_value)
print("Átlag:", avg_value)

Hány számot szeretne feldolgozni? 4
Kérem az 1. értéket: 2
Kérem az 2. értéket: 4
Kérem az 3. értéket: 5
Kérem az 4. értéket: 7


Minimum: 2.0
Maximum: 7.0
Átlag: 4.5


A [medián](https://hu.wikipedia.org/wiki/Medi%C3%A1n) számítását nézzük meg külön, ez egy kicsit érdekesebb feladat. A medián meghatározásához sorba kell rendezi a lista elemeit és az ilyen módon kapott lista középső eleme lesz a medián. A sorba rendezéssel nincs gond, már tudjuk, hogy a ```sort``` függvénnyel ezt nagyon könnnyen megtehetjük. Az érdekesebb kérdés a középső elem kiválasztása. Középső elem nincs mindig egyértelműen. Például egy 3 elemű listának van, de egy 4 elemű lista esetén nincs. Ha a lista elemszáma páros, akkor azt mondjuk, hogy két középső eleme van és ennek a két elemnek az átlaga adja a mediánt. Tehát azt látjuk, hogy a mediánt vagy így vagy úgy számítjuk. Ez egy tipikus esete az elágazásnak. Próbáljuk meg ilyen módon megoldani.

In [74]:
# Rendezzük a lista elemeit. A sort függvény hívása után a data lista már növekvő sorrendben tartalmazza a korábbi elemeit.
data.sort()

print(data)

# Ha a data hossza páros, azaz kettővel osztva nulla a maradék, akkor két középső elem lesz.
# Ellenkező esetben, azaz ha páratlan az elemszáma, akkor csak egy középső elem van. Ez utóbbi az egyszerűbb eset.
if len(data) % 2 == 0:
    # A két középső elem átlaga adja a medián.
    median_value = (data[len(data)//2] + data[len(data)//2-1]) / 2
else:
    # Az egyetlen középső elem lesz a medián.
    median_value = data[len(data)//2]

print(median_value)

[2.0, 4.0, 5.0, 7.0]
4.5


Az érdekesebb eset az amikor két középső elemünk van. A ```len(data)//2``` minden esetben, amikor páros az elemszám, akkor a jobb oldali középső elemet fogja megadni. Ha az elemszám 2, akkor az 1. indexű elemet kapjuk. Ha az elemszám 4, akkor a 2. indexű elemet kapjuk. És így tovább. Ebből a bal oldali középső elemet úgy érjük el, ha kivonunk belőle egyet. Tehát a jobb oldali középső elemet a ```len(data)//2```, a bal oldalit pedig a ```len(data)//2-1``` indexen érjük el. A hagyományos osztással (```/```) ezeknek  a műveleteknek az eredménye mindig ```float``` lenne, amit ```int``` típusra kellene konvertálni. Erre megoldást jelent, ha az egész osztást (```//```) használjuk.