# 4. előadás

* tuple, list, set, különbségek
* indexelés különféle módjai
* in operátor (ciklus esetén és logikai vizsgálat esetén)
* list: append, insert, pop, reverse, sort
* string: split függvény listát készít
* több dimenziós listák
* for ciklus
* range függvény


## Alapvető adatszerkezetek

Sokszor előfordul olyan szituáció, hogy egyszerre több adattal (szöveggel, számmal stb.) kell dolgoznunk. Például több adaton szeretnénk végrehajtani ugyanolyan műveleteket, ugyanazt a számítást. Arra is sokszor van példa, hogy több adatnak csak együttesen van értelme, külön-külön nem tudunk velük mit kezdeni.

Ilyen helyzetekben szükség van arra, hogy ezeket az adatokat együttesen tudjuk kezelni, tárolni és felhasználni. Erre szolgálnak különféle adatszerkezetek. Ezekből 3 alapvetőt biztosít számunkra a Python, melyek elsőre nagyon hasonlónak tűnnek, de mindegyiknek megvan a maga szerepe. Ezek a következők:
* lista (```list```),
* rendezett n-es (```tuple```),
* halmaz (```set```).

### Lista (```list```)

A lista segítségével adatok rendezett gyűjteményét érjük el. Ez azt jelenti, hogy tetszőleges adatokat tudunk benne tárolni. A változóknál megtanultuk, hogy azok minig csak egy értéket képesek tárolni. A lista egy időben több érték tárolására is alkalmas, és az értékeket rendezetten tárolja. Azaz minden egyes elemnek megvan a pozíciója a sorban.

Nézzünk egy egyszerű példát. Készítsünk egy listát, ami a kedvenc gyümölcseinket tartalmazza!

In [1]:
fruits = ["maracuja", "szilva", "földicseresznye"]

A ```fruits``` változó most egy listát tárol el. Egy olyan listát, amelynek három eleme van, mindhárom eleme egy-egy ```str``` típusú adat.
A listát mindig szögletes zárójelpár jelöli. A zárójelpár között soroljuk fel a lista elemeit. A lista elemei bármilyen típusú adatok lehetnek.

Nézzük meg miket tudunk csinálni egy ilyen egyszerű listával!

A ```print``` függvény segítségével, más változókhoz hasonlóan ki tudjuk írni a kimenetre. Lista esetén egy felsorolást fogunk kapni annak tartalmáról.

In [2]:
print(fruits)

['maracuja', 'szilva', 'földicseresznye']


A listákat ugyanolyan módon tudjuk indexelni, mint az ```str``` típusú szövegeket. Ügyeljünk rá, hogy az első elem indexe most is 0!

Lekérhetjük egy adott indexen található elemét:

In [3]:
print(fruits[0])

maracuja


Negatív értékekkel is indexelhetünk, a módszer ugyanaz:

print(fruits[-1])

De a szeletelés (slicing) művelet is ugyanúgy működik. Kérjük le az első két elemét:

In [4]:
print(fruits[0:2])

['maracuja', 'szilva']


A már ismert ```len``` függvénnyel lekérdezhetjük egy lista elemszámát:

In [5]:
print(len(fruits))

3


Mindezek alapján már meg tudjuk tenni azt, hogy egy ```while``` ciklus segítségével végig indexeljünk egy lista elemein. A ciklusváltozóval (```i```) a lista elemszámáig iterálunk, minden iterációban kiírjuk az ```i```-edik elemet, majd nem felejtkezünk el a ciklusváltozó inkrementálásáról sem.

In [6]:
i = 0
while i < len(fruits):
    print(fruits[i])
    i += 1

maracuja
szilva
földicseresznye


A szemléltetés kedvéért próbáljuk meg bejárni a listát a végétól az elejéig:

In [7]:
i = len(fruits) - 1
while i >= 0:
    print(fruits[i])
    i -= 1

földicseresznye
szilva
maracuja


Az ```in``` operátort listák esetén is tudjuk alkalmazni, működése nagyon hasonló, mint a string-ek esetén már láttuk! Lista esetén az ```in``` operátor megadja, hogy az operátor előtti adat szerepel e az operátor utáni listán:

In [8]:
if "banán" in fruits:
    print("Szereted a banánt!")
else:
    print("Nem szereted a banánt.")

Nem szereted a banánt.


Egy lista keverten tartalmazhat több féle adatot:

In [9]:
l = ["alma", 42, False, 1*2**3/7]
print(l)

['alma', 42, False, 1.1428571428571428]


Ritka, hogy ilyen módon használjuk a listákat, de bizonyos esetekben hasznos lehet ez a tulajdonsága.

Természetesen, ha egy lista bármit tartalmazhat, akkor ebbe maga a lista is beletartozik. Tehát egy lista tartalmazhat egy másik listát:

In [10]:
l = [1, [2, 3], [4, [5, 6]]]

i = 0
while i < len(l):
    print(l[i])
    i += 1

1
[2, 3]
[4, [5, 6]]


A fenti példában ```l``` egy 3 elemű lista. Az első eleme egy ```int```. A második eleme egy ```list```, ami 2 darab ```int``` értéket tartalmaz. A harmadik eleme ismét egy ```list``` típus, melynek szintén két eleme van. Az első eleme egy ```int```, a második azonban egy ```list```, ami további két ```int``` értékből áll.

A string-ekkel ellentétben a lista elemeit utólag is tudjuk módosítani az indexükkel történő hivatkozás által:

In [43]:
print(fruits)
fruits[0] = "passiógyümölcs"
print(fruits)

['maracuja', 'szilva', 'földicseresznye']
['passiógyümölcs', 'szilva', 'földicseresznye']


#### Feladat: Listában tárolt számok szummázása

Legyen egy listánk számokkal. Azt szeretnénk, hogy összegezzük a pozitív értékeket és ennek eredményét jelenítsük meg a kimeneten.

In [11]:
# A values lista tárolja az értékeket. Ezek alapján szeretnénk a szummát képezni.
values = [-2, 34, -61, 34, -50, -25, -4, -59, 98, 43, 46, 16, 23, -34, 0, 75, 63, -23, -40, 8]

# Ciklusváltozó
i = 0

# A szumma tárolására szolgál.
sum = 0

# A while ciklussal végig iterálunk a values lista minden elemén.
while i < len(values):
    # Eldöntjük, hogy az aktuális elem pozitív előjelű vagy sem.
    if values[i] > 0:
        # Ha pozitív az i-edik érték, akkor hozzáadjuk a sum változóhoz.
        sum += values[i]
    # Nem felejtjük el inkrementálni a ciklusváltozót.
    i += 1

# Megjelenítjük a szummázás eredményét.
print(sum)

440


Listák esetén értelmezett az összeadás és a szorzás művelete is. Nézzük meg előbb az összeadást! Két tetszőleges listát össze tudunk adni, ami azt jelenti, hogy a két listát egymáshoz fűzi és eredményül egy új listát kapunk, amely mindkét lista elemeit tartalmazza.

In [12]:
a = [1, 2, 3]
b = [5, 6, 7, 8]
c = a + b
print("a", a)
print("b", b)
print("c", c)

a [1, 2, 3]
b [5, 6, 7, 8]
c [1, 2, 3, 5, 6, 7, 8]


Láthatjuk, hogy az ősszefűzés során a két lista elemei nem keverednek. Az eredményül kapott lista elején az összeadás operátor bal oldalán álló lista elemei szerepelnek, majd ez után következnek az operátor jobb oldalán álló lista elemei.

A szorzás művelet logikája ugyanaz, mint a string-ek esetén már láttuk. Szorzást egy lista és egy egész között tudunk megfeleltetni, ami visszavezethető összeadás műveletre. Azt pedig már tudjuk, hogy mit csinál. A szorzásban szereplő listát a szorzásban szereplő egész darabszor fogja egymás után fűzni.

In [13]:
d = a * 2
e = b * 4
print("d", d)
print("e", e)

d [1, 2, 3, 1, 2, 3]
e [5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8, 5, 6, 7, 8]


Ahogy az ```str``` típusnál is láttuk, úgy a ```list``` típusnak is vannak beépített függvényei. Ezek közül nézzü meg a legfontosabbakat.

* ```append```
Segítségével egy létező listához tudunk új elemet fűzni. Az új elem mindig a lista végére fog kerülni.

In [14]:
print(fruits)
fruits.append("körte")
print(fruits)

['maracuja', 'szilva', 'földicseresznye']
['maracuja', 'szilva', 'földicseresznye', 'körte']


Ezt gyakran alkalmazzuk úgy, hogy kezdetben egy üres listát hozzukn létre, majd azt bővítjük (pl. felhasználói bemenet által). Ha üres szögletes zárójelpárt adunnk meg, akkor az 0 elemű listát eredményez.

In [15]:
data = []

print("data elemszáma:", len(data))
print("data elemei:", data)

data.append(-1)
data.append(12)

print("data elemszáma:", len(data))
print("data elemei:", data)

data elemszáma: 0
data elemei: []
data elemszáma: 2
data elemei: [-1, 12]


* ```clear```

A lista összes elemét törli, üres listát kapunk.

In [16]:
print(data)

data.clear()

print(data)

[-1, 12]
[]


* ```copy```

Másolatot készít a listából, visszatérési értékként kapjuk meg a lista másolatát.

In [17]:
a = [1, 2, 3]
b = a.copy()

print(a)
print(b)

[1, 2, 3]
[1, 2, 3]


Itt egy nagyon fontos dolgot meg kell nézni! Amikor a számok (```int```, ```float```) tárolását és használatát tanultuk, akkor megnéztük, hogy számok esetén tudunk ilyet csinálni:

In [18]:
x = 10
y = x

print(x)
print(y)

10
10


Ezzel gyakorlatilag az ```x``` tartalmát átmásoltuk az ```y``` változóba. Felmerülhet a kérdés, hogy lista esetén ugyanez a mechanizmus nem működhet? Nézzük meg!

In [19]:
a = [1, 2, 3]
b = a

print(a)
print(b)

[1, 2, 3]
[1, 2, 3]


Látszólag működik, de csak látszólag! Itt egy nagyon fontos különbség van az előbbi ```y = x``` és a mostani ```b = a``` értékadások között. Amikor az ```y = x``` értékadást hajtottuk végre, akkor az ```x``` tartalmából egy másolat készült, ez lett az ```y```. Listák esetén ez nem így történik. A ```b = a``` értékadásnál nem készül másolat az ```a``` listáról, hanem ```b``` változó fizikailag is ugyanazt a listát fogja tartalmazni, mint az ```a``` változó. Gyakorlatilag egy olyan listánk lett, amit két névvel (két változóval) is elérünk. Az ilyen esetben a ```b``` változót fedőnévnek (alias) nevezzük.

Ezt a legegyszerűbb a következő kóddal tudjuk szemléltetni:

In [20]:
print("a", a)
print("b", b)

a[0] = 100

print("a", a)
print("b", b)

a [1, 2, 3]
b [1, 2, 3]
a [100, 2, 3]
b [100, 2, 3]


Azt látjuk, hogy az ```a``` listának az 0. indexű elemét átírtuk 100-ra. Azonban ez a változás a ```b``` listán is érvényben van, hiszen a két név (```a``` és ```b```) ugyanarra a fizikai listára mutat.

Ezzel szemben a ```copy``` művelet készít egy másolatot a listából, így a két lista valóban különböző lesz:

In [21]:
a = [1, 2, 3]
b = a.copy()

print("a", a)
print("b", b)

a[0] = 100

print("a", a)
print("b", b)

a [1, 2, 3]
b [1, 2, 3]
a [100, 2, 3]
b [1, 2, 3]


Látható, hogy miután módosítottuk az ```a``` lista 0. indexű elemét, ez semmilyen kihatással nem volt a ```b``` listára, hiszen az most valóban egy fizikailag különálló, önálló lista.

* ```index```

Paraméterül adott érték jobbról az első előfordulásának indexét adja eredményül.

In [22]:
print(fruits)

print(fruits.index("szilva"))

['maracuja', 'szilva', 'földicseresznye', 'körte']
1


Ha olyan elem indexét kérjük le, ami nem szerepel a listán, akkor hibát fogunk kapni.

In [23]:
print(fruits.index("alma"))

ValueError: 'alma' is not in list

Egy elágazással és az ```in``` művelettek kombinálva jól használható olyan esetben is, ha nem tudjuk, hogy a keresett elem biztosan szerepel e a listán.

In [24]:
fruit = "alma"

if fruit in fruits:
    print(fruits.index(fruit))
else:
    print(fruit, "nincs a listán!")

alma nincs a listán!


* ```insert```

Meghatározott pozícióra helyezi a megadott új elemet.

In [25]:
print(fruits)
fruits.insert(1, "eper")
print(fruits)

['maracuja', 'szilva', 'földicseresznye', 'körte']
['maracuja', 'eper', 'szilva', 'földicseresznye', 'körte']


* ```pop```

A paraméterként megadott indexen található elemet kiveszi a listáról és ez az elem lesz a visszatérési értéke. 

In [26]:
print(fruits)

fruit = fruits.pop(1)

print(fruit)
print(fruits)

['maracuja', 'eper', 'szilva', 'földicseresznye', 'körte']
eper
['maracuja', 'szilva', 'földicseresznye', 'körte']


Ha paraméter nélkül hívjuk a ```pop``` függvényt, akkor mindig az utolsó elemet veszi ki a listáról.

print(fruits)

fruit = fruits.pop()

print(fruit)
print(fruits)

Paraméter nélküli alkalmazása a leggyakoribb. Ezzel a művelettel, valamint az ```append``` művelettel együttesen [verem (stack)](https://en.wikipedia.org/wiki/Stack_(abstract_data_type)) adatszerkezetként tudjuk felhasználni a listát. A verem sajátossága, hogy azt úgy kezeljük, hogy csak a végére tudunk elemeket helyezni, és csak a végéről tudunk elemet kiolvasni.

Ilyen módon működik például a böngészők "vissza" gombja mögötti mechanizmus, ahol az előzmények kerülnek egy verembe és a gomb megnyomásával mindig a verem tetején található oldalt érjük csak el, azaz a legutóbbit. De verem segítségével valósítható meg a klasszikus [fordított lengyel jelölés](https://en.wikipedia.org/wiki/Reverse_Polish_notation) is, aritmetikai műveletek kiértékelése céljából.

* ```sort```

A lista elemeit rendezi.

In [31]:
nums = [7, 2, 4, 1, 45, -1, -97, 0, -2, 1, 6]
print(nums)
nums.sort()
print(nums)

[7, 2, 4, 1, 45, -1, -97, 0, -2, 1, 6]
[-97, -2, -1, 0, 1, 1, 2, 4, 6, 7, 45]


Alapértelmezetten növekvő sorrendben rendez. A ```reverse``` paramétere segítségével módosíthatunk a sorrenden.

In [33]:
nums = [7, 2, 4, 1, 45, -1, -97, 0, -2, 1, 6]
print(nums)
nums.sort(reverse=True)
print(nums)

[7, 2, 4, 1, 45, -1, -97, 0, -2, 1, 6]
[45, 7, 6, 4, 2, 1, 1, 0, -1, -2, -97]


[Bővebben a listák műveleteiről](https://docs.python.org/3/tutorial/datastructures.html#more-on-lists)

Létezik a ```list``` függvény is. Ennek segítségével nem listából listát tudunk generálni. Több objektum is létezik, amikből listát tudunk generálni. Az eddig tanultak közül még csak a string ilyen. Ha a ```list``` függvénynek átadunk egy ```str``` típust paraméterként, akkor abból visszatérési értékként készít egy olyan listát, amely a bemeneti szöveg egyes karaktereit fogja tartalmazni.

In [38]:
s = "Python"
l = list(s)
print(s)
print(l)

Python
['P', 'y', 't', 'h', 'o', 'n']


### Rendezett n-es (```tuple```)

A rendezett n-es (a továbbiakban a egyszerűség kedvéért az angol nevén: tuple), nagyon hasonló a listához (```list```). Szintén tetszőleges típusú és menyiségű elemet tárolhatunk el benne rendezetten. A legfontosabb eltérés, hogy a ```tuple``` esetén az elemek utólag nem módosíthatók. Ilyen tekintetben kicsit hasonló az ```str```-hez. Ránézésre onnan tudjuk megkülönböztetni, hogy amíg a ```list``` elemei szögletes zárójelpárban íródnak, addig a ```tuple``` elemeit kerek zárójelpárban helyezzük el. Ezt érdems észben tartani és nem összekeverni! Akár nehezen kiszúrható hibát generálhatunk vele, ami sok bosszúságot okozhat!

In [50]:
t = (1, 2, 3)
print(t)
print(len(t))
print(t[0])
print(t[-1])
print(t[1:])
print(type(t))

(1, 2, 3)
3
1
3
(2, 3)
<class 'tuple'>


A fentiek alapján minden ugyanúgy működik, mint a listák esetén. De az értékeket módosítani nem tudjuk:

In [51]:
t[0] = -9

TypeError: 'tuple' object does not support item assignment

Ebből fakadóan új elemet hozzáfűzni sem lehet semmilyen módon. Így a ```list``` esetén ismertetett műveletek sem értelmezhetők (pl. ```append```, ```pop```, ```clear``` stb.)

Összefűzésre van lehetőségünk, hiszen ilyenkor nem a meglévő ```tuple``` objektumokat akarjuk módosítjuk, hanem a meglévőkből generálunk újat.

In [54]:
t0 = (1, 2, 3)
t1 = (4, 5, 6)
t2 = t0 + t1
print(t2)

(1, 2, 3, 4, 5, 6)


Bár ritka, de a lehetőség nyitott arra, hogy 1 elemű ```tuple```-t hozzunk létre. Az eddigiek alapján jogosan gondolhatjuk azt, hogy ezt a következő módon tehetjük meg:

In [1]:
t = (8)

De ez sajnos nem így van. Nézüzk meg ```t``` mit tartalmaz és milyen típusú lett:

In [2]:
print(t)
print(type(t))

8
<class 'int'>


A ```t``` változó a 8-as értéket tárolja és ennek megfelelően ```int``` típusú lett. De mi nem ezt szerettük volna, hanem olyan ```tuple``` adatszerkezetet szeretnénk, aminek egyetlen eleme van, a 8-as.

A fenti esettel az a gond, hogy a fordító ezt matematikai kifejezésként értelmezi és ennek megfelelően dolgozza fel. Ami jelen esetben annyit tesz, hogy a felesleges zárójelezést eltávolítja és a kifejezés eredménye a 8 lesz, ami egész  szám. Ez így tulajdonképpen logikus is.

Na de hogyan tuudnk mégis egy elemű ```tuple```-t létrehozni?

Erre a következő jelölés került bevezetésre:

In [5]:
t = (8,)
print(t)
print(len(t))
print(type(t))

(8,)
1
<class 'tuple'>


A ```tuple``` egyetlen eleme után egy vesszőt teszünk. Ez látszólag feleslegesnek tűnik, de azért kell, mert különben matematikai kifejezésként értelmezné a fordító a leírtakat.

Korábban láttuk már, hogy egyszerre, egy sorban több változónak is tudunk értéket adni. Ha egy ```tuple```elemeit szeretnénk valemiért külön változókba helyezni, akkor hasonló módon itt is  alkalmazhatjuk ezt:

In [8]:
point = (10.023, -0.901, 3.012)
x, y, z = point
print(point)
print(x, y, z)

(10.023, -0.901, 3.012)
10.023 -0.901 3.012


A fenti módszer listák esetén is működik  természetesen.

A ```tuple``` függvény segítségével ```tuple``` objektumot tudunk létrehozni. A ```list``` függvénynél láttuk, hogy ```str```-ből tudunk ```list```-et gyártani. Hasonló módon a ```tuple``` függvény ```tuple``` objektumot készít tetszőleges szövegből:

In [12]:
t = tuple("python")
print(t)
print(len(t))

('p', 'y', 't', 'h', 'o', 'n')
6


A ```list``` és ```tuple``` függvényeket arra is használhatjuk, hogy ```tuple```-ből ```list```-et és ```list```-ből ```tuple```-t generáljunk.

In [15]:
t0 = tuple("python")
l0 = list(t0)
t1 = tuple(l0)

print(t0, type(t0))
print(l0, type(l0))
print(t1, type(t1))

('p', 'y', 't', 'h', 'o', 'n') <class 'tuple'>
['p', 'y', 't', 'h', 'o', 'n'] <class 'list'>
('p', 'y', 't', 'h', 'o', 'n') <class 'tuple'>


### Halmaz (```set```)

A ```set``` segítségével a listához hasonló szerkezetet tudunk kialakítani. Viszont ebben az esetben a matematikai halmazok fő jellemzőivel rendelkezik a típus. Így az elemei nem rendezettek és minden elemet csak egyszer tartalmazhat. A renndezettség itt nyilván nem valós rendezettlenséget jelent, hiszen az elemeknek fzizikálisan a memóriában valamilyen módon követniük kell egymást. Viszont nincs hozzájuk index rendelve, így az indexen keresztül nem is érjük el az  elemeit.

A halmaz elemeit kapcsoszárójelpárban adjuk meg:

In [27]:
s = {1, 2, 3}
print(s)
print(type(s))

{1, 2, 3}
<class 'set'>


Minden elemet egyszer tartalmazhat csak. Így ha egy elemet többször adunk meg, akkor csak az első kerül tárolásra:

In [31]:
s = {1, 2, 1}
print(s)

{1, 2}


A halmazok esetén is értelmezve van több hasznos beépített függvény. Ezek közül nézzünk meg néhányat!

* ```add```

Új elemet adhatunk a halmazhoz.

In [34]:
s = {1, 2, 3}

print(s)

s.add(4)

print(s)

{1, 2, 3}
{1, 2, 3, 4}


Ha az elemet már tartalmazza a halmaz, akkor nem törétnik változás, de hibát sem kapunk.

In [35]:
s.add(1)
print(s)

{1, 2, 3, 4}


* ```clear```

Kiüríti a halmazt. Üres halmaz esetén nem üres kapcsoszárójelpár jelenik meg (```{}```) a kimeneten, hanem a ```set()``` felíratot láthatjuk.

In [36]:
s.clear()
print(s)
print(len(s))

set()
0


* ```copy```

A eddigiekhez hasonlóan, most is másolatot tudunk készíteni az adatszerkezetből.

In [37]:
s0 = {1, 2, 3, 4}
s1 = s0.copy()