# 9. előadás

## Tartalom
* Szöveges fájlok létrehozása, megnyitása, írása, olvasása

Szöveges fájlokat megnyitni az ```open``` függvény segítségével tudunnk, függetlenül attól, hogy milyen műveletet szeretnénk végrehajtani:
* új fájl létrehozása,
* meglévő fájl felülírása,
* meglévő fájlhoz hozzáfűzés,
* vagy meglévő fájl olvasása.

Az ```open``` függvénynek két paramétert szükséges megadnunk: az első a fájl neve, a második egy karakter, ami meghatározza, hogy milyen műveletet szeretnénk végrehajtani:
* ```"w"```: Írásra megnyitjuk a fájlt. Ha már létezik, akkor a tartalma törlésre kerül. Ha még nem létezik, akkor új fájlt hoz létre.
* ```"a"```: Meglévő fájlt nyitunk meg írásra a tartalma törlése nélkül. Ezt hozzáfűzésnek nevezzük. Ha a fájl nem létezik, akkor új fájlt hoz létre.
* ```"r"```: Meglévő fájlt olvasásra nyitunk meg. Ha a fájl nem létezik, akkor hibát kapunk.

Nézzünk ezekre példákat!

## Fájl írása

In [1]:
f = open("f0.txt", "w")

A fenti kódban megnyitottuk az ```f0.txt``` nevű fájlt írásra. Mivel ez még nem létezett, ezért létrehozásra került, tartalma teljesen üres.

Ez után van lehetőségünk arra, hogy tartalommal töltsük fel.

In [2]:
f.write("Hello!")

6

A ```write``` függvénnyel tetszőleges szöveget helyezhetünk el a fájlban. Mindig a végéhez fogja illeszteni az új szöveget, így többször is írhatunk a fájlba segítségével:

In [3]:
for i in range(10):
    f.write(str(i))

Arra ügyelni kell, hogy csak ```str``` típust írhatunk a fájlba. Ha más jellegű adatunk van, akkor azt előbb szöveggé kell alakítani, mint azt fent is láthatjuk.

Jelen pillanatban ez található az ```f0.txt``` fájlban:

```Hello!0123456789```

Látható, hogy a ```write``` függvény sosem fog új sort kezdeni. Ha szeretnénk mégis, akkor ezt sortörés karakterrel kell jeleznünk.

In [4]:
f.write("\nEz most új sorban lesz.")

24

Így a fájl tartalma a következő:

```Hello!0123456789```

```Ez most új sorban lesz.```

Nagyon fontos! Ha a fájl írásával végeztünk, akkor ezt jeleznünk kell a ```close``` függvény hívásával:

In [5]:
f.close()

Most nyissuk meg újra az ```f0.txt``` fájlt írásra (```"w"```) és egy ciklus segítségével írjuk be az egész számokat a $[0, 5[$ intervallumból:

In [6]:
f = open("f0.txt", "w")

for i in range(5):
    f.write(f"{i}\n")

f.close()

A fájl tartalma most a következő lett:

```0```

```1```

```2```

```3```

```4```


Fontos, hogy a ```"w"``` paraméter miatt a korábban beleírt tartalom elveszett. Ha azt szeretnénk, hogy a korábbi tartalom ne vesszen el, hanem ahhoz szeretnénk további sorokat fűzni, akkor az ```"a"``` paraméterrel tehetjük ezt meg:

In [7]:
f = open("f0.txt", "a")

numbers = ("nulla", "egy", "kettő", "három", "négy")

for number in numbers:
    f.write(number + "\n")

f.close()

Ennek hatására a fájl tartalma a következő lett:

```0```

```1```

```2```

```3```

```4```

```nulla```

```egy```

```kettő```

```három```

```négy```

A ```write``` függvényel kívül a ```writelines``` függvény segítségével is tudunk fájlba írni. Bemenetként egy szövegeket tartalmazó listát vár és a lista elemeit fogja egymás után a fájlba írni.

In [8]:
f = open("f0.txt", "w")

numbers = ("nulla", "egy", "kettő", "három", "négy")

f.writelines(numbers)

f.close()

Fontos, hogy itt sem fog automatikusan sortöréseket elhelyezni. Így a fájl tartalma a következő módon alakul:

```nullaegykettőháromnégy```

Ennél az esetnél csinálhatjuk például azt, hogy list comprehension módszerrel generálunk egy új listát, ahol minden elemhez hozzáfűzűnk még egy sortörést. Ezt rögtön át is adjuk bemenetként a ```writelines``` függvénynek.

In [9]:
f = open("f0.txt", "w")

numbers = ("nulla", "egy", "kettő", "három", "négy")

f.writelines([number + "\n" for number in numbers])

f.close()

így már a következő tartalmat kapjuk:

```nulla```

```egy```

```kettő```

```három```

```négy```

#### Feladat: Bevásárlólista

Készítsünk egy programot, amivel bevásárlólistát tudunk generálni. A listán el szeretnénk tárolni a vásárlandó termékek nevét (```str```) és mennyiségét (```int```). A mértékegységtől most eltekintünk. A felhasználótól folyamatosan kérjük be előbb a következő termék nevét, majd annak a mennyiségét. Ezeket egy szótárba tároljuk el. A bekérést úgy lehessen megszakítani, ha a termék nevének ```0``` értéket ad meg. Ez után hozzunk létre egy ```MyShoppingList.txt``` nevű fájlt és ebbe mentsük el a lista tartalmát, soronként az egyes elemeket. Minden sor előbb a termék nevét tartalmazza, majd kettősponttal és szóközzel elválasztva a mennyiséget.

In [10]:
# Bevásárlólista generálása és fájlba írása

# A listát egy szótárban tároljuk el
shopping_list = {}

# Végtelen ciklussal folyamatosan kérjük be a felhasználótól a termék nevét és mennyiségét.
# Kilépni akkor tudunk, ha terméknévnek 0-t ad meg.
while True:
    # Először kérjük a termék nevét, ami mindenképp szöveg.
    item = str(input("Mit szeretne a listához adni?"))
    # Megnézzük, hogy ki kell e lépni.
    # Ha igen, akkor a break utasítással zárjuk a ciklust.
    if item == "0":
        break
    # Ha nem léptünk ki, akkor jöhet a kívánt termék mennyisége. Feltételezzük, hogy egész számot ad meg a felhasználó.
    count = int(input(f"Mekkora mennyiséget szeretnél venni ebből: {item}?"))
    # A megadott értékek alapján frissítjük a szótár tartalmát.
    shopping_list[item] = count

# Létrehozzuk a fájlt írásra. Ha korábban létezett, akkor az eddigi tartalma törlődik.
f = open("MyShoppingList.txt", "w")

# Végig iterálunk a szótár kulcs-érték párjain.
# Most a kulcs (item) a termék neve, és az érték (count) a vásárlandó mennyiség.
for item, count in shopping_list.items():
    # A kívánt módon a  fájlba írjuk. Ügyelünk rá, hogy a végén egy sortörést is elhelyezzünk.
    f.write(f"{item}: {count}\n")

# Ha végeztünk a fájl írásával, akkor bezárjuk a fájlt.
f.close()

Mit szeretne a listához adni? alma
Mekkora mennyiséget szeretnél venni ebből: alma? 10
Mit szeretne a listához adni? ásványvíz
Mekkora mennyiséget szeretnél venni ebből: ásványvíz? 6
Mit szeretne a listához adni? liszt
Mekkora mennyiséget szeretnél venni ebből: liszt? 1
Mit szeretne a listához adni? 0


Ha mindent jól csináltunk, akkor a ```MyShoppingList.txt``` fájl tartalma a következő:

```alma: 10```

```ásványvíz: 6```

```liszt: 1```

## Fájl olvasása

Létező fájl olvasása esetén az ```"r"``` paraméterrel jelezhetjük a szándékunkat. Nyissuk meg olvasásra a korábban létrehozott ```MyShoppingList.txt``` fájlt!

In [11]:
f = open("MyShoppingList.txt", "r")

A fájl teljes tartalmát a ```read``` függvény segítségével tudjuk kiolvasni. Visszatérési értéke egy ```str``` lesz, ami a fájlban található szöveget tartalmazza.

In [12]:
my_shopping_list = f.read()

print(my_shopping_list)

alma: 10
ásványvíz: 6
liszt: 1



Fontos, hogy ezzel a függvénnyel csak egyszer tudjuk kiolvasni a teljes tartalmat. Következő hívásra egy üres szöveget kapunk.

In [13]:
my_shopping_list = f.read()

print(my_shopping_list)
print(len(my_shopping_list))


0


Zárjuk le a fájlt, nyissuk meg újra és nézzünk meg egy másik módszert, ami általában jobban a hasznukra fog válni! A ```readlines``` függvény segítségével a teljes fájl tartalmát szintén be tudjuk olvasni. Azonban most egy listát fogunk visszatérésül kapni, amely eleme a fájl egyes sorait jelképezi. Általában ezzel sokkal könnyebb dolgozni. Jellemzően soronként szeretnénk valamilyen műveletet eszközölni egy fájl tartalmán, ezért eleve jó az számunkra, ha olyan szerkezetben kapjuk vissza a tartalmat, ahol elkülönülnek az egyes sorok.

In [14]:
f.close()

f = open("MyShoppingList.txt", "r")

lines = f.readlines()

f.close()

print(lines)

for line in lines:
    print(line)

['alma: 10\n', 'ásványvíz: 6\n', 'liszt: 1\n']
alma: 10

ásványvíz: 6

liszt: 1



Fontos, hogy a sorvégi sortöréseket tartalmazni fogja a visszakapott lista. Általában erre nincs szükségünk, de már ismerünk több módszert is amikkel könnyen megszabadulhatunk a sortörésektől.

Csinálhatjuk azt, hogy a feldolgozás előtt egyszerű slicing művelettel megválunk tőle:

In [15]:
for line in lines:
    print(line[:-1])

alma: 10
ásványvíz: 6
liszt: 1


Hasonló módon ezt elérhetjük a ```replace``` függvény alkalmazásával is:

In [16]:
for line in lines:
    print(line.replace("\n", ""))

alma: 10
ásványvíz: 6
liszt: 1


De használhatunk comprehension-t is, így előbb megszabadulunk az összes sortöréstől, majd csak utána következik az egyes sorok feldolgozása:

In [17]:
lines = [line[:-1] for line in lines]

for line in lines:
    print(line)

alma: 10
ásványvíz: 6
liszt: 1


#### Feladat: Bevásárlólista olvasása

Készítsünk egy programot, ami a korábban létrehozott bevásárlólista fájlt vissza tudja olvasni és készít belőle egy szótárat ugyanolyan formában, mint ahogy azt a bevásárlólista felvitele során tettük.

In [18]:
# Megnyitjuk a fájlt olvasásra, majd beolvassuk a teljes tartalmát egy listába. Végül zárjuk a fájlt.
f = open("MyShoppingList.txt", "r")
lines = f.readlines()
f.close()

# Kezdetben üres szótár. Ide fogjuk eltárolni a beolvasott adatokat.
my_shopping_list = {}

# Végig megyünk az egyes sorokon
for line in lines:
    # Az idx megadja, hogy hol kezdődik az elválasztó kettőspont és szóköz.
    # Tudjuk, hogy eddig az indexig tart a vásárlandó termék megnevezése.
    idx = line.index(": ")
    # Ez  alapján a termék nevét ki tudjuk nyerni slicing segítségével.
    item = line[:idx]
    # A darabszámot is könnyen elérjük ugyanezzel a technikával.
    # Kezdő pozíciója az idx után van két karakterrel, mivel az idx-en kezdődik a ": " rész-string.
    # Az utolsó karakter a sortörés, erre nincs szükségünk. Ezért nem a végéig indexelünk.
    count = line[idx+2:-1]
    # Egésszé alakítjuk a kinyert adatot.
    count = int(count)
    # Felvesszük a szótárhoz az adott terméket és a mennyiséget.
    my_shopping_list[item] = count

print("Bevásárlólistám:")
for item, count in my_shopping_list.items():
    print(item, count)    

Bevásárlólistám:
alma 10
ásványvíz 6
liszt 1


Vegyük észre, hogy ezt nagyon szépen meg lehet oldani dict comprehension segítségével is!

In [19]:
f = open("MyShoppingList.txt", "r")
lines = f.readlines()
f.close()

my_shopping_list = {line[:line.index(":")]:int(line[line.index(":")+2:-1]) for line in lines} 

print("Bevásárlólistám:")
for item, count in my_shopping_list.items():
    print(item, count)

Bevásárlólistám:
alma 10
ásványvíz 6
liszt 1


#### Feladat: Tarantino

Olvassuk be az ```ea09``` mappából a ```tarantino.csv``` fájlt. A fájl egy [csv formátumú](https://en.wikipedia.org/wiki/Comma-separated_values) adatbázis, amely [Quentin Tarantino](https://hu.wikipedia.org/wiki/Quentin_Tarantino) néhány filmje esetén tartalmazza, hogy:
* Az adott filmben mikor halt meg valaki, és
* az adott filmben mikor és milyen káromkodás hangzott el.

A fájl 4 tulajdonságot rögzít a következő sorrendben:
* Film címe
* Esemény típusa: "word" vagy "death"
* Ha az esemény "word", akkor az elhangzott káromkodás. A tulajdonság "death" esemény esetén üres.
* Az esemény idejét a filmben, percben kifejezve, valós értékként.


A fájl első 10 sora a következő:

```
movie,type,word,minutes_in
Reservoir Dogs,word,dick,0.40
Reservoir Dogs,word,dicks,0.43
Reservoir Dogs,word,fucked,0.55
Reservoir Dogs,word,fucking,0.61
Reservoir Dogs,word,bullshit,0.61
Reservoir Dogs,word,fuck,0.66
Reservoir Dogs,word,shit,0.90
Reservoir Dogs,word,fuck,1.43
Reservoir Dogs,word,dicks,1.56
```

Látjuk, hogy a fájl első sora a fejléc: "movie", "type", "word" és "minutes_in". Utána az egyes rekordok következnek. A tulajdonságokat elválasztó karakter mindenhol a vessző.

Olvassuk be a fájlt, mint szöveges fájlt és a tartalmát tároljuk el egy listában. Így könnyen feldolgozhatóvá válik.

In [20]:
# A fájl megnnyitása olvasásra.
f = open("ea09/tarantino.csv", "r")
# Beolvassuk az összes sorát.
lines = f.readlines()
# Ez után nyugodtan zárhatjuk a fájlt, már nincs rá szükség, hiszen a teljes tartalma a lines listában megtalálható.
f.close()

A ```lines``` lista önmagában még elég kaotikus. Nézzük meg az első 100 bejegyzését:

In [21]:
print(lines[:100])

['movie,type,word,minutes_in\n', 'Reservoir Dogs,word,dick,0.40\n', 'Reservoir Dogs,word,dicks,0.43\n', 'Reservoir Dogs,word,fucked,0.55\n', 'Reservoir Dogs,word,fucking,0.61\n', 'Reservoir Dogs,word,bullshit,0.61\n', 'Reservoir Dogs,word,fuck,0.66\n', 'Reservoir Dogs,word,shit,0.90\n', 'Reservoir Dogs,word,fuck,1.43\n', 'Reservoir Dogs,word,dicks,1.56\n', 'Reservoir Dogs,word,fuck,1.66\n', 'Reservoir Dogs,word,dick,1.75\n', 'Reservoir Dogs,word,dick,1.75\n', 'Reservoir Dogs,word,dick,1.75\n', 'Reservoir Dogs,word,dick,1.75\n', 'Reservoir Dogs,word,dick,1.75\n', 'Reservoir Dogs,word,dick,1.75\n', 'Reservoir Dogs,word,dick,1.75\n', 'Reservoir Dogs,word,dicks,1.75\n', 'Reservoir Dogs,word,motherfucker,1.83\n', 'Reservoir Dogs,word,dick,1.96\n', 'Reservoir Dogs,word,pussy,2.15\n', 'Reservoir Dogs,word,fucks,2.18\n', 'Reservoir Dogs,word,fuck,2.30\n', 'Reservoir Dogs,word,fucking,2.45\n', 'Reservoir Dogs,word,hell,2.48\n', 'Reservoir Dogs,word,fucking,2.51\n', 'Reservoir Dogs,word,fucking,

Most a ```lines``` lista minden eleme egy ```str``` szöveg, ami egy-egy sora a ```tarantino.csv``` fájlnak.

In [22]:
print(lines[0]) # A lista első sora a fejlécet tartalmazza.
print(lines[123]) # A 123. sorban található bejegyzés.

movie,type,word,minutes_in

Reservoir Dogs,word,fucking,26.26



Alakítsuk át a ```lines``` listát úgy, hogy minden eleme egy 4 elemú lista legyen, amely a korábban részletezett 4 tulajdonságot tárolják. Ügyeljünk rá, hogy az első sor (tehát a 0. indexen lévő elem) a fejléc. Ez utóbbit ne tároljuk el.

In [23]:
lines = [line[:-1].split(",") for line in lines[1:]]

Nézzük végig, hogy mi történt a fenti comprehension-ben! A ```for``` ciklus segítségével a ```lines[1:]``` listán iteráltunk végig. Azért ezen és nem a ```lines``` listán, mert annak első sorára nincs szükségünk, az a fejléc. Ezért a slicing művelettel az első sort kihagytuk a listából. Minden lépésben az ```line``` változóba kerül az aktuális sor. Ennek az utolsó karakterére nincs szükségünk, mivel az a sortörés karaktert tartalmazza. Ezért a ```line[:-1]``` szövegrésszel operálunk, szintén a slicing művelet segítségével. Az így kapott szöveget a ```split``` függvény segítségével daraboljuk listává a vessző karakterek mentén. Ez a lista fog minden iterációban belekerülni a comprehension által generált listába, amit el is tárolunk az  eredeti lista helyén (azt felülírva) a ```lines``` változóban.

Nézzük meg most a ```lines``` néhány sorát:

In [24]:
for line in lines[:10]:
    print(line)

['Reservoir Dogs', 'word', 'dick', '0.40']
['Reservoir Dogs', 'word', 'dicks', '0.43']
['Reservoir Dogs', 'word', 'fucked', '0.55']
['Reservoir Dogs', 'word', 'fucking', '0.61']
['Reservoir Dogs', 'word', 'bullshit', '0.61']
['Reservoir Dogs', 'word', 'fuck', '0.66']
['Reservoir Dogs', 'word', 'shit', '0.90']
['Reservoir Dogs', 'word', 'fuck', '1.43']
['Reservoir Dogs', 'word', 'dicks', '1.56']
['Reservoir Dogs', 'word', 'fuck', '1.66']


Látjuk, hogy ez így már sokkal jobban kezelhető. Így már tudunk különféle műveleteket, számításokat végrehajtani a csv fájl tartalmán.

Gyűjtsük ki az összes egyedi káromkodást a filmekből. Azaz minden káromkodás csak egyszer szerepeljen a gyűjteményben. Erre jó megoldás, ha halmazt alkalmazunk, hiszen ez az adatszerkezet garantálja, hogy minden elem csak egyszer szerepelhet.

In [25]:
# A words halmazba gyűjtjük a káromkodásokat.
words = set()

# Ciklussal végig megyünk az egyes sorokon.
for line in lines:
    # A káromkodás a harmadik tulajdonság (2. indexű), ezeket adjuk hozzá a words halmazhoz.
    words.add(line[2])

# Írjuk a kimenetre a halmaz tartalmát.
print(words)

{'', 'assholes', 'dicks', 'hell', 'horseshit', 'chickenshit', 'cunts', 'horeshit', 'jackass', 'motherfucking', 'merde', 'shittiest', 'fuckup', 'gook', 'fuckface', 'motherfuckers', 'shitty', 'cunt', 'asshole', 'asshead', 'negro ', 'faggot', 'bastards', 'slope', 'gooks', 'dick', 'goddamned', 'cockblockery', 'shithead', 'fucker', 'damn', 'fucking', 'jew (verb)', 'fucks', 'pussy', 'shit', 'goddamn', 'cocksucker', 'dickless', 'wetback', 'bitch', 'fuckhead', 'bastard', 'japs', 'shitting', 'slut', 'damned', 'shitload', 'ass', 'motherfucker', 'jap', 'bullshit', 'asses', 'bitches', 'shitless', 'fuckers', 'fuck', 'dumbass', 'n-word ', 'fucked', 'squaw'}


Látjuk, hogy ez így nem az  igazi. Az első eleme egy üres string. Ez azért van, mert az adatbázisunk nem csak káromkodásokat, de haláleseteket is tartalmaz. Haláleset esetén a "word" oszlopban az érték üres szöveg. Ezek miatt van egy üres szöveg a káromkodások listán. Generáljuk újra, de most kicsit okosabban:

In [26]:
# A words halmazba gyűjtjük a káromkodásokat.
words = set()

# Ciklussal végig megyünk az egyes sorokon.
for line in lines:
    # Csak akkor adjuk  a halmazhoz az értéket, ha az adott sor eseménye káromkodás.
    if line[1] == "word":
        # A káromkodás a harmadik tulajdonság (2. indexű), ezeket adjuk hozzá a words halmazhoz.
        words.add(line[2])

# Írjuk a kimenetre a halmaz tartalmát.
print(words)

{'assholes', 'dicks', 'hell', 'horseshit', 'chickenshit', 'cunts', 'horeshit', 'jackass', 'motherfucking', 'merde', 'shittiest', 'fuckup', 'gook', 'fuckface', 'motherfuckers', 'shitty', 'cunt', 'asshole', 'asshead', 'negro ', 'faggot', 'bastards', 'slope', 'gooks', 'dick', 'goddamned', 'cockblockery', 'shithead', 'fucker', 'damn', 'fucking', 'jew (verb)', 'fucks', 'pussy', 'shit', 'goddamn', 'cocksucker', 'dickless', 'wetback', 'bitch', 'fuckhead', 'bastard', 'japs', 'shitting', 'slut', 'damned', 'shitload', 'ass', 'motherfucker', 'jap', 'bullshit', 'asses', 'bitches', 'shitless', 'fuckers', 'fuck', 'dumbass', 'n-word ', 'fucked', 'squaw'}


In [27]:
words_in_movie = {}

for line in lines:
    if line[1] == "word":
        if line[0] in words_in_movie:
            words_in_movie[line[0]] += 1
        else:
            words_in_movie[line[0]] = 1

for title, count in words_in_movie.items():
    print(f"{title}: {count}")

Reservoir Dogs: 421
Pulp Fiction: 469
Kill Bill: Vol. 1: 57
Kill Bill: Vol. 2: 69
Inglorious Basterds: 58
Django Unchained: 262
Jackie Brown: 368


Az eredmények alapján látjuk, hogy a legtöbb káromkodás a Ponyvaregény c. filmben hangzik el.

Nézzük meg, hogy mi a legnagyobb szünet két káromkodás között a Ponyvaregény esetén! Ehhez először gyűjtsük egy listába a káromkodások időpontjait:

In [28]:
times = [float(line[-1]) for line in lines if line[0] ==  "Pulp Fiction" and line[1] == "word"]

for t in times:
    print(t, end=" ")

0.52 0.82 1.37 1.62 1.73 1.77 2.18 2.22 2.28 2.28 2.42 2.45 2.47 2.53 2.6 3.52 3.58 3.67 3.7 4.68 4.75 7.7 7.87 8.25 8.67 8.72 8.72 9.1 10.08 10.17 10.4 10.73 10.75 10.85 10.98 11.52 11.55 11.6 11.6 11.63 11.68 11.83 11.88 11.92 12.03 12.07 12.2 12.27 12.88 12.9 12.92 12.93 12.95 12.97 12.98 13.0 13.23 13.33 13.38 13.43 13.47 16.78 17.4 17.45 18.38 18.4 18.62 19.33 19.57 19.58 19.7 19.82 19.85 19.85 19.95 20.0 21.32 21.42 21.82 21.88 22.03 22.08 22.1 23.07 23.47 23.52 23.7 24.07 24.23 24.4 24.45 24.45 25.08 25.12 25.17 25.28 25.33 25.37 25.42 25.88 25.92 27.75 27.78 27.88 27.98 27.98 28.03 28.08 28.1 28.22 28.3 28.98 29.43 29.47 29.52 29.63 29.65 29.67 29.68 29.82 29.88 29.92 29.92 29.97 34.25 37.02 37.03 41.05 41.05 41.12 41.9 42.1 42.98 43.0 43.03 54.58 54.63 54.67 54.68 54.97 55.0 55.48 55.75 55.83 55.83 55.93 55.93 56.1 56.22 56.28 56.32 56.38 56.45 56.53 56.55 56.55 56.92 56.98 57.02 57.03 57.05 57.12 57.12 57.17 57.18 57.25 57.38 57.45 57.57 57.62 57.63 57.82 57.85 57.85 57.87 57

A fenti comprehension a következők végzi. A ```lines``` elemein iterál végig. Minden iterációban a ```line``` tartalmazza a következő rekordot az adatbázisból. Nekünk csak azok a sorok érdekesek, ahol a film címe a "Pulp Fiction" és az esemény típusa "word". Ezt szűrőfeltételt állítjuk be a comprehension utolsó szakaszában. Az ennek a feltételnek eleget tevő ```line```-oknak nézzük az utolsó elemét, hiszen ez tartalmazza az időpontot, amikor a káromkodás elhangzott. Ezt a ```float``` függvénnyel valós számmá alakítjuk, mivel számolni fogunk  az itt található perc értékekkel. Végeredményben a ```times``` lista ```float``` értékeket fog tartalmazni, ahol minden érték egy percet jelent a Ponyvaregényből, ahol egy káromkodás elhangzott.

Ahhoz, hogy megkapjuk, hogy hol van a legnagyobb szünet két egymás utáni káromkodás között, a következőkre van szükségünk:
* Muszáj, hogy a lista növekvő sorrendben rendezett legyen. Ez egyébként eleve így van, mert az adatbázis időpont szerint rendezve tartalmazza az értékeket. De ha nem így lenne, akkor a ```sort``` segítségével ezt könnyen megtehetjük.
* Végig kell menni a listán és minden két szomszédos elem esetén nézni kell a különbségüket. Azaz, hogy mennyi idő telt el a kettő között. Ezekből az időkből kell nekünk a legnagyobb.

In [29]:
# Most nincs szükség rendezésre, mert az adatbázis eleve idő szerint rendezetten tartalmazza a rekordokat.
# De ha nem így lenne, akkor a sort függvénnyel ezt könnyen megtehetnénk.
#times.sort()

# A max_len tárolja mindig az eddigi leghosszabb szünetet.
# Kezdetben legyen 0, mivel ennél csak hosszabb időket kaphatunk.
max_len = 0
# A max_len_idx változóban tároljuk a hozzá tartozó indexet a times listáról.
# Itt a szünet kezdő idejének helyzetét tároljuk, tehát az első és a második káromkodás közötti szünet kezdete a 0. indexen található.
max_len_idx = 0

# A ciklussal végig járjuk az időket.
# Minden lépésben az i-edik és az (i+1)-edik elmekkel dolgozunk.
# Emiatt nem megyünk a lista végéig, hiszen az utolsó elem esetén az (i+1)-edik érték már nem értelmezett.
for i in range(1, len(times) - 1):
    # Vesszük a két káromkodás között eltelt időt.
    act_len = times[i+1] - times[i]
    # Megnézzük, hogy a most mért távolság nagyobb e, mint az eddigi legnagyobb.
    if act_len > max_len:
        # Ha nagyobb, akkor eltároljuk az új eddigi legnagyobb értékét.
        max_len = act_len
        # Valamint eltároljuk a hozzá tartozó indexet is.
        max_len_idx = i

print(f"Legnagyobb szünet két káromkodás között: {max_len:.2f} perc")
print(f"Ez a film [{times[max_len_idx]}, {times[max_len_idx+1]}] perc intervallumában található.")

Legnagyobb szünet két káromkodás között: 11.55 perc
Ez a film [43.03, 54.58] perc intervallumában található.


Az előző feladatot indexelés használata helyett megoldhatjuk például a ```zip``` függvény használatával is:

In [30]:
max_len = 0

max_len_idx = 0

for t0, t1 in zip(times[:-1], times[1:]):
    act_len = t1 - t0
    if act_len > max_len:
        max_len = act_len
        max_len_idx = i

print(f"Legnagyobb szünet két káromkodás között: {max_len:.2f} perc")
print(f"Ez a film [{times[max_len_idx]}, {times[max_len_idx+1]}] perc intervallumában található.")

Legnagyobb szünet két káromkodás között: 11.55 perc
Ez a film [147.9, 148.15] perc intervallumában található.


Ebben a megközelítésben a ```times[:-1]``` és ```times[1:]``` listákon iteráltunk egyszerre a ```zip``` függvény segítségével. A ```times[:-1]``` segítségével az első elemtől az utolsó előtti elemig megyünk, míg a ```times[1:]``` lista az első elemet hagyja ki, de az utolsóig megy.