# Itereerbare objecten

Bij het gebruik van data hebben we nood aan een ordentelijke manier om deze op te slaan. Indien we zouden beschikken over een 1000-tal meetgegevens, dan spreekt het voor zich dat we hier geen 1000 variabelen voor gaan instantiëren. Een verzameling van deze meetgegevens die we gaan opslaan in één variabele dringt zich dan ook aan. Binnen Python bestaan er verschillende manieren om dit te bewerkstellingen. We noemen deze dan de _itereerbare objecten_. 

## Strings

We hebben wel al gezien hoe we veel karakters kunnen bijhouden, namelijk in een `string`. Een string is op zich dus ook een verzameling van veel karakters. 

### Indexering

Of we nu werken met strings, lijsten of tuples, bij elk van deze verzamelingen zullen we te maken hebben met indexeringen. In de verzameling kunnen we ieder element bereiken door gebruik te maken van de **juiste index**, wat niet anders is dan op te geven in het **hoeveelste element** wij geïnteresseerd zijn. Aangezien wij op een computersysteem zitten is er één addertje onder het gras. **Er wordt altijd geteld vanaf 0!**

Stel dat we uitgaan van de string `VTI-Torhout`, dan zien we meteen dat deze string niets anders is dan een verzameling van 11 karakters. In de verzameling hebben we vervolgens een karakter met index 0, die overeenstemt met de eerste letter van de string, namelijk de `V`. Het tweede karakter, de letter `T`, heeft dan als index 1 enzoverder.

|Verzameling|V|T|I|-|T|o|r|h|o|u|t|
|---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|:---:|
|index|0|1|2|3|4|5|6|7|8|9|10|
||-11|-10|-9|-8|-7|-6|-5|-4|-3|-2|-1|

In bovenstaand voorbeeld is ook een tweede rij met indices toegevoegd, maar dan met negatieve getallen. Een negatief getal laat toe de verzameling van langs achteren te benaderen.

:::{admonition} Opgelet
:class: danger
Index 0 stemt overeen met benaderen van langs voor en betreft de eerste positie. Het eerste negatieve getal dat bestaat is -1 en stemt dusdanig overeen met het laatste karakter van de string.
:::

Als een string is opgeslagen in een variabele, dan kun je de individuele letters van de string benaderen via de variabele naam en de index van de gevraagde letter tussen vierkante haken `[]` rechts ernaast.

In [1]:
myStr = "VTI-Torhout"
print(f"De 7de letter bedraagt \"{myStr[6]}\"")

De 7de letter bedraagt "r"


(slicing-target)=
Naast enkele indices om letters in een string te benaderen, kun je ook substrings van een string benaderen (we noemen dit ook _slicing_) door twee getallen tussen vierkante haken te zetten met een dubbele punt `:` ertussen.
- De eerste van deze getallen is de index waar de substring start.
- Het tweede getal is waar de substring eindigt.
- De substring is exclusief de letter die hoort bij de tweede index.
- Door het linkse getal weg te laten geef je aan dat de substring begint bij de start van de string (dus bij index 0).
- Door het rechtergetal weg te laten geef je aan dat de substring eindigt met het laatste teken van de string (inclusief dit laatste teken).

In [2]:
print(myStr[0:3])
print(myStr[:3])
print(myStr[4:11])
print(myStr[4:])

VTI
VTI
Torhout
Torhout


Optioneel kan er nog een 3de waarde opgegeven worden bij het _slicen_, namelijk de _step_ waarde. Stel dat we van een string alle $k^{3n}$ karakters willen:

In [3]:
print(myStr[::3])

V-ru


Negatieve waarde voor de _step_ zijn ook toegelaten. Volgend voorbeeld geeft de string in omgekeerde volgorde:

In [4]:
print(myStr[::-1])

tuohroT-ITV


### Methodes

Indien wij controleren wat het type variabele is van `myStr` krijgen wij het volgende:

In [5]:
print(type(myStr))

<class 'str'>


We kunnen hier opmerken dat dit een _klasse_ betreft. Op een klasse kunnen wij meestal verschillende methoden toepassen. Je kan deze aanroepen via de `.` operator die je laat volgen op een _object_ van de desbetreffende klasse. In ons voorbeeld kan dit via `myStr.<methode_naam>`. Voor de klasse `str` zijn volgende methoden beschikbaar:

1. `lower()`:  Zet een string om in kleine letters (de haakjes verwachten geen argument, maar methodes hebben altijd haakjes nodig om uitgevoerd te worden). Het spreekt voor zich dat er ook een `upper()` is die alles in hoofdletters zet.
2. `index(<substring>)`: Bepaalt op welke plaats een substring voor het eerst start in een string. Als optionele argumenten kan je twee getallen meegeven die bepalen van waar tot waar gezocht moet worden. Zie hiervoor _[slicing](#slicing-target)_.
3. `strip()`: Verwijdert spaties aan het begin en einde van een string, inclusief eventuele _newline_ tekens en andere tekens die als spaties gezien kunnen worden. Als je iets anders dan spaties wilt verwijderen, kun je als parameter een string meegeven die bestaat uit alle te verwijderen tekens. Deze worden _gestript_ aan het begin en einde van de string totdat een karakter voorkomt die niet in de meegegeven string staat.
4. `split()`: Splitst een string in delen. Hier zou je een argument kunnen invoeren (namelijk het scheidingsteken of delimiter), maar standaard wordt er gesplitst op spaties. Het resultaat van deze opsplitsing is een [lijst](#list-target) van woorden.
5. `join()`: De tegenhanger van `split()`. `join()` plakt een lijst van woorden aaneen tot een string, waarbij de woorden in de string van elkaar gescheiden zijn middels een specifieke separator, namelijk de string waarop de `join()` methode wordt toegepast. De parameter die je met de methode meegeeft betreft een lijst van woorden. De retourwaarde is de resulterende string.
6. `replace(<substring 1>,<substring 2>)`: Vervangt alle instanties van substring 1 in een string door substring 2. Optioneel kan een derde, numerieke parameter meegegeven worden die aangeeft hoe vaak een vervanging moet plaatsvinden.


In [6]:
print(myStr.lower())
print(myStr.upper())
print(myStr.strip("VTI-"))
myList = myStr.split('-')
print(myList)
print(" ".join(myList))
print(myStr.replace('t','k'))

vti-torhout
VTI-TORHOUT
orhout
['VTI', 'Torhout']
VTI Torhout
VTI-Torhouk


(list-target)=
## Lijsten en tuples

### Inleiding

Omdat ze zo sterk verwant zijn behandelen we _tuples_ en _lijsten_ samen. Lijsten en tuples zijn itereerbare objecten die dus een groep van elementen bevatten. Deze groep moet niet per se bestaan uit dezelfde datatypes. Het vormelijk onderscheid tussen een lijst en een tuple wordt gemaakt door de soort haakjes bij het invoeren:
* Ronde haakjes `(<items>)` dienen voor een _tuple_
* Vierkante haakjes `[<items>]` dienen voor een _list_

:::{admonition} Opgelet
:class: caution
Achter de schermen worden deze door Python anders behandeld. **Tuples** zijn **onveranderlijk** terwijl lijsten op elk ogenblik kunnen gewijzigd worden in het programma. Werken met tuples gaat daarom sneller dan met lijsten (minder processor intensief).
:::

In [7]:
myTuple = ("string", 123, True);
myList = ["string", 123, True];

### Indexering

Je gebruikt elementen uit een lijst of een tuple precies zoals je dat doet met een string. Door het element te indexeren. De indices werken dan ook op dezelfde manier als bij strings. _Slicing_ is hier eveneens mogelijk.

In [8]:
print(myTuple[1])
print(myList[:2])

123
['string', 123]


Merk op dat we bij een list ook terug heel eenvoudig de waarden kunnen gaan aanpassen. Bij een tuple lukt dit niet:

In [9]:
myList[2] = False
myTuple[2] = False

TypeError: 'tuple' object does not support item assignment

(divmod-target)=
* Als je een functie hebt die meerdere waarden teruggeeft, zal deze altijd de verschillende waarden in een tuple plaatsen. _Dit is reeds kort aangehaald bij de geheel getal delingen en de modulo operator. De methode `divmod()` geeft hierbij het resultaat van de geheel getal deling als eerste element terug en het resultaat van de modulo als tweede element van de tuple._
* Aan een lijst kun je ook zaken toevoegen via de _concatentatie_ operator. _Opgelet met itereerbare items. Deze zullen als aparte elementen worden toegevoegd. Bij het toevoegen van een string zal ieder karakter apart worden toegevoegd!_

In [10]:
print(divmod(5,2)) #Deel 5 door 2
myList += ["Sint-Aloysius"] #Voeg een nieuwe element toe
print(myList)

(2, 1)
['string', 123, False, 'Sint-Aloysius']


### Functies

Voor tuples en lijsten zijn er enkele functies beschikbaar die als parameter een tuple/lijst aanvaarden. 
1. `len(<object>)` geeft het aantal elementen in de lijst/tuple.
2. `max(<object>)` geeft het maximum van een lijst/tuple van getallen. Eveneens bestaat hier de functie `min(<object>)` die dan natuurlijk het minimum geeft.
3. `sum(<object>)` berekent de som van een lijst/tuple van getallen. _Merk op dat dit een functie is die je eveneens zelf eenvoudig kan gaan opstellen aan de hand van een herhaling._

:::{admonition} Opgelet
:class: note
Alvorens je deze functies kan gebruiken, moet je lijst/tuple natuurlijk wel gedefinieerd zijn! Je kan altijd een lege lijst/tuple gaan aanmaken door niets binnen de haakjes (`()` voor een tuple, `[]` voor een lijst) te plaatsen. 
:::

### Methodes

:::{admonition} Opgelet
:class: note
De hieronder opgesomde methoden zijn enkel van toepassing op lijsten (tenzij anders vermeld). De reden hiervoor is dat enkel lijsten aanpasbaar zijn, en veel van deze methoden een wijziging aan de lijst doorvoeren. 
:::

1. `<lijst>.append(<object>)` voegt een element toe aan het einde van de lijst. Dit hoeft geen lijst te zijn. Indien je hier een lijst toevoegt zal er in de lijst een extra lijst worden opgenomen (één niveau dieper). Indien je een lijst wil toevoegen aan het einde van de lijst gebruik je de methode `extend` (zie hieronder).

In [11]:
myList = ["koen",39]
myList.append("TW&E")
myList.append(["test",123])
print(myList)

['koen', 39, 'TW&E', ['test', 123]]


2. `<lijst1>.extend(<lijst2>)` maakt een lijst langer door alle elementen van een tweede lijst aan het einde van de eerste lijst toe te voegen. Hier wordt de inhoud van de tweede lijst object per object _ge-append_ aan de eerste lijst. _Op de achtergrond wordt doorheen de lijst, die itereerbaar is, gelopen._
3. `<lijst>.insert(<positie>,<object>)` voegt een object toe op een gekozen positie binnen de lijst waarop de methode wordt toegepast.
4. `<lijst>.remove(<object>)` laat je een object van de lijst verwijderen. Het object dat je wil verwijderen geef je mee als argument. Als dit element meerdere keren voorkomt in de lijst, wordt de eerste instantie (die met de laagste index) verwijderd. Als je een element probeert te verwijderen dat niet voorkomt in de lijst volgt er een runtime error.
5. `<lijst>.pop(<positie>)` verwijdert een object op een specifieke positie. Als geen argument wordt meegegeven, wordt het laatste object van de lijst verwijderd. Als een positie wordt meegegeven die buiten het bereik van de lijst valt, volgt een runtime error. _De methode retourneert het verwijderde object._
6. `<lijst>.index(<object>)` retourneert de index van de eerste instantie in een lijst/tuple van het object dat als argument aan de methode is meegegeven. Een runtime error volgt als het object niet voorkomt in de lijst/tuple.
7. `<lijst>.count(<object>)` retourneert een integer die aangeeft hoe vaak het object dat als argument is meegegeven voorkomt in de lijst/tuple. _Opgelet dat je deze methode niet verwart met de functie `len(<lijst>/<tuple>)!`
8. `<lijst>.sort()` sorteert de elementen van de lijst, van laag naar hoog. Als de objecten strings zijn, betreft het een alfabetische sortering. Als de objecten getallen zijn, betreft het een numerieke sortering. Om van hoog naar laag te sorteren, kun je een argument `reverse = True` meegeven of de methode `<lijst>.reverse()` gebruiken. _Het sorteren zelf is iets die vrij complex is. Hoe zal er gesorteerd worden wanneer de lijst verschillende data types van objecten bevat? Het is soms beter dit te doen met een zelf geschreven methode a.d.h.v. [`key` en `lambda` functie](https://blogboard.io/blog/knowledge/python-sorted-lambda/), gecombineerd met de functie `sorted(<object>).`_ 

In [12]:
print(myList)
print(myList.pop(3)) #verwijder de lijst in de lijst, de methode retourneert wat verwijderd is
print(myList)
myList.extend(["test",123])
print(myList)
myList.insert(1,"geeraert")
print(myList)
myList.remove("test")
print(myList)

['koen', 39, 'TW&E', ['test', 123]]
['test', 123]
['koen', 39, 'TW&E']
['koen', 39, 'TW&E', 'test', 123]
['koen', 'geeraert', 39, 'TW&E', 'test', 123]
['koen', 'geeraert', 39, 'TW&E', 123]


## Dictionaries

