# Hoofdstuk 6: Strings

In dit hoofdstuk leer je hoe je met tekstuele informatie omgaat en hoe je teksten kunt manipuleren.
In programmeeromgevingen worden teksten weergegeven door strings. Dit hoofdstuk
geeft details over strings en over functies die beschikbaar zijn om strings aan te pakken.

## 6.1 Introductie

We hebben strings reeds kort geïntroduceerd. Een string is een tekst, omsloten door enkele of dubbele aanhalingstekens. Een string mag een willekeurige lengte
 hebben, inclusief nul tekens lang. Twee strings kan je aan
elkaar kunt plakken, concateneren, met behulp van de +, en je kan een string herhalen door middel van de *. Bijvoorbeeld:

In [None]:
def main():
    s1 = "appel"
    s2 = ' banaan '
    print(s1)
    print(s2)
    print(s1 + s2)
    print(3 * s1)
    print(s2 * 3)
    print(2 * s1 + 2 * s2)

if __name__== "__main__":
    main()

### 6.1.1 len()

**len()** is een basisfunctie die één parameter krijgt en die de lengte van die parameter
teruggeeft. Je kan bijvoorbeeld een string variabele als parameter aan de functie **len()**
geven, en het resultaat van de functie is dan de lengte van de string.

**Opgave 6.1** Wat print de code hieronder? Controleer of je vermoeden klopt.

In [None]:
def main():
    print(len('man'))
    print(len('mango'))
    print(len("")) # "" is een lege string

if __name__== "__main__":
    main()

**Opgave 6.2** En wat denk je van de code hieronder? Denk goed na voor je een antwoord
geeft.

In [None]:
def main():
    print(len('mango\'s'))
    print(len('mango is lekker'))

if __name__== "__main__":
    main()

### 6.1.2 format()

De **format()** methode (laten we de correcte benaming gebruiken, het is geen functie
maar een methode) wordt als volgt aangeroepen: 
```
<string>.format()
```
Het resultaat is een nieuwe string, die een geformatteerde versie is van de string waarvoor de methode
is aangeroepen. **format()** kan een willekeurig aantal parameters meekrijgen, die in de
geformatteerde string ingebracht kunnen worden op specifieke plaatsen.
De plaatsen waar **format()** de parameter waardes in de string plaatst worden in de string
aangegeven middels accolades ({ en }). Als je alleen {} gebruikt om de parameters aan te
duiden, worden ze van links naar rechts afgehandeld. 

Bijvoorbeeld:

In [None]:
print("De eerste drie getallen zijn {}, {} en {}.".format("een", "twee", "drie"))

Als je ze in een andere volgorde wilt afhandelen, kun je de volgorde bepalen door een getal
tussen de acolades te zetten. De eerste parameter is nummer 0, de tweede nummer 1, de
derde nummer 2, etcetera (als je het vreemd vindt om nummering te beginnen bij nul, weet
dan dat dat gebruikelijk is in programmeertalen, en dat je het nog vaker zult tegenkomen
in dit boek). Bijvoorbeeld:

In [None]:
print("Achterwaarts zijn ze {2}, {1} en {0}.".format("een", "twee", "drie"))

**format()** kan variabelen van ieder type verwerken, zolang ze maar een fatsoenlijke string
representatie hebben. Bijvoorbeeld, **format()** kan getallen verwerken en zelfs verschillende
soorten data types mixen:

In [None]:
print("De eerste drie getallen zijn {}, {} en {}.".format(1, "twee", 3.0))

Als je de parameters op een specifieke manier wil formatteren, zijn daar mogelijkheden
voor, als je een dubbele-punt (:) tussen de accolades zet, na het volgorde-nummer als je
dat gebruikt, met rechts van de dubbelpunt formatteringsinstructies. 

Eerst enkele instructies voor string parameters. Als je een bepaalde hoeveelheid tekens
wilt reserveren voor een string, dan kun je dat aangeven met een integer rechts van de
dubbele-punt. Dit wordt de “precisie” genoemd. De volgende code gebruikt een precisie
van 7.

In [None]:
print("De eerste drie getallen zijn {:7}, {:7} en {:7}.".format("een", "twee", "drie"))

Als de precisie te kort is voor de lengte van de string, neemt format() gewoon meer ruimte
voor de string. Je kunt de precisie dus niet gebruiken om een string voortijdig af te breken.

In [None]:
print("De eerste drie getallen zijn {:2}, {:2} en {:2}.".format("een", "twee", "drie"))

Als je precisie gebruikt, kun je de parameter links uitlijnen, centreren of rechts uitlijnen
in de ruimte die je hebt gereserveerd. Dat doe je door een “alignment” teken te plaatsen
tussen de dubbele punt en de precisie. Deze “alignment” tekens zijn < voor links uitlijnen,
^ voor centreren en > voor rechts uitlijnen.

In [None]:
print("De eerste drie getallen zijn {:<7}, {:^7} en {:>7}.".format("een", "twee", "drie"))

We gaan nu verder met formatteringsinstructies voor getallen. Als je een getal wilt laten interpreteren
als een integer, moet je de kleine letter “d” plaatsen rechts van de dubbele punt
(“d” staat hierbij voor “decimaal”). Wil je dat het getal wordt geïnterpreteerd als een float,
dan moet je een “f” plaatsen rechts van de dubbele-punt. **format()** maakt de juiste conversie
voor je als dat kan. Je kunt echter niet van een float een integer maken, want dat
veroorzaakt een runtime error.

In [None]:
def main():
    print("{} gedeeld door {} is {}".format(1, 2, 1 / 2))
    print("{:d} gedeeld door {:d} is {:f}".format(1, 2, 1 / 2))
    print("{:f} gedeeld door {:f} is {:f}".format(1, 2, 1 / 2))

if __name__== "__main__":
    main()

Net als bij strings, kun je voor getallen precisie en uitlijning gebruiken. Dit doe je op
dezelfde manier. En net als bij strings geldt dat als de precisie niet voldoende groot is, de
functie gewoon de ruimte neemt die nodig is. Let erop dat een eventueel min-teken en een
eventuele punt in een float ook plaats nodig hebben.
Tenslotte, en misschien het meest nuttig, kun je aangeven met hoeveel decimalen een float
getoond moet worden, door een punt en een getal te plaatsen links van de letter “f.” De
**format()** methode zal het getal afronden tot het juiste aantal decimalen. Merk op dat je
ook mag aangeven dat je nul decimalen wilt zien door .0 te gebruiken, wat ervoor zal
zorgen dat een float wordt getoond als een integer.

In [None]:
def main():
    s = "{:>5d} keer {:>5.2f} is {:>5.2f}"
    print(s.format(1, 3.75, 1 * 3.75))
    print(s.format(2, 3.75, 2 * 3.75))
    print(s.format(3, 3.75, 3 * 3.75))
    print(s.format(4, 3.75, 4 * 3.75))
    print(s.format(5, 3.75, 5 * 3.75))

if __name__== "__main__":
    main()

### 6.1.3 for loop

Met een **for** loop kunnen alle tekens in een string doorlopen worden.

In [None]:
def main():
    s1 = "mango"
    s2 = "banaan"
    for letter in s1:
        if letter in s2:
            print(s1, "en", s2, "bevatten beide de letter", letter)
        
if __name__== "__main__":
    main()

## 6.2 Strings over meerdere regels

In Python kunnen strings meerdere regels beslaan. Dat kan nuttig zijn wanneer je een
erg lange string in je programma hebt of als je de output van de string op een specifieke
manier wilt formatteren. Dit kan op twee manieren bereikt worden:
+ Met enkele of dubbele aanhalingstekens en een indicatie dat de string doorloopt op
de volgende regel door een backslash aan het einde van de regel te zetten.
+ Met drievoudige enkele of dubbele aanhalingstekens.

Eerst tonen we hoe het werkt met enkele of dubbele aanhalingstekens om de string:

In [None]:
def main():
    langestring = "De drie musketiers zijn Aramis, Athos en Porthos. Hoewel ze bekend staan als \
de drie musketiers spelen hun avonturen zich af met vier personen. De vierde musketier is \
waarschijnlijk zelfs de bekendste: D'Artagnan. Hun beroemde motto was: \"Eén voor allen, allen \
voor één!\" De belangrijkste verhaallijn is het complot van de op macht beluste kardinaal \
Richelieu die gebruik wil maken van de onervarenheid van de jonge koning Lodewijk XIII. \
Door de koning en zijn vrouw in diskrediet te brengen hoopt hij de koning tot aftreden te \
dwingen waarop hij zelf het leger kan aanvoeren om de hugenoten aan te vallen en de oorlog \
te verklaren aan Engeland."
    print(langestring)

if __name__== "__main__":
    main()

Als je deze code uitvoert, zie je dat Python de string als een geheel interpreteert. De backslash
(`\`) die aangeeft dat de string verder gaat op de volgende regel is algemener bruikbaar
dan alleen voor strings: je kunt hem achter ieder Python statement zetten om aan te geven
dat het statement verder gaat op de volgende regel. Dat kan nuttig zijn bij bijvoorbeeld
lange berekeningen.

De aanbevolen manier om strings over meerdere regels te spreiden in Python is echter het
gebruik van drievoudige aanhalingstekens. We hebben reeds eerder gezien dat
je die gebruikt om lange commentaar in de code op te nemen, maar feitelijk komt het erop
neer dat je dan een lange string midden in je programma zet. Zo’n string doet niks, tenzij
je hem aan een variabele toekent. Hier is een voorbeeld van een string met drievoudige
dubbele aanhalingstekens:

In [None]:
def main():
    langestring = """De drie musketiers zijn Aramis, Athos en Porthos. Hoewel ze bekend staan als
de drie musketiers spelen hun avonturen zich af met vier personen. De vierde musketier is
waarschijnlijk zelfs de bekendste: D'Artagnan. Hun beroemde motto was: \"Eén voor allen, allen
voor één!\" De belangrijkste verhaallijn is het complot van de op macht beluste kardinaal    
Richelieu die gebruik wil maken van de onervarenheid van de jonge koning Lodewijk XIII.
Door de koning en zijn vrouw in diskrediet te brengen hoopt hij de koning tot aftreden te
dwingen waarop hij zelf het leger kan aanvoeren om de hugenoten aan te vallen en de oorlog
te verklaren aan Engeland."""
    print(langestring)

if __name__== "__main__":
    main()

Het opvallende verschil tussen deze twee voorbeelden is dat in het eerste voorbeeld de
string beschouwd werd als een lange, doorlopende serie tekens, terwijl in het tweede voorbeeld
de verschillende regels op meerdere regels geprint wordt. De reden dat dat gebeurt
in het tweede voorbeeld is dat er een onzichtbaar teken staat aan het einde van iedere regel,
dat aangeeft dat Python naar een nieuwe regel moet gaan voordat verder geprint wordt.
Dit is een zogeheten “newline” teken en je kunt het expliciet in een string opnemen, door
gebruik te maken van de code "\n". Deze code moet je niet lezen als twee tekens, de backslash
en de "n", maar als een enkel “newline” teken. Je kunt met dit teken ervoor zorgen
dat de output over meerdere regels geprint wordt. Dat kan zelfs als je de backslash aan het
einde van een regel zet om aan te geven dat de string over meerdere regels verspreid is, als
in het eerste voorbeeld. Bijvoorbeeld:

In [None]:
def main():
    shakespeare = "ROMEO\n\
She speaks.\n\
O, speak again, bright angel! For thou art\n\
As glorious to this night, being o'er my head,\n\
As is a winged messenger of heaven\n\
Unto the white, upturned, wondering eyes\n\
Of mortals that fall back to gaze on him\n\
When he bestrides the lazy-puffing clouds\n\
And sails upon the bosom of the air.\n\
JULIET\n\
O Romeo, Romeo! Wherefore art thou Romeo?\n\
Deny thy father and refuse thy name.\n\
Or, if thou wilt not, be but sworn my love,\n\
And I’ll no longer be a Capulet."
    print(shakespeare)

if __name__== "__main__":
    main()

## 6.3 Tekens in een string

Je weet al dat een string een verzameling is van tekens in een specifieke
volgorde. Je kunt de individuele tekens van een string door middel van indices benaderen.

### 6.3.1 String indices

Ieder teken in een string heeft een positie, en die positie kun je weergeven door de index. 
De indices beginnen bij 0 en lopen op tot aan de lengte van de
string. Hieronder zie je het woord “python” op de eerste regel, met op de tweede en derde
regel indices voor ieder teken in deze string:
<table>
    <tr><td>p</td><td>y</td><td>t</td><td>h</td><td>o</td><td>n</td></tr>
    <tr><td>0</td><td>1</td><td>2</td><td>3</td><td>4</td><td>5</td></tr>
    <tr><td>-6</td><td>-5</td><td>-4</td><td>-3</td><td>-2</td><td>-1</td></tr>
</table>
    
Zoals je kunt zien, kun je positieve indices gebruiken die beginnen met 0 bij de eerste letter
van de string en die oplopen tot het einde van de string. Je kunt ook negatieve indices
gebruiken, die starten met -1 bij de laatste letter van de string en die aflopen totdat de
eerste letter van de string bereikt is.
De lengte van een string `s` kun je berekenen met `len(s)`; de laatste letter van de string
heeft dus index `len(s)-1`. Met negatieve indices heeft de eerste letter van de string de
index `-len(s)`.

Als een string is opgeslagen in een variabele, dan kun je de individuele letters van de string
benaderen via de variabele naam en de index van de gevraagde letter tussen vierkante
haken ([ ]) rechts ernaast.



In [None]:
def main():
    fruit = "aardbei"
    print(fruit[4])
    print(fruit[2])
    print(fruit[1])
    print(fruit[-4])
    print(fruit[-2])
    print(fruit[-5])
    print(fruit[-1])
    print(fruit[5])

if __name__== "__main__":
    main()

Je mag ook variabelen als indices gebruiken, en zelfs berekeningen of functie-aanroepen.
Je moet er echter altijd voor zorgen dat berekeningen leiden tot integers, want floats kunnen
niet als indices gebruikt worden. Hieronder staan een paar voorbeelden, waarvan de
meesten zo ingewikkeld zijn dat er eigenlijk geen reden is om ze op deze manier in een programma
te zetten. Maar ze laten wel zien wat de mogelijkheden zijn.

In [None]:
def main():
    fruit = "aalbes"
    x = 3
    print(fruit[3 - 2])
    print(fruit[int(7 / 2)])
    print(fruit[2 ** 2] )
    print(fruit[int((x - len(fruit)) / 3)])
    print(fruit[-len(fruit)])
    print(fruit[-x])

if __name__== "__main__":
    main()

In principe mag je een index ook gebruiken bij een string die niet in een variabele staat,
bijvoorbeeld, `"aalbes"[3]` is de letter "b". Het mag duidelijk zijn dat niemand dat ooit
doet.

Naast enkele indices om letters in een string te benaderen, kun je ook substrings van een
string benaderen door twee getallen tussen vierkante haken te zetten met een dubbele punt
(:) ertussen. De eerste van deze getallen is de index waar de substring start, de tweede waar
de substring eindigt. De substring is exclusief de letter die hoort bij de tweede index. Door
het linkergetal weg te laten geef je aan dat de substring begint bij de start van de string
(dus bij index 0). Door het rechtergetal weg te laten geef je aan dat de substring eindigt
met het laatste teken van de string (inclusief dit laatste teken).
Als je probeert een teken van een string te benaderen met een index die buiten de string
valt, krijg je een runtime error (“index out of bounds”). Als je een substring probeert te
benaderen geldt die beperking niet; het is toegestaan om getallen te gebruiken die buiten
het bereik van de string vallen.

In [None]:
def main():
    fruit = "aalbes"
    print(fruit[:])
    print(fruit[0:])
    print(fruit[:6])
    print(fruit[:100])
    print(fruit[:len(fruit)])
    print(fruit[1:-1])
    print(fruit[2], fruit[1:6])

if __name__== "__main__":
    main()

### 6.3.2 Strings doorlopen

Je hebt reeds in hoofdstuk 4 gezien hoe je de tekens van een string kunt doorlopen door een **for**
loop te gebruiken:

In [None]:
def main():
    fruit = 'appel'
    for teken in fruit:
        print(teken, '- ', end='')
    
if __name__== "__main__":
    main()

Nu je indices begrijpt, realiseer je je waarschijnlijk wel dat je die ook kunt gebruiken om
een string te doorlopen:

In [None]:
def main():
    fruit = 'appel'
    for i in range(0, len(fruit)):
        print(fruit[i], "-", end="")
    print()
    i = 0
    while i < len(fruit):
        print(fruit[i], " - ", end="")
        i += 1
    
if __name__== "__main__":
    main()

Als je voldoende hebt aan toegang krijgen tot de individuele tekens in de string, is de eerste
methode, waarbij de constructie `for <teken> in <string>` wordt gebruikt, verreweg het
meest elegant en leesbaar. Maar soms moet je een probleem oplossen waarbij een andere
methode nodig is.

**Opgave 6.3** Schrijf een programma dat van een string de indices print van alle klinkers (a,
e, i, o, en u).

**Opgave 6.4** Schrijf een programma waarbij je twee string-variabelen aanmaakt en voor ieder teken in de eerste
string dat in de tweede string precies hetzelfde teken heeft op precies dezelfde index,
druk je het teken en de index af.

**Opgave 6.5** Schrijf een functie die een string als argument krijgt, en die dan een nieuwe
string retourneert die hetzelfde is als het argument, maar waarbij ieder teken dat geen
letter is vervangen is door een spatie (bijvoorbeeld, de uitdrukking "ph@t l00t" wordt
gewijzigd in "ph t l t").

### 6.3.3 Substrings met stappen

Substrings kunnen behalve een index voor begin en einde een derde argument krijgen,
namelijk stapgrootte. Dit argument werkt equivalent aan het derde argument voor de
**range()** functie. De syntax voor substrings is `<string>[<begin>:<einde>:<stap>]`. Indien
niet opgegeven, is de stapgrootte 1.

Een veelgebruikte toepassing van de stapgrootte is het gebruik van een negatieve waarde
om de string te inverteren.

In [None]:
def main():
    fruit = "banaan"
    print(fruit[::2])
    print(fruit[1::2])
    print(fruit[::-1])
    print(fruit[::-2])

if __name__== "__main__":
    main()

Het inverteren van een string via `[::-1]` is conceptueel gelijk aan het doorlopen van de
string vanaf het laatste teken tot het eerst met achterwaartse stappen van grootte 1.

In [None]:
def main():
    fruit = "banaan"
    print(fruit[::-1])
    for i in range(5, -1, -1):
        print(fruit[i])
    
if __name__== "__main__":
    main()

## 6.4 Strings zijn onveranderbaar

Een kerneigenschap van strings is dat ze onveranderbaar (Engels: “immutable”) zijn. Dit
betekent dat strings niet kunnen wijzigen. Bijvoorbeeld, je kunt niet een teken in een string
wijzigen door er een nieuwe waarde aan toe te kennen. Ter demonstratie: de volgende
code leidt tot een runtime error als je hem probeert uit te voeren:

In [None]:
def main():
    fruit = "aaldbei"
    fruit[2] = "r" # Runtime error!
    print(fruit)

if __name__== "__main__":
    main()

Als je een wijziging wilt maken in een string, moet je een nieuwe string maken die de
wijziging omvat; je kunt daarna de nieuwe string toekennen aan de bestaande variabele
als je wilt. Bijvoorbeeld:

In [None]:
def main():
    fruit = "aaldbei"
    fruit = fruit[:2] + "r" + fruit[3:]
    print(fruit)

if __name__== "__main__":
    main()

De reden waarom strings onveranderbaar zijn, is te technisch om hier te bespreken. Onthoud
alleen dat als je een string wilt wijzigen, je geen nieuwe waarde kunt toekennen aan
een individueel teken uit de string. In plaats daarvan moet je de variabele die de string
bevat geheel overschrijven.

## 6.5 string methodes

Er is een aantal methodes beschikbaar die ontworpen zijn om strings te bewerken. Al deze
methodes worden toegepast op een string om een operatie uit te voeren. Omdat strings
onveranderbaar zijn, zullen deze methodes nooit de string waarop ze werken wijzigen,
maar ze retourneren in plaats daarvan een gewijzigde versie van de string.
Net als de **format()** methode worden al de string methodes
aangeroepen via de syntax `<string>.<methode>()`, met andere woorden, je specificeert
de string waarop de methode moet werken, gevolgd door een punt, gevolgd door
de methode.

### 6.5.1 strip()

**strip()** verwijdert spaties aan het begin en einde van een string, inclusief eventuele “newline”
tekens en andere tekens die als spaties gezien kunnen worden. Als je iets anders dan
spaties wilt verwijderen, kun je als parameter een string meegeven die bestaat uit alle te
verwijderen tekens.

In [None]:
def main():
    s = " En nu iets heel anders \n "
    print("[" + s + "]")
    s = s.strip()
    print("[" + s + "]")

if __name__== "__main__":
    main()

### 6.5.2 upper() en lower()

**upper()** creëert een versie van een string met alle letters als hoofdletters. **lower()** werkt
op dezelfde manier, maar maakt van alle letters kleine letters. Geen van beide methodes
heeft parameters.

In [None]:
def main():
    s = "The Meaning of Life"
    print(s)
    print(s.upper())
    print(s.lower())

if __name__== "__main__":
    main()

### 6.5.3 find()

**find()** kun je gebruiken om in een string te zoeken naar de start-index van een bepaalde
substring. Als parameter krijgt de methode de gezochte substring. Optioneel kan een
tweede, numerieke parameter meegegeven worden die aangeeft bij welke index gestart
moet worden met zoeken. Een optionele derde, numerieke parameter is de index waarbij
het zoeken moet stoppen. Je krijgt de laagste index waarbij de substring gevonden wordt
terug, of -1 als de substring niet voorkomt.

In [None]:
def main():
    s = "Humpty Dumpty zat op de muur"
    print(s.find("zat"))
    print(s.find("t"))
    print(s.find("t", 12))
    print(s.find("q"))

if __name__== "__main__":
    main()

### 6.5.4 replace()

**replace()** vervangt alle instanties van een substring in een string door een andere substring.
Als parameters krijgt het de substring die gezocht wordt, en de substring die als
vervanging dient. Optioneel kan een derde, numerieke parameter meegegeven worden
die aangeeft hoe vaak een vervanging moet plaatsvinden.

We benadrukken nog even dat strings onveranderbaar zijn, dus de **replace()** functie
doet geen vervangingen in de string; hij geeft een nieuwe string terug die een
kopie is van de originele string, waarbij de vervangingen zijn uitgevoerd.

In [None]:
def main():
    s = 'Humpty Dumpty zat op de muur'
    print(s.replace(' zat op ', ' viel van '))

if __name__== "__main__":
    main()

### 6.5.5 split()

**split()** splitst een string op in woorden, gebaseerd op een gegeven teken of substring die
als separator beschouwd wordt. De separator is een parameter en als die niet is opgegeven,
is de separator de spatie, wat inhoudt dat je een string inderdaad opsplitst in de afzonderlijke
woorden (waarbij leestekens die aan woorden vastzitten beschouwd wordt als een
onderdeel van de desbetreffende woorden). Als de separator meerdere keren naast elkaar
staat, dan worden de extra separatoren genegeerd (dat wil zeggen dat met spaties als separator,
het niet uitmaakt of er tussen twee woorden één spatie staat, of meerdere).
Het resultaat van deze opsplitsing is een “lijst” van woorden. Zoals je reeds weet kun je de afzonderlijke
woorden in de lijst benaderen met de constructie `for <woord> in <lijst>`.

In [None]:
def main():
    s = 'Humpty Dumpty zat op de muur'
    lijst = s.split()
    for woord in lijst:
        print(woord)
    
if __name__== "__main__":
    main()

Je kan de **split()** methode ook gebruiken met een parameter. De parameter is dan om aan te geven welk karakter je wil gebruiken voor het opsplitsen van de string. Bijvoorbeeld, voor een tekst waarbij verschillende waardes gescheiden zijn door een komma kan je de **split()** methode als volgt gebruiken:

In [None]:
def main():
    csv = "2018,september,28,Data Processing,Hogeschool PXL"
    waardes = csv.split(',')
    for waarde in waardes:
        print( waarde )
    
if __name__== "__main__":
    main()

### 6.5.6 Oefening

**Opgave 6.6** In de string "Barbara had een bar, waar ze rabarbar verkocht, en die
daarom de rabarbarbarbarabar werd genoemd." is het woord "rabarber" verkeerd
gespeld. Gebruik **replace()** om alle voorkomende gevallen van deze fout te verbeteren.
Het verwacht resultaat is dan "Barbara had een bar, waar ze rabarber verkocht, en die
daarom de rabarberbarbarabar werd genoemd."

**Opgave 6.7** Neem de string "Niemand verwacht de Spaanse Inquisitie!# In feite,
zij die de Spaanse Inquisitie wel verwachten..." en toon hem tot aan, maar niet
inclusief, de hashtag (#). Gebruik **find()** om de index van de hashtag te bepalen.

**Opgave 6.8** Schrijf een programma dat een “schone” versie van alle woorden in de string
print. Alle tekens die geen letter zijn, worden niet beschouwd als deel van een woord,
maar als separator. Alle letters moeten in kleine letters worden omgezet. Bijvoorbeeld, de
string "Ik heb zo'n honger." produceert vijf woorden, namelijk "ik", "heb", "zo", "n",
en "honger". Je kunt de functie die je eerder hebt geschreven voor het schoonmaken van
strings hier gebruiken (zie Opgave 6.5).

## 6.6 De ASCII-tabel

De ASCII-code (**A**merican **S**tandard **C**ode for **I**nformation **I**nterchange) is een gestandaardiseerde code, waarmee dus 128 ($=2^7$) tekens gevormd kunnen worden. Van deze 128 tekens zijn er 96 bestemd voor het weergeven van tekst (cijfers, letters en leestekens). Je vindt in de ASCII-tabel dus de meest gangbare **leestekens** en de **cijfers** terug. Binnen de ASCII-code is er onderscheid in de letters, eerst komen de **hoofdletters**, daarna de **kleine letters**. Verder vind je ook nog een aantal veel gebruikte **symbolen** terug.

![alt text](./images/ASCII_dec.png "ASCII Tabel (gedeeltelijk)")

Om in een Python programma te achterhalen wat het nummer is van een teken, kun je de **ord()**
functie gebruiken. `ord("A")`, bijvoorbeeld, geeft het nummer van "A", dat 65 is, zoals je kunt zien. 
De tegenhanger van
**ord()** is de **chr()** functie. **chr()** krijgt een nummer als argument en geeft als resultaat het teken
dat hoort bij dat nummer. Bijvoorbeeld, `chr(65)` is de letter "A".

In [None]:
def main():
    print(ord('A'))
    print(ord('a'))
    print(chr(65))
    print(chr(97))
    print("mango" > "mangaan")

if __name__== "__main__":
    main()

Om een uitgebreider voorbeeld van wat je kunt doen met codes voor tekens te laten zien,
is hier een programma dat (een gedeelte van) de ASCII tabel genereert:

In [None]:
def main():
    for j in range(16):
        for i in range(2, 8):
            c = i * 16 + j
            print("{:>3} {:<3}".format(c, chr(c)), end="")
        print()
    
if __name__== "__main__":
    main()