### Att traversera en lista: For-loopar
I förra veckan gick vi igenom avancerade datatyper, och tidigare datastrukturer. Det är nu dags att gå vidare till datamanipulation, att faktiskt göra någonting med denna. Vårt exempel var en tabell

Mycket data är organiserad som någon form av lista. Det kan vara observationer från ett experiment, dokument i ett arkiv, eller helt enkelt namn och metadata. Text kan ofta representeras som listor av ord, meningar eller tecken. Det är därför ofta intressant att genomföra någon form av instruktion för varje element i en lista. 

För detta syfte använder vi så kallade `for-loopar`. En loop är en konstruktion som *itererar* genom någonting, exempelvis en lista.

Betrakta nedan lista över namn:

In [1]:
names = ['Leia', 'Rey', 'Obi-Wan', 'Leia', 'Maul', 'C-3PO', 'Maul', 'Luke', 'Yoda', 'Leia', 'Grogu']

Loopar tillåter oss att tillämpa en funktion eller instruktion på varje enskilt element. Vi exemplifierar med den enkla `print`-funktionen. Varje utskrift här genomförs i en *iteration*. Att iterera genom en lista eller någon liknande struktur kallas att *traversera* den.

In [2]:
for name in names:
    print(name)

Leia
Rey
Obi-Wan
Leia
Maul
C-3PO
Maul
Luke
Yoda
Leia
Grogu


Detta är ett typexempel på syntax i Python, men vi måste dissekera vad som händer. 

`for` och `in` är reserverade nyckelord. Man bör alltså inte döpa variabler till dessa namn. 

`name` är en variabel som representerar varje enskilt element i listan `names`. Detta variabelnamn kan bytas ut till vad som helst som anses mer passande, exempelvis

In [3]:
for element in names:
    print(element)

Leia
Rey
Obi-Wan
Leia
Maul
C-3PO
Maul
Luke
Yoda
Leia
Grogu


som alltså gör samma sak. Programmet gör alltså vill säga
- För varje element i listan `names`, utför instruktionen `print` för elementet.

Instruktionerna som skall utföras varje iteration skrivs i Python med en indentering, 5 mellanslag eller ett `Tab`-nedslag. Detta är typisk *syntax*, ett ej betydelsebärande men obligatoriskt inslag i språket. Om syntaxen inte stämmer kommer ni att få ett `SyntaxError`.

Vi kan skapa ett liknande program som utför samma instruktion ett visst antal gånger, genom att skriva:

In [4]:
for i in [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]:
    print("Choklad")
    # print(i)

Choklad
Choklad
Choklad
Choklad
Choklad
Choklad
Choklad
Choklad
Choklad
Choklad


För 10 värden i listan skrivs alltså `Choklad` ut. Variabeln `i` tilldelas varje iteration detta värde, och instruktionen i indenteringen utförs. Testa att avkommentera det andra `print`-kommandot för att se vilket värde `i` antar.

Ett ekvivalent sätt att skriva vår loop över `names` hade alltså varit att skriva

```python
for i in [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]:
    print(names[i])

```
där vi alltså itererar genom varje index för namnen i listan och hämtar värdet på namnet. En shorthand för detta är att skriva

In [7]:
for i in range(0, 11):
    print(names[i])

Leia
Rey
Obi-Wan
Leia
Maul
C-3PO
Maul
Luke
Yoda
Leia
Grogu


där `range(min, max)` genererar en lista med heltal mellan `min` och `maximum-1`.

In [None]:
for i in range(0, len(names)):
    print(names[i])

# While-loopar
En annan variant på loopar är så kallade while-loopar. Dessa loopar så länge ett visst villkor är uppfyllt, så länge villkoret är `True`.

Syntaxen är 

```python
while condition:
    # Perform task
```

Exekveringen är som följer:
1. Först kontrolleras att villkoret är sant vid start. Om det inte är det kommer loopen inte starta.
2. Om det är sant, så genomförs instruktionerna i loopens *kropp*.
3. Vid nästa iteration så kontrolleras om villkoret fortfarande är sant.
4. Detta fortsätter till villkoret inte längre är sant.

In [8]:
while True:
    print("Hello")

Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hello
Hell

KeyboardInterrupt: 

Eftersom en while-loop lätt blir en *oändlig loop*, måste man se till att loop-villkoret uppdateras på något vis. Exempelvis:

In [9]:
condition = True # Will run a first time
x = 0

while condition:

    # Print the condition and value for debugging
    print(condition, x)

    # Perform task
    x = x + 2

    # Update condition
    condition = x < 10

True 0
True 2
True 4
True 6
True 8


## Exempel: Tabell-iteration
Jämför i förra passet, där vi definierade tabeller som antingen listor av rader eller listor av kolumner. Vi skall nu utgå från listor av rader, och extrahera endast värdena från en kolumn, samt summera dessa. Detta motsvaras av `COUNT(*)` i SQL.

In [10]:
table = [
    {"ord": "rälsmarknad", "antal förekomster": 4, "tfidf": 14.18311444, "rättstavad": True},
    {"ord": "verldsmarknad", "antal förekomster": 11, "tfidf": 10.78912178, "rättstavad": True},
    {"ord": "bokmarknad", "antal förekomster": 8, "tfidf": 4.81071705, "rättstavad": True},
    {"ord": "parisermarknad", "antal förekomster": 1, "tfidf": 3.951243719, "rättstavad": True},
    {"ord": "penningemarknad", "antal förekomster": 7, "tfidf": 3.620795599, "rättstavad": True},
    {"ord": "bokhandelsmarknad", "antal förekomster": 1, "tfidf": 3.034952987, "rättstavad": True},
    {"ord": "egendomsmarknad", "antal förekomster": 1, "tfidf": 2.69848075, "rättstavad": True},
]


total_count = 0

for row in table:

    # Extract the number of countds
    row_count = row["antal förekomster"]

    total_count = total_count + row_count
    # Alt.
    # total_count = total_count + row["antal förekomster"]
    # Or
    # total_count += row["antal förekomster"]


print(total_count)

33


## Exempel: Tabell-uppdatering
Vi betraktar samma tabell som tidigare. Ett väldigt vanligt problem är att man är intresserad av att uppdatera värdena i en tabell, eller manipulera antalet kolumner. Vi skall därför försöka avrunda värdena i kolumnen `tfidf` med hjälp av den inbyggda funktionen `round`. 

Den enda förkunskapen för detta är att veta att key-value-par i dictionaries kan uppdateras som vanliga variabler, det vill säga 

```python
d =  {
    'nyckel': 'värde'
}

d['nyckel'] = 'nytt värde'
```

In [11]:
for row in table:

    row['tfidf'] = round(row['tfidf'])


print(table)

[{'ord': 'rälsmarknad', 'antal förekomster': 4, 'tfidf': 14, 'rättstavad': True}, {'ord': 'verldsmarknad', 'antal förekomster': 11, 'tfidf': 11, 'rättstavad': True}, {'ord': 'bokmarknad', 'antal förekomster': 8, 'tfidf': 5, 'rättstavad': True}, {'ord': 'parisermarknad', 'antal förekomster': 1, 'tfidf': 4, 'rättstavad': True}, {'ord': 'penningemarknad', 'antal förekomster': 7, 'tfidf': 4, 'rättstavad': True}, {'ord': 'bokhandelsmarknad', 'antal förekomster': 1, 'tfidf': 3, 'rättstavad': True}, {'ord': 'egendomsmarknad', 'antal förekomster': 1, 'tfidf': 3, 'rättstavad': True}]


## Exempel: Filtrering - en kik på If-satser

Ett avancerat exempel som kommer återkomma är *if-satser*, i princip tester för booleaner. Dessa kan användas för att filtrera data, eller villkora instruktioner på viss typ av data.

Exempelvis, betänk att vi nu intresserade av att veta hur många gånger `Leia` förekommer i listan. Man kan tänka sig att man vill veta hur många gånger personen förekommer i en databas, exempelvis.

Vad vi gör är att vi skriver en loop som går igenom varje element i listan och kontrollerar om namnet är just Leia. I så fall skrivs det ut till skärmen.

In [5]:
for name in names:
    if name == 'Leia':
        print(name)

Leia
Leia
Leia
