# Ontwerpen met data

Computing to the `max`!

Tot nu toe heb je gezien hoe je oplossingen met functies kan ontwerpen met technieken als recursie maar ook compositie, het opdelen van een probleem in kleinere stukken waar meerdere functies verantwoordelijk zijn voor een deel van de oplossing.

Nu gaan we kijken hoe we kunnen ontwerpen met data!

## `max` of `min`

De niet subtiele kunst van het uitzoeken van het beste (en slechtste) van alles: `>` of `<`

In [1]:
"m&m's" > "koffie"

True

In [2]:
[0, 42] < [4, 2]

True

In [3]:
[0, "m&m's"] < [4, "koffie"]

True

In [4]:
"🥚" > "🐔"

True

Let op, het kip of ei probleem is nu opgelost 😉

## `max`

Een recept voor het leven? Python heeft het al voor ons!

> De echte vraag is natuurlijk **wat** te maximaliseren!


Of te minimaliseren met `min` ...

![Pineapple pizza](images/7/pineapple_pizza.jpg)

Smaken verschillen en je zal zien dat Python een heel duidelijke mening heeft!

### to the `max`



![GOOG NASDAQ](images/7/goog_nasdaq.png)

Je ziet hier de koersontwikkeling van een willekeurig aandeel. Wanneer was dit aandeel in deze periode het meest en wanneer het minst waard?

## `max`imaal rendement

Wat is de hoogste prijs van een aandeel in een bepaalde periode?

In [5]:
max([475.5, 458.0, 441.3, 470.8, 532.8, 520.9])

532.8

### Maar wanneer?

De informatie is beperkt want we weten niet *wanneer* de koers `max` was!

Hoe zou je de bijbehorende maand ook in de reeks kunnen opnemen?

In [6]:
max([[470.8, "may"], [532.8, "jul"], [520.9, "sep"]])

[532.8, 'jul']

Dit is een interessant idee, hoe zou een combinatie van prijs en maand kunnen worden gerepresenteerd? Het zijn twee elementen die logisch bij elkaar horen en dit zou je kunnen zien als een collectie van `max`imaal *twee* elementen. Het datatype dat dit goed zou kunnen representeren is een list, waar je ook de betekenis van de volgorde mee kan uitdrukken: het element op index positie 0 is altijd de prijs (een integer) en het element op positie 1 de bijbehorende maand (een string).

Prijs en maand kunnen combineren in een list is handig! Maar misschien hebben we liever de maand als eerste element?

In [7]:
max([["may", 470.8], ["jul", 532.8], ["sep", 520.9]])

['sep', 520.9]

Bij het vergelijken van lists zal Python altijd naar het *eerste* element van een list kijken om te komen tot een `max` of `min`. Dit werkt heel goed als het eerste element een getal is (een integer, in dit geval) maar hoe worden strings vergeleken?

Bedenk je dat lists en strings beide sequenties zijn, collecties van opeenvolgende elementen. Net als bij lists zal Python het eerste element van een string kiezen (een karaker) om mee te vergelijken. In dit geval is "s" het `max` karakter en dit komt overeen met de positie in het alfabet.

## Python's advies

Python's advies voor een beter leven

In [8]:
L = ["liefde", "werken", "studeren", "feesten", "eten", "sporten", "of", "slapen"]

Wat is het belangrijkst voor een `max(L)` of `min(L)` beter leven?

In [9]:
max(L)

'werken'

In [10]:
min(L)

'eten'

Hmm Python, het is niet waarschijnlijk dat iedereen het hier mee eens is!

### `str`ings to the `max`

Strings zijn collecties en net als bij lists kiest Python het *eerste* element voor vergelijkingen

In [11]:
"w" > "e"

True

Intuïtief zou je denken dat dit een vergelijking is op basis van de positie in het alfabet waar "w" `max` is.

In [12]:
"w" > "🤷‍♀️"

False

Weet je nog dat emoji ook karakters zijn? In dit geval is 🤷‍♀️ de `max`!

Als je er bij stilstaat bestaan er zoveel meer karakters dan alleen het alfabet, bijvoorbeeld "&", "?" of "!". Maar denk ook aan karakters in andere talen, bijvoorbeeld Koreaans (안녕하세요!): wat is de `min` en `max` van al deze karakters?!?

Hier is duidelijk meer aan de hand en dit gaan we verder onderzoeken wanneer je gaat rekenen met taal. We zullen dan ook zien of het kip of ei probleem écht is opgelost!

## `max` recursief

```python
def max(L):
    """Vind het max element in L
    input: L, een (niet lege) list
    """
    if len(L) == 1:
        return L[0]           # maar 1 element

    max_of_rest = max(L[1:])  # max van de rest

    if L[0] > max_of_rest:
        return L[0]           # of L[0]
    else:
        return max_of_rest    # of max_of_rest!
```

## `max` scrabble score

Welk element (woord) in een lijst heeft de hoogste scrabble score?

In [13]:
def letter_score(s):
    """Scrabble letter score
    """
    if s in "adeinorst":
        return 1
    elif s in "ghl":
        return 2
    elif s in "bcmp":
        return 3
    elif s in "jkuvw":
        return 4
    elif s == "f":
        return 5
    elif s == "z":
        return 6
    elif s in "xy":
        return 8
    elif s == "q":
        return 10
    else:
        return 0

Je herkent hier de oplossing om voor een letter `s` de scrabble score te vinden.

In [14]:
def scrabble_score(S):
    if len(S) == 1:
        return letter_score(S)                             # base case
    else:
        return letter_score(S[0]) + scrabble_score(S[1:])  # recursive case

Om voor een woord de totale scrabble score te berekenen heb je deze functie moeten implementeren. Als je dit niet gelukt is dan krijg je het bij dezen cadeau, bestudeer natuurlijk wel wat het doet!

In [15]:
L = ["aliens", "zap", "hazy", "code"]

In [16]:
def max_ss(L):
    """Vind L's element met de hoogste scrabble score
    input: L, een (niet lege) list
    """
    if len(L) == 1:
        return L[0]              # maar 1 element

    max_of_rest = max_ss(L[1:])  # max van de rest

    if scrabble_score(L[0]) > scrabble_score(max_of_rest):
        return L[0]              # of L[0]
    else:
        return max_of_rest       # of max_of_rest!

In [17]:
max_ss(L)

'hazy'

## Voor de `LoL`

Kunnen we deze oplossing vereenvoudigen, voor de `LoL`?

List comprehension is een eenvoudige en effciënte oplossing om iteraties niet recursief maar sequentieel op te lossen. We gaan hier het principe van lists om gegevens te combineren gebruiken (zoals je ook net zag bij de aandelenkoersen) om zo te komen tot lijsten met lijsten, oftewel *List of Lists*! 

### `LoL` met list comprehension

*List of Lists*

In [18]:
def max_ss(L):
    """Vind L's element met de hoogste scrabble score
    """
    LoL = [[scrabble_score(w), w] for w in L]

    bestpair = max(LoL)

    return bestpair[1]

Onze `LoL`, of *List of Lists* is een list comprehension waar elk element een *score*- en *woord*paar is.

Je zag eerder dat (in het voorbeeld met aandelen) dat Python een `max` (en `min`) bepaalt op basis van het eerste element van een collectie. Python weet niet waar het op moet vergelijken om tot een `max` te komen van een list en daarom kiest het het eerste element als basis voor vergelijking. Wij maken hier dankbaar gebruik van dat gedrag!

### Stap voor stap

In [19]:
L = ["aliens", "zap", "hazy", "code"]

We gebruiken weer dezelfde list aan scrabble woorden.

In [20]:
LoL = [[scrabble_score(w), w] for w in L]

De lists of lists waar elk element een combinatie is van score en woord.

In [21]:
LoL

[[7, 'aliens'], [10, 'zap'], [17, 'hazy'], [6, 'code']]

De `LoL` kan je inspecteren en dit is het resultaat van de list comprehension. Je ziet inderdaad paren van score en woord.

In [22]:
bestpair = max(LoL)

In [23]:
bestpair

[17, 'hazy']

To the `max`! Het beste score- en woordpaar wordt gevonden op basis van de waarde van het eerste element, de score.

Wat geeft de functie uiteindelijk terug?

```python
return bestpair[1]
```

## Quiz

### Langste woord

```python
def maxlen(L):
    """Vind het langste woord in L
    """
    LoL = [[len(s), s] for s in L]
    
    bestpair = max(LoL)
    
    return bestpair[1]

L = ["aliens", "zap", "hazy", "code"]
```

1.  Vul aan, `LoL` is:
    ```python
    [[6, "aliens"], [3, "zap"], ..., ...]
    ```
2.  Wat is `bestpair`?
3.  Wat wordt als *resultaat* teruggegeven?


#### Antwoord

1.  `LoL` is:
    ```python
    [[6, "aliens"], [3, "zap"], [4, "hazy"], [4, "code"]]
    ```
2.  `bestpair` is
    ```python
    [6, "aliens"]
    ```
3.  Het resultaat is "aliens"


### Dichtst bij 42

```python
def bestnumb(L):
    """Vind het getal het dichtst bij 42
    """
    LoL = [...]
    
    bestpair = ...

    return bestpair[1]

    
L = [30, 40, 50]
```

1. Wat is de `LoL`?

2. `min(LoL)` of `max(LoL)` voor `bestpair`?

Hint, Python heeft een ingebouwde functie `abs(x)`, bijvoorbeeld:

```python
20 == abs(22 - 42)
```

#### Antwoord

1.  `LoL` is
    ```python
    [[abs(x - 42), x] for x in L]
    ```

2. `bestpair` is
    ```python
    min(LoL)  # let op, het *dichst* bij!
    ```

Terzijde, we adviseren je de quiz opgaven altijd zelf te proberen! We geven je hier het antwoord, maar probeer 
bijvoorbeeld in dit voorbeeld te beredeneren waarom de `LoL`

```python
[[abs(x - 42), x] for x in L]
```

het volgende resultaat geeft

```python
[[12, 30], [2, 40], [8, 50]]
```

bij gebruik van de functie `abs(x)`. Vraag jezelf af wat de functie `abs(x)` nu precies *doet*?

### Meest voorkomend

```python
def mostnumb(L):
    """Vind het meest voorkomend getal in L
    """
    LoL = [...]
    
    bestpair = ...
    
    return bstpr[1]

L = [3, 4, 5, 7, 6, 7]
```

1. Wat is de `LoL`?

2. `min(LoL)` of `max(LoL)` voor `bestpair`?

Tip, gebruik de volgende *hulpfunctie*

```python
def count(e, L):
    """Vind het aantal e's in L
    """
    LC = [1 for x in L if x == e]
    return sum(LC)
```

#### Antwoord

1.  `LoL` is
    ```python
    [[count(e, L), e] for e in L]
    ```
    
2. `bestpair` is
    ```python
    max(LoL)
    ```