# Tag 2. Kapitel 3. Fortgeschrittene Programmierung

## Lektion 36. Apply

In dieser Lektion werden wir 3 verschiedene `apply()` Funktionen kennenlernen. Die grundsätzliche Idee von apply() ist es, eine Funktion auf ein iterierbares Objekt anzuwenden.

Starten wir mit `lapply()`:

## lapply()

`lapply()` wird eine Funktion auf eine Liste oder einen Vektor anwenden:

    lapply(X, FUN, ...)
    
wobei X die Liste/der Vektor ist und FUN die Funktion. Meh Infos erhalten wir in der Doku:

In [1]:
help(lapply)

Schauen wir uns dazu ein praktisches Beispiel an: eine selbsterstellte Funktion auf einen Vektor anwenden. Zuerst möchte ich euch deshalb eine Funktion (wir werden im Verlauf des Kurses immer wieder nützliche Funktionen wie diese kennenlernen) zeigen, die es uns erlaubt aus einem Vektor eine zufällige Zahl zu ziehen:

In [4]:
# Wählt eine Zufallszahl zwischen 1 und 10
sample(x = 1:10,1)

In [18]:
# definieren wir einen neuen Vektor
v <- 11:15
print("Vektor v:")
v
# Einzelne Elemente des v-Vektors v[i] bei i = 1..5
print("Vektor-Elemente v[i] (i = 1..5)")
v[1]
v[2]
v[3]
v[4]
v[5]

[1] "Vektor v:"


[1] "Vektor-Elemente v[i] (i = 1..5)"


In [34]:
# Eine Funktion wird definiert, die x-Argument mit einer Zufallszahl addiert
addSample <- function(x){
    # Erhalte eine zufällige Zahl
    randomNumber <-sample(x=1:10,1)
    
    result <- x + randomNumber
    
    print(paste("Vektor-Element ", toString(x)," + Zufallszahl ", toString(randomNumber), " = ", result))
    
    # Addiere x und die zufällige Zahl und gebe es zurück
    return(result)
}

In [37]:
# lapply() - ruft Funktion addSample(v[i]) fünf Mal auf mit jedem Vektor-Element v[1]..v[5]
v2 <- lapply(v, addSample)
v2

[1] "Vektor-Element  11  + Zufallszahl  5  =  16"
[1] "Vektor-Element  12  + Zufallszahl  10  =  22"
[1] "Vektor-Element  13  + Zufallszahl  3  =  16"
[1] "Vektor-Element  14  + Zufallszahl  7  =  21"
[1] "Vektor-Element  15  + Zufallszahl  1  =  16"


## Anonyme Funktionen

Du dürftes im letzen Beispiel bemerkt haben, dass wir die komplette Funktion formell definieren mussten, um sie auf den Vektor anzuwenden. Im praktischen Einsatz macht diese Funktion eigentlich nur etwas sehr einfaches: eine Zufallszahl addieren. Wollen wir dazu wirklich eine Funktion definieren? Nein, insbesondere dann nicht, wenn wir sie nur ein einziges Mal verwenden!

Um mit diesem Problem umzugehen bietet R die *anonymen Funktionen* (so genannt, da sie keinen eigenen Namen haben). Die Syntax einer anonymen Funktion lautet:

    function(a){code hier}
    
Das Konzept ist gleich zu dem der *Lambda Ausdrücke* in Python. 

Wir können die Funktion von gerade eben auch als anonyme Funktion innerhalb von lapply() schreiben:

In [65]:
v1 = c(11,-50, 2, 3, 9)

In [46]:
# Anonyme Funktion mit lapply()
lapply(v1, function(a){a+sample(x=1:100,1)})

Dabei wird impliziert, dass alles innerhalb der geschwungenen Klammern {} zurückgegeben (return) wird. Hier ist ein einfacherers Beispiel:

In [47]:
# Fügt jedem Element zwei hinzu
lapply(v1, function(x){x+100})

Was würde passieren, wenn unsere Funktion mehrere Parameter hätte? lapply() bietet eine einfache Möglichkeit damit umzugehen. Schauen wir sie uns an:

In [53]:
add_two_args <- function(num1,num2){
    return(num1 + num2)
}

add_two_args(100,900)

In [54]:
# Den zweiten Parameter vergessen!
lapply(v1,add_two_args)

ERROR: Error in FUN(X[[i]], ...): Argument "num2" fehlt (ohne Standardwert)


In [55]:
# So wird funktionieren (2. Argument einfach nach dem Funktionsnamen angeben
lapply(v1,add_two_args,num2=100)

Das können wir auch mit mehreren Parametern machen; fügt sie einfach hinzu.

## sapply() vs. lapply()

lapply() hat uns als Ergebnis eine Liste erzeugt. Um den Prozess **s**impler zu gestallten können wir `sapply()` verwenden und so einen Vektor oder eine Matrix erhalten.

In [56]:
help(sapply)

In [57]:
# Toll, wir erhalten einen Vektor!
sapply(v1,add_two_args,num2=100)

In [64]:
# Rückgabetypen von lapply und sapply:

lv1 <- lapply(v,add_wahl,wahl=-100)
sv1 <- sapply(v,add_wahl,wahl=-100)

# Eine Liste
lv1
print(paste("Rückgabe-Typ von lapply-Funktion ist: ", class(lv1)))

# Ein Vektor
sv1
print(paste("Rückgabe-Typ von sapply-Funktion ist: ", class(sv1)))

[1] "Rückgabe-Typ von lapply-Funktion ist:  list"


[1] "Rückgabe-Typ von sapply-Funktion ist:  numeric"


### sapply() Einschränkungen

sapply() ist nicht in der Lage automatisch einen Vektor zu erstellen, falls die angewendete Funktion nicht für jedes Element im Vektor ein Ergebnis zurückgibt. Verdeutlichen wir dies an einem Beispiel:

In [66]:
# Überprüft gerade Zahlen
gerade <- function(x) {
  return(x[(x %% 2 == 0)])
}

nums <- c(1,2,3,4,5)

sapply(nums,gerade)

In [14]:
lapply(nums,gerade)

## Andere *apply()* Funktionen

Es gibt noch einige weitere apply() Funktionen in R. Wir haben uns alles angeschaut, was wir bis hierher wissen müssen. Solltest du allerdings neugierig sein, dann schaue in die [Dokumentation](https://www.rdocumentation.org/packages/base/versions/3.6.2/topics/lapply) oder lies diesen [StackOverflow Beitrag](http://stackoverflow.com/questions/3505701/r-grouping-functions-sapply-vs-lapply-vs-apply-vs-tapply-vs-by-vs-aggrega).

Herzlichen Glückwunsch! Sie sind mit Lektion 36. fertig!