# Apply

In dieser Lektion werden wir 3 verschiedene `apply()` Funktionen kennenlernen. Die grundsätzliche Idee von apply() ist es, eine Funktion auf ein iterierbares Objekt anzuwenden.

Starten wir mit `lapply()`:

## lapply()

`lapply()` wird eine Funktion auf eine Liste oder einen Vektor anwenden:

    lapply(X, FUN, ...)
    
wobei X die Liste/der Vektor ist und FUN die Funktion. Meh Infos erhalten wir in der Doku:

In [1]:
help(lapply)

Schauen wir uns dazu ein praktisches Beispiel an: eine selbsterstellte Funktion auf einen Vektor anwenden. Zuerst möchte ich euch deshalb eine Funktion (wir werden im Verlauf des Kurses immer wieder nützliche Funktionen wie diese kennenlernen) zeigen, die es uns erlaubt aus einem Vektor eine zufällige Zahl zu ziehen:

In [2]:
# W#ähle eine Zahl zwischen 1 und 10
sample(x = 1:10,1)

In [3]:
# Vektor
v <- c(1,2,3,4,5)

# Unsere Funktion
addzuf <- function(x){
    # Erhalte eine zufällige Zahl
    zuf <-sample(x=1:10,1)
    
    # Addiere x und die zufällige Zahl und gebe es zurück
    return(x+zuf)
}

# lapply()
lapply(v,addzuf)

## Anonyme Funktionen

Du dürftes im letzen Beispiel bemerkt haben, dass wir die komplette Funktion formell definieren mussten, um sie auf den Vektor anzuwenden. Im praktischen Einsatz macht diese Funktion eigentlich nur etwas sehr einfaches: eine Zufallszahl addieren. Wollen wir dazu wirklich eine Funktion definieren? Nein, insbesondere dann nicht, wenn wir sie nur ein einziges Mal verwenden!

Um mit diesem Problem umzugehen bietet R die *anonymen Funktionen* (so genannt, da sie keinen eigenen Namen haben). Die Syntax einer anonymen Funktion lautet:

    function(a){code hier}
    
Das Konzept ist gleich zu dem der *Lambda Ausdrücke* in Python. 

Wir können die Funktion von gerade eben auch als anonyme Funktion innerhalb von lapply() schreiben:

In [4]:
v

In [5]:
# Anonyme Funktion mit lapply()
lapply(v, function(a){a+sample(x=1:10,1)})

Dabei wird impliziert, dass alles innerhalb der geschwungenen Klammern {} zurückgegeben (return) wird. Hier ist ein einfacherers Beispiel:

In [6]:
# Fügt jedem Element zwei hinzu
lapply(v,function(x){x+2})

Was würde passieren, wenn unsere Funktion mehrere Parameter hätte? lapply() bietet eine einfache Möglichkeit damit umzugehen. Schauen wir sie uns an:

In [7]:
add_wahl <- function(num,wahl){
    return(num+wahl)
}

add_wahl(2,3)

In [8]:
# Uh oh! Den zweiten Parameter vergessen!
lapply(v,add_wahl)

ERROR: Error in FUN(X[[i]], ...): argument "wahl" is missing, with no default


In [9]:
# So geht's!
lapply(v,add_wahl,wahl=10)

Das können wir auch mit mehreren Parametern machen; fügt sie einfach hinzu.

## sapply() vs. lapply()

lapply() hat uns als Ergebnis eine Liste erzeugt. Um den Prozess **s**impler zu gestallten können wir `sapply()` verwenden und so einen Vektor oder eine Matrix erhalten.

In [10]:
help(sapply)

In [11]:
# Toll, wir erhalten einen Vektor!
sapply(v,add_wahl,wahl=10)

In [12]:
# Beweisen wir uns den Unterschied
lapp <- lapply(v,add_wahl,wahl=10)
sapp <- sapply(v,add_wahl,wahl=10)

class(lapp) # Eine Liste
class(sapp) # Vektor

### sapply() Einschränkungen

sapply() ist nicht in der Lage automatisch einen Vektor zu erstellen, falls die angewendete Funktion nicht für jedes Element im Vektor ein Ergebnis zurückgibt. Verdeutlichen wir dies an einem Beispiel:

In [13]:
# Überprüft gerade Zahlen
gerade <- function(x) {
  return(x[(x %% 2 == 0)])
}

nums <- c(1,2,3,4,5)

sapply(nums,gerade)

In [14]:
lapply(nums,gerade)

## Andere *apply()* Funktionen

Es gibt noch einige weitere apply() Funktionen in R. Wir haben uns alles angeschaut, was wir bis hierher wissen müssen. Solltest du allerdings neugierig sein, dann schaue in die [Dokumentation](http://www.inside-r.org/r-doc/base/lapply) oder lies diese großasrtige [StackOverflow Antwort](http://stackoverflow.com/questions/3505701/r-grouping-functions-sapply-vs-lapply-vs-apply-vs-tapply-vs-by-vs-aggrega).