# Einführung in R - Teil II
### Grundlagenmodul Stochastik Wintersemester 2021/22

## Programmieren in R


## Was sind Funktionen
- haben bereits einige Funktionen kennengelernt, z.B. `sum(x)`, `factorial(x)`, `sqrt(x)`, `choose(n,k)`, `plot(x,y,col="blue")`, etc.
- Manchmal kann es hilfreich sein, eine häufig verwendete Abfolge von Befehlen in ein Funktion zu schachteln.
  - spart Schreibarbeit
  - übersichtlicherer/kürzerer Code
  
### Beispiel: Einfache symmetrische Irrfahrt der Länge $N$


In [3]:
Irrfahrt <- function(N){
  # Erzeuge N Münzwurfe mit Werten 1/-1
  # Eine Möglichkeit: benutze Binomial mit n=1, p=1/2
  Y <- -(1-2*rbinom(N,1,1/2))

  # Berechne die Irrfahrt, durch Summieren der ersten n Schritte
  I <- cumsum(Y)
  
  # Wir wollen, dass der Startwert der Irrfahrt 0 ist:
  I <- c(0,I)
  
  # Gebe das Resultat zurück
  return(I)
}

print(Irrfahrt(10)) # Beispiel


 [1]  0  1  0 -1  0 -1  0 -1  0  1  2


## Funktionen definieren
### Allgemeine Struktur
```
name <- function(arg1, arg2, arg3=val, ...) {  # Funktionskopf
  # Funktionsdefinition                        # Funktionskörper
  ...
  ...
  return(Ergebnis)
}
```
- Der Name `name` kann jeder gültige Variablenname sein.
- Zuweisungsoperator `<-`, um Funktion in Variable `name` zu speichern.
- Die Argumente `arg1`, `arg2`, `arg3`,... sind ebenfalls gültige Variablennamen.
- Den Argumenten können Standardwerte zugewiesen werden `arg3=val`.
- Argumente ohne Standardwerte _müssen_ beim Funktionsaufruf übergeben werden!
- Auf die Argumente kann dann im Funktionskörper durch ihre Variablennamen zugegriffen werden. Diese Variablen sind _nur_ innerhalb der Funktion definiert.
- Im Funktionskörper findet die Berechnung statt. Alle Anweisungen werden der Reihe nach von oben nach unten ausgeführt.
- mit der (optionalen) Funktion `return(...)` kann ein Ergebnis zur weiteren Verwendung zurückgegeben werden.
  - Beachte: Nach einem `return`-statement wird der Funktionskörper nicht mehr weiter ausgeführt.

In [None]:
### Beispiel einfache aber nicht notwendigerweise symmetrische Irrfahrt der Länge $N$

In [5]:
Irrfahrt <- function(N, p=1/2) {
  # ähnlich dem ersten Beispiel aber diesmal
  # mit variablem p
  Y <- -(1-2*rbinom(N,1,p))

  # Der Rest wie oben
  I <- cumsum(Y)
  I <- c(0,I)
  return(I)
}

print(Irrfahrt(20))
print(Irrfahrt(20, 0.6))
print(Irrfahrt(20, 0.4))


 [1]  0  1  2  1  2  1  0  1  0 -1  0 -1 -2 -3 -2 -3 -2 -1 -2 -3 -4
 [1]  0  1  2  1  0  1  0 -1  0 -1  0  1  2  3  4  3  2  3  2  3  2
 [1]  0 -1  0  1  0 -1  0 -1 -2 -1 -2 -3 -2 -1  0 -1 -2 -1 -2 -3 -2


## Bedingte Ausführung mit `if`

- Manchmal ist es nötig, Teile des Codes nur unter bestimmten Bedingungen auszuführen.
- Dazu dienen `if ...`-Anweisungen

allgemeine Struktur
```
if (BEDINGUNG) {
  ...           # Wird ausgeführt, wenn BEDINGUNG == TRUE
}
```
- `BEDINGUNG` ist eine Abfrage/Funktion, die einen Wahrheitswert `TRUE` oder `FALSE` liefert

### Beispiel
Simuliere eine $\{-1,1\}$ wertige Zufallsvariable mit Hilfe einer $\{0,1\}$ wertigen

In [9]:
Muenze <- rbinom(1,1,1/2)
if (Muenze==0) {
  Muenze <- -1
}
print(Muenze)

[1] 1


## Bedingte Ausführung mit `if ... else ... `

allgemeine Struktur
```
if (BEDINGUNG) { 
  ...             # Wird ausgeführt, wenn BEDINGUNG == TRUE 
} else {          # sonst...  
  ...             # Wird ausgeführt, wenn BEDINGUNG == FALSE 
}
```
- lässt sich auch mit zwei nacheinander ausgeführten `if`-Abfragen realisieren. Die Verwendung von `else` ist jedoch
      eleganter und vor allem effizienter; Der Ausdruck `BEDINGUNG` muss nur einmal ausgewertet werden!

### Beispiel

In [12]:
Muenze <- rbinom(1,1,1/2)

if (Muenze==0) {
  print("Kopf")
} else {
  print("Zahl")
}

[1] "Kopf"


- Soll nur ein Wert ausgegeben werden, wenn eine bestimmte Bedingung erfüllt ist, kann auch die Funktion `ifelse(test, yes, no)` verwendet werden:

In [14]:
Muenze <- rbinom(3, 1, 1/2)
print(ifelse(Muenze==0, "Kopf", "Zahl"))

[1] "Kopf" "Zahl" "Zahl"


### Beispiel
Brückenwege einer einfachen symmetrischen Irrfahrt
- Ein Brückenweg ist ein Pfad der Länge $2N$, der in 0 startet und wieder in 0 endet.

In [15]:
Bruecke <- function(N) {
  # Generiere eine Irrfahrt der Länge 2N
  # Mit der Funktion aus dem letzten Beispiel
  I <- Irrfahrt(2*N)

  if (I[length(I)]==0) { # Ist Endpunkt ==0?
    return(I)            # Wenn ja, Gib Irrfahrt zurück
  } else {               # Sonst ...
    Bruecke(N)           # ... führe die Funkion noch einmal aus
  }
}

print(Bruecke(10))

 [1]  0 -1  0 -1 -2 -1  0  1  0 -1 -2 -1  0  1  2  1  0  1  0 -1  0


**Beachte** Diese Definition von `Bruecke` ist _rekursiv_, das heißt, sie verwendet sich selbst. Das ist in der Regel kein Problem, aber Vorsicht vor potentiell unendlichen Rekursionen!

## Geschachtelte Bedingungen: `else if`

Die `else`-Anweisung kann auch mit einer weiteren `if`-Abfrage kombiniert werden:
```
if (BEDINGUNG1) {
  ...
} else if (BEDINGUNG2) {
  ...
} else if (BEDINGUNG3) {
  ...
} else if ...
```
- Verwendung von `else if` ist effektiver als die hintereinander Reihung von `if`-Abfragen, da die einzelnen
      Bedingungen nur ausgewertet werden müssen, bis zum ersten Mal eine Bedingung `TRUE` ist.
    
### Beispiel

In [22]:
Los <- sample(1000,1)
if (Los %% 2 == 1) {
  print("Trostpreis")
} else if (Los %% 100 == 0) {
  print("Hauptgewinn")
} else {
  print("Niete")
} 

[1] "Trostpreis"


## Schleifen

Schleifen (engl. _loops_) sind nützlich, wenn gleiche bzw. ähnliche Anweisungen mehrmals hintereinander ausgeführt werden sollen,
    z.B. für alle Elemente eines Vektors.
    
- Zwei Arten von Schleifen in **R**: `for` und `while`

### die `for`-Schleife
    
- `for`-Schleifen iterieren durch die einzelnen Elemente eines Vektors:

```
for (var in V) {
  ...
}
```

  - Anweisungen in der Schleife werden der Reihe nach abgearbeitet
  - der Wert der Variablen `var` ändert sich in jedem Durchlauf und kann innerhalb der Schleife (und nur dort) verwendet werden. 
  
### die `while` Schleife
- `while`-Schleifen werden so lange wiederholt, wie eine Bedingung `TRUE` ist:

```
while (BEDINGUNG) {
  ...
}
```

  - Anweisungen in der Schleife werden der Reihe nach abgearbeitet
  - Vor jedem Schleifendurchlauf wird `BEDINGUNG` geprüft.
  - Gefahr von unendlichen Schleifen ( `while (TRUE) {}`).
  

###  Beispiel: Erweiterung des Los-Beispiels von Oben mit einer `for` Schleife

In [26]:
Lose <- sample (1000 ,100)
Gewinn <- NULL  # Initialisieren des Ergebnisses
for (Los in Lose){
  # Für jedes Los aus dem Vektor "Lose", speichere die jeweilige
  # Bezeichnung ("Hauptgewinn", "Trostpreis", "Niete") im Vektor
  # "Gewinn"
  if ( Los %% 2 == 1) {
    Gewinn <- c(Gewinn, "Trostpreis")
  } else if ( Los %% 100 == 0) {
    Gewinn <- c(Gewinn ,"Hauptgewinn")
  } else {
    Gewinn <- c(Gewinn ,"Niete")
  }
}
print(Gewinn)

  [1] "Trostpreis"  "Niete"       "Niete"       "Trostpreis"  "Niete"      
  [6] "Trostpreis"  "Niete"       "Trostpreis"  "Niete"       "Trostpreis" 
 [11] "Trostpreis"  "Trostpreis"  "Niete"       "Niete"       "Trostpreis" 
 [16] "Niete"       "Niete"       "Trostpreis"  "Niete"       "Trostpreis" 
 [21] "Niete"       "Niete"       "Niete"       "Niete"       "Trostpreis" 
 [26] "Niete"       "Niete"       "Trostpreis"  "Niete"       "Niete"      
 [31] "Niete"       "Niete"       "Niete"       "Trostpreis"  "Niete"      
 [36] "Niete"       "Trostpreis"  "Niete"       "Trostpreis"  "Niete"      
 [41] "Trostpreis"  "Trostpreis"  "Niete"       "Hauptgewinn" "Niete"      
 [46] "Trostpreis"  "Trostpreis"  "Niete"       "Trostpreis"  "Trostpreis" 
 [51] "Niete"       "Hauptgewinn" "Trostpreis"  "Niete"       "Trostpreis" 
 [56] "Trostpreis"  "Niete"       "Niete"       "Niete"       "Trostpreis" 
 [61] "Niete"       "Trostpreis"  "Niete"       "Trostpreis"  "Niete"      
 [66] "Trost

### Beispiel: Brückenweg (s.o.) mit einer `while`-Schleife

In [27]:
N <- 50
Brueckenweg <- Irrfahrt(2*N)
while (Brueckenweg[length(Brueckenweg)] != 0) {
  # So lange die generierte Irrfahrt kein Brückenweg ist,
  # erzeuge eine neue Irrfahrt
  Brueckenweg <- Irrfahrt(2*N)
}
print(Brueckenweg)

  [1]  0  1  0  1  2  1  2  1  2  3  4  5  4  3  2  3  2  1  0 -1  0 -1  0  1  0
 [26]  1  2  3  2  1  0 -1  0 -1  0 -1 -2 -1 -2 -1  0  1  0 -1  0 -1 -2 -1 -2 -3
 [51] -2 -3 -4 -5 -4 -3 -2 -3 -2 -3 -4 -5 -4 -3 -2 -1 -2 -1 -2 -1 -2 -3 -4 -5 -6
 [76] -5 -4 -5 -6 -5 -4 -5 -4 -5 -6 -7 -6 -5 -4 -3 -2 -3 -4 -3 -2 -3 -2 -3 -2 -1
[101]  0


## Kontrolle in Schleifen: `break` und `next`

Innerhalb einer Schleife kann mit den Befehlen `break` und `next` Kontrolle über die Schleife ausgeübt werden.

- Der Befehl `break` beendet die Schleife sofort und es wird der nächste Befehl nach der Schleife ausgeführt.
- Der Befehl `next` beendet den aktuellen Schleifendurchlauf und setzt die Ausführung mit dem nächsten Schleifendurchlauf fort.

Beide Befehle werden üblicherweise mit einer `if`-Abfrage kombiniert:

### Beispiel 1 `next`

In [28]:
for ( i in 1:10 ) {
  if (i %% 2 == 0) {
    next
  }
  print(i)
}

[1] 1
[1] 3
[1] 5
[1] 7
[1] 9


### Beispiel 2 `break`

In [29]:
while (TRUE) {
  Wuerfel <- sample(6,1)
  print(Wuerfel)
  if (Wuerfel == 6) {
    break
  }
}

[1] 1
[1] 1
[1] 6



- Natürlich kann auch `next` in einer `while`-Schleife und `break` in einer `for`-Schleife verwendet werden.
- Wird in einer Funktion eine Schleife verwendet und innerhalb der Schleife wird ein `return(...)` ausgeführt, so wird auch die Schleife sofort beendet.

### Beispiel Einfacher (aber ineffizienter) Primzahltest

In [30]:
is.prime <- function(n){
  # Teste, ob n eine ganze Zahl >1 ist:
  if ((round(n)-n != 0) | (n<2)) {
    # Falls nein, beende Ausführung und gib
    # NA (not available) zurück
    return(NA)
  }
  # Falls n == 2, gib 'TRUE' zurück
  if (n == 2) return(TRUE)
  prime <- TRUE  # initialisiere die Ergebnisvariable
  # Teste ob irgendeine Zahl kleiner als n
  # ein Teiler von n ist.
  for (i in 2:(n-1)) {
    if (n %% i == 0) {
      # Wenn i teilt n, setze prime auf FALSE und breche
      # die Schleife ab
      prime <- FALSE
      break
    }
  }
  # Liefere den Wert von "prime" als Ergebnis zurück
  return(prime)
}
is.prime(3)
is.prime(215164869)

## Funktionen auf Vektoren anwenden: Die Funktion `sapply`
- Einige Funktionen (z.B. `is.prime` aus dem letzten Beispiel) lassen sich nicht auf Vektoren anwenden.
- Die Funktion `sapply(X, FUN)` wendet die Funktion `FUN` auf die einzelnen Komponenten von `X` an und liefert einen Vektor als Ergebnis.

### Beispiel

In [31]:
Num <- 1:100
primes <- sapply(Num , is.prime)
print(Num[primes])

 [1] NA  2  3  5  7 11 13 17 19 23 29 31 37 41 43 47 53 59 61 67 71 73 79 83 89
[26] 97
