# 程序设计

### 控制结构

以下是控制函数的脚本执行流程的常用结构，包括：

- 分支函数 `if else`
- 循环函数 `for while repeat`
- 终止语句 `break`
- 空语句 `next`

我们经常需要可以检查一个程序的状态和改变这个程序的行为的功能。条件语句可以提供这样的功能，最简单的形式是 if 语句。

以下编写一个Relu函数，深度学习的激活函数之一

In [60]:
x <- sample(-1:1, 1, replace=T)

if (x < 0) {
    y<-0
} else {
    y<-x
}

print(y)

[1] 1


可能有一种情况，当你需要执行一段代码几次，循环语句允许我们多次执行一个语句或一组语句。

- repeat循环 多次执行一系列语句，并简化管理循环变量的代码
- while循环 在给定条件为真时，重复语句或语句组。 它在执行循环体之前测试条件
- for循环 像while语句，不同之处在于它测试在循环体的端部的条件

以下编写一个计算1000以内的 Fibonacci 数的程序

In [15]:
f<-c(1,1);i<-1
repeat{
    f[i+2]<-f[i]+f[i+1]
    i<-i+1
    if (f[i]+f[i+1]>=1000) break
}
print(f)

 [1]   1   1   2   3   5   8  13  21  34  55  89 144 233 377 610 987


In [14]:
f<-c(1,1);i<-1
while(f[i]+f[i+1]<1000){
    f[i+2]<-f[i]+f[i+1]
    i<-i+1
}
print(f)

 [1]   1   1   2   3   5   8  13  21  34  55  89 144 233 377 610 987


构造一个4阶的Hilbert矩阵，该矩阵正定且高度病态

In [18]:
n<-4; x<-array(0, dim=c(n,n))
for (i in 1:n){
    for (j in 1:n){
        x[i,j]<-1/(i+j-1)
    }
}
print(x)

          [,1]      [,2]      [,3]      [,4]
[1,] 1.0000000 0.5000000 0.3333333 0.2500000
[2,] 0.5000000 0.3333333 0.2500000 0.2000000
[3,] 0.3333333 0.2500000 0.2000000 0.1666667
[4,] 0.2500000 0.2000000 0.1666667 0.1428571


中止语句是 `break`，作用是强行中止循环；空语句是 `next`，表示继续执行

In [63]:
for (i in 1:5){
    if (i==2) next
    if (i==4) break
    print(i)
}

[1] 1
[1] 3


### 函数

在现代编程语言中函数的优点是可复用性、模块化设计，它是一系列声明的组合以执行特殊的任务。在 R 语言里有很多内建的函数，例如 sum()、min()、max()、mean() 等。

函数定义使用 `function` 关键字，一般格式为
```
function_name <- function(arg_1, arg_2, ...) {
   Function body 
}
```

函数体是一个表达式或复合表达式（复合语句），以复合表达式中最后一个表达式为返回值，也可以用 `return(x)` 返回x的值。如果函数需要返回多个结果， 可以打包在一个列表（list）中返回。

In [69]:
moment<-function(x, k, mean=0){
    sum((x-mean)^k)/length(x)
}
    
X<-c(80.02,79.94,79.98,79.97,79.97,80.03,79.95,79.97)
moment(X,k=2,mean=mean(X))

自定义形式参数表能帮助我们更好地定制函数，形参表常见的几种变化有：

- 无参数
- 位置和名称
- 指定缺省值
- 传递函数
- 省略号`...`

调用没有参数的函数

In [70]:
# Create a function without an argument.
new.function <- function() {
   for(i in 1:5) {
      print(i^2)
   }
}

# Call the function without supplying an argument.
new.function()

[1] 1
[1] 4
[1] 9
[1] 16
[1] 25


使用参数值调用函数

函数调用的参数可以按照函数中定义的顺序提供，也可以以不同的顺序提供，但分配给参数的名称。

In [71]:
# Create a function with arguments.
new.function <- function(a,b,c) {
   result <- a * b + c
   print(result)
}

# Call the function by position of arguments.
new.function(5,3,11)

# Call the function by names of the arguments.
new.function(a = 11, b = 5, c = 3)

[1] 26
[1] 58


使用默认参数调用函数

我们可以在函数定义中定义参数的值，并调用函数而不提供任何参数以获取默认结果。 但是我们也可以通过提供参数的新值来获得非默认结果来调用这样的函数。

In [72]:
# Create a function with arguments.
new.function <- function(a = 3, b = 6) {
   result <- a * b
   print(result)
}

# Call the function without giving any argument.
new.function()

# Call the function with giving new values of the argument.
new.function(9,5)

[1] 18
[1] 45


将函数作为参数传递到函数中

我们常常用到对一堆数据的多个单元进行某类操作，此时很适合自定义传递函数的函数，R语言的 `*apply` 有着同样的手法。

In [73]:
add_two_numbers <- function(num1, num2){
   num1 + num2
}

multiply_two_numbers <- function(num1, num2){
    num1 * num2
}

some_function <- function(func){
   func(2, 4)

}

some_function(add_two_numbers)

some_function(multiply_two_numbers)

在自定义R函数的形参中， 还允许有一个特殊的...形参（三个小数点）

 在函数调用时，所有没有形参与之匹配的实参，不论是带有名字还是不带有名字的，都自动归入这个参数。

In [74]:
mad_libs <- function(...){
  
  args <- list(...)
  
  place <- args[["place"]]
  adjective <- args[["adjective"]]
  noun <- args[["noun"]]
  
  paste("News from", place, "today where", adjective, "students took to the streets in protest of the new", noun, "being installed on campus.")
}

mad_libs(place = "London", adjustive = "beautiful", noun = "dog")

省略号能帮助我们定制十分强大和健壮的函数，在R里面常用，例如 `sapply(x, FUN, ...)` 中的形式参数FUN需要函数实参，此函数有可能需要更多的参数，则 `...` 发挥作用。

我们将前面的 `some_function` 修改得更加强大和健壮，例如自定义计算的数据。

In [81]:
some_function_ad <- function(func, ...){
   func(...)
}

some_function_ad(func=multiply_two_numbers, num1=3, num2=4)

`*apply` 家族是R中很强大的函数，其主要思想是 `Split-Apply-Combine`，用于处理数据。在此介绍以下几种：

- `lapply` 用来对 `list`、`data.frame` 数据集进行循环应用某个函数，返回列表
- `sapply` 用来对 `list`、`data.frame` 数据集进行循环应用某个函数，返回向量，输出更加友好
- `vapply` 与前一个函数相似，但可以预先指定的返回值类型，使得得到的结果更加安全
- `tapply` 把数据按照某种分组，在每个组内进行某个运算

创建一个数据帧作为数据来展示各个函数

In [99]:
df<-data.frame(
    Name=c("Alice","Becka","James","Jeffrey","John"),
    Sex=c("F","F","M","M","M"),
    Age=c(13,13,13,13,12),
    Height=c(56.5,65.3,57.3,62.5,59.0),
    Weight=c(84.0,98.0,83.0,84.0,99.5)
    )

print(df)

     Name Sex Age Height Weight
1   Alice   F  13   56.5   84.0
2   Becka   F  13   65.3   98.0
3   James   M  13   57.3   83.0
4 Jeffrey   M  13   62.5   84.0
5    John   M  12   59.0   99.5


In [105]:
y<-lapply(df[3:5], mean)
print(y)

$Age
[1] 12.8

$Height
[1] 60.12

$Weight
[1] 89.7



In [106]:
y<-sapply(df[3:5], mean)
print(y)

   Age Height Weight 
 12.80  60.12  89.70 


In [107]:
y<-vapply(df[3:5], mean, numeric(1))
print(y)

   Age Height Weight 
 12.80  60.12  89.70 


In [110]:
y<-tapply(df$Age, df$Sex, mean)
print(y)

       F        M 
13.00000 12.66667 


### 调试

在程序运行出错时，假定没有IDE的情况下，常用的调试方法有：

- 若有错误提示则看错误提示
- 输出中间结果，`print` 和 `cat`
- 跟踪调试，实时地查看甚至修改运行时变量的值，`browser` 和 `debug`

In [82]:
f<-function(x,y){
    x+y_
}

f(10,20)

ERROR: Error in f(10, 20): 找不到对象'y_'


In [83]:
f<-function(x,y){
    cat('x=',x,'\n')
    cat('y=',y,'\n')
    x+y
}

f(10,20)

x= 10 
y= 20 


In [85]:
# n单步跟踪 c退出跟踪
f<-function(x,y){
    browser()
    x+y
}

f(10,20)

Called from: f(10, 20)
debug在<text>#4: x + y


In [86]:
f<-function(x,y){
    x+y
}
debug(f)
f(10,20)


debugging in: f(10, 20)
debug在<text>#1: {
    x + y
}
debug在<text>#2: x + y
exiting from: f(10, 20)
