# 控制结构

R语言中的控制结构可以用来控制程序的执行流程，默认是从上到下执行的，其他基本 的控制结构包括：
- if-else结构：用于测试逻辑条件
- for   结构：用于执行固定次数的循环
- while   结构：用于在某个条件成立时执行循环 
- repeat   结构：用于直接执行无限循环
- break 语句：用于终止并跳出循环
- next   语句：用于跳过循环中的当前迭代 
- return    语句：用于从函数中退出

## if

仅在满足一个条件时执行，即条件只能得到一个逻辑值，else一定要跟在大括号后面，else 语句并不是必须的.可以多个if语句

```shell
if(条件){语句
} else   {语句}
if (条件1){语句
} else  if (条件2){语句 } else    {语句}
```

In [1]:
x <- rnorm(1, 3, 1)
x


In [2]:
if (x > 3) {
    y <- 10
} else {
    y <- 0
}
y


In [3]:
y <- if (x > 3) {
    10
} else {
    0
}
y


ifelse, switch

ifelse结构比较紧凑的向量化版本(输入输出均为向量，向量可以有多个元素),根据条件 执行后面两个语句中的一个

In [8]:
# 生成10个二项分布随机变量，每个变量都是100次试验中成功的次数，成功的概率为0.5
rbinom(10, 100, 0.5)
ifelse(rbinom(1, 1, 0.5), "字", "花")


## switch  

根据后面一个表达式的值选择语句执行：switch(expr,...), 
- 表达式是数字则按顺序，字符则按名字，表达式长度必须为1
- 按名字匹配都匹配不到，且最后一句没有给名字，则执行最后一句

In [9]:
switch(2,
    " 不",
    "要"
)

switch("median",
    median = median(c(-1:9, 50)),
    mean = mean(c(-1:9, 50))
) ## [1]4.5
switch("aaa",
    median = median(c(-1:9, 50)),
    mean = mean(c(-1:9, 50)),
    print("nothing")
)


[1] "nothing"


## for


最常见的循环运算符.基本思想是：设置一个循环下标(通常为i),然后循环下标遍历一个整 数数列，每取一个值就代入循环中的语句计算一次，直到遍历完数列中所有数.

In [10]:
for (i in 1:2) {
    print(i)
}


[1] 1
[1] 2


In [11]:
x <- c("a", "b")
for (i in 1:2) {
    print(x[i])
}


[1] "a"
[1] "b"


In [12]:
for (i in seq_along(x)) {
    print(x[i])
} ## seq_along         相比seq 更有效率，输入向量，输出等长的数列


[1] "a"
[1] "b"


for嵌套循环

嵌套越多给理解带来的难度越大，尽量不要超过两层 .

In [13]:
x <- matrix(1:6, 2, 3)
for  (i in seq_len(nrow(x))) {
    for (j in seq_len(ncol(x))) {
        print(x[i, j])
    }
}


[1] 1
[1] 3
[1] 5
[1] 2
[1] 4
[1] 6


## while


从条件语句开始，得到真执行后面的执行语句，执行完后继续判定条件，直到条件得到假， 循环结束. (可能由于循环条件的设置不当而造成死循环)

In [14]:
count <- 0
while (count < 6) {
    print(count)
    count <- count + 1
}


[1] 0
[1] 1
[1] 2
[1] 3
[1] 4
[1] 5


多条件


条件语句常常多于一句，一般由左至右执行

In [15]:
z <- 5
while (z >= 3 && z <= 10) {
    print(z)
    coin <- rbinom(1, 1, 0.5) ##    投一枚均匀硬币
    if (coin == 1) {
        z <- z + 1
    } else {
        z <- z - 1
    } ## 小型的随机游走
}


[1] 5
[1] 4
[1] 3
[1] 4
[1] 3


## repeat


无限循环，在统计应用中使用较少，但是偶尔会用到。终止的办法是使用break函

以上是计算算法收敛常用的函数，但是并不是所有的算法都是收敛的。算法的效果还 部分取决于容差，容差越小，循环的时间越长。通常来说，由于难以预测循环的时
间，就会存在无限循环的危险。
最好使用for 循环，for 循环具有对该循环可运行迭代次数的硬性限制。可有效防止死 循环。

在repeat函数中，如果算法没有收敛也不会出现警告，而是一直循环下去

In [None]:
x <- 1
tol <- le - 8
repeat{
    xl <- computeEstimate() ## 自己写的一个函数
    if (abs(x1 - x0) < tol) {
        break
    } else {
        xO <- xl
    }
}


## next,return

next可以用在任何一种循环中，用来跳过某一次迭代

In [None]:
for (i in 1:100) {
    if (i <= 20) {
        next ## 跳过头20次循环
    }
    ## 其他想要执行的语句
}


break函数则是完全跳出循环
return 函数也可以退出循环，主要用来退出函数，会结束整个函数，返回一个值。



函数通过function() 指令创建，被当做R的一个对象存储。既函数属于R的对象类别“函 数类”

```R
f<-  function(<参数>){
##show your capability

}
```

在R中函数被认为是一级对象，所以函数的处理方式和其他类似于向量的处理方式是一 样的。
- 可以把函数作为其他函数的参数
- 函数可以嵌套，既可以在一个函数中定义一个函数

函数包含已经命名的参数，这些参数可以赋值默认值。

- 函数定义里的参数称为形参
- formals()   函数可以返回一个函数所有的形参(函数名作为输入) ·并不是每次调用函数都会用到所有的形参
- 函数参数可以缺失或者有缺省值

In [16]:
formals(mean)


$x


$...



参数匹配


函数参数可以通过位置或者名字匹配。 以下对sd()函数的调用都是等价的：

In [17]:
mydata <- rnorm(100)
sd(mydata)

sd(x = mydata, na.rm = T)

sd(na.rm = T, x = mydata)
sd(na.rm = T, mydata)



参数匹配可以名字匹配和位置匹配混合使用，先匹配名字，剩下的参数按照位置匹 配。

In [19]:
args(lm)


In [21]:
# 下面两个调用是等价的。

lm(data = mydata, y ~ x, model = F, 1:100)
lm(y ~ x, mydata, 1:100, model = F)


ERROR: Error in model.frame.default(formula = y ~ x, data = mydata, subset = 1:100, : 'data' must be a data.frame, environment, or list


R中匹配参数的顺序是：

1.寻找参数名的精确匹配——2.寻找部分匹配——3.寻找位置匹配

## 惰性取值
函数参数的取值是惰性的，只有需要的时候才会求值。           
以上函数并没有使用参数b, 所以调用f(3)的时候并不会返回错误，因为3是通过位置匹 配到a的。



In [22]:
f <- function(a, b) {
    a^2
}
f(3)


## 参数

...用来表明可以传递给另一个函数的一些参数。

...常用于需要拓展到另一个函数，而又不想复制原函数的整个参数列表。


In [24]:
myplot <- function(x, y, type = "1", ...) {
    plot(x, y, type = type, ...)
}


使用在泛型函数(Generic function)中，使得附加函数可以传递给方法(methods)
- 泛型函数不做任何事，它的作用是根据数据类型选择合适的方法。

In [25]:
mean


当传递到函数的参数数量不能事先确定的时候需要使用..

In [26]:
args(paste)
## function   (..,sep    =””,collapse    =NULL)
## NULL
args(cat)
## function     (..,file      ="",sep     ="",fill      =FALSE,   labels =NULL,


...之后的参数


使用…的一个陷阱是任何出现在…之后的参数都需要明确的给出名称，不能进行部分匹配。这样做是为了让R区分对象传递给的参数是…还是后面的参数。

In [27]:
args(paste)
## function(..,sep=”",collapse   =NULL)
## NULL
paste("a", "b", sep = ":")
## [1]"a:b"
paste("a", "b", se = ":")
