# 生成随机数

|参数|功能|
|:---:|:---:|
|r|返回随机生成的数字|
|d|返回概率密度函数值，$f(x = z)$|
|p|返回累积密度函数(cdf)，等价于$P[X\leq z]$|
|q|返回逆累积密度函数(对应的分位数)|

## 正态分布，$X \sim N(\mu,\sigma^{2})$

$E = \mu, Var = \sigma^2$，概率密度函数：$\frac1{\sigma\sqrt{2\pi}}\; \exp\left(-\frac{\left(x-\mu\right)^2}{2\sigma^2} \right) \!$

K-S散度

In [49]:
ks.test(rnorm(100),'pnorm',alternative = 'two.sided')


	One-sample Kolmogorov-Smirnov test

data:  rnorm(100)
D = 0.061678, p-value = 0.8413
alternative hypothesis: two-sided


#### rnorm（n，mean = 0，sd = 1）

In [15]:
rnorm(10,0,1)  #等效于rnorm(10, mean = 0, sd = 1)

#### dnorm（x，mean = 0，sd = 1，log = FALSE），返回正态分布的概率密度函数的值；dnorm（z）表示标准正态分布密度函数f（x）在x=z处的函数值；log为TRUE时，函数返回值不再是正态分布而是对数分布

In [21]:
dnorm(1, mean = 1, sd = 1, log = FALSE)
dnorm(0)

#### pnorm（q，mean = 0，sd = 1，lower.tail = TRUE，log.p = FALSE）,返回值是正态分布的分布函数值，比如pnorm（z）等价于P[X≤z]

In [22]:
pnorm(1, mean = 1, sd = 1, log = FALSE)
pnorm(0)

#### qnorm（p，mean = 0，sd = 1，lower.tail = TRUE，log.p = FALSE），返回值是给定概率p后的对应分位点

In [30]:
qnorm(.85, mean = 1, sd = 1, log = FALSE)
qnorm(.5)

In [35]:
qnorm(c(0.05, 0.95),mean=1000,sd=100)    #1000的90%置信区间对应分位点

## t分布

统计量：$t={\frac{{\overline {X}}_{n}-\mu}{\sqrt{\frac{S^2}{n}}}}$，概率密度函数：${\frac  {\Gamma ((df +1)/2)}{{\sqrt  {df \pi }}\,\Gamma (df /2)\,(1+x^{2}/df )^{{(df +1)/2}}}}\!$

自由度v越小，t分布曲线愈平坦，曲线中间愈低，曲线双侧尾部翘得愈高；自由度v愈大，t分布曲线愈接近正态分布曲线，当自由度v=∞时，t分布曲线为标准正态分布曲线

#### rt(n, df, ncp), ncp为非中心化参数&ensp;$\delta$，仅仅 可用abs(ncp)<=37.62的范围。如果忽略该参数，则使用中心分布

In [62]:
print(rt(3,df=10, ncp = 10))
print(rt(4,df=20, ncp = 20))
print(rt(5,df=30, ncp = 30))

[1]  6.269172  9.161156 10.045868
[1] 19.82308 21.98510 18.05173 22.59347
[1] 26.78821 26.33829 37.51754 29.56637 29.07232


#### dt(x, df, ncp, log = FALSE)， 返回&ensp;$f(x)$

In [66]:
dt(2, df = 20)
dt(2, df = 10)
dt(4, df = 10, ncp = 4)

#### pt(q, df, ncp, lower.tail = TRUE, log.p = FALSE)，返回累积密度函数(cdf)，等价于$P[X\leq q]$，lower.tail：TRUE (default), probabilities are P[X ≤ x], otherwise, P[X > x]

In [90]:
pt(4, df = 20, ncp = 4)
pt(4, df = 20, ncp = 4, lower.tail = FALSE)
pt(4, df = 20, ncp = 4) + pt(4, df = 20, ncp = 4, lower.tail = FALSE)

#### qt(p, df, ncp, lower.tail = TRUE, log.p = FALSE)，返回逆累积密度函数(对应的分位数)

In [78]:
qt(0.5, df = 20, ncp = 4)

## 二项分布(n重伯努利)，$X \sim B(n, p)$，n次伯努利试验中得到x次成功的分布

$E = np, Var = np(1-p)$，概率质量函数：${\displaystyle f(k;n,p)=\Pr(X=k)={n \choose k}p^{k}(1-p)^{n-k}}$

#### rbinom(n, size, prob)，从给定样本产生给定概率的所需数量的随机值，size：试次，大于0

In [97]:
print(rbinom(8,500,.4))

[1] 183 217 192 209 210 197 193 192


#### dbinom(x, size, prob, log = FALSE)，给出每个点的概率密度分布，返回&ensp;$f(x)$

In [99]:
print(dbinom(200,500,.4))

[1] 0.03639907


In [101]:
choose(500,200)*0.4^200*0.6^300    #使用排列函数choose计算

#### pbinom(q, size, prob, lower.tail = TRUE, log.p = FALSE)，给出事件的累积概率，返回&ensp;$P[X\leq q]$

In [108]:
print(pbinom(200,500,.4))

[1] 0.5194108


#### qbinom(p, size, prob, lower.tail = TRUE, log.p = FALSE)，返回逆累积密度函数(对应的分位数)

In [107]:
print(qbinom(.5, 500, .4))

[1] 200


## 几何分布，$X \sim Pr(p)$，x次伯努利试验中最后一次得到成功的分布

$E = \frac{1}{p}, Var = \frac{1-p}{p^2}$，概率质量函数：$\Pr(X=k)=(1-p)^{{k-1}}p$

## 卡方分布，$X\sim\chi ^{2}(df)$

$E = df, Var = 2df$，概率密度函数：${\displaystyle f_{df}(x)={\frac {{\frac {1}{2}}^{\frac {df}{2}}}{\Gamma ({\frac {df}{2}})}}x^{{\frac {df}{2}}-1}e^{\frac {-x}{2}}}$