In [None]:
from scipy.stats import norm,binom
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

# 实践中的统计
## 陶氏化学公司
1940年，陶氏化学公司在得克萨斯州墨西哥沿岸购买了800英亩土地，用以建造一个镁生产设施。得克萨斯州陶氏化学公司的产品包括镁、苯乙烯、塑料、胶粘剂、溶剂  
统计质量控制最初的一些成功应用出现在化学处理过程中  
在干燥剂的生产应用中，他们每隔一定周期抽取产品组成样本，计算每个样本的平均值，并且将它们记录在$\bar{x}$控制图上  
一个实例是，分析家开始观察样本均值的数值，该数值显示有一次过程的运转在它的设计范围之外。经过对控制图和运转情况的进一步观察，分析家发现差异可以追溯到某个操作人员  
陶氏化学公司在任何使用统计质量控制的地方都可以取得质量的大幅度改进 5  
本章我们将阐述陶氏化学公司所使用的$\bar{x}$控制图是如何构造的。控制图是统计质量控制的一部分，它被称为统计过程控制  
美国质量协会对质量是这样定义的：”质量是产品或服务的所有性质的特征，这些性质和特征使得该产品或服务能够满足特定的需要“  
扩大质量的范围自然导致**全面质量**的概念  
全面质量是以人为本的管理系统，其目的在于不断降低实际成本以持续提升顾客满意度。全面质量强调学习和适应并将持续改变作为组织成功的关键  
不管全面质量在不同组织中是如何实现的，它主要依据三个基本原理：以顾客和股东为中心;将参与精神与团队合作贯穿整个组织;以不断改进和学习为中心 5  
# 20.1 理念和框架
休哈特博士在贝尔电话实验室继续从事他的质量跟踪指导1956年退休，他将统计学、工程学、经济学等学科融合在一起，从而改变了工业历史的进程  
尽管质量是每个人的工作，但是戴明博士强调，注重质量必须由管理者领导。他提出了对管理者至关重要的14个职责要点  
朱兰为质量下了一个简单的定义：质量必须与实用性相匹配。朱兰的质量方法关注三个质量过程：质量计划、质量控制和质量改进  
其中两个最重要的项目是美国的马尔科姆·鲍德里奇国家质量奖和ISO9000国际认证过程  
## 20.1.1 马尔科姆·鲍德里奇国家质量奖
由美国总统颁发的马尔科姆·鲍德里奇国家质量奖授予在七个方面表现杰出的组织：1.领导;2.战略策划;3.客户和市场;4.测量、分析和信息管理;5.人类资源；6.流程管理;7.经营成果 5  
自1988年首次颁奖依赖，鲍德里奇国家质量项目(BNQP)在深度和影响力方面逐渐拓展。1988年依赖，已经分发了近200万册准则手册，通过组织的大规模复制以及电子化途径，其数量有效地得到增长  
## 20.1.2 ISO 9000
ISO 9000是由5个国际标准组成的一个系列标准，由设在瑞士日内瓦的国际标准化组织（ISO）于1987年颁布。总之，ISO 9000 认证覆盖的鲍德里奇质量奖标准不到10% 5   
## 20.1.3 六西格玛
这个质量水平被称为六西格玛质量水平，达到这个质量目标创建的方法被称为**六西格玛**  
一个组织可以承担两类六西格玛方案  
+ DMAIC（界定、测量、分析、改进和控制）帮助重新设计已存在的过程  
+ DFSS 用于设计新产品、过程或服务  

在重新设计已存在的过程和新过程中，六西格玛着重强调统计分析和仔细测量。今天，在帮助组织的经营业绩和过程质量达到鲍德里奇的水平方面，六西格玛已经成为一个主要工具 5  
**六西格玛和百万个机会中的缺陷数**  在六西格玛术语中，缺陷是指传递给消费者的任何错误或误差。六西格玛过程将质量性能定义为百万个机会中的**缺陷数**  
KJW公司经营一条填装谷物箱的生产线。填装过程的均值为$\mu=16.05$盎司，标准差为$\sigma=0.10$盎司。另外假设填装重量服从正态分布，填装重量的分布如图20-1所示  
![20-1](../syn_pic/statistics_for_business_economics/20-1.png)
<center>图20-1 谷物箱装填重量过程为均值$\mu=16.05$的正态分布</center>

假设管理人员认为15.45-16.65盎司是装填过程可以接受的质量限  

In [None]:
'''
5
'''
p=norm.cdf(15.45,16.05,0.1)*2
print('只有{:.8%}的谷物箱装填重量小于15.45或大于16.65'.format(p))

摩托罗拉早期在六西格玛上的工作使他们相信，过程均值平均而言可以移动高达1.5个标准差。例如，假设KJW的过程均值增加1.5个标准差0.15盎司，根据这个移动，填装重量正态分布的中心将变为$\mu=16.2$盎司  
图20-2描述了这种情况，上质量限16.65在新过程均值$\mu=16.2$盎司右侧的4.5个标准差  

In [None]:
p1=norm.sf(16.65,16.20,0.1)*1000000
print('每百万只有{:.1f}的缺陷-谷物箱装填重量小于15.45或大于16.65'.format(p1))

如果KJW的管理人员认为15.45-16.65盎司对装填过程是可以接受的质量限，则KJW填装过程将被认为是一个六西格玛过程  
要达到和维持六西格玛质量水平，组织必须强调监控和维持质量。质量保证是指为了达到和维持质量，由某个组织制定的政策、步骤和准则的整套系统 5  
质量保证有两个主要功能：质量工程和质量控制。质量工程的目标包括产品设计和生产过程设计的质量，还包括在生产之前确定质量问题  
**质量管理**包括一系列的检测和策略以确定是否满足质量标准。如果没有满足质量保准，则可以通过修正或预防措施来达到和维持质量的一致性  
第一种方法是统计过程控制，利用控制图的图形显示来监控生产过程，其目的是确定过程能否继续活着是否应采取修正措施，以达到预期的质量水平。第二种方法是接受抽样，在必须根据样本中发现的质量问题，决定接受或拒绝一组项目时，使用这种方法 5  
# 20.2 统计过程控制  
本节我们通过已连续不断制造货物的生产过程来考虑质量控制程序  
所有这些因素可能会导致低质量的产品。幸运的是，监控生产的程序是行之有效的，能比较早地检测出低质量的产品，生产过程因而可以得到调整或修正  
如果所生产的产品在质量上的变异来源于**可指出的原因**,比如工具的磨损、错误的机器安装、劣质的原材料或者操作人员的失误等，则应该立即调整或修正生产过程  
另外，如果变异来源于所谓的**一般原因**，比如在原料、温度和湿度等方面随机出现的差异，生产者可能无法控制，生产过程也不需要调整  
统计过程控制的主要目标是确定产品的质量变异来源于可指出的原因还是一般原因 5  
无论何时我们发现可指出的原因，我们的结论是，生产过程处于失控状态。但是，如果生产过程中产品的变异仅仅来源于一般原因，我们的结论是，生产过程处于统计控制状态，或简单地说处于在控状态   
过程控制统计程序的依据是第9章介绍的假设检验方法。原假设$H_0$表示生产过程处于在控状态，备择假设$H_a$表示生产过程处于失控状态  
![tb20-1](../syn_pic/statistics_for_business_economics/tb20-1.png)
## 20.2.1 控制图
**控制图**对确定产品中的质量差异是来源于一般原因还是来源于可指出的原因，提供了一个做出决策的基础  
控制图根据它所包含的数据类型进行分类。如果根据长度、重量或温度等变量来测量产品质量，则可以使用**$\bar{x}$控制图** 5  
图20-3显示了$\bar{x}$控制图的一般结构  
![20-3](../syn_pic/statistics_for_business_economics/20-3.png)
<center>图20-3 $\bar{x}$控制图的结构</center>

标记为UCL和LCL的两条线，对确定过程是出于在控状态还是失控状态非常重要，它们分别被称为控制上限和控制下限  
随着时间推移，越来越多的数据点被添加到控制图上。数据点的顺序是从左向右，与抽取样本过程的顺序相同。每个点代表进行一次假设检验来确定过程是否处于在控状态  
除$\bar{x}$控制图外，可供使用的其他控制图还有用来监测样本中测量极差的**R控制图**,样本中缺陷比例的**p控制图**和样本中缺陷项目数的**np控制图** 5  
## 20.2.2 $\bar{x}$控制图：过程的均值和标准差已知  
为了阐述$\bar{x}$控制图的结构，让我们再次考虑KJW包装公司的情形。当生产过程运转正常时，即系统处于在控状态时，平均重量为$\mu=16.05$盎司，并且过程的标准差为$\sigma=0.10$盎司。另外，假设填装重量服从正态分布，如图20-4所示  

In [None]:
'''
python	numpy	Array creation routines	np.linspace() start/stopb
'''
x=np.linspace(norm.ppf(0.01,16.05,0.1),\
                   norm.ppf(0.99,16.05,0.1),100)
plt.plot(x,norm.pdf(x,16.05,0.1))
plt.show()
print('图20-4 谷物箱填装重量的正态分布')

对于一个处于在控状态的过程，正如第7章介绍的那样，$\bar{x}$的抽样分布可以用来确定$\bar{x}$值所期望的变异性  
对容量为n的样本，$\bar{x}$的标准差为（20-1）  
$$\sigma_{\bar{x}}=\frac{\sigma}{\sqrt{n}}$$
5  
因此，$\bar{x}$的抽样分布服从均值为$\mu$、标准差为$\sigma_{\bar{x}}$的正态分布，如图20-5所示  
![20-5](../syn_pic/statistics_for_business_economics/20-5.png)  
如果过程处于在控状态，$\bar{x}$的抽样分布可用来确定什么样的$\bar{x}$值是可以接受的。质量控制的通常做法是将位于均值上下3个标准差之间的任何$\bar{x}$值都认为是可以接受的  
因此，$\bar{x}$控制图的控制限如下 5  
<hr />

**$\bar{x}$控制图的控制限：过程的均值和标准差已知**
$$UCL=\mu+3\sigma_{\bar{x}}$$(20-2)  
$$LCL=\mu-3\sigma_{\bar{x}}$$(20-3)   
<hr />

假设一名质量控制检验员定期抽取6箱谷物作为样本，并且用填装重量的样本均值来确定生产过程是处于在控状态还是失控状态  
利用式20-1,我们得到均值的标准误差为 5  

In [None]:
sigma=0.1/np.sqrt(6)
sigma 

因此，在过程均值等于16.05的情形下，控制限UCL和LCL如下  

In [None]:
ucl=16.05+3*sigma
print('ucl:{:.2f}'.format(ucl))

In [None]:
lcl=16.05-3*sigma
print('lcl:{:.2f}'.format(lcl))

图20-6是在10小时期间所取的10个样本结果的控制图 5  
![20-6](../syn_pic/statistics_for_business_economics/20-6.png)  

In [None]:
plt.plot(np.array([0,10]),np.array([ucl,ucl]))
plt.plot(np.array([0,10]),np.array([16.05,16.05]))
plt.plot(np.array([0,10]),np.array([lcl,lcl]))
plt.xlim(0,10)
plt.ylim(15.8,16.3)
plt.show()

注意图20-6中第5个样本的均值，有强有力的证据表明，过程处于失控状态。$\bar{x}$控制图上的其他点都位于控制上下限之间的事实，表明纠正措施是成功的    
## 20.2.3 $\bar{x}$控制图：过程的均值和标准差未知  
在KJW包装公司的例子中，我们介绍了在过程的均值和标准差已知时如何构造$\bar{x}$控制图。在大多数情况下，必须利用样本来估计过程的均值和标准差，而样本是从在控状态的过程中抽取的  
在实践中，较常见的是用极差代替标准差来监测过程的变异性，这是因为极差容易计算 5  
Jensen计算机用品公司生产直径为3.5英寸的微型计算机软盘，并刚刚完成对生产过程的调整使其处于在控状态。在表20-2中给出了每一个样本的软盘直径的样本均值$\bar{x}_j$和极差$R_j$  
由总样本均值给出过程均值$\mu$的估计值  
<hr />

**总样本均值**（20-4）  
$$\bar{x}=\frac{\bar{x}_1+\bar{x}_2+\dots+\bar{x}_k}{k}$$
式中，$\bar{x}_j$代表第j个样本的均值，$j=1,2,\dots,k$;k代表样本个数  
<hr />


In [None]:
'''
5
'''
jensen=pd.read_csv('../pydata-book-master/statistics_for_business_economics/ch19/Jensen.csv')
jensen.head()

对表20-2的JCS数据，总样本均值为  

In [None]:
'''
python	pandas	dataframe	d.mean() axis
'''
j1=jensen.iloc[:,1:]
jensen_mean=j1.mean(axis=1).mean()
print('总样本均值为x={:.4f}'.format(jensen_mean))

这个数值将作为$\bar{x}$控制图的中心线。每一个样本的极差$R_j$,是每一个样本的最大值与最小值只查，K个样本的平均极差计算公式如下  
<hr />

**平均极差**（20-5）  
$$\bar{R}=\frac{R_1+R_2+\dots+R_k}{k}$$
式中，$R_j$代表第j个样本的极差，$j=1,2,\dots,k$；k代表样本个数 5  
<hr />

对表20-2的JCS数据，平均极差为  

In [None]:
'''
python	pandas	dataframe	d.max()
python	pandas	dataframe	d.min()
python	pandas	dataframe	d.apply() axis
'''
j_range=j1.apply(lambda x:x.max()-x.min(),axis=1)
j_r=j_range.mean()
print('平均极差为{:.4f}'.format(j_r))

前面我们已经表明，$\bar{x}$控制图的控制上下限是(20-6)  
$$\bar{x}\pm3\frac{\sigma}{\sqrt{n}}$$
因此，为了构造$\bar{x}$控制图的控制限，我们需要估计过程的均值$\mu$和标准差$\sigma$。$\mu$的估计是$\bar{x}$，$\sigma$的估计可以使用极差数据建立 5  
可以证明：过程标准差$\sigma$的一个估计量为平均极差除以$d_2$，$d_2$是一个依赖于样本容量n的常数，即（20-7）  
$$\sigma的估计量=\frac{\bar{R}}{d_2}$$
在表20-3《美国检验与材料学会数据描述和控制图分析手册》给出的$d_2$的数值。如果我们将$\sigma=\bar{R}/d_2$代入式（20-6），则$\bar{x}$控制图的控制限可以写为（20-8）  
$$\bar{x}\pm3\frac{\bar{R}/d_2}{\sqrt{n}}=\bar{x}\pm{A_2\bar{R}}$$  
注意，$A_2=3/(d_2\sqrt{n})$是一个仅依赖于样本容量的常数。表20-3给出了$A_2$的数值 5  
![tb20-3](../syn_pic/statistics_for_business_economics/tb20-3.png)
对n=5,$A_2=0.577$。于是，$\bar{x}$控制图的控制限为  

In [None]:
ucl=jensen_mean+j_r*0.577
lcl=jensen_mean-j_r*0.577
print('因此,UCL={:.3f},LCL={:.3f}'.format(ucl,lcl))

图20-7是Jensen计算机用品公司问题的$\bar{x}$控制图。我们用表20-2的数据和MInitab的控制图程序来构造控制图  

In [None]:
'''
5

'''
jd1=j1.mean(axis=1).reset_index()
jd1.columns=['no','obs']
jd1['no']=jd1['no'].add(1)
jd1.head()

In [None]:
plt.plot(np.array([0,20.5]),np.array([ucl,ucl]))
plt.plot(np.array([0,20.5]),np.array([jensen_mean,jensen_mean]))
plt.plot(np.array([0,20.5]),np.array([lcl,lcl]))
plt.plot(jd1['no'],jd1['obs'],marker='o')
plt.xlim(0,20.5)
plt.ylim(3.475,3.522)
plt.show()

## 20.2.4 R控制图
现在让我们考虑可以用来控制一个过程变异性的极差控制图（R控制图）。为了构造R控制图，我们需要将样本极差看做一个有自己的均值和标准差的随机变量  
进一步，可以证明，极差标准差的估计是 （20-9） 
$$\hat\sigma_R=d_3\frac{\bar{R}}{d_2}$$
式中，$d_2$和$d_3$是依赖于样本容量的常数；表20-3给出了$d_2$和$d_3$的数值。于是，R控制图的UCL是（20-10）  
$$\bar{R}+3\hat\sigma_R=\bar{R}\left(1+3\frac{d_3}{d_2}\right)$$
LCL是（20-11） 5  
$$\bar{R}-3\hat\sigma_R=\bar{R}\left(1-3\frac{d_3}{d_2}\right)$$
如果我们令（20-12）  
$$D_4=1+3\frac{d_3}{d_2}$$
(20-13)  
$$D_3=1+3\frac{d_3}{d_2}$$
我们可以将R控制图的控制限写为  
（20-14）
$$UCL=\bar{R}D_4$$
（20-15）5  
$$LCL=\bar{R}D_3$$
表20-3也给出了$D_3$和$D_4的数值。注意，对于n=5，有$D_3=0,D_4=2.114$。因此，控制限是    

In [None]:
ucl=j_r*2.114
lcl=j_r*0
print('ucl={:.3f},lcl={:.0f}'.format(ucl,lcl))

图20-8是Jensen计算机用品问题的R控制图。我们利用表20-2的数据和Minitab的控制图来构造控制图  

In [None]:
'''
5
'''
jr1=j_range.reset_index()
jr1.columns=['no','obs']
jr1['no']=jr1['no'].add(1)
jr1.head()

In [None]:
plt.plot(np.array([0,20.5]),np.array([ucl,ucl]))
plt.plot(np.array([0,20.5]),np.array([j_r,j_r]))
plt.plot(np.array([0,20.5]),np.array([lcl,lcl]))
plt.plot(jr1['no'],jr1['obs'],marker='o')
plt.xlim(0,20.5)
plt.show()

## 20.2.5 p控制图
利用有缺陷项目比例的数据构造的控制图称为p控制图  
在过程处于在控状态时，错误投递的比例p是0.03  
对于一个处于在控状态的过程，正如第7章介绍的那样，$\bar{p}$的抽样分布可以用来确定$\bar{p}$值所期望的变异性  
对于容量为n的样本，$\bar{p}$的标准差计算公式是(20-16) 5  
$$\sigma_{\bar{p}}=\sqrt{\frac{p(1-p)}{n}}$$
对于$\bar{p}$,当下面两个条件得到满足时，就可以认为样本容量充分大  
$$np\ge5$$
$$n(1-p)\ge5$$
因此，当样本容量充分大时，$\bar{p}$的抽样分布可以近似服从均值为p,标准差为$\sigma_{\bar{p}}$的正态分布。这个分布如图20-9所示  
![20-9 5](../syn_pic/statistics_for_business_economics/20-9.png)
我们的控制限如右侧所示  
<hr />

**P控制图的控制限**  
(20-17)  
$$UCL=p+3\sigma_{\bar{p}}$$
(20-18)
$$LCL=p-3\sigma_{\bar{p}}$$
<hr/>

对于p=0.03，样本容量n=200，利用式20-6，得到标准误差为 5  

In [None]:
p=0.03
n=200
sigma_p=np.sqrt(p*(1-p)/200)
print('{:.4f}'.format(sigma_p))

In [None]:
ucl=p+3*sigma_p
lcl=p-3*sigma_p
print('ucl={:.4f},lcl={:.4f}'.format(ucl,lcl))

图20-10是邮件分拣过程的控制图  
![20-10](../syn_pic/statistics_for_business_economics/20-10.png)
对于一个处于在控状态的过程，如果缺项项目的比例未知，则我们首先应该用样本数据来估计它 5  
## 20.2.6 np控制图
np控制图是针对样本中有缺陷项目的个数而构造的控制图  
当样本容量充分大时，即$np\ge5$并且$n(1-p)\ge5$时，在一个容量为n的样本中观测到的有缺陷项目数的分布可以近似服从均值为np、标准差为$\sqrt{np(1-p)}$的正态分布  
我们有控制限如下：  
<hr />

**np控制图的控制限**(20-19) 
$$UCL=np+3\sqrt{np(1-p)}$$
(20-20)  5  
$$LCL=np-3\sqrt{np(1-p)}$$
<hr />

对于邮件分拣过程的例子  

In [None]:
ucl=n*p+3*np.sqrt(n*p*(1-p))
lcl=n*p-3*np.sqrt(n*p*(1-p))
print('ucl={:.4f},lcl={:.4f}'.format(ucl,lcl))

np控制图所提供的信息与p控制图所提供的信息相同。唯一区别是，np控制图是观测到的有缺陷项目数的分布图，而p控制图是观测到的有缺陷项目比例的分布图  
## 20.2.7 控制图的解释
根据在控制图中点的位置和分布模式，我们可以确定一个过程是否处于统计控制状态，而且错判的概率很小 5  
除了数据点位于控制限之外，某些控制限之内的数据点的分布模式也可能是质量控制问题的预警信号  
在控制图看到的另一种模式是随着世界的推移而发生的逐渐变化或趋势  
## 注释
1. 因为$\bar{x}$控制图的控制限依赖于平均极差的数值，所以这些控制限没有太多的意义，除非过程的变异性处于在控状态  
2. np控制图根据有缺陷的数量来监控过程 5  

# 20.3 接受抽样
在质量控制术语中，一组项目称为一批，**接受抽样**是一种统计方法，该方法能使我们将接受-拒绝的决定建立在检测从一批中抽取项目样本的基础上  
图20-11是接受抽样的一般步骤  
![20-11](../syn_pic/statistics_for_business_economics/20-11.png)
接受抽样统计程序的依据是第9章介绍的假设检验方法。原假设与备择假设的陈述如下  
$$H_0:高质量批$$
$$H_a:低质量批$$
5  
表20-4是假设检验程序的结果  
![tb20-4](../syn_pic/statistics_for_business_economics/tb20-4.png)
第一类错误的概率对批产品的生产者造成了风险，因此被称为**生产者风险**  
另一方面，第二类错误的概率对批产品的消费者造成了风险，因此被称为**消费者风险**  
## 20.3.1 KALI有限公司：接受抽样的实例  
因此，KALI很关注超载保护器的质量。保证质量的一种方法是检测所收到的每一个部件，这种方法被称为100%检验法 5  
作为替代方法，KALI利用接受抽样方案来检测超载保护器的质量  
一个接受抽样方案包含样本容量n和接受准则c。**接受准则**是在样本中发现有缺陷项目的最大数量，并且仍然可以接收该批  
质检员只需要抽取15个项目组成样本，对每一个项目进行检验，并根据下面的决策规则做出结论  
+ 如果没有发现有缺陷项目，则接收该批  
+ 如果发现1个或1个以上有缺陷项目，则拒收该批 5  

只有生产者风险和消费者风险都控制在一个合理的水平时，这个方案才能得以实施  
## 20.3.2 计算接收一批的概率  
通过改变假设的有缺陷项目的百分比，我们可以检验抽样方案关于两类风险的影响  
因此，对于容量为15的样本，有缺陷的项目数服从一个二项分布。二项概率函数其形式如下  
<hr />

**接受抽样的二项概率函数（20-21）**  
$$f(x)=\frac{n!}{x!(n-x)!}p^x(1-p)^(n-x)$$
5  
式中，n代表样本容量;p代表批中有缺陷项目的比例;x代表样本中有缺陷项目的个数;f(x)代表样本中有x个有缺陷项目的概率  
<hr />

对KALI的接受抽样方案,n=15；于是，对有缺陷项目为5%(p=0.05)的一批，我们有(20-22)  

In [None]:
'''
python	scipy	Statistical functions (scipy.stats)	binom() b.pmf()
'''
f0=binom.pmf(0,15,0.05)
print('该批的概率={:.4f}'.format(f0))

In [None]:
print('因此有缺陷项目为5%的一批，拒绝的概率为={:.4f}'.format(1-f0))

如果有缺陷项目分别为1%,2%,3%,$\dots$，对于n=15，c=0的抽样方案，接受这批的概率汇总如表20-6所示 5  

In [None]:
pl=[0.01,0.02,0.03,0.04,0.05,0.10,0.15,0.20,0.25]
prl=[np.round(binom.pmf(0,15,i),4) for i in pl]
prl

根据表20-6的概率，将接受一批的概率和批中有缺陷项目的百分比绘成图20-12。这个图形或曲线，被称为n=15,c=0的接受抽样方案的**抽样特性曲线**  
![20-12](../syn_pic/statistics_for_business_economics/20-12.png)
或许我们应该考虑其他抽样方案，它们有不同的样本容量n或不同的接受准则c。继续这一的计算，我们得到图20-13  
![20-13 5](../syn_pic/statistics_for_business_economics/20-13.png)
该图是KALI公司问题的四种不同的接受抽样方案的抽样特性曲线  
## 20.3.3 选择接受抽样方案
为了制订这个方案，管理人员必须对批中有缺陷项目的比例指定两个数值。一个数值$p_0$用于控制生产者风险;另一个数值$p_1$用于控制消费者风险  
我们使用如下记号：  
$\alpha$——生产者风险:拒收有缺陷比例为$p_0$的一批的概率  
$\beta$——消费者风险:接收有缺陷比例为$p_1$的一批的概率 5  
假设对KALI问题，管理人员规定$p_0=0.03$,$p_1=0.15$  
从图20-14的n=15、c=0的抽样特征曲线中，我们看到$p_0=0.03$给出的生产者风险大约是1-0.63=0.37，$p_1=0.15$给出的消费者风险大约是0.09  
但是，假如管理人员要求生产者风险$\alpha=0.1$消费者风险$\beta=0.20$。我们看到，n=15,c=0的生产者风险过高，我们应该考虑其他接受抽样方案  
利用$p_0=0.03，\alpha=0.10,p_1=0.15和\beta=0.20$，图20-13表明，n=20,c=1的接受抽样方案最接近于同时满足生产者风险和消费者风险的需要  
正如本节所介绍的，在决定抽样方案时，我们需要结合预期的生产者风险和消费者风险，考虑一些计算或抽样特性曲线 5  
![20-14](../syn_pic/statistics_for_business_economics/20-14.png)
## 20.3.4 多重抽样方案  
另一种可供选择的抽样方案时**多重抽样方案**,它涉及两个或多个抽样阶段  
在每一个阶段有3种可能的结论：停止抽样并接受该批，停止抽样并拒绝该批，或者继续抽样  
图20-15是两阶段或双重样本方案的流程  
![20-15 5](../syn_pic/statistics_for_business_economics/20-15.png)
## 注释
1. 对于接受抽样，使用二项分布的依据是假设：批的容量较大   
2. 在MIL-ST-105D的抽样表中，$p_0$被称为可接受质量水平（AQL）  
3. 在本节中我们介绍了品质抽样方案 5  

# 小结
本章我们讨论了统计方法如何用来帮助进行质量控制  
我们还讨论了被称为接受抽样的技术 5  
# 关键术语
**全面质量** 通过不断噶金和学习的测量以提高消费者满意度和降低实际成本的一种全面的系统方法  
**六西格玛** 用测量和统计分析得到一个高质量水平的方法，它使得每百万出现缺陷的机会不超过3.4  
**质量控制** 确定是否达到质量标准的一系列检查和测量行为  
**可指出的原因**  由于诸如工具的磨损、不正确的机器安装、低质量的原材料或者操作人员失误等因素，使得过程的产品出现的变异性  
**一般原因**  由于随机性，使得过程的产品出现正常的或自然的变异性 5  
**控制图** 用于帮助确定一个过程是处于在控状态还是失控状态的一种图形工具  
**$\bar{x}$控制图** 根据一个变量，如长度、温度、重量等的均值来检测一个过程的产品质量时所使用的控制图  
**R控制图** 根据一个变量的极差来检验一个过程的产品质量时所使用的控制图  
**p控制图** 根据缺陷率来检验一个过程的产品质量时所使用的控制图  
**np控制图** 根据有缺陷的项目的数量来检验一个过程的产品质量时所使用的控制图 5  
**一批** 一组项目，例如正在进货的原材料，或外购的零部件，以及来自总装线的制成品  
**接受抽样** 通过在样本中发现有缺陷的项目的数量来决定接收还是拒收一批的统计方法  
**生产者风险** 拒绝一个高质量批的风险，也称为第一类错误  
**消费者风险** 接收一个低质量批的风险，也称为第二类错误  
**接收准则** 样本中发现有缺陷项目的最大数量，并且仍然可以接收该批 5  
**抽样特性曲线** 显示接收一批的概率为该批中有缺陷项目百分比的函数的图形  
**多重抽样方案** 利用不止一个样本或一个抽样阶段的接收抽样方案 5  
# 重要公式
均值的标准误差（20-1）  
$$\sigma_{\bar{x}}=\frac{\sigma}{\sqrt{n}}$$
$\bar{x}$控制图的控制限：过程的均值和标准差已知（20-2）（20-3）  
$$UCL=\mu + 3\sigma_{\bar{x}}$$
$$LCL=\mu - 3\sigma_{\bar{x}}$$
总样本均值（20-4） 5  
$$\bar{\bar{x}}=\frac{\bar{x}_1+\bar{x}_2+\dots+\bar{x}_k}{k}$$
平均极差（20-5） 
$$\bar{R}=\frac{R_1+R_2+\dots+R_k}{k}$$
$\bar{x}$控制图的控制限：过程的均值和标准差未知（20-8）  
$$\bar{x}\pm{A_2\bar{R}}$$
R控制图的控制限（20-14）（20-15） 5  
$$UCL=\bar{R}D_4$$
$$LCL=\bar{R}D_3$$
比例的标准误差（20-16）  
$$\sigma_{\bar{p}}=\sqrt{\frac{p(1-p)}{n}}$$
p控制图的控制限（20-17）（20-18）  
$$UCL=p+3\sigma_{\bar{p}}$$
$$LCL=p-3\sigma_{\bar{p}}$$
np控制图的控制限（20-19）（20-20） 5  
$$UCL=np+3\sqrt{np(1-p)}$$
$$LCL=np-3\sqrt{np(1-p)}$$
接收抽样的二项概率函数（20-21）  
$$f(x)=\frac{n!}{x!(n-x)!}p^x(1-p)^(n-x)$$
5  