有关 Excel 中的置信统计函数的说明

摘要

本文介绍 Microsoft Office Excel 2003 和 Microsoft Office Excel 2007 中的置信函数,阐释如何使用该函数,并将 Excel 2003 和 Excel 2007 的函数结果与早期版本的置信度进行比较Excel 版本。

置信区间的含义经常被误解,我们尝试提供有效和无效语句的说明,这些语句可在你确定数据的置信值之后进行。

详细信息

置信(alpha,sigma,n)函数返回一个值,可用于构造总体平均值的置信区间。 置信区间是以已知的样本平均值为中心的值范围。 假定示例中的观测值来自于具有已知标准偏差和 sigma 的正态分布,并且示例中的观测值为 n。

语法

CONFIDENCE(alpha,sigma,n)

参数: Alpha 为概率,0 < alpha < 1。 Sigma 是正数,n 是对应于样本大小的正整数。

通常,alpha 的概率很小,例如0.05。

用法示例

假设智能商(IQ)分数遵循标准偏差15的普通分布。 您在当地学校为50学生的示例测试 IQs,获得105的样本平均值。 您希望为总体平均值计算 95% 置信区间。 95% 或0.95 置信区间对应于 alpha = 1 – 0.95 = 0.05。

若要阐释置信函数,请创建一个空白 Excel 工作表,复制下表,然后在空白 Excel 工作表中选择单元格 A1。 在“编辑”菜单上,单击“粘贴”。

注意: 在 Excel 2007 中,单击 "开始" 选项卡上 "剪贴板" 组中的 "粘贴"。

下表中的条目填充工作表中的单元格 A1: B7。

字母

0.05

stdev.s

15

n

50

样本平均值

105

= 置信度(B1、B2、B3)

= NORMSINV (1-B1/2) * B2/SQRT (B3)

将此表粘贴到新的 Excel 工作表中后,单击 "粘贴选项" 按钮,然后单击 "匹配目标格式"。

在粘贴区域仍处于选中状态时,指向 "格式" 菜单上的 "",然后单击 "自动调整所选内容"。

注意: 在 Excel 2007 中,选择了所粘贴的单元格区域,单击 "开始" 选项卡上的 "单元格" 组中的 "格式",然后单击 "自动调整列宽"。

单元格 A6 显示置信度的价值。 单元格 A7 显示相同的值,因为对置信(alpha、sigma、n)的调用返回计算结果:

NORMSINV(1 – alpha/2) * sigma / SQRT(n)

未直接进行任何更改,但 NORMSINV 已在 Microsoft Excel 2002 中改进,在 Excel 2002 和 Excel 2007 之间进行了更多改进。 因此,信心在这些更高版本的 Excel 中可能会返回不同(和改进)的结果,因为可信度依赖于 NORMSINV。

这并不意味着您应该对早期版本的 Excel 丧失信心。 NORMSINV 中的错误通常发生在其参数值非常接近0或非常接近1的情况下。 在实践中,alpha 通常设置为0.05、0.01 或0.001。 Alpha 的值必须比此值小得多,例如0.0000001,在 NORMSINV 中的舍入误差很可能会被注意到。

注意: 有关 NORMSINV 中的计算差异的讨论,请参阅 NORMSINV 上的文章。

有关详细信息,请单击下面的文章编号,以查看 Microsoft 知识库中相应的文章:

826772 Excel 统计函数: NORMSINV

把握结果的解释

Excel 2003 和 Excel 2007 的 Excel 帮助文件已重写,因为所有早期版本的帮助文件都提供有关解释结果的误导性建议。 示例中,"假设我们注意到,在 50 commuters 的示例中,工作的平均持续时间为30分钟,总体标准偏差为2.5。 我们可以确保总体平均值的间隔为 30 +/-0.692951 "95%",其中0.692951 是置信度(0.05,2.5,50)返回的值。

对于同一示例,"完成工作的平均持续时间" 为30±0.692951 分钟,或29.3 到30.7 分钟。 " 在此情况下,这也是有关使用概率0.95 在间隔 [30 –0.692951,30 + 0.692951] 内的总体平均值的声明。

在对生成此示例数据的实验之前,传统的 statistician (与 Bayesian statistician 不同)不会对总体平均值的概率分布产生任何陈述。 相反,传统的 statistician 处理假设测试。

例如,传统的 statistician 可能希望执行基于具有已知标准偏差(如2.5)的常规分布的 supposition 的双侧假设测试,这是总体平均值、μ0和 a 的特定预选值。预选的重要性级别(如0.05)。 测试的结果将基于观察样本的值(例如,30)和 null 假设总体平均值为μ0的假设在两个方向上,如果观察到的样本平均值太远,将在 "严重级别 0.05" 处被拒绝。 如果 null 假设被拒绝,则解释是指在 supposition 中,μ0是真正的总体平均值的概率小于 5% 的情况下,μ0。 执行此测试后,传统 statistician 仍无法对总体平均值的概率分布进行任何声明。

另一方面,Bayesian statistician 将从总体平均值(名为 priori 分布)的假设概率分布开始,以与传统 statistician 相同的方式收集实验性证据,并使用此证据若要修改总体平均值的她或其概率分布,从而获得一个 posteriori 分布。 Excel 不提供有助于 Bayesian statistician 的统计函数。 Excel 的统计函数均适用于古典 statisticians。

置信区间与假设测试相关。 根据实验性证据,置信区间对假设总体平均值的简要说明μ0,这将产生总体平均值为μ0的 null 假设以及将产生拒绝的μ0的值。null 假设总体平均值为μ0。 经典 statistician 不能对总体平均值在任何特定间隔内的可能性进行任何声明,因为她或从来没有对此概率分布进行 priori 假设,如果有,则需要此类假设使用实验性证据修改它们。

通过使用本部分开头的示例,了解假设测试和置信区间之间的关系。 在上一节中所述的置信度与 NORMSINV 之间的关系有:

CONFIDENCE(0.05, 2.5, 50) = NORMSINV(1 – 0.05/2) * 2.5 / SQRT(50) = 0.692951

由于样本平均值为30,因此置信区间为 30 +/-0.692951。

现在考虑一个双侧假设测试,其中0.05 包含符合标准偏差2.5 的标准偏差,样本大小为50和特定假设总体平均值μ0。 如果这是真正的总体平均值,则样本平均值将来自具有总体平均值μ0和标准偏差(2.5/SQRT (50))的正态分布。 此分布是对称的μ0,你可能希望在绝对值(样本均值-μ0) > 某些截止值时拒绝 null 假设。 截止值是:如果μ0是真正的总体平均值,则值样本平均值-μ0高于此值或μ0-每个概率 0.05/2 均会出现这种情况。 此截止值是

NORMSINV(1 – 0.05/2) * 2.5/SQRT(50) = CONFIDENCE(0.05, 2.5, 50) = 0. 692951

因此,如果下列语句之一成立,则拒绝 null 假设(总体平均值 = μ0):

样本平均值-μ0 > 0。 692951
0–样本平均值 > 0。 692951

由于示例平均值等于30,因此这两个语句将成为以下语句:

30-μ0 > 0。 692951
μ0– 30 > 0。 692951

重写它们以便仅在左侧显示μ0会生成以下语句:

μ0 < 30-0。 692951
μ0 > 30 + 0。 692951

这些值是不在置信区间中的μ0的值 [30 –0.692951,30 + 0.692951]。 因此,置信区间 [30 –0.692951,30 + 0.692951] 包含μ0的这些值,其中,总体平均值为μ0的 null 假设不会被拒绝,因为提供了样本证据。 对于此间隔外的μ0的值,null 假设总体平均值为μ0将被拒绝,并提供样本证据。

结论

在早期版本的 Excel 中,通常会对 NORMSINV (p)中的 p 非常小或非常大的值进行纠正。 通过调用 NORMSINV (p)评估信心,因此 NORMSINV 的精确度是令用户安心的一个潜在因素。 但是,在实践中使用的 p 值不太大可能会导致 NORMSINV 中出现显著的舍入错误,而性能则不会对任何版本的 Excel 的用户感到担忧。

本文大部分主要致力于解释可信度的结果。 换句话说,我们提出了 "置信区间的含义是什么?" 置信区间经常被误解。 很遗憾,excel 2003 之前的所有版本的 excel 中的 Excel 帮助文件均已参与此 misunderstanding。 Excel 2003 帮助文件已得到改进。

注意:  本页面是自动翻译的,可能包含语法错误或不准确之处。 我们的目的是使此内容能对你有所帮助。 能否告知我们此信息是否有所帮助? 下面是该参考内容的英文版

扩展你的 Office 技能
了解培训
抢先获得新功能
加入 Office 预览体验计划

此信息是否有帮助?

谢谢您的反馈!

谢谢你的反馈! 可能需要转接到 Office 支持专员。

×