Excel 中置信度統計函數的描述

摘要

本文將說明 Microsoft Office Excel 2003 和 Microsoft Office Excel 2007 中的置信函式,說明如何使用此函數,並將 Excel 2003 和 Excel 2007 的函數結果與舊版中的可信度結果進行比較Excel 版本。

置信區間的意義通常是誤解,我們嘗試提供有效和無效語句的說明,這些語句可在您從資料決定可信度值後進行。

其他資訊

置信度(Alpha、西格瑪、n)函數會傳回一個值,您可以用來建立總體平均值的置信區間。 [置信區間] 是以已知範例為中心的值範圍。 範例中的觀測值假設是來自具有已知標準差、西格瑪的正態分佈,而樣本中的觀察數目是 n。

語法

CONFIDENCE(alpha,sigma,n)

參數: Alpha 為 probability,而 0 < Alpha < 1。 西格瑪是正數,而 n 是對應到樣本大小的正整數。

通常,Alpha 是小的機率,例如0.05。

用法範例

假設情報商(IQ)分數遵循標準差15的正態分佈。 您在當地學校測試50學生的範例,並取得105的樣本平均值。 您想要計算總體平均值的 95% 可信度間隔。 95% 或0.95 置信區間會對應到 Alpha = 1 – 0.95 = 0.05。

若要說明置信函式,請建立一個空白的 Excel 工作表、複製下清單格,然後選取空白 Excel 工作表中的儲存格 A1。 在 [編輯] 功能表上,按一下 [貼上]。

附註: 在 Excel 2007 中,按一下 [常用] 索引標籤上 [剪貼簿] 群組中的 [

下表中的專案填滿工作表中的儲存格 A1: B7。

Alpha

0.05

標準

15

n

50

樣本平均值

105

= 置信度(B1,B2,B3)

= NORMSINV (1-B1/2) * B2/SQRT (B3)

將表格貼到新的 Excel 工作表之後,按一下 [貼上選項] 按鈕,然後按一下 [符合目的格式設定]。

在貼上的範圍仍為選取狀態時,指向 [格式] 功能表上的 [],然後按一下 [自動調整選取範圍]。

附註: 在 Excel 2007 中,選取了已選取的儲存格範圍,按一下 [常用] 索引標籤上 [儲存格] 群組中的 [格式],然後按一下 [自動調整欄寬]。

儲存格 A6 顯示置信度的價值。 儲存格 A7 顯示相同的值,因為置信度(Alpha、西格瑪、n)傳回計算結果:

NORMSINV(1 – alpha/2) * sigma / SQRT(n)

不會直接進行任何變更,但在 Microsoft Excel 2002 中已改善 NORMSINV,然後在 Excel 2002 與 Excel 2007 之間也做了更多改進。 因此,置信度在這些更新版本的 Excel 中可能會傳回不同(並改良),因為可信度依賴于 NORMSINV。

這並不代表舊版 Excel 的置信度。 NORMSINV 通常會發生錯誤,其引數的值非常接近0或非常接近1。 在實際操作中,Alpha 通常會設定為0.05、0.01 或0.001。 Alpha 的值必須比這個小得多,例如0.0000001,在 NORMSINV 中的進位誤差可能會被察覺。

附註: 請參閱 NORMSINV 上的文章,以取得 NORMSINV 中的計算差異討論。

如需詳細資訊,請按一下下列文章編號,以查看 Microsoft 知識庫中的文章:

826772 Excel 統計函數: NORMSINV

可信度結果的轉譯

針對 Excel 2003 和 Excel 2007 重新編寫了 [可信度] 的 Excel 說明檔案,因為所有舊版的說明檔案都有誤導性的解釋結果。 例如,「假設我們在我們的 50 commuters 範例中所述,使用的平均出差時間為30分鐘,而總體標準差為2.5。 我們可以將總體平均值在 30 +/-0.692951 "中的置信度 95%,其中0.692951 是置信度(0.05,2.5,50)傳回的值。

在相同範例中,[結論] 的結果為「出差的平均使用時間等於30±0.692951 分鐘,或29.3 至30.7 分鐘。」 對,這也是樣本總體平均值在時間間隔 [30 –0.692951,30 + 0.692951] 中,具有 probability 0.95 的聲明。

在執行已產生此範例資料的實驗之前,傳統 statistician (而非 Bayesian statistician)不會對總體平均值的機率分配產生任何指示。 相反地,傳統的 statistician 會處理假設測試。

例如,傳統 statistician 可能會想要執行雙側假設測試,其基礎是以已知標準差(例如2.5)標記法向,樣本總體平均值、μ0及 a 的特定預先選取值。預先選取的 [重要性] 層級(例如0.05)。 測試的結果會依據觀察到的樣本平均值(例如30),而如果觀察到的樣本平均值在任何方向上都是從μ0,則會在重要等級0.05 遭到拒絕的 null 假設。 如果 null 假設遭到拒絕,轉譯就是樣本代表遠或從μ0的 supposition,可能小於μ0是真實總體平均值的中的時間不足 5%。 在進行這個測試之後,傳統 statistician 仍無法對總體平均值的機率分佈產生任何相關資訊。

另一方面,Bayesian statistician 會從總體平均值(名為 priori 分配)的假設概率分佈開始,以與傳統 statistician 相同的方式來收集實驗性證據,並使用此證據若要修正總體平均值的她或其概率分佈,從而取得 posteriori 分配。 Excel 不提供統計函數,可協助 Bayesian statistician 這項工作。 Excel 的統計函數都是針對古典 statisticians。

[可信度] 間隔與假設測試有關。 根據實驗性證據,置信區間會提供關於假設樣本總體平均值μ0的簡明聲明,該語句會接受總體平均值為μ0的 null 假設,以及會產生拒絕的μ0值。在總體平均值為μ0的 null 假設中。 古典 statistician 無法對總體平均值落在任何特定間隔中的任何可能性進行任何指示,因為她或從來沒有對此機率分配進行 priori 假設,而且如果有的話,就需要進行這類假設。使用實驗證據來修正。

使用本節開頭的範例,探索假設測試與置信區間之間的關聯。 使用上一節中所述的置信度與 NORMSINV 之間的關係,您有:

CONFIDENCE(0.05, 2.5, 50) = NORMSINV(1 – 0.05/2) * 2.5 / SQRT(50) = 0.692951

因為樣本平均值是30,所以置信區間為 30 +/-0.692951。

現在,請考慮使用基本等級0.05 的雙側假設測試,如前文所述,假設標準差2.5 的正態分佈,樣本大小50與特定的假設總體平均值,μ0。 如果這是真實的總體平均值,則樣本平均值將是使用總體平均值μ0和標準差,2.5/SQRT (50)來進行。 這個傳播是對稱的μ0,如果 ABS (樣本均值-μ0) > 部分的截止值,您就會想要拒絕 null 假設。 截止值:如果μ0是真實的總體平均值、樣本平均值-μ0高於這個值或μ0的值,則每個概率 0.05/2 都會發生這種情況。 這個截止值是

NORMSINV(1 – 0.05/2) * 2.5/SQRT(50) = CONFIDENCE(0.05, 2.5, 50) = 0. 692951

因此,如果下列其中一個陳述成立,就會拒絕 null 假設(總體平均值 = μ0):

範例平均值-μ0 > 0。 692951
0–樣本平均值 > 0。 692951

因為樣本均值 = 30,所以在我們的範例中,這兩個語句會變成下列語句:

30-μ0 > 0。 692951
μ0– 30 > 0。 692951

重新寫入這些專案,讓左邊只有μ0會產生下列語句:

μ0 < 30-0。 692951
μ0 > 30 + 0。 692951

這些值都是不在可信度間隔 [30 –0.692951,30 + 0.692951] 中的μ0值。 因此,根據樣本證據,置信度間隔 [30 –0.692951,30 + 0.692951] 包含總體平均值為μ0的 null 值假設不會遭到拒絕。 針對此間隔以外的μ0值,如果樣本證據為μ0,則會拒絕總體平均值的 null 假設。

總結

在 NORMSINV (p)中,在舊版 Excel 中通常會發生極小或極大的值。 您可以呼叫 NORMSINV (p)來評估置信度,所以 NORMSINV 的精確度是一個可能的問題。 不過,在練習中使用 p 的值不大可能會造成 NORMSINV 中大量的進位誤差,而且置信度的值不應關心任何版本的 Excel 使用者。

本文大部分主要是解釋置信度的結果。 換句話說,我們已問過「信賴間隔的含義為何?」 您通常會誤解置信度間隔。 遺憾的是,excel 2003 版 excel 中的 Excel 說明檔案已參與此 misunderstanding。 Excel 2003 說明檔案已改良。

附註:  本頁面是經由自動翻譯而成,因此文中可能有文法錯誤或不準確之處。 讓這些內容對您有所幫助是我們的目的。 告訴我們這項資訊是否有幫助? 這裡是供您參考的英文文章

增進您的 Office 技巧
探索訓練
優先取得新功能
加入 Office 測試人員

這項資訊有幫助嗎?

感謝您的意見反應!

感謝您的意見反應! 我們將協助您與我們的其中一個 Office 支援專員連絡以深入了解您的意見。

×