Mô tả về các hàm thống kê tin cậy trong Excel

Tóm tắt

Bài viết này mô tả hàm CONFIDENCE trong Microsoft Office Excel 2003 và trong Microsoft Office Excel 2007, minh họa cách thức sử dụng hàm và so sánh các kết quả của hàm for Excel 2003 và Excel 2007 với kết quả của sự tự tin trước đó Các phiên bản của Excel.

Ý nghĩa của một khoảng tin cậy thường xuyên được hiểu sai và chúng tôi cố gắng cung cấp giải thích về câu lệnh hợp lệ và không hợp lệ có thể được thực hiện sau khi bạn xác định một giá trị tin cậy từ dữ liệu của bạn.

Xem thêm thông tin

Hàm CONFIDENCE (Alpha, Sigma, n) trả về một giá trị mà bạn có thể dùng để tạo một khoảng tin cậy cho trung bình dân số. Khoảng tin cậy là một phạm vi của các giá trị được căn giữa theo nghĩa của mẫu đã biết. Các quan sát trong mẫu được giả định đến từ phân bố chuẩn với độ lệch chuẩn, Sigma và số lượng quan sát trong mẫu là n.

Cú pháp

CONFIDENCE(alpha,sigma,n)

Tham số: alpha là một xác suất và 0 < Alpha < 1. Sigma là số dương và n là số nguyên dương tương ứng với kích cỡ mẫu.

Thông thường, Alpha là một xác suất nhỏ, chẳng hạn như 0,05.

Ví dụ về việc sử dụng

Giả định rằng các điểm tin trí thông minh (IQ) theo một phân bố chuẩn với độ lệch chuẩn 15. Bạn kiểm tra IQs cho một mẫu học sinh 50 trong trường học địa phương của bạn và lấy trung bình mẫu của 105. Bạn muốn tính toán một khoảng tin cậy 95% cho trung bình dân số. Khoảng thời gian tự tin 95% hoặc 0,95 tương ứng với Alpha = 1 – 0,95 = 0,05.

Để minh họa hàm CONFIDENCE, hãy tạo một trang tính Excel trống, sao chép bảng sau đây, sau đó chọn ô A1 trong trang tính Excel trống của bạn. Trên menu Chỉnh sửa, bấm vào Dán.

Lưu ý: Trong Excel 2007, bấm vào dán trong nhóm bảng tạm trên tab trang đầu.

Các mục nhập trong bảng dưới đây điền các ô A1: B7 trong trang tính của bạn.

kiến

0,05

stdev

15

n

50

mẫu trung bình

105

= CONFIDENCE (B1, B2, B3)

= NORMSINV (1-B1/2) * B2/SQRT (B3)

Sau khi bạn dán bảng này vào trang tính Excel mới của bạn, hãy bấm nút tùy chọn dán , rồi bấm khớp định dạng đích.

Với phạm vi dán vẫn được chọn, hãy trỏ đến cột trên menu định dạng , rồi bấm vào tùy chọn tự khớp.

Lưu ý: Trong Excel 2007, với phạm vi ô được dán được chọn, hãy bấm định dạng trong nhóm ô trên tab trang đầu, rồi bấm tự động khớp với độ rộng cột.

Ô A6 Hiển thị giá trị của sự tự tin. Ô A7 Hiển thị cùng một giá trị vì một cuộc gọi đến tin cậy (Alpha, Sigma, n) trả về kết quả của tính toán:

NORMSINV(1 – alpha/2) * sigma / SQRT(n)

Không có thay đổi nào được thực hiện trực tiếp đến sự tự tin, nhưng NORMSINV đã được cải thiện trong Microsoft Excel 2002, và sau đó cải thiện thêm được thực hiện giữa Excel 2002 và Excel 2007. Do đó, CONFIDENCE có thể trả về các kết quả khác nhau (và cải tiến) trong các phiên bản Excel sau này, vì tin cậy dựa vào NORMSINV.

Điều này không có nghĩa là bạn nên mất tin cậy trong sự tự tin đối với các phiên bản Excel cũ hơn. Inaccuracies trong NORMSINV thường xảy ra đối với các giá trị của đối số của nó rất gần 0 hoặc rất gần 1. Trong thực tế, Alpha thường được đặt thành 0,05, 0,01 hoặc có thể 0,001. Giá trị của Alpha phải nhỏ hơn nhiều so với, ví dụ 0,0000001, trước khi các lỗi ngắt kết hợp trong NORMSINV có thể sẽ được nhận ra.

Lưu ý: Xem bài viết về NORMSINV để thảo luận về tính khác biệt về tính toán trong NORMSINV.

Để biết thêm thông tin, hãy bấm số bài viết sau đây để xem bài viết trong cơ sở kiến thức Microsoft:

826772 Hàm thống kê Excel: NORMSINV

Giải thích về kết quả của sự tự tin

Tệp trợ giúp Excel cho sự tự tin đã được viết lại cho Excel 2003 và Excel 2007 vì tất cả các phiên bản cũ hơn của tệp trợ giúp đã đưa ra lời khuyên gây hiểu lầm về kết quả diễn giải. Ví dụ về các trạng thái, "giả sử chúng tôi quan sát rằng, trong các 50 commuters của chúng tôi, độ dài trung bình đi làm việc là 30 phút với độ lệch chuẩn dân số của 2,5. Chúng tôi có thể là 95 phần trăm tin cậy rằng trung bình dân số nằm trong khoảng 30 +/-0,692951 "trong đó 0,692951 là giá trị trả về bởi CONFIDENCE (0,05, 2,5, 50).

Đối với cùng một ví dụ, kết luận sẽ đọc, "độ dài trung bình của du lịch để làm việc bằng 30 ± 0,692951 phút, hoặc 29,3 đến 30,7 phút." Có lẽ, đây cũng là một câu lệnh về trung bình dân số rơi xuống trong khoảng thời gian [30 – 0,692951, 30 + 0,692951] với xác suất 0,95.

Trước khi thực hiện thử nghiệm mang dữ liệu về ví dụ này, một thống kê cổ điển (như trái ngược với thống kê Bayes) có thể không có câu lệnh về phân bố xác suất của trung bình dân số. Thay vào đó, một thống kê cổ điển đề với kiểm tra giả thuyết.

Ví dụ, một thống kê cổ điển có thể muốn thực hiện kiểm tra giả thuyết hai mặt dựa trên việc phân bố thông thường với độ lệch tiêu chuẩn đã biết (chẳng hạn như 2,5), một giá trị cụ thể được chọn trước đặc biệt của trung bình dân số, μ0 và a mức độ quan trọng được chọn sẵn (chẳng hạn như 0,05). Kết quả của kiểm tra sẽ được dựa trên giá trị của trung bình mẫu được quan sát (ví dụ 30) và giả thuyết null là trung bình dân số là μ0 sẽ bị từ chối theo nghĩa 0,05 nếu có nghĩa là mẫu được quan sát quá xa từ μ0 theo cùng một hướng. Nếu giả thuyết null bị từ chối, việc giải thích là một mẫu có nghĩa là đến nay hoặc hơn nữa từ μ0 sẽ xảy ra bằng cách có cơ hội nhỏ hơn 5% thời gian bên dưới vị trí phân bố là μ0 là trung bình dân số thực sự. Sau khi tiến hành kiểm tra này, một thống kê cổ điển vẫn không thể thực hiện bất kỳ câu lệnh nào về phân bố xác suất của trung bình dân số.

Một số liệu thống kê Bayes, ở mặt khác, sẽ bắt đầu với phân bố xác suất giả định đối với trung bình tổng thể (có tên là phân bố ưu tiên), sẽ thu thập bằng chứng thực nghiệm theo cách tương tự với các thống kê cổ điển và sẽ sử dụng chứng cứ này để sửa đổi phân bố xác suất của mình cho trung bình dân số và do đó có được phân bố posteriori. Excel không cung cấp các hàm thống kê vốn sẽ giúp một thống kê Bayes trong nỗ lực này. Các hàm thống kê của Excel là tất cả đều được thiết kế dành cho các thống kê cổ điển.

Các khoảng tin cậy có liên quan đến kiểm tra giả thuyết. Với bằng chứng thực nghiệm, một khoảng tin cậy sẽ tạo ra một câu lệnh ngắn gọn về các giá trị của dân số giả thuyết có nghĩa là μ0 mà có thể mang lại cho giả thuyết null rằng trung bình dân số là μ0 và các giá trị của μ0 mà có thể bị từ chối của giả thuyết null rằng trung bình dân số là μ0. Một thống kê cổ điển không thể thực hiện bất kỳ câu lệnh nào về cơ hội mà trung bình dân số rơi vào bất kỳ khoảng thời gian cụ thể nào, bởi vì cô ấy hoặc ông không bao giờ làm cho các giả định ưu tiên về phân bố xác suất này và các giả định như vậy sẽ được yêu cầu nếu một sử dụng bằng chứng thử nghiệm để sửa lại chúng.

Khám phá mối quan hệ giữa các kiểm tra giả thuyết và khoảng tin cậy bằng cách dùng ví dụ ở đầu phần này. Với mối quan hệ giữa sự tự tin và NORMSINV đã nêu trong phần cuối cùng, bạn có:

CONFIDENCE(0.05, 2.5, 50) = NORMSINV(1 – 0.05/2) * 2.5 / SQRT(50) = 0.692951

Vì mẫu có nghĩa là 30, khoảng tin cậy là 30 +/-0,692951.

Bây giờ hãy xem xét kiểm tra giả thuyết hai mặt với mức độ quan trọng 0,05 như được mô tả trước đó giả định một phân bố bình thường với độ lệch chuẩn 2,5, kích cỡ mẫu 50 và một số có nghĩa là số giả định cụ thể, μ0. Nếu đây là số có nghĩa là true, thì mẫu này sẽ xuất hiện từ một phân bố chuẩn với số độ trung bình có giá trị là μ0 và độ lệch chuẩn, 2,5/SQRT (50). Phân bố này là đối xứng về μ0 và bạn muốn từ chối giả thuyết null nếu ABS (có nghĩa là mẫu-μ0) > một số giá trị Cutoff. Giá trị Cutoff sẽ là như vậy nếu μ0 là trung độ dân số True, giá trị trung bình mẫu-μ0 cao hơn mức định dạng này hoặc giá trị của μ0 – có nghĩa là mẫu cao hơn mức này sẽ xảy ra với xác suất 0,05/2. Giá trị Cutoff này được

NORMSINV(1 – 0.05/2) * 2.5/SQRT(50) = CONFIDENCE(0.05, 2.5, 50) = 0. 692951

Vì vậy, từ chối giả thuyết null (dân số trung bình = μ0) nếu một trong các câu lệnh sau đây là đúng:

nghĩa là mẫu-μ0 > 0. 692951
0 – nghĩa là mẫu > 0. 692951

Vì mẫu có nghĩa là = 30 trong ví dụ của chúng tôi, hai báo cáo này trở thành những câu lệnh sau đây:

30-μ0 > 0. 692951
μ0 – 30 > 0. 692951

Viết lại chúng để chỉ có μ0 xuất hiện ở bên trái sẽ tạo ra các câu lệnh sau:

μ0 < 30-0. 692951
μ0 > 30 + 0. 692951

Đây là các giá trị chính xác của μ0 không có trong khoảng tin cậy [30 – 0,692951, 30 + 0,692951]. Do đó, khoảng tin cậy [30 – 0,692951, 30 + 0,692951] có chứa các giá trị đó của μ0, trong đó giả thuyết null có nghĩa là μ0 sẽ không bị từ chối, cho bằng chứng mẫu. Đối với giá trị của μ0 bên ngoài khoảng thời gian này, giả thuyết null có nghĩa là μ0 sẽ bị từ chối cho bằng chứng mẫu.

Kết

Không chính xác trong các phiên bản trước của Excel thường xảy ra đối với các giá trị cực nhỏ hoặc rất lớn của p trong NORMSINV (p). TIN cậy được đánh giá bằng cách gọi NORMSINV (p), do đó tính chính xác của NORMSINV là một mối quan tâm tiềm ẩn đối với người dùng của sự tự tin. Tuy nhiên, các giá trị của p được dùng trong thực tế sẽ không đủ cực để gây ra các lỗi không quan trọng trong NORMSINV và hiệu suất của sự tự tin không phải là mối quan tâm đến người dùng bất kỳ phiên bản nào của Excel.

Hầu hết bài viết này tập trung vào việc diễn giải kết quả của sự tự tin. Nói cách khác, chúng tôi đã yêu cầu "ý nghĩa của một khoảng thời gian tin cậy là gì?" Khoảng tin cậy thường xuyên bị hiểu lầm. Rất tiếc, các tệp trợ giúp Excel trong tất cả các phiên bản của Excel vốn cũ hơn Excel 2003 đã góp phần vào sự hiểu lầm này. Tệp trợ giúp Excel 2003 đã được cải thiện.

Lưu ý:  Trang này được dịch tự động nên có thể chứa các lỗi về ngữ pháp hoặc nội dung không chính xác. Mục đích của chúng tôi là khiến nội dung này trở nên hữu ích với bạn. Cho chúng tôi biết thông tin này có hữu ích hay không? Dưới đây là bài viết bằng tiếng Anh để bạn tham khảo..​

Phát triển kỹ năng Office của bạn
Khám phá nội dung đào tạo
Sở hữu tính năng mới đầu tiên
Tham gia Người dùng nội bộ Office

Thông tin này có hữu ích không?

Cảm ơn phản hồi của bạn!

Cảm ơn bạn đã phản hồi! Để trợ giúp tốt hơn, có lẽ chúng tôi sẽ kết nối bạn với một trong những nhân viên hỗ trợ Office của chúng tôi.

×