Popis statistických funkcí spolehlivosti v Excelu

Shrnutí

Tento článek popisuje funkci CONFIDENCE v Microsoft Office Excelu 2003 a v Microsoft Office Excelu 2007, která ukazuje, jak se daná funkce používá, a porovnává výsledky funkce pro Excel 2003 a Excel 2007 s výsledky spolehlivosti v dřívějších verzích. verze Excelu.

Význam intervalu spolehlivosti je často nevýkladný a snažíme se poskytnout vysvětlení platných a neplatných příkazů, které lze provést po určení hodnoty spolehlivosti dat.

Další informace

Funkce CONFIDENCE (alfa, Sigma, n) vrátí hodnotu, kterou můžete použít k vytvoření intervalu spolehlivosti pro střední hodnotu základního souboru. Interval spolehlivosti je oblast hodnot, která je zarovnána na střed známého vzorového významu. Pozorování ve výběru se pokládají za normálního rozdělení se známou směrodatnou odchylkou, a počet pozorování ve vzorku je n.

Syntaxe

CONFIDENCE(alpha,sigma,n)

Parametry: alfa je pravděpodobnost a 0 < < 1. Sigma je kladné číslo a n je kladné celé číslo, které odpovídá velikosti výběru.

Obvykle je alfa malá pravděpodobnost, třeba 0,05.

Příklad použití

Předpokládejme, že skóre podílu Intelligence (IQ) sleduje normální rozdělení se směrodatnou odchylkou 15. Otestujete IQs pro ukázku pro 50 studentů v místní škole a získejte vzorekovou střední hodnotu 105. Chcete vypočítat 95% interval spolehlivosti pro střední hodnotu základního souboru. Interval spolehlivosti 95% nebo 0,95 odpovídá alfa = 1-0,95 = 0,05.

Pokud chcete funkci CONFIDENCE ilustrovat, vytvořte prázdný excelový list, zkopírujte následující tabulku a pak ve svém prázdném excelovém listu vyberte buňku a1. V nabídce Úpravy klikněte na Vložit.

Poznámka: V Excelu 2007 klikněte ve skupině Schránka na kartě Domů na Vložit .

V listu následují položky tabulky a1: B7.

hodnotou

0,05

Vrátí

15

n

50

střední hodnota výběru

105

= CONFIDENCE (B1; B2; B3)

= NORMSINV (1-B1/2) * B2/SQRT (B3)

Po vložení této tabulky do nového excelového listu klikněte na tlačítko Možnosti vložení a pak klikněte na Přizpůsobit formátování cíli.

Se stále vybraným vloženým rozsahem přejděte v nabídce Formát na příkaz sloupec a pak klikněte na přizpůsobit výběr.

Poznámka: V Excelu 2007 vyberte vybranou oblast buněk, ve skupině buňky na kartě Domů klikněte na Formát a potom klikněte na Přizpůsobit šířku sloupců.

Buňka A6 zobrazuje hodnotu spolehlivosti. Buňka A7 zobrazuje stejnou hodnotu, protože volání důvěry (alfa, Sigma, n) vrátí výsledek výpočtu:

NORMSINV(1 – alpha/2) * sigma / SQRT(n)

Nebyly provedeny žádné změny, které by byly přímo důvěryhodné, ale funkce NORMSINV byla vylepšena v Microsoft Excelu 2002 a další vylepšení byla mezi Excelem 2002 a Excelem 2007. Proto mohou být v těchto novějších verzích aplikace Excel navráceny různé (a vylepšené) výsledky, protože se na funkci NORMSINV spoléhá.

Neznamená to, že byste měli ztratit důvěru v dřívějších verzích Excelu. V nepřesnosti funkce NORMSINV se obvykle dochází u hodnot argumentu velmi blízko k nule nebo velmi blízko k 1. V praxi je alfa obvykle nastaveno na 0,05, 0,01 nebo 0,001. Hodnoty argumentu alfa musí být značně menší, než je třeba 0,0000001, než se při zaokrouhlování chyb v režimu NORMSINV zobrazí chybové zprávy.

Poznámka: Informace o rozdílech v výpočtůch v NORMSINV najdete v článku o funkci NORMSINV.

Další informace najdete v následujícím článku znalostní báze Microsoft Knowledge Base:

826772 Statistické funkce Excelu: NORMSINV

Vyhodnocení výsledků důvěry

Soubor nápovědy k Excelu pro spolehlivost se přepsal pro Excel 2003 a Excel 2007, protože všechny dřívější verze souboru s nápovědou mají zavádějící upozornění na interpretace výsledků. Příklad uvádí, že v našem ukázkovém počtu pracovních dnů v 50 je průměrná doba cestování do práce 30 minut se směrodatnou odchylkou základního souboru 2,5. Můžeme být 95 procent, že je střední hodnota počtu obyvatel v intervalu 30 +/-0,692951 "tam, kde 0,692951 představuje hodnotu vrácenou důvěrou (0,05, 2,5, 50).

Ve stejném příkladu se výsledek přečte tak, že průměrná doba cestování je rovna 30 ± 0,692951 minut nebo 29,3 až 30,7 minut. Předpokládá se to také o střední hodnotu v intervalu [30 – 0,692951, 30 + 0,692951] s pravděpodobností 0,95.

Před provedením experimentu, který vrátil data pro tento příklad, může klasický statistik (jako protiklad k Bayesian statistickému tématu) nedělat žádné prohlášení o pravděpodobnosti rozdělení základního souboru. Namísto toho se klasické statistik řeší pomocí testování hypotéz.

Může se například stát, že klasickým statistikám bude vést oboustranně připravený test, který je založen na supposition normálního rozdělení se známou směrodatnou odchylkou (například 2,5), určitou předem vybranou hodnotou základního souboru střední, μ0 a a. předem vybraná úroveň významnosti (například 0,05) Výsledek zkoušky by byl založen na hodnotě sledované střední hodnoty vzorku (například 30) a nulovém předpokladu, že střední hodnota počtu obyvatel by byla odmítnuta na úrovni významnosti 0,05, pokud je zjištěný průměr zjištěného vzorku příliš daleko od μ0 v obou směrech. Pokud je hodnota null hypotéza odmítnutá, je výkladem to, že ve vzorku je ve skutečnosti, že se jedná o méně než 5% času v rámci supposition, který μ0 představuje. Po provedení této zkoušky klasická definice nedokáže dělat žádné prohlášení o pravděpodobnosti rozdělení základního souboru.

Bayesian statistické údaje na druhé straně začínat předpokládaným rozdělením pravděpodobnosti pro střední hodnotu základního souboru (s poznámkou k nějakému rozdělení), kdyby byly shromažďovány experimentální důkazy stejným způsobem jako klasické statistického modulu a tyto důkazy by byly použity Chcete-li změnit jeho rozdělení pravděpodobnosti pro střední hodnotu, a získat za něj následné rozdělení. Excel neobsahuje žádné statistické funkce, které by Bayesian statistiku v této vynasnaží. Statistické funkce Excelu jsou určené pro klasické statistiky.

Intervaly spolehlivosti se týkají testů hypotéz. Díky experimentálním důkazům je interval spolehlivosti stručným prohlášením o hodnotách hypotetické střední hodnotě základního souboru střední μ0, což by vedlo k přijetí nulového předpokladu, že střední hodnota základního souboru je μ0 a hodnoty μ0, které by vrátily odmítnutí. nulové hypotézy, že střední hodnota základního souboru je μ0. Klasický statistické údaje nemůžou dělat žádné prohlášení o pravděpodobnosti, že střední hodnota základního souboru spadá do jakéhokoli konkrétního intervalu, protože nebo nikdy neprovádí předem předpoklady tohoto rozdělení pravděpodobnosti a takové předpoklady by byly nutné Revidujte je pomocí experimentálních důkazů.

Prozkoumejte vztah mezi testy hypotéz a intervaly spolehlivosti pomocí příkladu na začátku tohoto oddílu. S relací mezi SPOLEHLIVOSTí a NORMSINV uvedenými v posledním oddílu máte tyto funkce:

CONFIDENCE(0.05, 2.5, 50) = NORMSINV(1 – 0.05/2) * 2.5 / SQRT(50) = 0.692951

Protože je střední hodnota výběru 30, je interval spolehlivosti 30 +/-0,692951.

Nyní uvažujte dvoustrannou zkoušku s úrovní významnosti 0,05, jak je popsáno výše, která předpokládá normální rozdělení se směrodatnou odchylkou 2,5, což je velikost vzorku 50 a konkrétní hypotetické střední hodnotě počet obyvatel znamená μ0. Pokud se jedná o skutečný průměr základního souboru, bude mít vzorek průměr od normálního rozdělení se střední hodnotou μ0 a směrodatnou odchylkou, 2,5/odmocnina (50). Toto rozdělení je symetricko o μ0 a Vy byste chtěli odmítnout hodnotu null hypotézy, pokud by bylo možné použít funkci ABS (střední hodnota-μ0 >). Hodnota typu přerušení by byla taková, že kdyby μ0 byla skutečná střední hodnota, znamená to, že hodnota vzorového střední hodnoty – μ0 vyšší než toto přerušení nebo hodnota μ0-vzorková je vyšší než toto započet, jako je třeba 0,05/2. Tato hodnota přerušení je

NORMSINV(1 – 0.05/2) * 2.5/SQRT(50) = CONFIDENCE(0.05, 2.5, 50) = 0. 692951

Zamítnout hodnotu null hypotézy (střední hodnota počtu = μ0), pokud je splněn některý z následujících výrazů:

příklad střední hodnoty – μ0 > 0 692951
0 – vzorek střední > 0. 692951

Vzhledem k tomu, že vzorek střední = 30 v našem příkladu, jsou tyto dva příkazy následující:

30-μ0 > 0. 692951
μ0 – 30 > 0 692951

Popište je tak, aby na levé straně μ0 pouze následující příkazy:

μ0 < 30-0. 692951
μ0 > 30 + 0. 692951

Jedná se přesně o hodnoty μ0, které nejsou v intervalu spolehlivosti [30 – 0,692951; 30 + 0,692951]. Proto je interval spolehlivosti [30 – 0,692951, 30 + 0,692951] Tyto hodnoty μ0, přičemž hodnota null hypotézy, která je střední hodnota počtu obyvatel, se nezamítla, a to s uvedením ukázkových důkazů. V případě hodnot μ0 mimo tento interval by byl odmítnut NEPRAVDA, že střední hodnota základního souboru je μ0.

Provedené

Nepřesnost v dřívějších verzích Excelu se obvykle vyskytují pro extrémně malé nebo extrémně velké hodnoty p v NORMSINV (p). SPOLEHLIVOST se vyhodnocuje voláním funkce NORMSINV (p), takže přesnost funkce NORMSINV je potenciálním problémem pro uživatele s důvěrou. Hodnoty p, které se používají v praxi, však nemůžou být natolik nepříznivě, aby v NORMSINV mohly způsobit významné chyby zaokrouhlení a výkon důvěry uživatelů nezáleží na tom, jak se dají používat žádné verze Excelu.

Většina z těchto článků má fokus na interpretaci výsledků důvěry. Jinými slovy, jsme požádáni o "Jaký je význam intervalu spolehlivosti?" Intervaly spolehlivosti jsou často mylně srozumitelné. Soubory nápovědy Excelu ve všech verzích Excelu starší než Excel 2003 nám bohužel přispěly k tomuto nesrozumitelnému porozumění. Soubor nápovědy k Excelu 2003 se zlepšil.

Poznámka:  Tato stránka byla přeložena automaticky a může obsahovat gramatické chyby nebo nepřesnosti. Naším cílem je to, aby pro vás byl její obsah užitečný. Mohli byste nám prosím dát vědět, jestli vám informace pomohly? Pokud chcete, můžete se podívat na anglickou verzi článku.

Rozšiřte své dovednosti s Office
Projít školení
Získejte nové funkce jako první
Připojte se k účastníkům programu Office Insiders

Byly tyto informace užitečné?

Děkujeme vám za zpětnou vazbu.

Děkujeme vám za váš názor! Pravděpodobně bude užitečné, když vás spojíme s některým z našich agentů podpory Office.

×