Beskrivning av funktionerna för konfidens-statistik i Excel

Sammanfattning

I den här artikeln beskrivs funktionen konfidens i Microsoft Office Excel 2003 och i Microsoft Office Excel 2007 visas hur funktionen används och jämför resultaten av funktionen för Excel 2003 och för Excel 2007 med resultaten från tidigare versioner av Excel.

Syftet med konfidens intervallet är ofta fel tolkat och vi försöker ge en förklaring av giltiga och ogiltiga uttryck som kan göras efter att du har fastställt ett konfidens värde från dina data.

Mer information

Funktionen konfidens tecken (alfa, Sigma, n) returnerar ett värde som du kan använda för att konstruera ett konfidens intervall för en populations medelvärde. Konfidens intervallet är ett område med värden som är centrerade med ett känt urval. Observationer i provet antas komma från en normal distribution med känd standard avvikelse, Sigma och antalet observationer i provet är n.

Syntax

CONFIDENCE(alpha,sigma,n)

Parametrar: alfa är en sannolikhet och 0 < alfa < 1. Sigma är ett positivt tal och n är ett positivt heltal som motsvarar prov storleken.

Vanligt vis är Alfa en liten sannolikhet, till exempel 0,05.

Exempel på användning

Anta att intelligens kvoten (IQ) ska komma efter en normal fördelning med standard avvikelsen 15. Du testar IQs för ett urval av 50 studenter på din lokala skola och får ett urval av 105. Du vill beräkna ett 95% konfidens intervall för populationens medelvärde. Ett 95%-eller 0,95 konfidens intervall motsvarar alfa = 1 – 0,95 = 0,05.

Om du vill visa funktionen konfidens skapar du ett tomt Excel-kalkylblad, kopierar följande tabell och markerar sedan cell a1 i ett tomt Excel-kalkylblad. Klicka på Klistra inRedigera-menyn.

Obs!: I Excel 2007 klickar du på Klistra in i gruppen Urklipp på fliken Start .

Posterna i tabellen nedan fyller i cellerna a1: B7 i kalkyl bladet.

varken

0,05

STDAV

15

n

50

medelvärde

105

= KONFIDENS (B1, B2, B3)

= NORMSINV (1-B1/2) * B2/ROT (B3)

När du har klistrat in tabellen i det nya Excel-kalkylbladet klickar du på knappen Inklistringsalternativ och sedan på Matcha målformatering.

Med det inklistrade området markerat pekar du på kolumnformat -menyn och klickar sedan på passa markering.

Obs!: I Excel 2007 klickar du på format i gruppen celler på fliken Start och sedan på Autopassa kolumn bredd.

Cell A6 visar värdet på KONFIDENS. I cell A7 visas samma värde eftersom ett samtal till konfidens (alfa, Sigma, n) returnerar resultatet av dator användning:

NORMSINV(1 – alpha/2) * sigma / SQRT(n)

Inga ändringar har gjorts direkt för FÖRTROENDEt, men NORMSINV har förbättrats i Microsoft Excel 2002 och sedan har du fler förbättringar av Excel 2002 och Excel 2007. Därför kan FÖRTROENDEt returnera andra (och förbättrade) resultat i dessa senare versioner av Excel, eftersom det är KONFIDENSts.

Det betyder inte att du bör förlora förtroende för tidigare versioner av Excel. Infelaktigheter i NORMSINV skedde vanligt vis för värden för argumenten mycket nära 0 eller nästan nära 1. I praktiken är alfa vanligt vis inställt på 0,05, 0,01 eller kanske 0,001. Värdena i alpha måste vara mycket mindre än de, till exempel 0,0000001, innan avrundnings fel i NORMSINV kan komma att notera.

Obs!: Se artikeln om NORMSINV för att diskutera beräknings skillnader i NORMSINV.

Mer information får du om du klickar på följande artikel nummer och läser artikeln i Microsoft Knowledge Base:

826772 Statistiska funktioner i Excel: NORMSINV

Tolkning av konfidens INTERVALLET

Hjälp filen för Excel för förtroende har skrivits om för Excel 2003 och för Excel 2007 eftersom alla tidigare versioner av hjälp filen gav missvisande råd om hur du tolkar resultat. I exemplen "Antag att vi i vårt exempel av 50-klienter ser att genomsnittlig längd på jobbet är 30 minuter med en populations standard avvikelse på 2,5. Vi kan vara 95 procent säkra på att populationen är i intervallet 30 +/-0,692951 "där 0,692951 är värdet som returneras av konfidens intervallet (0,05, 2,5, 50).

I det här exemplet läser slutsats "" Genomsnittlig längd för resor till arbete lika med 30 ± 0,692951 minuter eller 29,3 till 30,7 minuter ". Detta är också en instruktion om populations medelvärdet som faller inom intervallet [30 – 0,692951, 30 + 0,692951] med sannolikhet 0,95.

Innan testet som gav upphov till det här exemplet besvaras kan en klassisk statistician (i motsats till en Bayesian statistician) inte göra något meddelande om sannolikhets fördelningen för populationen. I stället är en klassisk statistician med hypotes testning.

En klassisk statistician kanske vill genomföra ett dubbels idigt hypotes test som baseras på supposition av en normal fördelning med känd standard avvikelse (till exempel 2,5), ett visst förvalt värde för populationen, μ0 och a förvald signifikansnivån (till exempel 0,05). Testets resultat baseras på värdet i det observerade urvalet (till exempel 30) och null hypotesen att populationens medelvärde ska nekas till en signifikans nivå 0,05 om det observerade provet är för långt från μ0 i båda riktningarna. Om den null hypotesen avvisas är det bara att ett sampel betyder att det är det som är mindre än 5 procent av tiden under suppositionen som μ0 är den faktiska populations medelvärdet. När testet har genomförts kan en klassisk statistician ändå inte göra något meddelande om sannolikhets fördelningen för populationen.

En Bayesian statistician, å andra sidan, skulle börja med en förmodad sannolikhets fördelning för populationen (som kallas en tidigare distribution), skulle samla in experimentella belägg på samma sätt som den klassiska statistician och skulle använda detta bevis för att ändra sin sannolikhets fördelning för populationen innebär detta att få en en efterhands distribution. Excel tillhandahåller inga statistiska funktioner som kan hjälpa en Bayesian statistician i den här försöka. De statistiska funktionerna i Excel är avsedda för klassisk Statisticians.

Konfidens intervallet är relaterade till hypotes analyser. Med hänsyn till experimentella belägg blir konfidens intervallet en kortfattad förklaring om värdena för hypotetiska populationen returnerar μ0 som skulle ge godkännandet av null hypotesen att populationen är μ0 och värdena för μ0 som skulle ge avslag den null hypotesen är att populationen är μ0. En klassisk statistician kan inte göra något meddelande om chansen att populationen innebär ett visst intervall, eftersom hon eller han aldrig gör ett antagande om sannolikhets fördelningen och sådana antaganden skulle krävas om en sådan skedde Använd experimentella belägg för att omarbeta dem.

Utforska relationen mellan hypotes test och konfidens intervall genom att använda exemplet i början av det här avsnittet. Med relationen mellan förtroende och NORMSINV i det sista avsnittet har du:

CONFIDENCE(0.05, 2.5, 50) = NORMSINV(1 – 0.05/2) * 2.5 / SQRT(50) = 0.692951

Eftersom medelvärdet är 30 är konfidens intervallet 30 +/-0,692951.

Du bör nu tänka på dubbels idigt hypotes test med signifikansnivån 0,05 enligt beskrivningen ovan som utgår från en normal fördelning med standard avvikelsen 2,5, en prov storlek på 50 och en viss hypotetisk populations medelvärde, μ0. Om det är den faktiska populations medelvärdet kommer Stick provet från en normal fördelning med populationens utgångs punkt och standard avvikelse, 2.5/rot (50). Den här distributionen är symmetrisk för μ0 och du vill avvisa null hypotesen om ABS (Sample medelvärde-μ0) > ett visst värde. Det sista värdet skulle vara sådant att om μ0 var den faktiska populations medelvärdet innebär detta ett värde på ett sampel som är högre än denna avgränsare eller ett värde på μ0 – medelvärdet högre än detta skulle inträffa med sannolikheten 0,05/2. Detta sista värde är

NORMSINV(1 – 0.05/2) * 2.5/SQRT(50) = CONFIDENCE(0.05, 2.5, 50) = 0. 692951

Så avvisa null hypotesen (population medelvärde = μ0) om något av följande påståenden är sant:

medelvärde – μ0 > 0. 692951
0 – exempel > 0. 692951

Eftersom samplet medelvärde = 30 i vårt exempel blir de här två satserna följande påståenden:

30-μ0 > 0. 692951
μ0 – 30 > 0. 692951

Om du skriver om dem så att bara μ0 visas till vänster blir följande uttryck:

μ0 < 30-0. 692951
μ0 > 30 + 0. 692951

Det här är exakt värdena för μ0 som inte är i konfidens intervallet [30 – 0,692951, 30 + 0,692951]. Därför kan konfidens intervallet [30 – 0,692951, 30 + 0,692951] innehålla dessa värden för μ0, där null hypotesen att populations medelvärdet är μ0 inte skulle nekas, baserat på exempel beviset. För värden för μ0 utanför det här intervallet är null hypotesen att populations medelvärdet för μ0 att nekas till exempel beviset.

Slut

Felaktigheter i tidigare versioner av Excel inträffar vanligt vis för extremt små eller extremt stora värden på p i NORMSINV (p). FÖRTROENDE utvärderas av att ringa NORMSINV (p), så att det blir möjligt för användare att vara säkra. Däremot är det troligt att de värden som används i praxis inte är extrema nog för att orsaka allvarliga avrundnings fel i NORMSINV och prestanda i tillförlitlighet bör inte vara ett problem för användare av någon version av Excel.

De flesta av den här artikeln är inriktade på att tolka resultaten av förtroende. Vi har med andra ord bett "Vad är syftet med konfidens intervallet?" Konfidens intervallet är ofta ett mer problem. Tyvärr har Excel-hjälpfiler i alla versioner av Excel som är tidigare än Excel 2003 bidragit till den här missförstånd. Hjälp filen för Excel 2003 har förbättrats.

Obs!:  Den här sidan har översatts automatiskt och kan innehålla grammatiska fel och andra felaktigheter. Vår avsikt är att innehållet ska vara användbart för dig. Skulle du vilja svara på om informationen var till hjälp? Här är den engelska artikeln som en referens.

Utöka dina Office-kunskaper
Utforska utbildning
Få nya funktioner först
Anslut till Office Insiders