TICAMības statistikas funkciju apraksts programmā Excel

Kopsavilkums

Šajā rakstā paskaidrota funkcija CONFIDENCE programmā Microsoft Office Excel 2003 un Microsoft Office Excel 2007, parāda, kā funkcija tiek izmantota, un tiek salīdzināti funkcijas rezultāti programmai Excel 2003 un Excel 2007 ar iepriekšējo pārliecības rezultātu Excel versijas.

Ticamības intervāla nozīme bieži ir nepareizi interpretēta, un mēs cenšamies sniegt skaidrojumu par derīgiem un nederīgiem priekšrakstiem, kurus var veikt pēc TICAMības vērtības noteikšanas no datiem.

Papildinformācija

Funkcija CONFIDENCE (alfa, Sigma, n) atgriež vērtību, ko var izmantot, lai izveidotu ticamības intervālu populācijas vidējam. Ticamības intervāls ir vērtību diapazons, kas tiek centrēts zināmā izlases vidē. Tiek pieņemts, ka izlasē iekļautie novērojumi ir no parasta sadalījuma ar zināmo standartnovirzi, Sigma un novērojumu skaits izlasē ir n.

Sintakse

CONFIDENCE(alpha,sigma,n)

Parametri: alfa ir varbūtība un 0 < alfa < 1. Sigma ir pozitīvs skaitlis, un n ir pozitīvs vesels skaitlis, kas atbilst parauga lielumam.

Parasti alfa ir neliela varbūtība, piemēram, 0,05.

Izmantošanas piemērs

Pieņemiet, ka informācijas koeficients (IQ) rādītāji atbilst parastajam sadalījumam ar 15. standartnovirzi. Testējiet IQs par 50 skolēnu izlasi savā lokālajā skolā un iegūstiet parauga vidējo vērtību 105. Vēlaties aprēķināt 95% ticamības intervālu populācijas vidējam. 95% vai 0,95 ticamības intervāls atbilst alfa = 1 – 0,95 = 0,05.

Lai ilustrētu funkciju CONFIDENCE, izveidojiet tukšu Excel darblapu, kopējiet tālāk esošo tabulu un pēc tam tukšā Excel darblapā atlasiet šūnu a1. Rediģēšanas izvēlnē noklikšķiniet uz Ielīmēt.

Piezīme.: Programmā Excel 2007 cilnes Sākums grupā Starpliktuve noklikšķiniet uz Ielīmēt .

Tabulā norādītie ieraksti darblapā aizpilda šūnas A1: B7.

alfa

0,05

Funkcija STDEV

15

n

50

izlases vidējais

105

= CONFIDENCE (B1, B2, B3)

= NORMSINV (1-B1/2) * B2/SQRT (B3)

Pēc tam, kad šo tabulu ielīmējat jaunajā Excel darblapā, noklikšķiniet uz pogas Ielīmēšanas opcijas un pēc tam noklikšķiniet uz saskaņot ar mērķa formatējumu.

Kad ielīmētais diapazons joprojām ir atlasīts, norādiet uz kolonna izvēlnē formāts un pēc tam noklikšķiniet uz Automātiski ietilpināt atlasi.

Piezīme.: Programmā Excel 2007 ar atlasītu ielīmēto šūnu diapazonu, cilnes Sākums grupā šūnas noklikšķiniet uz Formatēt un pēc tam noklikšķiniet uz Automātiski ietilpināt kolonnas platumu.

Šūnā A6 ir redzama TICAMības vērtība. Šūnā A7 ir redzama tā pati vērtība, jo uzticības signāls (alfa, Sigma, n) atgriež datora datu apstrādes rezultātu:

NORMSINV(1 – alpha/2) * sigma / SQRT(n)

Nekādas izmaiņas nekļuva netiešas, bet programmā Microsoft Excel 2002 tika uzlabota NORMSINV, un pēc tam tika veikti citi uzlabojumi starp Excel 2002 un Excel 2007. Tāpēc uzticība var atmainīt citus (un uzlabotus) rezultātus, izmantojot šīs jaunākās Excel versijas, jo uzticēšanās attiecas uz NORMSINV.

Tas nenozīmē, ka jums jāzaudē uzticēšanās iepriekšējām Excel versijām. Ir redzamas arī neprecizitātes NORMSINV, jo tās argumentam ir ļoti tuvs 0 vai ļoti tuvs 1. Praksē alfa parasti tiek iestatīts uz 0,05, 0,01 vai varbūt 0,001. Alfa vērtībām ir jābūt daudz mazākām, piemēram, 0,0000001, pirms ir pamanījis, ka programmā NORMSINV ir sagaidāmas kļūdas.

Piezīme.: Skatiet rakstu par NORMSINV, lai apspriestu ar skaitļošanas atšķirībām NORMSINV.

Lai iegūtu papildinformāciju, noklikšķiniet uz šī raksta numura, lai skatītu Microsoft zināšanu bāzes rakstu:

826772 Excel statistiskās funkcijas: NORMSINV

TICAMības rezultātu interpretēšana

Excel palīdzības fails uzticēšanās uzmeklēšanai ir pārrakstīts programmā Excel 2003 un Excel 2007, jo visas vecākas palīdzības faila versijas sniedza maldinošu padomu par rezultātu interpretāciju. Piemērs norāda, ka mēs norādīsim, ka mūsu 50 strādnieku izlasē vidējais gājiena garums ir 30 minūtes ar 2,5 populācijas standartnovirzi. Mēs varam būt 95 procenti pārliecināti, ka populācijas vidējais ir intervāls 30 +/-0,692951, kur 0,692951 ir vērtība, ko atgriež CONFIDENCE (0.05, 2,5, 50).

Šajā pašā piemērā secinājums ir šāds: "vidējais gājiens uz darbu ir vienāds ar 30 ± 0,692951 minūtēm vai 29,3 līdz 30,7 minūtēm". Iespējams, šis ir arī paziņojums par populācijas vidējo vērtību, kas atbilst intervālam [30 – 0,692951; 30 + 0,692951] ar varbūtību 0,95.

Pirms eksperimenta veikšanas, kas deva datus šim piemēram, klasiskie statistiķi (pretstatā Bajesjana statistiķim) var sniegt nekādu pārskatu par populācijas vidējā varbūtības sadalījumu. Tā vietā klasiskie statistiķi nodarbojas ar hipotēzes testēšanu.

Piemēram, klasiskā statistiķi var vēlēties veikt abpusēju hipotēzes pārbaudi, kuras pamatā ir normāls sadalījums ar zināmu standartnovirzi (piemēram, 2,5), noteikta iepriekš izvēlēta populācijas vidējā vērtība, ģ0 un a iepriekš atlasīts nozīmības līmenis (piemēram, 0,05). Testa rezultāts ir pamatots uz novērotā parauga vidējo vērtību (piemēram, 30) un nulles hipotēzi par to, ka populācijas vidējais ir ģ0, tiktu noraidīta nozīmības līmenī 0,05, ja novērotais parauga vidējais līmenis bija pārāk tālu no ģ0 jebkurā virzienā. Ja nulles hipotēze ir noraidīta, tas nozīmē, ka piemērs, kas norāda, ka tālu vai tālāk no ģ0 rastos, ir mazāks par 5% no laika saskaņā ar pieņēmumu, ka ģ0 ir patiess populācijas vidējais. Pēc šī testa veikšanas klasiskā statistiķi joprojām nevar izveidot nekādu paziņojumu par populācijas vidējā varbūtības sadalījumu.

Bajesjana statistiķi, no otras puses, sāks ar pieņemto varbūtību sadalījumu populācijas vidējam (ar nosaukumu a priori), apkopos eksperimentālos pierādījumus tādā pašā veidā kā klasiskā statistiķis, un tas izmantotu šos pierādījumus lai pārskatītu viņas vai varbūtības sadalījumu populācijas vidējam, un tādējādi iegūtu a posteriori sadalījumu. Programma Excel nesniedz statistiskas funkcijas, kas palīdzēs Bajesjana statistiķiem šajā centienos. Excel statistiskās funkcijas ir paredzētas klasiskā statistiķiem.

Ticamības intervāli ir saistīti ar hipotēzes pārbaudēm. Ņemot vērā eksperimentālos pierādījumus, ticamības intervāls sniedz kodolīgu pārskatu par hipotēzes iedzīvotāju vidējo ģ0 vērtībām, kas iegūtu nulles hipotēzes akceptēšanu, ka populācijas vidējais ir ģ0 un ģ0 vērtības, kas varētu izraisīt atteikumu no nulles hipotēzes par to, ka populācijas vidējais ir ģ0. Klasiskais statistiķis nevar sniegt pārskatu par iespēju, ka populācijas vidējais līmenis ir atsevišķā noteiktā intervālā, jo viņa nekad neveic iepriekš izklāstītos pieņēmumus par šo varbūtības sadali, un tādi pieņēmumi ir nepieciešami, ja tas būtu Izmantojiet eksperimentālus pierādījumus, lai tos pārskatītu.

Izpētiet relāciju starp hipotēzes testiem un ticamības intervālu, izmantojot šīs sadaļas sākumā esošo piemēru. Ar saistību starp uzticamību un NORMSINV, kas norādīta pēdējā sadaļā, jums ir:

CONFIDENCE(0.05, 2.5, 50) = NORMSINV(1 – 0.05/2) * 2.5 / SQRT(50) = 0.692951

Tā kā izlasē vidējais ir 30, ticamības intervāls ir 30 +/-0,692951.

Tagad apsveriet abpusēju hipotēzes testu ar nozīmības līmeni 0,05, kā norādīts iepriekš, kas pieļauj parastu sadalījumu ar standartnovirzi 2,5, piemēram, 50 un konkrētu hipotētisku populācijas vidējo vērtību, ģ0. Ja tas ir patiess populācijas vidējais, tad izlases vidējais būs no parasta sadalījuma ar populācijas vidējo ģ0 un standartnovirze, 2.5/SQRT (50). Šis sadalījums ir simetrisks attiecībā uz ģ0, un jūs vēlaties noraidīt nulles hipotēzi, ja ABS (Sample mean-ģ0) > kādu robeždatuma vērtību. Vērtība robeždatuma ir tāda, ka, ja ģ0 būtu patiess populācijas vidējais aritmētiskais, tad izlases vidējais-ģ0 vērtība ir lielāka par šo nogriešanas vērtību vai ģ0 — izlases vidējais lielums ir lielāks par šo novirzi, katram rastos ar varbūtību 0,05/2. Šī robeždatuma vērtība ir

NORMSINV(1 – 0.05/2) * 2.5/SQRT(50) = CONFIDENCE(0.05, 2.5, 50) = 0. 692951

Tādējādi noraidīt nulles hipotēzi (populācijas vidējais = ģ0), ja ir patiess viens no šiem apgalvojumiem:

Sample mean-ģ0 > 0. 692951
0 — izlases vidējais > 0. 692951

Ņemot vērā, ka izlasē vidējais = 30 mūsu piemērā šie divi paziņojumi kļūst par tālāk norādītajiem priekšrakstiem.

30-ģ0 > 0. 692951
ģ0 – 30 > 0. 692951

Tos pārrakstīt, lai kreisajā pusē tiktu parādīts tikai ģ0, kas sniedz tālāk norādītos priekšrakstus.

ģ0 < 30-0. 692951
ģ0 > 30 + 0. 692951

Tās ir tieši ģ0 vērtības, kas nav ticamības intervālā [30 – 0,692951, 30 + 0,692951]. Tāpēc ticamības intervāls [30 – 0,692951; 30 + 0,692951] satur tās ģ0 vērtības, kuru nulles hipotēzi, ko populācijas vidējais ir ģ0, netiktu noraidītas, ņemot vērā parauga pierādījumus. Ģ0 vērtībām ārpus šī intervāla tiek noraidīta nulles hipotēze par to, ka populācijas vidējais ir ģ0, ņemot vērā parauga pierādījumus.

Vieglāk secinājumus

Neprecizitātes agrākās programmas Excel versijās parasti ir ļoti mazas vai ļoti lielas vērtības no p šūnā NORMSINV (p). TICAMības novērtējums tiek novērtēts, zvanot uz NORMSINV (p), tāpēc NORMSINV precizitāte ir potenciāla problēma, kas attiecas uz uzticēšanās lietotājiem. Taču praksē izmantoto p vērtību, iespējams, nav pietiekami lielas, lai izraisītu ievērojamas apaļās kļūdas, kas rodas NORMSINV, un uzticības veiktspēju nevajadzētu interesēt jebkuras programmas Excel versijas lietotājiem.

Lielākajā daļā šī raksta galvenā uzmanība ir pievērsta izpratnei par uzticēšanās rezultātiem. Citiem vārdiem sakot, mēs esam lūguši "kas ir ticamības intervāla nozīme?" Ticamības intervāls bieži tiek pārprasts. Diemžēl Excel palīdzības faili visās Excel versijās, kas ir vecākas par Excel 2003, ir veicinājuši šo maldīgo izpratni. Excel 2003 palīdzības fails ir uzlabots.

Piezīme.:  Šī lapa ir tulkota automatizēti, un tajā var būt gramatiskas kļūdas un neprecizitātes. Mūsu nolūks ir šo saturu padarīt jums noderīgu. Vai jūs varat mūs informēt, vai informācija bija noderīga? Šeit ir raksts angļu valodā jūsu atsaucei.​

Paplašiniet savas Office prasmes
Iepazīties ar apmācību
Esiet pirmais, kas saņem jaunās iespējas
Pievienoties Office Insider programmai

Vai šī informācija bija noderīga?

Paldies par jūsu atsauksmēm!

Paldies par atsauksmēm! Šķiet, ka jums varētu būt noderīgi sazināties ar kādu no mūsu Office atbalsta speciālistiem.

×