Office
Pierakstīties

Analīzes rīku komplekta izmantošana salikto datu analīzes vajadzībām

Piezīme.:  Mēs vēlamies sniegt jums visjaunāko palīdzības saturu jūsu valodā, cik vien ātri to varam. Šī lapa ir tulkota automatizēti, un tajā var būt gramatiskas kļūdas un neprecizitātes. Mūsu nolūks ir šo saturu padarīt jums noderīgu. Vai lapas lejasdaļā varat mums pavēstīt, vai informācija jums noderēja? Ērtai atsaucei šeit ir šis raksts angļu valodā .

Ja jāizstrādā kompleksā statistiskā vai tehniskā analīze, izmantojot analīzes rīku komplektu, var samazināt veicamo darbību skaitu un laiku. Jūs nodrošināt datus un parametrus katrai analīzei un rīks izmanto atbilstīgas statistiskās vai tehniskās makro funkcijas, lai aprēķinātu un rādītu rezultātus izvades tabulā. Daži rīki papildus izvades tabulām ģenerē diagrammas.

Datu analīzes funkcijas var vienlaikus izmantot tikai vienā darblapā. Veicot datu analīzi grupētās darblapās, rezultāti tiek rādīti pirmajā darblapā un pārējās darblapās tiek rādītas tukšas formatētas tabulas. Lai veiktu datu analīzi pārējās darblapās, pārrēķiniet analīzes rīku katrā darblapā.

Analīzes rīku komplektā ir iekļauti tālāk esošajās sadaļās aprakstītie rīki. Lai piekļūtu šiem rīkiem, cilnes Dati grupā Analīze noklikšķiniet uz Datu analīze. Ja komanda Datu analīze nav pieejama, jāielādē analīzes rīku komplekta pievienojumprogramma.

  1. Noklikšķiniet uz cilnes Fails, Opcijas un pēc tam uz kategorijas Pievienojumprogrammas.

    Ja izmantojat Excel 2007, noklikšķiniet uz Microsoft Office pogas pogas attēls un pēc tam uz Excel opcijas

  2. Lodziņā Pārvaldīt atlasiet Excel pievienojumprogrammas un pēc tam noklikšķiniet uz Doties uz.

    Ja izmantojat Excel for Mac izvēlnē Fails, dodieties uz sadaļu Rīki > Excel pievienojumprogrammas

  3. Lodziņā Pievienojumprogrammas atzīmējiet izvēles rūtiņu Analīzes rīku komplekts un pēc tam noklikšķiniet uz Labi.

    • Ja lodziņā Pieejamās pievienojumprogrammas nav norādīta opcija Analīzes rīku komplekts, noklikšķiniet uz Pārlūkot, lai to atrastu.

    • Ja tiek parādīta uzvedne, kas informē par to, ka analīzes rīku komplekts nav instalēts datorā, noklikšķiniet uz , lai to instalētu.

Piezīme.: Lai analīzes rīku komplektā iekļautu programmu Visual Basic for Application (VBA), var ielādēt analīzes rīku komplekta - VBA pievienojumprogrammu tādā pašā veidā, kā ielādējot analīzes rīku komplektu. Lodziņā Pieejamās pievienojumprogrammas atzīmējiet izvēles rūtiņu Analīzes rīku komplekts - VBA.

Anova analīzes rīki piedāvā dažādus dispersijas analīzes tipus. Izmantojamie rīki ir atkarīgi no daudziem faktoriem un paraugu skaita, kurus ieguvis no populācijas, kuru vēlaties testēt.

Anova: Vienfaktors

Ar šo rīku tiek veikta vienkārša dispersijas analīze par divu vai vairāku piemēru datiem. Analīze sniedz hipotēzes testu, ka katrs paraugs ir izvilkts no tās pašas pamatā esošās iespējamības attiecībā pret alternatīvo hipotēzi, ka pamatā esošie varbūtības sadalījumi nav vienādi visiem paraugiem. Ja ir tikai divi paraugi, var izmantot darblapas funkciju T.TEST. Ar vairāk nekā diviem paraugiem nav T.TEST ar piemērotu apkopojumu un tā vietā var nosaukt viena faktora Anova modeli.

Anova: Divfaktors ar replicēšanu

Šis analīzes rīks ir noderīgs, kad datus var klasificēt divās dažādās dimensijās. Piemēram, augu garumu mērīšanas eksperimentā augiem var dot dažādu veidu mēslojumu (piemēram, A, B, C) un tos var turēt arī dažādās temperatūrās (piemēram, zemā, augstā). Katram no sešiem iespējamiem pāriem {mēslojums, temperatūra} ir vienāds augu garuma novērojumu skaits. Izmantojot šo Anova rīku, var pārbaudīt:

  • Vai augu garumi dažādu veidu mēslojumiem tiek izvilkti no tās pašas pamatā esošās populācijas. Šai analīzei temperatūra tiek ignorēta.

  • Vai arī augu garumi dažādos temperatūras līmeņos tiek izvilkti no tās pašas pamatā esošās populācijas. Šai analīzei mēslojumu veidi tiek ignorēti.

Aprēķinot atšķirību efektu starp mēslojumu veidiem, kas atrodamas pirmajā punktā ar aizzīmi, un atšķirības pēc temperatūras, kas atrodamas otrajā punktā ar aizzīmēm, seši paraugi, kas pārstāv visus vērtību {mēslojums, temperatūra} pārus, tiek izvilkti no tās pašas populācijas. Alternatīvā hipotēze ir tāda, ka efekti rodas atbilstīgi konkrētiem pāriem {mēslojums, temperatūra} pāri un virs atšķirībām, kas pamatotas tikai uz mēslojumu vai tikai uz temperatūru.

Ievades diapazona iestatījums Anova rīkam

Anova: Divfaktors bez replicēšanas

Šis analīzes rīks ir noderīgs, ja dati tiek klasificēti divās dažādās dimensijās kā divu faktoru gadījumā ar replicēšanu. Tomēr šim rīkam ir pieņemts, ka katram pārim ir tikai viens novērojums (piemēram, katrs pāris {mēslojums, temperatūra} iepriekšējā piemērā).

Darblapas funkcija CORREL un PEARSON aprēķina korelācijas koeficientu starp diviem mērījuma mainīgajiem, ja katra mainīgā mērījumi tiek novēroti katrai no N tēmām. (Katrs jebkuras tēmas trūkstošais novērojums liek ignorēt šo tēmu analīzē.) Korelācijas analīzes rīks ir īpaši noderīgs, ja katrai no N tēmām ir vairāk nekā divi mērīšanas mainīgie. Tas nodrošina izvades tabulu, korelācijas matricu, kurā redzama CORREL (vai PEARSON) vērtība, ko lieto katram iespējamam mērījuma mainīgo pārim.

Korelācijas koeficients līdzīgi kovariācijai ir apjoma mērījums, kurā divi mērījuma mainīgie tiek "variēti kopā". Atšķirībā no kovariācijas korelācijas koeficients ir mērogots tā, lai tā vērtība nebūtu atkarīga no vienībām, kurās izteikti mērījuma mainīgie. (Piemēram, divi mērījuma mainīgie ir svars un augstums, korelācijas koeficienta vērtība ir nemainīta, ja svars tiek konvertēts no mārciņām uz kilogramiem.) Katra korelācijas koeficienta vērtībai ir jābūt no -1 līdz +1 (ieskaitot).

Korelācijas analīzes rīku var izmantot, lai pārbaudītu katru mērījuma mainīgo pāri un noteiktu, vai abiem mērījuma mainīgajiem ir tendence pārvietoties kopā — tas ir, viena mainīgā lielajām vērtībām ir tendence būt saistītām ar otra lielajām vērtībām (pozitīvā korelācija), vai viena mainīgā mazajām vērtībām ir tendence būt saistītām ar otra lielajām vērtībām (negatīvā korelācija) vai arī abu mainīgo vērtībām ir tendence būt nesaistītām (korelācija pie 0 (nulle)).

Ja ir N dažādi mērījumu mainīgie, kas novēroti personu kopā, korelācijas un kovariācijas rīkus var izmantot vienā iestatījumā. Korelācijas un kovariācijas rīki dod izvades tabulu, matricu, kas rāda korelācijas koeficientu vai kovariāciju atbilstīgi starp katru mērījuma mainīgo pāri. Atšķirība ir tāda, ka korelācijas koeficienti ir mērogoti atrasties starp -1 un +1 ieskaitot. Atbilstīgās kovariācijas netiek mērogotas. Gan korelācijas koeficients, gan kovariācija ir mērījumi, kurā divi mainīgie "variējas kopā".

Kovariācijas rīks aprēķina darblapas funkcijas COVARIANCE.P vērtību katram mērījuma mainīgo pārim. (Ja ir tikai divi mērījuma mainīgie, tas ir, N=2, tiešā COVARIANCE.P ir vairāk piemērota nekā kovariācijas rīks. Ievadne kovariācijas rīka izvadnes tabulas diagonālē rindā i, kolonnā i ir i mērījuma mainīgā kovariācija ar sevi. Tā ir tikai populācijas dispersija šim mainīgajam, kā to aprēķina darblapas funkcija VAR.P.

Varat izmantot kovariācijas rīku, lai pārbaudītu katru lieluma mainīgo pāri un noteiktu, vai divi lieluma mainīgie tiecas sastapties — tas ir, vai viena mainīgā lielās vērtības var tikt saistītas ar otra mainīgā lielajām vērtībām (pozitīvā kovariācija), vai viena mainīgā mazās vērtības var tikt saistītas ar otra mainīgā lielajām vērtībām (negatīvā kovariācija), vai, iespējams, abu mainīgo vērtības nevar tikt saistītas (kovariācija tuva 0 (nullei)).

Aprakstošās statistikas analīzes rīks ģenerē nemainītās statistikas atskaiti datiem ievades diapazonā, sniedzot informāciju par centrālo tendenci un datu mainīgumu.

Eksponenciālās nogludināšanas analīzes rīks prognozē vērtību, pamatojoties uz iepriekšējā perioda analīzi, kurš ir pielāgots kļūdai šajā iepriekšējā prognozē. Rīks izmanto nogludināšanas konstanti a, kuras lielums nosaka, cik lielā mērā prognozes atbilst kļūdām iepriekšējā prognozē.

Piezīme.: Piemērota nogludināšanas konstantes vērtība ir no 0,2 līdz 0,3. Šīs vērtības norāda, ka pašreizējo prognozi vajadzētu pielāgot par 20-30 procentiem kļūdai iepriekšējā prognozē. Lielākas konstantes izveido ātrāku atbildi, bet var izveidot neparastas projekcijas. Mazākas konstantes var izveidot ilgus kavējumus prognozes vērtībām.

F testa divparauga dispersiju analīzes rīks veic divparaugu F testu, lai salīdzinātu divas populācijas dispersijas.

Piemēram, var izmantot F testa rīku laiku paraugos peldēšanas sacensībām katrai no divām komandām. Rīks sniedz nulles hipotēzes testa rezultātu, ka šie divi paraugi nāk no vienādu dispersiju sadalījuma attiecībā pret alternatīvu, ka dispersijas nav vienādas ar spēkā esošajiem sadalījumiem.

Rīks aprēķina F statistikas (vai F koeficienta) vērtību. F vērtība, kas ir tuva 1, sniedz pierādījumu, ka spēkā esošās populācijas dispersijas ir vienādas un "F kritiskais viensekojums" sniedz kritisko vērtību, kas ir mazāka par 1 izvēlētajam nozīmīguma līmenim alfa. Ja f > 1, "P(F <= f) viensekojums" dod iespējamību novērot F statistikas vērtību, kas ir lielāka par f, kad populācijas dispersijas ir vienādas un "F kritiskais viensekojums" dod kritisko vērtību, kas ir lielāka par 1 līmenim alfa.

Fourier analīzes rīks risina problēmas lineārās sistēmās un analizē periodiskos datus, datu transformēšanai izmantojot ātrās Fourier transformēšanas (FFT) metodi. Šis rīks atbalsta arī inversās transformācijas, kurās transformēto datu inverss tiek atgriezts uz sākotnējiem datiem.

Ievades un izvades diapazoni Fourier analīzei

Histogrammas analīzes rīks aprēķina atsevišķos un kumulatīvos sastopamības biežumus šūnas datu diapazonam un datu nodalījumiem. Šis rīks ģenerē datus vērtības gadījumu skaitam datu kopā.

Piemēram, klasē, kurā ir 20 audzēkņi, var noteikt rezultātu izplatību burtu kategorijās. Histogrammas tabula attēlo burtu kategorijas robežas un rezultātu skaitu starp zemāko robežu un pašreizējo robežu. Atsevišķs visbiežākais rezultāts ir datu režīms.

Padoms.: Programmā Excel 2016 tagad var izveidot histogrammas vai Pareto diagrammu.

Mainīgā vidējā analīzes rīks projektē vērtības prognozes periodā, pamatojoties uz mainīgā vidējo vērtību konkrētā iepriekšējo periodu skaitā. Vidējais mainīgais sniedz tendences informāciju, ko maskētu visu vēsturisko datu vienkāršs vidējais. Lietojiet šo rīku, lai prognozētu pārdošanu, krājumus vai citas tendences. Katras budžeta vērtības pamatā it tālāk norādītā formula.

Formula mainīgo vidējo aprēķināšanai

kur:

  • N ir iepriekšējo periodu skaits, kas jāiekļauj vidējā mainīgajā

  • A j ir faktiskā vērtība laikā j

  • F j ir prognozētā vērtība laikā j

Dažādu skaitļu ģenerēšanas analīzes rīks aizpilda diapazonu ar neatkarīgiem dažādiem skaitļiem, kas ir izvilkti no vienas no vairākām izplatībām. Tēmas populācijā var raksturot ar varbūtības sadalījumu. Piemēram, var izmantot parastu izplatību, lai raksturotu personu garumu populāciju, vai arī var izmantot divu iespējamo iznākumu Bernulli sadalījumu, lai raksturotu apgriezto rezultātu populāciju.

Ranga un procentiles analīzes rīks izveido tabulu, kurā ir iekļauts katras vērtības rangs un procentuālā kategorija datu kopā. Var analizēt saistīto vērtību stāvokli datu kopā. Šis rīks izmanto darblapas funkciju RANK.EQ un PERCENTRANK.INC. Ja vēlaties uzskaitīt saistītas vērtības, izmantojiet funkciju RANK.EQ, kas saistītas vērtības apstrādā kā vērtības ar vienādu rangu, vai arī izmantojiet funkciju RANK.AVG, kas atgriež saistīto vērtību vidējo rangu.

Regresijas analīzes rīks veic lineārās regresijas analīzi, lietojot "mazāko kvadrātu" metodi, lai caur novērojumu kopu iekļautos līnijā. Var analizēt, kā vienu atkarīgo mainīgo ietekmē vienu vai vairāku neatkarīgo mainīgo vērtības. Piemēram, var analizēt, kā sportista veiktspēju ietekmē tādi faktori kā vecums, garums un svars. Var piešķirt koplietojumus veiktspējas mērvienībā katram no šiem trim faktoriem, pamatojoties uz veiktspējas datu kopu, un pēc tam izmantot rezultātus, lai paredzētu jauna, nepārbaudīta sportista veiktspēju.

Regresijas rīks izmanto darblapas funkciju LINEST.

Iztveršanas analīzes rīks izveido paraugu no populācijas, apstrādājot ievades diapazonu kā populāciju. Ja populācija ir pārāk liela apstrādei vai diagrammai, varat izmantot attēlojošu paraugu. Var izveidot arī paraugu, kurā ir tikai vērtības no konkrētas cikla daļas, ja uzskatāt, ka ievades dati ir periodiski. Piemēram, ja ievades diapazons satur ceturkšņa pārdošanas skaitļus, iztveršana notiek ar periodisku četru vietu pārraides ātrumu vērtībām no tā paša ceturkšņa izvades diapazonā.

Divu paraugu T testa analīzes rīku pārbaude populācijas vienādībai nozīmē, kas ir zem katra parauga. Trīs rīki izmanto dažādus pieņēmumus: ka populācijas dispersijas ir vienādas, ka populācijas dispersijas nav vienādas un ka divi paraugi attēlo pirmsapstrādes un pēcapstrādes novērojumus tām pašām tēmām.

Trim tālākminētajiem rīkiem T statistiskā vērtība T tiek aprēķināta un parādīta kā "t Stat" izvades tabulās. Atbilstīgi datiem šī vērtība var būt negatīva vai pozitīva. Ar vienādu spēkā esošās populācijas pieņēmumu tas nozīmē, ka, ja t < 0, "P(T <= t) viensekojums" sniedz iespējamību, ka tiks novērota t-statistikas vērtība, kas ir vairāk negatīva nekā t. Ja t >=0, "P(T <= t) viensekojums" sniedz iespējamību, ka t-statistikas vērtību var novērot lielāku vai vienādu ar "t kritisko viensekojumu" ir alfa.

"P(T <= t) divsekojums" sniedz iespējamību, ka t-statistikas vērtību var novērot lielāku vai vienādu ar t. "P kritiskais divsekojums" sniedz starpības vērtību, tādējādi novērotās t-statistikas iespējamība absolūtajā vērtībā, kas lielāka par "P kritisko divsekojumu", ir alfa.

t tests: divi pāra paraugi vidējiem

Var izmantot pāra testu, ja paraugos ir dabiski novērojumu pāri, piemēram, divreiz testējot paraugu grupu — pirms un pēc eksperimenta. Šis analīzes rīks un tā formula veic divparaugu pāru studenta T testu, lai noteiktu, vai novērojumi, kas tika veikti pirms apstrādes, un novērojumi, kas tika veikti pēc apstrādes, ir nākuši no izplatībām ar vienādiem populācijas vidējiem. Šī T testa forma nepieņem, ka abu populāciju dispersijas ir vienādas.

Piezīme.: Starp šī rīka ģenerētajiem rezultātiem ir pūlotā dispersija, uzkrātais datu izplatības mērījums par vidējo, kas iegūts no šīs formulas.

Formula pūlotās dispersijas aprēķināšanai

t tests: divu izlašu pieņemšana vienādās dispersijās

Šis analīzes rīks veic divu izlašu studenta T testu. Šī T testa forma pieņem, ka divas datu kopas nāk no sadalījumiem ar vienādām dispersijām. Uz to atsaucas kā uz homoskedastisku T testu. Šo T testu var izmantot, lai noteiktu, cik liela ir iespējamība, ka abi piemēri ir nākuši no sadalījumiem ar vienādiem populācijas vidējiem.

t tests: divu izlašu pieņemšana nevienādās dispersijās

Šis analīzes rīks veic divu izlašu studenta T testu. Šī T testa forma pieņem, ka divas datu kopas nāk no sadalījumiem ar nevienādām dispersijām. Uz to atsaucas kā uz heteroscedastisko T testu. Tāpat kā iepriekšējā vienādo dispersiju gadījumā šo T testu var izmantot, lai noteiktu, vai abi piemēri, kā liekas, ir nākuši no sadalījumiem ar vienādiem populācijas vidējiem. Izmantojiet šo testu, ja abos paraugos ir atšķirīgas tēmas. Izmantojiet pāru testu, kas aprakstīts šajā piemērā, ja ir atsevišķa tēmu kopa un divi paraugi attēlo mērījumus katrai tēmai pirms un pēc apstrādes.

Lai noteiktu statistisko vērtību t, izmanto tālāk norādīto formulu.

Formula vērtības t aprēķināšanai

Šo formulu izmanto brīvības pakāpju aprēķināšanai, df. Tā kā aprēķina rezultāts parasti nav vesels skaitlis, df vērtība tiek noapaļota uz tuvāko veselo skaitli, lai iegūtu kritisko vērtību no t tabulas. Excel darblapas funkcija T.TEST izmanto aprēķināto df vērtību bez noapaļošanas, jo var aprēķināt T.TEST vērtību ar df, kas nav vesels skaitlis. Iemesls tam, ka T.TEST rezultāti un šis t-testa rīks atšķiras nevienādu dispersiju gadījumā, ir dažādās pieejas brīvības līmeņu noteikšanai.

Formula brīvības pakāpju saskaņošanai

Z tests: divi paraugi līdzekļu analīzes rīkam veic divu paraugu Z testu vidējiem ar zināmām dispersijām. Šis rīks tiek lietots, lai pārbaudītu nulles hipotēzi, ka nav atšķirības starp diviem populācijas vidējiem pret vienpusēju vai divpusēju alternatīvu hipotēzēm. Ja dispersijas nav zināmas, tā vietā jāizmanto darblapas funkcija Z.TEST.

Izmantojot Z testa rīku, uzmanieties, lai pareizi izprastu izvadi. "P(Z <= z) viensekojums" faktiski ir P(Z >= ABS(z)), z vērtības iespējamība tālāk no 0 tajā pašā virzienā kā novērotā z vērtība, ja nav atšķirības starp populācijas līdzekļiem. "P(Z <= z) divsekojums" faktiski ir P(Z >= ABS(z) vai Z <= -ABS(z)), z vērtības iespējamība tālāk no 0 jebkurā virzienā nekā novērotā z vērtība, ja nav atšķirības starp populācijas līdzekļiem. Divsekojumu rezultāts ir vienkārši viensekojuma rezultāts, kas reizināts ar 2. Z testa rīku var arī izmantot gadījumam, kur nulles hipotēze ir tā, ka nav konkrētas vērtības, kas nav nulle atšķirībai starp diviem populācijas vidējiem. Piemēram, šo testu var izmantot, lai noteiktu atšķirības starp divu automašīnu modeļu veiktspēju.

Vai nepieciešama papildu palīdzība?

Vienmēr varat pajautāt speciālistiem Excel Tech kopienā, saņemt atbalstu Answers kopienā vai ieteikt jaunu līdzekli vai uzlabojumu vietnē Excel User Voice.

Skatiet arī

Histogrammas izveide programmā Excel 2016

Pareto diagrammas izveide programmā Excel 2016

Noskatieties video, lai analīzes rīku komplekta un Risinātāja pievienojumprogrammas instalēšana un aktivizēšana

TEHNISKĀS funkcijas (atsauce)

STATISTIKAS funkcijas (atsauce)

Pārskats par formulām programmā Excel

Kā nepieļaut kļūdainas formulas

Kļūdu atrašana un izlabošana formulās

Excel īsinājumtaustiņi un funkciju taustiņi

Excel funkciju saraksts (pēc alfabēta)

Excel funkciju saraksts (pēc kategorijas)

Paplašiniet savas Office prasmes
Iepazīties ar apmācību
Esiet pirmais, kas saņem jaunās iespējas
Pievienoties Office Insider programmai

Vai šī informācija bija noderīga?

Paldies par jūsu atsauksmēm!

Paldies par atsauksmēm! Šķiet, ka varētu būt noderīgi sazināties ar kādu no mūsu Office atbalsta aģentiem.

×