Analüüsi tööriistapaketi kasutamine keeruliste andmeanalüüside jaoks

NB! :  See artikkel on masintõlgitud, vaadake lahtiütlust. Selle artikli ingliskeelse versiooni leiate aadressilt (viiteks).

Kui soovite läbi viia keerukat statistilist või tehnilist analüüsi, saate analüüsi tööriistapaketi lisandmooduli Analysis ToolPak abil säästa oma vaeva ja aega. Esitage iga analüüsi jaoks andmed ja parameetrid ning vastav tööriist arvutab ja kuvab sobivaid statistilisi või tehnilisi makrofunktsioone kasutades tulemused väljundtabelis. Mõned tööriistad loovad lisaks väljundtabelitele ka diagramme.

Andmeanalüüsi funktsioone saate kasutada vaid ühel töölehel korraga. Rühmitatud töölehtede andmete analüüsimisel kuvatakse esimesel töölehel tulemused ja ülejäänud töölehtedel tühjad vormindatud tabelid. Ülejäänud töölehtede andmete analüüsimiseks tuleb iga töölehe jaoks teha analüüsiriista ümberarvutus.

Järgmistes jaotistes kirjeldatakse analüüsi tööriistapaketi lisandmoodulis Analysis ToolPak sisalduvaid tööriistu. Tööriistadele juurdepääsemiseks klõpsake menüü Andmed jaotise Analysis (Analüüs) nuppu Data Analysis (Andmete analüüs). Kui nupp Data Analysis (Andmete analüüs) pole saadaval, tuleb andmete tööriistapaketi lisandmoodul Analysis ToolPak laadida.

  1. Klõpsake menüüs Fail nuppu Suvandid ja seejärel kategooriat Lisandmoodulid.

    Kui kasutate Excel 2007, klõpsake Microsoft Office'i nuppu Office'i nupu pilt ja siis nuppu Exceli suvandid

  2. Valige ripploendist Halda väärtus Exceli lisandmoodulid ja klõpsake siis nuppu Mine.

    Kui kasutate Excel for Mac, klõpsake menüüs Fail valige Tööriistad > Exceli lisandmoodulid

  3. Dialoogiboksis Lisandmoodulid ruut Analüüsi tööriistapakett ja seejärel klõpsake nuppu OK.

    • Kui loendis Saadaolevad lisandmoodulid pole väärtust Analüüsi tööriistapakett, klõpsake selle otsimiseks nuppu Sirvi.

    • Kui kuvatakse teade, et analüüsi tööriistapaketi lisandmoodul Analysis ToolPak pole teie arvutisse praegu installitud, klõpsake selle installimiseks nuppu Jah.

Märkus. : Analüüsi tööriistapaketi lisandmoodulile Analysis ToolPak mooduli Visual Basic for Application (VBA) funktsioonide lisamiseks saate sarnaselt analüüsi tööriistapaketi lisandmooduliga laadida ka mooduli Analüüsi tööriistapakett – VBA. Märkige boksis Saadaolevad lisandmoodulid ruut Analüüsi tööriistapakett – VBA.

Dispersioonanalüüsi tööriistad hõlmavad dispersioonianalüüsi jaoks mitmesuguseid võimalusi. See, millist tööriista peaksite kasutama, sõltub tegurite ja testitavate populatsioonide puhul saadaolevate valimite arvust.

Üheteguriline Dispersioonanalüüs

See tööriist on ette nähtud kahel või enamal valimil põhinevate andmete dispersiooni lihtsa analüüsi jaoks. Analüüsi käigus võrreldakse hüpoteesi, et iga valim on võetud samast aluseks olevast tõenäosusjaotusest, alternatiivse hüpoteesiga, et aluseks olevad tõenäosusjaotused pole kõigi valimite puhul samad. Kui valimeid on ainult kaks, võite kasutada töölehefunktsiooni T.TEST. Rohkem kui kahe valimi puhul pole T.TEST-i jaoks mugavat üldistust olemas ning selle asemel võib kasutada ühe teguriga dispersioonanalüüsi.

ANOVA: Kahekordne kordusega Dispersioonanalüüs

Sellest analüüsiriistast on kasu juhul, kui andmeid saab liigitada kahe erineva dimensioonina. Oletagem näiteks, et taimede kõrguse mõõtmiseks korraldatud katse raames on taimedele antud erinevat sorti väetist (nt A, B, C) ja lisaks on taimi hoitud erineval temperatuuril (nt madalal ja kõrgel). Võimalikke paare {väetis, temperatuur} on seega kokku kuus ning iga paari puhul on olemas võrdne arv taimede kõrguse vaatlusandmeid. Selle dispersioonanalüüsi tööriista abil saame testida järgmist:

  • kas taimede kõrgused erinevate väetisesortide puhul pärinevad samast aluseks võetud populatsioonist (selle analüüsi puhul ignoreeritakse temperatuuri);

  • kas taimede kõrgused erinevate temperatuuritasemete puhul pärinevad samast aluseks võetud populatsioonist (selle analüüsi puhul ignoreeritakse väetisesorte);

kas siis, kui arvesse on võetud esimeses loendipunktis väetisesortide puhul põhjustatud erinevuste mõju ning teises loendipunktis temperatuurist põhjustatud erinevuste mõju, on kõiki väärtuste {väetis, temperatuur} paare esindavad valimid võetud samast populatsioonist. Alternatiivne hüpotees väidab, et kindlate väärtuste {väetis, temperatuur} paaride teatud mõjud ei sõltu ainult väetisest või ainult temperatuurist põhjustatud erinevustest.

sisendvahemik häälestamise anova tööriist

ANOVA: Kahekordne Korduseta Dispersioonanalüüs

Sellest analüüsiriistast on abi juhul, kui andmed on liigitatud kahe erineva dimensioonina (nagu ka kahe teguri ja kordamisega juhtumis). Selle tööriista kasutamisel aga eeldatakse, et iga paari (nt eelnevas näites iga paari {väetis, temperatuur}) puhul on tehtud ainult üks vaatlus.

Töölehefunktsioonid CORREL ja PEARSON arvutavad kahe mõõdetava muutuja vahelise korrelatsioonikordaja, kui iga muutuja osas vaadeldakse mõõtmisi iga N objekti puhul. (Kui mõne objekti puhul on vaatlus puudu, ignoreeritakse seda objekti analüüsis.) Korrelatsioonianalüüsi tööriistast on eriti kasu siis, kui iga N objekti puhul on mõõdetavaid muutujaid rohkem kui kaks. See tööriist koostab väljundtabeli ehk korrelatsioonimaatriksi, kus kuvatakse igale võimalikule mõõdetavate muutujate paarile rakendatud funktsiooni CORREL (või PEARSON) väärtus.

Korrelatsioonikordaja mõõdab sarnaselt kovariatsiooniga kahe mõõdetava muutuja "koos muutumise" ulatust. Erinevalt kovariatsioonist muutub korrelatsioonikordaja nii, et selle väärtus ei sõltu ühikutest, milles mõõdetavaid muutujaid väljendatakse. (Kui mõõdetavad muutujad on näiteks mass ja pikkus, jääb korrelatsioonikordaja väärtus muutumatuks ka siis, kui mass teisendatakse naeltest kilogrammideks.) Korrelatsioonikordaja väärtus peab alati jääma vahemikku -1 kuni +1 (kaasa arvatud).

Korrelatsioonianalüüsi tööriista abil saate iga mõõdetavate muutujate paari analüüsida, määratlemaks, kas mõlemad mõõdetavad muutujad kalduvad koos liikuma – kas ühe muutuja suured väärtused kalduvad seostuma teise muutuja suurte väärtustega (positiivne korrelatsioon), kas ühe muutuja väikesed väärtused kalduvad seostuma teise muutuja suurte väärtustega (negatiivne korrelatsioon) või kas mõlema muutuja väärtused kalduvad olema omavahel seostamatud (nullilähedane korrelatsioon).

Tööriistu Korrelatsioon ja Kovariatsioon saab koos kasutada olukorras, kus teatud isikutekogumi puhul vaadeldakse N-hulka erinevaid mõõdetavaid muutujaid. Mõlemad tööriistad (Korrelatsioon ja Kovariatsioon) koostavad väljundtabeli ehk maatriksi, kus kuvatakse vastavalt siis iga mõõdetavate muutujate paari korrelatsioonikordaja või kovariatsioon. Erinevus on selles, et korrelatsioonikordajad paigutatakse skaalal vahemikku -1 kuni +1 (kaasa arvatud). Vastavaid kovariatsioone skaalale ei paigutata. Nii korrelatsioonikordaja kui ka kovariatsioon mõõdavad kahe muutuja koos muutumise ulatust.

Kovariatsiooni tööriist arvutab iga mõõdetavate muutujate paari puhul töölehefunktsiooni COVARIANCE.P väärtuse. (Kui mõõdetavaid muutujaid on ainult kaks ehk N=2, on funktsiooni COVARIANCE.P kasutamine kovariatsiooni tööriistale mõistlikuks alternatiiviks.) Kovariatsiooni tööriista väljundtabeli diagonaalil rea i ja veeru i lõikepunktis asuv kirje on i-nda mõõdetava muutuja kovariatsioon iseendaga. See on lihtsalt selle muutuja töölehefunktsiooni VAR.P arvutatud populatsiooni dispersioon.

Kovariatsioonianalüüsi tööriista abil saate iga mõõdetavate muutujate paari analüüsida, määratlemaks, kas mõlemad mõõdetavad muutujad kalduvad koos liikuma – kas ühe muutuja suured väärtused kalduvad seostuma teise muutuja suurte väärtustega (positiivne kovariatsioon), kas ühe muutuja väikesed väärtused kalduvad seostuma teise muutuja suurte väärtustega (negatiivne kovariatsioon) või kas mõlema muutuja väärtused kalduvad olema omavahel seostamatud (nullilähedane kovariatsioon).

Kirjeldava statistika analüüsiriist loob sisendvahemikus leiduvate andmete kohta ühe muutujaga statistika aruande, sisaldades teavet andmete keskmise ja hajuvuse kohta.

Eksponentsilumise analüüsiriist ennustab eelneva perioodi prognoosil põhinevat ja selle vea osas täpsustatud väärtust. Tööriist kasutab silumiskonstanti a, mille suurusjärk määratleb, kui täpselt reageerivad prognoosid eelmise prognoosi vigadele.

Märkus. : Väärtused 0,2–0,3 on mõistlikud silumiskonstandid. Need väärtused osutavad, et praegust prognoosi tuleks eelmises prognoosis esinenud vigu arvestades korrigeerida 20–30%. Suuremad tegurid annavad kiirema vastuse, kuid projektsioon võib olla vigane. Väiksemate tegurite puhul võib prognoosiväärtustega kaasneda pikem viivitus.

F-Testi analüüsitööriist Kaks valimit dispersioonide jaoks teostab kahe populatsioonidispersiooni võrdlemiseks kahe valimiga F-testi.

Näiteks võite F-Testi tööriista kasutada kahe meeskonna ujumisvõistluses saavutatud aegade valimite osas. Tulemi saamiseks võrdleb tööriist nullhüpoteesi, et mõlemad valimid pärinevad võrdse dispersiooniga jaotustest, alternatiivse hüpoteesiga, et vastavate jaotuste dispersioonid pole võrdsed.

Tööriist arvutab F-statistiku (ehk F-suhte) f-väärtuse. Kui f-väärtus on 1 lähedal, siis osutab see, et aluseks olevad populatsioonidispersioonid on võrdsed. Kui väljundtabelis on f < 1 "P(F <= f) ühepoolne", annab see tõenäosuse, et võrdsete populatsioonidispersioonide puhul on F-statistiku väärtus vaatlemisel väiksem kui f, ning "F-statistiku kriitiline ühepoolne" annab valitud olulisuse nivoo alfa puhul tulemiks, et kriitiline väärtus on väiksem kui 1. Kui f > 1, "P(F <= f) ühepoolne", annab see tõenäosuse, et võrdsete populatsioonidispersioonide puhul on F-statistiku väärtus vaatlemisel suurem kui f, ning "F-statistiku kriitiline ühepoolne" annab alfa kriitiliseks väärtuseks rohkem kui 1.

Fourier' analüüsi tööriist lahendab lineaarsüsteemides ülesandeid ja analüüsib perioodilisi andmeid, kasutades andmete teisendamiseks kiire Fourier' teisenduse (FFT) meetodit. See tööriist toetab ka pöördteisendusi, mille puhul teisendatud andmete pööre tagastab algandmed.

Fourier analüüsi sisend- ja vahemikud

Histogrammi analüüsiriist arvutab andmete lahtrivahemiku ja lahtrisalvede individuaalsed ja kumulatiivsed sagedused. See tööriist loob väärtuse andmehulgas esinemise kordade arvu andmed.

Näiteks 20 õpilasega klassis saate määratleda punktisummade jaotuse hindekategooriates. Histogrammitabelis on ära toodud nii hinnete piirid kui ka alumise piirangu ja praeguse piirangu vahele jäävate punktisummade arv. Kõige sagedamini esinev punktisumma on andmete mood.

Näpunäide. : Rakenduses Excel 2016, saate nüüd luua histogramm või Pareto -diagramm.

Jooksva keskmise analüüsiriist ennustab prognoosiperioodi väärtusi, võttes aluseks muutuja keskmise väärtuse kindla arvu eelnevate perioodide jooksul. Jooksev keskmine pakub trenditeavet, mille kõigi ajalooliste andmete lihtne keskmine peidaks. Selle tööriista abil saate prognoosida müüki, laoseisu või muid trende. Iga prognoosiväärtus põhineb järgmisel valemil.

Jooksva keskmise arvutamise valem

Kus:

  • N on jooksvasse keskmisse kaasatavate eelmiste perioodide arv

  • A j on tegelik väärtus j-hetkel

  • F j on prognoositud väärtus j-hetkel

Juhuarvude loomise analüüsiriist täidab vahemiku sõltumatute juhuarvudega, mis pärinevad ühest jaotusest (kui jaotusi on mitu). Populatsiooni objekte saate iseloomustada tõenäosusjaotusega. Näiteks saate normaaljaotusega iseloomustada isikute pikkuste populatsiooni või kasutada kulli ja kirja viskamise tulemite populatsiooni iseloomustamiseks kahe võimaliku tulemuse Bernoulli jaotust.

Asukoha ja protsentiili analüüsiriist koostab tabeli, mis sisaldab andmehulgas iga väärtuse järgarvulist ja protsentuaalset asukohta. Nii saate analüüsida väärtuste suhtelist paiknemist andmehulgas. See tööriist kasutab töölehefunktsioone RANK.EQ ja PERCENTRANK.INC. Kui soovite arvesse võtta ka võrdseid väärtusi, kasutage töölehefunktsiooni RANK.EQ, mis kohtleb võrdseid väärtusi sama asukohaga väärtustena, või kasutage funktsiooni RANK.AVG, mis tagastab võrdsete väärtuste keskmise asukoha.

Regressiooni analüüsiriist teostab lineaarregressiooni analüüsi vähimruutude meetodi abil, et sobitada sirget erinevate vaatlustega. Saate analüüsida, kuidas mõjutavad ühe või mitme sõltumatu muutuja väärtused ühte sõltuvat muutujat. Näiteks saate analüüsida, millist mõju avaldavad sportlase tulemustele sellised tegurid nagu vanus, pikkus ja kaal. Tulemuste andmete kogumi põhjal saate igale tegurile määrata teatud osakaalu tulemuste mõõtmisel ja tulemeid seejärel kasutada uue, testimata sportlase tulemuste ennustamiseks.

Regressiooni tööriist kasutab töölehefunktsiooni LINEST.

Valiku analüüsiriist loob populatsioonivalimi, käsitledes populatsioonina sisendvahemikku. Kui populatsioon on töötlemiseks või kaardistamiseks liiga suur, võite kasutada esindavat valimit. Samuti võite luua valimi, mis sisaldab ainult tsükli teatud osast pärinevaid väärtusi, kui arvate, et sisendandmed on perioodilised. Kui sisendvahemik sisaldab näiteks kvartaalseid müüginäitajaid, võite valimi koostamisel kasutada perioodimäära neli, et paigutada väljundvahemikku sama kvartali väärtused.

Kahe valimiga t-Testi analüüsiriistad testivad iga valimi aluseks olevate populatsioonide aritmeetiliste keskmiste võrdsust. Kolme tööriista puhul lähtutakse erinevatest eeldustest: populatsioonide dispersioonid on võrdsed, populatsioonide dispersioonid pole võrdsed, ning kaks valimit esindavad samade objektide töötlemiseelseid ja töötlemisjärgseid vaatlusi.

Kõigi kolme tööriista puhul arvutatakse t-statistiku väärtus t, mis kuvatakse väljundtabelis nimega "t Stat". Sõltuvalt andmetest võib see väärtus t olla nii negatiivne kui ka mittenegatiivne. Eeldades, et analüüsi aluseks olevate populatsioonide aritmeetilised keskmised on võrdsed, siis kui t < 0, "P(T <= t) ühepoolne", annab see tõenäosuse, et t-statistiku vaadeldav väärtus oleks negatiivsem kui t. Kui t >=0, "P(T <= t) ühepoolne", annab see tõenäosuse, et t-statistiku vaadeldav väärtus oleks positiivsem kui t. "t-statistiku kriitiline ühepoolne" annab katkestusväärtuse, mille puhul väärtusest "t-statistiku kriitiline ühepoolne" suurema või sellega võrdse väärtuse vaatlemise tõenäosus on alfa.

"P(T <= t) kahepoolne" annab tõenäosuse, et t-statistiku vaadeldav väärtus oleks absoluutväärtuselt suurem kui t. "P-statistiku kriitiline kahepoolne" annab katkestusväärtuse, mille puhul väärtusest "P-statistiku kriitiline kahepoolne" absoluutväärtuselt suurema t-statistiku väärtuse vaatlemise tõenäosus on alfa.

t-Test: kahe valimi keskväärtuste arvutamiseks paaris

Paaristesti saate kasutada kui valimis on vaatlused loomupäraselt paaris (nt valimigruppi on testitud kaks korda – enne ja pärast eksperimenti). See analüüsiriist ja selle valem sooritavad kahe paarisvalimi Studenti t-testi, et kontrollida, kas vaatlused, mis on võetud enne ja pärast töötlemist, on tõenäoliselt pärit võrdsete populatsiooni keskväärtustega jaotustest. t-test ei eelda mõlema populatsiooni dispersiooni võrdsust.

Märkus. : Selle tööriista loodavate tulemite seas on ühendatud dispersioon – keskmise ümbruses asuvate andmete hajuvuse akumuleeritud mõõtmine, mis tuletatakse järgmisest valemist.

Ühendatud dispersioon arvutamise valem

t-Test: kaks valimit võrdsete dispersioonide eeldusega

See analüüsiriist sooritab kahe valimi Studenti t-testi. t-test eeldab, et kaks andmehulka pärinevad sama dispersiooniga jaotustest. Seda nimetatakse püsihajuvaks t-testiks. Selle t-testiga saate määrata, kas kaks valimit pärinevad tõenäoliselt jaotustest, mille populatsioonidel on võrdne keskväärtus.

t-Test: kaks valimit ebavõrdsete dispersioonide eeldusega

See analüüsiriist sooritab kahe valimi Studenti t-testi. See t-test eeldab, et kaks andmehulka pärinevad ebavõrdse dispersiooniga jaotustest. Seda nimetatakse muuthajuvaks t-testiks. Nagu eelmise, võrdse dispersiooni puhul, saate seda testi kasutada selleks, et määratleda, kas kaks valimit pärinevad tõenäoliselt jaotustest, millel on võrdsed populatsiooni keskväärtused. Kasutage seda testi juhul, kui kahes valimis on eristuvaid üksusi. Kasutage järgmises näiteskirjeldatud paaristesti üksuste ühe kogumi olemasolu puhul ja kui kaks valimit esindavad iga üksuse mõõtmisi enne ja pärast töötlemist.

Statistilise väärtuse t määratlemiseks kasutatakse järgmist valemit.

Väärtuse t arvutamise valem

Järgmist valemit kasutatakse vabadusastmete (df) arvutamiseks. Kuna arvutuse tulem pole üldjuhul täisarv, ümardatakse df-väärtus lähima täisarvuni, et t-tabelist saaks tuua kriitilise väärtuse. Exceli töölehefunktsioon T.TEST kasutab arvutatud df-väärtust ilma ümardamiseta, kuna funktsiooni T.TEST puhul saab väärtust arvutada ka mittetäisarvulise df-iga. Kuna need vabadusastmete määratlemise meetodid on erinevad, on funktsiooni T.TEST ja selle t-Testi tööriista tulemid ebavõrdsete dispersioonide puhul erinevad.

Valemi ühtlustada vabadusastmete arv.

z-Testi analüüsitööriist Kaks valimit keskmise jaoks teostab teadaolevate dispersioonidega keskmiste võrdlemiseks kahe valimiga z-Testi. Selle tööriistaga saab võrrelda nullhüpoteesi, et kahe populatsiooni keskmiste vahel pole erinevusi, ühepoolse või kahepoolse alternatiivse hüpoteesiga. Kui dispersioonid pole teada, tuleks selle tööriista asemel kasutada töölehefunktsiooni Z.TEST.

z-Testi tööriista kasutamisel olge väljundi tõlgendamisel ettevaatlik. "P(Z <= z) ühepoolne" on tegelikult P(Z >= ABS(z)) – tõenäosus, et z-väärtus on 0-st kaugemal samas suunas nagu vaadeldud z-väärtus, kui populatsioonide keskmiste vahel pole erinevusi. "P(Z <= z) kahepoolne" on tegelikult P(Z >= ABS(z) või Z <= -ABS(z)) – tõenäosus, et z-väärtus on 0-st kummaski suunal kaugemal kui vaadeldud z-väärtus, kui populatsioonide keskmiste vahel pole erinevusi. Kahepoolne tulem on lihtsalt kahega korrutatud ühepoolne tulem. z-Testi tööriista saab kasutada ka juhul, kui nullhüpotees on see, et kahe populatsiooni keskmistel on teatud kindel nullist erineva väärtusega erinevus. Näiteks saate selle testi abil määratleda kahe automudeli jõudluse erinevusi.

Kas vajate rohkem abi?

Võite oma küsimuse alati esitada mõnele Exceli tehnikakogukonna eksperdile, otsida abi vastustefoorumist või soovitada mõnd uut funktsiooni või täiustust Exceli User Voice’i lehel.

Märkus. : Masintõlke lahtiütlus. Selle artikli tõlkis arvutisüsteem ilma inimese sekkumiseta. Microsoft pakub selliseid masintõlkeid, et inglise keelt mittekõnelevad kasutajad saaksid vaadata sisu Microsofti toodete, teenuste ja tehnoloogiate kohta. Kuna artikkel on masintõlgitud, võib see sisaldada sõnavara-, süntaksi- või grammatikavigu.

Vt ka

Rakenduses Excel 2016 histogrammi loomine

Rakenduses Excel 2016 Pareto-diagrammi loomine

Vaadake videot, et analüüsi tööriistapakett ja Solver Lisandmoodulite installimine ja aktiveerimine

Tehnika funktsioonid (teatmematerjalid)

Statistilised funktsioonid (teatmematerjalid)

Exceli valemite ülevaade

Katkenud valemite vältimine

Valemites vigade leidmine ja

Exceli kiirklahvid ja funktsiooniklahvid

Exceli funktsioonid (tähestikuliselt)

Exceli funktsioonid (kategooriate kaupa)

Täiendage oma oskusi
Tutvuge koolitusmaterjalidega
Kasutage uusi funktsioone enne teisi
Liituge Office Insideri programmiga

Kas sellest teabest oli abi?

Täname tagasiside eest!

Täname tagasiside eest! Tundub, et võiksime teid kokku viia ühega meie Office'i tugiagentidest, kes aitab teil probleemi lahendada.

×