Analüüsi tööriistapaketi kasutamine keeruliste andmeanalüüside jaoks

Kui soovite läbi viia keerukat statistilist või tehnilist analüüsi, saate analüüsi tööriistapaketi lisandmooduli Analysis ToolPak abil säästa oma vaeva ja aega. Esitage iga analüüsi jaoks andmed ja parameetrid ning vastav tööriist arvutab ja kuvab sobivaid statistilisi või tehnilisi makrofunktsioone kasutades tulemused väljundtabelis. Mõned tööriistad loovad lisaks väljundtabelitele ka diagramme.

Andmeanalüüsi funktsioone saate kasutada vaid ühel töölehel korraga. Rühmitatud töölehtede andmete analüüsimisel kuvatakse esimesel töölehel tulemused ja ülejäänud töölehtedel tühjad vormindatud tabelid. Ülejäänud töölehtede andmete analüüsimiseks tuleb iga töölehe jaoks teha analüüsiriista ümberarvutus.

Järgmistes jaotistes kirjeldatakse analüüsi tööriistapaketi lisandmoodulis Analysis ToolPak sisalduvaid tööriistu. Tööriistadele juurdepääsemiseks klõpsake menüü Andmed jaotise Analysis (Analüüs) nuppu Data Analysis (Andmete analüüs). Kui nupp Data Analysis (Andmete analüüs) pole saadaval, tuleb andmete tööriistapaketi lisandmoodul Analysis ToolPak laadida.

  1. Klõpsake menüüs Fail nuppu Suvandid ja seejärel kategooriat Lisandmoodulid.

    Kui kasutate rakendust Excel 2007, klõpsake Microsoft Office’i nuppu Office‘i nupu pilt ja valige siis Exceli suvandid.

  2. Valige ripploendist Halda väärtus Exceli lisandmoodulid ja klõpsake siis nuppu Mine.

    Kui kasutate rakendust Excel for Mac, valige failimenüüs Tööriistad > Exceli lisandmoodulid.

  3. Märkige dialoogiboksis Lisandmoodulid ruut Analüüsi tööriistapakett ja klõpsake nuppu OK.

    • Kui loendis Saadaolevad lisandmoodulid pole väärtust Analüüsi tööriistapakett, klõpsake selle otsimiseks nuppu Sirvi.

    • Kui kuvatakse teade, et analüüsi tööriistapaketi lisandmoodul Analysis ToolPak pole teie arvutisse praegu installitud, klõpsake selle installimiseks nuppu Jah.

Märkus.: Analüüsi tööriistapaketi lisandmoodulile Analysis ToolPak mooduli Visual Basic for Application (VBA) funktsioonide lisamiseks saate sarnaselt analüüsi tööriistapaketi lisandmooduliga laadida ka mooduli Analüüsi tööriistapakett – VBA. Märkige boksis Saadaolevad lisandmoodulid ruut Analüüsi tööriistapakett – VBA.

Dispersioonanalüüsi tööriistad hõlmavad dispersioonianalüüsi jaoks mitmesuguseid võimalusi. See, millist tööriista peaksite kasutama, sõltub tegurite ja testitavate populatsioonide puhul saadaolevate valimite arvust.

Üheteguriline dispersioonanalüüs

See tööriist sooritab kahe või enama proovi andmete dispersiooni lihtsa analüüsi. Analüüs sisaldab hüpoteesi, et iga näidis võetakse samast tõenäosusest, mis on saadud alternatiivsete hüpoteeside põhjal, mis ei ole kõigi valimite puhul ühesugused. Kui teil on ainult kaks valimit, saate kasutada töölehefunktsiooni T.Test. Kui teil on rohkem kui kaks valimit, siis ei ole mugavat üldistust T.Testja ühe teguri ANOVA mudeli saab selle asemel kutsuda.

Kaheteguriline kordusega dispersioonanalüüs

Sellest analüüsiriistast on kasu juhul, kui andmeid saab liigitada kahe erineva dimensioonina. Oletagem näiteks, et taimede kõrguse mõõtmiseks korraldatud katse raames on taimedele antud erinevat sorti väetist (nt A, B, C) ja lisaks on taimi hoitud erineval temperatuuril (nt madalal ja kõrgel). Võimalikke paare {väetis, temperatuur} on seega kokku kuus ning iga paari puhul on olemas võrdne arv taimede kõrguse vaatlusandmeid. Selle dispersioonanalüüsi tööriista abil saame testida järgmist:

  • Kas eri väetiste tootemarkide kõrgused võetakse samast alusvarast. Selle analüüsi puhul ignoreeritakse temperatuure.

  • Kas eri temperatuuridel olevate taimede kõrgused võetakse samast elanikkonnast. Selle analüüsi puhul ignoreeritakse väetiste kaubamärke.

kas siis, kui arvesse on võetud esimeses loendipunktis väetisesortide puhul põhjustatud erinevuste mõju ning teises loendipunktis temperatuurist põhjustatud erinevuste mõju, on kõiki väärtuste {väetis, temperatuur} paare esindavad valimid võetud samast populatsioonist. Alternatiivne hüpotees väidab, et kindlate väärtuste {väetis, temperatuur} paaride teatud mõjud ei sõltu ainult väetisest või ainult temperatuurist põhjustatud erinevustest.

Dispersioonanalüüsi tööriista sisendvahemiku häälestamine

Kaheteguriline korduseta dispersioonanalüüs

Sellest analüüsiriistast on abi juhul, kui andmed on liigitatud kahe erineva dimensioonina (nagu ka kahe teguri ja kordamisega juhtumis). Selle tööriista kasutamisel aga eeldatakse, et iga paari (nt eelnevas näites iga paari {väetis, temperatuur}) puhul on tehtud ainult üks vaatlus.

Nii CORREL kui ka Pearsoni töölehe funktsioonid arvutavad kahe mõõtühiku vahelised koefitsiendid, kui iga muutuja puhul jälgitakse iga muutuja mõõtmist. (Mis tahes teema puuduv tähelepanek põhjustab seda, et analüüsis ignoreeritakse teemat.) Korrelatsiooni analüüsi tööriist on eriti kasulik juhul, kui iga N teema kohta on rohkem kui kaks mõõtmiste muutujat. See annab väljundi tabeli, korrelatsiooni maatriksi, mis näitab iga võimaliku CORREL (või Pearson) väärtust.

Korrelatsiooni koefitsient (nt covariance) on mõõt, mille ulatuses kaks mõõtmiste muutujat "erinevad koos." Erinevalt covariance mastaabitakse korrelatsiooni koefitsienti nii, et selle väärtus ei sõltu kahest mõõtühikust. (Kui kahes mõõtühikus on näiteks kaal ja kõrgus, siis ei muudeta korrelatsiooni koefitsienti, kui kaal teisendatakse naelast kilogrammi võrra.) Mis tahes korrelatsiooni koefitsiendi väärtus peab olema vahemikus-1 ja + 1 (kaasa arvatud).

Korrelatsioonianalüüsi tööriista abil saate iga mõõdetavate muutujate paari analüüsida, määratlemaks, kas mõlemad mõõdetavad muutujad kalduvad koos liikuma – kas ühe muutuja suured väärtused kalduvad seostuma teise muutuja suurte väärtustega (positiivne korrelatsioon), kas ühe muutuja väikesed väärtused kalduvad seostuma teise muutuja suurte väärtustega (negatiivne korrelatsioon) või kas mõlema muutuja väärtused kalduvad olema omavahel seostamatud (nullilähedane korrelatsioon).

Tööriistu Korrelatsioon ja Kovariatsioon saab koos kasutada olukorras, kus teatud isikutekogumi puhul vaadeldakse N-hulka erinevaid mõõdetavaid muutujaid. Mõlemad tööriistad (Korrelatsioon ja Kovariatsioon) koostavad väljundtabeli ehk maatriksi, kus kuvatakse vastavalt siis iga mõõdetavate muutujate paari korrelatsioonikordaja või kovariatsioon. Erinevus on selles, et korrelatsioonikordajad paigutatakse skaalal vahemikku -1 kuni +1 (kaasa arvatud). Vastavaid kovariatsioone skaalale ei paigutata. Nii korrelatsioonikordaja kui ka kovariatsioon mõõdavad kahe muutuja koos muutumise ulatust.

Covariance tööriist arvutab töölehe funktsiooni Covariance väärtuse. P iga mõõtmiste muutujate paari jaoks. (COVARIANCE otsene kasutamine. P – mitte Covariance tööriist on mõistlik alternatiiv, kui on ainult kaks mõõtmiste muutujat, st N = 2.) Covariance tööriista väljundi tabeli diagonaalis olev kirje i reas, i veerus on i-nda mõõtetulemuse Covariance. See on ainult selle muutuja Populatsiooni dispersioon, mille arvutab töölehe funktsioon var.P.

Kovariatsioonianalüüsi tööriista abil saate iga mõõdetavate muutujate paari analüüsida, määratlemaks, kas mõlemad mõõdetavad muutujad kalduvad koos liikuma – kas ühe muutuja suured väärtused kalduvad seostuma teise muutuja suurte väärtustega (positiivne kovariatsioon), kas ühe muutuja väikesed väärtused kalduvad seostuma teise muutuja suurte väärtustega (negatiivne kovariatsioon) või kas mõlema muutuja väärtused kalduvad olema omavahel seostamatud (nullilähedane kovariatsioon).

Kirjeldava statistika analüüsiriist loob sisendvahemikus leiduvate andmete kohta ühe muutujaga statistika aruande, sisaldades teavet andmete keskmise ja hajuvuse kohta.

Eksponentsilumise analüüsiriist ennustab eelneva perioodi prognoosil põhinevat ja selle vea osas täpsustatud väärtust. Tööriist kasutab silumiskonstanti a, mille suurusjärk määratleb, kui täpselt reageerivad prognoosid eelmise prognoosi vigadele.

Märkus.: Väärtused 0,2–0,3 on mõistlikud silumiskonstandid. Need väärtused osutavad, et praegust prognoosi tuleks eelmises prognoosis esinenud vigu arvestades korrigeerida 20–30%. Suuremad tegurid annavad kiirema vastuse, kuid projektsioon võib olla vigane. Väiksemate tegurite puhul võib prognoosiväärtustega kaasneda pikem viivitus.

F-Testi analüüsitööriist Kaks valimit dispersioonide jaoks teostab kahe populatsioonidispersiooni võrdlemiseks kahe valimiga F-testi.

Näiteks võite F-Testi tööriista kasutada kahe meeskonna ujumisvõistluses saavutatud aegade valimite osas. Tulemi saamiseks võrdleb tööriist nullhüpoteesi, et mõlemad valimid pärinevad võrdse dispersiooniga jaotustest, alternatiivse hüpoteesiga, et vastavate jaotuste dispersioonid pole võrdsed.

Tööriist arvutab F-statistiku (ehk F-suhte) f-väärtuse. Kui f-väärtus on 1 lähedal, siis osutab see, et aluseks olevad populatsioonidispersioonid on võrdsed. Kui väljundtabelis on f < 1 "P(F <= f) ühepoolne", annab see tõenäosuse, et võrdsete populatsioonidispersioonide puhul on F-statistiku väärtus vaatlemisel väiksem kui f, ning "F-statistiku kriitiline ühepoolne" annab valitud olulisuse nivoo alfa puhul tulemiks, et kriitiline väärtus on väiksem kui 1. Kui f > 1, "P(F <= f) ühepoolne", annab see tõenäosuse, et võrdsete populatsioonidispersioonide puhul on F-statistiku väärtus vaatlemisel suurem kui f, ning "F-statistiku kriitiline ühepoolne" annab alfa kriitiliseks väärtuseks rohkem kui 1.

Fourier' analüüsi tööriist lahendab lineaarsüsteemides ülesandeid ja analüüsib perioodilisi andmeid, kasutades andmete teisendamiseks kiire Fourier' teisenduse (FFT) meetodit. See tööriist toetab ka pöördteisendusi, mille puhul teisendatud andmete pööre tagastab algandmed.

Fourier' analüüsi sisend- ja väljundvahemikud

Histogrammi analüüsiriist arvutab andmete lahtrivahemiku ja lahtrisalvede individuaalsed ja kumulatiivsed sagedused. See tööriist loob väärtuse andmehulgas esinemise kordade arvu andmed.

Näiteks 20 õpilasega klassis saate määratleda punktisummade jaotuse hindekategooriates. Histogrammitabelis on ära toodud nii hinnete piirid kui ka alumise piirangu ja praeguse piirangu vahele jäävate punktisummade arv. Kõige sagedamini esinev punktisumma on andmete mood.

Näpunäide.: Rakenduses Excel 2016 saate nüüd koostada histogrammi või Pareto diagrammi.

Jooksva keskmise analüüsiriist ennustab prognoosiperioodi väärtusi, võttes aluseks muutuja keskmise väärtuse kindla arvu eelnevate perioodide jooksul. Jooksev keskmine pakub trenditeavet, mille kõigi ajalooliste andmete lihtne keskmine peidaks. Selle tööriista abil saate prognoosida müüki, laoseisu või muid trende. Iga prognoosiväärtus põhineb järgmisel valemil.

Libiseva keskmise arvutamise valem

Kus:

  • N on jooksvasse keskmisse kaasatavate eelmiste perioodide arv

  • A j on tegelik väärtus j-hetkel

  • F j on prognoositud väärtus j-hetkel

Juhuarvude loomise analüüsiriist täidab vahemiku sõltumatute juhuarvudega, mis pärinevad ühest jaotusest (kui jaotusi on mitu). Populatsiooni objekte saate iseloomustada tõenäosusjaotusega. Näiteks saate normaaljaotusega iseloomustada isikute pikkuste populatsiooni või kasutada kulli ja kirja viskamise tulemite populatsiooni iseloomustamiseks kahe võimaliku tulemuse Bernoulli jaotust.

Auaste ja protsentiili analüüsi tööriist loob tabeli, mis sisaldab järgarv iga väärtuse ja protsentide auastet. Saate analüüsida väärtuste suhtelist seisundit andmete kogumis. See tööriist kasutab töölehe funktsioonide auastet. EQ japrotsendimäärade. INC. Kui soovite seotud väärtuste eest arvestada, kasutage auastet. Funktsioon EQ , mis kohtleb seotud väärtusi sama auastmega või kasutab auastet.Funktsioon AVG , mis annab tulemuseks seotud väärtuste keskmise auastme.

Regressiooni analüüsiriist teostab lineaarregressiooni analüüsi vähimruutude meetodi abil, et sobitada sirget erinevate vaatlustega. Saate analüüsida, kuidas mõjutavad ühe või mitme sõltumatu muutuja väärtused ühte sõltuvat muutujat. Näiteks saate analüüsida, millist mõju avaldavad sportlase tulemustele sellised tegurid nagu vanus, pikkus ja kaal. Tulemuste andmete kogumi põhjal saate igale tegurile määrata teatud osakaalu tulemuste mõõtmisel ja tulemeid seejärel kasutada uue, testimata sportlase tulemuste ennustamiseks.

Tööriist regressioon kasutab töölehefunktsiooni LINEST.

Valiku analüüsiriist loob populatsioonivalimi, käsitledes populatsioonina sisendvahemikku. Kui populatsioon on töötlemiseks või kaardistamiseks liiga suur, võite kasutada esindavat valimit. Samuti võite luua valimi, mis sisaldab ainult tsükli teatud osast pärinevaid väärtusi, kui arvate, et sisendandmed on perioodilised. Kui sisendvahemik sisaldab näiteks kvartaalseid müüginäitajaid, võite valimi koostamisel kasutada perioodimäära neli, et paigutada väljundvahemikku sama kvartali väärtused.

Kahe valimiga t-Testi analüüsiriistad testivad iga valimi aluseks olevate populatsioonide aritmeetiliste keskmiste võrdsust. Kolme tööriista puhul lähtutakse erinevatest eeldustest: populatsioonide dispersioonid on võrdsed, populatsioonide dispersioonid pole võrdsed, ning kaks valimit esindavad samade objektide töötlemiseelseid ja töötlemisjärgseid vaatlusi.

Kõigi kolme tööriista puhul arvutatakse t-statistiku väärtus t, mis kuvatakse väljundtabelis nimega "t Stat". Sõltuvalt andmetest võib see väärtus t olla nii negatiivne kui ka mittenegatiivne. Eeldades, et analüüsi aluseks olevate populatsioonide aritmeetilised keskmised on võrdsed, siis kui t < 0, "P(T <= t) ühepoolne", annab see tõenäosuse, et t-statistiku vaadeldav väärtus oleks negatiivsem kui t. Kui t >=0, "P(T <= t) ühepoolne", annab see tõenäosuse, et t-statistiku vaadeldav väärtus oleks positiivsem kui t. "t-statistiku kriitiline ühepoolne" annab katkestusväärtuse, mille puhul väärtusest "t-statistiku kriitiline ühepoolne" suurema või sellega võrdse väärtuse vaatlemise tõenäosus on alfa.

"P(T <= t) kahepoolne" annab tõenäosuse, et t-statistiku vaadeldav väärtus oleks absoluutväärtuselt suurem kui t. "P-statistiku kriitiline kahepoolne" annab katkestusväärtuse, mille puhul väärtusest "P-statistiku kriitiline kahepoolne" absoluutväärtuselt suurema t-statistiku väärtuse vaatlemise tõenäosus on alfa.

t-test: kahe valimi keskväärtuste arvutamiseks paaris

Paaristesti saate kasutada kui valimis on vaatlused loomupäraselt paaris (nt valimigruppi on testitud kaks korda – enne ja pärast eksperimenti). See analüüsiriist ja selle valem sooritavad kahe paarisvalimi Studenti t-testi, et kontrollida, kas vaatlused, mis on võetud enne ja pärast töötlemist, on tõenäoliselt pärit võrdsete populatsiooni keskväärtustega jaotustest. t-test ei eelda mõlema populatsiooni dispersiooni võrdsust.

Märkus.: Selle tööriista loodavate tulemite seas on ühendatud dispersioon – keskmise ümbruses asuvate andmete hajuvuse akumuleeritud mõõtmine, mis tuletatakse järgmisest valemist.

Ühendatud valimi dispersiooni arvutamise valem

t-test: kaks valimit võrdsete dispersioonide eeldusega

See analüüsiriist sooritab kahe valimi Studenti t-testi. t-test eeldab, et kaks andmehulka pärinevad sama dispersiooniga jaotustest. Seda nimetatakse püsihajuvaks t-testiks. Selle t-testiga saate määrata, kas kaks valimit pärinevad tõenäoliselt jaotustest, mille populatsioonidel on võrdne keskväärtus.

t-test: kaks valimit ebavõrdsete dispersioonide eeldusega

See analüüsiriist sooritab kahe valimi Studenti t-testi. See t-test eeldab, et kaks andmehulka pärinevad ebavõrdse dispersiooniga jaotustest. Seda nimetatakse muuthajuvaks t-testiks. Nagu eelmise, võrdse dispersiooni puhul, saate seda testi kasutada selleks, et määratleda, kas kaks valimit pärinevad tõenäoliselt jaotustest, millel on võrdsed populatsiooni keskväärtused. Kasutage seda testi juhul, kui kahes valimis on eristuvaid üksusi. Kasutage järgmises näiteskirjeldatud paaristesti üksuste ühe kogumi olemasolu puhul ja kui kaks valimit esindavad iga üksuse mõõtmisi enne ja pärast töötlemist.

Statistilise väärtuse t määratlemiseks kasutatakse järgmist valemit.

Väärtuse t arvutamise valem

Vabadusastmete arvu arvutamiseks kasutatakse järgmist valemit. Kuna arvutuse tulem pole tavaliselt täisarv, ümardatakse DF-väärtus lähima täisarvuni, et saada tabelist t tabelist kriitiline väärtus. Exceli töölehe funktsioon T.Test kasutab arvutatud df-väärtust ümardamata, sest seda on võimalik arvutada väärtuse Tjaoks.Test täisarvuga DF. Kuna need erinevad lähenemised vabadusastmete määramiseks, on T-i tulemused.Test ja see t-testi tööriist erineb ebavõrdsete dispersioonide juhtumist.

Vabadusastmete umbkaudse arvutamise valem

Z-test: kaks valimit tähendab, et analüüsi tööriist sooritab kaks valimit z-test teadaolevate dispersioonide abil. Seda tööriista kasutatakse null-hüpoteesi testimiseks, et kahe populatsiooni vaheline erinevus ei erineks ühepoolsete või kahepoolsete alternatiivsete hüpoteeside abil. Kui dispersioonid pole teada, on tööleht funktsioon Z.Selle asemel tuleks kasutada testi .

z-Testi tööriista kasutamisel olge väljundi tõlgendamisel ettevaatlik. "P(Z <= z) ühepoolne" on tegelikult P(Z >= ABS(z)) – tõenäosus, et z-väärtus on 0-st kaugemal samas suunas nagu vaadeldud z-väärtus, kui populatsioonide keskmiste vahel pole erinevusi. "P(Z <= z) kahepoolne" on tegelikult P(Z >= ABS(z) või Z <= -ABS(z)) – tõenäosus, et z-väärtus on 0-st kummaski suunal kaugemal kui vaadeldud z-väärtus, kui populatsioonide keskmiste vahel pole erinevusi. Kahepoolne tulem on lihtsalt kahega korrutatud ühepoolne tulem. z-Testi tööriista saab kasutada ka juhul, kui nullhüpotees on see, et kahe populatsiooni keskmistel on teatud kindel nullist erineva väärtusega erinevus. Näiteks saate selle testi abil määratleda kahe automudeli jõudluse erinevusi.

Kas vajate rohkem abi?

Võite oma küsimuse alati esitada mõnele Exceli tehnikakogukonna eksperdile, otsida abi vastustefoorumist või soovitada mõnd uut funktsiooni või täiustust Exceli User Voice’i lehel.

Vt ka

Histogrammi koostamine rakenduses Excel 2016

Pareto-diagrammi koostamine rakenduses Excel 2016

Analüüsi tööriistapaketi laadimine Excelis

MATEMAATIKA ERIFUNKTSIOONID (teatmematerjalid)

STATISTIKAFUNKTSIOONID ( teatmematerjalid)

Exceli valemite ülevaade

Katkiste valemite ärahoidmine

Valemites vigade leidmine ja lahendamine

Exceli kiirklahvid ja funktsiooniklahvid

Exceli funktsioonid (tähestikuliselt)

Exceli funktsioonid (kategooriate kaupa)

Täiendage Office'i kasutamise oskusi
Tutvuge koolitusmaterjalidega
Kasutage uusi funktsioone enne teisi
Liituge Office Insideri programmiga

Kas sellest teabest oli abi?

Täname tagasiside eest!

Täname tagasiside eest! Tundub, et võiksime teid kokku viia ühega meie Office'i tugiagentidest, kes aitab teil probleemi lahendada.

×