Analüüsi tööriistapaketi kasutamine keeruliste andmeanalüüside jaoks

Märkus.: Soovime pakkuda teie keeles kõige ajakohasemat spikrisisu niipea kui võimalik. See leht on tõlgitud automaatselt ja sellel võib leiduda grammatikavigu või ebatäpsusi. Tahame, et sellest sisust oleks teile abi. Palun märkige selle lehe allservas, kas sellest teabest oli teile kasu või mitte. Soovi korral saab ingliskeelset artiklit lugeda siit.

Kui soovite läbi viia keerukat statistilist või tehnilist analüüsi, saate analüüsi tööriistapaketi lisandmooduli Analysis ToolPak abil säästa oma vaeva ja aega. Esitage iga analüüsi jaoks andmed ja parameetrid ning vastav tööriist arvutab ja kuvab sobivaid statistilisi või tehnilisi makrofunktsioone kasutades tulemused väljundtabelis. Mõned tööriistad loovad lisaks väljundtabelitele ka diagramme.

Andmeanalüüsi funktsioone saate kasutada vaid ühel töölehel korraga. Rühmitatud töölehtede andmete analüüsimisel kuvatakse esimesel töölehel tulemused ja ülejäänud töölehtedel tühjad vormindatud tabelid. Ülejäänud töölehtede andmete analüüsimiseks tuleb iga töölehe jaoks teha analüüsiriista ümberarvutus.

Järgmistes jaotistes kirjeldatakse analüüsi tööriistapaketi lisandmoodulis Analysis ToolPak sisalduvaid tööriistu. Tööriistadele juurdepääsemiseks klõpsake menüü Andmed jaotise Analysis (Analüüs) nuppu Data Analysis (Andmete analüüs). Kui nupp Data Analysis (Andmete analüüs) pole saadaval, tuleb andmete tööriistapaketi lisandmoodul Analysis ToolPak laadida.

  1. Klõpsake menüüs Fail nuppu Suvandid ja seejärel kategooriat Lisandmoodulid.

    Kui kasutate rakendust Excel 2007, klõpsake Microsoft Office’i nuppu Office‘i nupu pilt ja valige siis Exceli suvandid.

  2. Valige ripploendist Halda väärtus Exceli lisandmoodulid ja klõpsake siis nuppu Mine.

    Kui kasutate rakendust Excel for Mac, valige failimenüüs Tööriistad > Exceli lisandmoodulid.

  3. Märkige dialoogiboksis Lisandmoodulid ruut Analüüsi tööriistapakett ja klõpsake nuppu OK.

    • Kui loendis Saadaolevad lisandmoodulid pole väärtust Analüüsi tööriistapakett, klõpsake selle otsimiseks nuppu Sirvi.

    • Kui kuvatakse teade, et analüüsi tööriistapaketi lisandmoodul Analysis ToolPak pole teie arvutisse praegu installitud, klõpsake selle installimiseks nuppu Jah.

Märkus.: Analüüsi tööriistapaketi lisandmoodulile Analysis ToolPak mooduli Visual Basic for Application (VBA) funktsioonide lisamiseks saate sarnaselt analüüsi tööriistapaketi lisandmooduliga laadida ka mooduli Analüüsi tööriistapakett – VBA. Märkige boksis Saadaolevad lisandmoodulid ruut Analüüsi tööriistapakett – VBA.

Dispersioonanalüüsi tööriistad hõlmavad dispersioonianalüüsi jaoks mitmesuguseid võimalusi. See, millist tööriista peaksite kasutama, sõltub tegurite ja testitavate populatsioonide puhul saadaolevate valimite arvust.

Üheteguriline dispersioonanalüüs

See tööriist teostab kahe või enama näidised andmete lihtsa analüüsi arv dispersioon. Analüüsi pakub juhul, et iga valim on sama aluseks oleva tõenäosusjaotuse alternatiivne juhul, et aluseks tõenäosusjaotuse pole kõigi valimite puhul samad vastu võetud test. Kui on ainult kaks näidet, saate kasutada funktsiooni T. tööleheTEST. Rohkem kui kaks proovi, on pole mugavat üldistust.TTESTja ühe tegur Anova mudeli saate kutsuda hoopis.

Kaheteguriline kordusega dispersioonanalüüs

Sellest analüüsiriistast on kasu juhul, kui andmeid saab liigitada kahe erineva dimensioonina. Oletagem näiteks, et taimede kõrguse mõõtmiseks korraldatud katse raames on taimedele antud erinevat sorti väetist (nt A, B, C) ja lisaks on taimi hoitud erineval temperatuuril (nt madalal ja kõrgel). Võimalikke paare {väetis, temperatuur} on seega kokku kuus ning iga paari puhul on olemas võrdne arv taimede kõrguse vaatlusandmeid. Selle dispersioonanalüüsi tööriista abil saame testida järgmist:

  • Kas erinevate väetis kaubamärkide elektrijaamade kõrgus on pärit sama sihtrühma. Temperatuuride ignoreeritakse analüüsiks.

  • Kas temperatuur erinevate tasemete elektrijaamade kõrgus on pärit sama sihtrühma. Põhjustatud ignoreeritakse analüüsiks.

kas siis, kui arvesse on võetud esimeses loendipunktis väetisesortide puhul põhjustatud erinevuste mõju ning teises loendipunktis temperatuurist põhjustatud erinevuste mõju, on kõiki väärtuste {väetis, temperatuur} paare esindavad valimid võetud samast populatsioonist. Alternatiivne hüpotees väidab, et kindlate väärtuste {väetis, temperatuur} paaride teatud mõjud ei sõltu ainult väetisest või ainult temperatuurist põhjustatud erinevustest.

Dispersioonanalüüsi tööriista sisendvahemiku häälestamine

Kaheteguriline korduseta dispersioonanalüüs

Sellest analüüsiriistast on abi juhul, kui andmed on liigitatud kahe erineva dimensioonina (nagu ka kahe teguri ja kordamisega juhtumis). Selle tööriista kasutamisel aga eeldatakse, et iga paari (nt eelnevas näites iga paari {väetis, temperatuur}) puhul on tehtud ainult üks vaatlus.

CORREL ja PEARSON töölehefunktsioone nii arvutada kahe muutujate mõõtmed iga muutuja avastamisel iga N objekti vahel korrelatsioonikordaja. (Mis tahes puuduvad jälgimine jaoks mis tahes teema põhjustab selle teema analüüsi ignoreeritakse.) Korrelatsiooni analüüsi tööriist on eriti kasulik siis, kui seal on rohkem kui kaks muutujate iga N objekti. Pakub väljund tabeli, korrelatsiooni maatriks, mis näitab iga muutujate võimalike paari rakendatud CORREL (või PEARSON) väärtus.

Korrelatsioonikordaja Kovariatsioon, nagu on määral, millele kaks muutujate "koos muutumise." Kovariatsioon, erinevalt korrelatsioonikordaja valem on mastaabitud nii, et selle väärtus ei sõltu üksused, kus on kaks mõõtühikute muutujate väljendatud. (Näiteks, kui kaks mõõtühikute muutujad on paksus ja kõrgus, korrelatsioonikordaja väärtus on samaks kui mass teisendatakse naeltest kilogrammideks.) Mis tahes korrelatsioonikordaja väärtus peab olema -1 ja + 1, kaasa arvatud vahel.

Korrelatsioonianalüüsi tööriista abil saate iga mõõdetavate muutujate paari analüüsida, määratlemaks, kas mõlemad mõõdetavad muutujad kalduvad koos liikuma – kas ühe muutuja suured väärtused kalduvad seostuma teise muutuja suurte väärtustega (positiivne korrelatsioon), kas ühe muutuja väikesed väärtused kalduvad seostuma teise muutuja suurte väärtustega (negatiivne korrelatsioon) või kas mõlema muutuja väärtused kalduvad olema omavahel seostamatud (nullilähedane korrelatsioon).

Tööriistu Korrelatsioon ja Kovariatsioon saab koos kasutada olukorras, kus teatud isikutekogumi puhul vaadeldakse N-hulka erinevaid mõõdetavaid muutujaid. Mõlemad tööriistad (Korrelatsioon ja Kovariatsioon) koostavad väljundtabeli ehk maatriksi, kus kuvatakse vastavalt siis iga mõõdetavate muutujate paari korrelatsioonikordaja või kovariatsioon. Erinevus on selles, et korrelatsioonikordajad paigutatakse skaalal vahemikku -1 kuni +1 (kaasa arvatud). Vastavaid kovariatsioone skaalale ei paigutata. Nii korrelatsioonikordaja kui ka kovariatsioon mõõdavad kahe muutuja koos muutumise ulatust.

Kovariatsiooni tööriist arvutab töölehefunktsiooni KOVARIATSIOONI väärtus. P muutujate iga paari jaoks. (Otsene kasutamine KOVARIATSIOON. P, mitte tööriista kovariatsioon on mõistlik alternatiiv kui on ainult kaks muutujate, st, N = 2.) Klõpsake tööriista kovariatsiooni diagonaalääris kirje tabel reas i, veerg on i-nda mõõtühikute muutuja iseendaga kovariatsioon. See on on populatsiooni dispersioon muutuja VAR. töölehefunktsiooni arvutatudP.

Kovariatsioonianalüüsi tööriista abil saate iga mõõdetavate muutujate paari analüüsida, määratlemaks, kas mõlemad mõõdetavad muutujad kalduvad koos liikuma – kas ühe muutuja suured väärtused kalduvad seostuma teise muutuja suurte väärtustega (positiivne kovariatsioon), kas ühe muutuja väikesed väärtused kalduvad seostuma teise muutuja suurte väärtustega (negatiivne kovariatsioon) või kas mõlema muutuja väärtused kalduvad olema omavahel seostamatud (nullilähedane kovariatsioon).

Kirjeldava statistika analüüsiriist loob sisendvahemikus leiduvate andmete kohta ühe muutujaga statistika aruande, sisaldades teavet andmete keskmise ja hajuvuse kohta.

Eksponentsilumise analüüsiriist ennustab eelneva perioodi prognoosil põhinevat ja selle vea osas täpsustatud väärtust. Tööriist kasutab silumiskonstanti a, mille suurusjärk määratleb, kui täpselt reageerivad prognoosid eelmise prognoosi vigadele.

Märkus.: Väärtused 0,2–0,3 on mõistlikud silumiskonstandid. Need väärtused osutavad, et praegust prognoosi tuleks eelmises prognoosis esinenud vigu arvestades korrigeerida 20–30%. Suuremad tegurid annavad kiirema vastuse, kuid projektsioon võib olla vigane. Väiksemate tegurite puhul võib prognoosiväärtustega kaasneda pikem viivitus.

F-Testi analüüsitööriist Kaks valimit dispersioonide jaoks teostab kahe populatsioonidispersiooni võrdlemiseks kahe valimiga F-testi.

Näiteks võite F-Testi tööriista kasutada kahe meeskonna ujumisvõistluses saavutatud aegade valimite osas. Tulemi saamiseks võrdleb tööriist nullhüpoteesi, et mõlemad valimid pärinevad võrdse dispersiooniga jaotustest, alternatiivse hüpoteesiga, et vastavate jaotuste dispersioonid pole võrdsed.

Tööriist arvutab F-statistiku (ehk F-suhte) f-väärtuse. Kui f-väärtus on 1 lähedal, siis osutab see, et aluseks olevad populatsioonidispersioonid on võrdsed. Kui väljundtabelis on f < 1 "P(F <= f) ühepoolne", annab see tõenäosuse, et võrdsete populatsioonidispersioonide puhul on F-statistiku väärtus vaatlemisel väiksem kui f, ning "F-statistiku kriitiline ühepoolne" annab valitud olulisuse nivoo alfa puhul tulemiks, et kriitiline väärtus on väiksem kui 1. Kui f > 1, "P(F <= f) ühepoolne", annab see tõenäosuse, et võrdsete populatsioonidispersioonide puhul on F-statistiku väärtus vaatlemisel suurem kui f, ning "F-statistiku kriitiline ühepoolne" annab alfa kriitiliseks väärtuseks rohkem kui 1.

Fourier' analüüsi tööriist lahendab lineaarsüsteemides ülesandeid ja analüüsib perioodilisi andmeid, kasutades andmete teisendamiseks kiire Fourier' teisenduse (FFT) meetodit. See tööriist toetab ka pöördteisendusi, mille puhul teisendatud andmete pööre tagastab algandmed.

Fourier' analüüsi sisend- ja väljundvahemikud

Histogrammi analüüsiriist arvutab andmete lahtrivahemiku ja lahtrisalvede individuaalsed ja kumulatiivsed sagedused. See tööriist loob väärtuse andmehulgas esinemise kordade arvu andmed.

Näiteks 20 õpilasega klassis saate määratleda punktisummade jaotuse hindekategooriates. Histogrammitabelis on ära toodud nii hinnete piirid kui ka alumise piirangu ja praeguse piirangu vahele jäävate punktisummade arv. Kõige sagedamini esinev punktisumma on andmete mood.

Näpunäide.: Rakenduses Excel 2016 saate nüüd koostada histogrammi või Pareto diagrammi.

Jooksva keskmise analüüsiriist ennustab prognoosiperioodi väärtusi, võttes aluseks muutuja keskmise väärtuse kindla arvu eelnevate perioodide jooksul. Jooksev keskmine pakub trenditeavet, mille kõigi ajalooliste andmete lihtne keskmine peidaks. Selle tööriista abil saate prognoosida müüki, laoseisu või muid trende. Iga prognoosiväärtus põhineb järgmisel valemil.

Libiseva keskmise arvutamise valem

Kus:

  • N on jooksvasse keskmisse kaasatavate eelmiste perioodide arv

  • A j on tegelik väärtus j-hetkel

  • F j on prognoositud väärtus j-hetkel

Juhuarvude loomise analüüsiriist täidab vahemiku sõltumatute juhuarvudega, mis pärinevad ühest jaotusest (kui jaotusi on mitu). Populatsiooni objekte saate iseloomustada tõenäosusjaotusega. Näiteks saate normaaljaotusega iseloomustada isikute pikkuste populatsiooni või kasutada kulli ja kirja viskamise tulemite populatsiooni iseloomustamiseks kahe võimaliku tulemuse Bernoulli jaotust.

Asukoht ja protsentiil analüüsiriist loob tabeli, mis sisaldab iga väärtuse andmehulgas kasutamist ja protsentuaalse asukoha andmehulgas. Saate analüüsida väärtusi andmehulgas suhtelise positsiooni. See tööriist kasutab töölehefunktsioone asukoht. EQ jaPERCENTRANK. INC. Kui soovite kontoga võrdseid väärtusi, kasutage asukoht. EQ funktsioon, mis käsitleb võrdseid väärtusi, millel on sama väärtusega, või kasutage funktsiooni asukoha ARVULOENDIS.Funktsioon AVG , mis tagastab keskmise võrdseid väärtusi.

Regressiooni analüüsiriist teostab lineaarregressiooni analüüsi vähimruutude meetodi abil, et sobitada sirget erinevate vaatlustega. Saate analüüsida, kuidas mõjutavad ühe või mitme sõltumatu muutuja väärtused ühte sõltuvat muutujat. Näiteks saate analüüsida, millist mõju avaldavad sportlase tulemustele sellised tegurid nagu vanus, pikkus ja kaal. Tulemuste andmete kogumi põhjal saate igale tegurile määrata teatud osakaalu tulemuste mõõtmisel ja tulemeid seejärel kasutada uue, testimata sportlase tulemuste ennustamiseks.

Regressiooni tööriist kasutab töölehefunktsiooni LINEST.

Valiku analüüsiriist loob populatsioonivalimi, käsitledes populatsioonina sisendvahemikku. Kui populatsioon on töötlemiseks või kaardistamiseks liiga suur, võite kasutada esindavat valimit. Samuti võite luua valimi, mis sisaldab ainult tsükli teatud osast pärinevaid väärtusi, kui arvate, et sisendandmed on perioodilised. Kui sisendvahemik sisaldab näiteks kvartaalseid müüginäitajaid, võite valimi koostamisel kasutada perioodimäära neli, et paigutada väljundvahemikku sama kvartali väärtused.

Kahe valimiga t-Testi analüüsiriistad testivad iga valimi aluseks olevate populatsioonide aritmeetiliste keskmiste võrdsust. Kolme tööriista puhul lähtutakse erinevatest eeldustest: populatsioonide dispersioonid on võrdsed, populatsioonide dispersioonid pole võrdsed, ning kaks valimit esindavad samade objektide töötlemiseelseid ja töötlemisjärgseid vaatlusi.

Kõigi kolme tööriista puhul arvutatakse t-statistiku väärtus t, mis kuvatakse väljundtabelis nimega "t Stat". Sõltuvalt andmetest võib see väärtus t olla nii negatiivne kui ka mittenegatiivne. Eeldades, et analüüsi aluseks olevate populatsioonide aritmeetilised keskmised on võrdsed, siis kui t < 0, "P(T <= t) ühepoolne", annab see tõenäosuse, et t-statistiku vaadeldav väärtus oleks negatiivsem kui t. Kui t >=0, "P(T <= t) ühepoolne", annab see tõenäosuse, et t-statistiku vaadeldav väärtus oleks positiivsem kui t. "t-statistiku kriitiline ühepoolne" annab katkestusväärtuse, mille puhul väärtusest "t-statistiku kriitiline ühepoolne" suurema või sellega võrdse väärtuse vaatlemise tõenäosus on alfa.

"P(T <= t) kahepoolne" annab tõenäosuse, et t-statistiku vaadeldav väärtus oleks absoluutväärtuselt suurem kui t. "P-statistiku kriitiline kahepoolne" annab katkestusväärtuse, mille puhul väärtusest "P-statistiku kriitiline kahepoolne" absoluutväärtuselt suurema t-statistiku väärtuse vaatlemise tõenäosus on alfa.

t-test: kahe valimi keskväärtuste arvutamiseks paaris

Paaristesti saate kasutada kui valimis on vaatlused loomupäraselt paaris (nt valimigruppi on testitud kaks korda – enne ja pärast eksperimenti). See analüüsiriist ja selle valem sooritavad kahe paarisvalimi Studenti t-testi, et kontrollida, kas vaatlused, mis on võetud enne ja pärast töötlemist, on tõenäoliselt pärit võrdsete populatsiooni keskväärtustega jaotustest. t-test ei eelda mõlema populatsiooni dispersiooni võrdsust.

Märkus.: Selle tööriista loodavate tulemite seas on ühendatud dispersioon – keskmise ümbruses asuvate andmete hajuvuse akumuleeritud mõõtmine, mis tuletatakse järgmisest valemist.

Ühendatud valimi dispersiooni arvutamise valem

t-test: kaks valimit võrdsete dispersioonide eeldusega

See analüüsiriist sooritab kahe valimi Studenti t-testi. t-test eeldab, et kaks andmehulka pärinevad sama dispersiooniga jaotustest. Seda nimetatakse püsihajuvaks t-testiks. Selle t-testiga saate määrata, kas kaks valimit pärinevad tõenäoliselt jaotustest, mille populatsioonidel on võrdne keskväärtus.

t-test: kaks valimit ebavõrdsete dispersioonide eeldusega

See analüüsiriist sooritab kahe valimi Studenti t-testi. See t-test eeldab, et kaks andmehulka pärinevad ebavõrdse dispersiooniga jaotustest. Seda nimetatakse muuthajuvaks t-testiks. Nagu eelmise, võrdse dispersiooni puhul, saate seda testi kasutada selleks, et määratleda, kas kaks valimit pärinevad tõenäoliselt jaotustest, millel on võrdsed populatsiooni keskväärtused. Kasutage seda testi juhul, kui kahes valimis on eristuvaid üksusi. Kasutage järgmises näiteskirjeldatud paaristesti üksuste ühe kogumi olemasolu puhul ja kui kaks valimit esindavad iga üksuse mõõtmisi enne ja pärast töötlemist.

Statistilise väärtuse t määratlemiseks kasutatakse järgmist valemit.

Väärtuse t arvutamise valem

Vabadusastmete, df arvutamiseks kasutatakse järgmist valemit. Kuna arvutamise tulemus on tavaliselt pole täisarv, ümardatakse väärtus DF saada kriitilise väärtuse t tabelist lähima täisarvuni. Exceli töölehe funktsiooni T.TEST kasutab arvutatud df väärtust ilma ümardamise, sest see on võimalik arvutada väärtuse T.Mõne noninteger testi df. Need erinevad meetodid on vabadusastmete, T. tulemuste tõttuTEST ja see t-Test tööriist erinevad ebavõrdsete dispersioonide eeldusega juhul.

Vabadusastmete umbkaudse arvutamise valem

Z-testi: mis teadaolevate dispersioonide teeb kahe valimi z-testi analüüsitööriist kaks proovi. See tööriist on kasutatud testimiseks null juhul, kui on olemas kaks populatsiooni tähendab vastu kas ühepoolsete või kahepoolsete alternatiivse hüpoteesiga vahet. Kui dispersioonide tundmatu, töölehe funktsioon Z.Selle asemel tuleks kasutada TEST .

z-Testi tööriista kasutamisel olge väljundi tõlgendamisel ettevaatlik. "P(Z <= z) ühepoolne" on tegelikult P(Z >= ABS(z)) – tõenäosus, et z-väärtus on 0-st kaugemal samas suunas nagu vaadeldud z-väärtus, kui populatsioonide keskmiste vahel pole erinevusi. "P(Z <= z) kahepoolne" on tegelikult P(Z >= ABS(z) või Z <= -ABS(z)) – tõenäosus, et z-väärtus on 0-st kummaski suunal kaugemal kui vaadeldud z-väärtus, kui populatsioonide keskmiste vahel pole erinevusi. Kahepoolne tulem on lihtsalt kahega korrutatud ühepoolne tulem. z-Testi tööriista saab kasutada ka juhul, kui nullhüpotees on see, et kahe populatsiooni keskmistel on teatud kindel nullist erineva väärtusega erinevus. Näiteks saate selle testi abil määratleda kahe automudeli jõudluse erinevusi.

Kas vajate rohkem abi?

Võite oma küsimuse alati esitada mõnele Exceli tehnikakogukonna eksperdile, otsida abi vastustefoorumist või soovitada mõnd uut funktsiooni või täiustust Exceli User Voice’i lehel.

Vt ka

Histogrammi koostamine rakenduses Excel 2016

Pareto-diagrammi koostamine rakenduses Excel 2016

Exceli analüüsi tööriistapaketi laadimine

MATEMAATIKA ERIFUNKTSIOONID (teatmematerjalid)

STATISTIKAFUNKTSIOONID ( teatmematerjalid)

Exceli valemite ülevaade

Katkiste valemite ärahoidmine

Valemites vigade leidmine ja lahendamine

Exceli kiirklahvid ja funktsiooniklahvid

Exceli funktsioonid (tähestikuliselt)

Exceli funktsioonid (kategooriate kaupa)

Täiendage Office'i kasutamise oskusi
Tutvuge koolitusmaterjalidega
Kasutage uusi funktsioone enne teisi
Liituge Office Insideri programmiga

Kas sellest teabest oli abi?

Täname tagasiside eest!

Täname tagasiside eest! Tundub, et võiksime teid kokku viia ühega meie Office'i tugiagentidest, kes aitab teil probleemi lahendada.

×