Kompleksna analiza podatkov z orodji za analizo

Če morate razviti zapletene statistične ali inženirske analize, lahko prihranite čas in zmanjšate število korakov, če uporabite orodja za analizo. Za vsako analizo orodju zagotovite podatke in parametre, orodje pa uporabi ustrezne statistične ali inženirske funkcije z makri, da izračuna in prikaže rezultate v izhodni tabeli. Nekatera orodja izdelajo poleg izhodnih tabel tudi grafikone.

Funkcije za analizo podatkov se lahko sočasno uporabljajo samo na enem delovnem listu. Ko boste izvajali analizo podatkov na skupini delovnih listov, boste dobili rezultate samo na prvem delovnem listu, na preostalih delovnih listih pa samo prazne oblikovane tabele. Če želite izvesti analizo podatkov na preostalih delovnih listih, uporabite orodje za analizo na vsakem delovnem listu.

V zbirki orodij za analizo so orodja, opisana v spodnjih razdelkih. Če želite dostopati do orodij, na zavihku Podatki v skupini Analiza kliknite Analiza podatkov. Če ukaz Analiza podatkov ni na voljo, morate namestiti dodatek za analizo podatkov.

  1. Kliknite zavihek Datoteka, Možnosti in nato kategorijo Dodatki.

    Če uporabljate Excel 2007, kliknite gumb Microsoft Office Slika gumba »Office« , nato pa kliknite Excelove možnosti.

  2. V polju Upravljanje izberite možnost Excelovi dodatki in nato kliknite Pojdi.

    Če uporabljate Excel for Mac, v meniju datoteke odprite Orodja > Excelovi dodatki.

  3. V polju Dodatki potrdite potrditveno polje Orodja za analizo in nato kliknite V redu.

    • Če Orodja za analizo niso navedena v oknu Dodatki, ki so na voljo, kliknite Prebrskaj in jih poiščite.

    • Če se prikaže poziv, da orodja za analizo trenutno niso nameščena na vašem računalniku, kliknite Da in jih namestite.

Opomba : Če želite vključiti še funkcije VBA (Visual Basis for Application), lahko naložite dodatek orodij za analizo – VBA, tako kot ste naložili orodja za analizo. Na seznamu Dodatki, ki so na voljo potrdite potrditveno polje Orodja za analizo – VBA.

Orodje »Anova« omogoča različne vrste analize variance. Izbira orodja je odvisna od številnih dejavnikov in od števila vzorcev iz populacije, ki jo nameravate testirati.

Anova: en faktor

To orodje izvede preprosto analizo variance za dva ali več vzorcev. Analiza priskrbi preskus hipoteze, da je vsak vzorec izbran iz enake temeljne verjetnostne porazdelitve, proti alternativni hipotezi, da temeljne verjetnostne porazdelitve niso enake za vse vzorce. Če imate samo dva vzorca, lahko uporabite funkcijo T.TEST delovnega lista. Če imate več kot dva vzorca, ustrezne posplošitve T.TEST ni, tako da namesto tega raje pokličite model Anove z enim faktorjem.

Anova: dva faktorja s podvajanjem

To orodje za analizo je uporabno, ko lahko podatke razvrstite v dve različni dimenziji. V poskusu meritve na primer višine rastlin so rastline lahko gnojene z različnimi znamkami gnojil (npr. A, B in C) in pri različnih temperaturah (npr. nizki in visoki). Za vseh šest možnih parov {gnojilo, temperatura} imamo enako število opazovanj višine rastlin. Z uporabo tega orodja Anova lahko preskusimo:

  • Ali se višine rastlin za različne znamke gnojila izberejo iz iste temeljne populacije? Temperature se pri tej analizi prezrejo.

  • Ali se višine rastlin za različne ravni temperature izberejo iz iste temeljne populacije? Znamke gnojil se pri tej analizi prezrejo.

Ali se, glede na ocene za posledice razlik med znamkami gnojil v prvi točki z oznakami in razlikami v temperaturah v drugi točki z oznakami, šest vzorcev, ki predstavlja vse pare vrednosti {gnojilo, temperatura}, izbere iz iste populacije? Alternativna hipoteza je, da so posledice zaradi določenih parov {gnojilo, temperatura} prek in nad razlikami, ki temeljijo samo na gnojilu ali pa samo na temperaturi.

Priprava vhodnega obsega za orodje Anova

Anova: dva faktorja brez podvajanja

To orodje za analizo je uporabno, če so podatki razvrščeni v dveh različnih dimenzijah, na primer v primeru dveh faktorjev z replikacijo. Vendar pa za to orodje domnevamo, da vsak par (npr. vsak par {gnojilo, temperatura} v prejšnjem primeru) opazujemo samo enkrat.

Funkciji CORREL in PEARSON delovnega lista izračunata korelacijski koeficient med dvema merskima spremenljivkama, ko mere vsake spremenljivke opazujete za vsakega od N predmetov. (Katero koli manjkajoče opazovanje za kateri koli predmet povzroči, da bo ta predmet v analizi prezrt.) Orodje za analizo korelacije je še posebej uporabno, ko imate več kot dve merski spremenljivki za vsakega od N predmetov. Priskrbi izhodno tabelo, korelacijsko matriko, ki prikaže vrednost CORREL (ali PEARSON), ki jo uporablja vsak možen par merskih spremenljivk.

Korelacijski koeficient je tako kot kovarianca mera, do katere dve merski spremenljivki »variirata skupaj«. V nasprotju s kovarianco je korelacijski koeficient usmerjen tako, da je njegova vrednost neodvisna od enot, v katerih sta izraženi dve merski spremenljivki. (Če sta dve merski spremenljivki, na primer teža in višina, ostane vrednost korelacijskega koeficienta nespremenjena, če težo pretvorimo iz funtov v kilograme.) Vrednost katerega koli korelacijskega koeficienta mora biti med vključno -1 in 1.

Orodje za korelacijo lahko uporabljate, če želite preučiti vsak par merskih spremenljivk, da ugotovite, ali se ti dve merski spremenljivki nagibata k skupnemu premikanju — se pravi, ali so velike vrednosti ene spremenljivke nagnjene k povezavi z velikimi vrednostmi druge spremenljivke (pozitivna korelacija), ali so majhne vrednosti ene spremenljivke nagnjene k povezavi z velikimi vrednostmi druge spremenljivke (negativna korelacija) ali pa vrednosti obeh spremenljivk sploh nista v sorodu (korelacija blizu 0 (nič)).

Orodji za korelacijo in kovarianco lahko uporabimo v isti nastavitvi, ko v naboru posameznikov opazujete N različnih merskih spremenljivk. Orodji za korelacijo in kovarianco ponudita izhodno tabelo, matriko, ki prikazuje korelacijski koeficient oziroma kovarianco med vsakim parom merskih spremenljivk. Razlika je v tem, da je vrednost korelacijskega koeficienta med vključno -1 in vključno 1. Ustrezna kovarianca nima omejitev. Korelacijski koeficient in kovarianca sta meri, do katerih dve spremenljivki »variirata skupaj«.

Orodje za kovarianco izračuna vrednost funkcije COVARIANCE.P delovnega lista za vsak par merskih spremenljivk. (Neposredna uporaba funkcije COVARIANCE.P namesto orodja za kovarianco je razumljiva, ko imate samo dve merski spremenljivki, torej N=2). Vnos na diagonali izhodne tabele orodja za kovarianco v vrstici »i« in v stolpcu »i« je kovarianca i-te merske spremenljivke s samo seboj. To je samo varianca populacije za to spremenljivko, kot jo izračuna funkcija VAR.P delovnega lista.

Orodje Kovarianca lahko uporabljate, če želite preučiti vsak par merskih spremenljivk, da ugotovite, ali se ti dve merski spremenljivki nagibata k skupnemu premikanju  — se pravi, ali so velike vrednosti ene spremenljivke nagnjene k povezavi z velikimi vrednostmi druge spremenljivke (pozitivna kovarianca), ali so majhne vrednosti iz ene spremenljivke nagnjene k povezavi z velikimi vrednostmi druge spremenljivke (negativna kovarianca) ali pa vrednosti obeh spremenljivk sploh nista v sorodu (kovarianca blizu 0 (nič)).

Ustvari poročilo o enovariabilni statistiki za podatke v vhodnem obsegu z informacijami o osrednji tendenci in variabilnosti podatkov.

Orodje za analizo Eksponentno glajenje predvidi vrednost glede na napovedi prejšnjega obdobja, ki je prilagojena za napako v tej napovedi. Uporablja konstanto glajenja a, katere velikost določa, koliko se napovedi odzivajo na napake v prejšnjih napovedih.

Opomba : Vrednosti od 0,2 do 0,3 so smiselne vrednosti za konstante glajenja. Te vrednosti določajo, naj se trenutna napoved zaradi napake prilagodi za 20 odstotkov do 30 odstotkov glede na predhodno napoved. Večje vrednosti dajejo hitrejše odzive, vendar lahko izdelujejo brezciljne napovedi. Majhne konstante pa lahko povzročijo dolge zakasnitve pri napovedi vrednosti.

Izvede dvovzorčni F-test in primerja dve populacijski varianci.

Orodje F-Test lahko na primer uporabite na vzorcih časov plavalnega tekmovanja za vsako od dveh ekip. Orodje priskrbi rezultat preskusa ničelne hipoteze, da ta vzorca prihajata iz porazdelitve z enakimi variancami, proti alternativni hipotezi, da variance niso enake v temeljni porazdelitvi.

Orodje izračuna vrednost »f« F-statistike (ali F-razmerje). Vrednost »f« blizu 1 priskrbi dokaz, da so temeljne variance populacije enake. Če je v izhodni tabeli f < 1, da »P(F <= f) enorepo« verjetnost opazovanja vrednosti F-statistike manj kot »f«, ko so variance populacije enake in da »enorepi kritični F« kritično vrednost, ki je za izbrano raven zaupanja alfa manj kot 1. Če je f > 1, da »P(F <= f) enorepo« verjetnost opazovanja vrednosti F-statistike več kot »f«, ko so variance populacije enake in da »enorepi kritični F« kritično vrednost, ki je za alfo večja kot 1.

Orodje za Fourierjevo analizo rešuje probleme linearnih sistemov in analizira periodične podatke z metodo hitre Fourierjeve transformacije (FFT - Fast Fourier Transform). To orodje podpira tudi inverzne transformacije, ki vrnejo izvirne podatke na podlagi invertiranih transformiranih podatkov.

Vhodni in izhodni obsegi za Fourierjevo analizo

Orodje za analizo Histogram izračuna posamezne in seštevalne frekvence za obseg celic podatkov in predale podatkov. Ustvari tudi podatke za število pogostosti vrednosti v podatkovni množici.

Primer: V razredu z 20 učenci lahko ugotovite porazdelitev ocen po številčnih vrednostih od 1 (nezadostno) do 5 (odlično). Histogramska tabela predstavlja meje številčnih vrednosti ocen in število ocen med najnižjo in trenutno mejo. Tista ocena, ki je najbolj pogosta, se imenuje način podatkov.

Namig : V programu Excel 2016 lahko zdaj ustvarite histogram ali grafikon pareto.

Predvideva vrednosti v obdobju napovedi na podlagi povprečne vrednosti spremenljivke čez določeno število prehodnih obdobij. Drseče povprečje daje informacije o smernicah, ki bi jih preprosto povprečje vseh podatkov iz preteklosti zakrilo. Uporabljajte to orodje za predvidevanje obsega prodaje, zalog in drugih smernic. Vsaka napovedana vrednost temelji na formuli:

Formula za izračun drsečega povprečja

kjer je:

  • N število prejšnjih obdobij, ki jih želite vključiti v drseče povprečje

  • A j dejanska vrednost ob času j

  • F j napovedana vrednost ob času j

Orodje za analizo Generiranje naključnih števil napolni obseg z neodvisnimi naključnimi števili, vzetimi iz ene od več porazdelitev. To orodje lahko uporabljate, če želite pripisati porazdelitev verjetnosti elementom v populaciji. Lahko na primer opišete populacijo telesne višine posameznikov, uporabite normalno porazdelitev ali pa uporabite Bernoullijevo porazdelitev dveh mogočih izidov, če želite opisati populacijo izidov pri metanju kovanca.

Orodje za analizo »Rangiranje in percentili« izriše tabelo z vrstnim in odstotkovnim redom za vsako vrednost v naboru podatkov. To orodje uporablja funkciji delovnega lista RANK.EQ in PERCENTRANK.INC. Če želite računati za nedoločene vrednosti, uporabite funkcijo RANK.EQ, ki nedoločene vrednosti obravnava, kot da imajo enak obseg, ali uporabite funkcijo RANK.AVG, ki vrne povprečen obseg nedoločenih vrednosti.

Orodje za analizo Regresija izvede analizo linearne regresije z uporabo metode »najmanjših kvadratov« in množico merskih točk približa premici. To orodje lahko uporabljate za analizo, kako na vrednost ene odvisne spremenljivke vplivajo vrednosti ene ali več neodvisnih spremenljivk.Analizirate lahko, kako na primer vplivajo na atletove dosežke dejavniki, kot so starost, višina in teža. Vsem tem trem dejavnikom lahko pripišete deleže pomembnosti za učinkovitost atleta na podlagi podatkovne množice o učinkovitosti. Nato uporabite rezultat, če želite predvideti zmogljivosti novega atleta, ki ga še niste preskusili.

Orodje za regresijo uporablja funkcijo delovnega lista LINEST.

Ustvari vzorec iz populacije tako, da vzame zanjo kar vhodni obseg. Kadar je populacija preobsežna, da bi jo program obdelal ali izrisal, lahko uporabljate predstavitveni vzorec. Ustvarite lahko tudi vzorec, ki vsebuje vrednosti samo iz določenega dela periode, če ste prepričani, da so vhodni podatki periodični.Če na primer vsebuje vhodni obseg četrtletne številke o prodaji, vam vzorčenje s periodično stopnjo štiri postavi vrednosti iz istega četrtletja v izhodni obseg.

Orodja za analizo dvovzorčnega t-Testa preskušajo enakost sredin populacije, ki temeljijo na vsakem vzorcu. Tri orodja uporabljajo različne domneve: da so variance populacije enake, da variance populacije niso enake in da dva vzorca predstavljata opazovanja pred obdelavo in po njej na istem predmetu.

Za vsa tri spodnja orodja je t-statistična vrednost t izračunana in prikazana kot »t Stat« v izhodnih tabelah. Glede na podatke je lahko ta vrednost t negativna ali nenegativna. Pod domnevo enakih temeljnih sredin populacije, če je t < 0, da »P(T <= t) enorepo« verjetnost, da bo opazovana vrednost t-statistike, ki je bolj negativna kot t. Če je t >=0, da »P(T <= t) enorepo« verjetnost, da bo opazovana vrednost t-statistike, ki je bolj pozitivna kot t. »Enorepi kritični t« da zmanjšano vrednost, tako da je verjetnost opazovanja vrednosti t-statistike, ki je večja ali enaka »enorepi kritični t«, alfa.

»P(T <= t) dvorepi« da verjetnost, da bo opazovana vrednost t-statistike, katere absolutna vrednost je večja kot t. »Dvorepi kritični P« da zmanjšano vrednost, tako da verjetnost opazovanja t-statistike, katere absolutna vrednost je večja kot »Dvorepi kritični P«, alfa.

t-Test: v paru z dvema vzorcema za aritmetične sredine

Preskus v paru lahko uporabite, ko imate v vzorcih naravno združevanje opazovanj v pare, na primer ko je vzorčna skupina preskušena dvakrat — pred poskusom in po njem. To orodje za analizo in njegova formula izvajata dvovzorčni študentov t-Test v paru, da določi, ali so opazovanja pred obdelavo in po njej prišla iz porazdelitev z enakimi sredinami populacije. Ta oblika t-Testa ne predvideva, da sta varianci obeh populacij enaki.

Opomba : Med rezultati, ki jih ustvari to orodje, je tudi zbirna varianca, zbrana mera razpršenosti podatkov o srednji vrednosti, ki je izpeljana iz te formule.

Formula za izračunavanje zbirne variance

t-Test: z dvema vzorcema z upoštevanjem enakih varianc

To orodje za analizo izvede dvovzorčni študentov t-Test. Ta oblika t-Testa predpostavlja, da sta ti množici podatkov prišli iz porazdelitev z enakimi variancami. To imenujemo tudi homoskedastični t-Test. Te t-Teste lahko uporabite, da ugotovite, ali sta ta vzorca prišla iz porazdelitev z enakimi sredinami populacije.

t-Test: z dvema vzorcema z upoštevanjem neenakih varianc

To orodje za analizo izvede dvovzorčni študentov t-Test. Ta oblika t-Testa predpostavlja, da sta ti množici podatkov prišli iz porazdelitev z neenakimi variancami; To imenujemo tudi heteroskedastični t-Test. Tako kot v gornjem primeru z enakimi variancami lahko ta t-Test uporabite, da ugotovite, ali sta ta vzorca prišla iz porazdelitev z enakimi variancami. Ta preskus uporabite, ko so v dveh vzorcih ločljivi predmeti. Preskus v paru, ki je opisan v naslednjem primeru, uporabite, ko imate en sam nabor predmetov, dva vzorca pa predstavljata mere za vsak predmet pred obdelavo in po njej.

Formula, ki jo program uporablja za ugotavljanje statistične vrednosti preskusa t, je:

Formula za izračunavanje vrednosti t-ja

Ta formula se uporablja za izračunavanje stopenj prostosti, »df«. Ker rezultat izračuna običajno ni celo število, morate vrednost »df« zaokrožiti na najbližje celo število, da pridobite kritično vrednost iz tabele t. Funkcija T.TEST Excelovega delovnega lista uporablja nezaokroženo izračunano vrednost »df«, ker je vrednost za T.TEST mogoče izračunati z vrednostjo »df«, ki ni celo število. Zaradi teh različnih pristopov določanja stopenj prostosti se bosta rezultata orodij T.TEST in tega t-Testa v primeru neenakih varianc razlikovala.

Formula za približno določanje prostorskih stopenj

z-Test: Orodje za dvovzorčno analizo za srednje vrednosti izvede dvovzorčni z-test za srednje vrednosti z znanimi variancami. To orodje uporabite za preskušanje ničelne hipoteze, da ni razlike med sredinami populacije, proti bodisi enostranski bodisi dvostranski alternativni hipotezi. Če variance niso znane, raje uporabite funkcijo Z.TEST delovnega lista.

Ko uporabljate orodje z-Test, bodite previdni pri razumevanju rezultata. »P(Z <= z) enorepo« je dejansko P(Z >= ABS(z)), verjetnost z-vrednosti, ki je dlje od 0 v isti smeri kot opazovana z-vrednost, ko ni razlike med sredinami populacije. »P(Z <= z) dvorepo« je dejansko P(Z >= ABS(z) ali Z <= -ABS(z)), verjetnost z-vrednosti, ki je dlje od 0 v kateri koli smeri kot opazovana z-vrednost, ko ni razlike med sredinami populacije. Dvorepi rezultat je samo enorepi rezultat, pomnožen z 2. Orodje z-Test lahko uporabite tudi v primerih, kjer je ničelna hipoteza, da je za razliko med dvema sredinama populacije določena neničelna vrednost. Ta preskus lahko na primer uporabite, če želite ugotoviti razlike v zmogljivostih dveh modelov osebnih vozil.

Potrebujete dodatno pomoč?

Kadar koli lahko zastavite vprašanje strokovnjaku v skupnosti tehničnih strokovnjakov za Excel, pridobite podporo skupnosti Answers ali predlagate novo funkcijo oziroma izboljšavo na spletnem mestu Excel User Voice.

Glejte tudi

Ustvarjanje histograma v programu Excel 2016

Ustvarjanje grafikona pareto v programu Excel 2016

Oglejte si videoposnetek za namestitev in aktiviranje dodatkov Orodja za analizo in Reševalec

Funkcije za INŽENIRING (referenca)

STATISTIČNE funkcije (referenca)

Pregled formul v Excelu

Kako se izogniti nedelujočim formulam

Iskanje in popravljanje napak v formulah

Bližnjice na tipkovnici in funkcijske tipke za Excel

Excelove funkcije (v abecednem vrstnem redu)

Excelove funkcije (po kategorijah)

Razširite svoja znanja
Oglejte si izobraževanje
Prvi dobite nove funkcije
Pridružite se programu Office Insider

Vam je bila informacija v pomoč?

Zahvaljujemo se vam za povratne informacije.

Zahvaljujemo se vam za povratne informacije. Videti je, da bi vam prišla prav pomoč enega od naših Officeovih agentov za podporo.

×