Bruke Analyseverktøy til å utføre komplisert dataanalyse

Hvis du må utvikle kompliserte statistiske eller tekniske analyser, kan du spare tid ved å bruke analyseverktøyet. Du legger inn data og parametere for hver analyse, og verktøyet bruker passende statistiske eller tekniske makrofunksjoner til å beregne og deretter vise resultatet i en utdatatabell. Enkelte verktøy genererer diagrammer i tillegg til utdatatabellene.

Dataanalysefunksjonene kan bare brukes i ett regneark om gangen. Når du utfører dataanalyser i grupperte regneark, vises resultatet i det første regnearket, mens tomme, formaterte tabeller blir vist i resten av regnearkene. Når du skal utføre dataanalyser i resten av regnearkene, må du omberegne analyseverktøyet for hvert regneark.

Analyseverktøyet inneholder verktøyene som er beskrevet i avsnittene nedenfor. Du får tilgang til disse verktøyene ved å klikke Dataanalyse i Analyse-gruppen på fanen Data. Hvis kommandoen Dataanalyse ikke er tilgjengelig, må du laste inn tilleggsprogrammet Analyseverktøy.

  1. Klikk Alternativer på fanen Fil, og klikk deretter fanen Tillegg.

    Hvis du bruker Excel 2007, klikker du på Microsoft Office-knappen Office-knappen , og deretter på Alternativer for Excel.

  2. Velg Excel-tillegg fra Behandle-boksen, og klikk deretter Søk.

    Hvis du bruker Excel for Mac, går du til Verktøy > Excel-tillegg i Fil-menyen.

  3. Merk av for Analyseverktøy i Tillegg-boksen, og klikk deretter OK.

    • Hvis Analyseverktøy ikke vises i Tilgjengelige tillegg-boksen, kan du klikke Bla gjennom for å finne det.

    • Hvis du får melding om at analyseverktøyet ikke er installert på datamaskinen, klikker du Ja for å installere det.

Merknad: Hvis du vil ta med VBA-funksjoner (Visual Basic for Application) for Analyseverktøy, kan du laste inn tillegget Analyseverktøy - VBA på samme måte som du laster inn Analyseverktøy. I Tilgjengelige tillegg-boksen merker du av for Analyseverktøy - VBA.

Analyseverktøyene i Dataanalyse inneholder ulike verktøy for å analysere varians. Verktøyet du bør bruke, avhenger av antall faktorer og antall utdrag fra populasjonen du vil teste.

Variansanalyse: Én faktor

Dette verktøyet utfører en enkel variansanalyse av data for to eller flere utvalg. Analysen tester hypotesen at hvert utvalg er trukket fra samme underliggende sannsynlighetsfordeling, mot den alternative hypotesen at underliggende sannsynlighetsfordelinger ikke er like for alle utvalg. Hvis det bare er to utvalg, kan du bruke regnearkfunksjonen T.TEST. Hvis det er mer enn to utvalg, finnes det ingen passende generalisering av T.TEST, og en-faktoranalysen kan brukes i stedet.

Variansanalyse: To faktorer med tilbakelegging

Dette analyseverktøyet er nyttig når data kan klassifiseres etter to forskjellige dimensjoner. I et eksperiment for å måle plantehøyde, kan for eksempel plantene ha forskjellige gjødselstyper (for eksempel A, B og C) og også forskjellige temperaturer (for eksempel lav og høy). For hvert av de seks mulige gjødsel- eller temperaturparene har vi et likt antall observasjoner av plantehøyde. Ved å bruke dette dataanalyseverktøyet kan vi teste:

  • Om plantehøyden for de forskjellige gjødselstypene er trukket fra samme underliggende populasjon. Temperaturene er ikke tatt hensyn til i denne analysen.

  • Om plantehøyden for de forskjellige temperaturnivåene er trukket fra samme underliggende populasjon. Gjødselstypene blir ikke tatt hensyn til i denne analysen.

Om det er gjort rede for virkningene av forskjellene mellom gjødselstypene i første punkt og temperaturene i andre punkt, med de seks utvalgene som representerer alle parverdiene for gjødsel eller temperatur trukket fra samme populasjon. Den alternative hypotesen er at det finnes virkninger som skyldes bestemte gjødsels -eller temperaturpar over og ovenfor forskjellene som er basert bare på gjødsel eller bare på temperatur.

Oppsett for inndataområdet for dataanalyseverktøy

Variansanalyse: To faktorer uten tilbakelegging

Dette analyseverktøyet er nyttig når data klassifiseres etter to forskjellige dimensjoner, som i tilfellet i to faktorer med tilbakelegging. I dette verktøyet antas det imidlertid at det bare finnes én observasjon for hvert par (for eksempel hvert gjødsels- eller temperaturpar i det forrige eksemplet).

Regnearkfunksjonene KORRELASJON og PEARSON beregner begge korrelasjonskoeffisienten mellom to målingsvariabler når målingene av hver variabel observeres for hvert av N-emnene (når en observasjon for et emne mangler, blir emnet ikke tatt hensyn til i analysen). Korrelasjonsanalyseverktøyet er spesielt nyttig når det er flere enn to målingsvariabler for hvert av N-emnene. Det gis en utdatatabell, en korrelasjonsmatrise som viser KORRELASJON-verdien (eller PEARSON-verdien) som gjelder for hvert mulige målingsvariabelpar.

Korrelasjonskoeffisienten er som kovariansen en måling av hvor mye to målingsvariabler «varierer» sammen. I motsetning til kovariansen skaleres korrelasjonskoeffisienten slik at verdien er uavhengig av enhetene de to målingsvariablene er uttrykt i (hvis for eksempel de to målingsvariablene er vekt og høyde, forblir korrelasjonskoeffisienten uendret hvis vekten konverteres fra pund til kilogram). Verdien av alle korrelasjonskoeffisienter må være mellom eller lik -1 og +1.

Du kan bruke korrelasjonsanalyseverktøyet til å undersøke hvert målingsvariabelpar for å avgjøre om de to målingsvariablene viser samvariasjon \endash det vil si om store verdier i en variabel henger sammen med store verdier i den andre (positiv korrelasjon), om små verdier i en variabel henger sammen med store verdier i den andre (negativ korrelasjon), eller om verdiene i variablene ikke er relatert til hverandre (korrelasjon nær 0 (null)).

Verktøyene Korrelasjon og Kovarians kan begge brukes ved samme innstillinger, når du har observert N forskjellige målingsvariabler for et sett personer. Korrelasjons- og kovariansverktøyene har begge en utdatatabell, en matrise som viser henholdsvis korrelasjonskoeffisienten eller kovariansen mellom hvert målingsvariabelpar. Forskjellen er at korrelasjonskoeffisienter er skalert til å være mellom eller lik -1 og +1. De tilsvarende kovariansene skaleres ikke. Både korrelasjonskoeffisienten og kovariansen er målinger av hvor mye to variabler «varierer» sammen.

Verktøyet Kovarians beregner verdien av regnearkfunksjonen KOVARIANS.P for hvert målingsvariabelpar (direkte bruk av KOVARIANS.P i stedet for verktøyet Kovarians er et fornuftig alternativ når det bare er to målingsvariabler, det vil si at N=2). Oppføringen i diagonalen i utdatatabellen for verktøyet Kovarians i rad i, kolonne i er kovariansen målingsvariabelen i-th med seg selv. Dette er bare populasjonsvariansen for variabelen slik det beregnes i regnearkfunksjonen VARIANS.P.

Du kan bruke kovariansanalyseverktøyet til å undersøke hvert målingsvariabelpar for å avgjøre om de to målingsvariablene viser samvariasjon \endash det vil si om store verdier i en variabel henger sammen med store verdier i den andre (positiv kovarians), om små verdier i en variabel henger sammen med store verdier i den andre (negativ kovarians), eller om verdiene i variablene ikke er relatert til hverandre (kovarians nær 0 (null)).

Analyseverktøyet Deskriptiv statistikk genererer en rapport over univariat statistikk for data i inndataområdet. Denne rapporten gir informasjon om sentraltendens og spredning for dataene.

Analyseverktøyet Eksponentiell glatting predikerer en verdi som er basert på prognosen for forrige periode, justert for feil i den forrige prognosen. Dette verktøyet bruker glattingskonstanten a. Størrelsen på denne konstanten avgjør i hvilken grad prognosene reagerer på feil i forrige prognose.

Merknad: Verdier mellom 0,2 og 0,3 er fornuftige glattingskonstanter. Disse verdiene indikerer at prognosen bør justeres 20 til 30 % for feil i forrige prognose. Større konstanter gir raskere svar, men kan gi uberegnelige prognoser. Mindre konstanter kan resultere i lang ventetid på prognoseverdiene.

Analyseverktøyet F-test: To utvalg for varianser utfører en F-test med to utvalg for å sammenligne variansen i to populasjoner.

Du kan for eksempel bruke F-test-verktøyet for eksempler med tider i svømming for hvert av to lag. Verktøyet gir testresultatet for nullhypotese, det vil si at disse to utvalgene kommer fra fordelinger med lik varians, mot alternativet at variansen ikke er lik i underliggende fordelinger.

Verktøyet beregner verdien f av en F-statistikk (eller F-forhold). En f-verdi nær opptil 1 beviser at underliggende populasjonsvarianser er like. Hvis f < 1 "P(F <= f) ensidig" i utdatatabellen, er sannsynligheten for å observere en verdi i F-statistikken mindre enn f når populasjonsvariansene er like, og "F-kritisk ensidig" gir kritisk verdi mindre enn 1 for valgt signifikansnivå, Alfa. Hvis f > 1, "P(F <= f) ensidig", er sannsynligheten for å observere en verdi i F-statistikken større enn f når populasjonsvariansene er like og "F-kritisk ensidig" gir kritisk verdi større enn 1 for Alfa.

Verktøyet Fourier-analyse løser problemer i lineære systemer og analyserer periodiske data ved at dataene transformeres ved hjelp av metoden «rask Fourier-transformasjon» (Fast Fourier Transform). Dette verktøyet støtter også inverse transformasjoner, der den inverse av transformerte data returnerer de opprinnelige dataene.

Inndata- og utdataområder for Fourier-analyse

Analyseverktøyet Histogram beregner enkeltfrekvenser og kumulative frekvenser for et celleområde med data og dataintervaller. Dette verktøyet genererer data for antall forekomster av verdier i et datasett.

I en klasse med 20 studenter kan du for eksempel være interessert i fordelingen av karakterer. En histogramtabell presenterer øvre og nedre karaktergrense, og antall karakterer mellom laveste grense og gjeldende grense. Den enkeltkarakter som forekommer hyppigst, utgjør modalverdien for dataene.

Tips!: I Excel 2016 kan du nå opprette et histogram eller paretodiagram.

Analyseverktøyet Bevegelig gjennomsnitt projiserer verdier i prognoseperioden, basert på gjennomsnittsverdien av variablene over et bestemt antall foregående perioder. Et bevegelig gjennomsnitt gir trendinformasjon som et enkelt gjennomsnitt av alle historiske verdier ville skjule. Du kan bruke dette verktøyet til å forutsi salg, vareopptelling eller andre trender. Hver prognoseverdi er basert på følgende formel.

Formel for å beregne bevegelig gjennomsnitt

hvor:

  • N er antall tidligere perioder du vil ha med i det bevegelige gjennomsnittet

  • A j er den faktiske verdien på tidspunkt j

  • F j er prognoseverdien på tidspunkt j

Analyseverktøyet Generering av tilfeldige tall fyller et område med uavhengige, tilfeldige tall, trukket fra en eller flere fordelinger. Du kan beskrive elementene i en populasjon med en sannsynlighetsfordeling. Du kan for eksempel bruke en normalfordeling til å beskrive høyden på individene i en populasjon, eller bruke en Bernoulli-fordeling med to mulige resultater til å simulere en populasjon av mynt- og kronekast.

Analyseverktøyet Rangering og persentil lager en tabell med ordenstallrangering og prosentdelrangering for hver verdi i et datasett. Du kan analysere den relative rangeringen for verdier i et datasett. Dette verktøyet bruker regnearkfunksjonene RANG.EKV og PROSENTDEL.INK. Hvis du vil gjøre rede for uavgjorte verdier, bruker du RANG.EKV-funksjonen, som behandler uavgjorte verdier som om de har samme rang, eller bruk RANG.GJSN-funksjonen, som returnerer gjennomsnittsrang for de uavgjorte verdiene.

Analyseverktøyet Regresjon utfører lineær regresjonsanalyse ved hjelp av «minste kvadraters metode» til å tilpasse en linje til et sett observasjoner. Du kan analysere hvordan en enkelt variabel påvirkes av verdiene til en eller flere uavhengige variabler. Du kan for eksempel analysere hvordan ytelsen til en idrettsutøver påvirkes av faktorer som alder, høyde og vekt. Du kan knytte deler av prestasjonene til hver av de tre faktorene, basert på et sett prestasjonsdata, og deretter bruke resultatet til å predikere prestasjonene til en ny idrettsutøver som ikke har vært testet.

Verktøyet Regresjon bruker regnearkfunksjonen RETTLINJE.

Analyseverktøyet Utvalg lager et utvalg fra en populasjon ved å behandle inndataområdet som en populasjon. Når populasjonen er for stor til at du kan behandle eller lage diagram av det, kan du bruke et representativt utvalg. Du kan også lage et utvalg som bare inneholder verdier fra en bestemt del av en syklus, hvis du tror at inndataene er periodiske. Hvis for eksempel inndataområdet inneholder salgstall for et kvartal, blir utvalgsverdiene fra samme kvartal lagt inn i utdataområdet.

Analyseverktøyene T-test for to utvalg tester likhet i populasjonsgjennomsnittet som ligger under hvert utvalg. De tre verktøyene har forskjellige forutsetninger: at populasjonsvariansene er like, at populasjonsvariansene ikke er like, og at de to utvalgene representerer observasjoner av de samme elementene før behandling og etter behandling.

For alle de tre verktøyene nedenfor beregnes en t-statistikkverdi, t, som vises som "t-stat" i utdatatabellene. Avhengig av dataene kan denne t-verdien være negativ eller ikke-negativ. Under forutsetningen av at de underliggende populasjonene har samme gjennomsnitt, hvis t < 0, "P(T <= t) ensidig", er sannsynligheten for at en verdi i t-statistikken vil bli observert som si være mer negativ enn t. Hvis t >=0, "P(T <= t) ensidig", er sannsynligheten for at en verdi i t-statistikken vil bli observert som er mer positiv enn t. "t-kritisk ensidig" gir en avkuttet verdi, slik at sannsynligheten for å observere en verdi i t-statistikken større enn eller lik "t-kritisk ensidig", er Alfa.

I "P(T <= t) tosidig" er sannsynligheten for at en verdi i t-statistikken som er større i absolutt verdi enn i t, vil observeres. "P-kritisk tosidig" gir en avkuttet verdi, slik at sannsynligheten for en observert t-statistikk som er større i absolutt verdi enn "P-kritisk tosidig", er Alfa.

T-test: Gjennomsnitt for to parvise utvalg

Du kan bruke en parvis test når det dannes naturlige observasjonspar i utvalgene, for eksempel når en utvalgsgruppe testes to ganger \endash før og etter et eksperiment. Dette analyseverktøyet og formelen utfører en partest med to utvalg for studenter for å avgjøre om observasjoner før en behandling og observasjoner som er tatt etter en behandling kan komme fra fordelinger der populasjonen har samme gjennomsnitt. I denne t-testen antas det ikke at variansen i populasjonene er like.

Merknad: Blant resultatene som genereres av dette verktøyet er gruppevarians, et samlet mål på spredningen av data rundt gjennomsnittet, som er utledet fra formelen nedenfor.

Formel for å beregne gruppevarians

T-test: To utvalg med antatt like varianser

Dette analyseverktøyet utfører en t-test med to utvalg av studenter. I denne typen t-test blir det antatt at de to datasettene kom fra fordelinger med like varianser. Testen kalles en homoskedastisk t-test. Du kan bruke denne t-testen til å avgjøre om det er sannsynlig at de to utvalgene kom fra fordelinger der populasjonen har samme gjennomsnitt.

T-test: To utvalg med antatt ulike varianser

Dette analyseverktøyet utfører en t-test for to utvalg av studenter. I denne typen t-test antas det at de to datasettene kom fra fordelinger med ulike varianser. Testen kalles en heteroskedastisk t-test. Slik som i det foregående tilfellet med lik varians, kan du bruke denne t-testen til å avgjøre om det er sannsynlig at de to utvalgene har kommet fra fordelinger der populasjonen har samme gjennomsnitt. Bruk denne testen når det er forskjellige elementer i de to utvalgene. Bruk den parvise testen som er beskrevet i følgende eksempel, når det er et enkelt sett elementer og de to utvalgene representerer målinger for hvert element før og etter en behandling.

Formelen nedenfor brukes til å finne den statistiske verdien t.

Formel for å beregne verdien t

Følgende formel brukes til å beregne graden av frihet, df. Fordi resultatet av beregningen vanligvis ikke er et helt tall, rundes df-verdien av til nærmeste heltall for å få en kritisk verdi fra t-tabellen. Regnearkfunksjonen i Excel, T.TEST, bruker den beregnede df-verdien uten å runde av, fordi det er mulig å beregne en verdi for T.TEST uten en df med heltall. På grunn av disse forskjellige måtene å bestemme grad av frihet på, vil resultatene i T.TEST og dette t-test-verktøyet være forskjellige fra tilfellet med ulik varians.

Formel for å finne en tilnærmelse til antall frihetsgrader

Analyseverktøyet Z-test: Gjennomsnitt for to parvise utvalg utfører en z-test for to utvalg for gjennomsnitt med kjente varianser. Dette verktøyet brukes til å teste nullhypotesen om at det ikke er noen forskjell mellom populasjonsgjennomsnitt, enten mot en ensidig eller en tosidig alternativ hypotese. Hvis variansene er kjent, bør regnearkfunksjonen Z.TEST brukes i stedet.

Når du bruker Z-test-verktøyet, bør du være nøye på at du forstår utdataene. "P(Z <= z) ensidig" er egentlig P(Z >= ABS(z)), sannsynligheten for en z-verdi lengre fra 0 i samme retning som den observerte z-verdien når det ikke er noen forskjell mellom populasjonsgjennomsnittene. "P(Z <= z) tosidig" er egentlig P(Z >= ABS(z) or Z <= -ABS(z)), sannsynligheten for en z-verdi lengre fra 0 i hvilken som helst retning enn den observerte z-verdien når det ikke er noen forskjell mellom populasjonsgjennomsnittene. Det tosidige resultatet er bare det ensidige resultatet multiplisert med 2. Z-test-verktøyet kan også brukes i tilfellet der nullhypotesen er at det er en bestemt ikke-null-verdi for forskjellen mellom de to populasjonsgjennomsnittene. Du kan for eksempel bruke denne testen til å finne forskjellen i ytelse mellom to bilmodeller.

Trenger du mer hjelp?

Du kan alltid spørre en ekspert i Excel tekniske fellesskap, få støtte i Svar-fellesskapet eller foreslå en ny funksjon eller forbedring på Excel User Voice.

Se også

Opprette et histogram i Excel 2016

Opprette et paretodiagram i Excel 2016

Se denne videoen for å installere og aktivere tilleggene Analyseverktøy og Problemløser i

TEKNISKE funksjoner (referanse)

STATISTISKE funksjoner (referanse)

Oversikt over formler i Excel

Slik unngår du brutte formler

Finne og rette feil i formler

Excel-hurtigtaster og -funksjonstaster

Excel-funksjoner (alfabetisk)

Excel-funksjoner (etter kategori)

Utvid ferdighetene dine
Utforsk opplæring
Vær først ute med de nye funksjonene
Bli med i Office Insiders

Var denne informasjonen nyttig?

Takk for tilbakemeldingen!

Takk for tilbakemeldingen! Det høres ut som det kan være lurt å sette deg i kontakt med én av våre Office-kundestøtteagenter.

×