Brug af Analysis ToolPak til at udføre kompleks dataanalyse

Hvis du skal udvikle komplekse statistiske eller tekniske analyser, kan du spare tid ved at anvende Analysis ToolPak. Du skal levere dataene og parametrene til hver analyse. Værktøjet bruger de relevante statistiske eller tekniske makrofunktioner til at beregne og vise resultaterne i en outputtabel. Ud over outputtabellerne genereres der også diagrammer i nogle værktøjer.

Dataanalysefunktionerne kan kun anvendes på ét regneark ad gangen. Når du udfører en dataanalyse på grupperede regneark, vises resultaterne i det første regneark, og tomme, formaterede tabeller vises i de resterende regneark. Hvis du vil udføre en dataanalyse på de resterende regneark, skal du genberegne med analyseværktøjet for hvert regneark.

Analysis ToolPak indeholder de værktøjer, der er beskrevet i de følgende afsnit. Hvis du vil bruge disse værktøjer, skal du klikke på Dataanalyse i gruppen Analyse under fanen Data. Hvis kommandoen Dataanalyse ikke er tilgængelig, skal du indlæse tilføjelsesprogrammet Analysis ToolPak.

  1. Klik på fanen Filer, klik på Indstillinger, og klik derefter på kategorien Tilføjelsesprogrammer.

    Hvis du bruger Excel 2007, skal du klikke på Microsoft Office-knappen Office-knapflade og derefter klikke på Excel-indstillinger.

  2. Markér Excel-tilføjelsesprogrammer i feltet Administrer, og klik derefter på Søg.

    Hvis du bruger Excel til Mac, skal du i filmenuen gå til Værktøjer > Excel-tilføjelsesprogrammer.

  3. Markér afkrydsningsfeltet Analysis ToolPak i dialogboksen Tilføjelsesprogrammer, og klik derefter på OK.

    • Hvis Analysis ToolPak ikke vises i feltet Tilgængelige tilføjelsesprogrammer, skal du klikke på Gennemse for at finde det.

    • Hvis der vises en meddelelse om, at Analysis ToolPak ikke aktuelt er installeret på din computer, skal du klikke på Ja for at installere det.

Note: Hvis du vil medtage VBA-funktioner (Visual Basic for Application) til Analysis ToolPak, kan du indlæse VBA-tilføjelsesprogrammet til Analysis ToolPak på samme måde, som du indlæser Analysis ToolPak. Markér afkrydsningsfeltet Analysis ToolPak - VBA i feltet Tilgængelige tilføjelsesprogrammer.

Analyseværktøjerne Anova foretager forskellige typer af variansanalyser. Hvilket værktøj, du skal anvende i den konkrete sammenhæng, afhænger af, hvor mange faktorer og hvor mange stikprøver du har fra de populationer, du vil teste.

Anova: Enkeltfaktor

Dette analyseværktøj udfører en simpel analyse af varians på data for to eller flere stikprøver. Analysen producerer en test af den hypotese, at hver stikprøve udtrækkes fra den samme underliggende sandsynlighedsfordeling, i forhold til den alternative hypotese, at underliggende sandsynlighedsfordelinger ikke er de samme for alle stikprøver. Hvis der kun er to stikprøver, kan regnearksfunktionen T.TEST bruges. Ved mere end to stikprøver er der ingen praktisk generalisering af T.TEST, og Anova enkeltfaktormodellen kan bruges i stedet.

Anova: To-faktor med gentagelse

Dette analyseværktøj er nyttigt, når data kan klassificeres i to forskellige dimensioner. I en undersøgelse af plantehøjde kan planterne f.eks. tildeles forskellige gødningsmærker (f.eks. A, B, C) og kan også opbevares ved forskellige temperaturer (f.eks. lav og høj). For hver af de 6 mulige par af {gødning; temperatur} findes samme antal observationer af plantehøjde. Med dette Anova-værktøj kan du teste:

  • Om plantehøjderne for de forskellige gødningsmærker udtrækkes fra den samme underliggende population. Temperatur ignoreres ved denne analyse.

  • Om plantehøjderne for de forskellige temperaturniveauer udtrækkes fra den samme underliggende population. Gødningsmærke ignoreres ved denne analyse.

Uanset om der er redegjort for effekterne af de forskelle mellem gødningsmærker, der blev fundet i det første punkt i opstillingen, og de forskelle i temperaturer, der blev fundet i det andet punkt i opstillingen, udtrækkes de seks stikprøver, der repræsenterer alle par af {gødning, temperatur}-værdier, fra den samme population. Den alternative hypotese er, at der er effekter, der forårsages af specifikke {gødning, temperatur}-par over og under forskellene, der er baseret på gødning alene eller på temperatur alene.

Indstilling af inputområde for Anova-analyseværktøj

Anova: To-faktor uden gentagelse

Dette analyseværktøj er nyttigt, når data er klassificeret i to forskellige dimensioner som i to faktor-tilfældet med gentagelse. Men for dette værktøj antages, at der kun er en enkelt observation for hvert par, f.eks. hvert {gødning, temperatur}-par i forrige eksempel.

Regnearksfunktionerne KORRELATION og PEARSON beregner begge korrelationskoefficienten mellem to målingsvariabler, når målinger på hver variabel observeres for hver af N-emnerne. (En eventuel manglende observation for et emne forårsager, at emnet ignoreres i analysen). Analyseværktøjet Korrelation er særligt nyttigt, når der er mere end to målingsvariabler for hvert af N-emnerne. Det indeholder en outputtabel, en korrelationsmatrix, der viser værdien af KORRELATION (eller PEARSON) anvendt på hvert muligt par målingsvariabler.

Korrelationskoefficienten er ligesom kovariansen et mål for, hvor meget to målingsvariabler "varierer sammen". I modsætning til kovariansen skaleres korrelationskoefficienten, så dens værdi er uafhængig af de enheder, de to målingsvariabler udtrykkes i. (Hvis f.eks. de to målingsvariabler er vægt og højde, er værdien af korrelationskoefficienten uændret, hvis vægt konverteres fra pund til kilogram). Værdien af en korrelationskoefficient skal være mellem -1 og +1 inklusive.

Du kan bruge analyseværktøjet Korrelation til at undersøge hvert par målingsvariabler for at bestemme, om de to målingsvariabler har tendens til at bevæge sig sammen – dvs. om store værdier af den ene variabel har tendens til at være forbundet med store værdier af den anden (positiv korrelation), om små værdier af den ene variabel har tendens til at være forbundet med store værdier af den anden (negativ korrelation), eller om værdier af begge variabler har tendens til ikke at være relateret (korrelation nær 0 (nul)).

Værktøjerne Korrelation og Kovarians kan begge bruges med samme indstilling, når du har N forskellige målingsvariabler, der er observeret på et sæt individer. Værktøjerne Korrelation og Kovarians giver hver en outputtabel, en matrix, der viser henholdsvis korrelationskoefficienten eller kovariansen mellem hvert par målingsvariabler. Forskellen er, at korrelationskoefficienter skaleres til at ligge mellem -1 og +1 inklusive. De kovarianser, der svarer til hinanden, skaleres ikke. Både korrelationskoefficienten og kovariansen er mål for, hvor meget to variabler "varierer sammen".

Værktøjet Kovarians beregner værdien af regnearksfunktionen KOVARIANSP for hvert par målingsvariabler. (Direkte brug af KOVARIANCP frem for værktøjet Kovarians er et fornuftigt alternativ, når der kun er to målingsvariabler, dvs. N=2). Posten på diagonalen i værktøjet Kovarians' outputtabel i række i, kolonne i er kovariansen af den i. målingsvariabel med sig selv. Dette er blot populationsvariansen for denne variabel, som den er beregnet af regnearksfunktionen VARIANS.P.

Du kan bruge værktøjet Kovarians til at undersøge hvert par målingsvariabler for at bestemme, om de to målingsvariabler har tendens til at bevæge sig sammen – dvs., om store værdier af den ene variabel har tendens til at være forbundet med store værdier af den anden (positiv kovarians), om små værdier af den ene variabel har tendens til at være forbundet med store værdier af den anden (negativ kovarians), eller om værdier af begge variabler har tendens til ikke at være relateret (kovarians nær 0 (nul)).

Analyseværktøjet Beskrivende statistik genererer en rapport, der indeholder statistik med én variabel for dataene i inputområdet samt oplysninger om dataenes overordnede tendens og afvigelse.

Analyseværktøjet Eksponentiel udglatning forudsiger en værdi, der er baseret på prognosen fra den forrige periode afstemt efter fejl i denne forrige prognose. Værktøjet benytter en udglatningskonstant, a, hvis størrelse bestemmer, hvor meget prognosen ændres som følge af fejl i den forrige prognose.

Note: Værdier mellem 0,2 og 0,3 er egnede som udglatningskonstanter. Værdierne angiver, at den aktuelle prognose skal korrigeres for fejl med 20 % til 30 % i forhold til den foregående prognose. Større konstanter giver et hurtigere svar, men kan give fejlagtige prognoser. Mindre konstanter kan resultere i, at prognoseværdierne ændres længe efter, at de faktiske værdier ændres.

Analyseværktøjet F-test: Dobbelt-stikprøve for varians udfører en F-test med dobbelt stikprøve for at sammenligne varianser i to populationer.

Du kan f.eks. bruge værktøjet F-Test på stikprøver af tider ved et svømmestævne for hvert af de to hold. Værktøjet indeholder resultatet af en test af den null-hypotese, at disse to stikprøver kommer fra fordelinger med lige varians i forhold til alternativet, at varianserne ikke er lig med hinanden i de underliggende fordelinger.

Værktøjet beregner værdien f for en F-stikprøvefunktion (eller et F-forhold). En værdi af f, der er tæt på 1, er et tegn på, at de underliggende populationsvarianser er lig med hinanden. Hvis f < 1, giver "P(F <= f) en-sidet" i outputtabellen sandsynligheden for at observere en værdi af F-stikprøvefunktionen, der er mindre end f, når populationsvarianser er lig hinanden, og "F kritisk en-sidet" giver den kritiske værdi mindre end 1 for det valgte signifikansniveau Alpha. Hvis f > 1, giver "P(F <= f) en-sidet" sandsynligheden for at observere en værdi af F-stikprøvefunktionen, der er større end f, når populationsvarianser er lig med hinanden, og "F kritisk en-sidet" giver den kritiske værdi større en 1 for Alpha.

Analyseværktøjet Fourier-analyse løser problemer i lineære systemer og analyserer periodiske data ved hjælp af Fast Fourier Transform-metoden (FFT) til at transformere data. Med dette værktøj understøttes også inverse transformationer, hvor det omvendte af de transformerede data returnerer de oprindelige data.

Input- og outputområder for Fourier-analyser

Analyseværktøjet Histogram beregner individuelle og kumulative hyppigheder for et celleområde, der består af data og dataklasser. Værktøjet genererer data for antallet af forekomster af en værdi i et datasæt.

Du kan bruge Histogram, hvis du f.eks. vil kende fordelingen af resultater, opdelt efter karakterer, i en klasse med 20 elever. En histogramtabel viser grænserne for hver karakter samt antallet af resultater, der ligger mellem den nedre grænse og den aktuelle grænse. Det resultat, der forekommer hyppigst, er celleområdets typeværdi.

Tip: I Excel 2016 kan du nu oprette et histogram eller Pareto-diagram.

Analyseværktøjet Bevægeligt gennemsnit beregner værdier i prognoseperioden på grundlag af variablens gennemsnitsværdi i et bestemt antal foregående perioder. Et bevægeligt gennemsnit frembringer tendensoplysninger, som ikke kan aflæses ud fra et simpelt gennemsnit af alle historiske data. Brug dette værktøj til at oprette prognoser for salg, lagerbeholdning eller tendenser. Hver enkelt prognoseværdi er baseret på nedenstående formel.

Formel til beregning af bevægeligt gennemsnit

hvor:

  • N er antallet af foregående perioder, der skal indgå i det bevægelige gennemsnit

  • A j er den faktiske værdi på tidspunktet j

  • F j er prognoseværdien på tidspunktet j

Analyseværktøjet Generering af tilfældige tal fylder et område med uafhængige tilfældige tal, der er udtaget fra en af flere fordelinger. Du kan bruge værktøjet til at beskrive emnerne i en population med en sandsynlighedsfordeling. Du kan f.eks. benytte en normalfordeling til at beskrive populationen af højden på mennesker, eller du kan benytte en Bernoulli-fordeling for to mulige udfald til at beskrive den population af resultater, der fremkommer, når der slås plat og krone.

Analyseværktøjet Rang og fraktil frembringer en tabel, der indeholder rangen for hver værdi i et datasæt udtrykt i ordenstal og procent. Du kan benytte værktøjet til at analysere den relative placering af værdier i et datasæt. Værktøjet bruger regnearksfunktionerne PLADS.LIGE og PROCENTPLADS.MEDTAG. Hvis du vil gøre rede for bundne værdier, skal du bruge funktionen PLADS.LIGE, der behandler bundne værdier som om, at de har samme rang. Du kan også bruge funktionen PLADS.GNSN, der returnerer den gennemsnitlige rang for de bundne værdier.

Analyseværktøjet Regression udfører en lineær regressionsanalyse ved at benytte metoden "mindste kvadrater" til at definere en linje gennem et sæt observationer. Du kan analysere, på hvilken måde en enkelt afhængig variabel påvirkes af værdier fra en eller flere uafhængig variabler. Du kan f.eks. analysere, på hvilken måde en sportsudøvers resultater påvirkes af faktorer som alder, højde og vægt. Du kan tilskrive en vis del af den samlede præstation til hver af disse tre faktorer på grundlag af et sæt præstationsdata og derefter anvende resultaterne til at forudsige præstationerne for en ny, ikke-testet sportsudøver.

Værktøjet Regression bruger regnearksfunktionen LINREGR.

Analyseværktøjet Stikprøve tager en stikprøve fra en population ved at behandle inputområdet som en population. Hvis populationen er for stor til at kunne bearbejdes eller blive vist i et diagram, kan du benytte en repræsentativ stikprøve. Du kan også tage en stikprøve, der kun indeholder værdierne fra en bestemt del af en cyklus, hvis du mener, at inputdataene er periodiske. Hvis inputområdet f.eks. indeholder kvartalsvise salgstal, vil en stikprøve med en periodisk frekvens på 4 placere værdierne fra samme kvartal i outputtabellen.

Analyseværktøjet T-test med to stikprøver tester for lighed af den populationsmiddelværdi, der ligger under hver stikprøve. De tre værktøjer anvender forskellige forudsætninger: at populationsvarianserne er lig med hinanden, at populationsvarianserne ikke er lig med hinanden, og at de to stikprøver repræsenterer før og efter behandlingsobservationer for de samme emner.

For alle tre værktøjer nedenfor gælder det, at en t-statistik-værdi, t, beregnes og vises som "t Stat" i outputtabellerne. Afhængig af dataene kan denne værdi, t, være negativ eller ikke-negativ. Under forudsætning af ens underliggende populationsmiddelværdier gælder det, at hvis t < 0, giver "P(T <= t) en-sidet" sandsynligheden for, at der observeres en værdi af t-statistik, der er mere negativ end t. Hvis t >=0, giver "P(T <= t) en-sidet" sandsynligheden for, at der observeres en værdi af t-statistik, der er mere positiv end t. "t kritisk en-sidet" giver skæringsværdien, så sandsynligheden for at observere en værdi af t-statistik, der er større end eller lig med "t kritisk en-sidet", er Alpha.

"P(T <= t) to-sidet" giver sandsynligheden for, at der observeres en værdi af t-statistik, der er større i absolut værdi end t. "P kritisk to-sidet" giver skæringsværdien, så sandsynligheden for en observeret t-statistik, der er større i absolut værdi end "P kritisk to-sidet", er Alpha.

T-test: Parvis dobbelt stikprøve for middelværdi

Du kan bruge en parvis test, når observationerne i stikprøverne danner naturlige par, f.eks. når en stikprøvegruppe testes to gange, – dvs. før og efter et forsøg. Dette analyseværktøj og den tilhørende formel udfører en parvis T-test med dobbelt stikprøve for at fastlægge, om observationer, der er foretaget før en behandling, og observationer, der er foretaget efter en behandling, med sandsynlighed kommer fra fordelinger med ens populationsmiddelværdier. Denne form af T-testen forudsætter ikke, at varianserne for begge populationer er ens.

Note: Blandt de resultater, der genereres af dette værktøj, er puljevarians, der er en akkumuleret måling af dataspredningen omkring middelværdien, og som opnås ved at bruge følgende formel:

Formel til beregning af puljevarians

T-test: To stikprøver med ens varians

Dette analyseværktøj udfører en T-test med dobbelt stikprøve. Denne form af T-testen, der kaldes homoscedastisk T-test, forudsætter, at de to datasæt er fra fordelinger med de samme varianser. Du kan bruge denne T-test til at bestemme, om der er sandsynlighed for, at de to stikprøver kommer fra fordelinger med ens populationsmiddelværdier.

T-test: To stikprøver med forskellig varians

Dette analyseværktøj udfører en T-test med dobbelt stikprøve. Denne form af T-testen, der kaldes heteroscedastisk T-test, forudsætter, at de to datasæt er fra fordelinger med forskellige varianser. Som i det ovenstående tilfælde med ens varianser kan du bruge denne T-test til at bestemme, om der er sandsynlighed for, at de to stikprøver kommer fra fordelinger med ens populationsmiddelværdier. Brug denne test, når der er forskellige emner i de to stikprøver. Brug den parvise test, der er beskrevet i nedenstående eksempel, når der er et enkelt sæt emner, og de to stikprøver repræsenterer målinger for hvert emne før og efter en behandling.

Den følgende formel bruges til at bestemme den statistiske værdi t.

Formel til beregning af værdien t

Følgende formel bruges til at beregne frihedsgraderne, f. Da resultatet af beregningen normalt ikke er et heltal, afrundes værdien af f til det nærmeste heltal for at opnå en kritisk værdi fra t-tabellen. Regnearksfunktionen T.TEST i Excel bruger den beregnede f-værdi uden afrunding, da det er muligt at beregne en værdi for T.TEST med en f-værdi, som ikke er et heltal. Som en følge af disse forskellige måder til at bestemme frihedsgraderne er resultaterne af T.TEST og dette T-test-værktøj forskellige i tilfældet med forskellig varians.

Formel til beregning af den tilnærmede værdi for frihedsgraden

Analyseværktøjet Z-test: To stikprøver for middelværdi udfører en Z-test med dobbelt stikprøve for middelværdier med kendte varianser. Værktøjet bruges til at undersøge null-hypotesen, at der ikke er nogen forskel mellem to populationsmiddelværdier i forhold til enten en-sidede eller to-sidede alternative hypoteser. Hvis varianserne ikke kendes, skal regnearksfunktionen Z.TEST bruges i stedet.

Når du bruger værktøjet Z-test, skal du være omhyggelig med at forstå outputtet. "P(Z <= z) en-sidet" er i virkeligheden P(Z >= ABS(z)), sandsynligheden for en z-værdi, der er længere væk fra 0 i den samme retning som den observerede z-værdi, når der ikke er nogen forskel mellem populationsmiddelværdierne. "P(Z <= z) to-sidet" er i virkeligheden P(Z >= ABS(z) eller Z <= -ABS(z)), sandsynligheden for en z-værdi, der er længere væk fra 0 i en af retningerne end den observerede z-værdi, når der ikke er nogen forskel mellem populationsmiddelværdierne. Det to-sidede resultat er blot det en-sidede resultat ganget med 2. Værktøjet Z-test kan også bruges i de tilfælde, hvor null-hypotesen er, at der er en specifik værdi forskellig fra nul for forskellen mellem de to populationsmiddelværdier. Du kan f.eks. benytte denne test til at undersøge forskelle mellem to bilmodellers præstationer.

Har du brug for mere hjælp?

Du kan altid spørge en ekspert i Excel Tech Community, få support i Answers community eller foreslå en ny funktion eller forbedring i Excel User Voice.

See Also

Opret et histogram i Excel 2016

Opret et Pareto-diagram i Excel 2016

Se en video for at installere og aktivere tilføjelsesprogrammerne Analysis Toolpak og Problemløser

Tekniske funktioner (reference)

Statistiske funktioner (reference)

Oversigt over formler i Excel

Sådan undgår du ødelagte formler

Find og ret fejl i formler

Tastaturgenveje og funktionstaster i Excel

Excel-funktioner (alfabetisk)

Excel-funktioner (efter kategori)

Udvid dine færdigheder
Gå på opdagelse i kurser
Få nye funktioner først
Bliv Office Insider

Var disse oplysninger nyttige?

Tak for din feedback!

Tak for din feedback! Det lyder, som om det vil kunne hjælpe, hvis du bliver sat i forbindelse med en af vores Office-supportteknikere.

×