Brug af Analysis ToolPak til at udføre kompleks dataanalyse

Bemærk!: Vi vil gerne give dig den mest opdaterede hjælp, så hurtigt vi kan, på dit eget sprog. Denne side er oversat ved hjælp af automatisering og kan indeholde grammatiske fejl og unøjagtigheder. Det er vores hensigt, at dette indhold skal være nyttigt for dig. Vil du fortælle os, om oplysningerne var nyttige for dig, nederst på denne side? Her er artiklen på engelsk så du kan sammenligne.

Hvis du har brug for at udvikle komplekse statistiske eller tekniske analyser, kan du gemme trin og tid ved hjælp af Analysis ToolPak. Du angiver data og parametre for hver analyse, og værktøjet bruger de relevante statistiske eller tekniske makrofunktioner til at beregne og få vist resultaterne i en outputtabel. Nogle værktøjer genererer diagrammer ud over output tabeller.

Dataanalysefunktionerne kan kun anvendes på ét regneark ad gangen. Når du udfører en dataanalyse på grupperede regneark, vises resultaterne i det første regneark, og tomme, formaterede tabeller vises i de resterende regneark. Hvis du vil udføre en dataanalyse på de resterende regneark, skal du genberegne med analyseværktøjet for hvert regneark.

Analysis ToolPak indeholder de værktøjer, der er beskrevet i de følgende afsnit. Hvis du vil bruge disse værktøjer, skal du klikke på Dataanalyse i gruppen Analyse under fanen Data. Hvis kommandoen Dataanalyse ikke er tilgængelig, skal du indlæse tilføjelsesprogrammet Analysis ToolPak.

  1. Klik på fanen Filer, klik på Indstillinger, og klik derefter på kategorien Tilføjelsesprogrammer.

    Hvis du bruger Excel 2007, skal du klikke på Microsoft Office-knappen Office-knapflade og derefter klikke på Excel-indstillinger

  2. Markér Excel-tilføjelsesprogrammer i feltet Administrer, og klik derefter på Søg.

    Hvis du bruger Excel til Mac, skal du i filmenuen gå til Værktøjer > Excel-tilføjelsesprogrammer.

  3. Markér afkrydsningsfeltet Analysis ToolPak i dialogboksen Tilføjelsesprogrammer, og klik derefter på OK.

    • Hvis Analysis ToolPak ikke vises i feltet Tilgængelige tilføjelsesprogrammer, skal du klikke på Gennemse for at finde det.

    • Hvis der vises en meddelelse om, at Analysis ToolPak ikke aktuelt er installeret på din computer, skal du klikke på Ja for at installere det.

Bemærk!: Hvis du vil medtage VBA-funktioner (Visual Basic for Application) til Analysis ToolPak, kan du indlæse VBA-tilføjelsesprogrammet til Analysis ToolPak på samme måde, som du indlæser Analysis ToolPak. Markér afkrydsningsfeltet Analysis ToolPak - VBA i feltet Tilgængelige tilføjelsesprogrammer.

Analyseværktøjerne Anova foretager forskellige typer af variansanalyser. Hvilket værktøj, du skal anvende i den konkrete sammenhæng, afhænger af, hvor mange faktorer og hvor mange stikprøver du har fra de populationer, du vil teste.

Anova: Enkeltfaktor

Dette værktøj udfører en simpel analyse af variansen på data for to eller flere eksempler. Analysen indeholder en test af hypotesen om, at hver prøve udtrækkes fra den samme underliggende sandsynlighedsfordeling mod den alternative hypotese, at underliggende Sandsynligheds fordelinger ikke er ens for alle eksempler. Hvis der kun er to eksempler, kan du bruge regnearksfunktionen T.Test. Med mere end to prøver er der ikke nogen praktisk generalisering af T.Test-og enkelt faktor-modellen for Anava kan kaldes i stedet.

Anova: To-faktor med gentagelse

Dette analyseværktøj er nyttigt, når data kan klassificeres langs to forskellige dimensioner. I et forsøg på at måle højden af planter kan planterne tildeles forskellige mærker for gødning (f. eks. A, B, C) og kan også opbevares ved forskellig temperatur (f. eks. lavt, højt). For hver af de seks mulige par af {gødning, temperatur}, har vi et lige antal observationer af plante højde. Ved hjælp af dette ANOVA-værktøj kan vi teste:

  • Om plantehøjderne for de forskellige gødningsmærker udtrækkes fra den samme underliggende population. Temperatur ignoreres ved denne analyse.

  • Om plantehøjderne for de forskellige temperaturniveauer udtrækkes fra den samme underliggende population. Gødningsmærke ignoreres ved denne analyse.

Uanset om der er redegjort for effekterne af de forskelle mellem gødningsmærker, der blev fundet i det første punkt i opstillingen, og de forskelle i temperaturer, der blev fundet i det andet punkt i opstillingen, udtrækkes de seks stikprøver, der repræsenterer alle par af {gødning, temperatur}-værdier, fra den samme population. Den alternative hypotese er, at der er effekter, der forårsages af specifikke {gødning, temperatur}-par over og under forskellene, der er baseret på gødning alene eller på temperatur alene.

Indstilling af inputområde for Anova-analyseværktøj

Anova: To-faktor uden gentagelse

Dette analyseværktøj er nyttigt, når data er klassificeret på to forskellige dimensioner som i to-faktor-case med replikering. Men for dette værktøj forudsættes det, at der kun er én enkelt observation for hvert par (f. eks. hver {gødning, temperaturer}-par i det foregående eksempel).

Regnearksfunktionerne KORRELATION og PEARSON beregner begge korrelationskoefficienten mellem to målingsvariabler, når målinger på hver variabel observeres for hver af N-emnerne. (En eventuel manglende observation for et emne forårsager, at emnet ignoreres i analysen). Analyseværktøjet Korrelation er særligt nyttigt, når der er mere end to målingsvariabler for hvert af N-emnerne. Det indeholder en outputtabel, en korrelationsmatrix, der viser værdien af KORRELATION (eller PEARSON) anvendt på hvert muligt par målingsvariabler.

Korrelationskoefficienten, såsom Kovarians, er et mål for, hvor meget de to målingsvariabler "varierer sammen". I modsætning til kovariansen skaleres korrelationskoefficienten, så værdien er uafhængig af de enheder, som de to målingsvariabler udtrykkes i. (Hvis de to målingsvariabler er vægt og højde, er værdien af korrelationskoefficienten uændret, hvis vægt konverteres fra pund til kilogram). Værdien af en korrelationskoefficient skal være mellem-1 og + 1 inklusive.

Du kan bruge analyseværktøjet Korrelation til at undersøge hvert par målingsvariabler for at bestemme, om de to målingsvariabler har tendens til at bevæge sig sammen – dvs. om store værdier af den ene variabel har tendens til at være forbundet med store værdier af den anden (positiv korrelation), om små værdier af den ene variabel har tendens til at være forbundet med store værdier af den anden (negativ korrelation), eller om værdier af begge variabler har tendens til ikke at være relateret (korrelation nær 0 (nul)).

Værktøjerne Korrelation og Kovarians kan begge bruges med samme indstilling, når du har N forskellige målingsvariabler, der er observeret på et sæt individer. Værktøjerne Korrelation og Kovarians giver hver en outputtabel, en matrix, der viser henholdsvis korrelationskoefficienten eller kovariansen mellem hvert par målingsvariabler. Forskellen er, at korrelationskoefficienter skaleres til at ligge mellem -1 og +1 inklusive. De kovarianser, der svarer til hinanden, skaleres ikke. Både korrelationskoefficienten og kovariansen er mål for, hvor meget to variabler "varierer sammen".

Værktøjet Kovarians beregner værdien af KOVARIANSEN for regnearksfunktionen . P for hvert par målingsvariabler. (Direkte brug af kovarians. P i stedet for værktøjet Kovarians er et rimeligt alternativ, når der kun er to målingsvariabler, dvs. N = 2.) Posten på diagonalen for værktøjet til Kovarians-outputtabellen i række i, kolonne i er kovariansen af den i-Este målings variabel med sig selv. Dette er kun populations variansen for variablen, beregnet af funktionen regneark .P.

Du kan bruge værktøjet Kovarians til at undersøge hvert par målingsvariabler for at bestemme, om de to målingsvariabler har tendens til at bevæge sig sammen – dvs., om store værdier af den ene variabel har tendens til at være forbundet med store værdier af den anden (positiv kovarians), om små værdier af den ene variabel har tendens til at være forbundet med store værdier af den anden (negativ kovarians), eller om værdier af begge variabler har tendens til ikke at være relateret (kovarians nær 0 (nul)).

Analyseværktøjet Beskrivende statistik genererer en rapport, der indeholder statistik med én variabel for dataene i inputområdet samt oplysninger om dataenes overordnede tendens og afvigelse.

Analyseværktøjet Eksponentiel udglatning forudsiger en værdi, der er baseret på prognosen fra den forrige periode afstemt efter fejl i denne forrige prognose. Værktøjet benytter en udglatningskonstant, a, hvis størrelse bestemmer, hvor meget prognosen ændres som følge af fejl i den forrige prognose.

Bemærk!: Værdier mellem 0,2 og 0,3 er egnede som udglatningskonstanter. Værdierne angiver, at den aktuelle prognose skal korrigeres for fejl med 20 % til 30 % i forhold til den foregående prognose. Større konstanter giver et hurtigere svar, men kan give fejlagtige prognoser. Mindre konstanter kan resultere i, at prognoseværdierne ændres længe efter, at de faktiske værdier ændres.

Analyseværktøjet F-test: Dobbelt-stikprøve for varians udfører en F-test med dobbelt stikprøve for at sammenligne varianser i to populationer.

Du kan for eksempel bruge værktøjet F-test på eksempler af tidspunkter i en flyde mødes for hver af to teams. Værktøjet giver resultatet af en test af null-hypotesen om, at disse to eksempler kommer fra fordelinger med ens afvigelser, mod den alternative værdi, at varianserne ikke er lig med i de underliggende fordelinger.

Værktøjet beregner værdien f for en F-stikprøvefunktion (eller et F-forhold). En værdi af f, der er tæt på 1, er et tegn på, at de underliggende populationsvarianser er lig med hinanden. Hvis f < 1, giver "P(F <= f) en-sidet" i outputtabellen sandsynligheden for at observere en værdi af F-stikprøvefunktionen, der er mindre end f, når populationsvarianser er lig hinanden, og "F kritisk en-sidet" giver den kritiske værdi mindre end 1 for det valgte signifikansniveau Alpha. Hvis f > 1, giver "P(F <= f) en-sidet" sandsynligheden for at observere en værdi af F-stikprøvefunktionen, der er større end f, når populationsvarianser er lig med hinanden, og "F kritisk en-sidet" giver den kritiske værdi større en 1 for Alpha.

Analyseværktøjet Fourier-analyse løser problemer i lineære systemer og analyserer periodiske data ved hjælp af Fast Fourier Transform-metoden (FFT) til at transformere data. Med dette værktøj understøttes også inverse transformationer, hvor det omvendte af de transformerede data returnerer de oprindelige data.

Input- og outputområder for Fourier-analyser

Analyseværktøjet Histogram beregner individuelle og kumulative hyppigheder for et celleområde, der består af data og dataklasser. Værktøjet genererer data for antallet af forekomster af en værdi i et datasæt.

I en klasse af 20 studerende kan du for eksempel fastlægge fordelingen af resultater i kategorierne for bogstav klasser. En histogramtabel viser grænser for bogstav klasser og antallet af resultater mellem den laveste grænse og den aktuelle grænse. Det mest alminde mest almindeligt, der er mest, er data tilstanden.

Tip!: I Excel 2016 kan du nu oprette et histogram eller Pareto-diagram.

Analyseværktøjet Bevægeligt gennemsnit beregner værdier i prognoseperioden på grundlag af variablens gennemsnitsværdi i et bestemt antal foregående perioder. Et bevægeligt gennemsnit frembringer tendensoplysninger, som ikke kan aflæses ud fra et simpelt gennemsnit af alle historiske data. Brug dette værktøj til at oprette prognoser for salg, lagerbeholdning eller tendenser. Hver enkelt prognoseværdi er baseret på nedenstående formel.

Formel til beregning af bevægeligt gennemsnit

hvor:

  • N er antallet af foregående perioder, der skal indgå i det bevægelige gennemsnit

  • A j er den faktiske værdi på tidspunktet j

  • F j er prognoseværdien på tidspunktet j

Analyseværktøjet til generering af tilfældige tal fylder et område med uafhængige tilfældige tal, der trækkes fra en af flere fordelinger. Du kan beskrive emnerne i en population med en sandsynlighedsfordeling. Du kan for eksempel bruge en normal fordeling til at beskrive populationen af enkeltpersoners højde, eller du kan bruge en Bernoulli-fordeling af to mulige resultater til at beskrive populationen af betalings-reflip-resultater.

Analyseværktøjet Rang og fraktil frembringer en tabel, der indeholder den ordinale og procentvise rang for hver værdi i et datasæt. Du kan analysere den relative placering af værdier i et datasæt. Dette værktøj bruger rangen for regnearksfunktioner . EQ ogPROCENTPLADS. INC. Hvis du vil redegøre for bundne værdier, skal du bruge placeringen . Funktionen EQ , som behandler bundne værdier, som har den samme placering, eller du kan bruge placeringen .Funktionen Gnsn , som returnerer den gennemsnitlige klassificering for de bundne værdier.

Analyseværktøjet regression foretager lineær regressionsanalyse ved at bruge "mindste kvadrater"-metode til at tilpasse en linje gennem et sæt observationer. Du kan analysere, hvordan en enkelt afhængig variabel påvirkes af værdierne for en eller flere uafhængige variabler. Du kan for eksempel analysere, hvordan en atletens-præstation påvirkes af disse faktorer som alder, højde og vægt. Du kan fordeling i ydeevnen for hver af disse tre faktorer, baseret på et sæt af ydelsesdata, og derefter bruge resultaterne til at forudsige ydeevnen for en ny, ikke-testet atletens.

Værktøjet Regression bruger mest regnearks funktions linje.

Analyseværktøjet prøve analyse opretter en stikprøve fra en population ved at behandle inputområdet som en population. Når populationen er for stor til at blive behandlet eller diagram, kan du bruge et repræsentativt eksempel. Du kan også oprette et eksempel, der kun indeholder værdierne fra en bestemt del af en cyklus, hvis du mener, at inputdataene er periodiske. Hvis inputområdet for eksempel indeholder salgstal for kvartaler, kan du få vist et eksempel på en periode på fire værdier fra det samme kvartal i outputområdet.

Analyseværktøjet T-test med to stikprøver tester for lighed af den populationsmiddelværdi, der ligger under hver stikprøve. De tre værktøjer anvender forskellige forudsætninger: at populationsvarianserne er lig med hinanden, at populationsvarianserne ikke er lig med hinanden, og at de to stikprøver repræsenterer før og efter behandlingsobservationer for de samme emner.

For alle tre værktøjer nedenfor gælder det, at en t-statistik-værdi, t, beregnes og vises som "t Stat" i outputtabellerne. Afhængig af dataene kan denne værdi, t, være negativ eller ikke-negativ. Under forudsætning af ens underliggende populationsmiddelværdier gælder det, at hvis t < 0, giver "P(T <= t) en-sidet" sandsynligheden for, at der observeres en værdi af t-statistik, der er mere negativ end t. Hvis t >=0, giver "P(T <= t) en-sidet" sandsynligheden for, at der observeres en værdi af t-statistik, der er mere positiv end t. "t kritisk en-sidet" giver skæringsværdien, så sandsynligheden for at observere en værdi af t-statistik, der er større end eller lig med "t kritisk en-sidet", er Alpha.

"P(T <= t) to-sidet" giver sandsynligheden for, at der observeres en værdi af t-statistik, der er større i absolut værdi end t. "P kritisk to-sidet" giver skæringsværdien, så sandsynligheden for en observeret t-statistik, der er større i absolut værdi end "P kritisk to-sidet", er Alpha.

T-test: Parvis dobbelt stikprøve for middelværdi

Du kan bruge en parvis test, når der er en naturlig parring af observationer i prøverne, f. eks når en prøve gruppe er testet to gange – før og efter et forsøg. Dette analyseværktøj og den tilhørende formel udfører en parvis t-test med to stikprøver til at bestemme, om observationer, der er taget før en behandling og observationer, der skal udføres efter en behandling, sandsynligvis skal stamme fra fordelinger med lige populations midler. Denne t-test formular forudsætter ikke, at variansen af begge populationer er ens.

Bemærk!: Blandt de resultater, der genereres af dette værktøj, er puljevarians, der er en akkumuleret måling af dataspredningen omkring middelværdien, og som opnås ved at bruge følgende formel:

Formel til beregning af puljevarians

T-test: To stikprøver med ens varians

Dette analyseværktøj udfører en t-test med to stikprøver. Denne t-test formular antager, at de to datasæt kom fra fordelinger med de samme afvigelser. Den kaldes en homoscedastic t-test. Du kan bruge denne t-test til at afgøre, om de to stikprøver kommer fra fordelinger med lige populations midler.

T-test: To stikprøver med forskellig varians

Dette analyseværktøj udfører en t-test med to stikprøver. Denne t-test formular antager, at de to datasæt stammer fra fordelinger med uens afvigelser. Den kaldes en heteroscedasticitetstest t-test. Som det er tilfældet med de ligheds lige ligheds afvigelser, kan du bruge denne t-test til at afgøre, om de to prøver kan stamme fra fordelinger med lige populations middel. Brug denne test, når der er særskilte emner i de to stikprøver. Brug den parrede test, der er beskrevet i det følgende eksempel, når der er et enkelt sæt af emner, og de to prøver repræsenterer målinger for hvert emne før og efter en behandling.

Den følgende formel bruges til at bestemme den statistiske værdi t.

Formel til beregning af værdien t

Følgende formel bruges til at beregne frihedsgrader, FG. Da resultatet af beregningen normalt ikke er et heltal, afrundes værdien af FG til det nærmeste heltal for at få en kritisk værdi fra t-tabellen. Excel-regnearksfunktionen T.Test anvender den beregnede FG-værdi uden afrunding, da det er muligt at beregne en værdi for T.Test med en ikke-heltals FG. På grund af de forskellige måder at bestemme frihedsgrader på, er resultatet af T.Test -og dette t-test-værktøj varierer fra forskel på store afvigelser.

Formel til beregning af den tilnærmede værdi for frihedsgraden

Analyseværktøjet z-test: to stikprøver for middelværdi udfører en z-test med to stikprøver for middelværdier med kendte afvigelser. Dette værktøj bruges til at teste null-hypotesen, at der ikke er nogen forskel mellem to populationsmiddelværdier i forhold til enten én sidet eller to-sidede alternative hypoteser. Hvis varianser ikke er kendt, er funktionen regneark Z.Test skal bruges i stedet.

Når du bruger værktøjet z-test, skal du være omhyggelig med at forstå outputtet. "P (Z < = Z) en-sidet" er virkelig P (Z > = ABS (z)), sandsynligheden for en Z-værdi, der er yderligere fra 0 i den samme retning som den observerede Z-værdi, når der ikke er nogen forskel mellem populations metoderne. "P (Z < = Z) to-halet" er virkelig P (Z > = ABS (z) eller Z < =-ABS (z)), sandsynligheden for en Z-værdi, der er mere fra 0, i begge retninger end den observerede Z-værdi, når der ikke er nogen forskel mellem populations middelværdien. Det tosidede resultat er blot det enkeltsidede resultat ganget med 2. Værktøjet z-test kan også bruges til det tilfælde, hvor null-hypotesen er, at der er angivet en bestemt værdi, der ikke er nul, for forskellen mellem de to populations midler. Du kan for eksempel bruge denne test til at bestemme forskelle mellem to Car-modellers ydeevne.

Har du brug for mere hjælp?

Du kan altid spørge en ekspert i Excel Tech Community, få support i Answers community eller foreslå en ny funktion eller forbedring i Excel User Voice.

Se også

Oprette et histogram i Excel 2016

Opret et pareto-diagram i Excel 2016

Indlæs Analysis ToolPak i Excel

TEKNISKE funktioner (reference)

STATISTISKE funktioner (reference)

Oversigt over formler i Excel

Sådan undgår du ødelagte formler

Find og ret fejl i formler

Tastaturgenveje og funktionstaster i Excel

Excel-funktioner (alfabetisk)

Excel-funktioner (efter kategori)

Udvid dine Office-færdigheder
Gå på opdagelse i kurser
Få nye funktioner først
Bliv Office Insider

Var disse oplysninger nyttige?

Tak for din feedback!

Tak for din feedback! Det lyder, som om det vil kunne hjælpe, hvis du bliver sat i forbindelse med en af vores Office-supportteknikere.

×