Complexe gegevensanalyses uitvoeren met Analysis ToolPak

Als u complexe statistische of technische analyses moet ontwerpen, bespaart u tijd door met Analysis ToolPak te werken. U geeft de gegevens en parameters voor elke analyse op. Vervolgens worden in het hulpmiddel de relevante statistische of technische macrofuncties toegepast en worden de resultaten in een uitvoertabel weergegeven. In een aantal hulpmiddelen worden naast uitvoertabellen ook grafieken gegenereerd.

De functies voor gegevensanalyse kunnen slechts in één werkblad tegelijk worden gebruikt. Als u gegevens in gegroepeerde werkbladen analyseert, worden de resultaten in het eerste werkblad weergegeven en worden in de overige werkbladen lege, opgemaakte tabellen weergegeven. Als u de gegevensanalyse ook in de overige werkbladen wilt toepassen, moet u het analysehulpmiddel op elk werkblad opnieuw toepassen.

Analysis ToolPak bevat de hulpmiddelen die in de volgende secties worden beschreven. Deze hulpmiddelen opent u door op Gegevensanalyse te klikken in de groep Analyse van het tabblad Gegevens. Als de opdracht Gegevensanalyse niet beschikbaar is, moet u de invoegtoepassing Analysis ToolPak laden.

  1. Klik op het tabblad Bestand op Opties en klik op de categorie Invoegtoepassingen.

    Als u Excel 2007 gebruikt, klikt u op de Microsoft Office-knop afbeelding office-knop en vervolgens op Opties voor Excel.

  2. Selecteer in het vak Beheren de optie Excel-invoegtoepassingen en klik op Start.

    Als u Excel voor Mac gebruikt, gaat u in het bestandsmenu naar Extra > Excel-invoegtoepassingen.

  3. Selecteer in het vak Invoegtoepassingen het selectievakje Analysis ToolPak en klik vervolgens op OK .

    • Als Analysis ToolPak niet voorkomt in het vak Beschikbare invoegtoepassingen, klikt u op Bladeren om naar de invoegtoepassing te zoeken.

    • Als u het bericht krijgt dat Analysis ToolPak niet is geïnstalleerd op uw computer, klikt u op Ja om de invoegtoepassing te installeren.

Opmerking : Als u in Analysis ToolPak gebruik wilt maken van de functies van Visual Basic for Applications (VBA), laadt u de invoegtoepassing Analysis ToolPak - VBA op dezelfde manier als u Analysis ToolPak laadt. Schakel in het vak Beschikbare invoegtoepassingen het selectievakje Analysis ToolPak - VBA in.

De hulpmiddelen voor variantieanalyse bieden verschillende typen variantieanalyses. Welk hulpmiddel u het best kunt gebruiken, hangt af van het aantal factoren en het aantal steekproeven dat u neemt van de te toetsen populaties.

Unifactoriële variantieanalyse

Met dit hulpmiddel kunt u een enkelvoudige variantieanalyse uitvoeren op gegevens van twee of meer steekproeven. Deze analyse toetst de hypothese dat elke steekproef is getrokken uit dezelfde onderliggende kansverdeling tegenover de alternatieve hypothese dat onderliggende kansverdelingen niet voor alle steekproeven hetzelfde zijn. Als er slechts twee steekproeven zijn, kunt u ook de werkbladfunctie T.TOETS gebruiken. Zijn er meer dan twee steekproeven, dan is er geen geschikte generalisatie van T.TOETS. In dat geval kunt u wel gebruikmaken van de unifactoriële variantieanalyse.

Multifactoriële variantieanalyse met herhaling

Dit analysehulpmiddel is geschikt als gegevens kunnen worden geclassificeerd volgens twee verschillende dimensies. Bijvoorbeeld: in een experiment waarbij de hoogte van planten wordt gemeten, kunt u de planten verschillende merken kunstmest geven (merk A, B en C) en bij verschillende temperaturen kweken (hoog en laag). Voor elk van de zes mogelijke combinaties van kunstmest en temperatuur hebben we een gelijk aantal waarnemingen van de planthoogte. Met dit hulpmiddel kunnen we toetsen:

  • Of hoogten van planten voor de verschillende merken kunstmest uit dezelfde onderliggende populatie zijn getrokken. De temperaturen worden voor deze analyse genegeerd.

  • Of hoogten van planten voor de verschillende temperatuurniveaus uit dezelfde onderliggende populatie zijn getrokken. De kunstmestmerken worden voor deze analyse genegeerd.

Volgens de nulhypothese worden de zes steekproeven die alle combinaties van kunstmest en temperatuur vertegenwoordigen, uit dezelfde populatie getrokken, ongeacht of er nu een verklaring is gevonden voor de effecten van verschillen tussen kunstmestmerken die zijn aangetroffen bij stap 1 en verschillen in temperaturen die zijn aangetroffen bij stap 2. Volgens de alternatieve hypothese zijn er effecten die zijn toe te schrijven aan specifieke combinaties van kunstmest en temperatuur, buiten verschillen op basis van alleen kunstmest of van alleen temperatuur.

Invoerbereik opgeven voor variantieanalyse

Multifactoriële variantieanalyse zonder herhaling

Dit analysehulpmiddel is geschikt als gegevens een waarde hebben in twee verschillende dimensies, net als bij de multifactoriële variantieanalyse met herhaling. Bij dit hulpmiddel nemen we echter aan dat er voor elk paar (bijvoorbeeld elke combinatie van kunstmest en temperatuur in het bovenstaande voorbeeld) maar één waarneming is.

De werkbladfuncties CORRELATIE en PEARSON berekenen beide de correlatiecoëfficient tussen twee meetvariabelen wanneer metingen op elke variabele worden waargenomen voor elk van n proefpersonen. (Als een waarneming ontbreekt voor een proefpersoon, wordt deze proefpersoon in de analyse genegeerd.) Het analysehulpmiddel Correlatie is met name geschikt wanneer er meer dan twee meetvariabelen voor elk van n proefpersonen zijn. In de uitvoertabel, een correlatiematrix, wordt de waarde van CORRELATIE (of PEARSON) weergegeven voor elk mogelijk paar meetvariabelen.

Net als de covariantie geeft de correlatiecoëfficiënt aan in welke mate twee meetvariabelen 'gezamenlijk variëren'. Anders dan bij de covariantie is de waarde van de correlatiecoëfficiënt onafhankelijk van de eenheden waarin de twee meetvariabelen worden uitgedrukt. Als de twee meetvariabelen bijvoorbeeld gewicht en hoogte zijn, blijft de waarde van de correlatiecoëfficient ongewijzigd als het gewicht wordt geconverteerd van ponden naar kilo's. In elke correlatiecoëfficiënt wordt de covariantie omgerekend naar een waarde van minimaal -1 en maximaal +1.

Met het hulpmiddel Correlatie kunt u elk paar meetvariabelen onderzoeken om vast te stellen in welke mate de twee meetvariabelen met elkaar samenhangen. Bij een positieve correlatie gaan grote waarden in de ene variabele samen met grote waarden in de andere variabele. Als kleine waarden in de ene variabele samengaan met grote waarden in de andere variabele, is er sprake van een negatieve correlatie. Het is ook mogelijk dat de waarden van beide variabelen geen of weinig samenhang vertonen. In dat geval nadert de correlatie de waarde 0 (nul). 

De hulpmiddelen Correlatie en Covariantie kunnen allebei in dezelfde situatie worden gebruikt, wanneer u beschikt over n verschillende meetvariabelen, die zijn waargenomen in een verzameling individuen. De hulpmiddelen Correlatie en Covariantie geven elk een uitvoertabel, een matrix, waarin respectievelijk de correlatiecoëfficiënt of covariantie tussen elk paar meetvariabelen wordt weergegeven. Het verschil is dat correlatiecoëfficiënten worden omgerekend naar een schaal van -1 tot +1 (deze waarden inbegrepen), terwijl overeenkomstige covarianties de oorspronkelijke schaal behouden. Zowel de correlatiecoëfficiënt als de covariantie geven aan in welke mate twee variabelen 'gezamenlijk variëren'.

Het hulpmiddel Covariantie berekent de waarde van de werkbladfunctie COVARIANTIE.P voor elk paar meetvariabelen. (Het kan handig zijn om direct COVARIANTIE.P te gebruiken in plaats van het hulpmiddel Covariantie wanneer er slechts twee meetvariabelen zijn, dus n=2.) De invoer op de diagonaal van de uitvoertabel van het hulpmiddel Covariantie in rij i, kolom i is de covariantie van de i-e meetvariabele met zichzelf. Dit is hetzelfde als de populatievariantie voor die variabele zoals berekend door de werkbladfunctie VAR.P.

Met het hulpmiddel Covariantie kunt u elk paar meetvariabelen onderzoeken om vast te stellen in welke mate de twee meetvariabelen met elkaar samenhangen. Bij een positieve covariantie gaan grote waarden in de ene variabele samen met grote waarden in de andere variabele. Als kleine waarden in de ene variabele samengaan met grote waarden in de andere variabele, is er sprake van een negatieve covariantie. Het is ook mogelijk dat de waarden van beide variabelen geen of weinig samenhang vertonen. In dat geval nadert de covariantie de waarde nul. 

Met het analysehulpmiddel Beschrijvende statistiek wordt een univariaat statistisch rapport gegenereerd voor gegevens in het invoerbereik. Het rapport geeft informatie over de centrale trend en de variabiliteit van de gegevens.

Met het analysehulpmiddel Exponentiële demping wordt een waarde voorspeld op basis van de voorspelling voor de voorgaande periode, bijgesteld voor de fout in deze voorspelling. In dit hulpmiddel wordt de dempingsconstante a gebruikt. De grootte van de dempingsconstante bepaalt in hoeverre rekening wordt gehouden met fouten in eerdere voorspellingen.

Opmerking : Waarden tussen 0,2 en 0,3 zijn redelijke dempingsconstanten. Deze waarden geven aan dat de huidige voorspelling met 20 tot 30 procent moet worden bijgesteld vanwege fouten in de voorgaande voorspelling. Als u een hogere waarde opgeeft, worden de resultaten sneller berekend, maar neemt de kans op foutieve voorspellingen toe. Lagere waarden kunnen leiden tot grote vertragingen bij het berekenen van de waarden.

Met het analysehulpmiddel F-toets voor twee steekproeven op varianties worden de populatievarianties van twee steekproeven getoetst.

U kunt het hulpmiddel F-toets bijvoorbeeld gebruiken bij steekproeven van de tijden die door twee teams zijn behaald bij een zwemwedstrijd. Het hulpmiddel geeft de uitkomst van een toets van de nulhypothese dat deze twee steekproeven behoren tot verdelingen met gelijke varianties ten opzichte van de alternatieve hypothese dat de varianties niet gelijk zijn in de onderliggende verdelingen.

Het hulpmiddel berekent de waarde f van een toetsingsgrootheid F (of F-ratio). Een waarde van f dicht bij 1 levert het bewijs dat de onderliggende populatievarianties gelijk zijn. Als in de uitvoertabel f < 1 geeft 'P(F <= f) eenzijdig' de kans een waarde van de toetsingsgrootheid F kleiner dan f waar te nemen wanneer populatievarianties gelijk zijn. 'Eenzijdige kritische F-waarde' geeft de kritische waarde kleiner dan 1 voor het gekozen significantieniveau Alfa. Als f > 1, geeft 'P(F <= f) eenzijdig' de kans een waarde van de toetsingsgrootheid F groter dan f waar te nemen wanneer populatievarianties gelijk zijn. 'Eenzijdige kritische F-waarde' geeft de kritische waarde groter dan 1 voor alfa.

Met het analysehulpmiddel Fourier-analyse lost u vraagstukken in lineaire systemen op en analyseert u periodieke gegevens. Hiervoor worden gegevens getransformeerd met de FFT-methode (Fast Fourier Transform). In dit hulpmiddel worden ook omgekeerde transformaties ondersteund zodat u de getransformeerde gegevens weer kunt omzetten in de oorspronkelijke gegevens.

Invoer- en uitvoerbereik voor Fourier-analyse

Met het analysehulpmiddel Histogram worden afzonderlijke en cumulatieve frequenties berekend voor een cellenbereik met gegevens en grenswaarden. U kunt met dit hulpmiddel bepalen hoe vaak een bepaalde waarde in een gegevensverzameling voorkomt.

Als u bijvoorbeeld wilt weten hoe in een klas met twintig leerlingen de proefwerkcijfers in bepaalde categorieën zijn verdeeld, kunt u dat met dit hulpmiddel bepalen. Een histogram laat zien welke cijfers de begrenzing van de categorieën vormen en geeft het aantal cijfers tussen de benedengrens en de huidige grens weer. Het meest behaalde cijfer is dan de modus van het gegevensbereik.

Tip : In Excel 2016 kunt u nu een histogram of Paretografiek maken.

Het analysehulpmiddel Zwevend gemiddelde projecteert waarden in de voorspellingsperiode, op basis van de gemiddelde waarde van de variabele over een bepaald aantal voorafgaande perioden. Een zwevend gemiddelde geeft informatie over trends die moeilijk te herkennen zijn in een eenvoudig gemiddelde van alle historische gegevens. U kunt dit hulpmiddel gebruiken voor verkoopprognoses, voorraadprognoses en andere trends. Elke voorspellingswaarde is gebaseerd op de volgende formule:

Formule voor het berekenen van zwevende gemiddelden

waarbij:

  • N het aantal voorgaande perioden is dat in het zwevend gemiddelde wordt opgenomen.

  • A j de actuele waarde is op het moment j

  • F j de voorspellingswaarde is op het moment j

Met het analysehulpmiddel Aselecte getallen wordt een bereik gevuld met onafhankelijke willekeurige getallen die uit één van een aantal afzonderlijke verdelingen worden getrokken. U kunt dit hulpmiddel gebruiken om aan onderdelen van een populatie een kansverdeling toe te kennen. U kunt bijvoorbeeld een normale verdeling toekennen aan een populatie bestaande uit de lichaamslengte van personen, of een Bernoulli-verdeling van twee mogelijke waarden aan de populatie bestaande uit de uitkomsten van een 'kruis-of-munt'-proef.

Met het analysehulpmiddel Rang en percentiel wordt een tabel gegenereerd met voor elke waarde in een gegevensverzameling de rangwaarde en de percentiele waarde. U kunt dit hulpmiddel gebruiken om de relatieve positie van waarden in een gegevensverzameling te analyseren. Dit hulpmiddel gebruikt de werkbladfuncties RANG.GELIJK en PROCENTRANG.INC. Als u rekening wilt houden met gedeelde plaatsen, gebruikt u de functie RANG.GELIJK waarbij dezelfde rang wordt toegekend aan gedeelde plaatsen, of de functie RANG.GEMIDDELDE waarbij de gemiddelde rang wordt toegekend aan gedeelde plaatsen.

Met het analysehulpmiddel Regressie wordt een lineaire regressieanalyse uitgevoerd. Bij deze analyse wordt met de methode van de kleinste kwadraten een lijn getrokken door de verzameling waarnemingen. U kunt analyseren hoe een enkele afhankelijke variabele wordt beïnvloed door de waarde van een of meer onafhankelijke variabelen. U kunt bijvoorbeeld analyseren hoe de prestaties van een sporter worden beïnvloed door factoren zoals leeftijd, hoogte en gewicht. U kunt een aandeel in de gemeten prestaties toewijzen aan elk van deze drie factoren, op basis van een verzameling prestatiegegevens, en vervolgens de prestaties van een nieuwe sporter voorspellen.

Het hulpmiddel Regressie maakt gebruik van de werkbladfunctie LIJNSCH.

Met het analysehulpmiddel Steekproef wordt een steekproef uit een populatie genomen, waarbij het invoerbereik als een populatie wordt beschouwd. Als de populatie te groot is om te verwerken of in een grafiek weer te geven, kunt u gebruikmaken van een representatieve steekproef. Bovendien kunt u, als het invoerbereik periodieke gegevens bevat, een steekproef nemen die alleen waarden bevat uit een bepaald deel van de cyclus. Als het invoerbereik bijvoorbeeld kwartaalcijfers bevat, worden bij een steekproef met een periodiek van 4 de waarden uit hetzelfde kwartaal in de uitvoertabel geplaatst.

De analysehulpmiddelen voor de t-toets met twee gepaarde steekproeven testen of de populatiegemiddelden van elke steekproef gelijk zijn. De drie hulpmiddelen gaan uit van verschillende veronderstellingen: dat de populatievarianties gelijk zijn, dat de populatievarianties niet gelijk zijn, en dat de twee steekproeven voor en na behandeling waarnemingen weergeven over dezelfde onderdelen.

Voor alle drie onderstaande hulpmiddelen wordt een toetsingsgrootheid T berekend en weergegeven als 't Stat' in de uitvoertabellen. Afhankelijk van de gegevens kan deze waarde T negatief of niet-negatief zijn. Uitgaande van gelijke onderliggende populatiegemiddelden, als t < 0, geeft 'P(T <= t) eenzijdig' de kans dat een waarde van de toetsingsgrootheid T wordt waargenomen die negatiever is dan t. Als t >=0, geeft 'P(T <= t) eenzijdig' de kans dat een waarde van de toetsingsgrootheid T wordt waargenomen die positiever is dan t. 'Eenzijdige kritische t-waarde' geeft de grenswaarde waarbij de kans een waarde van de toetsingsgrootheid T groter dan of gelijk aan de 'eenzijdige kritische t-waarde' waar te nemen, gelijk is aan alfa.

'P(T <= t) tweezijdig' geeft de kans dat een waarde van toetsingsgrootheid T wordt geobserveerd die in absolute waarde groter is dan t. 'Tweezijdige kritische P-waarde' geeft de grenswaarde waarbij de kans van een waargenomen toetsingsgrootheid T in absolute waarde groter dan de 'tweezijdige kritische P-waarde' gelijk is aan alfa.

T-toets: twee gepaarde steekproeven voor gemiddelden

U kunt een gepaarde toets gebruiken wanneer van waarnemingen in de steekproeven natuurlijk gepaard zijn, bijvoorbeeld wanneer een steekproefgroep zowel voor als na een experiment wordt getoetst. Met deze variant van de t-toets voert u een gepaarde t-toets uit op twee steekproeven om vast te stellen of het waarschijnlijk is dat waarnemingen die zijn gedaan vóór een behandeling en waarnemingen die zijn gedaan na een behandeling, behoren tot verdelingen met gelijke populatiegemiddelden. Er wordt bij deze t-toetsvariant niet aangenomen dat de varianties van beide populaties gelijk zijn. 

Opmerking : Een van de resultaten van dit hulpmiddel is de gepaarde variantie, een maat voor de spreiding van gegevens om het gemiddelde. De gepaarde variantie wordt afgeleid uit de volgende formule:

formule voor het berekenen van gepaarde variantie

T-toets: twee gepaarde steekproeven met gelijke varianties

Met dit analysehulpmiddel voert u een t-toets uit op twee steekproeven. In deze toets wordt ervan uitgegaan dat de twee gegevensverzamelingen behoren tot verdelingen met gelijke varianties. De toets wordt daarom ook wel een homoscedastische t-toets genoemd. Met deze t-toets kunt u vaststellen of het waarschijnlijk is dat de twee steekproeven behoren tot verdelingen met gelijke populatiegemiddelden.

T-toets: twee gepaarde steekproeven met ongelijke varianties

Met dit analysehulpmiddel voert u een t-toets uit op twee steekproeven. Bij deze variant van de t-toets wordt aangenomen dat de twee gegevensverzamelingen behoren tot verdelingen met ongelijke varianties. Deze toets wordt daarom ook wel een heteroscedastische t-toets genoemd. Net als bij de eerder besproken t-toets met twee gepaarde steekproeven met gelijke varianties kunt met deze t-toets vaststellen of het waarschijnlijk is dat de twee steekproeven behoren tot verdelingen met gelijke populatiegemiddelden. Gebruik deze toets als er sprake is van verschillende proefpersonen in de twee steekproeven. Gebruik de hieronder beschreven gepaarde toets als er sprake is van één groep proefpersonen en de twee steekproeven gegevens hebben voor elk onderdeel voor en na een behandeling.

De volgende formule wordt gebruikt om de statistische waarde t vast te stellen:

Formule voor het berekenen van de waarde t

Met de volgende formule worden de vrijheidsgraden (vg) berekend. Aangezien de uitkomst van de berekening meestal geen geheel getal is, wordt de waarde van vg afgerond op het dichtstbijzijnde gehele getal om een kritische waarde uit de t-tabel te verkrijgen. De Excel-werkbladfunctie T.TOETS gebruikt de berekende vg-waarde zonder afronding, omdat het mogelijk is een waarde voor T.TOETS te berekenen met een vg-waarde die geen geheel getal is. Vanwege deze verschillen bij het bepalen van de vrijheidsgraden, zullen de uitkomsten van T.TOETS en dit hulpmiddel verschillend zijn als er sprake is van ongelijke varianties.

formule voor het benaderen van vrijheidsgraden

Met het analysehulpmiddel Z-toets (twee steekproeven voor gemiddelden) wordt een z-toets uitgevoerd op de gemiddelden van twee steekproeven met bekende varianties. Dit hulpmiddel wordt gebruikt om de nulhypothese dat er geen verschil is tussen twee populatiegemiddelden te toetsen in vergelijking tot een- of tweezijdige alternatieve hypothesen. Als die varianties niet bekend zijn, moet u de werkbladfunctie Z.TOETS gebruiken.

Let op dat u de uitvoer van het hulpmiddel Z-toets goed begrijpt. 'P(Z <= z) eenzijdig' is in feite P(Z >= ABS(z)), de kans op een Z-waarde verder van 0 in dezelfde richting als de waargenomen z-waarde wanneer er geen verschil is tussen de populatiegemiddelden. 'P(Z <= z) tweezijdig' is in feite P(Z >= ABS(z) of Z <= -ABS(z)), de kans op een Z-waarde verder van 0 in een van beide richtingen dan de waargenomen z-waarde wanneer er geen verschil is tussen de populatiegemiddelden. De tweezijdige uitkomst is simpelweg de eenzijdige uitkomst vermenigvuldigd met 2. Het hulpmiddel Z-toets kan ook worden gebruikt wanneer de nulhypothese luidt dat er een specifieke niet-nulwaarde is voor het verschil tussen de twee populatiegemiddelden. U kunt deze toets bijvoorbeeld gebruiken om verschillen tussen de prestaties van twee automodellen vast te stellen.

Meer hulp nodig?

U kunt altijd uw vraag stellen aan een expert in de Excel Tech Community, ondersteuning vragen in de Answer-community of een nieuwe functie of verbetering voorstellen in Excel User Voice.

Zie ook

Een histogram maken in Excel 2016

Een paretografiek maken in Excel 2016

Video: Analysis ToolPak en Oplosser installeren en activeren

Technische functies (overzicht)

Statistische functies (overzicht)

Overzicht van formules in Excel

Niet-werkende formules voorkomen

Fouten opsporen in formules

Excel-sneltoetsen en -functietoetsen voor Windows

Excel-functies (alfabetisch)

Excel-functies (per categorie)

Uw vaardigheden uitbreiden
Training verkennen
Als eerste nieuwe functies krijgen
Deelnemen aan Office Insiders

Was deze informatie nuttig?

Bedankt voor uw feedback.

Hartelijk dank voor uw feedback! Het lijkt ons een goed idee om u in contact te brengen met een van onze Office-ondersteuningsagents.

×