Komplex adatelemzés az Analysis ToolPak bővítménnyel

Megjegyzés: Szeretnénk, ha minél gyorsabban hozzáférhetne a saját nyelvén íródott súgótartalmakhoz. Ez az oldal gépi fordítással lett lefordítva, ezért nyelvtani hibákat és pontatlanságokat tartalmazhat. A célunk az, hogy ezek a tartalmak felhasználóink hasznára váljanak. Kérjük, hogy a lap alján írja meg, hogy hasznos volt-e az Ön számára az itt található információ. Az eredeti angol nyelvű cikket itt találja.

Ha komplex statisztikai vagy mérnöki elemzéseket kell készítenie, akkor időt és energiát takaríthat meg az Analysis ToolPak használatával. Elég megadnia az adatokat és az egyes elemzések paramétereit, és az eszköz a megfelelő statisztikai és mérnöki makrófunkciókkal kiszámítja és megjeleníti az eredményeket egy kimeneti táblázatban. Egyes eszközök a kimeneti táblázatok mellett diagramokat is előállítanak.

Az adatelemzési funkciók egyszerre csak egy munkalapon használhatók. Ha csoportosított munkalapokon végez adatelemzést, az eredmények az első munkalapon jelennek meg, a többi munkalapon pedig csak üres formázott táblázatok lesznek láthatók. Ha a fennmaradó munkalapok adatait is szeretné elemezni, akkor munkalaponként újra kell számítania az eredményeket az elemző eszközzel.

Az Analysis ToolPak az alábbi szakaszokban leírt eszközöket foglalja magában. Az eszközök eléréséhez kattintson az Adatok lap Elemzés csoportjának Adatelemzés parancsára. Ha az Adatelemzés parancs nem érhető el, akkor be kell töltenie az Analysis ToolPak bővítményt.

  1. Kattintson a Fájl lap Beállítások gombjára, majd a Bővítmények kategóriára.

    Ha az Excel 2007-öt használja, kattintson a Microsoft Office gomb Az Office gomb képe , majd az Excel beállításai parancsra.

  2. A Kezelés legördülő listában válassza az Excel-bővítmények lehetőséget, és kattintson az Ugrás gombra.

    Mac Excel használata esetén a Fájl menüben keresse meg az Eszközök > Excel-bővítmények parancsot.

  3. Jelölje be a Bővítmények párbeszédpanelen az Analysis ToolPak jelölőnégyzetet, és kattintson az OK gombra.

    • Ha az Analysis ToolPak nem szerepel a Létező bővítmények listában, akkor a Tallózás gombra kattintva megkeresheti.

    • Ha az alkalmazás kiírja, hogy az Analysis ToolPak bővítmény nincs a számítógépen telepítve, akkor a telepítéshez kattintson az Igen gombra.

Megjegyzés: Az Analysis ToolPak rendszerhez készült Visual Basic for Application (VBA) függvények betöltéséhez az Analysis ToolPak-VBA-bővítményt az Analysis ToolPak betöltésével együtt is betölthet. Jelölje be a létező bővítmények mezőben az Analysis ToolPak-VBA jelölőnégyzetet.

Az Anova (Analysis of Variance) elemzőeszközzel különféle típusú varianciaanalízisek végezhetők. A választandó eszközt a tényezők száma, illetve a statisztikai sokaságból vett és a próbának alávetni kívánt minták száma határozza meg.

Egytényezős varianciaanalízis

Ezzel az eszközzel két vagy több minta esetén az adatok közötti eltérést egyszerű elemzéssel végezheti el. Az elemzés azt a feltételezést adja meg, hogy az egyes minták ugyanabból a valószínűsítő eloszlásból származnak, hogy az egyes minták nem egyeznek meg az összes minta esetében. Ha csak két minta van, használhatja a Tfüggvényt.Tesztet. Ha kettőnél több mint két mintát tartalmaz, nem lehet megfelelő általánosítani a T-T.Teszt, és a single Factor egytényezős varianciaanalízis modell is hívható.

Kéttényezős varianciaanalízis ismétlésekkel

Ez az elemzőeszköz akkor hasznos, ha az adatok két különböző dimenzió szerint osztályozhatók. Adott például egy kísérlet, amelyben a növények magasságát mérik, miközben különféle márkájú tápoldatokkal (például A, B, C) kezelik, ezenkívül különböző hőmérsékletnek (alacsony, magas) is teszik ki őket. A hat lehetséges {tápoldat, hőmérséklet} párosítás mindegyikéhez egyenlő számú magasságmérés tartozik. Ekkor varianciaanalízissel vizsgálhatók a következők:

  • A különböző tápoldatmárkához tartozó növénymagasságok ugyanabból a sokaságból származnak-e. Ez az elemzés nem veszi figyelembe a hőmérséklet hatását.

  • A különböző hőmérsékletekhez tartozó növénymagasságok ugyanabból a sokaságból származnak-e. Ebben az esetben a tápoldatok hatását hagyja figyelmen kívül.

Figyelembe véve az első pontban a tápoldatmárkák között észlelt különbségeket, valamint a második pontban a hőmérsékletek között észlelt különbségeket, az összes {tápoldat, hőmérséklet} értékpárt képviselő hat minta ugyanabból a sokaságból származik-e. Az alternatív hipotézis szerint amellett, hogy a hőmérséklet vagy a tápoldat változása külön-külön eltérést okoz, az egyes {tápoldat, hőmérséklet} pároknak további hatás is tulajdonítható.

A varianciaanalízis bemeneti tartományának beállítása

Kéttényezős varianciaanalízis ismétlések nélkül

Ez az elemzőeszköz akkor használható, ha az adatok két különböző dimenzió szerint osztályozhatók, a kéttényezős, ismétléses varianciaanalízishez hasonlóan. Itt azonban feltételezzük, hogy minden párhoz (például az előző példában minden {tápoldat, hőmérséklet} párhoz) csak egy megfigyelés tartozik.

A KORREL és a PEARSON munkalapfüggvény egyaránt két mérési változó korrelációs együtthatóját számítja ki olyan mérések alapján, amelyek során mindegyik változót n egyeden mértek meg. (Ha bármelyik egyed esetében hiányzik valamelyik mérés, akkor az az egyed kimarad az elemzésből). A korrelációanalízis különösen hasznos, ha az n egyed mindegyikéhez kettőnél több mérési változó tartozik. Az eszköz egy táblázatban – a korrelációs mátrixban – megjeleníti a KORREL (vagy PEARSON) értéket az összes lehetséges értékpárra.

A korrelációs együttható, mint például az eltérés, az a mérték, amennyire a két mérési változó egymástól eltérő. Az eltérésekkel ellentétben a korrelációs együttható úgy van méretezve, hogy annak értéke független legyen annak az egységnek, amelyben a két mérési változót fejezi ki. (Ha például a két mérési változó vastagsága és magassága, akkor a korrelációs együttható értéke nem változik, ha a súlyt kilóról kilogrammra konvertálja.) A korrelációs együttható értékének 1 és + 1 közöttinek kell lennie.

Ha a korrelációanalízissel megvizsgálja az összes értékpárt, meghatározhatja, hogy a két mérési változó együtt mozog-e, vagyis az egyik változó nagyobb értékei a másik változó értékének növekedésével vannak-e összefüggésben (pozitív korreláció), vagy éppen fordítva, az egyik változó nagyobb értékeihez a másik változó kisebb értékei tartoznak (negatív korreláció), vagy a két változó értékei között nem fedezhető fel kapcsolat (a korreláció nullához közeli).

A korrelációs és a többtényezős eszközök egyaránt használhatók ugyanabban a beállításban, ha az egyéneknél több különböző mérési változót észlel. A korrelációs és a szórásos eszközök mindegyike kimeneti táblát, mátrixot jelenít meg, amely a korrelációs együtthatót vagy a szórást jeleníti meg az egyes mérési változók között. A különbség az, hogy a korrelációs együtthatók a-1 és a + 1 közötti tartományba vannak méretezve. A megfelelő eltérések nem méretezhetők. A korrelációs együttható és az eltérés a két változó közötti eltérés mértékét is méri.

A szórás eszköz kiszámítja a munkalap függvény ELTÉRÉSének értékét . P : a mérési változók minden egyes párosításához. (Az eltérés közvetlen használata. A (z) az eltérés eszköz helyett a megfelelő alternatíva, ha csak két mérési változó létezik, azaz N = 2.) A többtényezős eszköz kimeneti táblázatának átlós, az i. oszlopa az i oszlopban az i-edik mérési változónak a saját magával való eltérése. Ez csak az adott változó sokasági eltérése, a var függvény által számított módon .P.

Ha a varianciaanalízissel megvizsgálja az összes értékpárt, meghatározhatja, hogy a két mérési változó együtt mozog-e, vagyis az egyik változó nagyobb értékei a másik változó értékének növekedésével vannak-e összefüggésben (pozitív kovariancia), vagy éppen fordítva, az egyik változó nagyobb értékeihez a másik változó kisebb értékei tartoznak (negatív kovariancia), vagy a két változó értékei között nem fedezhető fel kapcsolat (a kovariancia nullához közeli).

A leíró statisztika elemzőeszköz egyváltozós statisztikai jelentést készít a kiindulási adattartományról, és információt nyújt az adatok súlypontjáról és változatosságáról.

Az exponenciális simítással a korábbi időszak adatai alapján előre lehet jelezni egy, az előző időszak hibaértékeivel korrigált értéket. A módszer az a simítási állandót használja, ennek nagysága határozza meg, hogy a megelőző időszakból származó hibák mekkora hatást gyakoroljanak az előrejelzésekre.

Megjegyzés: A simítási állandó értékét 0,2 és 0,3 között célszerű megválasztani. Ez az érték azt jelzi, hogy az aktuális előrejelzést a korábbi előrejelzési hibájának 20–30 százalékával kell korrigálni. Nagyobb állandókkal gyorsabb közelítés érhető el, de az előrejelzés hibája is nagyobb lesz. Ha az állandó értéke túl kicsi, akkor viszont a becsült értékek csak sokára érik el a tényleges értékeket.

A kétmintás f-próba két statisztikai sokaság szórásnégyzetét hasonlítja össze.

Használhatja például az F-próba eszközt az úszni kívánt időpontokon a két csapatra. Az eszköz annak a null hipotézisnek a vizsgálatát adja eredményül, amely szerint ez a két minta egyenlő eltérésekkel elvégezhető eloszlásból származik, azzal a különbséggel, hogy az eltérések nem egyenlők az alapul szolgáló eloszlásban.

Az eszköz egy F-statisztika (vagy F viszonyszám) f értékét számolja ki. Az 1-hez közeli f érték azt bizonyítja, hogy a vizsgált sokasági varianciák megegyeznek. Ha az eredménytáblában f < 1, akkor a „P(F <= f) egyoldalú próba” annak a valószínűségét jelenti, hogy az F-statisztika megfigyelt értéke kisebb, mint f, amennyiben a sokasági varianciák egyenlőek, és az „F-kritikus egyoldalú próba” kritikus értéke 1-nél kisebb a választott alfa pontossági szinthez. Ha f > 1, akkor a „P(F >= f) egyoldalú próba” annak a valószínűségét jelenti, hogy az F-statisztika megfigyelt értéke nagyobb, mint f, amennyiben a sokasági varianciák egyenlőek, és az „F-kritikus egyoldalú próba” kritikus értéke 1-nél nagyobb a választott alfa szinthez.

Lineáris rendszerek és periodikus adatok elemzésére használható, az adatokat a gyors Fourier-transzformáció (Fast Fourier Transform - FFT) módszerével transzformálja. A művelet segítségével inverz transzformáció is végezhető, amely a transzformált adatokból visszaadja az eredeti adatokat.

A Fourier-analízis bemeneti és kimeneti tartománya

Egy cellatartomány adatai és az adatkategóriák alapján egyenkénti és halmozott gyakoriságok számíthatók ki. Az eljárással meg lehet határozni, hogy egy adott érték hányszor fordul elő az adathalmazban.

Ha például egy 20 tanulóból álló osztályt használ, akkor kioszthatja a pontszámokat a betű-fokozat kategóriákban. A hisztogram táblázat a legalsó és a jelenlegi kötött közötti pontszámokat jeleníti meg. Az egyetlen leggyakrabban előforduló pontszám az adattípus.

Tipp: Az Excel 2016-ban létrehozhat egy hisztogramot vagy egy Pareto diagramot.

Ez az eljárás a becsült időszak értékeit úgy számítja ki, hogy a megelőző időszak adatait megadott számú periódusonként átlagolja. A mozgó átlagolás módszerével olyan részletek derülhetnek ki a trendről, amelyek a meglévő adatok egyszerű átlagolásával elmosódnak. Ez a módszer értékesítési adatok, raktárkészletadatok vagy egyéb változó adatok előrejelzésére használható. A becsült értékeket az alábbi képlet alapján számítja ki:

Mozgó átlagok számítására szolgáló képlet

ahol:

  • N a mozgó átlag periódusainak száma

  • A j a tényleges érték a j időpontban

  • F j a becsült érték a j időpontban

Ezzel a módszerrel több eloszlásból származó és egymástól független véletlen számokkal tölthető fel egy tartomány. Egyik alkalmazása egy sokaság egyedeinek jellemzése valószínűségi eloszlás segítségével. Például egy populáció egyedeinek magassága normális eloszlással írható le, egy két lehetséges kimenetelű esemény – ilyen a pénzfeldobás – bekövetkezésének valószínűsége pedig a Bernoulli-eloszlással jellemezhető.

A rangsor és a percentilis elemző eszköz olyan táblázatot hoz létre, amely az adathalmaz egyes értékeinek sorszámát és százalékos rangsorát tartalmazza. Az adathalmazok relatív értékeit elemezheti. Ez az eszköz a munkalapfüggvény függvény rangsorát használja. EQ ésSZÁZALÉKRANG. INC. Ha a kötött értékek számláját szeretné használni, használja a rangsort. EQ függvény, amely ugyanazt a rangsorban kezeli a kötött értékeket, vagy használja a rangsort.Az AVG függvény, amely a kötött értékek átlagát számítja ki.

Ez az eljárás lineáris regresszióanalízist végez: a legkisebb négyzetek módszerével egyenest illeszt az adatpontok halmazára. Segítségével elemezheti, hogy egy függő változó értékét hogyan befolyásolja több független változó értéke. Megvizsgálható például, hogy egy atléta teljesítményét hogyan befolyásolják az olyan adatok, mint a kora, a magassága és a testsúlya. A teljesítményadatok alapján meghatározható, hogy az egyes tényezők milyen mértékben befolyásolják az eredményt, majd ezek alapján előre jelezhető egy új, még nem vizsgált sportoló teljesítménye.

A regressziós eszköz a munkalap függvény Linhasználja.

Ez az eljárás a kiindulási adathalmazt alapsokaságnak tekinti, és abból egy mintát választ ki. A sokaságot képviselő mintát akkor használhatja, ha a teljes sokaság túl nagy a vizsgálathoz vagy az ábrázoláshoz. Ha úgy véli, hogy a kiindulási adatok periodikusak, az adatok egyetlen meghatározott ciklusából is mintát tud venni. Ha például a kiindulási tartomány értékesítési adatokat tartalmaz negyedéves bontásban, akkor a teljes időszak minden negyedik adatának kiválasztásával megkaphatja az egy adott negyedévre vonatkozó eredményeket.

A kétmintás t-próba eszközeivel megvizsgálhatja, hogy a két sokaságnak, amelyekből a mintát vette, egyenlő-e a várható értéke. A három eszköz különböző feltételezésekből indul ki: a sokasági varianciák egyenlőek, a sokasági varianciák különbözőek, illetve a két minta olyan mérésekből áll, amelyek ugyanazon egyedek kezelés előtti és kezelés utáni állapotát tükrözik.

Mindhárom eszköz egy t-statisztika értékét, t-t számítja ki és jeleníti meg t-statisztika néven az eredménytáblákban. Az adatoktól függően ez a t érték lehet negatív vagy nem negatív. Feltéve, hogy a vizsgált sokaságok várható értékei egyenlőek, ha t < 0, akkor a „P(T <= t) egyoldalú próba” annak a valószínűségét jelenti, hogy a t-statisztika vizsgált értéke egy t-nél kisebb negatív érték. Ha t >=0, a „P(T >= t) egyoldalú próba” annak a valószínűségét jelenti, hogy a t-statisztika vizsgált értéke egy t-nél nagyobb pozitív érték. A „t-kritikus egyoldalú próba” a szakadási pont értékét adja meg, így annak a valószínűsége, hogy a t-statisztika vizsgált értéke a „t-kritikus egyoldalú próba” értékénél nagyobb vagy egyenlő, éppen alfa.

A „P(T <= t) kétoldalú próba” annak a valószínűségét jelenti, hogy a t-statisztika vizsgált értékének abszolút értéke nagyobb t-nél. A „P-kritikus kétoldalú próba” a szakadási pont értékét adja meg, így annak a valószínűsége, hogy a t-statisztika vizsgált értékének abszolút értéke a „P-kritikus kétoldalú próba” értékénél nagyobb, éppen alfa.

Kétmintás párosított t-próba a várható értékre

Párosított tesztet is használhat, ha a mintákban természetes párosítást végez, például ha a minta csoportját kétszer teszteli, a kísérlet előtt és után. Ez az Analysis Tool és annak képlete párosított kétmintás Student-féle t-próbát végez annak meghatározásához, hogy a kezelés után a kezelés és a vizsgálat után tett megjegyzések valószínűleg az egyenlő sokaságú disztribúciókban fognak-e kialakulni. Ez a t-próba-űrlap nem feltételezi, hogy a két populáció eltérése egyenlő.

Megjegyzés: Ezzel a vizsgálati módszerrel a súlyozott variancia is kiszámítható, amely az adatok várható érték körüli szóródását összesíti, és a következő képlettel határozható meg:

Súlyozott varianciát számító képlet

Kétmintás t-próba egyenlő szórásnégyzeteknél

Ez az elemzési eszköz kétmintás Student-féle t-próbát hajt végre. A t-próba-űrlap azt feltételezi, hogy a két adathalmaz azonos eltérésekkel rendelkező eloszlásból származik. A továbbiakban: homoszcedasztikus t-próba. Ezt a t-próbát használva megállapíthatja, hogy a két minta valószínűsíthető-e az egyenlő sokaságú disztribúciókban.

Kétmintás t-próba nem egyenlő szórásnégyzeteknél

Ez az elemzési eszköz kétmintás Student-féle t-próbát hajt végre. A t-próba-űrlap azt feltételezi, hogy a két adathalmaz egyenlőtlen eltérésekkel elvégezhető eloszlásból származik. A továbbiakban: heteroscedasztikus t-próba. Az előző egyenlő eltérésekkel ellentétben a t-próba segítségével megállapítható, hogy a két minta valószínűsíthető-e az egyenlő sokaságú eloszlások esetében. Ezt a tesztet akkor használja, ha a két minta eltérő tárgyakat tartalmaz. Használja a párosított tesztet, amelyet az alábbi példában ismertetünk, ha egyetlen csoport van, és a két minta a kezelés előtt és után az egyes témákhoz tartozó mértékegységeket ábrázolja.

A t statisztikai érték az alábbi képlettel számítható ki.

A t érték számítási képlete

Az alábbi képlet a szabadság, a DF mértékének kiszámítására szolgál. Mivel a számítási eredmény általában nem egész szám, a DF értékét a legközelebbi egész számra kerekíti a program, ha a t táblából kritikus értéket szeretne beolvasni. Az Excel-munkalap m függvényeA teszt kerekítés nélkül használja a számított DF értéket, mert lehetséges a Térték kiszámítása.Teszt nem egész szám DF értékkel Ezek a különböző megközelítések a szabadság mértékének meghatározására, a T- keredményeire.A teszt és a t-próba eszköz eltérő lesz az egyenlőtlenségek esetében.

A szabadságfok közelítő értékét számító képlet

A z-próba: az Analysis Tool két mintája két minta z-próbát végez az ismert eltérésekkel. Ezzel az eszközzel tesztelheti azt a nullát, amely szerint nincs különbség a két sokaság között az egyoldalas vagy kétoldalas alternatív hipotézisekkel szemben. Ha az eltérések nem ismertek, a munkalap függvény a Z. A tesztet inkább használni kell.

A z-próba használatakor fontos, hogy jól értelmezze az eredményt. A „P(Z <= z) egyoldalú próba” valójában a P(Z >= ABS(z)), vagyis annak a z értéknek a valószínűsége, amely a 0-tól távolabb, ugyanabban az irányban van, mint a vizsgált z érték, és a sokaság várható értékei között nincs eltérés. A „P(Z <= z) kétoldalú próba” valójában a P(Z >= ABS(z) vagy a Z <= -ABS(z)), vagyis annak a z értéknek a valószínűsége, amely a 0-tól bármely irányban távolabb van a vizsgált z értéknél, és a sokaság várható értékei között nincs eltérés. A kétoldalú próba eredménye az egyoldalú próba eredményének a kétszerese. A z-próba akkor is használható, ha a nullhipotézis az, hogy a két sokaság várható értékeinek különbsége egy adott, nullától különböző érték. A módszer alkalmas lehet például két autómodell teljesítménykülönbségének vizsgálatára.

További segítségre van szüksége?

Bármikor segítséget kérhet az Excel technikai közösségétől és az Answers-közösségtől, az Excel User Voice webhelyen pedig új funkciókra vagy fejlesztésekre tehet javaslatot.

Lásd még

Hisztogram létrehozása az Excel 2016

Pareto diagram létrehozása az Excel 2016

Az Analysis ToolPak bővítmény betöltése az Excel alkalmazásban

MÉRNÖKI függvények (segédlet)

STATISZTIKAI függvények (segédlet)

A képletek áttekintése az Excelben

Hibás képletek kiküszöbölése

Képletekben lévő hibák keresése és javítása

Az Excel billentyűparancsai és funkcióbillentyűi

Az Excel függvényeinek betűrendes listája

Az Excel függvényeinek kategória szerinti listája

Office-jártasság bővítése
Oktatóanyagok megismerése
Új szolgáltatások listájának lekérése
Részvétel az Office Insider programban

Hasznos volt az információ?

Köszönjük a visszajelzését!

Köszönjük visszajelzését. Jobbnak látjuk, ha az Office egyik támogatási szakemberéhez irányítjuk.

×