Komplexná analýza údajov pomocou doplnku Analytické nástroje

Ak potrebujete vytvoriť zložité štatistické alebo inžinierske analýzy, môžete pomocou doplnku Analytické nástroje ušetriť množstvo krokov a čas. Pre každú analýzu zadáte údaje a parametre a nástroj použije príslušné štatistické alebo inžinierske funkcie makier na výpočet a zobrazenie výsledkov vo výstupnej tabuľke. Niektoré nástroje okrem výstupných tabuliek vygenerujú aj grafy.

Funkcie na analýzu údajov je možné použiť naraz iba na jednom hárku. Keď vykonáte analýzu údajov na zoskupených hárkoch, výsledky sa zobrazia v prvom hárku a v zostávajúcich hárkoch sa zobrazia prázdne formátované tabuľky. Ak chcete vykonať analýzu údajov v zostávajúcich hárkoch, vykonajte výpočet s analytickým nástrojom pre každý hárok.

Doplnok Analytické nástroje obsahuje nástroje popísané nižšie. Prístup k týmto nástrojom získate kliknutím na položku Analýza údajov v skupine Analýza na karte Údaje. Ak príkaz Analýza údajov nie je k dispozícii, je potrebné zaviesť doplnok Analytické nástroje.

  1. Kliknite na kartu Súbor, kliknite na položku Možnosti a potom kliknite na kategóriu Doplnky.

    Ak používate Excel 2007, kliknite na tlačidlo Microsoft Office Obrázok tlačidla Office a potom kliknite na položku Možnosti programu Excel

  2. V poli Správa vyberte položku Doplnky programu Excel a potom kliknite na položku Prejsť.

    Ak používate Excel pre Mac, v ponuke súboru prejdite na položky Nástroje > Doplnky pre Excel.

  3. V dialógovom okne Dostupné doplnky začiarknite políčko Analytické nástroje a potom kliknite na tlačidlo OK.

    • Ak sa položka Analytické nástroje nenachádza v poli Dostupné doplnky, kliknite na položku Prehľadávať a vyhľadajte ju.

    • Ak sa zobrazí výzva, že doplnok Analytické nástroje nie je momentálne nainštalovaný, kliknutím na tlačidlo Áno sa nainštaluje.

Poznámka: Ak chcete mať v doplnku Analytické nástroje k dispozícii aj funkcie jazyka Visual Basic for Application (VBA), môžete zaviesť doplnok Analytické nástroje – VBA rovnakým spôsobom ako doplnok Analytické nástroje. V poli Dostupné doplnky začiarknite políčko Analytické nástroje - VBA.

Analytické nástroje Anova poskytujú rôzne typy analýz rozptylov. Výber vhodného nástroja závisí od počtu faktorov a počtu vzoriek zo základného súboru, ktorý chcete testovať.

Anova: jeden faktor

Tento nástroj vykoná jednoduchú analýzu odchýlky v údajoch dvoch alebo niekoľkých vzoriek. Analýza poskytuje test hypotézy o tom, že každá vzorka je vykreslená z rovnakej rozdelenia pravdepodobnosti oproti alternatívnej hypotéze, že rozdelenie rozdelenia pravdepodobnosti nie je rovnaké pre všetky vzorky. Ak sú k dispozícii len dve vzorky, môžete použiť funkciu hárka T.Test. Pri viac než dvoch vzorkách nie je k dispozícii žiadna pohodlná generalizácia T.Testa môže sa namiesto toho vyzvať model ANOVA s jediným faktorom.

Anova: dva faktory s opakovaním

Tento analytický nástroj je užitočný v prípade, že údaje je možné klasifikovať podľa dvoch odlišných dimenzií. Napríklad pri pokusoch, pri ktorých sa meria výška rastlín, je možné rastliny hnojiť rôznymi typmi hnojív (napríklad A, B, C) a pestovať pri rôznych teplotách (napríklad pri vysokej a nízkej teplote). Pre každú zo šiestich možných kombinácií hnojiva a teploty sa počas pozorovania získa rovnaký počet údajov o výške rastliny. Pomocou tohto nástroja Anova je možné testovať nasledovné skutočnosti:

  • Môžete testovať, či sú hodnoty výšky rastlín v prípade jednotlivých hnojív vybraté z rovnakého základného súboru. Teploty sa pri tejto analýze neberú do úvahy.

  • Môžete testovať, či sú hodnoty výšky rastlín pre rôzne teploty vybraté z rovnakého základného súboru. Hnojivá sa pri tejto analýze neberú do úvahy

Nakoniec môžete testovať, či po zahrnutí rozdielnych vplyvov jednotlivých typov hnojív, ktoré sa zistili v prvom bode, a zahrnutí rozdielnych vplyvov teplôt, ktoré sa zistili v druhom bode, boli hodnoty šiestich vzoriek reprezentujúcich všetky kombinácie hnojiva a teploty vybraté z rovnakého základného súboru. Alternatívna hypotéza vychádza z predpokladu, že existujú rôzne vplyvy konkrétnych kombinácií hnojiva a teploty, ktoré sú výraznejšie ako rozdiely vyplývajúce len z rozdielov v hnojivách alebo v teplote.

Nastavenie vstupnej oblasti pre nástroj Anova

Anova: dva faktory bez opakovania

Tento analytický nástroj je užitočný pri klasifikácii podľa dvoch odlišných dimenzií, tak ako v prípade dvojfaktorovej analýzy s opakovaním. Pri tomto nástroji sa však predpokladá, že pre každú kombináciu je k dispozícii len jedno pozorovanie (napríklad pre každú kombináciu hnojiva a teploty vo vyššie uvedenom príklade).

Funkcie hárka CORREL a PEARSON slúžia na výpočet korelačného koeficientu medzi dvoma meranými veličinami, ak sú hodnoty meraní jednotlivých veličín zaznamenané pre každý z N prvkov. (Ak pre určitý prvok nie sú k dispozícii údaje, daný prvok sa pri analýze neberie do úvahy.) Analytický nástroj korelácie je užitočný najmä vtedy, ak pre každý z N prvkov existujú viac ako dve merané veličiny. Výstupom analýzy vo forme tabuľky je korelačná matica, v ktorej sú zobrazené hodnoty funkcie CORREL (alebo PEARSON) aplikovanej na každú vzájomnú kombináciu meraných veličín.

Korelačný koeficient, tak ako kovariancia, predstavuje mieru „vzájomnej odlišnosti“ dvoch meraných veličín. Na rozdiel od kovariancie je korelačný koeficient škálovaný, čo znamená, že jeho hodnota nie je závislá od jednotiek, v ktorých sú uvedené dané dve merané veličiny. (Ak sú meranými veličinami napríklad hmotnosť a výška a jednotka hmotnosti sa konvertuje z libier na kilogramy, hodnota korelačného koeficientu sa nezmení.) Hodnota každého korelačného koeficientu musí byť z uzavretého intervalu (-1,1).

Analytický nástroj korelácie sa používa na analýzu každej vzájomnej kombinácie meraných veličín, ktorá slúži na určenie závislosti dvoch meraných veličín  – t. j. či vyššie hodnoty jednej veličiny súvisia skôr s vyššími hodnotami druhej veličiny (kladná korelácia), alebo či nižšie hodnoty jednej veličiny súvisia skôr s vyššími hodnotami druhej veličiny (záporná korelácia), prípadne, či sú hodnoty obidvoch veličín nezávislé (korelácia blízka nule).

Nástroje Correlation a Covariance možno použiť v prípade, ak je k dispozícii N rôznych meraných veličín, ktoré boli namerané na množine prvkov. Výstupom týchto nástrojov je tabuľka obsahujúca maticu, ktorá uvádza korelačný koeficient alebo kovarianciu medzi jednotlivými vzájomnými kombináciami meraných veličín. Rozdiel je v tom, že korelačné koeficienty sú škálované tak, aby ich hodnota ležala v uzavretom intervale (–1,1). Príslušné kovariancie nie sú škálované. Korelačný koeficient aj kovariancia predstavujú mieru, akou sa dve veličiny „vzájomne odlišujú“.

Nástroj na odchýlku vypočíta hodnotu ODCHÝLKy funkcie hárka . P pre každý pár meracích premenných. (Priame použitie ODCHÝLKy. P skôr ako nástroj na odchýlku je rozumnou alternatívou, ak sú k dispozícii len dve veličiny merania, t. j = 2.) Položka na diagonále výstupnej tabuľky nástroja odchýlky v riadku i, stĺpci i je odchýlka ukazovateľa i-th so samotnou veľkosťou. Toto je len odchýlka populácie pre danú premennú, ako je vypočítaná funkciou hárka var.P.

Analytický nástroj Covariance sa používa na analýzu každej vzájomnej kombinácie meraných veličín, ktorá slúži na určenie závislosti dvoch meraných veličín  – t. j. či vyššie hodnoty jednej veličiny súvisia skôr s vyšším hodnotami druhej veličiny (kladná kovariancia), alebo či nižšie hodnoty jednej veličiny súvisia skôr s vyšším hodnotami druhej veličiny (záporná kovariancia), prípadne či sú hodnoty obidvoch veličín nezávislé (kovariancia blízka nule).

Analytický nástroj Descriptive Statistics vygeneruje zostavu štatistického hodnotenia jednorozmerných údajov vo vstupnom rozsahu a poskytne informácie o hlavnom trende a premenlivosti údajov.

Analytický nástroj Exponential Smoothing slúži na výpočet prognózovanej hodnoty na základe prognózy predchádzajúceho obdobia, pričom sa zohľadnia chyby predchádzajúcej prognózy. Nástroj používa konštantu vyrovnávania a, ktorej veľkosť vyjadruje citlivosť prognózovaných hodnôt na prípadné chyby v predchádzajúcej prognóze.

Poznámka: Vhodné konštanty vyrovnávania sú v rozsahu 0,2 až 0,3. Tieto hodnoty vyjadrujú, že prognózovaná hodnota by mala zohľadniť chyby v predchádzajúcej prognóze na 20 až 30 percent. Vyššie hodnoty konštanty umožňujú rýchlejšiu odozvu na chybu, ale môžu viesť k chybným prognózam. Nižšie hodnoty môžu spôsobiť zdĺhavé odozvy prognózovaných hodnôt.

Analytický nástroj F-Test Two-Sample for Variances vykoná F-test dvoch vzoriek na porovnanie odchýlok základného súboru.

Nástroj F-Test môžete napríklad aplikovať na dosiahnuté časy dvoch súťažných tímov, ktoré boli namerané v rámci plaveckých pretekov. Výsledkom je test nulovej hypotézy, že dané dva časy sú z rozdelení s rovnakým rozptylom a voči alternatívnej hypotéze nie sú rozptyly v uvedených rozdeleniach zhodné.

Tento nástroj vypočíta hodnotu f F-štatistiky (alebo F-pomer). Ak sa hodnota f blíži k 1, znamená to, že odchýlky základného súboru sú rovnaké. Ak je vo výstupnej tabuľke hodnota f < 1, Jednostranná pravdepodobnosť „P(F <= f) one-tail“ určuje pravdepodobnosť výskytu hodnoty F-štatistiky nižšej ako f, ak sú rozptyly základného súboru rovnaké a jednostranná pravdepodobnosť „F Critical one-tail“ určuje kritickú hodnotu nižšiu ako 1 pre zvolenú hladinu významnosti alfa. Ak je hodnota f > 1, jednostranná pravdepodobnosť „P(F <= f) one-tail“ určuje pravdepodobnosť výskytu hodnoty F-štatistiky vyššej ako f, ak sú odchýlky základného súboru rovnaké a jednostranná pravdepodobnosť „F Critical one-tail“ určuje kritickú hodnotu vyššiu ako 1 pre hladinu významnosti alfa.

Nástroj Fourier Analysis umožňuje vyriešiť problémy v lineárnych systémoch a analyzovať periodické údaje pomocou metódy rýchlej Fourierovej transformácie (FFT) na transformáciu údajov. Nástroj podporuje aj inverzné transformácie, pri ktorých sú výsledkom inverzie transformovaných údajov opäť pôvodné údaje.

Vstupná a výstupná oblasť pre Fourierovu analýzu

Analytický nástroj Histogram vypočíta individuálne a kumulatívne frekvencie pre údaje v rozsahu buniek a blokoch údajov. Nástroj vygeneruje frekvenciu výskytov určitej hodnoty v množine údajov.

Napríklad v triede s 20 študentmi možno určiť rozdelenie dosiahnutých známok pomocou kategórií jednotlivých známok. V tabuľke histogramu sa zobrazia hranice známok a počet výskytov získaných známok medzi dolnou a aktuálnou hranicou. Najčastejší výskyt známky sa nazýva modus.

Tip: V Exceli 2016 môžete teraz vytvárať histogram alebo Paretov graf.

Analytický nástroj Moving Average sa používa na prognózu hodnôt pre obdobie prognózy na základe priemernej hodnoty premennej za stanovený počet predchádzajúcich období. Kĺzavý priemer poskytuje informácie o trende, ktoré nemožno zistiť pri výpočte jednoduchého priemeru všetkých historických údajov. Tento nástroj sa používa na vytváranie prognóz výsledkov predaja, stavu zásob a iných trendov. Prognózované hodnoty sa vypočítajú podľa nasledovného vzorca.

Vzorec na výpočet kĺzavého priemeru

kde:

  • N je počet predchádzajúcich období, ktoré sú zahrnuté do výpočtu kĺzavého priemeru,

  • A j je aktuálna hodnota v čase j,

  • F j je predpovedaná hodnota v čase j.

Analytický nástroj Random Number Generation vyplní rozsah nezávislými náhodnými číslami vybratými z niektorého rozdelenia. Prvky základného súboru možno charakterizovať rozdelením pravdepodobnosti. Môžeme napríklad použiť normálne rozdelenie na charakterizovanie výšky jednotlivcov v základnom súbore alebo použiť Bernoulliho rozdelenie dvoch možných výsledkov na charakterizovanie základného súboru výsledkov hádzania mince.

Nástroj na analýzu Rank a percentile vytvorí tabuľku obsahujúcu poradové a percentuálne umiestnenie každej hodnoty v množine údajov. Relatívne postavenie hodnôt v množine údajov môžete analyzovať. Tento nástroj používa poradie funkcií hárka . EQ aPERCENTRANK. INC. Ak chcete účtovať zviazané hodnoty, použite funkciu Rank. EQ (funkcia), ktorá zaobchádza s zviazanými hodnotami s rovnakým stupňom, alebo použite funkciu Rank.Funkcia AVG , ktorá vráti priemernú hodnosť pre zviazané hodnoty.

Analytický nástroj Regression vykoná lineárnu regresnú analýzu pomocou metódy najmenších štvorcov, pričom preloží priamku cez množinu pozorovaní. Umožňuje analyzovať ako hodnoty jednej alebo viacerých nezávislých premenných ovplyvňujú danú závislú premennú. Môžete napríklad analyzovať ako je výkonnosť atléta ovplyvnená faktormi ako vek, výška a hmotnosť. Podiely v miere výkonnosti môžete priradiť ku každému z týchto troch faktorov na základe údajov o výkonnosti a potom výsledky použiť na predpovedanie výkonu ďalšieho atléta, ktorý nebol testovaný.

Nástroj regresia používa funkciu hárka LINEST.

Analytický nástroj Sampling vytvorí vzorku zo základného súboru, pričom za základný súbor sa považuje vstupný rozsah. Ak je základný súbor príliš veľký na spracovanie alebo vytvorenie grafu, možno použiť reprezentatívnu vzorku. Ak predpokladáte, že vstupné údaje sú periodické, môžete vytvoriť vzorku obsahujúcu hodnoty len z určitej časti cyklu. Ak napríklad vstupný rozsah obsahuje štvrťročné údaje predaja, výber vzorky s periódou štyri sa umiestni do výstupného rozsahu hodnoty z rovnakého štvrťroku.

Analytické nástroje Two-Sample t-Test testujú rovnosť stredných hodnôt základných súborov jednotlivých vzoriek. Tieto tri nástroje vychádzajú z troch rôznych predpokladov: 1) rozptyly základných súborov sú rovnaké; 2) rozptyly základných súborov nie sú rovnaké; 3) dve vzorky reprezentujú pozorovania rovnakých objektov pred spracovaním a po spracovaní.

V prípade všetkých troch nižšie uvedených nástrojov sa vypočíta hodnota t-štatistická hodnota t a zobrazí sa ako "t stat" vo výstupných tabuľkách. V závislosti od údajov môže byť táto hodnota, t, záporná alebo nezáporná. Za predpokladu rovnosti základného základného súboru znamená, že ak je t < 0, "P (T <= t)", "rovná sa pravdepodobnosť, že bude zaznamenaná hodnota t-štatistickej hodnoty, ktorá je viac záporná ako t. Ak je t >= 0, "P (T <= t) One-Tail" udáva pravdepodobnosť, že hodnota t-štatistického prvku bude zaznamenaná, že je pozitívnejší ako t. "t kritická jednostranná hodnota" poskytuje kritickú hodnotu tak, aby pravdepodobnosť pozorovania hodnoty t-štatistického prvku väčšia alebo rovná "t Critical jeden-Tail" je alfa.

"P (T <= T) obojstranná" udáva pravdepodobnosť, že hodnota t-štatistiky bude zaznamenaná, že je väčšia ako absolútna hodnota ako t. "P kritické dva-Tail" poskytuje kritickú hodnotu tak, aby pravdepodobnosť zaznamenanej t-štatisticky väčšej hodnoty v absolútnych hodnotách ako "P kritické dva-Tail" bola alfa.

t-Test: Dvojvýberový párový test pre stredné hodnoty

Párový test môžete použiť, ak v prípade vzoriek existuje prirodzené párovanie pozorovaní, napríklad ak je skupina vzoriek testovaná dvakrát  – pred a po experimente. Tento analytický nástroj a jeho vzorec určia pomocou dvojvýberového párového Studentovho t-testu, či majú pozorovania získané pred spracovaním a pozorovania získané po spracovaní rozdelenia s rovnakými strednými hodnotami základných súborov. V prípade tohto t-Testu sa nepredpokladá rovnosť rozptylov oboch základných súborov.

Poznámka: Jedným z výsledkov nástroja je združený rozptyl alebo akumulovaná miera variability údajov okolo strednej hodnoty, ktorá sa vypočíta pomocou nasledovného vzorca.

Vzorec na výpočet združeného rozptylu

t-Test: Dvojvýberový test s rovnosťou odchýlok

Tento analytický nástroj vykoná test t-test dvoch vzoriek. Tento formulár t-test predpokladá, že dve množiny údajov pochádzajú z rozložení s tými istými odchýlkami. Označuje sa ako Dvojvýberový t-test. Tento t-test môžete použiť na určenie, či dve vzorky pravdepodobne pochádzajú z rozdelenia s rovnakými strednými spôsobmi.

t-Test: Dvojvýberový test s nerovnosťou odchýlok

Tento analytický nástroj vykoná test t-test dvoch vzoriek. Tento formulár t-test predpokladá, že dve množiny údajov pochádzali z rozdelenia s nerovnými odchýlkami. Označuje sa ako Dvojvýberový t-test. Rovnako ako v prípade predchádzajúceho prípadu rovnakých odchýlok môžete použiť tento t-test na určenie, či tieto dve vzorky budú pravdepodobne pochádzať z rozdelenia s rovnakými strednými spôsobmi. Tento test použite v prípade, že sú v dvoch vzorkách odlišné predmety. Použite spárovaný test opísaný v príklade sledovať, keď existuje jedna množina predmetov a dve vzorky predstavujú merania pre každý predmet pred liečbou a po nej.

Nasledovný vzorec sa používa na výpočet štatistickej hodnoty t.

Vzorec na výpočet testovacej charakteristiky t

Nasledujúci vzorec sa používa na výpočet stupňov voľnosti df. Keďže výsledok výpočtu zvyčajne nie je celé číslo, hodnota DF sa zaokrúhli na najbližšie celé číslo, aby sa dosiahla kritická hodnota z tabuľky t. Funkcia hárka Excelu T.Test použije vypočítanú hodnotu DF bez zaokrúhlenia, pretože je možné spočítať hodnotu T.Test s neceločíselným DF. Vzhľadom na tieto rozdielne prístupy na určenie stupňov voľnosti sa výsledky T.Test a tento nástroj t-test sa bude líšiť v prípade nerovných odchýlok.

Vzorec na výpočet približného počtu stupňov voľnosti

Z-test: nástroj na analýzu dvoch vzoriek pre nástroje vykoná dve vzorky z-test pre prostriedky so známymi odchýlkami. Tento nástroj sa používa na otestovanie nulovej hypotézy, že medzi dvomi hodnotami základného súboru neexistuje žiadny rozdiel medzi jednostrannými alebo obojstrannými alternatívnymi hypotézami. Ak nie sú známe odchýlky, funkcia hárka z.Namiesto toho by sa mal použiť test .

Pred používaním nástroja z-test by ste mali porozumieť výstupu tohto nástroja. Jednostranná pravdepodobnosť „P(Z <= z) one-tail" je v skutočnosti pravdepodobnosťou P(Z >= ABS(z)), čo predstavuje pravdepodobnosť výskytu hodnoty z, ktorá sa na číselnej osi bude nachádzať vo väčšej vzdialenosti smerom od 0 a rovnakým smerom ako pozorovaná hodnota z, a to za predpokladu, že medzi strednými hodnotami základných súborov nie je rozdiel. Obojstranná pravdepodobnosť „P(Z <= z) two-tail“ je v skutočnosti pravdepodobnosťou P(Z >= ABS(z) alebo Z <= -ABS(z)), čo predstavuje pravdepodobnosť výskytu hodnoty z, ktorá sa na číselnej osi bude nachádzať vo väčšej vzdialenosti smerom od 0 ako pozorovaná hodnota z, teda napravo od kladnej pozorovanej hodnoty z a zároveň naľavo od zápornej pozorovanej hodnoty z, a to za predpokladu, že medzi strednými hodnotami základných súborov nie je rozdiel. Obojstranný výsledok je teda len vynásobením jednostranného výsledku hodnotou 2. Nástroj z-test možno tiež použiť v prípade, keď nulovú hypotézu predstavuje skutočnosť, že pre rozdiel medzi dvoma strednými hodnotami základných súborov existuje konkrétna nenulová hodnota. Tento test môžete napríklad použiť na určenie rozdielov medzi výkonom dvoch modelov automobilov.

Potrebujete ďalšiu pomoc?

Vždy sa môžete opýtať odborníka v komunite technikov pre Excel, získať podporu v rámci komunity lokality Answers alebo navrhnúť novú funkciu či vylepšenie na lokalite Excel User Voice.

Pozrite tiež

Vytvorenie histogramu v Exceli 2016

Vytvorenie Pareto grafu v Exceli 2016

Načítanie doplnku Analytické nástroje v Exceli

Technické funkcie (odkaz)

ŠTATISTICKÉ funkcie (odkaz)

Prehľad vzorcov v Exceli

Zabránenie vzniku nefunkčných vzorcov

Vyhľadanie a oprava chýb vo vzorcoch

Excelové klávesové skratky a funkčné klávesy

Zoznam funkcií Excelu (podľa abecedy)

Zoznam funkcií Excelu (podľa kategórie)

Rozšírte svoje zručnosti práce s balíkom Office
Preskúmať školenie
Buďte medzi prvými, ktorí získajú nové funkcie
Pridajte sa k insiderom pre Office

Boli tieto informácie užitočné?

Ďakujeme za vaše pripomienky!

Ďakujeme vám za pripomienky. Pravdepodobne vám pomôže, ak vás spojíme s pracovníkom podpory pre Office.

×