Використання надбудови ''Пакет аналізу'' для виконання аналізу складних даних

Примітка.: Ми хочемо надавати найновіший вміст довідки рідною мовою користувачів якомога швидше. Цю сторінку перекладено за допомогою засобу автоматичного перекладу, тому вона може містити смислові, синтаксичні або граматичні помилки. Ми вважаємо, що цей вміст стане вам у пригоді. Повідомте нас, чи була інформація корисною, унизу цієї сторінки. Для зручності цю статтю можна переглянути англійською мовою.

Якщо потрібно провести комплексний статистичний або інженерний аналіз, можна зберегти зусилля та час, скориставшись пакетом аналізу. Ви надаєте дані та параметри для кожного аналізу, а засіб використовує усі потрібні статистичні або інженерні макрофункції для проведення підрахунку та відображає результати в таблиці результатів. Деякі засоби, окрім таблиць результатів, створюють ще й діаграми.

Функції аналізу даних можна використовувати одночасно тільки на одному аркуші. Під час виконання аналізу даних на згрупованих аркушах результати відображаються на першому аркуші і пусті форматовані таблиці відобразяться на решті аркушів. Щоб виконати аналіз даних на решті аркушів перерахуйте засіб аналізу на кожному аркуші.

Пакет аналізу містить описані нижче засоби. Щоб скористатися цими засобами, виберіть команду Аналіз даних у групі Аналіз на вкладці Дані. Якщо команда Аналіз даних недоступна, необхідно завантажити надбудову ''Пакет аналізу''.

  1. На вкладці Файл виберіть пункт Параметри, а потім – категорію Надбудови.

    Якщо ви використовуєте Excel 2007, натисніть Кнопку Microsoft Office Зображення кнопки Office а потім натисніть кнопку Параметри Excel

  2. У полі Керування виберіть пункт Надбудови Excel і натисніть кнопку Перейти.

    Якщо ви використовуєте Excel для Mac, у меню File (Файл) виберіть Tools (Знаряддя) > Excel Add-ins (Надбудови Excel).

  3. У вікні Надбудови встановіть прапорець для надбудови Пакет аналізу й натисніть кнопку OK.

    • Якщо надбудова Пакет аналізу відсутня у списку Наявні надбудови, натисніть кнопку Огляд, щоб її знайти.

    • Якщо з’явиться повідомлення, що надбудову ''Пакет аналізу'' ще не інстальовано на вашому комп’ютері, натисніть кнопку Так, щоб інсталювати її.

Примітка.: Щоб додати до пакета аналізу функції Visual Basic for Application (VBA), завантажте надбудову ''Пакет аналізу – VBA'' так само, як ви завантажували власне надбудову ''Пакет аналізу''. У полі Наявні надбудови встановіть прапорець Пакет аналізу – VBA.

Засоби дисперсійного аналізу призначені для виконання різних видів дисперсійного аналізу. Вибір використовуваного засобу залежить від багатьох факторів та кількості вибірок із сукупностей, які потрібно проаналізувати.

Дисперсійний аналіз: однофакторний

Цей засіб виконує простий Дисперсійний аналіз даних для двох або більше зразків. Аналіз порівнюється гіпотеза, що кожен зразок взято з одного базові розподілу ймовірності проти альтернативних гіпотеза, що базові ймовірність розподілу відрізняються від усіх зразках. Якщо є лише кілька зразків, який можна використовувати функцію T.Перевірка. Більше двох зразків є ні узагальнення T.Тесті моделі дисперсійного аналізу можна назвати рішень на основі натомість.

Дисперсійний аналіз: двофакторний із повторенням

Цей засіб аналізу корисний, якщо дані можна систематизувати за двома параметрами. Наприклад, в експерименті з вимірювання зростання рослини обробляли добривами різних виробників (наприклад, А, В, С) та утримували за різної температури (наприклад, низької та високої). Таким чином, для кожної з 6 можливих пар умов {добриво, температура} можна отримати однаковий набір спостережень за зростанням рослин. За допомогою засобу дисперсійного аналізу можна перевірити:

  • Чи висоти рослини для різних добрив марки відображаються від ж базові генеральної сукупності. Температура ігноруються для цього аналізу.

  • Чи висоти рослини температуру різних рівнів відображаються від ж базові генеральної сукупності. Добрив марки ігноруються для цього аналізу.

Чи 6 зразків, які представляють усі пари значень {добриво, температура} і використовуються для оцінки впливу різних марок добрив (крок 1) та рівнів температури (крок 2), витягнуто з однієї загальної сукупності. Альтернативна гіпотеза припускає, що вплив конкретних пар {добриво, температура} перевищує вплив окремо добрива та окремо температури.

Діапазон вхідних даних для засобу дисперсійного аналізу

Дисперсійний аналіз: двофакторний без повторення

Цей вид аналізу можна застосовувати, якщо дані класифіковано за двома вимірами. Однак для цього аналізу передбачено тільки одне спостереження для кожної пари (наприклад, для кожної пари {добриво, температура} в наведеному вище прикладі).

Функція CORREL та PEARSON функції аркуша як обчислити коефіцієнт кореляції між двома змінними вимірювання під розміри на кожному змінна спостерігаються для кожного з N елементів. (Будь-який відсутні спостереження за будь-яку тему викликає цю тему пропускатиметься до аналізу). Засіб аналізу кореляції корисний, особливо якщо є більше двох змінних вимірювання для кожного з N елементів. Він містить таблицю кореляції матриці, яка відображає значення функції CORREL (або PEARSON), що застосовується до кожної можливої пари змінних вимірювання.

Коефіцієнт кореляції, як-от коваріацію, тобто – це міра того міри, до яких дві змінних вимірювання» змінюються разом». На відміну від коваріацію, тобто коефіцієнта кореляції масштабується таким чином, щоб її значення незалежно від одиниці, в яких дві вимірювання змінні виражені. (Наприклад, якщо змінних два вимірювання товщини та висоти, значення коефіцієнта кореляції залишається незмінним якщо товщина буде перетворено на фунтах кілограми.) Значення будь-якого коефіцієнта кореляції має бути від -1 + 1 включно.

Кореляційний аналіз дає можливість установити, чи асоційовані набори даних за величиною, тобто більші значення з одного набору даних співвідносяться з більшими значеннями другого набору (позитивна кореляція), чи навпаки, малі значення одного набору даних співвідносяться з більшими значеннями другого набору (негативна кореляція), або дані двох діапазонів не співвідносяться (нульова кореляція).

Співвідношення та Коваріація засоби можна використовувати в ті ж самі параметри, якщо у вас є N різних вимірювання змінних набору людей. Співвідношення та Коваріація засоби кожного надають таблицю, матриці, яка відображає коефіцієнт кореляції або коваріацію, відповідно, між кожною парою змінних вимірювання. Різниця полягає в тому, що кореляції коефіцієнти припасовується між -1 і 1 включно. Відповідні covariances не масштабується. Коефіцієнт кореляції, так і Коваріація є міри міри, до якої двома змінними» змінюються разом».

Коваріація засіб обчислює значення функції аркуша КОВАРІАЦІЯ. P для кожної пари змінних вимірювання. (Пряме використання КОВАРІАЦІЯ. P, а не засобу Коваріація – це розумна альтернатива коли є лише кілька змінних вимірювання, тобто N = 2.) Запис по діагоналі Коваріація засобу вихідної таблиці в рядок, стовпець я Коваріація i ому вимірювання змінна з окремо. Це – просто відхилення генеральної сукупності для цього змінної, як обчислення за допомогою функції аркуша VAR.P.

Коваріаційний аналіз дає можливість установити, чи асоційовані набори даних за величиною, тобто більші значення з одного набору даних співвідносяться з більшими значеннями другого набору (позитивна коваріація), чи навпаки, малі значення одного набору даних співвідносяться з більшими значеннями другого набору (негативна коваріація), або дані двох діапазонів не співвідносяться (нульова коваріація).

Засіб аналізу ''Описова статистика'' використовується для створення одномірного статистичного звіту, який містить інформацію про центральну тенденцію та мінливість даних початкового діапазону.

Засіб аналізу ''Експоненційне згладжування'' застосовується для передбачення значення на основі прогнозу для попереднього періоду, скорегованого з урахуванням похибок у цьому прогнозі. Під час аналізу застосовується константа згладжування a, за величиною якої визначається ступінь впливу похибок на прогноз у попередньому прогнозі.

Примітка.: Для константи згладжування найбільш придатними є значення від 0,2 до 0,3. Ці значення вказують, що помилка поточного прогнозу встановлена на рівні від 20 до 30 відсотків помилки попереднього прогнозу. Більш високі значення константи пришвидшують відповідь, але можуть призвести до відображення непередбачених результатів. Низькі значення константи можуть спричинити великі проміжки між передбаченими значеннями.

Метод Фішера для двовибіркових дисперсій застосовується для порівняння дисперсій двох сукупностей.

Наприклад, можна використовувати цей засіб для аналізу вибірок результатів запливу для кожної з двох команд. Засіб надає результати порівняння нульової гіпотези про те, що ці дві вибірки взято з розподілу з рівними дисперсіями, з альтернативною гіпотезою, що дисперсії різні в базових розподілах.

За допомогою цього засобу обчислюється значення f F-статистики (або F-коефіцієнт). Значення f, близьке до 1, вказує, що дисперсії генеральної сукупності рівні. У таблиці вихідних даних, якщо f < 1, ''P(F <= f) однобічне'' дає можливість спостереження значення F-статистики, меншого від f за рівних дисперсій генеральної сукупності, а ''F критичне однобічне'' видає критичне значення, менше від 1, для вибраного рівня значності альфа. Якщо f > 1, ''P(F <= f) однобічне'' дає можливість спостереження значення F-статистики, більшого від f за рівних дисперсій генеральної сукупності, а ''F критичне однобічне'' видає критичне значення, більше від 1 для альфа.

Цей засіб застосовується для розв’язання задач у лінійних системах та аналізу періодичних даних на основі методу швидкого перетворення Фур’є. Засіб також підтримує зворотні перетворення, в цьому разі інвертування перетворених даних повертає вихідні дані.

Вхідний і вихідний діапазони даних для аналізу Фур’є

Засіб аналізу ''Гістограма'' використовується для обчислення окремих та кумулятивних частот для діапазону даних клітинки та елементах даних. Повертаються дані для кількості появ певного значення у наборі даних.

Наприклад, необхідно виявити розподіл успішності у групі з 20 студентів. Таблиця гістограми складається з меж шкали оцінок та кількості студентів, чий рівень успішності перебуває між найнижчою та поточною межею. Найчастіше повторюваний рівень є модою даних.

Порада.: В Excel 2016 тепер можна створювати гістограми та діаграми Парето.

Використовується для розрахунку значень у прогнозованому періоді на основі значення змінної для вказаної кількості попередніх періодів. Змінне середнє, на відміну від простого середнього для всієї вибірки, містить відомості про тенденції змінення даних. Цей метод може використовуватися для прогнозування збуту, запасів та інших процесів. Розрахунок прогнозованих значень виконується за такою формулою.

Формула для обчислення змінних середніх

де:

  • N – кількість попередніх періодів, які потрібно долучити до змінного середнього;

  • A j фактичне значення на момент часу j

  • F j прогнозоване значення на момент часу j

Використовується для заповнення діапазону випадковими числами, здобутими з одного або декількох розподілів. За допомогою цього засобу можна характеризувати елементи сукупності за законом імовірностей. Наприклад, можна використовувати нормальний розподіл для моделювання сукупності даних зросту осіб, або скористатися розподілом Бернуллі для двох ймовірних результатів, щоб описати сукупність результатів підкидання монети.

Ранг і процентиль засіб аналізу повертає таблицю, яка містить порядковий та відсотковий ранг кожного значення в наборі даних. Ви можете аналізувати відносне положення значення в наборі даних. Цей засіб використовує функції аркуша ранг. EQ таPERCENTRANK. INC. Якщо ви хочете ідентичними значеннями, використовуйте ранг. EQ функція, яка розпізнає пов'язаних значень мають такий самий ранг, або скористайтеся на ранг.Функція «середнє» , яка повертає середнє значення ранг ідентичними значеннями.

Засіб регресії аналізу виконує регресійний аналіз за допомогою методу «найменших квадратів» відповідно лінію за допомогою набору спостережень. Ви можете аналізувати як один залежної змінної залежить від значення для одного або кількох незалежних змінних. Наприклад, можна проаналізувати, як спортсмена продуктивність залежить від таких факторів, як вік, висоти та товщини. Можна розподілити спільні папки в міру виконання кожного з цих трьох факторів, залежно від набір даних продуктивності і передбачати продуктивність новий, непротестованих спортсменів за допомогою результатів.

Засіб регресії використовує функцію LINEST.

Створює вибірку з генеральної сукупності шляхом розгляду початкового діапазону як генеральної сукупності. Якщо сукупність завелика для оброблення або побудови діаграми, можна скористатися представницькою вибіркою. Крім того, якщо припускається періодичність вхідних даних, можна створити вибірку, яка містить значення тільки з однієї частини циклу. Наприклад, якщо початковий діапазон містить дані для квартальних продажів, створення вибірки з періодом 4 розташує в початковому діапазоні значення продажів з одного й того самого кварталу.

Засіб двовибіркового аналізу методом Ст’юдента перевіряє рівність середніх значень загальної сукупності за кожною вибіркою. Ці три засобі використовують різні припущення: що дисперсії сукупності рівні, що дисперсії сукупності не рівні, а також що дві вибірки представляють дані до та після експерименту над тими самими об’єктами.

Для всіх трьох засобів, наведених нижче, значення t-статистики – t – обчислюється та відображається як ''t Stat'' у таблицях результатів. Залежно від даних це значення t може бути від’ємним або невід’ємним. Якщо припустити, що середні значення генеральної сукупності рівні, при t < 0, ''P(T <= t) однобічне'' дає імовірність того, що спостережуване значення t-статистики буде більш від’ємним, ніж t. При t >=0, ''P(T <= t) однобічне'' робить можливим спостереження значення t-статистики, яке буде більш додатнім, ніж t. ''t Критичне однобічне'' видає граничне значення, тому імовірність спостереження значення t-статистики більшого або рівного ''t критичне однобічне'' дорівнює альфа.

''P(T <= t) двобічне'' дає імовірність спостереження значення t-статистики за абсолютним значенням, більшим від t. ''P критичне двобічне'' видає граничне значення, тому значення імовірності спостереження значення t- статистики за абсолютним значенням більшого ''P критичне двобічне'' дорівнює альфа.

Тест Ст’юдента: парний двовибірковий t-тест для середніх

Парний тест можна скористатися, якщо є природним сполучення у вибірках, наприклад, коли Генеральна сукупність перевіряється двічі – до та закінченню повідомлення. Цей засіб аналізу та його формула виконують парний Двовибірковий студент t тест для визначення, чи спостереження, взяті перед лікування та спостережень після можуть мати із розподілу дорівнює сукупностей. Цю форму t тест не вважати, що дисперсії обох населення дорівнює.

Примітка.: Одним із результатів тесту є сукупна дисперсія (сукупна міра розподілу даних навколо середнього значення), яка обчислюється за наведеною формулою.

Формула обчислення сукупної дисперсії

Тест Ст’юдента: двовибірковий t-тест із рівними дисперсіями

Цей засіб аналізу виконує студент Двовибірковий t тест. У цій формі t тест припускається, що два набори даних походять із розподілу ж дисперсії. Її називають гомоскедастичний t тест. За допомогою t тест для визначення, чи два зразки можуть мати із розподілу дорівнює сукупностей.

Тест Ст’юдента: двовибірковий t-тест із нерівними дисперсіями

Цей засіб аналізу виконує студент Двовибірковий t тест. У цій формі t тест припускається, що два набори даних походять із розподілу нерівними дисперсіями. Її називають гетероскедастичний t тест. Як і в попередньому рівними дисперсіями інциденту, за допомогою t тест для визначення, чи два зразки можуть мати із розподілу дорівнює сукупностей. Використовуйте цей тест, якщо існують різні набори даних у двох вибірках. За допомогою парний тест, описаних у прикладі, якщо один набір даних і дві вибірки представляють вимірювання для кожного елемента до і після.

Для визначення статистичного значення t використовується наведена формула.

Формула для обчислення значення t

Наведена нижче формула використовується для обчислення ступеня свободи df. Оскільки результат обчислення зазвичай не є цілим числом, значення df округлюється до найближчого меншого цілого для отримання граничного значення з t-таблиці. Функцію аркуша Excel T.Перевірка використовує обчислене значення df без округлення, оскільки це можливо, щоб обчислити значення для T.Перевірка з до noninteger df. Через ці різні підходи до визначення ступенів свободи, результати T.У випадку з різними дисперсіями відрізнятиметься тест і цей інструмент t тест.

Формула наближеного обчислення ступеня свободи

Z тесту: Двовибірковий засіб виконує Двовибірковий z тесту для із відомими дисперсіями. Цей засіб використовується для перевірки нульової гіпотези те, що не різницю двох сукупності засоби захисту односторонній або двосторонній альтернативних гіпотез. Якщо дисперсій невідомі, аркуші функції Z.Слід використовувати ТЕСТУ .

Під час використання засобу ''Зета-тест'' слід уважно переглядати результат. ''P(Z <= z) однобічне'' насправді є P(Z >= ABS(z)), імовірність z-значення, віддаленого від 0 у тому самому напрямку, що і спостережуване z-значення за однакових середніх значень генеральної сукупності. ''P(Z <= z) двобічне'' є насправді P(Z >= ABS(z) або Z <= -ABS(z)), імовірність z-значення, віддаленого від 0 у тому самому напрямку, що і спостережуване z-значення за однакових середніх значень генеральної сукупності. Двобічний результат є однобічним результатом, помноженим на 2. Засіб ''Зета-тест'' можна застосовувати для нульової гіпотези про особливе ненульове значення різниці між двома середніми генеральних сукупностей. Наприклад, цей метод можна використовувати для визначення різниці між характеристиками двох моделей автомобілів.

Потрібна додаткова довідка?

Ви завжди можете поставити запитання експерту в спільноті Tech (у розділі Excel), отримати підтримку в спільноті, що допомагає знайти відповіді на запитання, або запропонувати нову функцію чи вдосконалення на форумі Excel User Voice.

Додаткові відомості

Створення гістограми в програмі Excel 2016

Створення діаграми Парето в програмі Excel 2016

Завантаження надбудови аналізу у програмі Excel

ТЕХНІЧНІ функції (довідка)

СТАТИСТИЧНІ функції (довідка)

Огляд формул в Excel

Способи уникнення недійсних формул

Виявлення та виправлення помилок у формулах

Сполучення клавіш і функціональні клавіші в Excel

Функції Excel (за алфавітом)

Функції Excel (за категоріями)

Удосконалення навичок роботи з Office
Ознайомтеся з навчальними матеріалами
Отримуйте нові функції раніше за інших
Приєднайтеся до оцінювачів Office

Ця інформація корисна?

Дякуємо за ваш відгук!

Дякуємо за відгук! Схоже, вам може стати в нагоді допомога одного з наших спеціалістів служби підтримки Office, з яким ми вас можемо з’єднати.

×