Статистична перевірка гіпотез

Статист і чна пров е Сірка гіп про тез, система прийомів в математичній статистиці , Призначених для перевірки відповідності дослідних даних деякій статистичної гіпотези . Процедури С. п. Р дозволяють приймати або відкидати статистичні гіпотези, що виникають при обробці або інтерпретації результатів вимірювань в багатьох практично важливих розділах науки і виробництва, пов'язаних з експериментом. Правило, за яким приймається або відхиляється дана гіпотеза, називається статистичним критерієм. Побудова критерію визначається вибором підходящої функції Т від результатів спостережень, яка служить мірою розбіжності між досвідченими і гіпотетичними значеннями. Ця функція, що є випадковою величиною, називається статистикою критерію, при цьому передбачається, що розподіл ймовірностей Т може бути обчислено при допущенні, що перевіряється гіпотеза вірна. За розподілом статистики Т знаходиться значення Т0, таке, що якщо гіпотеза вірна, то ймовірність нерівності T> T0 дорівнює a, де a - заздалегідь заданий значущості рівень . Якщо в конкретному випадку виявиться, що Т> T0, то гіпотеза відкидається, тоді як поява значення Т £ T0 який суперечить гіпотезі. Нехай, наприклад, потрібно перевірити гіпотезу про те, що незалежні результати спостережень x1, ..., xn підкоряються нормальному розподілу із середнім значенням а = a0 і відомої дисперсією s 2. При цьому припущенні середнє арифметичне Статист і чна пров е Сірка гіп про тез, система прийомів в математичній статистиці , Призначених для перевірки відповідності дослідних даних деякій статистичної гіпотези результатів спостережень розподілено нормально з середнім а = a0 і дисперсією s 2 / n, а величина розподілена нормально з параметрами (0, 1). вважаючи можна знайти зв'язок між T0 і a за таблицями нормального розподілу. Наприклад, при гіпотезі а = a0 подія Т> 1, 96 має ймовірність а = 0,05. Правило, що рекомендує вважати, що гіпотеза а = a0 невірна, якщо Т> 1,96, буде приводити до помилкового відкидання цієї гіпотези в середньому в 5 випадках з 100, в яких вона вірна. Якщо ж Т £ 1,96, то це ще не означає, що гіпотеза підтверджується, тому що вказане нерівність з великою ймовірністю може виконуватися при а, близьких до a0. Отже, при використанні запропонованого критерію можна лише стверджувати, що результати спостережень не суперечать гіпотезі а = a0. При виборі статистики Т завжди явно чи неявно враховують гіпотези, що конкурують з гіпотезою а = a0. Наприклад, якщо заздалегідь відомо, що а ³ a0, т. Е. Відхилення гіпотези а = a0 тягне прийняття гіпотези а> a0, то замість Т слід узяти . Якщо дисперсія s 2 невідома, то замість даного критерію для перевірки гіпотези а = a0 можна скористатися т. Н. критерієм Стьюдента, заснованим на статистиці яка включає несмещенную оцінку дисперсії

і підпорядкована Стьюдента розподілу з n - 1 ступенями свободи (подібне завдання див. в ст. Математична статистика , Табл. 1a). Такого роду критерії називаються критеріями згоди і використовуються як для перевірки гіпотез про параметри розподілу, так і гіпотез про самих розподілах (див. непараметричні методи ). При вирішенні питання про прийняття або відхилення будь-якої гіпотези H0 за допомогою будь-якого критерію, заснованого на результатах спостереження, можуть бути допущені помилки двох типів. Помилка «першого роду» відбувається тоді, коли відкидається вірна гіпотеза H0. Помилка «другого роду» відбувається в тому випадку, коли гіпотеза H0 приймається, а насправді вірна не вона, а будь-яка альтернативна гіпотеза Н. Природно вимагати, щоб критерій для перевірки даної гіпотези приводив можливо рідше до помилкових рішень. Звичайна процедура побудови найкращого критерію для простої гіпотези полягає у виборі серед всіх критеріїв із заданим рівнем значущості і (ймовірність помилки першого роду) такого, що впровадить до найменшої імовірності помилки другого роду (або, що те ж саме, до найбільшої ймовірності відхилення гіпотези, коли вона невірна). Остання ймовірність (доповнює до одиниці ймовірність помилки другого роду) називається потужністю критерію. У разі, коли альтернативна гіпотеза Н проста, найкращим буде критерій, який має найбільшу потужність серед всіх інших критеріїв із заданим рівнем значущості а (найбільш потужний критерій). Якщо альтернативна гіпотеза Н складна, наприклад залежить від параметра, то потужність критерію буде функцією, визначеною на класі простих альтернатив, складових Н, т. Е. Буде функціейпараметра. Критерій, що має найбільшу потужність при кожній альтернативній гіпотезі з класу Н, називається рівномірно найбільш потужним, проте слід зазначити, що такий критерій існує лише в небагатьох спеціальних ситуаціях. У задачі перевірки гіпотези про середнє значення нормальної сукупності а = а0 проти альтернативної гіпотези а> a0 рівномірно найбільш потужний крітерійсуществует, тоді як при перевірці тієї жегіпотези проти альтернативи а ¹ a0 його немає. Тому часто обмежуються пошуком рівномірно найбільш потужних критеріїв в тих чи інших спеціальних класах (Інваріантних, незміщене критеріїв і т.п.).

Теорія С. п. Р дозволяє з єдиної точки зору трактувати висунуті практикою різні завдання математичної статистики (оцінка відмінності між середніми значеннями, перевірка гіпотези постійності дисперсії, перевірка гіпотези незалежності, перевірка гіпотез про розподіли і т.п. Ідеї послідовного аналізу , Застосовані до С. п. Р, вказують на можливість зв'язати рішення про прийняття або відхилення гіпотези з результатами последовательнопроводімих спостережень (в цьому випадку число спостережень, на основі яких за певним правилом приймається рішення, не фіксується заздалегідь, а визначається в ході експерименту) (Див. також Статистичні рішення ).

Літ .: Kpamep Г., Математичні методи статистики, пер. з англ., 2 вид., М., 1975; Леман Е., Перевірка статистичних гіпотез, пер. з англ., М., 1964.

Л. В. Прохоров.