Нулевая и альтернативная гипотезы. Проверка нулевой гипотезы

На разных стадиях статистического исследования и моделирования возникает необходимость в формулировке и экспериментальной проверке некоторых предположений (гипотез) относительно природы и величины неизвестных параметров анализируемой генеральной совокупности (совокупностей). Например, исследователь высказывает предположение: "выборка извлечена из нормальной генеральной совокупности" или "генеральная средняя анализируемой совокупности равна пяти". Такие предположения называются статистическими гипотезами.

Сопоставление высказанной гипотезы относительно генеральной совокупности с имеющимися выборочными данными, сопровождаемое количественной оценкой степени достоверности получаемого вывода, осуществляется с помощью того или иного статистического критерия и называется проверкой статистических гипотез .

Выдвинутая гипотеза называется нулевой (основной) . Ее принято обозначать Н 0 .

По отношению к высказанной (основной) гипотезе всегда можно сформулировать альтернативную (конкурирующую) , противоречащую ей. Альтернативную (конкурирующую) гипотезу принято обозначать Н 1 .

Цель статистической проверки гипотез состоит в том, чтобы на основании выборочных данных принять решение о справедливости основной гипотезы Н 0 .

Если выдвигаемая гипотеза сводится к утверждению о том, что значение некоторого неизвестного параметра генеральной совокупности в точности равно заданной величине, то эта гипотеза называется простой , например: "среднедушевой совокупный доход населения России составляет 650 рублей в месяц"; "уровень безработицы (доля безработных в численности экономически активного населения) в России равна 9%" . В других случаях гипотеза называется сложной .

В качестве нулевой гипотезы Н 0 принято выдвигать простую гипотезу, т.к. обычно бывает удобнее проверять более строгое утверждение.

Гипотезы о виде закона распределения исследуемой случайной величины;

Гипотезы о числовых значениях параметров исследуемой генеральной совокупности;

Гипотезы об однородности двух или нескольких выборок или некоторых характеристик анализируемых совокупностей;

Гипотезы об общем виде модели, описывающей статистическую зависимость между признаками и др.

Так как проверка статистических гипотез осуществляется на основании выборочных данных, т.е. ограниченного ряда наблюдений, решения относительно нулевой гипотезы Н 0 имеют вероятностный характер. Другими словами, такое решение неизбежно сопровождается некоторой, хотя возможно и очень малой, вероятностью ошибочного заключения как в ту, так и в другую сторону.



Так, в какой-то небольшой доле случаев α нулевая гипотеза Н 0 может оказаться отвергнутой, в то время как в действительности в генеральной совокупности она является справедливой. Такую ошибку называют ошибкой первого рода . А ее вероятность принято называтьуровнем значимости и обозначать α .

Наоборот, в какой-то небольшой доле случаев β нулевая гипотеза Н 0 принимается, в то время как на самом деле в генеральной совокупности она ошибочна, а справедлива альтернативная гипотеза Н 1 . Такую ошибку называют ошибкой второго рода . Вероятность ошибки второго рода принято обозначать β . Вероятность 1 - β называют мощностью критерия .

При фиксированном объеме выборки можно выбрать по своему усмотрению величину вероятности только одной из ошибок α или β . Увеличение вероятности одной из них приводит к снижению другой. Принято задавать вероятность ошибки первого рода α - уровень значимости. Как правило, пользуются некоторыми стандартными значениями уровня значимости α : 0,1; 0,05; 0,025; 0,01; 0,005; 0,001. Тогда, очевидно, из двух критериев, характеризующихся одной и той же вероятностью α отклонить правильную в действительности гипотезу Н 0 , следует принять тот, который сопровождается меньшей ошибкой второго рода β , т.е. большей мощностью. Снижения вероятностей обеих ошибок α и β можно добиться путем увеличения объема выборки.

Правильное решение относительно нулевой гипотезы Н 0 также может быть двух видов:

Будет принята нулевая гипотеза Н 0 , тогда как и на самом деле в генеральной совокупности верна нулевая гипотеза Н 0 ; вероятность такого решения 1 - α;

Нулевая гипотеза Н 0 будет отклонена в пользу альтернативной Н 1, тогда как и на самом деле в генеральной совокупности нулевая гипотеза Н 0 отклоняется в пользу альтернативной Н 1 ; вероятность такого решения 1 - β - мощность критерия.

Результаты решения относительно нулевой гипотезы можно проиллюстрировать с помощью таблицы 8.1.

Таблица 8.1

Проверка статистических гипотез осуществляется с помощью статистического критерия (назовем его в общем виде К ), являющего функцией от результатов наблюдения.

Статистический критерий - это правило (формула), по которому определяется мера расхождения результатов выборочного наблюдения с высказанной гипотезой Н 0 .

Статистический критерий, как и всякая функция от результатов наблюдения, является случайной величиной и в предположении справедливости нулевой гипотезы Н 0 подчинена некоторому хорошо изученному (и затабулированному) теоретическому закону распределения с плотностью распределения f(k) .

Выбор критерия для проверки статистических гипотез может быть осуществлен на основании различных принципов. Чаще всего для этого пользуются принципом отношения правдоподобия , который позволяет построить критерий наиболее мощный среди всех возможных критериев. Суть его сводится к выбору такого критерия К с известной функцией плотности f(k) при условии справедливости гипотезы Н 0 , чтобы при заданном уровнем значимости α можно было бы найти критическую точку К кр .распределения f(k) , которая разделила бы область значений критерия на две части: область допустимых значений, в которой результаты выборочного наблюдения выглядят наиболее правдоподобными, и критическую область, в которой результаты выборочного наблюдения выглядят менее правдоподобными в отношении нулевой гипотезы Н 0 .

Если такой критерий К выбран, и известна плотность его распределения, то задача проверки статистической гипотезы сводится к тому, чтобы при заданном уровне значимости α рассчитать по выборочным данным наблюдаемое значение критерия К набл. и определить является ли оно наиболее или менее правдоподобным в отношении нулевой гипотезы Н 0 .

Проверка каждого типа статистических гипотез осуществляется с помощью соответствующего критерия, являющегося наиболее мощным в каждом конкретном случае. Например, проверка гипотезы о виде закона распределения случайной величины может быть осуществлена с помощью критерия согласия Пирсона χ 2 ; проверка гипотезы о равенстве неизвестных значений дисперсий двух генеральных совокупностей - с помощью критерия F - Фишера; ряд гипотез о неизвестных значениях параметров генеральных совокупностей проверяется с помощью критерия Z - нормальной распределенной случайной величины и критерия T - Стьюдента и т.д.

Значение критерия, рассчитываемое по специальным правилам на основании выборочных данных, называется наблюдаемым значением критерия (К набл. ).

Значения критерия, разделяющие совокупность значений критерия на область допустимых значений (наиболее правдоподобных в отношении нулевой гипотезы Н 0 ) и критическую область (область значений, менее правдоподобных в отношении таблицам распределения случайной величины К , выбранной в качестве критерия, называются критическими точками(К кр.).

Областью допустимых значений (областью принятия нулевой гипотезы Н 0) К Н 0 не отклоняется.

Критической областью называют совокупность значений критерия К , при которых нулевая гипотеза Н 0 отклоняется в пользу конкурирующей Н 1 .

Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области .

Если конкурирующая гипотеза - правосторонняя, например, Н 1: а > а 0 , то и критическая область - правосторонняя (рис 1). При правосторонней конкурирующей гипотезе критическая точка (К кр. правосторонняя) принимает положительные значения.

Если конкурирующая гипотеза - левосторонняя, например, Н 1: а < а 0 , то и критическая область - левосторонняя (рис 2). При левосторонней конкурирующей гипотезе критическая точка принимает отрицательные значения (К кр. левосторонняя) .

Если конкурирующая гипотеза - двусторонняя, например, Н 1: а ¹ а 0 , то и критическая область - двусторонняя (рис 3). При двусторонней конкурирующей гипотезе определяются две критические точки (К кр. левосторонняя и К кр. правосторонняя) .


Область допустимых Критическая

значений область

На основе собранных в статистических исследованиях данных после их обработки делаются выводы об изучаемых явлениях. Эти выводы делаются путём выдвижения и проверки статистических гипотез.

Статистической гипотезой называется любое утверждение о виде или свойствах распределения наблюдаемых в эксперименте случайных величин. Статистические гипотезы проверяются статистическими методами.

Проверяемая гипотеза называется основной (нулевой) и обозначается Н 0 . Кроме нулевой выдвигается ещё и альтернативная (конкурирующая) гипотеза Н 1 ,отрицающая основную. Таким образом, в результате проверки будет принята одна и только одна из гипотез, а вторая будет отвергнута.

Типы ошибок . Выдвинутая гипотеза проверяется на основании исследования выборки, полученной из генеральной совокупности. Из-за случайности выборки в результате проверки не всегда делается правильный вывод. При этом могут возникать следующие ситуации:
1. Основная гипотеза верна и она принимается.
2. Основная гипотеза верна, но она отвергается.
3. Основная гипотеза не верна и она отвергается.
4. Основная гипотеза не верна, но она принимается.
Во случае 2 говорят об ошибке первого рода , в последнем случае речь идёт об ошибке второго рода .
Таким образом, по одним выборкам принимается правильное решение, а по другим – неправильное. Решение принимается по значению некоторой функции выборки, называемой статистической характеристикой , статистическим критерием или просто статистикой . Множество значений этой статистики можно разделить на два непересекающихся подмножества:

  • Н 0 принимается (не отклоняется), называется областью принятия гипотезы (допустимой областью) ;
  • подмножество значений статистики, при которых гипотеза Н 0 отвергается (отклоняется) и принимается гипотеза Н 1 ,называется критической областью.

Выводы:

  1. Критерием называется случайная величина K , которая позволяет принять или отклонить нулевую гипотезу H0 .
  2. При проверке гипотез можно допустить ошибки 2 родов.
    Ошибка первого рода состоит в том, что будет отклонена гипотеза H 0, если она верна ("пропуск цели"). Вероятность совершить ошибку первого рода обозначается α и называется уровнем значимости . Наиболее часто на практике принимают, что α = 0,05 или α = 0,01.
    Ошибка второго рода заключается в том, что гипотеза H0 принимается, если она неверна ("ложное срабатывание"). Вероятность ошибки этого рода обозначается β.

Классификация гипотез

Основная гипотеза Н 0 о значении неизвестного параметра q распределения обычно выглядит так:
Н 0: q = q 0 .
Конкурирующая гипотеза Н 1 может при этом иметь следующий вид:
Н 1: q < q 0 , Н 1: q > q 0 или Н 1: q q 0 .
Соответственно получается левосторонняя, правосторонняя или двусторонняя критические области. Граничные точки критических областей (критические точки ) определяют по таблицам распределения соответствующей статистики.

При проверке гипотезы разумно уменьшить вероятность принятия неправильных решений. Допустимая вероятность ошибки первого рода обозначается обычно a и называется уровнем значимости . Его значение, как правило, мало (0,1, 0,05, 0,01, 0,001 …). Но уменьшение вероятности ошибки первого рода приводит к увеличению вероятности ошибки второго рода (b ), т.е. стремление принимать только верные гипотезы вызывает возрастание числа отброшенных правильных гипотез. Поэтому выбор уровня значимости определяется важностью поставленной проблемы и тяжестью последствий неверно принятого решения.
Проверка статистической гипотезы состоит из следующих этапов :
1) определение гипотез Н 0 и Н 1 ;
2) выбор статистики и задание уровня значимости;
3) определение критических точек К кр и критической области;
4) вычисление по выборке значения статистики К экс ;
5) сравнение значения статистики с критической областью (К кр и К экс );
6) принятие решения: если значение статистики не входит в критическую область, то принимается гипотеза Н 0 и отвергается гипотеза H 1 , а если входит в критическую область, то отвергается гипотеза Н 0 и принимается гипотеза Н 1 . При этом, результаты проверки статистической гипотезы нужно интерпретировать так: если приняли гипотезу Н 1 , то можно считать её доказанной, а если принялигипотезу Н 0 , то признали, что она не противоречит результатам наблюдений.Однако этим свойством наряду с Н 0 могут обладать и другие гипотезы.

Классификация проверок гипотез

Рассмотрим далее несколько различных статистических гипотез и механизмов их проверки.
I) Гипотеза о генеральном среднем значении нормального распределения при не известной дисперсии . Предполагаем, что генеральная совокупность имеет нормальное распределение, её среднее и дисперсия неизвестны, но есть основания полагать, что генеральное среднее равно a . При уровне значимости α нужно проверить гипотезу Н 0: x =a. В качестве альтернативной можно использовать одну из трёх рассмотренных выше гипотез. В данном случае статистикой служит случайная величина , имеющая распределение Стьюдента с n – 1 степенями свободы. Определяется соответствующее экспериментальное (наблюдаемое) значение t экс t кр Н 1: x >a оно находится по уровню значимости α и числу степеней свободы n – 1. Если t экс < t кр Н 1: x ≠a критическое значение находится по уровню значимости α / 2 и том же числе степеней свободы. Нулевая гипотеза принимается, если | t экс |II) Гипотеза о равенстве двух средних значений произвольно распределённых генеральных совокупностей (большие независимые выборки). При уровне значимости α нужно проверить гипотезу Н 0: x ≠y . Если объём обеих выборок велик, то можно считать, что выборочные средние имеют нормальное распределение, а их дисперсии известны. В этом случае в качестве статистики можно использовать случайную величину
,
имеющую нормальное распределение, причём M (Z ) = 0, D (Z ) = 1. Определяется соответствующее экспериментальное значение z экс . Из таблицы функции Лапласа находится критическое значение z кр . При альтернативной гипотезе Н 1: x >y оно находится из условия F (z кр ) = 0,5 – a . Если z экс < z кр , то нулевая гипотеза принимается, в противоположном случае – отвергается. При альтернативной гипотезе Н 1: x ≠y критическое значение находится из условия F (z кр ) = 0,5×(1 – a ). Нулевая гипотеза принимается, если |z экс | < z кр .

III) Гипотеза о равенстве двух средних значений нормально распределённых генеральных совокупностей, дисперсии которых неизвестны и одинаковы (малые независимые выборки) . При уровне значимости α нужно проверить основную гипотезу Н 0: x =y . В качестве статистики используем случайную величину
,
имеющую распределение Стьюдента с (n х + n у – 2) степенями свободы. Определяется соответствующее экспериментальное значение t экс . Из таблицы критических точек распределения Стьюдента находится критическое значение t кр . Всё решается аналогично гипотезе (I).

IV) Гипотеза о равенстве двух дисперсий нормально распределённых генеральных совокупностей . В данном случае при уровне значимостиa нужно проверить гипотезу Н 0: D (Х ) = D (Y ). Статистикой служит случайная величина , имеющая распределение Фишера – Снедекора с f 1 = n б – 1 и f 2 = n м – 1 степенями свободы (S 2 б – большая дисперсия, объём её выборки n б ). Определяется соответствующее экспериментальное (наблюдаемое) значение F экс . Критическое значение F кр при альтернативной гипотезе Н 1: D (Х ) > D (Y ) находится из таблицы критических точек распределения Фишера – Снедекора по уровню значимости a и числу степеней свободы f 1 и f 2 . Нулевая гипотеза принимается, если F экс < F кр .

Инструкция . Для расчета необходимо указать размерность исходных данных.

V) Гипотеза о равенстве нескольких дисперсий нормально распределённых генеральных совокупностей по выборкам одинакового объёма. В данном случае при уровне значимостиa нужно проверить гипотезу Н 0: D (Х 1) = D (Х 2) = …= D (Х l ). Статистикой служит случайная величина , имеющая распределение Кочрена со степенями свободыf = n – 1 и l (n – объём каждой выборки, l – количество выборок). Проверка этой гипотезы проводится так же, как и предыдущей. Используется таблица критических точек распределения Кочрена.

VI) Гипотеза о существенности корреляционной связи. В данном случае при уровне значимостиa нужно проверить гипотезу Н 0: r = 0. (Если коэффициент корреляции равен нулю, то соответствующие величины не связаны друг с другом). Статистикой в данном случае служит случайная величина
,
имеющая распределение Стьюдента с f = n – 2 числом степеней свободы. Проверка этой гипотезы проводится аналогично проверке гипотезы (I).

Инструкция . Укажите количество исходных данных.

VII) Гипотеза о значении вероятности появления события. Проведено достаточно большое количество n независимых испытаний, в которых событие А произошло m раз. Есть основания полагать, что вероятность наступления данного события в одном испытании равна р 0 . Требуется при уровне значимостиa проверить гипотезу о том, что вероятность события А равна гипотетической вероятности р 0 . (Т.к. вероятность оценивается по относительной частоте, то проверяемую гипотезу можно сформулировать и иначе: значимо или нет различаются наблюдаемая относительная частота и гипотетическая вероятность).
Количество испытаний достаточно велико, поэтому относительная частота события А распределена по нормальному закону. Если нулевая гипотеза верна, то её математическое ожидание равно р 0 , а дисперсия . В соответствии с этим в качестве статистики выберем случайную величину
,
которая распределена приближённо по нормальному закону с нулевым математическим ожиданием и единичной дисперсией. Проверка данной гипотезы осуществляется точно так же, как и в случае (I).

Инструкция . Для расчета необходимо заполнить исходные данные.

5. Основные проблемы прикладной статистики - описание данных, оценивание и проверка гипотез

Основные понятия, используемые при проверке гипотез

Статистическая гипотеза – любое предположение, касающееся неизвестного распределения случайных величин (элементов). Приведем формулировки нескольких статистических гипотез:

1. Результаты наблюдений имеют нормальное распределение с нулевым математическим ожиданием.
2. Результаты наблюдений имеют функцию распределения N (0,1).
3. Результаты наблюдений имеют нормальное распределение.
4. Результаты наблюдений в двух независимых выборках имеют одно и то же нормальное распределение.
5. Результаты наблюдений в двух независимых выборках имеют одно и то же распределение.

Различают нулевую и альтернативную гипотезы. Нулевая гипотеза – гипотеза, подлежащая проверке. Альтернативная гипотеза – каждая допустимая гипотеза, отличная от нулевой. Нулевую гипотезу обозначают Н 0 , альтернативную – Н 1 (от Hypothesis – «гипотеза» (англ.)).

Выбор тех или иных нулевых или альтернативных гипотез определяется стоящими перед менеджером, экономистом, инженером, исследователем прикладными задачами. Рассмотрим примеры.

Пример 11. Пусть нулевая гипотеза – гипотеза 2 из приведенного выше списка, а альтернативная – гипотеза 1. Сказанное означает, то реальная ситуация описывается вероятностной моделью, согласно которой результаты наблюдений рассматриваются как реализации независимых одинаково распределенных случайных величин с функцией распределения N (0,σ), где параметр σ неизвестен статистику. В рамках этой модели нулевую гипотезу записывают так:

Н 0: σ = 1,

а альтернативную так:

Н 1: σ ≠ 1.

Пример 12. Пусть нулевая гипотеза – по-прежнему гипотеза 2 из приведенного выше списка, а альтернативная – гипотеза 3 из того же списка. Тогда в вероятностной модели управленческой, экономической или производственной ситуации предполагается, что результаты наблюдений образуют выборку из нормального распределения N (m , σ) при некоторых значениях m и σ. Гипотезы записываются так:

Н 0: m = 0, σ = 1

(оба параметра принимают фиксированные значения);

Н 1: m ≠ 0 и/или σ ≠ 1

(т.е. либо m ≠ 0, либо σ ≠ 1, либо и m ≠ 0, и σ ≠ 1).

Пример 13. Пусть Н 0 – гипотеза 1 из приведенного выше списка, а Н 1 – гипотеза 3 из того же списка. Тогда вероятностная модель – та же, что в примере 12,

Н 0: m = 0, σ произвольно;

Н 1: m ≠ 0, σ произвольно.

Пример 14. Пусть Н 0 – гипотеза 2 из приведенного выше списка, а согласно Н 1 результаты наблюдений имеют функцию распределения F (x ), не совпадающую с функцией стандартного нормального распределения Ф(х). Тогда

Н 0: F (х) = Ф(х) при всех х (записывается как F (х) ≡ Ф(х) );

Н 1: F (х 0) ≠ Ф(х 0) при некотором х 0 (т.е. неверно, что F (х) ≡ Ф(х) ).

Примечание. Здесь ≡ - знак тождественного совпадения функций (т.е. совпадения при всех возможных значениях аргумента х ).

Пример 15. Пусть Н 0 – гипотеза 3 из приведенного выше списка, а согласно Н 1 результаты наблюдений имеют функцию распределения F (x ), не являющуюся нормальной. Тогда

При некоторых m , σ;

Н 1: для любых m , σ найдется х 0 = х 0 (m , σ) такое, что .

Пример 16. Пусть Н 0 – гипотеза 4 из приведенного выше списка, согласно вероятностной модели две выборки извлечены из совокупностей с функциями распределения F (x ) и G (x ), являющихся нормальными с параметрами m 1 , σ 1 и m 2 , σ 2 соответственно, а Н 1 – отрицание Н 0 . Тогда

Н 0: m 1 = m 2 , σ 1 = σ 2 , причем m 1 и σ 1 произвольны;

Н 1: m 1 ≠ m 2 и/или σ 1 ≠ σ 2 .

Пример 17. Пусть в условиях примера 16 дополнительно известно, что σ 1 = σ 2 . Тогда

Н 0: m 1 = m 2 , σ > 0, причем m 1 и σ произвольны;

Н 1: m 1 ≠ m 2 , σ > 0.

Пример 18. Пусть Н 0 – гипотеза 5 из приведенного выше списка, согласно вероятностной модели две выборки извлечены из совокупностей с функциями распределения F (x ) и G (x ) соответственно, а Н 1 – отрицание Н 0 . Тогда

Н 0: F (x ) G (x ) , где F (x )

Н 1: F (x ) и G (x ) - произвольные функции распределения, причем

F (x ) G (x ) при некоторых х .

Пример 19. Пусть в условиях примера 17 дополнительно предполагается, что функции распределения F (x ) и G (x ) отличаются только сдвигом, т.е. G (x ) = F (x - а) при некотором а . Тогда

Н 0: F (x ) G (x ) ,

где F (x ) – произвольная функция распределения;

Н 1: G (x ) = F (x - а), а ≠ 0,

где F (x ) – произвольная функция распределения.

Пример 20. Пусть в условиях примера 14 дополнительно известно, что согласно вероятностной модели ситуации F (x ) - функция нормального распределения с единичной дисперсией, т.е. имеет вид N (m , 1). Тогда

Н 0: m = 0 (т.е. F (х) = Ф(х)

при всех х );(записывается как F (х) ≡ Ф(х) );

Н 1: m 0

(т.е. неверно, что F (х) ≡ Ф(х) ).

Пример 21. При статистическом регулировании технологических, экономических, управленческих или иных процессов рассматривают выборку, извлеченную из совокупности с нормальным распределением и известной дисперсией, и гипотезы

Н 0: m = m 0 ,

Н 1: m = m 1 ,

где значение параметра m = m 0 соответствует налаженному ходу процесса, а переход к m = m 1 свидетельствует о разладке.

Пример 22. При статистическом приемочном контроле число дефектных единиц продукции в выборке подчиняется гипергеометрическому распределению, неизвестным параметром является p = D / N – уровень дефектности, где N – объем партии продукции, D – общее число дефектных единиц продукции в партии. Используемые в нормативно-технической и коммерческой документации (стандартах, договорах на поставку и др.) планы контроля часто нацелены на проверку гипотезы

Н 0: p < AQL

Н 1: p > LQ ,

где AQL – приемочный уровень дефектности, LQ – браковочный уровень дефектности (очевидно, что AQL < LQ ).

Пример 23. В качестве показателей стабильности технологического, экономического, управленческого или иного процесса используют ряд характеристик распределений контролируемых показателей, в частности, коэффициент вариации v = σ/M (X ). Требуется проверить нулевую гипотезу

Н 0: v < v 0

при альтернативной гипотезе

Н 1: v > v 0 ,

где v 0 – некоторое заранее заданное граничное значение.

Пример 24. Пусть вероятностная модель двух выборок – та же, что в примере 18, математические ожидания результатов наблюдений в первой и второй выборках обозначим М (Х ) и М (У ) соответственно. В ряде ситуаций проверяют нулевую гипотезу

Н 0: М(Х) = М(У)

против альтернативной гипотезы

Н 1: М(Х) ≠ М(У).

Пример 25 . Выше отмечалось большое значение в математической статистике функций распределения, симметричных относительно 0, При проверке симметричности

Н 0: F (- x ) = 1 – F (x ) при всех x , в остальном F произвольна;

Н 1: F (- x 0 ) ≠ 1 – F (x 0 ) при некотором x 0 , в остальном F произвольна.

В вероятностно-статистических методах принятия решений используются и многие другие постановки задач проверки статистических гипотез. Некоторые из них рассматриваются ниже.

Конкретная задача проверки статистической гипотезы полностью описана, если заданы нулевая и альтернативная гипотезы. Выбор метода проверки статистической гипотезы, свойства и характеристики методов определяются как нулевой, так и альтернативной гипотезами. Для проверки одной и той же нулевой гипотезы при различных альтернативных гипотезах следует использовать, вообще говоря, различные методы. Так, в примерах 14 и 20 нулевая гипотеза одна и та же, а альтернативные – различны. Поэтому в условиях примера 14 следует применять методы, основанные на критериях согласия с параметрическим семейством (типа Колмогорова или типа омега-квадрат), а в условиях примера 20 – методы на основе критерия Стьюдента или критерия Крамера-Уэлча . Если в условиях примера 14 использовать критерий Стьюдента, то он не будет решать поставленных задач. Если в условиях примера 20 использовать критерий согласия типа Колмогорова, то он, напротив, будет решать поставленные задачи, хотя, возможно, и хуже, чем специально приспособленный для этого случая критерий Стьюдента.

При обработке реальных данных большое значение имеет правильный выбор гипотез Н 0 и Н 1 . Принимаемые предположения, например, нормальность распределения, должны быть тщательно обоснованы, в частности, статистическими методами. Отметим, что в подавляющем большинстве конкретных прикладных постановок распределение результатов наблюдений отлично от нормального .

Часто возникает ситуация, когда вид нулевой гипотезы вытекает из постановки прикладной задачи, а вид альтернативной гипотезы не ясен. В таких случаях следует рассматривать альтернативную гипотезу наиболее общего вида и использовать методы, решающие поставленную задачу при всех возможных Н 1 . В частности при проверке гипотезы 2 (из приведенного выше списка) как нулевой следует в качестве альтернативной гипотезы использовать Н 1 из примера 14, а не из примера 20, если нет специальных обоснований нормальности распределения результатов наблюдений при альтернативной гипотезе.

Предыдущая

Полученные в исследованиях выборочные данные всегда ог­раничены и носят в значительной мере случайный характер. Именно поэтому для анализа таких данных и используется мате­матическая статистика, позволяющая обобщать закономерности, полученные на выборке, и распространять их на всю генераль­ную совокупность.

Подчеркнем еще раз, что полученные в результате эксперимента на какой-либо выборке данные служат основанием для суждения о генеральной совокупности. Однако в силу действия случайных вероятностных причин оценка параметров генеральной совокупности, сделанная на основании экспериментальных (выборочных) данных, всегда будет сопровождаться погрешностью, и поэтому подобного рода оценки должны рассматриваться как предположительные, а не как окончательные утверждения.

Как указывает Г.В. Суходольский: «Под статистической гипотезой обычно понимают формальное предположение о том, что сходство (или различие) некоторых параметрических или функциональных характеристик случайно или, наоборот, неслучайно». Подобные предположения о свойствах и параметрах генеральной совокупности, различии выборок или зависимости между признаками получили названиестатистических гипотез.

Сущность проверки статистической гипотезы заключается в том, чтобы установить, согласуются ли экспериментальные данные и выдвинутая гипотеза, допустимо ли отнести расхождение между гипотезой и результатом статистического анализа экспериментальных данных за счет случайных причин? Таким образом, статистическая гипотеза - это научная гипотеза, допускающая статистическую проверку, а математическая статистика - это научная дисциплина, задачей которой и является научно обоснованная проверка статистических гипотез.

При проверке статистических гипотез используются два по­нятия: так называемая нулевая (обозначение Н 0 ) и альтернативная гипотеза (обозначение Н 1 ).

При сравнении распределений принято считать, что нулевая гипотеза Н 0 - это гипотеза о сходстве, а альтернативная Н 1 - гипотеза о различии. Таким об­разом, принятие нулевой гипотезы Н 0 свидетельствует об отсут­ствии различий, а гипотезы Н 1 - о наличии различий.

Например, две выборки извлечены из нормально рас­пределенных генеральных совокупностей и перед нами стоит задача сравнить эти выборки. Одна выборка имеет параметры и σ 1 , а другая параметры и σ 2 . Нуле­вая гипотеза Н 0 исходит из предположения о том, что = иσ 1 = σ 2 , то есть разность двух средних =0 и разность двух стандартных отклонений σ 1 σ 2 ,=0 (отсюда и название гипотезы - нулевая).

Принятие альтернативной гипотезы Н 1 свидетельствует о наличии различий и исходит из предположения, что ≠0 и σ 1 σ 2 ,≠0.


Очень часто альтернативная гипотеза носит название экспериментальной гипотезы , если в исследовании ставится задача доказать существование различий между выборками. Если же исследователь хочет доказать именно отсутствие различий, то экспериментальной гипотезой является нулевая гипотеза.

При сравнении выборок альтернативные статистические гипотезы могут быть направленными и ненаправленными.

Если мы заметили, что в одной выборке индивидуальные значения испытуемых по какому-либо признаку, выше, а в другой - ниже, то для проверки различий между выборками формулируется направленная гипотеза . Если мы ходим доказать, что в одной группе под влиянием каких-то экспериментальных воздействий произошли более выраженные изменения, необходимо также сформулировать направленную гипотезу. Формально она записывается так Н 1: х 1 превышает х 2 . Нулевая гипотеза при этом выглядит следующим образомН 0: х 1 не превышает х 2 .

Если мы хотим доказать, что различаются формы распределения, то формулируются ненаправленные гипотезы . Формально они записывается так Н 1: х 1 отличается от х 2 . Нулевая гипотеза Н 0: х 1 не отличается от х 2 .

Вообще говоря, при принятии или отвержении гипотез воз­можны различные варианты.

При проверке гипотезы экспериментальные данные могут противоречить гипотезе Н 0 , тогда эта гипотеза отклоняется. В противном случае, т.е. если экспериментальные данные согласу­ются с гипотезой Н 0 , она не отклоняется. Часто в таких случаях говорят, что гипотеза Н 0 принимается (хотя такая формулировка не совсем точна, однако она широко распространена). Отсюда видно, что статисти­ческая проверка гипотез, основанная на экспериментальных, выборочных данных, неизбежно связана с риском (вероятностью) принять ложное решение. При этом возможны ошибки двух родов. Ошибка первого рода произойдет, когда будет принято решение отклонить гипотезу Н 0 , хотя в действительности она оказывается верной. Ошибка второго рода произойдет когда бу­дет принято решение не отклонять гипотезу Н 0 , хотя в действительности она будет неверна. Очевидно, что и правильные выводы могут быть приняты также в двух случаях. Вышесказанное можно представить в виде таблицы 25.

В результате изучения данной главы студент должен:

знать

  • что такое статистическая гипотеза;
  • соотношение теоретических, экспериментальных и статистических гипотез;
  • различия между нулевой и альтернативной гипотезами;
  • логику оценки, принятия и отвержения статистических гипотез;
  • понятия ошибки первого и второго рода, статистической значимости (надежности);
  • различия между параметрической и непараметрической статистикой, возможности и ограничения этих двух видов статистических критериев;

уметь

  • проверять простейшие гипотезы о среднем с помощью t -теста Стьюдента для парных (связных) и непарных (независимых) выборок;
  • оценивать две выборки на однородность с помощью t -теста Стьюдента и F -теста Фишера;
  • строить доверительные интервалы для оцениваемых параметров;

владеть

  • методическим аппаратом и базовыми навыками выдвижения и проверки статистических гипотез;
  • навыками оценки статистических гипотез и построения доверительных интервалов.

Общая стратегия

Вы уже знаете, что в статистическом анализе принято различать понятия "параметр" и "статистика". Эти различия подробно обсуждались в гл. 1; в табл. 2.1 резюмируется состоявшееся обсуждение.

Вспомним, что всякое распределение может быть охарактеризовано теми или иными теоретическими параметрами. Математическое ожидание, дисперсия, асимметрия, эксцесс представляют собой примеры таких параметров распределения случайной величины в генеральной совокупности. Все они, отметим еще раз этот важный факт, представляют собой теоретические величины, которые почти никогда не бывают известны на практике. В практической деятельности исследователя их можно лишь оценить с той или иной степенью точности путем вычисления различных статистических величин, которые не всегда оказываются равными теоретическим величинам параметров, а также и друг другу, в чем мы уже убедились в параграфе 1.4, рассматривая практические примеры оценки различных параметров распределения такого свойства личности, как феминность – маскулинность.

Таблица 2.1

Соотношение параметров и статистики

И это неудивительно: ведь статистика отражает поведение случайных величин лишь в сформированной экспериментатором выборке, а не в самой генеральной совокупности. Поэтому у экспериментатора может возникнуть вопрос, каким образом вычисленные статистики соотносятся с теоретическими параметрами распределения. Иными словами, экспериментатор может заинтересоваться тем, действительно ли имеющиеся у него в распоряжении выборочные данные извлечены из генеральной совокупности, характеризующейся предполагаемыми в теории параметрами распределения. Чтобы ответить на этот вопрос, экспериментатор выдвигает и проверяет статистические гипотезы.

Статистическими гипотезами называют предположения о возможных значениях параметров распределения случайной величины в генеральной совокупности. Проверка и анализ статистических гипотез осуществляются в результате сбора и построения статистики. Инструментом в такой работе выступают статистические тесты, или критерии, каждый из которых представляет собой некоторый набор стандартизированных правил. На основе этих правил принимается решение об истинности или ложности статистической гипотезы.

Рассмотрим еще раз пример с подбрасыванием монеты. Можно предполагать, что вероятность выпадения "орла" при бросании нормальной, нефальшивой и неповрежденной, монеты равна 50%. Это значит, что математическое ожидание такого события при 100-кратном бросании монеты окажется равным 50. Проверка этой гипотезы будет состоять в том, чтобы провести подобного рода испытание, оценить в результате этого интересующий нас параметр путем вычисления соответствующей статистики и с помощью этой статистики проверить достоверность выдвинутой гипотезы. Например, проведя 100 испытаний монеты, мы можем убедиться в том, что каждая сторона действительно выпала по 50 раз. Однако вероятно, что результат такого испытания все же будет несколько отличаться от теоретически предполагаемого. Иными словами, даже если "орел" выпадет немного меньше или немного больше 50 раз, мы вряд ли будем иметь основания полагать, что монета фальшивая. Подозрительной будет ситуация, когда такое отклонение от теоретически предполагаемых величин достигнет бо́льших значений, например, когда "орел" при 100 испытаниях монеты не выпадет ни разу. Такой расклад, по-видимому, представляется маловероятным при условии, что с монетой все в порядке.

Итак, ясно, что если в ходе 100-кратного бросания монеты "орел" выпал ровно 50 раз, с монетой все в порядке. Если "орел" не выпал ни разу, есть основания предполагать, что с монетой что-то не то. Но где та грань, которая отделяет положительные и отрицательные выводы? Этот вопрос имеет отношение к выбираемому критерию принятия решения. Именно такими критериями и выступают разработанные в математической статистике для проверки статистических гипотез статистические тесты, которые поэтому часто называют статистическими критериями.

Таким образом, проверка статистических гипотез осуществляется в результате оценки вероятности случайного события, в качестве которого рассматривается величина статистики. Если эта вероятность оказывается очень незначительной при условии истинности выдвинутой гипотезы, проверяемая статистическая гипотеза отвергается, в противном случае гипотеза принимается.

Трудность этой процедуры, однако, может состоять в том, что мы можем заранее не знать конкретного значения параметра распределения анализируемой случайной величины. Например, в случае с монетой можно предположить, что монета фальшивая, и, следовательно, вероятность выпадения "орла" в той или иной степени отличается от 50%-ного. В этом случае, проведя серию испытаний, мы не сможем оценить степень отличия полученной статистики, характеризующей величину математического ожидания анализируемого события, от действительного его значения. И тогда проверка статистической гипотезы может показаться невозможной. Выход из этой ситуации может, однако, состоять в том, чтобы оценить вероятность гипотезы, противоположной выдвинутой. Иными словами, в данном случае можно, например, выдвинуть гипотезу о равенстве теоретической вероятности 50%. Если эта гипотеза оказывается неверной, принимается альтернативная гипотеза.

Действительно, при проверке статистических гипотез исследователь всегда имеет дело не с одной, а с двумя гипотезами, которые обозначаются как Н 0 и Н 1. Одна из этих гипотез называется нулевой, другая – альтернативной, т.е. опровергающей нулевую.

Нулевая гипотеза Н 0 всегда конкретна. Она всегда утверждает какое-то конкретное значение параметра распределения. Например, гипотеза, касающаяся математического ожидания, может формулироваться следующим образом: μ = А, где А – некоторое конкретное значение μ, а гипотеза, касающаяся равенства двух величии дисперсии, – σ1 = σ2.

Альтернативная гипотеза Н 1 формулируется всегда менее конкретно, например: μ > А ; * σ2 и т.п. Но, как правило, оказывается так, что экспериментатора интересует не конкретная нулевая гипотеза Н 0, а как раз менее конкретная альтернативная гипотеза Н 1, так как именно она в большей степени соответствует проверяемой им в эксперименте научной гипотезе.

Проводя эмпирическую оценку теоретического параметра, экспериментатор определяет статистическую значимость полученного результата, принимая за основу предположение об истинности Н 0. Статистическая значимость представляет собой вероятность того, что в бесконечном числе экспериментов, полностью воспроизводящих условия проведенного эксперимента, мы получим то же или еще большее значение построенной статистики. Если вероятность получить такое и еще большее значение статистики в бесконечном числе экспериментов с теми же условиями при том, что нулевая гипотеза истинна, оказывается небольшой, экспериментатор отказывается от нулевой гипотезы в пользу альтернативной.

Наглядно описанная логика представлена на рис. 2.1. Как очевидно, здесь выдвигаются две альтернативных гипотезы. Одна из них конкретная и предполагает равенство математического ожидания нулю. Эта гипотеза обозначена как Н 0. Соответствующая ей кривая описывает распределение случайной величины Ζ, предсказываемое этой гипотезой. Вторая гипотеза, обозначенная как Н 1, менее конкретная. Она лишь утверждает, что величина математического ожидания должна превышать нулевое значение. В принципе существует бесконечное множество кривых, описывающих распределения, соответствующие этой гипотезе. Приведенная кривая представляет собой одну из возможных. Величина Ζ эксп характеризует значение статистики, оценивающей теоретический параметр μ в эксперименте. Это то, что экспериментатор имеет в своем распоряжении, то, что ему удалось получить, проведя сбор эмпирических данных. Например, это может быть величина среднего арифметического по выборке. Тогда проверка выдвинутых статистических гипотез должна состоять в том, чтобы попытаться оценить, насколько вероятно в другом таком же эксперименте получить ту же величину Zэксп или даже еще бо́льшую при условии истинности нулевой гипотезы. Очевидно, что эта вероятность равна площади под кривой распределения, предполагаемой этой гипотезой. Эта площадь слева ограничена вычисленной статистикой, справа – не ограничена. Такая площадь, как мы помним (см. параграф 1.2), называется квантилем распределения. Она может быть определена следующим образом:

Рис. 2.1.

Необходимая для принятия или отвержения гипотезы величина квантиля р в этом уравнении представляет собой так называемый уровень значимости вычисленной статистики Zэксп. Чем больше эта величина, тем с большей вероятностью полученные в эксперименте данные описываются распределением f Ho(Z ), т.е. распределением, предсказанным гипотезой Н 0. Напротив, чем меньше значение р, тем меньше вероятность того, что эмпирические данные действительно соответствуют распределению f H0(Z), и тем больше вероятность того, что они описываются распределением, предполагающим более высокое значение μ. Таким образом, оценивая значение р, можно принять решение в пользу одной из двух выдвинутых гипотез.

Гипотеза Н 0 может быть принята, если величина квантиля, определяющего статистическую значимость эмпирического значения X, оказывается достаточно большой. Альтернативная гипотеза Н 1, принимается, если величина квантиля, который задает статистическую значимость полученного в эксперименте результата, оказывается пренебрежительно малой. Проблема, однако, состоит в том, какую величину квантиля, задающего статистическую значимость, считать достаточно большой, какую – пренебрежительно малой. Чтобы решить эту проблему, рассмотрим подробнее, какие возможности имеются у экспериментатора, оценивающего статистические гипотезы (табл. 2.2).

Понятно, что выдвинутые статистические гипотезы могут быть либо верными, либо неверными. Поскольку гипотезы Н 0 и Н 1 являются альтернативными, т.е. они исключают друг друга, имеют место лишь два гипотетических случая, характеризующих истинность или ложность рассматриваемых гипотез: либо Н 0 окажется верной, а Н 1 соответственно неверной, либо наоборот. Поскольку экспериментатор, оценивающий гипотезы, никогда не знает, какая из гипотез верна, сто решение принять или отвергнут гипотезу Н 0 никак не связано с ее истинностью или ложностью – ведь именно их он и пытается установить. Таким образом, в ходе проверки статистических гипотез возможно четыре исхода, благоприятными из которых для экспериментатора могут считаться лишь два, независимо от того, какую из гипотез на самом деле хочет доказать исследователь.

Таблица 2.2

Матрица исходов в оценке статистических гипотез

Если гипотеза Н 0 верна и она принимается в результате статистического анализа, экспериментатор не совершает ошибки. И это благоприятный исход для исследователя, даже если он хотел бы принять альтернативную гипотезу. Также экспериментатор нс совершает ошибки, когда он отвергает гипотезу Н 0, которая на самом деле является неверной. Однако может случиться так, что нулевая гипотеза в действительности верна, а экспериментатор ее все же отвергает. В этом случае он совершает ошибку, которую принято называть ошибкой первого рода или α(альфа )-ошибкой. Ошибкой второго рода, или β(бета )-ошибкой, называется исход, при котором экспериментатор принимает нулевую гипотезу, которая на самом деле оказывается неверной.

Ясно, что чем больше вероятность, определяющая статистическую значимость полученного в эксперименте результата, при которой экспериментатор готов отказаться от нулевой гипотезы в пользу альтернативной, тем больше вероятность ошибки первого рода и меньше вероятность ошибки второго рода (рис. 2.2). Напротив, уменьшая значение вероятности, при которой экспериментатор отказывается от нулевой гипотезы, он тем самым рискует с большей вероятностью совершить ошибку второго рода, но тем самым в большей степени ограждает себя от ошибки первого рода. Таким образом, вопрос о том, при каком уровне значимости гипотеза Н 0 может быть отвергнута или принята, связан на самом деле с тем, какая из двух возможных ошибок менее важна для экспериментатора. Применяя более консервативную стратегию проверки статистической гипотезы, экспериментатор пренебрегает опасностью ошибки второго рода. Применяя более радикальный вариант действия, экспериментатор как бы забывает об ошибке первого рода.

Рис. 2.2.

Если принятие статистической гипотезы подразумевает какие-либо важные социальные последствия, можно применить более консервативную стратегию ее оценки. Если серьезные последствия могут наступить вследствие неприятия статистической гипотезы, можно действовать менее консервативно.

Например, пусть рассматривается вопрос об определении умственной отсталости конкретного ребенка. В ходе психологического обследования установлено, что его коэффициент интеллекта ниже среднего значения для данной популяции испытуемых. Таким образом, возникло предположении о недостаточном интеллектуальном развитии этого ребенка и необходимости в связи с этим направления его в специальный интернат для умственно отсталых. Для проверки этой гипотезы были сформулированы две альтернативные статистические гипотезы, одна из которых предполагает, что полученные при обследовании данные характеризуют обычное популяционное распределение с математическим ожиданием, равным границе, определяющей умственную отсталость, скажем, 75 баллам (гипотеза Н 0), а вторая предполагает более низкое значение математического ожидания, т.е. математическое ожидание меньше заданной границы (гипотеза Н 1). Далее предположим, что в ходе оценки статистической значимости эмпирического показателя интеллектуального развития ребенка выяснилось, что вероятность получить при другом случайном испытании тот же результат или даже еще более низкий составляет не более одного шанса из 20. Возникает вопрос: можно ли на основании данного результата судить о недостаточной эмпирической обоснованности нулевой гипотезы и, следовательно, отказаться от нее в пользу альтернативной гипотезы Н 1? Ясно, что ответ на этот вопрос в значительной степени будет зависеть от того, какого рода ошибочные действия можно считать более приемлемыми. Если мы убеждены в том, что пребывание нормального ребенка хоть и с низкими умственными способностями в интернате для умственно отсталых лучше, чем обучение умственно отсталого в нормальной школе, мы можем принять одно решение, касающееся установления границ уровня значимости, если мы считаем по-другому, необходимо принять другое решение.

К счастью, исследователь, как правило, избавлен от необходимости разрешать проблему такого рода. Дело в том, что статистически невозможно обосновать оптимальный уровень значимости, который можно бы было принять в качестве эталонного при выборе статистических гипотез. Вместе с тем существуют некоторые квазистатистические соглашения, принимаемые по умолчанию (табл. 2.3). Эмпирический результат считается статистически значимым для отказа от нулевой гипотезы, если вероятность получить такой же или больший (меньший) результат при другом случайном испытании составляет менее одного шанса из 20, т.е. тогда, когда значение р оказывается меньше 0,05. Если значение р оказывается меньше 0,01, то полученный результат считается высокозначимым для отказа от нулевой гипотезы. В случае, когда значение р превышает 0,10, считается, что в эксперименте не установлены статистически значимые отличия от теоретического параметра, предполагаемого нулевой гипотезой. Если полученное значение р оказывается между величиной 0,10 и 0,05, результат считается неопределенным. Говорят, что он находится на границе уровней значимости. По-другому такой результат называют маргиналъно значимым.

Таблица 2.3

Стандартные величины квантилей, определяющее принятие статистического решения

Описанная стратегия проверки и принятия гипотез является универсальной и наиболее распространенной. Более консервативная стратегия может состоять в том, чтобы в качестве надежного и высоконадежного уровней принять значения вероятностей соответственно 0,01 и 0,001, а для ненадежного уровня значение вероятности установить в 0,05 (О. Ю. Ермолаев, ). Тогда маргинально значимым результатом окажется тот, который находится в диапазоне от 0,01 до 0,05. Однако такая стратегия в психологических исследованиях применяется все же редко.

В любом случае необходимо иметь в виду, что результаты анализа статистических гипотез не могут считаться достаточными для оценки экспериментальных гипотез, если они берутся сами но себе, вне связи со всей экспериментальной ситуацией.

Статистические гипотезы нельзя путать с экспериментальными и теоретическими гипотезами. Теоретические гипотезы отражают характер связей и закономерностей исследуемых явлений. Экспериментальные гипотезы выдвигаются на основе изучения таких теоретических знаний в данной области и конкретизируют таким образом сами теоретические гипотезы. Так же как и статистические гипотезы, они предполагают одновременную формулировку конкурирующих гипотез как отрицания существования предполагаемой каузальной зависимости. Благодаря этому факту исследуемая эмпирическая закономерность может допускать разные причинные интерпретации, называемые конкурирующими гипотезами.

В отличие от экспериментальных, статистические гипотезы являются лишь инструментом оценки собранных в ходе эксперимента данных и не предполагают изначально какой-либо эмпирической закономерности. Результат их проверки носит лишь статистический характер и поэтому не предполагает автоматического принятия или отвержения как экспериментальных, так и тем более теоретических гипотез.

Вверх