Нулевая гипотеза в статистике: пример. Проверка нулевой гипотезы. Статистические гипотезы и критерии

На разных стадиях статистического исследования и моделирования возникает необходимость в формулировке и экспериментальной проверке некоторых предположений (гипотез) относительно природы и величины неизвестных параметров анализируемой генеральной совокупности (совокупностей). Например, исследователь высказывает предположение: "выборка извлечена из нормальной генеральной совокупности" или "генеральная средняя анализируемой совокупности равна пяти". Такие предположения называются статистическими гипотезами.

Сопоставление высказанной гипотезы относительно генеральной совокупности с имеющимися выборочными данными, сопровождаемое количественной оценкой степени достоверности получаемого вывода, осуществляется с помощью того или иного статистического критерия и называется проверкой статистических гипотез .

Выдвинутая гипотеза называется нулевой (основной) . Ее принято обозначать Н 0 .

По отношению к высказанной (основной) гипотезе всегда можно сформулировать альтернативную (конкурирующую) , противоречащую ей. Альтернативную (конкурирующую) гипотезу принято обозначать Н 1 .

Цель статистической проверки гипотез состоит в том, чтобы на основании выборочных данных принять решение о справедливости основной гипотезы Н 0 .

Если выдвигаемая гипотеза сводится к утверждению о том, что значение некоторого неизвестного параметра генеральной совокупности в точности равно заданной величине, то эта гипотеза называется простой , например: "среднедушевой совокупный доход населения России составляет 650 рублей в месяц"; "уровень безработицы (доля безработных в численности экономически активного населения) в России равна 9%" . В других случаях гипотеза называется сложной .

В качестве нулевой гипотезы Н 0 принято выдвигать простую гипотезу, т.к. обычно бывает удобнее проверять более строгое утверждение.

Гипотезы о виде закона распределения исследуемой случайной величины;

Гипотезы о числовых значениях параметров исследуемой генеральной совокупности;

Гипотезы об однородности двух или нескольких выборок или некоторых характеристик анализируемых совокупностей;

Гипотезы об общем виде модели, описывающей статистическую зависимость между признаками и др.

Так как проверка статистических гипотез осуществляется на основании выборочных данных, т.е. ограниченного ряда наблюдений, решения относительно нулевой гипотезы Н 0 имеют вероятностный характер. Другими словами, такое решение неизбежно сопровождается некоторой, хотя возможно и очень малой, вероятностью ошибочного заключения как в ту, так и в другую сторону.



Так, в какой-то небольшой доле случаев α нулевая гипотеза Н 0 может оказаться отвергнутой, в то время как в действительности в генеральной совокупности она является справедливой. Такую ошибку называют ошибкой первого рода . А ее вероятность принято называтьуровнем значимости и обозначать α .

Наоборот, в какой-то небольшой доле случаев β нулевая гипотеза Н 0 принимается, в то время как на самом деле в генеральной совокупности она ошибочна, а справедлива альтернативная гипотеза Н 1 . Такую ошибку называют ошибкой второго рода . Вероятность ошибки второго рода принято обозначать β . Вероятность 1 - β называют мощностью критерия .

При фиксированном объеме выборки можно выбрать по своему усмотрению величину вероятности только одной из ошибок α или β . Увеличение вероятности одной из них приводит к снижению другой. Принято задавать вероятность ошибки первого рода α - уровень значимости. Как правило, пользуются некоторыми стандартными значениями уровня значимости α : 0,1; 0,05; 0,025; 0,01; 0,005; 0,001. Тогда, очевидно, из двух критериев, характеризующихся одной и той же вероятностью α отклонить правильную в действительности гипотезу Н 0 , следует принять тот, который сопровождается меньшей ошибкой второго рода β , т.е. большей мощностью. Снижения вероятностей обеих ошибок α и β можно добиться путем увеличения объема выборки.

Правильное решение относительно нулевой гипотезы Н 0 также может быть двух видов:

Будет принята нулевая гипотеза Н 0 , тогда как и на самом деле в генеральной совокупности верна нулевая гипотеза Н 0 ; вероятность такого решения 1 - α;

Нулевая гипотеза Н 0 будет отклонена в пользу альтернативной Н 1, тогда как и на самом деле в генеральной совокупности нулевая гипотеза Н 0 отклоняется в пользу альтернативной Н 1 ; вероятность такого решения 1 - β - мощность критерия.

Результаты решения относительно нулевой гипотезы можно проиллюстрировать с помощью таблицы 8.1.

Таблица 8.1

Проверка статистических гипотез осуществляется с помощью статистического критерия (назовем его в общем виде К ), являющего функцией от результатов наблюдения.

Статистический критерий - это правило (формула), по которому определяется мера расхождения результатов выборочного наблюдения с высказанной гипотезой Н 0 .

Статистический критерий, как и всякая функция от результатов наблюдения, является случайной величиной и в предположении справедливости нулевой гипотезы Н 0 подчинена некоторому хорошо изученному (и затабулированному) теоретическому закону распределения с плотностью распределения f(k) .

Выбор критерия для проверки статистических гипотез может быть осуществлен на основании различных принципов. Чаще всего для этого пользуются принципом отношения правдоподобия , который позволяет построить критерий наиболее мощный среди всех возможных критериев. Суть его сводится к выбору такого критерия К с известной функцией плотности f(k) при условии справедливости гипотезы Н 0 , чтобы при заданном уровнем значимости α можно было бы найти критическую точку К кр .распределения f(k) , которая разделила бы область значений критерия на две части: область допустимых значений, в которой результаты выборочного наблюдения выглядят наиболее правдоподобными, и критическую область, в которой результаты выборочного наблюдения выглядят менее правдоподобными в отношении нулевой гипотезы Н 0 .

Если такой критерий К выбран, и известна плотность его распределения, то задача проверки статистической гипотезы сводится к тому, чтобы при заданном уровне значимости α рассчитать по выборочным данным наблюдаемое значение критерия К набл. и определить является ли оно наиболее или менее правдоподобным в отношении нулевой гипотезы Н 0 .

Проверка каждого типа статистических гипотез осуществляется с помощью соответствующего критерия, являющегося наиболее мощным в каждом конкретном случае. Например, проверка гипотезы о виде закона распределения случайной величины может быть осуществлена с помощью критерия согласия Пирсона χ 2 ; проверка гипотезы о равенстве неизвестных значений дисперсий двух генеральных совокупностей - с помощью критерия F - Фишера; ряд гипотез о неизвестных значениях параметров генеральных совокупностей проверяется с помощью критерия Z - нормальной распределенной случайной величины и критерия T - Стьюдента и т.д.

Значение критерия, рассчитываемое по специальным правилам на основании выборочных данных, называется наблюдаемым значением критерия (К набл. ).

Значения критерия, разделяющие совокупность значений критерия на область допустимых значений (наиболее правдоподобных в отношении нулевой гипотезы Н 0 ) и критическую область (область значений, менее правдоподобных в отношении таблицам распределения случайной величины К , выбранной в качестве критерия, называются критическими точками(К кр.).

Областью допустимых значений (областью принятия нулевой гипотезы Н 0) К Н 0 не отклоняется.

Критической областью называют совокупность значений критерия К , при которых нулевая гипотеза Н 0 отклоняется в пользу конкурирующей Н 1 .

Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области .

Если конкурирующая гипотеза - правосторонняя, например, Н 1: а > а 0 , то и критическая область - правосторонняя (рис 1). При правосторонней конкурирующей гипотезе критическая точка (К кр. правосторонняя) принимает положительные значения.

Если конкурирующая гипотеза - левосторонняя, например, Н 1: а < а 0 , то и критическая область - левосторонняя (рис 2). При левосторонней конкурирующей гипотезе критическая точка принимает отрицательные значения (К кр. левосторонняя) .

Если конкурирующая гипотеза - двусторонняя, например, Н 1: а ¹ а 0 , то и критическая область - двусторонняя (рис 3). При двусторонней конкурирующей гипотезе определяются две критические точки (К кр. левосторонняя и К кр. правосторонняя) .


Область допустимых Критическая

значений область

СТАТИСТИЧЕСКИЕ ГИПОТЕЗЫ

Полученные в экспериментах выборочные данные всегда ограничены и носят в значительной мере случайный характер. Именно поэтому для анализа таких данных и используется мате­матическая статистика, позволяющая обобщать закономерности, полученные на выборке, и распространять их на всю генераль­ную совокупность.

Полученные в результате экспери­мента на какой-либо выборке данные служат основанием для суждения о генеральной совокупности. Однако в силу действия случайных вероятностных причин оценка параметров генераль­ной совокупности, сделанная на основании экспериментальных (выборочных) данных, всегда будет сопровождаться погрешнос­тью, и поэтому подобного рода оценки должны рассматриваться как предположительные, а не как окончательные утверждения. Подобные предположения о свойствах и параметрах генеральной совокупности получили название статистических гипотез . Как указывает Г.В. Суходольский: «Под статистической гипотезой обычно понимают формальное предположение о том, что сход­ство (или различие) некоторых параметрических или функцио­нальных характеристик случайно или, наоборот, неслучайно» .

Сущность проверки статистической гипотезы заключается в том, чтобы установить, согласуются ли экспериментальные дан­ные и выдвинутая гипотеза, допустимо ли отнести расхождение между гипотезой и результатом статистического анализа экспериментальных данных за счет случайных причин. Таким образом, статистическая гипотеза – это научная гипотеза, допускающая статистическую проверку, а математическая статистика – это научная дисциплина, задачей которой является научно обосно­ванная проверка статистических гипотез.

Статистические гипотезы подразделяются на нулевые и альтернативные, направленные и ненаправленные.

Нулевая гипотеза (H 0 ) – это гипотеза об отсутствии различий. Если мы хотим доказать значимость различий, то нулевую гипотезу требуется опровергнуть , иначе требуется подтвердить .

Альтернатив­ная гипотеза (Н 1 ) – гипотеза о значимости различий. Это то, что мы хотим до­казать, поэтому иногда ее называют экспериментальной гипотезой.

Бывают задачи, когда мы хотим доказать как раз незначимость различий, то есть подтвердить нулевую гипотезу. Например, если нам нужно убедиться, что разные испытуемые получают хотя и различные, но уравновешенные по трудности заданияили что экспериментальная и контрольная выборки не различаются между собой по каким-то значи­мым характеристикам. Однако чаще нам все-таки требуется доказать значимость различий, ибо они более информативны для нас в поиске нового.

Нулевая и альтернативная гипотезы могут быть направленными и ненаправленными.

Направленные гипотезы – если предполагается в одной группе значения признака выше, а в другой ниже:

Н 0: Х 1 не превышает Х 2 ,

Н 1: Х 1 превышает Х 2 .

Ненаправленные гипотезы – если предполагается что различаются формы распределения признака в группах:

Н 0: Х 1 не отличается от Х 2 ,

Н 1: Х 1 отличается Х 2 .

Если мы заметили, что в одной из групп индивидуальные значения испытуемых по какому-либо признаку, например по социальной активности, выше, а в другой ниже, то для проверки значимости этих различий нам необходимо сформулировать направленные гипотезы.

Если мы хотим доказать, что в группе А под влиянием каких-то экспериментальных воздействий произошли более выраженные изменения, чем в группе Б , то нам тоже необходимо сформулировать направленные гипотезы.

Если же мы хотим доказать, что различаются формы распределения признака в группах А и Б , то формулируются ненаправленные гипотезы.

Проверка гипотез осуществляется с помощью критериев статистической оценки различий.

Принимаемый вывод носит название статистического решения. Подчеркнем, что такое решение всегда вероятностно. При проверке гипотезы экспериментальные данные могут противоречить гипотезе Н 0 , тогда эта гипотеза отклоняется. В противном случае, т.е. если экспериментальные данные согласуются с гипотезой Н 0 , она не отклоняется. Часто в таких случаях говорят, что гипотеза Н 0 принимается. Отсюда видно, что статистическая проверка гипотез, основанная на экспериментальных выборочных данных, неизбежно связана с риском (вероятностью) принять ложное решение. При этом возможны ошибки двух родов. Ошибка первого рода произойдет, когда будет принято решение отклонить гипотезу Н 0 , хотя в действительности она оказывается верной. Ошибка второго рода произойдет, когда будет принято решение не отклонять гипотезу Н 0 , хотя в действительности она будет неверна. Очевидно, что и правильные выводы могут быть приняты также в двух случаях. В таблице 7.1 обобщено вышесказанное.

Таблица 7.1

Не исключено, что психолог может ошибиться в своем статистическом решении; как видим из таблицы 7.1, эти ошибки могут быть только двух родов. Поскольку исключить ошибки при принятии статистических гипотез невозможно, то необходимо минимизировать возможные последствия, т.е. принятие неверной статистической гипотезы. В большинстве случаев единственный путь минимизации ошибок заключается в увеличении объема выборки.

СТАТИСТИЧЕСКИЕ КРИТЕРИИ

Статистический критерий – это решающее правило, обеспечиваю­щее надежное поведение, то есть принятие истинной и отклонение ложной гипотезы с высокой вероятностью .

Статистические критерии обозначают также метод расчета опре­деленного числа и само это число.

Когда мы говорим, что достоверность различий определялась по критерию j * (критерий – угловое преобразование Фишера), то имеем в виду, что использовали метод j * для расчета определенного числа.

По соотношению эмпирического и критического значений крите­рия мы можем судить о том, подтверждается ли или опровергается нулевая гипотеза.

В большинстве случаев для того, чтобы мы признали различия значимыми, необходимо, чтобы эмпирическое значение критерия пре­вышало критическое, хотя есть критерии (например, критерий Манна-Уитни или критерий знаков), в которых мы должны придерживаться противоположного правила.

В некоторых случаях расчетная формула критерия включает в се­бя количество наблюдений в исследуемой выборке, обозначаемое как n . В этом случае эмпирическое значение критерия одновременно является тестом для проверки статистических гипотез. По специальной таблице мы определяем, какому уровню статистической значимости различий соответствует данная эмпирическая величина. Примером такого крите­рия является критерий j * , вычисляемый на основе углового преобразо­вания Фишера.

В большинстве случаев, однако, одно и то же эмпирическое зна­чение критерия может оказаться значимым или незначимым в зависи­мости от количества наблюдений в исследуемой выборке (n ) или от так называемого количества степеней свободы, которое обозначается как v или как df.

Число степеней свободы v равно числу классов вариационного ряда минус число условий, при которых он был сформирован. К числу таких условий относятся объем выборки (n ), средние и дисперсии.

Допустим, группу из 50 человек разделили на три класса по принципу:

Умеет работать на компьютере;

Умеет выполнять лишь определенные опера­ции;

Не умеет работать на компьютере.

В первую и вторую группы попало по 20 человек, в третью – 10.

Мы ограничены одним условием – объемом выборки. Поэтому, даже если мы потеряли данные о том, сколько человек не умеют рабо­тать на компьютере, мы можем определить это, зная, что в первом и втором классах – по 20 испытуемых. Мы не свободны в определении количества испытуемых в третьем разряде, «свобода» простирается только на первые две ячейки классификации:

Формулирование гипотез систематизирует предположения исследователя и представляет их в четком, лаконичном виде. Решение, которое требуется принять исследователю, касается истинности или ложности статистической гипотезы. Различают два вида гипотез: научные и статистические. Научная гипотеза – это предполагаемое решение проблемы (формулируется как теорема). Статистическая гипотеза – просто утверждение относительно неизвестного параметра генеральной совокупности (свойстве случайной величины или событии), которое формулируется для проверки надежности связи и которое можно проверить по известным выборочным статистикам (результатам исследования, имеющимся эмпирическим данным) .

Статистические гипотезы подразделяются на нулевые и альтернативные, направленные и ненаправленные. Нулевая гипотеза (Н 0) это гипотеза об отсутствии различий, отсутствие влияния фактора, отсутствие эффекта и т.п . Это то, что предполагается опровергнуть, если перед нами стоит задача доказать значимость различий. Альтернативная гипотеза (Н 1) это гипотеза о значимости различий. Это то, что предполагается доказать, поэтому ее иногда называют экспериментальной или рабочей гипотезой.

Сама же процедура обработки полученных количественных данных, заключающаяся в вычислении некоторых статистических характеристик и оценок, позволяющих проверить нулевую гипотезу называется статистическим анализом .

Нулевая и альтернативная гипотезы могут быть направленными и ненаправленными. Гипотеза называется направленной , если она содержит указание на направление отличий. Такие гипотезы следует формулировать, например, в том случае, если в одной из групп индивидуальные значения испытуемых по какому-либо признаку выше, а в другой ниже, или необходимо доказать, что в одной из групп под влиянием каких-либо экспериментальных воздействий произошли более выраженные изменения, чем в другой группе. Гипотеза называется ненаправленной , если ее формулировка предполагает лишь определение отличий или не отличий (без указания направления отличий). Например, если необходимо доказать, в двух разных группах различаются формы распределения признака.

Примеры формулирования гипотез.

Метод, который используется для принятия решения относительно справедливости статистической гипотезы, называется проверкой гипотезы . Основной принцип проверки гипотезы состоит в том, что выдвигается нулевая гипотеза Н 0 , с тем, чтобы попытаться опровергнуть ее и тем самым подтвердить альтернативную гипотезу Н 1 .

При проверке любой статистической гипотезы решение исследователя никогда не принимается с уверенностью, поскольку всегда остается риск принятия неправильного решения.

Обычно используемые выборки невелики, и в этих случаях вероятность ошибки может быть значительной. Существует так называемый уровень достоверности (уровень значимости) различия. Это вероятность того, что различия считаются существенными, а они на самом деле случайны. То есть это вероятность отклонения нулевой гипотезы, в то время как она верна.

Когда указывается, что различия достоверны на 5%-ном уровне значимости, или при p£0,05, то имеется в виду, что вероятность того, что они все-таки недостоверны, составляет 0,05 (низший уровень статистической значимости). Если указывается, что различия достоверны на 1%-ном уровне значимости, или при p£0,01, то имеется в виду, что вероятность того, что они все-таки недостоверны, составляет 0,01 (достаточный уровень статистической значимости). Если указывается, что различия достоверны на 0,1%-ном уровне значимости, или при p£0,001, то имеется в виду, что вероятность того, что они все-таки недостоверны, составляет 0,001 (высший уровень статистической значимости).

Правило отклонения Н 0 и принятия Н 1:

Если эмпирическое значение критерия равняется критическому значению, соответствующему p£0,05 или превышает его, то Н 0 отклоняется, но еще нельзя определенно принять Н 1 .

Если эмпирическое значение критерия равняется критическому значению, соответствующему p£0,01 или превышает его, то Н 0 отклоняется принимается Н 1 .

Для наглядности правила принятия решения можно использовать так называемую «ось значимости».

Если уровень достоверности не превышен, то можно считать вероятным, что выявленная разница действительно отражает положение дел в популяции. Для каждого статистического метода этот уровень можно узнать из таблиц распределения критических значений соответствующих критериев.

T – критерий Стьюдента

Это параметрический метод, используемый для проверки гипотез о достоверности разницы средних при анализе количественных данных в популяциях с нормальным распределением и с одинаковой дисперсией. Он хорошо применим в случае сравнения величин средних случайных значений измеряемого признака в контрольной и экспериментальной группах, в различных половозрастных группах, группах, имеющих другие различные признаки.

Обязательным условием применимости параметрических методов, в том числе и t‑критерия Стьюдента, для доказательства статистических гипотез является подчинение эмпирического распределения исследуемого признака закону нормального распределения .

Метод Стьюдента различен для независимых и зависимых выборок.

Независимые выборки получаются при исследовании двух различных групп испытуемых (например, контрольной и опытной групп). К зависимым выборкам относятся, например, результаты одной и той же группы испытуемых до и после воздействия независимой переменной.

Проверяемая гипотеза Н 0 состоит в том, что разность между средними значениями двух выборок равна нулю ( = 0), другими словами это гипотеза о равенстве средних (). Альтернативная гипотеза Н 1 состоит в том, что эта разность отлична от нуля ( ¹ 0) или же существует отличие выборочных средних ().

В случае независимых выборок для анализа разницы средних применяют формулу: при n 1 , n 2 > 30

и формулу при n 1 , n 2 < 30, где

Среднее арифметическое значение первой выборки;

Среднее арифметической значение второй выборки;

s 1 – стандартное отклонение для первой выборки;

s 2 – стандартное отклонение для второй выборки;

n 1 и n 2 – число элементов в первой и второй выборках.

Для нахождения критического значения t определим число степеней свободы:

n = n 1 - 1 + n 2 - 1 = (n 1 + n 2) – 2 = n - 2.

Если |t эмп | > t кр, то нулевую гипотезу отбрасываем и принимаем альтернативную, то есть считаем разницу средних достоверной. Если |t эмп | < t кр, то разница средних недостоверна.

В случае зависимых выборок для определения достоверности разницы средних применяется следующая формула: , где

d – разность между результатами в каждой паре (х i – y i);

åd – сумма этих частных разностей;

åd 2 – сумма квадратов частных разностей;

n – число пар данных.

Число степеней свободы в случае зависимых выборок для определения t критерия будет равно n = n - 1.

Существуют и другие статистические критерии проверки гипотез, как параметрические, так и непараметрические. Например, математико-статистический критерий, позволяющий судить о сходстве и различиях в дисперсиях случайных величин, называется критерием Фишера.

Корреляционный анализ

В самом общем виде под значением «корреляция» понимается взаимная связь. Хотя, говоря о корреляции, используют также термины «корреляционная связь» и «корреляционная зависимость», которые часто используются как синонимы.

Под корреляционной связью понимают согласованные изменения двух или большего количества признаков, т.е. изменчивость одного признака находится в некотором соответствии с изменчивостью другого.

Корреляционная зависимость - это изменения, которые вносят значения одного признака в вероятность появления разных значений другого признака.

Таким образом, согласованные изменения признаков и отражающая это корреляционная связь между ними может свидетельствовать не о зависимости этих признаков между собой, а о зависимости обоих этих признаков от какого-то третьего признака или сочетания признаков, не рассматриваемых в исследовании.

Полученные в исследованиях выборочные данные всегда ог­раничены и носят в значительной мере случайный характер. Именно поэтому для анализа таких данных и используется мате­матическая статистика, позволяющая обобщать закономерности, полученные на выборке, и распространять их на всю генераль­ную совокупность.

Подчеркнем еще раз, что полученные в результате эксперимента на какой-либо выборке данные служат основанием для суждения о генеральной совокупности. Однако в силу действия случайных вероятностных причин оценка параметров генеральной совокупности, сделанная на основании экспериментальных (выборочных) данных, всегда будет сопровождаться погрешностью, и поэтому подобного рода оценки должны рассматриваться как предположительные, а не как окончательные утверждения.

Как указывает Г.В. Суходольский: «Под статистической гипотезой обычно понимают формальное предположение о том, что сходство (или различие) некоторых параметрических или функциональных характеристик случайно или, наоборот, неслучайно». Подобные предположения о свойствах и параметрах генеральной совокупности, различии выборок или зависимости между признаками получили названиестатистических гипотез.

Сущность проверки статистической гипотезы заключается в том, чтобы установить, согласуются ли экспериментальные данные и выдвинутая гипотеза, допустимо ли отнести расхождение между гипотезой и результатом статистического анализа экспериментальных данных за счет случайных причин? Таким образом, статистическая гипотеза - это научная гипотеза, допускающая статистическую проверку, а математическая статистика - это научная дисциплина, задачей которой и является научно обоснованная проверка статистических гипотез.

При проверке статистических гипотез используются два по­нятия: так называемая нулевая (обозначение Н 0 ) и альтернативная гипотеза (обозначение Н 1 ).

При сравнении распределений принято считать, что нулевая гипотеза Н 0 - это гипотеза о сходстве, а альтернативная Н 1 - гипотеза о различии. Таким об­разом, принятие нулевой гипотезы Н 0 свидетельствует об отсут­ствии различий, а гипотезы Н 1 - о наличии различий.

Например, две выборки извлечены из нормально рас­пределенных генеральных совокупностей и перед нами стоит задача сравнить эти выборки. Одна выборка имеет параметры и σ 1 , а другая параметры и σ 2 . Нуле­вая гипотеза Н 0 исходит из предположения о том, что = иσ 1 = σ 2 , то есть разность двух средних =0 и разность двух стандартных отклонений σ 1 σ 2 ,=0 (отсюда и название гипотезы - нулевая).

Принятие альтернативной гипотезы Н 1 свидетельствует о наличии различий и исходит из предположения, что ≠0 и σ 1 σ 2 ,≠0.


Очень часто альтернативная гипотеза носит название экспериментальной гипотезы , если в исследовании ставится задача доказать существование различий между выборками. Если же исследователь хочет доказать именно отсутствие различий, то экспериментальной гипотезой является нулевая гипотеза.

При сравнении выборок альтернативные статистические гипотезы могут быть направленными и ненаправленными.

Если мы заметили, что в одной выборке индивидуальные значения испытуемых по какому-либо признаку, выше, а в другой - ниже, то для проверки различий между выборками формулируется направленная гипотеза . Если мы ходим доказать, что в одной группе под влиянием каких-то экспериментальных воздействий произошли более выраженные изменения, необходимо также сформулировать направленную гипотезу. Формально она записывается так Н 1: х 1 превышает х 2 . Нулевая гипотеза при этом выглядит следующим образомН 0: х 1 не превышает х 2 .

Если мы хотим доказать, что различаются формы распределения, то формулируются ненаправленные гипотезы . Формально они записывается так Н 1: х 1 отличается от х 2 . Нулевая гипотеза Н 0: х 1 не отличается от х 2 .

Вообще говоря, при принятии или отвержении гипотез воз­можны различные варианты.

При проверке гипотезы экспериментальные данные могут противоречить гипотезе Н 0 , тогда эта гипотеза отклоняется. В противном случае, т.е. если экспериментальные данные согласу­ются с гипотезой Н 0 , она не отклоняется. Часто в таких случаях говорят, что гипотеза Н 0 принимается (хотя такая формулировка не совсем точна, однако она широко распространена). Отсюда видно, что статисти­ческая проверка гипотез, основанная на экспериментальных, выборочных данных, неизбежно связана с риском (вероятностью) принять ложное решение. При этом возможны ошибки двух родов. Ошибка первого рода произойдет, когда будет принято решение отклонить гипотезу Н 0 , хотя в действительности она оказывается верной. Ошибка второго рода произойдет когда бу­дет принято решение не отклонять гипотезу Н 0 , хотя в действительности она будет неверна. Очевидно, что и правильные выводы могут быть приняты также в двух случаях. Вышесказанное можно представить в виде таблицы 25.

На основе собранных в статистических исследованиях данных после их обработки делаются выводы об изучаемых явлениях. Эти выводы делаются путём выдвижения и проверки статистических гипотез.

Статистической гипотезой называется любое утверждение о виде или свойствах распределения наблюдаемых в эксперименте случайных величин. Статистические гипотезы проверяются статистическими методами.

Проверяемая гипотеза называется основной (нулевой) и обозначается Н 0 . Кроме нулевой выдвигается ещё и альтернативная (конкурирующая) гипотеза Н 1 ,отрицающая основную. Таким образом, в результате проверки будет принята одна и только одна из гипотез, а вторая будет отвергнута.

Типы ошибок . Выдвинутая гипотеза проверяется на основании исследования выборки, полученной из генеральной совокупности. Из-за случайности выборки в результате проверки не всегда делается правильный вывод. При этом могут возникать следующие ситуации:
1. Основная гипотеза верна и она принимается.
2. Основная гипотеза верна, но она отвергается.
3. Основная гипотеза не верна и она отвергается.
4. Основная гипотеза не верна, но она принимается.
Во случае 2 говорят об ошибке первого рода , в последнем случае речь идёт об ошибке второго рода .
Таким образом, по одним выборкам принимается правильное решение, а по другим – неправильное. Решение принимается по значению некоторой функции выборки, называемой статистической характеристикой , статистическим критерием или просто статистикой . Множество значений этой статистики можно разделить на два непересекающихся подмножества:

  • Н 0 принимается (не отклоняется), называется областью принятия гипотезы (допустимой областью) ;
  • подмножество значений статистики, при которых гипотеза Н 0 отвергается (отклоняется) и принимается гипотеза Н 1 ,называется критической областью.

Выводы:

  1. Критерием называется случайная величина K , которая позволяет принять или отклонить нулевую гипотезу H0 .
  2. При проверке гипотез можно допустить ошибки 2 родов.
    Ошибка первого рода состоит в том, что будет отклонена гипотеза H 0, если она верна ("пропуск цели"). Вероятность совершить ошибку первого рода обозначается α и называется уровнем значимости . Наиболее часто на практике принимают, что α = 0,05 или α = 0,01.
    Ошибка второго рода заключается в том, что гипотеза H0 принимается, если она неверна ("ложное срабатывание"). Вероятность ошибки этого рода обозначается β.

Классификация гипотез

Основная гипотеза Н 0 о значении неизвестного параметра q распределения обычно выглядит так:
Н 0: q = q 0 .
Конкурирующая гипотеза Н 1 может при этом иметь следующий вид:
Н 1: q < q 0 , Н 1: q > q 0 или Н 1: q q 0 .
Соответственно получается левосторонняя, правосторонняя или двусторонняя критические области. Граничные точки критических областей (критические точки ) определяют по таблицам распределения соответствующей статистики.

При проверке гипотезы разумно уменьшить вероятность принятия неправильных решений. Допустимая вероятность ошибки первого рода обозначается обычно a и называется уровнем значимости . Его значение, как правило, мало (0,1, 0,05, 0,01, 0,001 …). Но уменьшение вероятности ошибки первого рода приводит к увеличению вероятности ошибки второго рода (b ), т.е. стремление принимать только верные гипотезы вызывает возрастание числа отброшенных правильных гипотез. Поэтому выбор уровня значимости определяется важностью поставленной проблемы и тяжестью последствий неверно принятого решения.
Проверка статистической гипотезы состоит из следующих этапов :
1) определение гипотез Н 0 и Н 1 ;
2) выбор статистики и задание уровня значимости;
3) определение критических точек К кр и критической области;
4) вычисление по выборке значения статистики К экс ;
5) сравнение значения статистики с критической областью (К кр и К экс );
6) принятие решения: если значение статистики не входит в критическую область, то принимается гипотеза Н 0 и отвергается гипотеза H 1 , а если входит в критическую область, то отвергается гипотеза Н 0 и принимается гипотеза Н 1 . При этом, результаты проверки статистической гипотезы нужно интерпретировать так: если приняли гипотезу Н 1 , то можно считать её доказанной, а если принялигипотезу Н 0 , то признали, что она не противоречит результатам наблюдений.Однако этим свойством наряду с Н 0 могут обладать и другие гипотезы.

Классификация проверок гипотез

Рассмотрим далее несколько различных статистических гипотез и механизмов их проверки.
I) Гипотеза о генеральном среднем значении нормального распределения при не известной дисперсии . Предполагаем, что генеральная совокупность имеет нормальное распределение, её среднее и дисперсия неизвестны, но есть основания полагать, что генеральное среднее равно a . При уровне значимости α нужно проверить гипотезу Н 0: x =a. В качестве альтернативной можно использовать одну из трёх рассмотренных выше гипотез. В данном случае статистикой служит случайная величина , имеющая распределение Стьюдента с n – 1 степенями свободы. Определяется соответствующее экспериментальное (наблюдаемое) значение t экс t кр Н 1: x >a оно находится по уровню значимости α и числу степеней свободы n – 1. Если t экс < t кр Н 1: x ≠a критическое значение находится по уровню значимости α / 2 и том же числе степеней свободы. Нулевая гипотеза принимается, если | t экс |II) Гипотеза о равенстве двух средних значений произвольно распределённых генеральных совокупностей (большие независимые выборки). При уровне значимости α нужно проверить гипотезу Н 0: x ≠y . Если объём обеих выборок велик, то можно считать, что выборочные средние имеют нормальное распределение, а их дисперсии известны. В этом случае в качестве статистики можно использовать случайную величину
,
имеющую нормальное распределение, причём M (Z ) = 0, D (Z ) = 1. Определяется соответствующее экспериментальное значение z экс . Из таблицы функции Лапласа находится критическое значение z кр . При альтернативной гипотезе Н 1: x >y оно находится из условия F (z кр ) = 0,5 – a . Если z экс < z кр , то нулевая гипотеза принимается, в противоположном случае – отвергается. При альтернативной гипотезе Н 1: x ≠y критическое значение находится из условия F (z кр ) = 0,5×(1 – a ). Нулевая гипотеза принимается, если |z экс | < z кр .

III) Гипотеза о равенстве двух средних значений нормально распределённых генеральных совокупностей, дисперсии которых неизвестны и одинаковы (малые независимые выборки) . При уровне значимости α нужно проверить основную гипотезу Н 0: x =y . В качестве статистики используем случайную величину
,
имеющую распределение Стьюдента с (n х + n у – 2) степенями свободы. Определяется соответствующее экспериментальное значение t экс . Из таблицы критических точек распределения Стьюдента находится критическое значение t кр . Всё решается аналогично гипотезе (I).

IV) Гипотеза о равенстве двух дисперсий нормально распределённых генеральных совокупностей . В данном случае при уровне значимостиa нужно проверить гипотезу Н 0: D (Х ) = D (Y ). Статистикой служит случайная величина , имеющая распределение Фишера – Снедекора с f 1 = n б – 1 и f 2 = n м – 1 степенями свободы (S 2 б – большая дисперсия, объём её выборки n б ). Определяется соответствующее экспериментальное (наблюдаемое) значение F экс . Критическое значение F кр при альтернативной гипотезе Н 1: D (Х ) > D (Y ) находится из таблицы критических точек распределения Фишера – Снедекора по уровню значимости a и числу степеней свободы f 1 и f 2 . Нулевая гипотеза принимается, если F экс < F кр .

Инструкция . Для расчета необходимо указать размерность исходных данных.

V) Гипотеза о равенстве нескольких дисперсий нормально распределённых генеральных совокупностей по выборкам одинакового объёма. В данном случае при уровне значимостиa нужно проверить гипотезу Н 0: D (Х 1) = D (Х 2) = …= D (Х l ). Статистикой служит случайная величина , имеющая распределение Кочрена со степенями свободыf = n – 1 и l (n – объём каждой выборки, l – количество выборок). Проверка этой гипотезы проводится так же, как и предыдущей. Используется таблица критических точек распределения Кочрена.

VI) Гипотеза о существенности корреляционной связи. В данном случае при уровне значимостиa нужно проверить гипотезу Н 0: r = 0. (Если коэффициент корреляции равен нулю, то соответствующие величины не связаны друг с другом). Статистикой в данном случае служит случайная величина
,
имеющая распределение Стьюдента с f = n – 2 числом степеней свободы. Проверка этой гипотезы проводится аналогично проверке гипотезы (I).

Инструкция . Укажите количество исходных данных.

VII) Гипотеза о значении вероятности появления события. Проведено достаточно большое количество n независимых испытаний, в которых событие А произошло m раз. Есть основания полагать, что вероятность наступления данного события в одном испытании равна р 0 . Требуется при уровне значимостиa проверить гипотезу о том, что вероятность события А равна гипотетической вероятности р 0 . (Т.к. вероятность оценивается по относительной частоте, то проверяемую гипотезу можно сформулировать и иначе: значимо или нет различаются наблюдаемая относительная частота и гипотетическая вероятность).
Количество испытаний достаточно велико, поэтому относительная частота события А распределена по нормальному закону. Если нулевая гипотеза верна, то её математическое ожидание равно р 0 , а дисперсия . В соответствии с этим в качестве статистики выберем случайную величину
,
которая распределена приближённо по нормальному закону с нулевым математическим ожиданием и единичной дисперсией. Проверка данной гипотезы осуществляется точно так же, как и в случае (I).

Инструкция . Для расчета необходимо заполнить исходные данные.

Вверх