Ошибки первого и второго рода


Помните, что цель проверки гипотезы состоит в подтверждении утверждения относительно совокупности на основе одной выборки. Поскольку мы полагаемся на выборку, то подвергаем себя риску, что наши выводы о совокупности могут оказаться ошибочными. Используя пример с мячами для гольфа, положим, что моя выборка попадает в область «Отклонить Н0» на последнем рисунке. То есть в соответствии с выборкой, мой мяч увеличит дистанцию более чем на 20 метров. А что, если истинное среднее по совокупности на самом деле значительно меньше 20 метров? Это может произойти в результате ошибки выборки. Тип ошибки, когда мы отклоняем Н0, а на самом деле это гипотеза является истинной, называется ошибкой первого рода. Вероятность совершения ошибки первого рода определяется уровнем значимости и обозначается α. При проверке гипотезы может произойти и другого рода ошибка. Предположим выборка с мячом для гольфа оказалась в пределах области «Не отклонять Н0» на рис. 2. То есть в соответствии с выборкой, мяч увеличивает дистанцию не более чем на 20 метров. Но что, если истинное среднее по совокупности на самом деле больше 20 метров? Тип ошибки, когда мы не отклоняем Н0, а на самом деле она является ложной, называется ошибкой второго рода. Вероятность совершения ошибки второго рода называется мощностью гипотезы и обозначается β. В табл. 1 представлены оба типа ошибок проверки гипотезы.

Как правило, при проверке гипотезы мы определяем уровень значимости α, который находится в пределах от 0.01 до 0.10, и происходит это до отбора выборки. Что бы вам было проще запомнить, можно думать об ошибках первого и второго рода следующим образом: нулевая гипотеза — это гипотеза о невиновности обвиняемого (следуя презумпции невиновности). Таким образом, (потенциальная) ошибка, совершить которую вы боитесь больше всего, — это признать невиновного виновным. Соответственно, именно ошибками первого рода больше всего озабочена статистика.

1.5. Использование шкалы исходной переменной

В этом разделе мы определим область отклонения с помощью шкалы исходной переменной, которой в нашем примере является количество дней. Для вычисления верхней и нижней границ области отклонения используем следуюшие уравнения. Границы области отклонения = μH0 +/- z × σx, где μH0 = среднее по совокупности, принятой основной гипотезой, а σx — стандартное отклонение по выборке. Для нашего примера с заработной платой (см.Приложение 1): Верхняя граница = 16732 Нижняя граница = 63819

Поскольку наше среднее по подвыборке №1 из 20 элементов равно 36,653 (округленно), по этой подвыборке мы попадаем в область «Не отклонять Н0» — как на рис. 1. Отсюда делаем вывод, что разница между 36,653 и 40,000 — это исключительно дело случая, и у нас есть «подтверждение», что среднее по совокупности равняется 40,000 (в действительности, лучше считать, что мы не можем опровергнуть, что среднее по совокупности равно 40,000).



Категория: управление. Дата публикации: 1 Март, 2010.