Статистическая значимость


Выводы о ценности результатов того или иного исследования обычно получают посредством статистического анализа, который позволяет протестировать одну или несколько гипотез. Результаты, полученные с помощью определенной процедуры исследования, называют статистически значимыми, если вероятность их случайного появления очень мала.

Эту концепцию можно проиллюстрировать на примере кидания монеты. Предположим, что монету подбросили 30 раз; 17 раз выпал “орел” и 13 раз выпала “решка”. Является ли значимым отклонение этого результата от ожидаемого (15 выпадений “орла” и 15 “решки”), или это отклонение случайно? Чтобы ответить на этот вопрос, можно, например, много раз кидать ту же монету по 30 раз подряд, и при этом отмечать, сколько раз повторится соотношение “орлов” и “решек”, равное 17:13.

Статистический анализ избавляет нас от этого утомительного процесса. С его помощью после первых 30 киданий монеты можно произвести оценку возможного числа случайных выпадений 17 “орлов” и 13 “решек”. Такая оценка называется вероятностным утверждением.

В научной литературе вероятностное утверждение в математической форме обозначается выражением р (вероятность) < (менее) 0,05 (5 %), которое следует читать как "вероятность менее 5 %". В примере с киданием монеты это утверждение будет означать, что если исследователь проведет 100 опытов, каждый раз кидая монету по 30 раз, то он может ожидать случайного выпадения комбинации из 17 "орлов" и 13 "решек" менее, чем в 5 опытах. Сегодня аналогичный результат исследований в области организационного поведения считается статистически значимым.

Для понимания исследований обычно бывает достаточно иметь ясное представление о концепции статистической значимости и необязательно знать, как рассчитываются используемые сегодня исследователями статистики. Однако при обосновании исследований в области организационного поведения используются следующие инструменты анализа:

· корреляция и корреляционная связь между переменными;

· детерминант/предсказывающая переменная и “ANOVA” (дисперсионный анализ);

· группа статистических методов под общим названием “метаанализ”.

Кривая нормального распределения Большинство процедур статистического анализа, часто используемых в исследованиях, основаны на предположении о том, что наблюдаемые переменныe распределяются среди исследуемой популяции по нормальному закону. Если переменная имеет нормальное распределение, то при графическом представлении данных большого числа значений этой переменной получится кривая характерной колоколообразной формы, которая называется кривой нормального распределения (ее часто называют просто нормальной кривой).

Если, например, измерить рост (переменная) большого числа мужчин и женщин, случайно выбранных однажды утром из толпы прохожих на углу оживленной улицы, то в этой выборке окажется относительно небольшая процентная доля очень высоких и очень низкорослых людей. Большинство людей из выборки будут иметь средний рост.

Любую нормальную кривую можно описать с помощью двух чисел. Одно из них – это усредненное по всем измерениям значение переменной, выраженное в единицах используемой шкалы, то есть среднее значение (μ) распределения. Второе число, описывающее нормальную кривую, характеризует вариабельность, или разброс точек кривой относительно среднего значения. С помощью математических преобразований вариабельность всех кривых такого вида можно выразить через стандартную единицу, которая называется стандартным отклонением (σ), Если известны среднее значение и стандартное отклонение нормальной кривой, то любой человек может точно воспроизвести эту кривую, поскольку при нормальном распределении переменной в каждый интервал длиной в одно стандартное отклонение влево или вправо от среднего значения попадает строго определенная процентная доля всех наблюдавшихся значений переменной. Эти процентные доли указаны на рис.2:

например, 68,26 % всех значений переменной отличаются от среднего значения не более чем на одно стандартное отклонение (по 34,13 % в меньшую и в большую стороны).

Кривая нормального распределения не только служит основой формального статистического анализа, но и используется в некоторых других целях. Одна из важных целей – объяснить людям, что означают баллы, полученные ими при прохождении тестов.

Если среднее значение результатов стандартизованного теста математических способностей равно 50 баллам, а стандартное отклонение – 10, то человек, получивший, например, 70 баллов, справился с тестом лучше, чем примерно 95% людей, которые проходили этот тест. Результат 70 баллов на два стандартных отклонения превышает средний (50 + 10 + 10 = 70).

Большинство статистических процедур основаны на предположении о нормальности кривой распределения, но некоторые важные для исследования в области организационного поведения переменные не подчиняются нормальному закону распределения. Такая переменная, как пол, имеет бимодальное распределение, то есть при измерении она может принимать только два значения – мужской и женский. Другие переменные имеют так называемое асимметричное распределение, когда большинство значений переменной группируется вокруг точки измерительной шкалы, которая не является средним значением.

Асимметричное распределение имеет вес тела людей; для людей любого роста и пола (то есть при условии контроля над ростом и полом) доля людей с весом выше среднего больше, чем доля людей с весом ниже среднего.

Для анализа переменных, имеющих бимодальное, асимметричное и другие отличные от нормального распределения, необходимы специальные статистические процедуры, но за немногими исключениями (например, пол) эти переменные редко встречаются в организационных исследованиях. Однако распределение данных наблюдений для конкретной выборки может отличаться от нормального из-за особенностей плана эксперимента или ошибок при формировании выборки объектов исследования.



Категория: управление. Дата публикации: 27 Февраль, 2010.