Детерминанты, предсказывающие переменные и ANOVA


Когда речь идет о двух переменных, то для выявления причины и следствия необходимо разобраться, какая из переменных оказывает влияние на другую переменную.

Например, анализ каузальных факторов, скрывающихся за положительной корреляцией между ростом и весом тела, приводит к выводу, что вес должен зависеть от роста.

При увеличении веса люди не становятся выше ростом, а при увеличении роста возрастает длина скелетных костей, которые должны быть покрыты мышцами и кожей, потому при прочих равных условиях люди высокого роста, как правило, весят больше.

Однако на практике “прочие условия” исследований редко бывают равными. Bес конкретного индивида определяется многими значимыми факторами, не имеющими отношения к росту. Среди этих факторов – наследственность, характер метаболизма, уровень активности, процентное отношение массы жира к массе мышц и количество потребляемой пищи. Этими, а также многими менее важными факторами, которые здесь не упоминаются, можно объяснить наблюдаемую дисперсию веса тела разных людей (различия в весе). Перечисление всех этих факторов позволило бы получить полный список детерминантов веса тела человека, и с помощью этого способа можно было бы объяснить 100 % различии в весе тела.

Маловероятно, что нам удастся перечислить все детерминанты какой-либо конкретной характеристики (такой как вес) или поведения: в этом перечне просто будет слишком много неизвестных. Тем не менее, в организационных исследованиях бывает много ситуаций, когда исследователь заинтересован в определении хотя бы некоторых из наиболее значимых детерминантов наблюдаемых между людьми различий по какой-либо переменной. С этой целью он опирается на опыт, теорию и предыдущие релевантные исследования, чтобы сформировать какую-либо гипотезу о том, какие переменные могут иметь отношение к этим различиям. Эти переменные называются предсказывающими.

Предсказывающая переменная – это переменная, влиянием которой объясняется значительная часть различии, наблюдаемых при измерении другой переменной.

Данное понятие можно проиллюстрировать исходя из того, насколько эти переменные “пересекаются” или имеют общую область изменения, которая называется общей дисперсией. Из диаграммы, изображенной на рис.3, видно, что опыт работы и выполнение работы имеют небольшую общую дисперсию, на что указывает маленькая площадь области пересечения двух кругов. В данном случае опыт работы будет предсказывающей переменной для выполнения работы.

В исследованиях предсказывающая переменная похожа на независимую, потому что она интересует исследователя (не будучи нерелевантной или искажающей) и в то же время не является зависимой переменной. Однако исследователи не манипулируют предсказывающими переменными (как в экспериментах) и не пытаются найти предсказывающие переменные, уже имеющие определенный уровень (как в полевых исследованиях); вместо этого они измеряют их у некоторых испытуемых из выборки.

Для иллюстрации использования предсказывающих переменных рассмотрим зависимую переменную, которая называется “вовлеченность в работу” и определяется здесь как уровень личных или психологических вложений человека, связанных с работой на своей текущей должности. В исследовании поставлен следующий вопрос: влиянием каких переменных можно объяснить наблюдаемые различия между людьми (дисперсию) в измеренных уровнях вовлеченности в работу?

Анализ предыдущих исследований вовлеченности в работу показывает, что могут оказаться релевантными такие переменные, как уровень образования, уровень выполнения работы, объем опыта работы и личностная переменная под названием “локус контроля”.

Когда собраны и проанализированы данные наблюдений за перечисленными переменными, становится ясно, что все переменные, кроме выполнения работы, значимо связаны с вовлеченностью в работу. Выясняется, что у исследуемых испытуемых 23 % дисперсии вовлеченности в работу объясняются совместным влиянием уровня образования, объема опыта работы и локуса контроля. Для исследований такого типа это внушительная процентная доля различий, но некоторые значимые детерминанты не учитывалась в гипотезе, поэтому значительная часть дисперсии (100 % – 23 % = 77 %) вовлеченности в работу не получила объяснения.

В этом примере не удается полностью объяснить различия – частично из-за влияния неидентифицированных переменных, не учитывавшихся в гипотезе, а частично из-за ошибок. Общая ошибка складывается из ошибок измерения и ошибок, связанных с тем, что для исследования были выбраны определенные испытуемые. Во всех исследованиях присутствуют ошибки обоих упомянутых типов. При тщательном и внимательном планировании исследования можно значительно снизить величину этих ошибок, но полностью устранить их невозможно. Поэтому важной задачей становится оценка величины фактической ошибки, которая может присутствовать в исследовании.

Для оценки того, какая доля дисперсии в данных определенной серии наблюдений порождена ошибкой, широко используется процедура под названием ANOVA (дисперсионный анализ). Существует несколько вариантов этой процедуры, но все они основаны на концепции сравнения величины различий (интересующей исследователя зависимой переменной), возникших за счет влияния переменных, которыми манипулировал экспериментатор, с величиной различий, порожденных ошибкой.

Эта концепция иллюстрируется диаграммой, изображенной на рис.4.

Испытуемые: Пилоты вертолетов.

Тип эксперимента: Имитации.

Зависимая переменная: Среднее количество ошибок при чтении.

Независимая переменная: Конфигурация приборной доски.

Большой круг изображает все наблюдавшиеся различия (100 %) в измерениях зависимой переменной – среднего количества ошибок, сделанных испытуемымилетчиками при чтении показаний приборов. Tpи сектора круга изображают доли различий, возникших за счет влияния каждого из следующих факторов:

· независимая переменная, которая интересует исследователя (различные конфигурации приборной доски);

· ошибка, возникающая за счет различий в некоторых характеристиках испытуемых выборки (таких, как острота зрения);

· ошибка, возникающая из других источников (таких как проблемы при пpoвeдeнии измерений, например, ошибка при записи ответа испытуемого).

Даже не зная конкретных цифр, можно понять, что большая часть дисперсии в правильности чтения пилотами показаний приборов объясняется различиями в конфигурациях приборной доски, а не ошибками. Такой результат исследования является желательным, но в диаграмме дисперсия, связанная с другими ошибками, всего в два раза меньше ошибки, вызванной конфигурацией приборной доски, и в некоторых экспериментах эта может быть статистически значимой.



Категория: управление. Дата публикации: 27 Февраль, 2010.