Интерпретация коэффициента надежности


В результате применения любого из описанных трех методов оценки степени надежности теста как измерительного инструмента получается одно число – коэффициент корреляции. Это число, которое обозначают буквой r, может изменяться в пределах от 0 до 1,00, но что это означает? Например, если r = 0,60, означает ли это, что тест имеет приемлемую надежность, или нет?

Большинство психологов согласятся с тем, что приемлемым является коэффициент надежности теста, превышающий 0,80, а наиболее желательны его значения выше 0,90.

Мнения по поводу минимального приемлемого значения могут расходиться.

По идеальным стандартам значение г = 0,60 является низким. Когда результаты теста используются для принятия решений, имеющих важное значение в жизни человека и/или организации, таких, как прием на работу нового сотрудника или поступление в образовательное учреждение, применяются традиционные, более высокие стандарты.

Поэтому стандарты оценки коэффициента надежности, как и выбор метода, в какой-то степени зависят от цели исследования.

Лучше всего, по-видимому, воспользоваться проверенным эмпирическим правилом “чем выше надежность, тем лучше”, поскольку надежность теста непосредственно влияет на стандартную погрешность измерения с помощью данного теста. Эта статистическая характеристика, в свою очередь, важна для практического использования теста.

Стандартная погрешность измерения Оценка надежности теста – это оценка ошибки, сделанной при определении положения индивидуума на измерительной шкале.

Теоретически, если многократно подвергнуть одного и того же человека тестированию с использованием эквивалентных тестов, полученные результаты будут распределяться вокруг истинного значения тестируемой характеристики. Некоторые из этих результатов будут ближе к истинному значению, чем другие, поскольку в некоторых случаях при проведении тестирования возникала меньшая ошибка, чем в других случаях. Если подвергнуть все эти результаты определенным статистическим преобразованиям, то результаты многократного тестирования можно представить в виде кривой нормального распределения.

Стандартная погрешность измерения – это стандартное отклонение этой кривой.

Кривая нормального распределения Стандартная погрешность измерения связана с распределением результатов, которые были бы получены при многократном тестировании одного человека с использованием одного и того же теста (хотя вычисляется она другим способом). Чем больше стандартная погрешность измерения, тем сильнее разброс результатов вокруг истинного значения (среднее значение распределения).

Существуют способы повышения надежности теста, а значит, и уменьшения стандартной погрешности измерения. Наиболее распространенным способом является увеличение продолжительности теста с целью получить более стабильную выборку измеряемых характеристик.



Категория: управление. Дата публикации: 28 Февраль, 2010.