Валидность тестов


Согласно словарным определениям, прилагательное “валидный” означает “обоснованный, подтвержденный фактами”, в то время как понятие надежность основывается на устойчивости результатов. Надежность играет важнейшую роль по очень простой причине: ненадежное измерение вообще не может быть валидным.

Надежный измерительный инструмент не обязательно обладает валидностью, но вопрос о валидности можно ставить только в том случае, если инструмент надежен.

По отношению к тестированию валидность определяется как “правильность, содержательность и полезность конкретных выводов, сделанных из результатов тестирования”.

Традиционно принято делить доказательства валидности выводов, сделанных по результатам теста на три категории, в зависимости от типа вывода, для которого наиболее релевантно данное доказательство:

· если имеются факты, свидетельствующие о том, что тест отражает смысл измеряемой характеристики, это доказывает валидность по конструкту;

· если можно продемонстрировать, что вопросы, включенные в тест, репрезентативны по отношению ко всему массиву вопросов, которые могли бы быть включены в тест, это служит доказательством валидности по содержанию;

· наконец, наличие систематической связи между результатами теста и некоторым внешним критерием (таким, как способность к исполнению работы в будущем) доказывает валидность по критерию.

Описанные категории удобны в употреблении, но это не означает, что существуют различные типы валидности. Скорее это различные категории доказательств, которые необходимо собрать, чтобы сделать вывод об общей валидности теста как измерительного инструмента. В идеале хотелось бы получить как можно больше таких доказательств. Однако исследования занимают много времени, они дорого стоят, и именно поэтому валидность теста чаще определяется сбором фактов, наиболее необходимых с точки зрения тех выводов, которые будут сделаны из этого теста.

Доказательство валидности по конструкту При использовании с какой бы то ни было целью любого теста всегда встает главный вопрос: измеряет ли этот тест именно ту характеристику, для измерения которой он предназначен? Если это так, то конструктная валидность этого теста доказана.

Доказательство валидности по содержанию Доказательство содержательной валидности релевантно выводам о конкретных вопросах, включенных в тест (его содержанию). Содержательная валидность теста обычно определяется одним из двух способов.

1. Определяется релевантность вопросов теста тому, что измеряется с его помощью.

2. Выявляется и оценивается репрезентативность того, что включено в текст, по отношению ко всему, что можно было бы в него включить, то есть к тестируемой области.

Доказательство валидности по критерию Доказательством критериальной валидности могут быть факты, свидетельствующие о том, что между результатами теста (предсказывающая переменная) и некоторым критерием существует систематичная и значимая связь. Критерий – это внешний по отношению к данному тесту результат измерения какого-либо атрибута или характеристика поведения, относительно которого будет проводиться оценка.

В организационном исследовании часто используются такие критерии, как уровень текучести кадров и абсентизм, выполнение работы, обучаемость и скорость продвижения по службе.

Доказательство валидности по критерию означает, что результаты теста можно использовать для получения выводов в форме прогнозов. Составление прогноза традиционно считается предпочтительным способом получения доказательств валидности по критерию, но его практическое применение имеет определенные недостатки. Одной из возможных проблем, связанных с составлением прогноза валидности по критерию, состоит в том, что между сбором данных теста (предсказывающая переменная) и сбором критериальных данных проходит некоторое время. При распространении прогнозов поведения на более далекое будущее их точность существенно снижается.

Общая валидность теста Резюмируя изложенное, повторим, что доказательства валидности выводов, которые можно сделать из результатов теста, традиционно делятся на три категории. Это не означает, что существуют различные типы валидности; различные подходы к сбору доказательств валидности любого данного теста должны приводить к одинаковым выводам. Идеальным способом конструирования теста является последовательное использование на разных этапах разработки теста нескольких различных процедур.

3.4. Виды тестов, используемых сегодня в менеджерской практике Общий обзор отборочных тестов, используемых при приеме на работу Мы анализируем поведение людей в организациях, поэтому находимся в контексте организаций. В этом контексте весьма полезным может стать тестирование при приеме на работу. Понимание основ теории измерений является необходимой базой для обсуждения любых конкретных отборочных тестов, используемых при приеме на работу.

Проанализируем теперь основные категории тестов, используемых для отбора сотрудников для организаций.



Категория: управление. Дата публикации: 28 Февраль, 2010.