Корреляция


Корреляция измеряет мощность и направление связи между х и у. На рис. 3 представлены различные типы корреляции в виде графиков рассеяния упорядоченных пар (х,у). По традиции переменная х размещается на горизонтальной оси, а у — на вертикальной. График А на рис. 3 является примером положительной линейной корреляции: при увеличении х также увеличивается у, причем линейно. График В показывает нам пример отрицательной линейной корреляции, на котором у при увеличении х линейно уменьшается. На графике С мы видим отсутствие корреляции между х и у. Эти переменные никоим образом не влияют друг на друга. Наконец, график D — это пример нелинейных отношений между переменными. По мере увеличения х, наш у сначала уменьшается, а потом меняет направление и увеличивается.

Теперь поговорим о линейных взаимосвязях между зависимой и независимой переменными.

Коэффициент корреляции

Коэффициент корреляции r демонстрирует как силу, так и направление связи между независимой и зависимой переменными. Значения r могут находиться в диапазоне от – 1.0 до +1.0. Когда r положителен, связь между х и у также является положительной (график А на рис. 3), а когда значение r отрицательно, связь также отрицательна (график В). Коэффициент корреляции, близкий к нулевому значению, свидетельствует о том, что между х и у связи не существует (график С). Сила связи между х и у определяется близостью коэффициента корреляции к – 1.0 или +1.0. Обратите внимание на рис. 4. График А показывает идеальную положительную корреляцию между х и у при r = + 1.0. График В — идеальная отрицательная корреляция между х и у при r = – 1.0. Графики С и D — примеры более слабых связей между зависимой и независимой переменными.

Используя эти значения и n = 6 (число упорядоченных пар), получаем:

Как видите, между числом часов, посвященных изучению предмета, и экзаменационной оценкой существует весьма сильная положительная корреляция. Преподаватели будут весьма рады узнать об этом. Какова выгода устанавливать связь между подобными переменными? Отличный вопрос. Если обнаруживается, что связь существует, мы можем предугадать экзаменационные результаты на основе определенного количества часов, посвященных изучению предмета. Проще говоря, чем сильнее связь, тем точнее будет наше предсказание. Мы научимся делать подобные предварительные оценки, когда перейдем к теме линейной регрессии. Программа Ехсеl может выполнить за вас всю эту работу с помощью функции КОРРЕЛ со следующими характеристиками: КОРРЕЛ (массив 1; массив 2), где: массив 1 = диапазон данных для первой переменной, массив 2 = диапазон данных для второй переменной.



Категория: управление. Дата публикации: 1 Март, 2010.