Предположения множественной регрессии


Предположения множественной регрессии отличаются от предположений одномерной регресии, по сути, только в формулировках.

1. Зависимость между переменной Y и вектором независимых переменных (X1, X2 .. Xn) носит линейный характер.

2. Вектор независмых переменных (X1, X2 .. Xn) не является случайным. Кроме того, не существует линейной связи между двумя или более независимыми переменными.

3. Математическое ожидание остатка по каждой переменной равно 0.

4. Вариация остатков постоянна для всех наблюдений.

5. Остатки не имеют автокорреляции и являются нормально распределенными.

1.9. Мультиколлинеарность

Что происходит, когда вы пытаетесь делать регрессию с мультиколлинеарными независимыми переменными? Постарайтесь собрать вместе все сохранившиеся в памяти сведения из линейной алгебры (отговорка о том, что вы не изучали в ВУЗе высшую математику, не принимается — линейная алгебра, хоть и в минимальном объеме, но входит в курс средней школы). Представьте, что вы пытаетесь разложить вектор по базису из двух других векторов; проблема же состоит в том, что вы не уверены ни в модуле (длине), ни в направлении векторов. У вас есть такие сведения: примерное направление (плюс-минус 15 градусов) и примерный модуль (1 плюс-минус 0.1). Теперь если два эти вектора (их «средние» направления) направлены перпендикулярно друг другу, то коэффициенты, полученные при разложении вектора по базису из двух таких векторов, не будут отличаться существенным образом. С другой стороны, представив, что угол между «средними» направлениями векторов составляет 15 градусов, мы получим, что реальный угол между векторами может находиться в пределах от – 15 до +45 градусов. Понятно, что пытаясь разложить наш вектор — да и вообще любой вектор — по такому, с позволения сказать, базису, ничего хорошего мы не получим. Мультиколлинеарность не обязательно проявляется в случае наличия корреляции между двумя или несколькими независимыми переменными; однако, наличие этой корреляции может подсказать о возможности существования такой неприятной проблемы, как мультиколлинеарность.

Кстати, а чем, собственно, она плоха, мультиколлинеарность? В общем, наше описание «на пальцах» достаточно хорошо отражает главную проблему: снижение точности определения коэффициентов.



Категория: управление. Дата публикации: 1 Март, 2010.