Бинарные переменные (dummy variables)


Бинарными в статистике называют переменные, которые могут принимать только 2 значения — 0 или 1. Именно такими переменными описывают, например, сезон, месяц года, день недели, наличие страховки и т.д.

Пример использования бинарных переменных приведен на листе «Магазин» (см. Приложение 3) книги «Примеры». В этом случае были использованы переменные «Май», «Декабрь» и «Бюджет». Очевидно, первые две из них принимают значение 1 в

27/42

соответствующем месяце, а переменная «Бюджет» принимает значение 1 только в случае, если — как нам стало известно пост-фактум — были перечислены деньги бюджетным организациям. При этом понятно, что мы могли бы ввести 11 переменных — по числу «линейно-независимых» месяцев (чтобы лучше это понять, попробуйте создать 12 переменных по числу месяцев — вероятнее всего, Excel присвоит одной из них коэффициент 0). Более того, введя, скажем, 46 переменных, мы сможем описать 47 наблюдений абсолютно точно. Разумеется, такая модель не будет иметь никакой предсказательной силы.

Использование Excel для анализа линейной регрессии на нескольких переменных

По большому счету, использование Excel для анализа регрессии на несколько переменных очень мало отличается от случая одной переменной. Формат функции тот же: ЛИНЕЙН (Известные_Y, Известные_X, А, Статистика). Единственное отличие состоит в том, что в данном случае Известные_X — несколько столбцов (обязательно соседних). Напомним, что мы будем пользоваться этой функцией в формате ЛИНЕЙН (Известные_Y, Известные_X, 1,1). Кроме того, напомним, что для получения всех результатов регрессии, нам необходимо следующее.

1. Создать в ячейке указанную выше формулу.

2. Пометить прямоугольник высотой 5 строк и шириной k+1 столбцов (k — количество независимых переменных).

3. Нажать сначала клавишу F2, а затем — одновременно — Ctrl+Shift+Enter.

4. Если вы все сделали правильно, появятся результаты регрессии Y на X.

Некоторое неудобство заключается в том, что Excel выводит коэффициенты в порядке, обратном тому, в котором они находились. Поясним (приведены исходные условия и результаты двумерной регрессии из примера с количеством КПК на 1000 человек населения).



Категория: управление. Дата публикации: 1 Март, 2010.