Оптимальный размер выборки


Допустим, изучается поведение покупателей в продовольственном магазине. В частности, мы хотим определить среднюю сумму чека. Владелец магазина (эксперт) говорит, что сумма может быть около 500–700 руб., а среднее отклонение σ может составить 200 руб.

В ходе опроса хотелось бы определить среднее значение с точностью (d) до 20 руб. при уровне достоверности (z) в 0,95.

Определение необходимого и достаточного объема выборки происходит на основе опыта и неформальных договоренностей исследователей между собой и/или с заказчиками.

Считается, что опрос 30–50 представителей конкретной (узкой) аудитории (замужних москвичек в возрасте 30–45 лет, имеющих одного ребенка, высшее образование и совокупный семейный доход в пределах от 700 до 1500 долл. США в месяц), можно распространять на всю группу. Допустимая ошибка (доверительный интервал) при уровне достоверности около 0,95 не превысит 4%.

Если в задачу исследования входит получение информации о мнениях, знаниях, поведении или отношении к некой проблеме всех москвичек, то необходимо построить такую выборку, в которой были бы представлены все узко определенные группы (страты).

Две страты – по семейному положению, три – по наличию и количеству детей, три возрастные, три доходные, две образовательные – итого 108 групп (страт), в каждой из которых должно быть не менее 30 респондентов. Всего – более 3000 респондентов.

Однако достаточно обойтись опросом 400–600 респондентов, а затем провести попарный факторный анализ (влияние факторов «Возраст», «Образование», «Доход», «Семейное положение», «Дети»), при этом каждый раз разбивая выборку на две-три группы, наполнение которых – не менее 100–150 респондентов.

Репрезентативная выборка населения России состоит из 3600–9000 человек и 180 групп (страт) (два пола, три возраста, два образовательных уровня, три доходные группы, пять типов поселений). Доверительный интервал будет находиться в пределах +/-3 процентных пункта. Это значит, что, если 30% (12% или 45%) респондентов заявили, что регулярно употребляют майонез, то долю потребителей майонеза в России можно оценить в 27–33% (9–15 или 42–48%, соответственно).

Размер выборки практически не зависит от размера генеральной совокупности. В мегаполисе с населением более 1 млн. чел. и в уездном городе с 35 тыс. жителей при построении выборки, репрезентативной по одинаковому числу параметров, потребуется опросить одинаковое количество людей.

Объем выборки зависит только от числа параметров, по которым мы желаем добиться репрезентативности (если только пол и возраст, то достаточно 400 чел., если параметров три, то количество респондентов должно увеличиться до 600 чел.).

Добиться репрезентативности по пяти параметрам (полу, возрасту, доходу, образованию, сфере профессиональной деятельности) в одном населенном пункте можно лишь на выборке из 1000–1200 чел.



Категория: маркетинг. Дата публикации: 6 Март, 2010.