Использование SPSS в маркетинговых исследованиях. - Маркетинг - Скачать бесплатно
Министерство образования Российской Федерации
Московская государственная академия тонкой химической технологии им. М. В.
Ломоносова
Бакалавриат по направлению 521500
«Менеджмент».
К а ф е д р а «М а р к е т и н г
а и м е н е д ж м е н т а»
Квалификационная работа бакалавра
На тему: «Использование SPSS в маркетинговых
исследованиях»
И.О. Зав. Кафедрой «Маркетинга и менеджмента»,
к.т.н.,
доцент:
Люкманов В.Б.
Руководитель работы, доцент
:
Фёдоров Л.А.
Студент группы
М-41:
Ширков
С.А.
Москва, 2002.
План работы.
Введение.
Глава 1. Маркетинговые исследования
1.1. Процесс маркетинговых исследований
1.1.1. Определение проблемы и целей исследования
1.1.2. Определение объектов исследования
1.1.3. Разработка плана сбора информации
1.1.4. Сбор данных
1.1.5. Анализ данных
1.1.6. Представление результатов
Глава 2. Использование программы статистической обработки SPSS при анализе
результатов маркетинговых исследований
2.1. Ввод данных и определение типов переменных
2.2. Возможности SPSS по использованию методов опис. статистики
2.3. Построение таблиц сопряженности
2.4. Вычисление корреляционных функций
2.5. Расчет t-критерия
2.6. Регрессионный анализ
2.7. Редактирование таблиц и графиков в окне Навигатора Вывода
Заключение.
Приложение 1.
Приложение 2.
Список литературы.
Введение.
Маркетинг затрагивает интересы каждого из нас в любой день нашей жизни.
Мы просыпаемся, когда радиочасы «Касио» включаются на песне Майкла
Джексона. В ванной мы чистим зубы пастой «Колгейт», бреемся бритвой
«Жиллетт», освежаем рот антисептиком «Плекс»,
опрыскиваем волосы лаком «Ревлон» и пользуемся множеством других
туалетных принадлежностей и приспособлений, произведенных в разных частях света.
Мы надеваем джинсы «Кальвин Клейн» и ботинки «Басс». На
кухне мы выпиваем стакан апельсинового сока «Джей-севен», насыпаем в
тарелку хрустящий рис «Келлог» и заливаем его молоком «Домик в
деревне». Через некоторое время мы выпиваем чашечку кофе
«Максвелл-хаус» с двумя чайными ложками сахарного песка
«Домино», одновременно жуя сдобную булочку «Сара Ли». Мы
покупаем апельсины, выращенные в Калифорнии, кофе, импортированный из Бразилии,
газету изготовленную из канадской древесины, а новости доходят до нас аж из
далекой Австралии.
Все это стало возможным благодаря системе маркетинга, причем с минимальными
усилиями с нашей стороны. Она обеспечила нам уровень жизни, о котором наши
предшественники могли только мечтать.
В условиях рыночных отношений и особенно в переходный к
рынку период, маркетинг является одной из важнейших экономических дисциплин.
От того, насколько правильно построена система маркетинга, зависит эффективное
функционирование всего народного хозяйства.
Что же стоит за понятием «Маркетинг»? Большинство ошибочно
отождествляют маркетинг со сбытом и стимулированием. И неудивительно! Ведь
американцев постоянно донимают телевизионные рекламные ролики, газетные
объявления, отправления прямой почтовой рекламы, визиты коммивояжеров. Кто-то
пытается что-то продать. Кажется, что нам никуда не деться от смерти, налогов и
коммерции.
Поэтому многие удивляются, узнав, что наиболее важным элементом маркетинга
является вовсе не сбыт. Сбыт - всего лишь верхушка маркетингового айсберга. Сбыт -
всего лишь одна из его многих функций, причем зачастую не самая существенная. Если
деятель рынка хорошо поработал над такими разделами маркетинга, как выявление
потребительских нужд, разработка подходящих товаров и установление на них
соответствующей цены, налаживание системы их распределения и эффективного
стимулирования, такие товары наверняка пойдут легко.
Каждый знает о так называемых ходовых товарах, за которыми потребители охотятся
толпами. Когда фирма «Истман Кодак» создала фотоаппараты типа
«Инстаматик», фирма «Атари» - первые видеоигры, а фирма
«Мазда» - спортивный автомобиль «РХ-7», они были завалены
заказами, потому что предложили именно те товары, которые были в то время нужны.
Они предложили не товарные подражатели, а изделия, четко отличающиеся от уже
существующих и предлагающие потребителям новые выгоды.
Что же позволило этим производителям точно определить, что нужно потребителям?
Конечно, это правильно проведённые маркетинговые исследования. Один из ведущих
теоретиков по проблемам управления, Петер Друккер, говорит об этом так:
«Цель маркетинговых исследований - сделать усилия по сбыту ненужными. Их
цель - так хорошо познать и понять клиента, что товар или услуга будут точно
подходить последнему и продавать себя сами».
В проведении маркетинговых исследований, когда лучшим другом человека
становится компьютер, а не собака, главным является быстрота и точность в сборе и
анализе полученных данных в ходе данного процесса. Задача моей работы - как
можно с помощью компьютера максимально быстро и точно дать ответы на вопросы
У.Фокса, одного из крупнейших американских специалистов по маркетинговым
исследованием:
• Кем ?
• Где?
• Каким образом? покупаются, продаются,
применяются
• Почему
?
изделия, выпускаемые компанией
• Когда?
• В каком количестве ?
Глава 1. Маркетинговые исследования
1.1. Процесс маркетинговых исследований
Аналитическая функция маркетинга (маркетинговые исследования) – это
функция, связывающая потребителей, конкурентов и общественность с маркетологами
посредством информации, которая используется для распознавания и определения
возможностей и проблем; выработки, оптимизации и оценки маркетинговых действий,
определения эффективности комплекса маркетинга и улучшения понимания маркетинга
как процесса. Маркетинговые исследования связаны с принятием решений по всем
аспектам маркетинговой деятельности, они снижают уровень неопределенности и
касаются всех элементов комплекса маркетинга, внешней и внутренней среды
предприятия.
Маркетинговое исследование – процесс, состоящий из шести этапов. На первом
происходит четкое определение проблемы и постановка целей исследования. Второй
этап – определение объектов исследования. Третий этап – разработка
плана сбора информации с использованием первичных и вторичных данных. Сбор
первичных данных требует выбора методов исследования (наблюдение, эксперимент,
опрос), подготовка орудий исследования (анкеты, механические устройства),
составления плана выборки (единица выборки, объем выборки, процедура выборки) и
выбора связи с аудиторией (телефон, почта и личное интервью). Четвёртый этап
– сбор информации с помощью внекабинетных или лабораторных изысканий. Пятый
этап – анализ собранной информации для вывода из совокупности полученных
данных показателей среднего уровня, переменных составляющих и выявления разного
рода взаимосвязей. Шестой этап – представление основных результатов, которые
дадут управляющим по маркетингу возможность принимать более взвешенные решения.
Всё выше перечичленное можно представить в виде небольшой схемы (см. рис.
1.1).
Рис.1.1 Процесс маркетинговых исследований
1.1.1 Определение проблемы и целей исследования
Нельзя начинать какие-либо исследования до тех пор пока не определена суть
(природа) проблемы.
Стадия распознавания и определения проблемы является первым шагом в процессе
нахождения решения. Невыполнение задач по сбыту, растущее число неоплаченных
счетов и низкий оборот – все это является сигналом, более серьезных проблем.
Исследователи должны распознать и определить проблемы, скрытые за этими
симптомами. Неправильное определение проблемы может привести к неправильному
решению.
Цели маркетинговых исследований вытекают из сформулированных проблем. Цели должны
быть ясно и четко сформулированы, должна существовать возможность их измерения и
оценки уровня их достижения.
1.1.2. Определение объектов исследования
Когда определена проблема, можно сформулировать задачи исследований. Как правило,
исследование включает в себя решение одной из четырех задач: разработать, описать,
проверить гипотезы и предсказать.
Исследование с целью разработки проводят, когда необходимо получить больше
информации по данной проблеме, более четко сформулировать гипотезы, или когда
необходимы новые гипотезы. Исследования с целью описания проблем, проводятся когда
нужно описать такие объекты, как рынок или его часть (сегмент), определяя его
характеристики на основе статистических данных.
Если задачей маркетинговых исследований является проверка гипотез относительно
взаимосвязи между независимыми и зависимыми переменными, фирмы проводят
исследования с целью выявления причин, вызвавших возникновение проблемы. Например,
исследование, проведенное с целью описания проблемы, может выявить, что фирма
снизила цены на свою продукцию и одновременно с этим на рынке возрос спрос на нее,
но оно не может определить, было ли снижение цены причиной роста объемов продаж.
Объем продаж мог вырасти вследствие других факторов – увеличения
покупательной способности потребителей или снижения маркетинговых усилий
конкурентов. Исследования с целью выявления причин, вызвавших возникновение
проблемы, призваны показать, или что снижение цены (независимая переменная)
является причиной роста объемов продаж (зависимая переменная), или что снижение
цены не является причиной роста объемов продаж.
1.1.3. Разработка плана сбора информации
На третьем этапе при сборе первичных данных (информации, собранной впервые
для какой-то конкретной цели) выбирают метод исследования. Остановимся на опросе,
так как анкетирование является одним из основных инструментов именно данного
метода маркетингового исследования.
Опрос может последовать в устной или письменной форме. Устные и телефонные опросы
называют обычно интервью. Опросы разделяются:
1) по кругу опрашиваемых (частные лица, эксперты, предприниматели и др.);
2) по количеству одновременно опрашиваемых (единичное или групповое
интервью);
3) по количеству тем, входящих в опрос (одна или несколько );
4) по уровню стандартизации (свободная схема или структурированная,
полностью стандартизированная);
5) по частоте опроса (одно- или многоразовый опрос).
При письменном опросе участники получают опросные листы, которые они должны
заполнить и отослать по назначению. В данном случае используются преимущественно
закрытые вопросы, ответ на которые заключается в выборе одного из приведенных
вариантов. Вопросы подразделяются следующим образом:
• да - нет вопросы (иногда предусматривается ответ типа «не
знаю» или «ни да, ни нет»);
• альтернативные вопросы, при которых нужно выбрать из ряда возможных
ответов один, иногда несколько;
• ранжирование объектов сравнения, например автомобилей, на базе
субъективно ощущаемых преимуществ;
• шкалирующие вопросы, дающие дифференцированную оценку похожести или
различия исследуемых объектов.
Разные виды вопросов задают различные уровни шкал, которые можно применить в
дальнейшем для измерения величины исследуемого признака.
При разработке вопросов нужно исходить из потребности в информации и возможностей
опрашиваемых дать правильный ответ. Если исследователя интересует только согласие
или несогласие, то достаточен вопрос вида «да — нет». Если же
нужно сделать заключение о мнениях опрашиваемых, то необходимо использовать
шкалирующие вопросы.
Опросные листы могут включать, кроме вопросов по существу дела, вопросы,
помогающие установить контакт с опрашиваемым, и вопросы, контролирующие
правильность и подлинность ответов. Кроме того, используются статистические
вопросы, касающиеся личности опрашиваемого.
Вопросы, которые могут вызвать неприятные чувства, например стыд, недовольство
или желание приукрасить реальность, лучше всего ставить не в прямой, а в косвенной
форме, например: вместо вопроса «Имеете ли вы автомобиль?» можно
задать вопрос «Кто в вашей семье имеет автомобиль?». При исследовании
реальных мотивов и мнений часто используются методы проекции и ассоциации. В
первом случае тестируемому лицу предлагается описать какую-либо ситуацию или
выразить возможную реакцию третьего лица на эту ситуацию. Как правило, люди
приписывают другим те особенности характера, которыми они обладают сами, свои
мнения и представления. На принципе ассоциации основан тест, выясняющий, что
напоминает испытуемому то или иное слово, например: что ассоциируется со словом
«лето» и т.д. (словесная ассоциация). Ту же основу имеет .тест
дополнения предложений, в ходе которого опрашиваемому предлагается закончить
неполное предложение, например: «Спортивным автомобилем владеют люди,
которые...». Время ответа в обоих случаях должно быть ограничено, чтобы
получить спонтанные суждения.
В исследовании маркетинга чаще всего употребляется устный опрос, или интервью.
Если опрос проходит по строго заданной схеме, то говорят о стандартизированном
интервью. Репрезентативность подобной формы сбора данных во многом зависит от
лица, проводящего интервью. С одной стороны, хорошая его подготовка способствует
уменьшению доли лиц, отказывающихся участвовать в работе. С другой стороны, нужно
учитывать влияние интервьюера на опрашиваемых, которое искажает иногда результаты
опроса.
Преимущества свободного опроса (имеется только тема и цель; конкретной схемы
нет):
• возможен индивидуальный подход к каждому из опрашиваемых лиц, что
помогает поддерживать атмосферу доверия;
• возможно получение добавочной информации.
Недостатки подобных опросов:
• трудно протоколировать ответы;
• плохая сравнимость результатов;
• трудность в обработке данных; высокие затраты.
При сборе первичных данных у исследователей маркетинга есть выбор из двух
основных орудий исследований – эта анкеты и механические устройства. Анкета
– более распространенное орудие. В широком смысле анкета – это ряд
вопросов, на которые опрашиваемый должен дать ответ. Анкета – инструмент
очень гибкий в том смысле, что вопросы можно задавать множеством разных способов.
Анкета требует тщательной разработки, опробования и устранения выявленных
недостатков до начала ее широкого использования. В небрежно подготовленной
анкете можно всегда найти целый ряд ошибок. В ходе разработки анкеты
исследователь маркетинга вдумчиво отбирает вопросы, их формулирование и
последовательность. Самые обычные ошибки – постановка вопросов, на которые
невозможно ответить, на которые не захотят ответить, которые не требуют ответа, и
отсутствие вопросов, на которые следовало бы обязательно получить ответ. Каждый
вопрос нужно проверить с точки зрения вклада, который он вносит в достижение
результатов исследования. Вопросы, представляющие собой просто праздный интерес,
следует опускать, поскольку они затягивают процедуру и действуют опрашиваемым на
нервы. Форма вопроса может повлиять на ответ. Исследователи маркетинга выделяют
два типа вопросов:
• Закрытые
• Открытые
Закрытый вопрос включает в себя все возможные варианты ответов, и опрашиваемый
просто выбирает один из них. Открытый вопрос дает опрашиваемым возможность
отвечать своими словами. Открытые вопросы ставят в самых разных формах. Открытые
вопросы часто дают больше, поскольку опрашиваемые ничем не связаны в своих
ответах. Особенно полезны открытые вопросы на поисковом этапе исследования, когда
необходимо установить, что люди думают, не замеряя, какое количество из них думают
тем или иным определенным образом. С другой стороны, на закрытые вопросы дают
ответы, которые легче интерпретировать и сводить в таблицы.
Формулирование вопроса требует осторожности. Исследователь должен пользоваться
простыми, недвусмысленными словами, которые не влияют на направление ответа.
Особого внимания требует и установление последовательности вопроса. Первый из них
должен по возможности пробудить у спрашиваемого интерес. Трудные или личные
вопросы следует задавать в начале анкеты, пока опрашиваемые не успели замкнуться в
себе. Вопросы должны задаваться в логической последовательности. Вопросы,
классифицирующие опрашиваемых на группы, задают в последнюю очередь, потому что
они носят более личный характер и менее интересны для отвечающих.
Анкета должна быть составлена таким образом, чтобы вопросы не могли
повлиять на поведение лица, которое будет опрошено. Хорошая анкета должна:
• облегчить ответ опрашиваемого лица;
• сформулировать вопрос с учетом его влияния на ответ опрашиваемого;
• позволить легко провести анализ.
Ниже приведён один из блоков анкеты, по которой были проведены реальные
маркетинговые исследования .
АНКЕТА
«ОПРОС АВТОМОБИЛИСТОВ НА АЗС»
Интервью проводится с водителями автомобилей, подъехавшими на АЗС для заправки
автомобиля топливом
Здравствуйте!
В рамках изучения компанией НК «Бензин» рынка нефтепродуктов Центр
Исследований проводит анкетный опрос автомобилистов, пользующихся услугами
АЗС.
Цель опроса – найти пути улучшения Вашего обслуживания и качества
обеспечения топливом. Ваши ответы на вопросы анкеты позволят НК
«Бензин» наилучшим образом удовлетворить потребности потребителей
топлива на АЗС.
Ваши ответы будут использоваться только в обобщенном виде. Просим Вас принять
участие в исследовании и ответить на вопросы предлагаемой анкеты.
БЛОК «ПОТРЕБЛЕНИЕ ТОПЛИВА РЕСПОНДЕНТОМ»
1. Укажите категорию Вашего автомобиля (данного автомобиля):
(отметьте один ответ)
1. Легковой российский автомобиль
2. Легковой иностранный автомобиль
3. Микроавтобус или грузовой автомобиль грузоподъемностью до 2 тонн
отечественного или иностранного производства
4. Грузовой автомобиль грузоподъемностью свыше 2 тонн отечественного или
иностранного производства
2. Каким топливом Вы заправляете свой автомобиль?
(отметьте все указанные ответы)
1. Дизельное топливо
2. Бензин А-76/АИ-80
3. Бензин
АИ-92/93
4. Бензин АИ-95
5. Бензин АИ-98
3. Оцените среднее за месяц потребление топлива для данного автомобиля, в
зависимости от времени года:
(запишите количество в литрах для каждого времени года; если респондент не
использует автомобиль в какое-либо время года, запишите "0")
Время года Потребление, литров в месяц
1. Зима л/мес
2. Весна л/мес
3. Лето л/мес
4. Осень л/мес
4. Укажите характер Вашего маршрута:
(отметьте один ответ)
1. Постоянно следую транзитом через данную область (край)
2. Случайно следую транзитом через данную
область
(край) ® ПЕРЕХОДИТЕ
К ВОПРОСУ 6
3. Проживаю в этой области (крае), постоянно проезжаю через данное место
4. Проживаю в этой области (крае), случайно проезжаю через данное
место.
5. Где Вы предпочитаете осуществлять заправку автомобиля в этой
местности?
(отметьте один ответ)
1. Почти всегда заправляюсь только на данной АЗС в этой местности
2. Заправляюсь постоянно только на нескольких определенных АЗС в этой
местности
Прежде чем начинать опрос, нужно проверить анкету на небольшом числе лиц, чтобы
окончательно доработать ее методом постепенного приближения; таким путем можно
избежать многих ошибок.
1.1.4. Сбор данных
С точки зрения организации процесса существуют по крайней мере три альтернативных
подхода к сбору данных: осуществление данного процесса силами сотрудников
маркетинговой службы, силами специально созданной группы или с привлечением
компаний, специализирующихся на сборе данных. Процесс сбора информации
обычно является самым дорогим этапом исследования.
Затем нужно обобщить полученные ответы на вопросы. Эта операция может быть легко
выполнена вручную при опросе нескольких десятков и даже нескольких сотен человек.
В случае опроса значительно большего числа людей, особенно если вопросов более 20,
нужно использовать компьютеры .
1.1.5. Анализ данных
Анализ данных начинается с преоброзования исходных данных (введение в
компьютер, проверка на наличие ошибок, кодирование.).Это позволяет перевести массу
необработанных данных в осмысленную информацию. Каждый ответ нужно тщательно
проанализиро¬вать и в случае надобности отбросить, если ясно, что он заведомо
неверный, из него невозможно что-либо понять или же если опра¬шиваемый ответил
просто "для галочки", не зная предмета.
Вид данных, которые введены в компьютерную программу SPSS приведены на
рисунке 1.2.
Ф.И.О. кто опрашивал
Вопросы анкеты.
Fio_int v1 v2 v3
и т.д.
Иванов А.В.
1 4 2 4
Петров М.Р.
4 3 1 2
Сидоров В.И.
3 1 3 1
Лобов П.Р.
2 2 4 3
т. д.
1 3 3 2
Варианты ответов
опрашиваемых.
Рис.1.2. Пример преобразованных данных
После того, как ответы проверены и преобразованы, нужно обработать результаты
и представить их в форме настолько простой, насколько это возмож¬но, обычно в
форме таблиц, графиков. Это можно сделать в ручную, что повлечёт за собой
привлечение большого количества сотрудников и большие временные затраты, а также с
помощью компьютеров и соответствующего програмного обеспечения. В последнее время
как показала практика одной из лучших программ для обработки полученных
результатов стала программа SPSS.
1.1.6. Представление результатов
Полученные в результате проведённого исследования выводы оформляются в виде
заключительного отчёта и предоставляются руководству фирмы. Не всем менеджерам для
принятия решений нужны все полученные результаты. Менеджеров могут не посвещать в
тонкости проведённого исследования, но доверять полученным даннм они должны.
Помимо написания отчёта можно сделать его устную презентацию. В данном случае
имеется возможность ответить на возникшие вопросы. Окончательный отчет имеет
целью представить результаты опроса в наиболее ясной и наиболее достоверной форме.
В любом случае автор не должен поддаваться влиянию своих собственных убеждений.
Речь идет не о доказательствах, но об изложении фактов со скрупулезной
точностью.
Глава 2. Использование программы статистической обработки SPSS при анализе
результатов маркетинговых исследований
Для работы со статистической компьютерной программой SPSS прежде всего необходимо
иметь результаты проведенного опроса (заполненные опросные листы). С образцом,
представляющим собой простой пример варианта опросного листа, можно ознакомиться в
Приложении 1.
По выбранным отдельным вопросам, либо по всем вопросам опросного листа,
необходимо выявить статистически значимые закономерности; определить
статистические распределения вариантов ответов; оценить близость к нормальному
закону распределения. Программа SPSS позволяет выводить на печать необходимые
таблицы, строить графики, диаграммы и/или гистограммы.
Изучив полученные данные и сделав окончательные выводы, требуется сформировать
итоговый отчет с подробным анализом результатов маркетингового исследования.
2.1. Ввод данных и определение типов переменных
Редактирование данных.
После загрузки программы программы статистической обработки SPSS на экран
выводится окно редактора данных (сетка, аналогичная сетке программы Excel) с
панелью инструментов и пунктами меню (см. рис. 2.1).
Для дальнейшей работы необходимо либо загрузить уже имеющиеся данные из файла с
расширением *.sav, либо ввести новые данные и, разумеется, сохранить их в файле
ИМЯ.sav . Для ввода данных и определения переменных используются пункты основного
меню Data – Define Variable
(см. рис. 2.2).
При вводе каждой переменной необходимо определить:
• имя переменной;
• тип переменной (Type);
• пропущенные значения (Missing Values);
• метку переменной (Labels) – для удобства работы метку
можно записать и на русском языке;
• расположение переменных в таблице (Column Format).
Рис. 2.1. Окно редактора данных программы SPSS
Рис. 2.2. Окно ввода данных
Рекомендуется определить также метки значений переменной – Value
Labels, например: “0” – нет ответа, “1” – да,
“2” - нет и т.п.
Для имени переменной должны выполняться следующие правила:
- имя должно начинаться с буквы, остальные символы могут быть
любые;
- имя не может оканчиваться точкой или символом подчеркивания;
- длина имени не может превышать восьми знаков;
- в именах не могут использоваться пробелы или специальные символы: !, ?, *)
и т.п.;
- имена переменных нечувствительны к регистру.
Возможными типами переменной могут быть: числовой, с точкой, с запятой, научное
представление, дата, денежное представление (доллар), денежное представление
(произвольная валюта) и строковый. Форматы произвольной валюты определяются в
разделе Currency в диалоговом окне Options, доступном из пункта меню Edit.
Метка может быть приписана каждому значению переменной. Это очень удобно,
поскольку длина имени не может превышать 8 символов, а метки переменных могут быть
длиной до 256 символов, и эти описывающие переменные метки отображаются при
выводе.
Пользователь имеет возможность определить некоторые значения данных как
пропущенные. Это очень часто оказывается полезным при выяснении причин отсутствия
информации. Например, исследователь хотел бы отделить данные, пропущенные потому,
что респондент отказался отвечать, от данных, пропущенных потому, что данный
вопрос не имел отношения к респонденту. Значения данных, обозначенные как
пользовательские пропущенные, специально помечаются для того, чтобы исключить их
из большинства вычислений.
Диалоговое окно Templates позволяет создавать шаблоны определения переменных (см.
рис. 2.3) и применять из при вводе.
Рис. 2.3. Диалоговое окно определения шаблона переменной.
Данные вводятся в любом порядке - по наблюдениям или по переменным, для выбранных
областей или для отдельных ячеек. Активная ячейка выделяется жирной рамкой.
Значения данных не записываются, пока пользователь не нажмет на Enter или не
выберет другую ячейку. Для ввода данных типа, отличного от простого числового,
необходимо сначала определить тип переменной.
После ввода данных их необходимо обязательно сохранить на жестком диске в файле с
оригинальным именем и расширением *.sav : File – Save As…
Введенные данные можно редактировать с помощью Редактора Данных, который
позволяет:
- Изменять значения данных.
- Вырезать, копировать, вставлять значения данных
- Добавлять и удалять наблюдения и\или переменные
- Изменять порядок или определения переменных
- Проводить поиск значений данных, переходить к определенному
наблюдению.
Рис. 2.4. Опции редактора данных (пункт меню Edit)
В программе SPSS имеются также средства для работы с файлами данных в различных
форматах. В частности, программа обеспечивает доступ к электронным таблицам,
созданным в Lotus 1-2-3 или Excel, к файлам баз данных, созданным в системе dBASE
и различных форматах SQL, к текстовым файлам данных.
2.2. Возможности SPSS по использованию методов описательной статистики
Для анализа результатов маркетинговых исследований может быть использовано
множество методов математической статистики, реализованных в программе SPSS. В
данной работе рассмотрены основы работы с основными методами.
К методам описательной статистики относится, в частности, построение
частотных таблиц. Выбираем пункты меню:
Statistics – Summarize – Frequencies – выбор дискретной
переменной (переменных).
В диалоговом окне процедуры Frequencies (Частоты) исследователь может (cм. рис.
2.5):
- нажав кнопку Statistics, задать вычисление максимального, минимального и
среднего значения, моды, медианы, среднеквадратического отклонения для
количественных переменных;
- кнопкой Charts задать вид графиков – столбиковая или круговая
диаграммы, гистограмма;
- кнопкой Format задать порядок, в котором будут выводиться результаты
Рис. 2.5. Диалоговое окно процедуры Частоты
Для непрерывных переменных может использоваться обобщающая статистика:
Statistics – Summarize – Descriptives.
Процедура Descriptives осуществляет вывод одномерных статистик для нескольких
переменных в одной таблице, а также вычисляет нормированные значения переменных.
Переменные могут быть упорядочены по величине их средних значений (в порядке
возрастания или убывания), по алфавиту или в порядке, в котором пользователь
выбирает переменные (используется по умолчанию).
Например, если каждое наблюдение в анализируемых данных содержит итоги дневных
объемов продаж для одного из дистрибьюторов компании в течение нескольких месяцев,
то эта процедура поможет рассчитать средний дневной объем продаж для каждого
дистрибьютора и расположить полученные результаты от наиболее высоких к низким.
Методы проверки статистических гипотез позволяют получить ответ на вопрос,
являются ли обнаруженные закономерности подлинными, или же их можно объяснить
случайными особенностями выборки. В частности, важным является вычисление
стандартной ошибки среднего значения. Стандартная ошибка среднего значения
необходима, чтобы определить, в какой области значений лежит истинное среднее
значение генеральной совокупности. Для ее вычисления необходимо использовать
пункты меню:
Statistics – Summarize – Frequencies - Statistics – S.E.Mean
(S.E.Mean – standard error Mean).
Для непрерывной переменной, как уже говорилось выше, вместо стандартной ошибки
среднего используются нормированные значения (z-значения) и необходимо
использовать:
Statistics – Summarize – Descriptives —
– выбор переменных – Save standartized values as variably.
Для проверки нормальности распределения кривая нормального распределения может
быть наложена на гистограмму. Для этого в программе SPSS требуется использовать
пункты меню: Statistics – Summarize –
– Frequencies – Charts – Histograms – With normal
curve (см. рис. 2.6)
Рис. 2.6. Окно задания графиков в процедуре Frequencies
Таким образом, гипотеза нормальности может быть проверена графически.
Для проверки нормальности распределения могут использоваться показатели
асимметрии (Skewness) и эксцесса (Kurtosis). Асимметрия показывает
"скошенность" кривой распределения относительно нормальной кривой, а
эксцесс замеряет "заостренность" кривой (положительный –
заостренная кривая, отрицательный – "тупая"). Стандартная ошибка
Std.Error позволяет оценить значимость асимметрии и эксцесса. Для вычисления этих
показателей необходимо использовать пункты меню:
Statistics – Summarize – Frequencies — Statistics –
Skewness, Kurtosis
Рис. 2.7. Задание вычисления асимметрии и эксцесса в процедуре Frequencies
Для предварительного вычисления многих параметров описательной статистики
(минимум, максимум, среднеквадратическое отклонение, усеченное среднее и т.п.),
можно использовать разведочный анализ - процедуру Explore:
Statistics – Summarize – Explore
– выбор переменной - Statistics…
Для проверки нормальности в этой процедуре вычисляются асимметрия, эксцесс,
изображается диаграмма Stem-and-leaf - "ствол и листья", позволяющая
оценить распределение:
Statistics – Summarize – Explore –
выбор переменной - Plots…- Stem-and-leaf
(Stem Width – ширина "ствола").
При интерпретации результатов необходимо учитывать, что диаграмма Stem-and-leaf в
окне вывода программы SPSS располагается с наклоном 90о (см. рис. 2.8).
Age of Respondent Stem-and-Leaf Plot
Frequency Stem & Leaf
12,00 1 . 899
143,00 2 . 000011111111222222233333344444
150,00 2 . 5555556666666777777888888899999
187,00 3 . 00000001111111222222222333333334444444
195,00 3 . 555555555556666666777777788888889999999
167,00 4 . 0000000111111112222223333333444444
113,00 4 . 5555667777778888889999
87,00 5 . 000011122223334444
78,00 5 . 555667778888999
87,00 6 . 00011112223333444
84,00 6 . 555566677778888999
95,00 7 . 0001111222233333444
53,00 7 . 5566677889
43,00 8 . 001122234
20,00 8 . 5799&
Stem width: 10
Each leaf: 5 case(s) & denotes fractional leaves.
Рис. 2.8. Пример диаграммы Stem-and-Leaf
Оценить вид распределения помогают также "ящичковые диаграммы". Для
вычисления "ящичковых диаграмм" используются пункты меню: Statistics
– Summarize – Explore
– выбор переменной – Plots… - Factor levels Together
Ящичковые диаграммы дают исследователю общее представление о распределении
переменной: на них высота ящичка – разброс значений, жирная черта внутри
– медиана или 50%- процентиль, нижняя грань – 25%-процентиль, верхняя
– 75%-процентиль.
Значения, не попавшие внутрь, изображаются отдельно вне ящика.
Эти значения можно исследовать отдельно (если они есть):
Statistics – Summarize – Explore
– выбор переменной - Statistics…- Outliers
Рис. 2.9. Пример задания расчета ящичковой диаграммы
В окне вывода при таком исследовании выводится таблица экстремальных значений
Extreme Values.
Одним из методов исследования нормальности распределения является также
построение графиков на нормальной вероятностной бумаге. На графике даются
координаты фактических значений переменных и теоретические значения, вычисленные
при условии
нормальности распределения (линия). Чем ближе фактические значения к линии, тем
больше распределение близко к нормальному. Аналогично можно интерпретировать
график с удаленным трендом – Detrended Normal Q-Q Plot, - нормальному
распределению здесь соответствует горизонтальная линия.
При построении графиков на нормальной вероятностной бумаге в программе SPSS
автоматически рассчитываются значения коэффициентов Колмогорова-Смирнова и
Шапиро-Уилкса. Эти критерии основаны на нулевой гипотезе о том, что данная выборка
получена из генеральной совокупности, имеющей нормальное распределение. В окне
вывода можно изучить Tests of Normality, особенно обращая внимание на уровень
значимости каждого критерия Sig: если он больше 0.05 (т.е. превышает 5%), то можно
принять нулевую гипотезу – или, строго говоря, нет оснований ее отвергнуть!
Существует большое количество методов проверки нормальности распределения, но ни
один из них не является универсальным. Одни могут подтверждать нормальность, а
другие – отвергать. Исследователю необходимо использовать все возможные
методы для получения как можно менее противоречивых данных!
2.3. Построение таблиц сопряженности
Каждая ячейка таблицы сопряженности содержит информацию о количестве объектов,
попадающих в группу, определенную комбинацией двух значений. В применении к
анализу опросных листов это означает, что исследователь может, например, получить
информацию о количестве мужчин, имеющих информацию о товаре (количество человек,
ответивших на вопрос о поле – "муж.", и на вопрос о известности
товара – "известен").
Для вычисления таблиц сопряженности используются пункты меню (см. рис.2.10):
Statistics – Summarize – Crosstabs –
выбор переменных: Row - по строкам, Column - по столбцам
Помимо количества объектов, попадающих на комбинацию значений, в таблице можно
вывести и процентные соотношения (см. рис.2.11) после выбора переменных :
Cells – Percentages – Total (по строкам и по столбцам)
Соотношения в таблицах сопряженности применимы только к выборке; для того, чтобы
проверить, возможно ли распространить результаты на генеральную совокупность,
необходимо использовать специальные критерии, в частности, вычислить критерий
хи-квадрат Пирсона.
Рис. 2.10. Вычисление таблиц сопряженности
Рис. 2.11. К вычислению таблиц сопряженности
Нулевая гипотеза предполагает, что между переменными нет никакой
зависимости. Используем пункты меню (см. рис.2.12):
Statistics – Summarize – Crosstabs - …….
………-Statistics … - Chi-square
Рис. 2.12. Вычисление критерия хи-квадрат Пирсона
В таблицах окна вывода программы SPSS исследователь получает следующие
результаты:
Pearson Chi-Square – хи-квадрат Пирсона.
Likelihood Ratio – отношение правдоподобия. Рассчитывается по более сложной
формуле, чем хи-квадрат Пирсона (хи-квадрат представляет собой приблизительную
оценку отношения правдоподобия).
Linear-by-Linear Association – критерий линейно-линейной зависимости.
Представляет собой коэффициент корреляции, применим только если обе переменные
– порядковые!
В таблице в окне вывода: Value – значения критерия, df - количество
степеней свободы, Asymp.Sig.(2-sided)- уровень значимости. Обычно нулевая гипотеза
отвергается, если уровень значимости меньше 5% (0.05).
Для того, чтобы определить вклад каждой ячейки таблицы в общее значение критерия
хи-квадрат, можно в меню:
Statistics – Summarize – Crosstabs - …….- Cells
выбрать для вывода также значения :
Expected – ожидаемое значение;
Unstandarized – ненормированные остатки;
Standarized – нормированные остатки
All Standarized – исправленные нормированные остатки (см. рис. 2.11).
Величины остатков позволяют судить о том, насколько сильно фактические значения
отличаются от ожидаемых, или какие значения более всего отклоняются от нулевой
гипотезы (если она верна, остатки должны быть равны нулю).
2.4. Вычисление корреляционных функций.
Корреляция - это исследование комбинаций непрерывных переменных. Графическое
представление зависимости между переменными можно получить с помощью диаграммы
рассеяния. Для построения диаграммы рассеяния используются пункты меню:
Graphs – Scatter – Simple – Define – выбор переменных
Диаграмма позволяет на глаз оценить зависимость двух переменных.
Рис. 2.13. Построение диаграммы рассеяния
Поверх уже созданной диаграммы в окне вывода можно наложить линию наименьших
квадратов. В окне Редактора графиков (чтобы его вызвать, необходимо два раза
щелкнуть левой клавишей мыши на графике в окне вывода) требуется задать: Charts
– Options – Fit Line – Total
Рис. 2.14. Наложение линии наименьших квадратов поверх диаграммы рассеяния
Если требуется обнаружить квадратичную или кубическую зависимость, необходимо в
окне редактора графиков выбирать Fit Options.
Информацию о зависимости между переменными можно получить, вычислив коэффициент
корреляции Пирсона r:
r = 1 – прямая зависимость;
r = -1 - обратная зависимость;
r = 0 - отсутствие зависимости (вернее, в данном случае линейную зависимость
установить не удается и можно попытаться установить нелинейную зависимость,
используя диаграммы рассеяния – см. выше). Для вычисления коэффициента
корреляции Пирсона используются пункты меню:
Statistics – Correlate - Bivariate –
выбор переменных – Correlation Coefficients - Pearson
Рис. 2.15. Вычисление коэффициента корреляции Пирсона
Для каждой выбранной пары переменных принимается нулевая гипотеза о том, что
линейная зависимость между ними отсутствует.
Результаты вычислений помещаются в таблицу Correlations в окне вывода
(см.рис.2.16):
Pearson Correlation – коэффициент корреляции;
Sig. (2-tailed) – уровень значимости коэффициента;
N - количество записей в файле данных, по которым делался расчет.
Рис 2.16. Вычисление коэффициента корреляции Пирсона
Особое внимание следует обратить на уровень значимости – любая
значимость выше 0.05 (5%) подтверждает нулевую гипотезу (о том, что в генеральной
совокупности значение коэффициента корреляции равно нулю).
Для использования коэффициента корреляции Пирсона необходимо, чтобы все
переменные были непрерывными и данные являлись бы случайной выборкой из
генеральной совокупности с нормальным распределением. В том случае, когда
какое-либо из этих условий не выполняется и коэффициент Пирсона использовать
нельзя, применяются так называемые непараметрические критерии
|