ГлавнаяНовости сайтаRssОбратная связьРекламаПравилаРегистрация

По тегам:

Популярное:





Календарь:

«    Сентябрь 2010    »
ПнВтСрЧтПтСбВс
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
 

Рекомендуем:

12 полезных советов

Диалоговые окна, Основы работы

Напоследок   хочется   рассказать   о   некоторых   полезных   свойствах   программы

SPSS, которые существенно облегчат работу с ней.

1.   Несколько файлов (баз данных) SPSS можно объединять, добавляя при этом

либо новые переменные, либо новых респондентов.

Чтобы добавить поля (переменные) в базу данных  SPSS, подготовьте два файла

данных (за один цикл можно объединить только два файла). В обоих файлах — реципиен-

те (база данных, в которую следует добавить переменные) и доноре (база данных, в кото-

рой содержатся добавляемые переменные) — необходимо, во-первых, проследить, чтобы

имена добавляемых переменных не повторяли имя файла-реципиента; во-вторых, создать

ключевое поле, то есть переменную, уникальным образом идентифицирующую  респон-

дентов. Обычно эту роль берет на себя номер анкеты. Отсортируйте оба файла по этой

переменной (одинаковым образом: по возрастанию или убыванию). При помощи меню

Data ► Merge Files ► Add Variables в открывшемся диалоговом окне выберите эту ключе-

вую переменную; затем выберите параметр Match case on key variables in sorted files; поме-

стите ключевую переменную в поле Key Variables. Щелкните на кнопке ОК, и в файл-ре-

ципиент будут добавлены новые переменные из файла-донора (после всех существующих

переменных).

Добавление респондентов происходит следующим образом. Убедитесь, что оба

файла (реципиент и донор) содержат одинаковые переменные (по имени и типу). Открой-

те диалоговое окно добавления респондентов при помощи меню  Data  ►  Merge  Files  ►

Add  Cases. В нем будут автоматически отобраны и помещены в файл-реципиент только

одинаковые переменные. После щелчка на кнопке О К изменения вступят в силу: новые

респонденты будут добавлены в конец рабочего файла.

2.   Построенные диаграммы можно изменять, дважды щелкнув на них мышью в

окне SPSS Viewer. Простые диаграммы, как будет показано в п. 3, содержат лишь базовые

возможности форматирования диаграмм (в специальном окне SPSS Chart Editor), тогда как

интерактивные диаграммы предоставляют значительный набор средств, аналогичных MS

Microsoft Excel.

3.     Графическая подсистема  SPSS  позволяет строить обычные (Simple) и инте-

рактивные (Interactive) диаграммы. Вторые отличаются от первых более широкими воз-

можностями форматирования. Однако какой бы тип диаграммы вы ни выбрали, они все

равно не будут иметь такого же привлекательного вида, как диаграммы в Microsoft Excel.

Диаграммы, выводимые в качестве дополнительного параметра в различных статистиче-

ских процедурах (меню  Analyze), - это только обычные диаграммы. Они предназначены

исключительно для использования в процессе анализа данных аналитиками и не подходят

для презентаций. Обычные диаграммы можно строить и отдельно от статистических про-

цедур — при помощи меню Graphs. При этом если, скажем, в Microsoft Excel все диаграм-

мы могут быть «на лету» преобразованы одна в другую, то в SPSS однажды построенная

диаграмма может менять только элементы форматирования. Наиболее часто используе-

мые виды диаграмм: Ваг (гистограмма), Line (график), Pie (сектограмма) и Scatter (точеч-

ная). Интерактивные диаграммы доступны посредством меню Graphs ► Interactive, кото-

рое также содержит четыре типа наиболее часто используемых видов диаграмм. Обычные

и интерактивные диаграммы могут быть как плоскими, так и объемными.

4.    Таблицы в окне  SPSS Viewer  можно изменять, дважды щелкнув на них мы-

шью. Далее выберите в меню Pivot пункт Pivoting Trays. Откроется дополнительное окно,

с помощью которого можно поменять местами столбцы, ряды и уровни таблицы.

5.   После создания таблиц линейных или перекрестных распределений на их ос-

нове можно строить различные диаграммы. Дважды щелкните на таблице мышью, чтобы

открыть ее. Затем выделите требуемые числовые значения (без названий переменных и ва-

риантов ответа) и щелкните правой кнопкой мыши. В появившемся контекстном меню

выберите Create Graph и в нем — требуемый тип диаграммы. После этого, например, бу-

дет построена интерактивная диаграмма.

6.     Меню  Analyze  ►  Custom  Tables  предоставляет доступ к диалоговым окнам,

предназначенным для построения одно - и многомерных таблиц. При помощи этих окон

вы можете создавать более презентабельные таблицы, чем Frequencies или Crosstabs. Мы

рекомендуем использовать диалоговое окно Multiple Response Tables для работы с много-

вариантными   переменными   (вместо   стандартной   процедуры  Analyze  ►  Multiple  Re-

sponse).

7.   Часто при работе с SPSS возникает необходимость скопировать результаты ра-

боты программы из окна SPSS Viewer в Microsoft Word или Microsoft Excel. Для того что-

бы   скопировать   диаграмму,   выделите   ее,   щелкнув   на   ней   правой   кнопкой   мыши,   и   в

открывшемся контекстном меню выберите пункт Сору. Таблицы копируются методами,

различными для Microsoft Word и Microsoft Excel. Так, чтобы скопировать таблицу в Mi-

crosoft Excel, выделите ее правой кнопкой мыши и в открывшемся меню выберите пункт

Сору. После этого вставка в Microsoft Excel производится обычным способом. В Microsoft

Word вы можете вставить таблицу, во-первых, в виде рисунка (метафайла) — выделите ее

при помощи правой кнопки мыши и выберите пункт Copy Objects (при этом таблицу не-

льзя изменять) — и, во-вторых, в виде собственно таблицы. Однако если вы просто скопи-

руете и вставите ее в Microsoft Word, таблица потеряет оформление и может стать нечита-

емой. Мы рекомендуем вставлять таблицу в Microsoft Word, предварительно скопировав

ее в Microsoft Excel.

8. В любых диалоговых окнах SPSS, так же как и в окне SPSS Viewer, вы можете

получить справку по конкретным элементам (кнопкам, полям, статистикам) — для этого

щелкните на них правой кнопкой мыши. Чтобы уточнить смысл какой-либо статистики,

представленной в объектах  SPSS  Viewer, сначала нужно открыть их двойным щелчком

мыши, а затем при помощи правой кнопки мыши получить информацию об интересую-

щей статистике.

9. Весьма мощным средством работы с SPSS для опытных исследователей явля-

ется командный синтаксис (Syntax). С его помощью можно, во-первых, автоматизировать

повторяющиеся операции (например, построение 30 регрессий), а во-вторых, получать до-

ступ к статистическим процедурам, не выведенным в основное меню программы (напри-

мер, MANOVA). Краткое описание командного синтаксиса заняло бы много страниц. Тем

не менее даже начинающие аналитики, не имеющие опыта работы с ним, могут достаточ-

но эффективно использовать командный синтаксис, изучая автоматически генерируемые

при работе с меню команды. Для того чтобы увидеть внутреннюю команду синтаксиса

при работе с какой-либо статистической процедурой, следует предварительно выбрать в

меню Edit ► Options на вкладке Viewer параметр Display commands in the log. После этого

все ваши действия будут автоматически отображаться в окне SPSS Viewer в виде простого

текста, который можно скопировать в окно Syntax (вызывается при помощи меню File ►

New ► Syntax).

10.    Не следует путать программный синтаксис (Syntax) со встроенным языком

программирования SPSS (Script). Окно программирования открывается при помощи меню

File ►  New ►  Script. Язык программирования  SPSS похож на Microsoft Visual Basic for

Applications (VBA), однако он содержит отдельные функции, специфичные для работы со

структурой базы данных формата  SPSS. Встроенный язык программирования весьма бе-

ден на визуальные средства интерактивного пользовательского интерфейса, однако он мо-

жет с успехом применяться в качестве клиента автоматизации, то есть для интегрирования

различных приложений, поддерживающих VBA (например, все приложения Microsoft Of-

fice) с SPSS. При помощи этого языка можно, например, строить графики в Microsoft Ex-

cel или формировать демонстрационные отчеты в Microsoft Word.

11.   Командный синтаксис SPSS обладает многими возможностями полноценного

макроязыка. В нем есть переменные, циклы, условные операции и т. д. Однако в некото-

рых случаях языка синтаксиса оказывается недостаточно. Мы рекомендуем использовать

командный синтаксис для операций с матрицей данных, то есть с анкетами респондентов,

находящимися в окне Data View. Иными словами, проводить такие операции, как чистка

базы данных (корректировка пропущенных значений, логической структуры ответов и т.

п.), формирование исходного списка переменных в окне  Variable  View, «подвешивание»

меток переменных, а также операции с отдельными ячейками данных (например, копиро-

вание-вставка из других программ). Для операций с результатами расчетов (таблицами,

результатами статистических тестов и т. д.), расположенными в окне SPSS Viewer, реко-

мендуется использовать другой встроенный язык программирования SPSS — язык скрип-

тов. Практика показывает, что большинство компаний, занимающихся маркетинговыми

исследованиями, производят обработку таблиц, построенных в  SPSS, в других програм-

мах (чаще всего в MS Excel). Ниже мы покажем, как при помощи языка скриптов SPSS ав-

томатизировать процесс переноса таблиц из окна SPSS Viewer в MS Excel (для построения

диаграмм) и в MS Word.

Мы уже не раз упоминали о слабости графической подсистемы  SPSS. В связи с

этим исследователи строят диаграммы в MS Excel, копируя их из окна SPSS

Viewer. Этот процесс может стать «узким местом» всего исследования, так как

при большом объеме таблиц с линейными и перекрестными распределениями процесс по-

строения диаграмм занимает весьма значительный период времени. Давайте посмотрим,

как можно легко и быстро автоматизировать данный процесс. Итак, предположим, что у

нас есть 100 таблиц с линейными распределениями по различным вопросам анкеты. Все

эти таблицы находятся в окне SPSS Viewer. Откройте редактор скриптов SPSS при помо-

щи  меню  File  ►  New  ►  Script. Появится  диалоговое   окно  Use  Starter  Script, которое

предлагает использовать текст уже написанной программы в качестве шаблона для наше-

го скрипта.  Мы  будем  создавать  скрипт  самостоятельно,  поэтому просто  щелкните  на

кнопке Отмена. Появится окно редактора скриптов SPSS, содержащее полноценную среду

разработки (IDE). Слева вы увидите две вкладки — 1 и 2. Мы будем писать скрипт1 на

установленной по умолчанию вкладке 1. Скрипты в SPSS пишутся на VBA-совместимом

языке Sax Basic. Его возможности в целом более ограничены по сравнению с VBA (а сред-

ства разработки диалоговых окон не выдерживают никакой критики). В окне редактора

скриптов SPSS по умолчанию введены начальная и конечная строки программы:

Sub Main

End Sub



16 сентября 2009 | Добавил:admin| | Просмотров: 1325
Подробнее


Итоги исследований

Интерфейс анализа

SPSS — это мощный современный аналитический инструмент, при помощи кото-

рого можно проводить любой тип анализа данных в маркетинговых исследованиях. И в то

время как построение математических моделей обычно считается прерогативой ученых,

статистический   анализ   данных   —   это   задача   исследователей.   Исследования   являются

неотъемлемой частью работы маркетологов, поэтому до тех пор, пока будут существовать

вопросы, подлежащие решению при помощи маркетингового анализа, будет существовать

и потребность в проведении статистического анализа данных. Цель настоящего пособия

— сделать проведение статистического анализа понятным каждому исследователю.

Компания SPSS Inc. разработала целый ряд руководств, в которых подробно опи-

сываются выпущенные ею программные продукты. В сумме они насчитывают 5000 стра-

ниц, где вы найдете ответ на любой вопрос, связанный с работой практикующего исследо-

вателя. Однако все эти пособия написаны преимущественно на английском языке, что яв-

ляется препятствием для многих отечественных маркетологов. Руководства содержат весь

объем информации о возможностях  SPSS, включая информацию, которая используется

редко либо вообще неприменима к маркетинговым исследованиям. В настоящем же посо-

бии страниц гораздо меньше, и наша задача состояла в том, чтобы рассказать о ключевых

моментах применения SPSS именно в маркетинговых исследованиях, с учетом специфиче-

ских   особенностей   данного   вида   профессиональной   деятельности.   Несмотря   на   не-

большой   объем   настоящего   руководства,   оно   охватывает   95   %   всех   используемых   на

практике статистических методик. Для изучения оставшихся 5 % методов, редко применя-

емых в маркетинговых исследованиях, мы рекомендуем обратиться к оригинальным ру-

ководствам по SPSS.



12 сентября 2009 | Добавил:admin| | Просмотров: 1069
Подробнее


Таблица Agglomeration Schedule

Способы расчета, Интерфейс анализа

При классификации переменных практически и статистически значимым является

кластер, состоящий всего из одной переменной. Поэтому, поскольку мы получили прием-

лемое число  кластеров  математическим  методом,  проведение  дальнейших  проверок  не

требуется. Вместо этого снова откройте главное диалоговое окно кластерного анализа (все

данные, использованные на предыдущем этапе, сохранились) и щелкните на кнопке Statis-

tics, чтобы организовать вывод классификационной таблицы. Вы увидите одноименное

диалоговое окно, где необходимо указать число кластеров, на которое необходимо разде-

лить 24 переменные (рис. 5.57). Для этого выберите параметр Single solution и в соответ-

ствующем поле укажите требуемое число кластеров: 4.

Заключение



11 сентября 2009 | Добавил:admin| | Просмотров: 487
Подробнее


Членство авиакомпаний в кластерах

Методы анализа

1. Авиакомпании, полностью удовлетворяющие требованиям всех клиентов по па-

раметру работы наземного персонала (входят только в один первый кластер):

■   Внуковские авиалинии;

■   American Airlines;

■   Continental;

■   Delta Airlines;

■   Air France;

■   Alitalia;

■   Austrian Airlines;

■   British Airways;

■   Swiss Air;

■   KLM;

■   Lufthansa;

■   SAS;

■   Korean Airlines;

■   Japan Airlines.

2.   Авиакомпании, удовлетворяющие требованиям большинства своих клиентов

по параметру работы наземного персонала (большая часть респондентов, летающих дан-

ными авиакомпаниями, удовлетворены работой наземного персонала):

■   Трансаэро.

3.   Авиакомпании, не удовлетворяющие требованиям большинства своих клиен-

тов по параметру работы наземного персонала (большая часть респондентов, летающих

данными авиакомпаниями, не удовлетворены работой наземного персонала):

■   Домодедовские авиалинии;

■   Пулково;

■   Сибирь;

■   Уральские авиалинии;

■   Самарские авиалинии;

■   KrasAir;

■   Finnair.

Таким образом, получено три целевых сегмента авиакомпаний по уровню средних

оценок, характеризующиеся различной степенью удовлетворенности респондентов рабо-

той наземного персонала:

1.   наиболее привлекательные для пассажиров авиакомпании по уровню работы

наземного персонала (14);

2.   скорее привлекательные авиакомпании (1);

3.   скорее непривлекательные авиакомпании (7).

Мы успешно завершили все этапы кластерного анализа и сегментировали авиа-

компании по семи выделенным критериям.

Теперь приведем описание методики кластерного анализа в паре с факторным.

Используем условие задачи из раздела 5.2.1 (факторный анализ). Как уже было сказано, в

задачах сегментирования при большом числе переменных целесообразно предварять кла-

стерный анализ факторным. Это делается для сокращения количества критериев сегменти-

рования до наиболее значимых. В нашем случае в исходном файле данных у нас есть 24

переменные. В результате факторного анализа нам удалось сократить их число до 5. Те-

перь это число факторов может эффективно применяться для кластерного анализа, а сами

факторы — использоваться в качестве критериев сегментирования.

Если перед нами стоит задача сегментировать респондентов по их оценке различ-

ных аспектов текущей конкурентной позиции авиакомпании X, можно провести иерархи-

ческий кластерный анализ по выделенным пяти критериям (переменные nfacl_l-nfac5_l). В

нашем случае переменные оценивались по разным шкалам. Например, оценка 1 для утвер-

ждения Я бы не хотел, чтобы авиакомпания менялась и такая же оценка утверждению Изменения в авиакомпании будут позитивным моментом диаметрально противоположны по

смыслу. В первом случае 1 балл (совершенно не согласен) означает, что респондент при-

ветствует изменения в авиакомпании; во втором случае оценка в 1 балл свидетельствует о

том, что респондент отвергает изменения в авиакомпании. При интерпретации кластеров у

нас неизбежно возникнут трудности, так как такие противоположные по смыслу перемен-

ные могут попасть в один и тот же фактор. Таким образом, для целей сегментирования реко-

мендуется   сначала   привести   в   соответствие   шкалы   исследуемых   переменных,   а   затем

пересчитать факторную модель. И уже далее проводить кластерный анализ над получен-

ными в результате факторного анализа переменными-факторами. Мы не будем снова по-

дробно описывать процедуры факторного и кластерного анализа (это было сделано выше

в соответствующих разделах). Отметим лишь, что при такой методике в результате у нас

получилось три целевые группы авиапассажиров, различающихся по уровню оценок вы-

деленным факторам (то есть группам переменных): низшая, средняя и высшая.

Весьма полезным применением кластерного анализа является разделение на груп-

пы частотных таблиц. Предположим, у нас есть линейное распределение ответов на во-

прос Какие марки антивирусов установлены в Вашей организации?. Для формирования

выводов   по   данному   распределению   необходимо   разделить   марки   антивирусов   на

несколько групп (обычно 2-3). Чтобы разделить все марки на три группы (наиболее попу-

лярные марки, средняя популярность и непопулярные марки), лучше всего воспользовать-

ся кластерным анализом, хотя, как правило, исследователи разделяют элементы частот-

ных таблиц на глаз, основываясь на субъективных соображениях.



10 сентября 2009 | Добавил:admin| | Просмотров: 478
Подробнее


Сравнение средних для двух выделенных кластеров

Интерфейс анализа

Может оказаться, что в аналогичном случае  по параметру  X  высокой оценкой

считается 4,5, а по параметру  Y  — только 3,9. Это не будет ошибкой кластеризации, а

напротив, позволит сделать важный вывод относительно значимости для респондентов

рассматриваемых параметров. Так, для параметра Y уже 3,9 балла является хорошей оцен-

кой, тогда как к параметру X респонденты предъявляют более строгие требования.

Мы идентифицировали два значимых кластера, различающиеся по уровню сред-

них оценок по критериям сегментирования. Теперь можно присвоить метки полученным

кластерам:   для   1   —   Авиакомпании,   удовлетворяющие   требованиям   респондентов   (по

семи анализируемым критериям); для 2 — Авиакомпании, не удовлетворяющие требова-

ниям респондентов. Теперь можно посмотреть, какие конкретно авиакомпании (закодиро-

ванные в переменной  q4) удовлетворяют требованиям респондентов, а какие — нет по

критериям  сегментирования.   Для  этого  следует  построить  перекрестное   распределение

переменной  q4 (анализируемые авиакомпании) в зависимости от кластеризующей пере-

менной clu2_l. Результаты такого перекрестного анализа представлены на рис. 5.54.

По этой таблице можно сделать следующие выводы относительно членства иссле-

дуемых авиакомпаний в выделенных целевых сегментах.



8 сентября 2009 | Добавил:admin| | Просмотров: 502
Подробнее


Диалоговое окно Options

Интерфейс анализа

В открывшемся окне  SPSS  Viewer  появятся результаты работы статистической

процедуры сравнения средних значений. Нас интересует таблица Report (рис. 5.53). Из нее

можно увидеть, на каком основании SPSS разделила респондентов на два кластера. Таким

критерием в нашем случае служит уровень оценок по анализируемым параметрам. Кла-

стер 1 состоит из респондентов, для которых средние оценки по всем критериям сегменти-

рования находятся на сравнительно высоком уровне (4,40 балла и выше). Кластер 2 вклю-

чает респондентов, оценивших рассматриваемые критерии сегментирования достаточно

низко (3,35 балла и ниже). Таким образом, можно сделать вывод о том, что 93,3 % респон-

дентов, сформировавшие кластер 1, оценили анализируемые авиакомпании по всем пара-

метрам в целом хорошо; 5,4 % — достаточно низко; 1,3 % — затруднились ответить (см.

рис. 5.50). Из рис. 5.53 можно также сделать вывод о том, какой уровень оценок для каж-

дого из рассматриваемых параметров в отдельности является высоким, а какой — низким

(причем данный вывод будет сделан со стороны респондентов, что позволяет добиться

высокой точности классификации). Из таблицы Report можно видеть, что для переменной

Регулирование очереди высоким считается уровень средней оценки 4,40, а для параметра

Внешний вид — 4.72.



6 сентября 2009 | Добавил:admin| | Просмотров: 511
Подробнее


Численность кластеров (решение для 2 кластеров)

Таблицы

Полученное решение несколько отличается от тех, которые вы, может быть, виде-

ли в учебных пособиях по SPSS. Даже в наиболее практически ориентированных учебни-

ках приведены искусственные примеры, где в результате кластеризации получаются идеальные целевые группы респондентов. В некоторых случаях (5) авторы даже прямо указы-

вают на искусственное происхождение примеров. В настоящем пособии мы применим в

качестве иллюстрации действия кластерного анализа реальный пример из практического

маркетингового исследования, не отличающийся идеальными пропорциями. Это позволит

нам показать наиболее распространенные трудности проведения кластерного анализа, а

также оптимальные методы их устранения.

Перед тем как приступить к интерпретации полученных кластеров, давайте под-

ведем итоги. У нас получилась следующая схема определения оптимального числа класте-

ров.

■   На этапе 1 мы определяем количество кластеров на основании математическо-

го метода, основанного на коэффициенте агломерации.

■   На этапе 2 мы проводим кластеризацию респондентов по полученному числу

кластеров и затем строим линейное распределение по образованной новой переменной

(clul6_l). Здесь  также следует  определить,  сколько кластеров  состоят из статистически

значимого количества респондентов. В общем случае рекомендуется устанавливать мини-

мально значимую численность кластеров на уровне не менее 10 респондентов.

■   Если все кластеры удовлетворяют данному критерию, переходим к завершаю-

щему этапу кластерного анализа: интерпретации кластеров. Если есть кластеры с незначи-

мым числом составляющих их наблюдений, устанавливаем, сколько кластеров состоят из

значимого количества респондентов.

■      Пересчитываем  процедуру  кластерного  анализа,  указав  в  диалоговом окне

Save число кластеров, состоящих из значимого количества наблюдений.

■   Строим линейное распределение по новой переменной.

Такая последовательность действий повторяется до тех пор, пока не будет найде-

но решение, в котором все кластеры будут состоять из статистически значимого числа ре-

спондентов. После этого можно переходить к завершающему этапу кластерного анализа

— интерпретации кластеров.

Необходимо особо отметить, что критерий практической и статистической значи-

мости численности кластеров не является единственным критерием, по которому можно

определить оптимальное число кластеров. Исследователь может самостоятельно, на осно-

вании имеющегося у него опыта предложить число кластеров (условие значимости долж-

но удовлетворяться). Другим вариантом является довольно распространенная ситуация,

когда в целях исследования заранее ставится условие сегментировать респондентов по за-

данному   числу   целевых   групп.   В   этом   случае   необходимо   просто   один   раз   провести

иерархический кластерный анализ с сохранением требуемого числа кластеров и затем пы-

таться интерпретировать то, что получится.

Для того чтобы описать полученные целевые сегменты, следует воспользоваться

процедурой сравнения средних значений исследуемых переменных (кластерных центрои-

дов). Мы сравним средние значения семи рассматриваемых критериев сегментирования в

каждом из двух полученных кластеров.

Процедура сравнения средних значений вызывается при помощи меню Analyze ►

Compare  Means  ►  Means. В открывшемся диалоговом окне (рис. 5.51) из левого списка

выберите семь переменных, избранных в качестве критериев сегментирования (ql3-ql9), и

перенесите   их   в   поле   для   зависимых   переменных  Dependent  List.   Затем   переменную

сШ2_1, отражающую разделение респондентов на кластеры при окончательном (двухкла-

стерном) решении задачи, переместите из левого списка в поле для независимых перемен-

ных Independent List. После этого щелкните на кнопке Options.



5 сентября 2009 | Добавил:admin| | Просмотров: 420
Подробнее


Линейное распределение для 16-кластерного решения

Диалоговые окна

Построив линейное распределение по вновь созданной переменной du4_l, мы уви-

дим, что только в двух кластерах (1 и 2) число респондентов является практически значи-

мым. Нам необходимо снова перестроить кластерную модель — теперь для двухкластер-

ного решения. После этого построим распределение по переменной du2_l (рис. 5.50). Как

вы видите из таблицы, двухкластерное решение имеет статистически и практически зна-

чимое число респондентов в каждом из двух сформированных кластеров: в кластере 1 —

695 респондентов; в кластере 2 — 40. Итак, мы определили оптимальное число кластеров

для нашей задачи и провели собственно сегментирование респондентов по семи избран-

ным критериям. Теперь можно считать основную цель нашей задачи достигнутой и при-

ступать к завершающему этапу кластерного анализа — интерпретации полученных целе-

вых групп (сегментов).



3 сентября 2009 | Добавил:admin| | Просмотров: 461
Подробнее


Диалоговое окно Method

Методы анализа, Способы расчета

Первое, что устанавливается в данном окне, — это метод формирования класте-

ров (то есть объединения наблюдений). Среди всех возможных вариантов статистических

методик, предлагаемых SPSS, следует выбирать либо установленный по умолчанию метод

Between-groups linkage, либо процедуру Ward (Ward's method). Первый метод использует-

ся чаще ввиду его универсальности и относительной простоты статистической процедуры,

на которой он основан. При использовании этого метода расстояние между кластерами

вычисляется как среднее значение расстояний между всеми возможными парами наблю-

дений, причем в каждой итерации принимает участие одно наблюдение из одного кла-

стера, а второе — из другого. Информация, необходимая для расчетов расстояния между

наблюдениями, находится на основании всех теоретически возможных пар наблюдений.

Метод Ward более сложен для понимания и используется реже. Он состоит из множества

этапов и основан на усреднении значений всех переменных для каждого наблюдения и по-

следующем суммировании квадратов расстояний от вычисленных средних до каждого на-

блюдения. Для решения практических задач маркетинговых исследований мы рекоменду-

ем всегда использовать метод Between-groups linkage, установленный по умолчанию.

После выбора статистической процедуры кластеризации следует выбрать метод

для вычисления расстояний между наблюдениями (область  Measure  в диалоговом окне

Method). Существуют различные методы определения расстояний для трех типов пере-

менных, участвующих в кластерном анализе (критериев сегментирования). Эти перемен-

ные могут иметь интервальную (Interval), номинальную (Counts) или дихотомическую (Bi-

nary) шкалу. Дихотомическая шкала (Binary) подразумевает только переменные, отражаю-

щие   наступление/ненаступление   какого-либо   события   (купил/не   купил,   да/нет   и   т.   д.).

Другие   типы   дихотомических   переменных   (например,   мужчина/женщина)   следует

рассматривать и анализировать как номинальные (Counts).

Наиболее часто используемым методом определения расстояний для интерваль-

ных   переменных   является   квадрат   евклидова   расстояния   (Squared  Euclidean  Distance),

устанавливаемый   по   умолчанию.   Именно   этот   метод   зарекомендовал   себя   в   марке-

тинговых исследованиях как наиболее точный и универсальный. Однако для дихотомиче-

ских переменных, где наблюдения представлены только двумя значениями (например, 0 и

1), данный метод не подходит. Дело в том, что он учитывает только взаимодействия меж-

ду наблюдениями типа: X = 1,Y = 0 и X = 0, Y=l (где X и Y — переменные) и не учитыва-

ет другие типы взаимодействий. Наиболее комплексной мерой расстояния, учитывающей

все важные типы взаимодействий между двумя дихотомическими переменными, является

метод Лямбда (Lambda). Мы рекомендуем применять  именно данный метод ввиду его

универсальности. Однако существуют и другие методы, например Shape, Hamann или An-

derbergs's D.

145

При указании метода определения расстояний для дихотомических переменных в

соответствующем поле необходимо указать конкретные значения, которые могут прини-

мать исследуемые дихотомические переменные: в поле Present — кодировку ответа Да, а в

поле Absent — Нет. Названия полей присутствует и отсутствует ассоциированы с тем, что

в группе методов  Binary  предполагается использовать только дихотомические перемен-

ные, отражающие наступление/ненаступление какого-либо события. Для двух типов пере-

менных  Interval  и  Binary  существует   несколько   методов   определения   расстояния.   Для

переменных с номинальным типом шкалы  SPSS  предлагает всего два метода:   ÷2  (Chi-

square measure) и ϕ2 (Phi-square measure). Мы рекомендуем использовать первый метод

как наиболее распространенный.

В диалоговом окне  Method  есть область  Transform  Values, в которой находится

поле Standardize. Данное поле применяется в том случае, когда в кластерном анализе при-

нимают участие переменные с различным типом шкалы (например, интервальные и номи-

нальные). Для того чтобы использовать эти переменные в кластерном анализе, следует

провести стандартизацию, приводящую их к единому типу шкалы — интервальному. Са-

мым распространенным методом стандартизации переменных является 2-стандартизация

(Zscores): все переменные приводятся к единому диапазону значений от - 3 до +3 и после

преобразования являются интервальными.

Так как все оптимальные методы (кластеризации и определения расстояний) ус-

тановлены по умолчанию, целесообразно использовать диалоговое окно  Method  только

для   указания   типа   анализируемых   переменных,   а   также   для   указания   необходимости

произвести 2-стандартизацию переменных.

Итак, мы описали все основные возможности, предоставляемые SPSS для прове-

дения кластерного анализа. Вернемся к описанию кластерного анализа, проводимого с це-

лью сегментирования авиакомпаний. Напомним, что мы остановились на шестнадцати-

кластерном решении и создали в исходном файле данных новую переменную clul6_l, рас-

пределяющую все анализируемые авиакомпании по кластерам.

Чтобы установить, насколько верно мы определили оптимальное число кластеров,

построим линейное распределение переменной clul6_l (меню Analyze ► Descriptive Statis-

tics ► Frequencies). Как видно на рис. 5.49, в кластерах с номерами 5-16 число респонден-

тов составляет от 1 до 7. Наряду с вышеописанным универсальным методом определения

оптимального количества кластеров (на основании разности между общим числом респон-

дентов и первым скачком коэффициента агломерации) существует также дополнительная

рекомендация:   размер   кластеров   должен   быть   статистически   значимым   и   практически

приемлемым. При нашем размере выборки такое критическое значение можно установить

хотя бы на уровне 10. Мы видим, что под данное условие попадают лишь кластеры с но-

мерами 1-4. Поэтому теперь необходимо пересчитать процедуру кластерного анализа с выводом четырехкластерного решения (будет создана новая переменная du4_l).



2 сентября 2009 | Добавил:admin| | Просмотров: 380
Подробнее


Диалоговое окно создания новой переменной

Методы анализа, Анализ результатов

Нечасто при проведении кластерного анализа используется диалоговое окно Sta-

tistics, вызываемое одноименной кнопкой в главном диалоговом окне. Оно позволяет орга-

низовать вывод в окне SPSS Viewer таблицы  Cluster Membership, в которой каждому ре-

спонденту в исходном файле данных сопоставляется номер кластера. Данная таблица при

достаточно большом количестве респондентов (практически во всех примерах маркетин-

говых   исследований)   становится   совершенно   бесполезной,   так   как   представляет   собой

длинную последовательность пар значений «номер респондента/номер кластера», в таком

виде не поддающуюся интерпретации. Технически цель кластерного анализа всегда состо-

ит в образовании в файле данных дополнительной переменной, отражающей разделение

респондентов на целевые группы (при помощи щелчка на кнопке Save в главном диалого-

вом окне кластерного анализа). Эта переменная в совокупности с номерами респондентов

и есть таблица Cluster Membership. Единственный практически полезный параметр в окне

Statistics — вывод таблицы Average Linkage (Between Groups), однако он уже установлен

по умолчанию. Таким образом, использование кнопки Statistics и вывод отдельной табли-

цы Cluster Membership в окне SPSS Viewer является нецелесообразным.

Про кнопку Plots уже было сказано выше: ее следует дезактивизировать, отменив

параметр Plots в главном диалоговом окне кластерного анализа.

Кроме этих редко используемых возможностей процедуры кластерного анализа,

SPSS предлагает и весьма полезные параметры. Среди них прежде всего кнопка Save, поз-

воляющая создать в исходном файле данных новую  переменную, распределяющую  ре-

спондентов по кластерам. Также в главном диалоговом окне существует область для вы-

бора объекта кластеризации: респондентов или переменных. Об этой возможности гово-

рилось выше в разделе 5.4. В первом случае кластерный анализ используется в основном

для сегментирования респондентов по некоторым критериям; во втором цель проведения

кластерного анализа аналогична факторному анализу: классификация (сокращение числа)

переменных.

Как видно из рис. 5.44, единственной не рассмотренной возможностью кластерно-

го анализа является кнопка выбора метода проведения статистической процедуры Method.

Эксперименты с данным Параметром позволяют добиться большей точности при опреде-

лении оптимального числа кластеров. Общий вид этого диалогового окна с параметрами,

установленными по умолчанию, представлен на рис. 5.48.



31 августа 2009 | Добавил:admin| | Просмотров: 355
Подробнее


Реклама






Голосование

Оцените работу движка

Лучший из новостных
Неплохой движок
Устраивает ... но ...
Встречал и получше
Совсем не понравился