Статистические пакеты: сравнительный анализ - [2] :: Программы

Статистика 6.0 и NCSS 2007 считают по разному кластерный анализ. Все настройки которые возможны учёл, многократно проверил, даже на всякий случай попробовал разные варианты. Ward`s method, Euclidean distances, Raw data; NCSS - original variables, Scaling method - St.dev. +другие попробовал. NCSS считает cluster cutoff, поставил значение чтоб оставалось 5 кластеров, принадлежность образца к какому либо кластеру записывается в отдельный столбик. В статистике столбик cases, где видно, какой case на какой ветке, можно созерцать на самой диаграмме или выделить и скопировать из customer labels из настроек диаграммы. если сравнить даже какой нибудь небольшой участок в середине одного из 5 основных кластеров создаваемых статистикой и найти в какой кластер из 5 их записала NCSS, то видно что эти же образцы (cases), которые в Статистике стоят рядом явно внутри одного из 5 основных кластеров (даже ближе, они остаются в одном. даже если 10 кластеров выделить) NCSS записала их же в 2-3 разных кластера из 5. Я сравнил в екселе с помощью условного форматирования выделяющего цветом одинаковые значения, вставляю блок cases одного кластера из пяти из статистики и тут же смотрю разброс этих же cases по 2-3 разным кластерам из 5 по мнению NCSS. То есть, значит изза какихнибудь не регулируемых настроек программ, их кластерный анализ не сопоставим? То есть я не могу анализировать свойства cases попавших в один кластер и отличие таковых от cases в другом кластере в статистике, используя cutoff от NCSS. Потому что то что есть один кластер в Статистике, при тех же доступных настройках - микс из кластеров NCSS. (Мне это нужно, потому что в статистике нет функции cluster cutoff, приходится долго вручную выуживать ряды cases относящиеся к 1 кластеру).

Модерирует : gyra, Maz
Версия для печати • Подписаться • Добавить в закладки
Страницы: 1 2