Выдержка из работы:
ВВЕДЕНИЕ
Кластерный анализ объединяет различные процедуры, используемые для про-ведения классификации. В результате проведения этих процедур исходная совокуп-ность объектов разделяется на кластеры или группы (классы) схожих между собой объектов. Под кластером обычно понимают группу объектов, обладающую свойст-вом плотности (плотность объектов внутри кластера выше, чем вне его), дисперси-ей, отделимостью то других кластеров, формой, размером.
Наиболее часто методы кластерного анализа используются в социологии, мар-кетинговых исследованиях, экономике, биологии, медицине, археологии.
Сложность задач кластерного анализа состоит в том, что реальные объекты являются многомерными, то есть описываются не одним, а несколькими параметра-ми, и объединение объектов в группы проводится в пространстве многих измерений, что весьма нетривиально. Кроме того, данные могут носить нечисловой характер
В целом методы кластеризации делятся на агломеративные (от слова агломе-рат – скопление) и итеративные дивизивные (от слова division – деление, разделе-ние).
В агломеративных, или объединенных, методах происходит последовательное объединение наиболее близких объектов в один кластер. Процесс такого последова-тельного объединения можно показать на графике в виде дендрограммы, или дерева объединения. Это удобное представление позволяет наглядно представить кластери-зацию агломеративными алгоритмами.
Разбиение на кластеры происходит с помощью некоторой метрики, например, евклидова расстояния. Задача кластерного анализа состоит в представлении исход-ной информации об элементах в сжатом виде без ее существенной потери.