Методы группировки объектов. Алгоритм K-средних

Методика проведения группировки объектов на основе алгоритма K-средних, используя рандомизацию исходных данных (объединенной центрированной матрицы наблюдений). Оценка требуемого числа итераций. Расчет расстояния от объектов до новых центров кластеров.

Рубрика Математика
Вид практическая работа
Язык русский
Дата добавления 20.09.2011
Размер файла 195,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Государственное образовательное учреждение высшего профессионального образования «Санкт-Петербургский государственный электротехнический университет «ЛЭТИ» им. В.И.Ульянова (Ленина)»

Кафедра БТС

Практическая работа по дисциплине

Автоматизация биомедицинских исследований

тема: «Методы группировки объектов. Алгоритм K-средних»

г. Санкт-Петербург 2011 г.

Задание

Используя рандомизацию исходных данных (объединенной центрированной матрицы наблюдений) провести группировку объектов на основе алгоритма K-средних. При этом:

1) число кластеров K задать равным числу исходных классов наблюдений (2 или 3);

2) в качестве первоначальных центров кластеров z1(1), z2(1) [и z3(1), если K=3] выбрать наиболее удаленные друг от друга объекты;

3) порядок выбора объектов из объединенной таблицы д.б. случайным;

4) использовать обновление центров кластеров до получения устойчивых результатов группировки (схождения алгоритма).

Оценить требуемое число итераций. Сравнить результаты группировки объектов с данными, полученными методом главных компонент.

Рандомизация строк матрицы центрированных значений

Путем перемешивания строк матрицы центрированных значений создадим новую матрицу X. Для удобства сформируем матрицу N, значения которой соответствуют тому, к какому классу принадлежит каждый из объектов новой матрицы Х.

Первая итерация.

А) Выбор начальных центров кластеров.

В качестве начальных центров кластеров выбираются наиболее удаленные друг от друга объекты.

Б) Расчет расстояния от объектов до начальных центров кластеров.

В) Сравниваем расстояния и определяем, к какому кластеру относится объект.

Объединим матрицы Х, N и S. В общей матрице можно будет увидеть, какие объекты попали в другой класс после первой итерации.

Вторая итерация.

А) Сортируем строки матрицы Х1 по возрастанию элементов последнего столбца.

Б) Определяем новые центры кластеров (выборочное среднее).

В) Рассчитываем расстояние от объектов до новых центров кластеров.

Г) Сравниваем расстояния и определяем, к какому кластеру относится объект.

Объединим матрицы Х, N и S2. В общей матрице можно будет увидеть, какие объекты попали в другой класс после второй итерации.

Третья итерация.

А) Сортируем строки матрицы Х2 по возрастанию элементов последнего столбца.

Б) Определяем новые центры кластеров (выборочное среднее).

Как мы видим центры кластеров на второй и третьей итерациях достаточно приближены друг к другу.

В) Рассчитываем расстояние от объектов до новых центров кластеров.

Г) Сравниваем расстояния и определяем, к какому кластеру относится объект.

Объединим матрицы Х, N и S3. В общей матрице можно будет увидеть, какие объекты попали в другой класс после третьей итерации.

Четвертая итерация.

А) Сортируем строки матрицы Х3 по возрастанию элементов последнего столбца.

Б) Определяем новые центры кластеров (выборочное среднее).

Как мы видим в третьей и четвертой итерациях значения центров совпали, значит можно закончить кластеризацию на этом этапе.

Вывод

матрица алгоритм итерация кластер

Сортируем строки матрицы Х3 по возрастанию элементов предпоследнего столбца.

Как мы видим, некоторые объекты второго класса попали в первый и третий кластеры. Это связано с тем, что объекты второго класса имели большой разброс. Так же мы определили, что для кластеризации достаточно трех итераций.

Размещено на Allbest.ru


Подобные документы

  • Граф как совокупность объектов со связями между ними. Характеристики ориентированного и смешанного графов. Алгоритм поиска кратчайшего пути между вершинами, алгоритм дейкстры. Алгебраическое построение матрицы смежности, фундаментальных резервов и циклов.

    методичка [29,4 M], добавлен 07.06.2009

  • Понятие обратной матрицы. Пошаговое определение обратной матрицы: проверка существования квадратной и обратной матрицы, расчет определителя и алгебраического дополнения, получение единичной матрицы. Пример расчета обратной матрицы согласно алгоритма.

    презентация [54,8 K], добавлен 21.09.2013

  • Понятие, виды, функции средней величины и значение метода средних величин статистике. Особенности уравнения тренда на основе линейной зависимости. Парные и частные коэффициенты корреляции. Сущность предела нахождения среднего процента содержания влаги.

    контрольная работа [42,8 K], добавлен 07.12.2008

  • Генеральная совокупность подлежащих изучению объектов или возможных результатов наблюдений, производимых в одинаковых условиях над одним объектом. Описание наблюдаемых значений случайной величины Х. Характеристика статистической функции распределения.

    курсовая работа [216,5 K], добавлен 03.05.2011

  • Применение в статистике конкретных методов в зависимости от заданий. Методы массовых наблюдений, группировок, обобщающих показателей, динамических рядов, индексный метод. Корреляционный и дисперсный анализ. Расчет средних статистических величин.

    контрольная работа [29,5 K], добавлен 21.09.2009

  • Сложение и умножение целых p-адических чисел, определяемое как почленное сложение и умножение последовательностей. Кольцо целых p-адических чисел, исследование свойств их деления. Объяснение данных чисел с помощью ввода новых математических объектов.

    курсовая работа [345,5 K], добавлен 22.06.2015

  • Квази-средние как обобщение классических средних величин. Квази-средние и функциональные уравнения. Решение некоторых функциональных уравнений. Характеристическое свойство квази-средних. Квази-средние и выпуклые функции.

    дипломная работа [412,7 K], добавлен 08.08.2007

  • Исследование сущности и сфер применения метода итераций. Нелинейные уравнения. Разработка вычислительный алгоритм метода итераций. Геометрический смысл. Составление программы решения систем нелинейных уравнений методом итераций в среде Turbo Pascal.

    реферат [183,7 K], добавлен 11.04.2014

  • Тела Платона, характеристика пяти правильных многогранников, их место в системе гармоничного устройства мира И. Кеплера. Агроритм построения треугольника средствами Mathcad. Формирование матрицы вершины координат додекаэдра, график поверхности.

    курсовая работа [644,0 K], добавлен 19.12.2010

  • Определение динамических свойств объектов с помощью дифференциальных уравнений для сравнительно простых объектов. Выражение входной и выходной величины элемента в долях, введение безразмерных координат. График кривой разгона, коэффициент усиления.

    реферат [12,5 K], добавлен 16.05.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.