Теория управления. Принципы системного анализа
Основные положения теории управления. Структура моделирования происшествий в техносфере. Модели основных функций организационно-технического управления. Понятие и основные принципы системного анализа. Программно-целевой подход к решению системных задач.
Рубрика | Безопасность жизнедеятельности и охрана труда |
Вид | анализ книги |
Язык | русский |
Дата добавления | 18.01.2011 |
Размер файла | 7,6 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
При большом числе факторов т для оценивания параметров линейной функции регрессии (1) можно строить дробные реплики высокой степени дробности. Так, при т=7 можно построить дробную реплику из полного факторного плана 23 для первых трех факторов, приравняв четыре остававшихся фактора к двухфакторным и трехфакторному взаимодействиям трех других факторов, положив, например
(15)
Такую реплику записывают как 27-4.
В общем случае дробную реплику обозначают через 2т-p, если р факторов приравнены к произведениям остальных т--p факторов, уровни которых выбраны согласно полному факторному плану. Дробную реплику 2т-p можно строить различными способами. Для анализа системы смешивания коэффициентов пользуются понятиями генерирующих и определяющих соотношений.
Генерирующими называют соотношения, с помощью которых построена дробная реплика. Так, для реплики, представленной в табл. 5, генерирующим является соотношение х3=x1х2, а это указывает, что фактор х3 занимает в матрице столбец, соответствующий взаимодействию x1x2. Для указанной выше реплики 27-4 генерирующим является соотношение (15).
Определяющим соотношением (определяющим контрастом) называют равенство, в левой части которого стоит единица, а в правой -- какое-либо произведение факторов. Для дробной реплики 2т-p можно получить p различных определяющих соотношений из генерирующих путем умножения обеих частей последних на их левые части с последующей заменой (хi)2 на 1 (i=1, .., т). Другие определяющие соотношения получаются путем перемножения ранее полученных и выделения среди них новых. Например, для реплики (табл. 5) определяющим является соотношение (12).
Построим определяющие соотношения для реплики 27-4, задаваемой генерирующими соотношениями (15). Умножая обе части равенств (15) на их левые части, получаем четыре определяющих соотношения:
(16)
Попарное перемножение этих четырех соотношений дает шесть новых:
(17)
Перемножение каждой тройки из четырех соотношений (16) Дает еще три определяющих соотношения:
(18)
Наконец, перемножая все четыре соотношения (16), получаем
(19)
Легко понять, что кроме (16) - (19), других определяющих соотношений для рассмотренной реплики 2+7-4 нет.
Знание определяющих соотношений позволяет найти всю систему совместных оценок без изучения матрицы планирования дробной реплики. Для того чтобы определить, с какими взаимодействиями смешано данное, нужно на него умножить обе части всех определяющих соотношений.
Определим, например, с какими взаимодействиями смешан главный эффект b3 в дробной реплике 27-4, определяемой генерирующими соотношениями (15). Для этого умножим все определяющие соотношения (16) - (19) на х3. Получим
Следовательно, главный эффект b3 смешан с эффектами взаимодействий первого порядка с эффектами взаимодействий второго порядка третьего порядка четвертого порядка и пятого порядка
В конкретной практической ситуации для выбора подходящей дробной реплики полного факторного плана необходимо использовать все априорные сведения теоретического и интуитивного характера об объекте планирования с целью выделения тех факторов и произведений факторов, влияние которых на результаты измерений существенно. При этом смешивание нужно производить так, чтобы общее среднее b0 и главные эффекты b1,..., bm были смешаны с эффектами взаимодействий самого высокого порядка (так как обычно они отсутствуют) или с эффектами таких взаимодействий, о которых известно, что они оказывают несущественное влияние на результаты измерений. Отсюда следует, в частности, что недопустимо произвольное разбиение полного факторного плана 23 на две части для выделения полуреплики 23-1.
Качество дробного факторного плана иногда характеризуют с помощью разрешающей способности плана, которая равна наименьшему числу символов в правых частях определяющих соотношений. В частности, для плана разрешающей способности III ни один главный эффект не смешан ни с каким другим главным эффектом, но главные эффекты смешаны с эффектами двухфакторных взаимодействий. Для плана разрешающей способности IV главные эффекты не смешаны друг с другом и с эффектами двухфакторных взаимодействий, но последние друг с другом смешаны. Для плана разрешающей способности V главные эффекты и эффекты двухфакторных взаимодействий не смешаны, но последние смешаны с эффектами трехфакторных взаимодействий. Все три рассмотренные выше дробные реплики имеют разрешающую способность III.
12.3 Метод наименьших квадратов
Рассмотрим особенности регрессионного анализа результатов моделирования на примере построения линейной регрессионной модели.
На рис. 3.9 показаны точки (xi, yi), полученные в эксперименте. Делаем предположение, что функция отклика может быть представлена в виде прямой линии
Требуется получить такие значения коэффициентов b0 и b1, при которых сумма квадратов ошибок будет минимальной. На рисунке ошибки ei для каждой экспериментальной точки равны расстояниям по вертикали от этой точки до линии регрессии (рис. 3).
Рис. 3. К построению регрессионной модели
Обозначим (yt)i =b0+ b0xi (здесь (уt)i - величина, предсказываемая регрессионной моделью), тогда выражение для ошибок будет иметь вид а функция ошибки
Для получения коэффициентов b0 и b1 при которых функция F0 будет минимальной, приравняем нулю частные производные dF0 /db0 и dF0 /db1. Будем иметь:
(20)
Таким образом, получена система двух линейных алгебраических уравнений:
(21)
Решая систему этих уравнений, получим
(22)
где N - число реализаций при моделировании.
Мы рассмотрели частный случай для уравнения (22). В более общем случае, когда эмпирическую функцию принимают в виде полинома
(23)
система уравнений типа (22), (23) будет иметь вид
(24)
Для оценки точности совпадения теоретических и экспериментальных данных следует определить среднюю квадратичную ошибку на единицу веса
(25)
или среднее абсолютное отклонение
(26)
где r - число вычисляемых (табличных) значений;
s - число параметров.
Последовательность вычислений при построении уравнения регрессии на основе метода наименьших квадратов рассмотрим на конкретном примере.
Пусть например необходимо подобрать уравнение регрессии по экспериментальным данным, приведенным ниже.
x |
0 |
0.5 |
1.0 |
1.5 |
2.0 |
|
y |
7.0 |
4.8 |
2.8 |
1.4 |
0 |
Вначале попытаемся в качестве типа эмпирической формулы принять линейную зависимость, удерживая в формуле два первых члена:
Составим нормальные уравнения, для чего предварительно заполним таблицу В таблице предусмотрим дополнительные столбцы 4, 5 и 8, которые нам могут потребоваться в дальнейшем (таблица 7).
Таблица 7
x0 |
x |
x2 |
x3 |
x4 |
y |
xy |
x2y |
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
1 |
0 |
0 |
0 |
0 |
7.0 |
0 |
0 |
|
1 |
0.5 |
0.25 |
0.125 |
0.0625 |
4.8 |
2.4 |
1.2 |
|
1 |
1.0 |
1 |
1 |
1 |
2.8 |
2.8 |
2.8 |
|
1 |
1.5 |
2.25 |
3.375 |
5.0625 |
1.4 |
2.1 |
3.15 |
|
1 |
2.0 |
4 |
8 |
16 |
0 |
0 |
0 |
|
5 |
5 |
7.5 |
12.5 |
22.125 |
16 |
7.3 |
7.15 |
Пользуясь данными столбцов 1, 2, 3, 6, 7, составим нормальные уравнения (3.26), которые применительно к нашему случаю при удержании только двух первых членов формулы будут иметь вид:
Подставляя табличные данные, получим:
Решая эти уравнения, найдем: b0 =6,68; b1 = -3,48, следовательно,
Оценим точность выполненных построений. Подставив в полученную формулу значения x (табл. 8), определим вычисленные значения уt и отклонения.
Таблица 8
x |
yt |
y-yt |
(y-yt)2 |
|
0 0.5 1.0 1.5 2.0 |
+6.68 +4.94 +3.20 +1.46 -0.28 |
+0.32 -0.14 -0.40 -0.06 +0.28 |
0.1024 0.0196 0.1600 0.0036 0.0784 |
Суммируя данные последнего столбца, будем иметь:
Средняя квадратическая ошибка на единицу веса
Среднее абсолютное отклонение (5.9) равно
Полученные величины показывают, что формула подобрана неудовлетворительно, так как исходные данные имеют точность до 0,1, а средняя квадратическая ошибка на единицу веса значительно больше 0,1.
Повторим все операции, используя более точное выражение
Для записи нормальных уравнений (7) дополним вспомогательную табл. 3.8 новыми данными, которые приведены в столбцах 4, 5, 8 и выделены курсивом. Составим нормальные уравнения:
После решения этой системы найдем b0=7.00; b1=-4.74; b2=0.63 и запишем искомую зависимость:
Для определения средней квадратической ошибки составим табл. 9.
Таблица 9
x |
yt |
y-yt |
(y-yt)2 |
|
0 0.5 1.0 1.5 2.0 |
7,0 4.79 2,89 1.30 0.04 |
0 +0.01 -0.09 +0.10 -0.04 |
0 0.0001 0.0081 0.0100 0.0016 |
Суммируя последний столбец, получим
Средняя квадратическая ошибка на единицу веса
Среднее абсолютное отклонение
Следовательно, формула вполне удовлетворительно соответствует экспериментальным данным.
Литература
1. Ильина Н.В. Системный анализ и моделирование процессов в техносфере: Учеб. пособие / Н.В. Ильина, Д.Д. Лапшин, В.И. Федянин. - Ч. 1. Воронеж: ГОУВПО «Воронежский государственный технический университет, 2008. - 206 с.
Лекция 13. Кластерный анализ
13.1 Основная цель кластерного анализа
Термин кластерный анализ (впервые ввел Tryon, 1939) в действительности включает в себя набор различных алгоритмов классификации. Общий вопрос, задаваемый исследователями во многих областях, состоит в том, как организовать наблюдаемые данные в наглядные структуры, т.е. развернуть таксономии. Например, биологи ставят цель разбить животных на различные виды, чтобы содержательно описать различия между ними. В соответствии с современной системой, принятой в биологии, человек принадлежит к приматам, млекопитающим, амниотам, позвоночным и животным. Заметьте, что в этой классификации, чем выше уровень агрегации, тем меньше сходства между членами в соответствующем классе. Человек имеет больше сходства с другими приматами (т.е. с обезьянами), чем с "отдаленными" членами семейства млекопитающих (например, собаками) и т.д. Далее мы рассмотрим общие методы кластерного анализ: Объединение (древовидная кластеризация), Двувходовое объединение и Метод K средних.
Заметим, что предыдущие рассуждения ссылаются на алгоритмы кластеризации, но ничего не упоминают о проверке статистической значимости. Фактически, кластерный анализ является не столько обычным статистическим методом, сколько "набором" различных алгоритмов распределения объектов по кластерам". Существует точка зрения, что в отличие от многих других статистических процедур, методы кластерного анализа используются в большинстве случаев тогда, когда вы не имеете каких-либо априорных гипотез относительно классов, но все еще находитесь в описательной стадии исследования. Следует понимать, что кластерный анализ определяет "наиболее возможно значимое решение". Поэтому проверка статистической значимости в действительности здесь неприменима, даже в случаях, когда известны p-уровни (как, например, в методе K средних).
Техника кластеризации применяется в самых разнообразных областях. Хартиган (Hartigan, 1975) дал прекрасный обзор многих опубликованных исследований, содержащих результаты, полученные методами кластерного анализа. Например, в области медицины кластеризация заболеваний, лечения заболеваний или симптомов заболеваний приводит к широко используемым таксономиям. В области психиатрии правильная диагностика кластеров симптомов, таких как паранойя, шизофрения и т.д., является решающей для успешной терапии. В археологии с помощью кластерного анализа исследователи пытаются установить таксономии каменных орудий, похоронных объектов и т.д. Известны широкие применения кластерного анализа в маркетинговых исследованиях. В общем, всякий раз, когда необходимо классифицировать "горы" информации к пригодным для дальнейшей обработки группам, кластерный анализ оказывается весьма полезным и эффективным.
13.2 Объединение (древовидная кластеризация)
Приведенный пример поясняет цель алгоритма объединения (древовидной кластеризации). Назначение этого алгоритма состоит в объединении объектов (например, животных) в достаточно большие кластеры, используя некоторую меру сходства или расстояние между объектами. Типичным результатом такой кластеризации является иерархическое дерево.
Иерархическое дерево
Рассмотрим горизонтальную древовидную диаграмму. Диаграмма начинается с каждого объекта в классе (в левой части диаграммы). Теперь представим себе, что постепенно (очень малыми шагами) вы "ослабляете" ваш критерий о том, какие объекты являются уникальными, а какие нет. Другими словами, вы понижаете порог, относящийся к решению об объединении двух или более объектов в один кластер.
В результате, вы связываете вместе всё большее и большее число объектов и агрегируете (объединяете) все больше и больше кластеров, состоящих из все сильнее различающихся элементов. Окончательно, на последнем шаге все объекты объединяются вместе. На этих диаграммах горизонтальные оси представляют расстояние объединения (в вертикальных древовидных диаграммах вертикальные оси представляют расстояние объединения). Так, для каждого узла в графе (там, где формируется новый кластер) вы можете видеть величину расстояния, для которого соответствующие элементы связываются в новый единственный кластер. Когда данные имеют ясную "структуру" в терминах кластеров объектов, сходных между собой, тогда эта структура, скорее всего, должна быть отражена в иерархическом дереве различными ветвями. В результате успешного анализа методом объединения появляется возможность обнаружить кластеры (ветви) и интерпретировать их.
Меры расстояния
Объединение или метод древовидной кластеризации используется при формировании кластеров несходства или расстояния между объектами. Эти расстояния могут определяться в одномерном или многомерном пространстве. Например, если вы должны кластеризовать типы еды в кафе, то можете принять во внимание количество содержащихся в ней калорий, цену, субъективную оценку вкуса и т.д. Наиболее прямой путь вычисления расстояний между объектами в многомерном пространстве состоит в вычислении евклидовых расстояний. Если вы имеете двух- или трёхмерное пространство, то эта мера является реальным геометрическим расстоянием между объектами в пространстве (как будто расстояния между объектами измерены рулеткой). Однако алгоритм объединения не "заботится" о том, являются ли "предоставленные" для этого расстояния настоящими или некоторыми другими производными мерами расстояния, что более значимо для исследователя; и задачей исследователей является подобрать правильный метод для специфических применений.
Евклидово расстояние. Это, по-видимому, наиболее общий тип расстояния. Оно попросту является геометрическим расстоянием в многомерном пространстве и вычисляется следующим образом:
расстояние(x,y) = {i (xi - yi)2 }1/2
Заметим, что евклидово расстояние (и его квадрат) вычисляется по исходным, а не по стандартизованным данным. Это обычный способ его вычисления, который имеет определенные преимущества (например, расстояние между двумя объектами не изменяется при введении в анализ нового объекта, который может оказаться выбросом). Тем не менее, на расстояния могут сильно влиять различия между осями, по координатам которых вычисляются эти расстояния. К примеру, если одна из осей измерена в сантиметрах, а вы потом переведете ее в миллиметры (умножая значения на 10), то окончательное евклидово расстояние (или квадрат евклидова расстояния), вычисляемое по координатам, сильно изменится, и, как следствие, результаты кластерного анализа могут сильно отличаться от предыдущих.
Квадрат евклидова расстояния. Иногда может возникнуть желание возвести в квадрат стандартное евклидово расстояние, чтобы придать большие веса более отдаленным друг от друга объектам. Это расстояние вычисляется следующим образом (см. также замечания в предыдущем пункте):
расстояние(x,y) = i (xi - yi)2
Расстояние городских кварталов (манхэттенское расстояние). Это расстояние является просто средним разностей по координатам. В большинстве случаев эта мера расстояния приводит к таким же результатам, как и для обычного расстояния Евклида. Однако отметим, что для этой меры влияние отдельных больших разностей (выбросов) уменьшается (так как они не возводятся в квадрат). Манхэттенское расстояние вычисляется по формуле:
расстояние(x,y) = i |xi - yi|
Расстояние Чебышева. Это расстояние может оказаться полезным, когда желают определить два объекта как "различные", если они различаются по какой-либо одной координате (каким-либо одним измерением). Расстояние Чебышева вычисляется по формуле:
расстояние(x,y) = Максимум|xi - yi|
Степенное расстояние. Иногда желают прогрессивно увеличить или уменьшить вес, относящийся к размерности, для которой соответствующие объекты сильно отличаются. Это может быть достигнуто с использованием степенного расстояния. Степенное расстояние вычисляется по формуле:
расстояние(x,y) = (i |xi - yi|p)1/r
где r и p - параметры, определяемые пользователем. Несколько примеров вычислений могут показать, как "работает" эта мера. Параметр p ответственен за постепенное взвешивание разностей по отдельным координатам, параметр r ответственен за прогрессивное взвешивание больших расстояний между объектами. Если оба параметра - r и p, равны двум, то это расстояние совпадает с расстоянием Евклида.
Процент несогласия. Эта мера используется в тех случаях, когда данные являются категориальными. Это расстояние вычисляется по формуле:
расстояние(x,y) = (Количество xi yi)/ i
Правила объединения или связи
На первом шаге, когда каждый объект представляет собой отдельный кластер, расстояния между этими объектами определяются выбранной мерой. Однако когда связываются вместе несколько объектов, возникает вопрос, как следует определить расстояния между кластерами? Другими словами, необходимо правило объединения или связи для двух кластеров. Здесь имеются различные возможности: например, вы можете связать два кластера вместе, когда любые два объекта в двух кластерах ближе друг к другу, чем соответствующее расстояние связи. Другими словами, вы используете "правило ближайшего соседа" для определения расстояния между кластерами; этот метод называется методом одиночной связи. Это правило строит "волокнистые" кластеры, т.е. кластеры, "сцепленные вместе" только отдельными элементами, случайно оказавшимися ближе остальных друг к другу. Как альтернативу вы можете использовать соседей в кластерах, которые находятся дальше всех остальных пар объектов друг от друга. Этот метод называется метод полной связи. Существует также множество других методов объединения кластеров, подобных тем, что были рассмотрены.
Одиночная связь (метод ближайшего соседа). Как было описано выше, в этом методе расстояние между двумя кластерами определяется расстоянием между двумя наиболее близкими объектами (ближайшими соседями) в различных кластерах. Это правило должно, в известном смысле, нанизывать объекты вместе для формирования кластеров, и результирующие кластеры имеют тенденцию быть представленными длинными "цепочками".
Полная связь (метод наиболее удаленных соседей). В этом методе расстояния между кластерами определяются наибольшим расстоянием между любыми двумя объектами в различных кластерах (т.е. "наиболее удаленными соседями"). Этот метод обычно работает очень хорошо, когда объекты происходят на самом деле из реально различных "рощ". Если же кластеры имеют в некотором роде удлиненную форму или их естественный тип является "цепочечным", то этот метод непригоден.
Невзвешенное попарное среднее. В этом методе расстояние между двумя различными кластерами вычисляется как среднее расстояние между всеми парами объектов в них. Метод эффективен, когда объекты в действительности формируют различные "рощи", однако он работает одинаково хорошо и в случаях протяженных ("цепочного" типа) кластеров. Отметим, что в своей книге Снит и Сокэл (Sneath, Sokal, 1973) вводят аббревиатуру UPGMA для ссылки на этот метод, как на метод невзвешенного попарного арифметического среднего - unweighted pair-group method using arithmetic averages.
Взвешенное попарное среднее. Метод идентичен методу невзвешенного попарного среднего, за исключением того, что при вычислениях размер соответствующих кластеров (т.е. число объектов, содержащихся в них) используется в качестве весового коэффициента. Поэтому предлагаемый метод должен быть использован (скорее даже, чем предыдущий), когда предполагаются неравные размеры кластеров. В книге Снита и Сокэла (Sneath, Sokal, 1973) вводится аббревиатура WPGMA для ссылки на этот метод, как на метод взвешенного попарного арифметического среднего - weighted pair-group method using arithmetic averages.
Невзвешенный центроидный метод. В этом методе расстояние между двумя кластерами определяется как расстояние между их центрами тяжести. Снит и Сокэл (Sneath and Sokal (1973)) используют аббревиатуру UPGMC для ссылки на этот метод, как на метод невзвешенного попарного центроидного усреднения - unweighted pair-group method using the centroid average.
Взвешенный центроидный метод (медиана). тот метод идентичен предыдущему, за исключением того, что при вычислениях используются веса для учёта разницы между размерами кластеров (т.е. числами объектов в них). Поэтому, если имеются (или подозреваются) значительные отличия в размерах кластеров, этот метод оказывается предпочтительнее предыдущего. Снит и Сокэл (Sneath, Sokal 1973) использовали аббревиатуру WPGMC для ссылок на него, как на метод невзвешенного попарного центроидного усреднения - weighted pair-group method using the centroid average.
Метод Варда. Этот метод отличается от всех других методов, поскольку он использует методы дисперсионного анализа для оценки расстояний между кластерами. Метод минимизирует сумму квадратов (SS) для любых двух (гипотетических) кластеров, которые могут быть сформированы на каждом шаге. Подробности можно найти в работе Варда (Ward, 1963). В целом метод представляется очень эффективным, однако он стремится создавать кластеры малого размера.
13.3 Двувходовое объединение
Ранее этот метод обсуждался в терминах "объектов", которые должны быть кластеризованы (см. Объединение (древовидная кластеризация)). Во всех других видах анализа интересующий исследователя вопрос обычно выражается в терминах наблюдений или переменных. Оказывается, что кластеризация, как по наблюдениям, так и по переменным может привести к достаточно интересным результатам. Например, представьте, что медицинский исследователь собирает данные о различных характеристиках (переменные) состояний пациентов (наблюдений), страдающих сердечными заболеваниями. Исследователь может захотеть кластеризовать наблюдения (пациентов) для определения кластеров пациентов со сходными симптомами. В то же самое время исследователь может захотеть кластеризовать переменные для определения кластеров переменных, которые связаны со сходным физическим состоянием.
После этого обсуждения, относящегося к тому, кластеризовать наблюдения или переменные, можно задать вопрос, а почему бы не проводить кластеризацию в обоих направлениях? Модуль Кластерный анализ содержит эффективную двувходовую процедуру объединения, позволяющую сделать именно это. Однако двувходовое объединение используется (относительно редко) в обстоятельствах, когда ожидается, что и наблюдения и переменные одновременно вносят вклад в обнаружение осмысленных кластеров.
Так, возвращаясь к предыдущему примеру, можно предположить, что медицинскому исследователю требуется выделить кластеры пациентов, сходных по отношению к определенным кластерам характеристик физического состояния. Трудность с интерпретацией полученных результатов возникает вследствие того, что сходства между различными кластерами могут происходить из (или быть причиной) некоторого различия подмножеств переменных. Поэтому получающиеся кластеры являются по своей природе неоднородными. Возможно это кажется вначале немного туманным; в самом деле, в сравнении с другими описанными методами кластерного анализа (Объединение (древовидная кластеризация) и Метод K средних), двувходовое объединение является, вероятно, наименее часто используемым методом. Однако некоторые исследователи полагают, что он предлагает мощное средство разведочного анализа данных (за более подробной информацией вы можете обратиться к описанию этого метода у Хартигана (Hartigan, 1975)).
13.4 Метод K средних
Этот метод кластеризации существенно отличается от таких агломеративных методов, как Объединение (древовидная кластеризация) и Двувходовое объединение. Предположим, вы уже имеете гипотезы относительно числа кластеров (по наблюдениям или по переменным). Вы можете указать системе образовать ровно три кластера так, чтобы они были настолько различны, насколько это возможно. Это именно тот тип задач, которые решает алгоритм метода K средних. В общем случае метод K средних строит ровно K различных кластеров, расположенных на возможно больших расстояниях друг от друга.
Пример
В примере с физическим состоянием (в пункте 13.3 Двувходовое объединение), медицинский исследователь может иметь "подозрение" из своего клинического опыта, что его пациенты в основном попадают в три различные категории. Далее он может захотеть узнать, может ли его интуиция быть подтверждена численно, то есть, в самом ли деле кластерный анализ K средних даст три кластера пациентов, как ожидалось? Если это так, то средние различных мер физических параметров для каждого кластера будут давать количественный способ представления гипотез исследователя (например, пациенты в кластере 1 имеют высокий параметр 1, меньший параметр 2 и т.д.).
Вычисления
С вычислительной точки зрения вы можете рассматривать этот метод, как дисперсионный анализ "наоборот". Программа начинает с K случайно выбранных кластеров, а затем изменяет принадлежность объектов к ним, чтобы: (1) - минимизировать изменчивость внутри кластеров, и (2) - максимизировать изменчивостьмежду кластерами. Данный способ аналогичен методу "дисперсионный анализ (ANOVA) наоборот" в том смысле, что критерий значимости в дисперсионном анализе сравнивает межгрупповую изменчивость с внутригрупповой при проверке гипотезы о том, что средние в группах отличаются друг от друга. В кластеризации методом K средних программа перемещает объекты (т.е. наблюдения) из одних групп (кластеров) в другие для того, чтобы получить наиболее значимый результат при проведении дисперсионного анализа (ANOVA).
Интерпретация результатов
Обычно, когда результаты кластерного анализа методом K средних получены, можно рассчитать средние для каждого кластера по каждому измерению, чтобы оценить, насколько кластеры различаются друг от друга. В идеале вы должны получить сильно различающиеся средние для большинства, если не для всех измерений, используемых в анализе. ЗначенияF-статистики, полученные для каждого измерения, являются другим индикатором того, насколько хорошо соответствующее измерение дискриминирует кластеры.
13.5 Алгоритм нечеткой кластеризации
Алгоритм нечеткой кластеризации называют FCM-алгоритмом (Fuzzy Classifier Means, Fuzzy C-Means). Целью FCM-алгоритма кластеризации является автоматическая классификация множества объектов, которые задаются векторами признаков в пространстве признаков. Другими словами, такой алгоритм определяет кластеры и соответственно классифицирует объекты. Кластеры представляются нечеткими множествами, и, кроме того, границы между кластерами также являются нечеткими.
FCM-алгоритм кластеризации предполагает, что объекты принадлежат всем кластерам с определенной ФП. Степень принадлежности определяется расстоянием от объекта до соответствующих кластерных центров. Данный алгоритм итерационно вычисляет центры кластеров и новые степени принадлежности объектов.
Для заданного множества К входных векторов и N выделяемых кластеров предполагается, что любой принадлежит любому с принадлежностью , где j - номер кластера, a k - входного вектора. Принимаются во внимание следующие условия нормирования для :
;
Цель алгоритма - минимизация суммы всех взвешенных расстояний :
где q - фиксированный параметр, задаваемый перед итерациями.
Для достижения вышеуказанной цели необходимо решить следующую систему уравнений:
, .
Совместно с условиями нормирования ид данная система дифференциальных уравнений имеет следующее решение:
(взвешенный центр гравитации) и
Алгоритм нечеткой кластеризации выполняется по шагам.
Шаг 1. Инициализация.
Выбираются следующие параметры:
необходимое количество кластеров N, ;
мера расстояний, как Евклидово расстояние;
фиксированный параметр q (обычно ~ 1,5);
начальная (на нулевой итерации) матрица принадлежности объектов xk с учетом заданных начальных центров кластеров .
Шаг 2. Регулирование позиций центров кластеров.
На t-м итерационном шаге при известной матрице вычисляется в соответствии с вышеприведенным решением системы дифференциальных уравнений.
Шаг 3. Корректировка значений принадлежности .
Учитывая известные , вычисляются , если , в противном случае:
Шаг 4. Остановка алгоритма.
Алгоритм нечеткой кластеризации останавливается при выполнении следующего условия:
где - матричная норма (например, Евклидова норма);
- заранее задаваемый уровень точности.
Литература:
1. Ильина Н.В. Системный анализ и моделирование процессов в техносфере: Учеб. пособие / Н.В. Ильина, Д.Д. Лапшин, В.И. Федянин. - Ч. 1. Воронеж: ГОУВПО «Воронежский государственный технический университет, 2008. - 206 с.
Лекция 14. Когнитивное моделирование
14.1 Понятие когнитивного моделирования
При принятии решений в неструктурированных ситуациях у субъекта (ЛПР или эксперта) возникает модель проблемной области, на основе которой он пытается объяснить происходящие в реальности процессы. При этом объективные закономерности реального мира представляются субъективными экспертными оценками. В результате образ наблюдаемой ситуации отражает не только законы и закономерности ситуации, но и мировоззрение субъекта, его систему убеждений, ценностей, уровень образования, опыт и т.д. [Checkland, 1981].
В этих условиях принятие решений - это искусство, включающее рациональные (логические) и интуитивные начала. В синтезе рационального и интуитивного возникает способность ЛПР принимать своевременные и адекватные решения.
Когнитивный подход к поддержке принятия решений ориентирован на то, чтобы активизировать интеллектуальные процессы субъекта и помочь ему зафиксировать свое представление проблемной ситуации в виде формальной модели. В качестве такой модели обычно используется так называемая когнитивная карта ситуации, которая представляет известные субъекту основные законы и закономерности наблюдаемой ситуации в виде ориентированного знакового графа, в котором вершины графа - это факторы (признаки, характеристики ситуации), а дуги между факторами - причинно-следственные связи между факторами [Робертс, 1986].
В когнитивной модели выделяют два типа причинно-следственных связей: положительные и отрицательные. При положительной связи увеличение значения фактора-причины приводит к увеличению значения фактора-следствия, а при отрицательной связи увеличение значения фактора-причины приводит к уменьшению значения фактора-следствия. Пример когнитивной карты некоторой экономической ситуации приведен на рис.1.
Рис.1. Пример когнитивной карты
Причинно-следственный граф представляет собой упрощенную субъективную модель функциональной организации наблюдаемой системы и является «сырым» материалом для дальнейших исследований и преобразований - когнитивного моделирования.
Цель когнитивного моделирования заключается в генерации и проверке гипотез о функциональной структуре наблюдаемой ситуации до получения функциональной структуры, способной объяснить поведение наблюдаемой ситуации.
Основные требования к компьютерным системам когнитивного моделирования - это открытость к любым возможным изменениям множества факторов ситуации, причинно-следственных связей, получение и объяснение качественных прогнозов развития ситуации (решение прямой задачи «Что будет, если …»), получение советов и рекомендаций по управлению ситуацией (решение обратной задачи «Что нужно, чтобы …»).
Узким местом существующих систем когнитивного моделирования ситуаций [Максимов, 1999; Кулинич, 1998; Силов, 1995] является несогласованность их пользовательского интерфейса и алгоритмов обработки с психологическими особенностями субъективного измерения значений и силы взаимовлияния факторов наблюдаемой ситуации. Эта несогласованность приводит к ошибкам и заблуждениям эксперта при определении силы взаимовлияния факторов, которые включаются в когнитивную модель ситуации. Разработка стратегии поведения субъекта на основе когнитивной модели с заблуждениями, естественно, приводит к стратегиям-заблуждениям.
В предлагаемой компьютерной системе концептуального моделирования неструктурированных ситуаций «Канва» влияние заблуждений эксперта ослабляется с помощью специальных программных модулей и подсистем, учитывающих особенности организации человеческой системы измерения, оценки и переработки субъективной информации.
Подсистемы системы концептуального моделирования «Канва» обеспечивают поддержку представления субъективной информации, извлечения предпочтений эксперта, обработку, представление результатов моделирования и поддержку аналитической деятельности эксперта.
Описание функционального назначения всех подсистем системы концептуального моделирования и их взаимодействие в процессе когнитивного анализа и моделирования плохо определенной ситуации приводится ниже.
14.2 Подсистема представления субъективной информации
Подсистема представления субъективной информации обеспечивает:
- Ввод в систему факторов, описывающих ситуацию, множество факторов - F={fi}.
- Задание числовых или лингвистических значений фактора в виде упорядоченного множества их абсолютных значений.
- Графический интерфейс для построения когнитивной модели ситуации в виде ориентированного знакового графа.
В подсистеме представления субъективной информации в качестве измерительных шкал значений наблюдаемых факторов ситуации используются порядковые шкалы, что позволяет интегрировать в единую модель ситуации факторы, имеющие числовые и лингвистические значения.
Когнитивная модель ситуации представляется в виде ориентированного знакового графа и задается матрицей смежности W={wij}, wij{-1,0,1} .
Окно графического редактора системы «Канва» для построения и редактирования орграфа ситуации приведено на рис.2.
Графический интерфейс представляет собой полноценный графический редактор, обеспечивающий: ввод нового фактора, установку причинной связи между факторами, определение направления и типа связи (положительная, отрицательная), удаление фактора, удаление связи, изменение масштаба представления графа.
Рис.2. Окно графического редактора
14.3 Подсистема извлечения предпочтений эксперта
Для определения силы взаимовлияния факторов в систему моделирования встроена подсистема извлечения предпочтений эксперта. В этой подсистеме в качестве исходной информации используется информация о числовых или лингвистических значениях факторов ситуации и знаковый граф ситуации, введенные в подсистеме представления субъективной информации. Исходная информация используется системой для порождения вопросов эксперту, из ответов на которые извлекается информация о силе причинных связей факторов ситуации.
Система обеспечивает генерацию вопросов эксперту и определение силы причинных связей между факторами в трех режимах:
Прямого оценивания. В этом режиме сила причинной связи определяется как передаточный коэффициент, вычисляемый по известным отклонениям фактора причины и фактора следствия. Задание отклонения значений факторов выполняется в двух режимах:
точное задание значений отклонений факторов причины и следствия;
задание отклонения значений факторов причины или следствия в виде нечеткого множества - функции принадлежности, заданной на множестве значений факторов.
Парного сравнения. В этом режиме с помощью процедуры парного сравнения осуществляется упорядочивание факторов причин по силе влияния на фактор следствия. В режиме парного сравнения осуществляется автоматическое обнаружение ошибок (нетранзитивных оценок) эксперта и их автоматическая или ручная корректировка.
Задание функциональной зависимости. В этом режиме значение фактора следствия определяется как функция от значений факторов причин. Этот режим используется в случае, если все значения факторов причин имеют числовые значения и известна их функциональная зависимость.
14.4 Подсистема обработки
После определения силы взаимовлияния всех связанных причинными связями факторов, знаковый орграф преобразуется во взвешенный орграф. Динамика процессов ситуации описывается системой уравнений продукций «Если, … То …». В матричном виде эта система уравнений записывается в следующем виде:
Z(t+1)=WZ(t) (1)
где, Z(t)=(zi(t)) - начальный вектор приращений значений факторов в момент времени t; Z(t+1)=(zi(t+1)) - вектор приращений значений факторов в момент времени t+1, zi(t)[_1,1]; W=|wij| - матрица смежности, wij[-1,1] - характеризует силу причинной связи.
Приращения значений факторов в последовательные дискретные моменты времени Z(t+1), … , Z(t+n) вычисляются с применением следующего правила композиции [Силов, 1995]:
zi(t)=max(zi+(t), zi-(t))
где, zi+(t)= (zj(t-1).wij) - максимальное положительное, а zi-(t) - максимальное по модулю отрицательное zi-(t)= (|zj(t-1).wij)| приращение значения фактора-следствия.
Приращение значения фактора zi(t) Z(t), t, представляется парой [Силов, 1995]: zi(t), ci(t), где, ci(t) - консонанс значения фактора, 0 ci(t) 1,
ci(t)=
Консонанс фактора характеризует уверенность субъекта в приращении значения zi(t) фактора fi. При ci(t)1, т.е. zi+(t)>>|zi-(t)| или |zi-(t)|>>zi+(t) уверенность субъекта в значении фактора zi(t) максимальна, а при ci(t) 0, т.е. zi+(t) |zi-(t)| минимальна. Интервалы значений консонанса в системе «Канва» имеют лингвистическую интерпретацию типа «Невозможно», «Возможно», «Достоверно» и т.д.
Результаты моделирования представляются в виде двумерного массива, строки которого - значения одного фактора в последовательные моменты времени, столбцы - значения всех факторов в последовательные моменты времени. Информация из двумерного массива данных избирательно используется подсистемами представления результатов моделирования и поддержки аналитической деятельности эксперта.
14.5 Подсистема представления результатов моделирования
Результаты моделирования в системе «Канва» представляются в графическом или табличном виде.
Рис.3.
Прогнозные абсолютные числовые и лингвистические значения факторов, а также отклонения значений факторов представляются в графическом виде или в таблицах на естественном и понятном эксперту языке.
На рис.3 показана форма системы «Канва» с представлениями результатов моделирования в графическом виде.
14.6 Подсистема поддержки аналитической деятельности эксперта
Подсистема поддержки аналитической деятельности эксперта является ядром системы концептуального моделирования «Канва». Функциональность и организация этой подсистемы ориентирована на стимуляцию мышления и интуиции эксперта и включает подсистемы:
1. Подсистема объяснения прогноза развития ситуации. Эта подсистема обеспечивает автоматическую генерацию отчета, включающего описание последовательных шагов (причинно-следственных цепочек) получения прогнозного значения любого фактора ситуации. Отчет включает положительную и отрицательную причинно-следственные цепочки. Положительная цепочка объясняет причину увеличения значения признака, а отрицательная его уменьшения.
Рис. 4. Форма расшифровки значения фактора
На рис. 4 Показана форма расшифровки значения фактора «Тариф на транспортные услуги» падает на 35,2%. В этой форме приведено объяснение изменение значения фактора «Тариф на транспортные услуги» при увеличении объема перевозок на 42,4 %. Правый список формы показывает причинно-следственную цепочку увеличивающую (+1,6%), а левый уменьшающую (-35,2%) значение анализируемого фактора.
2. Советующая подсистема. Эта подсистема обеспечивает интеллектуальную поддержку разработки стратегии достижения векторной цели с выдачей рекомендаций (советов) для выбора управляющих воздействий. Для получения совета эксперт из описания векторной цели (это множество факторов и их целевых значений) последовательно выбирает целевые факторы. Система, для каждого выбранного фактора предлагает два множества альтернативных управляющих воздействий. Первое множество включает факторы, значения которых для достижения целевого значения фактора необходимо увеличивать, а второе множество, соответственно, уменьшать. Эксперт, опираясь на собственные предпочтения, может выбрать любой фактор из любого предложенного множества в качестве альтернативного управляющего воздействия. Система, при этом в оперативном режиме отображает, во-первых, рекомендуемую абсолютную величину управляющего воздействия, а во-вторых, результат применения этого управляющего воздействия в графическом виде.
Таким образом, советующая подсистема поддерживает диалоговый режим разработки стратегии достижения векторной цели: эксперт выбирает целевой фактор; система дает ему советы и рекомендации по выбору управляющих факторов; эксперт выбирает управляющий фактор и величину воздействия; система оперативно отображает результаты применения этого воздействия. Советующий режим конструирования стратегии достижения векторной цели раскрепощает мышление и стимулирует интуицию эксперта, позволяет сформулировать множество различных сценариев (стратегий) достижения поставленной цели.
3. Подсистема поддержки сценарного исследования ситуации. Эта подсистема обеспечивает ввод, редактирование, просмотр и активизацию (загрузку) любого сценария. Сценарное исследование различных стратегий достижения цели осуществляется в подсистеме сравнения сценариев развития ситуации. Эта подсистема обеспечивает возможность парного сравнения и анализа двух любых сценариев развития ситуации.
Результаты моделирования: таблицы прогноза развития ситуации, графики, описание сценариев, расшифровки значений факторов в системе «Канва» могут быть распечатаны на принтере или в файл документа «Word».
Таким образом, система «Канва» может быть использована для концептуального анализа и моделирования сложных и плохо определенных политических, экономических или социальных ситуаций, разработки стратегий управления и механизмов их реализации, разработки программных документов стратегического развития страны, региона, предприятия, фирмы и т.д., а также, в качестве инструментария для непрерывного мониторинга состояния ситуации, порождения и проверки гипотез механизмов развития и механизмов управления ситуацией.
Применение системы концептуального моделирования «Канва» значительно расширяет горизонты аналитических возможностей экспертов, освобождая их интеллект от рутинной работы, стимулирует воображение и интуицию для генерации оригинальных решений и находок управления и рефлексивного поведения в запутанной ситуации.
14.7 Моделирование бизнес процессов на основе BPMN-диаграмм
Нотация моделирования бизнес процессов (Business Process Modeling Notation, BPMN) -- графическая нотация для моделирования бизнес процессов. BPMN была разработана Business Process Management Initiative (BPMI) и поддерживается Object Management Group, после слияния организаций в 2005 году. Текущая версия BPMN -- 1.2; ведётся разработка версии 2.0.
Рис. 5. Пример моделирования бизнес процесса в нотации BPMN 1.1: Обработка запроса о товарах
Спецификация BPMN описывает графическую нотацию для отображения бизнес-процессов в виде диаграмм бизнес процессов (ДБП). BPMN ориентирована как на технических специалистов, так и на бизнес пользователей. Для этого язык использует базовый набор интуитивно понятных элементов, которые позволяют определять сложные семантические конструкции. Кроме того, спецификация BPMN определяет как диаграммы, описывающие бизнес процесс, могут быть трансформированы в исполняемые модели на языке BPEL.
Основная цель BPMN -- создание стандартной нотации понятной всем бизнес пользователям. Бизнес пользователи включают в себя бизнес аналитиков, создающих и улучшающих процессы, технических разработчиков, ответственных за реализацию процессов и менеджеров, следящих за процессами и управляющих ими. Следовательно, BPMN призвана служить связующим звеном между фазой дизайна бизнес процесса и фазой его реализации.
В настоящий момент существует несколько конкурирующих стандартов для моделирования бизнес процессов. Распространение BPMN поможет унифицировать способы представления базовых концепций бизнес процессов (например, открытые и частные бизнес процессы, хореографии), а также более сложные концепции (например, обработка исключительных ситуаций, компенсация транзакций).
BPMN поддерживает лишь набор концепций, необходимых для моделирования бизнес процессов. Моделирование иных аспектов, помимо бизнес процессов, находится вне зоны внимания BPMN. Например, моделирование следующих аспектов не описывается в BPMN:
Модель данных
Организационная структура
Несмотря на то, что BPMN позволяет моделировать потоки данных и потоки сообщений, а также ассоциировать данные с действиями, она не является схемой информационных потоков.
Элементы
Моделирование в BPMN осуществляется посредством диаграмм с небольшим числом графических элементов. Это помогает пользователям быстро понимать логику процесса. Выделяют четыре основные категории элементов:
Объекты потока управления: события, действия и логические операторы
Соединяющие объекты: поток управления, поток сообщений и ассоциации
Подобные документы
Сущность и виды риска, основные положения его теории. Концепция приемлемого (допустимого) риска. Последовательность изучения опасностей. Цель системного анализа безопасности, принципы ее обеспечения и средства управления ею. Причины отказов оборудования.
презентация [226,2 K], добавлен 09.02.2014Цели и задачи системного анализа опасности, его этапы и принципы реализации. Исследование и оценка опасных и вредных факторов, возникающих на рабочем месте продавца продовольственных товаров. Производственный шум и вибрация, существующие способы защиты.
контрольная работа [40,3 K], добавлен 22.12.2015Безопасное использование ядерных технологий. Основные принципы построения системы физической защиты. Этапы проведения анализа уязвимости ядерного объекта. Понятие особо важной зоны. Система контроля управления доступом. Перегрузка ядерного топлива.
курсовая работа [1,6 M], добавлен 10.11.2014Методы и функции управления охраной труда. Принципы, направления и задачи государственной политики в области охраны труда в Республике Беларусь. Органы управления государственной системой охраны труда. Система управления охраной труда на предприятии.
реферат [473,1 K], добавлен 25.12.2011Полномочия и основные функции Межрегионального управления № 91 Федерального медико-биологического агентства России. Принципы проведения внеплановой проверки исполнения санитарного законодательства индивидуальными предпринимателями и юридическими лицами.
отчет по практике [25,6 K], добавлен 10.12.2012Задачи, функции, организационная структура и элементы системы управления охраной труда. Обеспечение производственной безопасности, снижение или исключение риска несчастных случаев и аварий. Этапы и принципы внедрения СУОТ. Нормативно-правовая база.
презентация [629,0 K], добавлен 07.02.2016Формирование здорового образа жизни путем системного и комплексного подхода к вопросам профилактики. Совершенствование работы по предупреждению дорожно-транспортных происшествий с участием детей и подростков. Программы развития здравоохранения в РБ.
реферат [687,9 K], добавлен 25.11.2014Понятие управления безопасностью, его сущность и особенности, подходы и методы. Основные мероприятия по обеспечению безопасности населения в чрезвычайных ситуациях, порядок их совершения. Особенности управления безопасностью в медицинских учреждениях.
реферат [148,8 K], добавлен 16.04.2009Понятие и значение, внутренняя структура и принципы работы системы управления охраной труда в РФ. Классификация производственных факторов, их негативное воздействие, оценка условий труда. Профилактика влияния производственных факторов, способы защиты.
дипломная работа [886,4 K], добавлен 29.05.2015Основные положения теории риска. Концепция приемлемого риска. Действие техногенных опасностей. Методические подходы к определению риска. Выявление источников опасностей. Системный анализ безопасности. Причины отказов оборудования на предприятиях.
лекция [75,1 K], добавлен 24.07.2013