Архитектура агентов, их классификация и свойства

Принципы работы архитектур агентов. Классификация агентных архитектур. Реагирующая агентная архитектура, ее практическое применение. Консультационная агентная архитектура. Гибридная агентная архитектура. Многоуровневая архитектура для автономного агента.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык русский
Дата добавления 24.02.2014
Размер файла 616,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

56

Содержание

  • Введение
  • 1. Реагирующая агентная архитектура
  • 1.1 Классификация агентных архитектур
  • 2.2 Практическое применение реагирующей агентной архитектуры
  • 2. Консультационная агентная архитектура
  • 2.1 Системы MCY1N и MUD
  • 2.2 Система XPLAN
  • 3. Гибридная агентная архитектура
  • 3.1 Многоуровневая архитектура для автономного агента ("Touring Machine")
  • 3.3 Система InteRRaP
  • Заключение
  • Список использованных источников

Введение

Развитие современной экономики приводит к существенным изменениям в организации производства и сбыта продукции. Высокую эффективность производства сегодня могут обеспечить лишь гибкие и мобильные распределенные производства, обеспечивающие быструю реакцию на изменяющиеся запросы потребителей, изменения на рынках сырья и комплектующих и т.д.

Современные системы логистики, обеспечивающие требуемые реакции путем оптимального перераспределения финансовых, материальных и других ресурсов, в этих условиях оказываются слишком централизованными и, как следствие, слишком жесткими, чтобы справиться с постоянно меняющимися объемами и составом внешних и внутренних потоков заказов и готовых компонент продукции.

Для решения этой проблемы в настоящей время предлагаются мультиагентные системы, которые позволяют построить и промоделировать работу полностью распределенных систем производства и сбыта продукции.

Целью курсовой работы является исследование архитектуры агентов, их классификации и свойств.

Объектом исследования являются принципы работы архитектур агентов.

Предметом исследования являлись учебники, научные статьи, монографии и исследования в логистике и теории искусственного интеллекта.

Основными методами исследования в курсовой работе являются аналитический, логический, системно-структурный.

Структура курсовой работы включает титульный лист, содержание, введение, три раздела с подразделами, заключение, список использованных источников.

1. Реагирующая агентная архитектура

1.1 Классификация агентных архитектур

Общие принципы работы.

В целом, классификация архитектур агентов основывается на парадигме, лежащей в основе принятой архитектуры. Так, архитектура, которая базируется на принципах и методах систем искусственного интеллекта, основанных на знаниях, получила название консультативной или совещательной архитектуры (deliberative agent architecture). А архитектура, основанная на реакции системы на события внешнего мира (reactive architecture), получила название реактивной. Однако среди современных систем искусственного интеллекта практически не существует таких, о которых можно было бы определенно сказать, что они является чисто консулатактивными или чисто реактивными. Подавляющее большинство этих систем является по сути гибридными, имея те или иные черты архитектур обоих типов. Последний подход к построению систем искусственного интеллекта получил название - гибридной архитектуры.

Итак, в настоящее время выделяют три основных вида агентных архитектур:

1. реагирующая (реактивная) архитектура;

2. консультационная (делиберативная) архитектура;

3. гибридная (смешанная) архитектура.

Каждый вид агентной архитектуры выражает различный подход, различную парадигму к построению решающих систем второго рода. Многие нерешенные задачи связаны с концепцией "всезнайства". Это обстоятельство привело к смене всей парадигмы консультационного подхода, на концепцию реагирующих архитектур.

архитектура агент гибридная реагирующая

Впервые идея реагирующих (реактивных) агентов возникла у американского профессора Родни Брукса [1, с.47]. В своих работах Брукс рассматривает две идеи:

1. реальный интеллект не воплощен в системах типа системы доказательства теорем или ЭС. Интеллектуальное поведение может быть реализовано без символьного представления, принятого в классическом искусственном интеллекте.

2. интеллектуальное поведение - результат взаимодействия со средой.

Итак, в значительном числе случаев невозможно сформировать централизованную символическую модель мира и сгенерировать полный план до начала действий агента. Обычно это обусловлено неполнотой априорной информации о среде, которой располагает агент, и изменчивостью среды. При реактивном планировании агент не генерирует весь план заранее как в случае классического планирования. После выполнения одного или нескольких действий агент запускает процедуру перегенерации плана на основе своего текущего состояния.

Другое распространённое название данного подхода - чередование планирования и выполнения. Одним из частных случаев является чередование планирования и обучения (если текущая цель агента обучение) - в этом случае действия агента между генерациями плана направлены на сбор новой информации и совершенствование модели среды. Поведение реактивных агентов можно рассматривать и как запуск некоторого правила поведения из базы знаний, или как результат выполнения априори заданных планов.

Реактивные агенты реагируют на изменения в среде, но они не способны к целеполаганию. Целевые установки реактивных агентов определены априори. Это означает, что описание всех ситуаций, которые могут возникнуть в среде агента, в которых от агента требуется выполнить некоторое действие, заданы агенту до начала его работы. На все остальные ситуации могущие возникнуть в его среде реактивный агент реагировать не будет, они не будут побуждать его к преследованию каких либо целей.

Реактивные агенты не имеют внутренней модели мира, характерной для классического искусственного интеллекта. Внутренняя модель мира реактивных агентов представляет собой набор правил типа "ситуация - действие", каждое из которых выбирается в соответствии с текущей ситуацией. Под ситуацией понимается потенциально сложная комбинация внутренних и внешних состояний.

Таким образом, основное отличие реагирующих агентов от консультационных состоит в том, что первые исходят из конечности знаний о среде, а вторые основаны на концепции "всезнайства".

Брукс для обоснования своих тезисов построил множество роботов (так называемых "моботов"), основанных на так называемой архитектуре регулирующей затраты. Архитектура, регулирующая затраты, - иерархически упорядоченная по степени сложности (по требуемым затратам на выполнение) совокупность всех возможных действий агента. Каждое действие конкурирует с другими в целях управления агентом. Чем ниже в иерархии расположено некоторое действие тем меньше оно требует затрат и тем проще ему получить управление агентом. Так на нижних уровнях представлены более простые действия (типа ухода от препятствий), а на верхних более сложные (например, найти выход из лабиринта). Необходимо заметить, что системы, ориентированные на результат, чрезвычайно просты, если рассуждать в терминах объема необходимых вычислений, без вывода, который определен для систем символического искусственного интеллекта. Но, несмотря на эту простоту, Брукс продемонстрировал агенты, решающие такие задачи, которые и для символических систем искусственного интеллекта выглядели бы весьма внушительно.

2.2 Практическое применение реагирующей агентной архитектуры

Характерным примером мобильных роботов Брукса (или "моботов") может служить тараконоподобный мобот под названием "Чингиз" [2, с.65]. "Чингиз" имеет шесть ног, но совершенно не имеет "центрального мозга". Все его двенадцать двигателей и двадцать один датчик распределены в разложимых сетях без централизованного контроллера. Каждая из шести ног Чингиза работает самостоятельно, независимо от других. Каждая нога имеет собственный управляющий узел - микропроцессор, который управлял действиями ноги. Процесс ходьбы для Чингиза является групповым проектом с участием, по крайней мере, шести отдельных решающих устройств. У данного "мобота", ходьба происходит вследствие коллективного поведения двенадцати двигателей. Два двигателя в каждой ноге поднимают или опускают её, в зависимости от того, что делают другие ноги. Когда они активизируются в правильной последовательности "мобот" движется. Например, два основных движения можно представить так: "Если я - нога, и я вверху, нужно опуститься вниз" или "Если я - нога и я спереди, другие пять должны находиться немного сзади" Эти процессы существуют независимо, происходят всегда, и возбуждаются всякий раз, когда сенсорные предварительные условия истинны. Запустить процесс ходьбы можно задав последовательность подъема ног (это - единственный пример, в котором централизованный контроль очевиден). Как только нога поднята, она автоматически продвигается вперед, и опускается. Когда нога становится на землю, всё тело продвигается вперед. Такое "существо" может идти по плоской гладкой поверхности без запинаний, Для того, чтобы Чингиз прошел через груду телефонных справочников, Брукс установил пару чувствительных контактных усиков, посылающих информацию о поверхности передней паре ног. Сигнал от контактов может приостановить действие двигателя. Правило такое: "Если контактный ус чувствует препятствие - соответствующая нога (правая либо левая) останавливается; если не чувствует, нога идёт дальше".

Брукс выделял четыре типа сущностей, обучению которым должны были быть способны его "моботы" [2, с.77].

1. "картина мира" (например некоторые моботы запоминали расположение препятствий, потенциально облегчая себе, таким образом, повторные прохождения).

2. численная "калибровка" параметров (причём как оценочных, т.е. отвечающих за распознавание ситуаций, так и параметров действий; например, насколько далеко необходимо шагнуть той или иной ноге "Чингиза" при его ходьбе).

3. ситуации, в которых должны применятся те или иные действия, т.е. корректировка поведения.

4. новые поведенческие модули (однако, введение новых поведенческих модулей осуществлялось только при доработках "моботов", т.е. извне, инженерами-разработчиками).

В этом аспекте интересны опыты Брукса по обучению уже упоминавшегося шестиногого "мобота" Чингиз передвижению на пяти, четырёх и даже на трёх ногах. Для этого он установил на "брюшке мобота" чувствительный датчик, срабатывающий при его касании поверхности и ввёл новое правило "не касаться датчиком поверхности" (т.е. не терять равновесия). Первоначально "Чингиз" пытался двигаться (а точнее каждая из его ног) так же как и с шестью исправными ногами, что неизбежно вело к падению и срабатыванию датчика. Однако способность к численной калибровке параметров и к корректировке поведения каждой из ног, в сочетании с правилом "не терять равновесия" вскоре привели к тому, что "Чингиз" стал способен к передвижению в ситуации отсутствия нескольких ног. Естественно, что изменились как ширина шага каждой из ног (численная калибровка), так и последовательность перестановки ног (корректировка поведения).

Другим примером реактивного агента может быть ситуативный автомат. Он не манипулирует с символами, и вообще, автомат не содержит каких-либо символических описаний. Эта технология зависит от возможности представить мир в терминах состояний автомата. Например:

Пусть Агент х содержит информацию Р о состоянии мира S, например S=K (x, P), если для всех состояний мира, в которых х имеет то же самое значение, как и в S, выражение Р истина.

Агент определен в терминах двух компонент: восприятие и действие. Затем используются две программы для синтеза агентов: RULER используется для определения компоненты восприятия, GAPPS - для компоненты действия.

RULER имеет три входа:

· Описание семантики агентных входов (при включении первого входа, "идёт дождь");

· Набор статических фактов ("когда идет дождь, земля мокрая");

· Спецификация переходов состояний мира ("если земля мокрая, она остается мокрой, пока не выйдет солнце").

Затем определяется желаемая семантика выхода (если первый вход включен, то земля - влажна). Все декларативное "знание" было уменьшено до очень простого цикла.

GAPPS в качестве своего входа имеет множество правил "сжатия" цели (существенные правила, которые кодируют информацию о достигаемых целях) и цель верхнего уровня, на основе чего генерирует программу, которая может быть оттранслирована в исполняемый код достижения цели.

Генерация цикла не представляет, не манипулирует символическими выражениями, вся символическая манипуляция выполнена во время компиляции.

По поводу реактивных систем было высказано следующее соображение: "Сила реактивных архитектур основана на их способности использовать локальные образцы активности в окружающей их среде для генерации более или менее внятных (hardwired action) ответов для заданного множества стимулов. Успешное использование этого метода предполагает:

1. полный набор воздействий окружающей среды, требуемый для однозначного определения последовательности действий агента на любое воздействие среды, тогда поведение агента может быть определено ситуативно;

2. агент не имеет глобальных ограничений по задаче, которые необходимо учитывать при ее решении;

3. цель агента может быть представлена в структуре агента неявно.

Если согласиться с мнением, что качество взаимодействия агента со средой определяют уровень интеллекта агента, то агенты с реактивной архитектурой в отличие от консулатактивных архитектур способны приспосабливаться к изменяющимся внешним условиям, но накапливаемые ими знания носят локальный характер типа "стимул-реакция". Взаимодействие агента реактивной архитектуры со средой носит не целевой характер: агент только отображает поведение среды, но не воздействует на неё целенаправленно. Помимо этого, обсуждаемый подход не имеет единой методологии. Вряд ли можно согласиться с представлением о том, что каждая из реактивных систем должна быть вручную настроена в результате большого объема экспериментирования.

2. Консультационная агентная архитектура

2.1 Системы MCY1N и MUD

Консультационная архитектура представляет собой классический подход к построению агентов. Его суть состоит в том, чтобы рассматривать агенты как системы, основанные на концепции всезнайства. Это означает, что все знания, необходимые агенту для решения возникающих перед ним задач, заданы агенту априори. Этих и только этих знаний достаточно агенту для разрешения любой ситуации возникающей перед ним, в его среде.

Рассмотрим далее одну из самых известных систем, архитектуру которую можно отнести к классу консультационных агентных архитектур систему MYCIN.

Система MYCIN была разработана в Стенфордском университете в 1970-х годах [1, с.89]. Задачей системы является диагностика и лечение определенных классов инфекционных заболеваний крови. Диагностирование инфекционных заболеваний "обычным образом" включает в себя разведение культуры вируса. На это требуется около 48 часов, что нередко отрицательно сказывается на здоровье пациента. Так что врачам нужно было быстро найти предположения относительно вероятных причин заболевания по имеющимся данным и использовать эти предположения для подбора лекарств. Часто программу MYCIN считают диагностической, но это не совсем так. MYCIN был разработан частично с целью исследования постановки диагнозов экспертами на основании приблизительных (но важных) предположений, основанных на частичной информации. Однако, потенциально важной для практики была следующая проблема - имеется большое количество молодых докторов или докторов, не являющихся специалистами в данной области, которым иногда приходится ставить такие диагнозы, и если бы имелся какой - либо инструмент, который мог помочь им, тогда это могло бы позволить более эффективно проводить лечение. Фактически, MYCIN никогда не использовалась на практике. Это произошло не из-за её недостатков - на тестировании она превзошла по быстродействию членов Стенфордской медицинской школы. Это произошло во многом из-за этических и юридических проблем, связанных с использованием компьютеров в медицине - если произойдет ошибка, кто будет в этом виноват?

Совершим небольшой экскурс в ту предметную область, в которой используется MYCIN, - в область диагностики и лечения заболеваний крови. Это описание достаточно поверхностное, однако нельзя рассматривать структуру и работу системы в отрыве от той области знаний, с которой данная система имеет дело.

"Антимикробный агент" - это любой лекарственный препарат, созданный для уничтожения бактерий и воспрепятствования их роста. Некоторые агенты слишком токсичны для терапевтических целей, и не существует агента, который является эффективным средством борьбы с любыми бактериями. Выбор терапии при бактериальном заражении состоит из четырех этапов:

1. выяснить, имеет ли место определенный вид заражения у данного пациента;

2. определить, какой микроорганизм (микроорганизмы) мог вызвать данный вид заражения;

3. выбрать множество лекарственных препаратов, подходящих для применения в данной ситуации;

4. выбрать наиболее эффективный препарат или их комбинацию.

Первичные анализы, взятые у пациента, направляют в микробиологическую лабораторию, где из них выращивается культура бактерий, т.е. создаются наилучшие условия для их роста. Иногда уже на ранних стадиях можно сделать заключение о морфологических характеристиках микроорганизмов. Но даже если микроорганизм, вызвавший заражение, и идентифицирован, еще неизвестно (или нет полной уверенности), к каким препаратам он чувствителен.

После 1976 года система неоднократно модифицировалась и обновлялась, но базовая версия состояла из пяти компонентов (рис.2.1) Стрелки на рисунке показывают основные потоки информации между модулями.

Рисунок 1.1 - Система MCY1N

База знаний содержит множество правил заданных в продукционной форме и связанные с ними коэффициенты уверенности. Коэффициенты уверенности устанавливаются для каждого правила в диапазоне [0.1] (0 - правилу нельзя верить; 1 - правило является абсолютно верным).

Динамическая база данных пациентов содержит информацию о конкретных пациентах и их заболеваниях. Эта информация используется для конкретизации поставленной перед системой текущей задачи.

Консультирующая программа задает вопросы, выводит заключения системы и дает советы для конкретного случая, используя информацию о пациенте и знания, хранящиеся в базе знаний системы.

Объясняющая программа отвечает на вопросы и дает пользователю информацию о том, на чем основываются рекомендации или заключения, сформулированные системой. При этом программа приводит трассировку процесса выработки рекомендаций.

Программа восприятия знаний служит для обновления знаний, хранящихся в системе. Обновление знаний происходит путём внесения в систему новых правил и корректировке старых. Стоит отметить, что знания вносятся именно из вне, экспертом в области инфекционных заболеваний, данная система не способна к самостоятельному обучению.

Подсистема, в которую входят компоненты 1, 2 и 3, отвечает за решение проблемы. Эта подсистема строит гипотезы относительно причин заболевания и формирует рекомендации, основываясь на этих гипотезах.

База знаний системы MYCIN организована в виде множества правил в форме:

Если условие (1) и. и условие^) удовлетворяются, То прийти к заключению (1) и. и к заключению (N).

Эти правила преобразованы в операторы языка LISP. Вот как выглядит перевод на обычный язык типичного правила MYCIN:

ЕСЛИ 1) организм обладает грамотрицательной окраской, и 2) организм имеет форму палочки, и 3) организм аэробный, ТО есть основания предполагать (0,8), что этот микроорганизм относится к классу enterobacteriaceae.

Такого рода правила названы оргправилами (ORGRULES) и в них сконцентрированы знания о таких организмах, как strepococcus, pseudonomas и enterobacteriaceae.

Структура управления правилами в MYCIN использует И/ИЛИ-граф и представляет собой следующее:

1) Формулировка каждой подцели всегда представляет собой обобщенную форму исходной цели. Так, если подцель состоит в том, чтобы доказать справедливость суждения "организм - это E. Coli", то формулировка такой подцели - определение типа организма. Этим инициируется исчерпывающий поиск, в который вовлекаются все возможные сведения об организмах.

В множестве правил, подходящих для сформулированной цели, выискивается такое, которое определенно удовлетворяется. Если для заключения об определенном параметре, например о природе организма, подходит несколько правил, то их результаты объединяются. Если коэффициент уверенности какой-либо из выдвинутых гипотез оказывается в диапазоне от - 0.2 до +0.2, то гипотеза отбрасывается.

Если текущая подцель представляет собой лист на графе (терминальный узел), то данные запрашиваются у пользователя. В противном случае устанавливается очередная подцель и выполняется переход на шаг (1).

По завершении процесса диагностики выбирается рекомендуемый курс лечения. Выбор включает две стадии: отбор рекомендуемых медикаментов и предпочтительного варианта или комбинации медикаментов из полученного списка.

В целом метод решения, используемый в системе MYCIN, представляет собой рассуждения в обратном направлении от диагностических гипотез к имеющимся данным, которое направляется правилами вывода. Однако для управления поиском решения (или для доказательства некоторой гипотезы), MYCIN использовал различные метаправила-стратегии. Они были необходимы, чтобы сделать рассуждения более эффективными и предотвратить задание пользователю ненужных вопросов. Одна из стратегий состоит в том, что предварительно задаются пользователю более или менее общие вопросы, которые позволяют системе исключить маловероятные диагнозы. Затем система может сосредоточиться на частностях и использовать в полной мере режим вывода от цели к фактам для доказательства выдвигаемых гипотез. Другие стратегии касаются способов вызова правил. Первая из них проста: используется первое возможное правило, MYCIN первым делом проверяет все заключения правила, чтобы увидеть, является ли какой-либо из них заведомо ложным. Если это не так, то правило используется. Другая стратегия имеет больше отношение к коэффициентам уверенности. MYCIN сначала рассматривает правила, которые имеют более высокий коэффициент уверенности при выводе заключения и правило перестает использоваться, как только суммарный коэффициент уверенности станет меньше 0.2.

Система MUD предназначена для консультирования инженеров при проведении буровых работ на газонаполненных и текучих пластах. Основываясь на описании свойств пластов, система анализирует проблемы, возникающие при таком бурении, и предлагает способы их преодоления. Изменение свойств пластов, такое как внезапное увеличение вязкости в процессе бурения, может возникать вследствие самых различных факторов, например повышения температуры или давления или неправильной рецептуры смеси химических добавок.

Система MUD реализована с помощью языка описания порождающих правил OPS5 (предшественника CLIPS). Правила связывают изменения свойств пластов (в терминологии MUD - абстрактные категории данных) с возможными причинами этих изменений (в терминологии MUD - абстрактные категории решений). Ниже приведено одно из таких правил в переводе на "человеческий" язык.

ЕСЛИ:

обнаружено уменьшение плотности пласта

И

обнаружено повышение вязкости

ТО: есть умеренные (7) основания предполагать, что имеется приток

воды.

В формулировке таких правил числа в скобках - коэффициенты уверенности, которые при "сцеплении" правил комбинируются таким же способом, как и в известной системе MYCIN. Таким образом, для того, чтобы определить достоверность предположения о проникновении воды, нужно принять во внимание все правила, которые "порождают" свидетельства за и против этой гипотезы.

Опыт, приобретенный исследователями в процессе работы над этой системой [7, с.109], показал, что эксперты часто затрудняются сформулировать правила, приемлемые для подхода на основе эвристической классификации. Формат правила далеко не всегда соответствует способу мышления, привычному для экспертов, и способу обмена знаниями, принятыми в их среде. Сложность вызывает и назначение коэффициентов уверенности в констатирующей части новых правил. При этом обычно приходится пересматривать сформулированные ранее правила и сравнивать имеющиеся в них значения коэффициентов. Очень часто эксперты используют коэффициенты уверенности для частичного упорядочения в отношении определенного "заключения". Также отмечалось, что экспертам иногда для правильной формулировки правил нужно располагать довольно подробной информацией о режиме применения правил и распространении значений коэффициентов уверенности в процессе их "сцепления".

При проектировании программ эвристической классификации, таких как MUD, процесс уточнения правил является шестиэтапным.

Эксперт сообщает инженеру по знаниям, какие правила нужно добавить или изменить.

Инженер по знаниям вносит изменения в базу знаний системы.

Инженер по знаниям запускает на выполнение программу, вводит данные, которые ранее уже обрабатывались прежним набором правил, и проверяет, таким образом полноту нового набора.

Если при обработке новым набором правил ранее проверенных исходных данных возникают какие-либо проблемы, инженер по знаниям обсуждает способы их преодоления с экспертом и далее повторяется этап 1.

Эксперт запускает систему и вводит новый вариант данных.

Если при обработке нового варианта не возникает никаких проблем, можно считать очередной сеанс внесения изменений в правила завершенным. В противном случае повторяется вся процедура, начиная с 1-го этапа.

По сути, зачастую производилась "подгонка" коэффициентов, поскольку сам эксперт был не в состоянии адекватно оценить их значения.

2.2 Система XPLAN

Другая система - XPLAN, создавалась в рамках проекта Explainable Expert Systems (Объясняющие Экспертные Системы) [8, с.214]. Идея этого проекта вполне созвучна существующей в настоящее время тенденции группировать и представлять в явном виде знания различного вида. Кроме того, в рамках этого проекта предпринята попытка использовать формальные методы, которые позволили бы зафиксировать в базе знаний системы основные решения, принимаемые в процессе ее разработки. Отсутствие таких формальных методов приводит к тому, что информация об основных решениях, положенных в основу проектирования, теряется на стадии реализации системы.

На рис.1.2 представлена структурная схема системы XPLAN. В базу знаний этой системы входят не только модель и правила предметной области, но и много дополнительной информации. Например, описание терминологии предметной области, информация, связанная с правилами предметной области, о доводах в пользу и против выбора определенной стратегии достижения цели, информация о том, каким целям отдается предпочтение в процессе решения проблемы, и т.д. Знания, выделенные в группу "Интеграция", используются для разрешения конфликтов между правилами предметной области в процессе работы "автоматического программиста", а знания, выделенные в группу "Оптимизация", имеют отношение к производительности экспертной системы, генерируемой этим автоматическим программистом.

Рисунок 1.2 - Структура системы XPLAN

Эти служебные группы знаний представляют те виды метазнаний, которые не связаны непосредственно с выбором правил объектного уровня в процессе логического вывода на этапе функционирования экспертной системы, а имеют отношение скорее к этапу ее проектирования.

Базы знаний системы XPLAN представлена в виде семантической сети, получившей наименование NIKL. Семантическая сеть - один из способов представления знаний. В названии соединены термины из двух наук: семантика в языкознании изучает смысл предложений, а сеть в математике представляет собой разновидность графа - набора вершин, соединённых дугами. В семантической сети роль вершин выполняют понятия базы знаний, а дуги (причем направленные) задают отношения между ними. Таким образом, семантическая сеть отражает семантику предметной области в виде понятий и отношений. NIKL формирует множество концептов (понятий), имеющих собственную внутреннюю структуру (набор слотов), между которыми можно задавать отношения (формировать связи). NIKL также имеет в своем составе классификатор, который, располагая информацией о структуре конкретной сети и новом концепте с определенной структурой, может поместить этот новый концепт на соответствующее ему место в этой сети.

Ещё одним интересным примером делиберативного агента, может служить система Program Enhancement Advisor (PEA) [9, с. 194]. Эта программа предназначена для оказания помощи программистам в повышении "читабельности" текстов программ. В той предметной области, в которой должна работать новая экспертная система, концептами семантической сети являются преобразования элементов программного кода, например замена оператора COND языка LISP на конструкцию IF-THEN-ELSE. Концепт является частным случаем другого концепта, KEYWORD CONSTRUCT, который, в свою очередь, является частным случаем концепта Easy-TO - READ CONSTRUCT. Используя организованную таким образом базу знаний, экспертная система может предложить программисту-пользователю заменить оператор

(COND ( (АТОМ X) X) (Т (CAR X))).

другим оператором, смысл которого более понятен при анализе текста программы:

(IF (АТОМ X) THEN X ELSE (CAR X)).

Знания, которые необходимы непосредственно для решения проблем, также представляются в семантической сети NIKL. Они выражаются в терминах концептов планов и целей, которые организованы в иерархическую структуру. Планы и цели связаны. Каждый план имеет "описание возможностей", в котором представлена информация о том, какие действия можно реализовать с помощью этого плана. Терминологическая информация, хранящаяся в семантической сети, используется генератором программ, например, для того, чтобы собирать воедино отдельные экземпляры концептов.

Генератор программ работает по принципу нисходящего (сверху вниз) уточнения, выполняя декомпозицию целей на подцели. Так, главная цель программы PEA - усовершенствовать программу - разделяется на подцели, например, улучшить читабельность. Разработчики системы назвали такой процесс декомпозиции целей "динамическим уточнением, направляемым пользователем", поскольку характер действий, выполняемых создаваемой системой, определяется инженером по знаниям, формирующим базу знаний. Если выбрана определенная цель, скажем, улучшить читабельность, то она автоматически становится субъектом процесса дальнейшей декомпозиции цель/подцель. Например, следующими подцелями будет просмотр текста программы и выявление в нем синтаксических конструкций, которые можно безболезненно заменить другими, более понятными, получение подтверждения от пользователя, одобряющего предлагаемую замену, выполнение замены и т.д.

В целом, идея агента с консультативной архитектурой вполне логична и высоко привлекательна: реализовать архитектуру в соответствии с некоторой логически ясной теорией с тем, чтобы решение задач агентом представляло бы собой доказательство соответствующих теорем. Если построить агент указанным образом, то естественно будут решены следующие две проблемы:

Проблема представления реального мира в виде точного, адекватного символического описания, формируемого в реальном времени.

Проблема осмысленности представления: как символически представить информацию о сложном реальном мире сущностей и процессов, и как заставить агент использовать эту информацию в реальном времени с целью получения необходимых результатов.

И, действительно, несмотря на огромный объем работ, который был выполнен по машинному доказательству теорем, проблема далека от своего завершения".

В целом, рассмотренные примеры агентов с консультативной архитектурой имеют то общее, что они основываются на концепции "всезнайства", что противоречит следующим общеизвестным положениям: ¦ Каждый объект мира агента бесконечномерен, он может быть охарактеризован лишь бесконечным множеством его свойств.

· Знания агента о мире и входящих в его состав объектах всегда конечны. Каждый объект мира агента всегда обладает рядом ещё не познанных свойств.

· Всякое взаимодействие агента со средой (объектами мира) носит целенаправленный характер.

· Всякое активное целенаправленное взаимодействие субъекта (агента) и объекта мира в одном из своих аспектов носит познавательный характер. В его основе во всех без исключения случаях лежит некоторая задача, которую решает субъект ради достижения своих целей.

· Всякое взаимодействие субъекта (агента) с объектом физического мира приводит к изменению знаний субъекта (агента) об объекте

Другой особенностью рассматриваемых архитектур является некоторое превалирование процесса планирования над всеми сопутствующими (равноценными) процессами, имеющими место при решении сложных задач, - это процессы отслеживания динамики среды агента, динамики взаимоотношений с пользователем и с другими агентами, функционирующими в среде агента. Наконец, рассмотренные архитектуры самодостаточны, они ориентированы на решение исходной задачи, они не предполагают на какое-либо взаимодействие с другими агентами с целью решить более сложную задачу в сравнении с теми, которые доступны каждому агенту в отдельности.

3. Гибридная агентная архитектура

3.1 Многоуровневая архитектура для автономного агента ("Touring Machine")

В ответ на трудности и ограничения на круг решаемых задач возникающие при разработке консультативных и реагирующих агентов были предложены так называемые гибридные системы, в которых сделана попытка объединить достоинства обоих подходов и уйти от их недостатков.

Очевидный подход состоит в том, чтобы построить агент из двух (или более) подсистем: консультативная и реагирующая. Первая компонента содержит символическую модель мира, генерирует планы и реализует их методами символических систем искусственного интеллекта. Вторая компонента способна к реакции на события, происходящие в среде, без участия в сложных рассуждениях. Часто реактивный компонент задан некоторыми прецедентами посредством совещательного модуля, таким образом, агент способен быстро реагировать на важные события окружающей среды. Такой вид структурирования естественным образом ведет к многоуровневым архитектурам. В такой архитектуре подсистемы управления агента упорядочены в иерархию, где более высокие уровни работают с информацией более высокого уровня абстракции. Например, на самом нижнем уровне может быть отображена информация непосредственно с датчиков, или на исполнительный механизм, а самый верхний уровень - долгосрочные цели. Ключевая проблема такой архитектуры состоит в том, чтобы создать структуру управления взаимодействием уровней с включением в нее подсистем агента

В 1992 г. была создана "туристическая" машина, как агент с гибридной архитектурой [7, с.87]. Архитектура содержит подсистемы восприятия и действия, которые взаимодействуют со средой агента непосредственно, и три уровня управления, определяющие структуру управления, обеспечивающую взаимодействие уровней. Каждый уровень независим, активен, параллельно осуществляющий процесс. Эта архитектура разработана для специального приложения автономного агента - подвижного робота. В отличие от большинства других разработок, она рассчитана на реальное приложение, а не только на демонстрационный вариант. В реальном приложении агент имеет дело с непредвиденными событиями внешнего мира, как в пространстве, так и во времени и в присутствии других агентов. При этом он должен сохранять способность адекватно реагировать на них и принимать решения. Но внешний мир невозможно моделировать в деталях. По этой причине архитектура агента и является гибридной. Агент должен иметь архитектуру, которая позволит ему справляться с неопределенностью и неполнотой информации, реагировать на непредвиденные события, пользуясь относительно простыми правилами.

Данная архитектура представлена на рис.2.1 По утверждению автора, эта архитектура демонстрирует хорошее поведение в соответствии с контекстом-состоянием внешней среды. Она включает в себя три уровня, каждый из которых соответствует различным типам способностей агента.

Рисунок 2.1 - Гибридная архитектура для автономного агента ("Touring Machine")

1. уровень реакции на события R поддерживает способность агента быстро реагировать на события, выдаваемые вышележащим уровнем, даже если они ранее не планировались;

2. уровень планирования P генерирует, исполняет и динамически реконструирует частичные планы, например, для выбора маршрута подвижного робота;

3. уровень предсказания, или моделирования M моделирует поведение сущностей внешней среды и самого агента, что может использоваться для объяснения наблюдаемого поведения и предсказания возможного их поведения в будущем.

Каждый из этих уровней имеет модель мира агента на соответствующем уровне абстракции и содержит возможности, соответствующие уровню. Каждый из уровней напрямую связан с компонентой восприятия и действия и в состоянии независимо от других уровней решать, реагировать или не реагировать в текущем состоянии мира. В архитектуру включена Подсистема управления на основе правил, активируемая контекстом с задачей обеспечить подходящее поведение агента в случае конфликта вариантов поведения, инициируемого различными уровнями. Система реализована как комбинация технологии обмена сообщениями и контекстной активации управляющих правил (в соответствии со спецификой предметной области), выступающей в роли посредника, который исследует данные разных уровней (воспринимаемый вход и выходы разных уровней), вводит на различные уровни новые данные и удаляет некоторые данные.

Синхронизация входов и выходов уровней также обеспечивается этой подсистемой. Фактически правила подсистемы выступают в роли фильтра между сенсорами агента и внутренними уровнями агента ("supressors") и между уровнями и их исполнительными элементами ("censors"). Посредничество это остается активным все время работы агента, однако оно прозрачно для уровней, каждый из которых продолжает действовать так, как если бы он был единственным при управлении агентом, не заботясь о возможном конфликте.

Данная архитектура имеет реализацию и, по мнению авторов вполне работоспособна. Она интегрирует в себе ряд традиционных механизмов рассуждений на основе знаний и механизмов чисто поведенческого, реактивного характера. Она является весьма характерным представителем гибридно-организованной агентной архитектуры.

3.3 Система InteRRaP

Система InteRRaP подобна "туристической" машине и имеет многоуровневую архитектуру, с каждым уровнем связан соответствующий уровень абстракции: чем ниже уровень, тем выше уровень абстракции. В InteRRaP эти уровни далее разделены на два вертикальных слоя: один содержит уровни баз знаний, а другой - различные компоненты управления, которые взаимодействуют с базами знаний своего уровня. Самый нижний уровень - компонента управления интерфейсом с миром, и база знаний, соответствующая мировому уровню (рис 2.2).

Интерфейс с внешним миром содержит возможности агента по восприятию событий внешнего мира, воздействия на него и средства коммуникации.

Рисунок 2.2 - InteRRaP-архитектура агента

Компонента, ответственная за реактивное поведение, использует базовые возможности агента по реактивному поведению, а также частично использует знания агента процедурного характера. Она базируется на понятии "фрагмента поведения" как некоторой заготовки реакции агента на некоторые стандартные ситуации. Это позволяет агенту в стандартных ситуациях не обращаться к планированию на основе знаний и реализовывать значительную часть своего поведения рутинным образом с хорошей эффективностью. Из базы знаний ей доступны только знания нижнего уровня абстракции, где содержится информация о фрагментах поведения.

Компонента, ответственная за планирование, содержит механизм планирования, позволяющий строить локальные планы агента, т.е. планы, несвязанные с кооперативным поведением. План представляется в виде графа, узлами которого могут быть либо конкретные наборы действий вплоть до элементарных шагов поведения, либо новые субпланы, подлежащие дальнейшей конкретизации. Таким образом, планирующая компонента активирует поведение (через нижележащую компоненту), направляемое целями. Она же участвует и в планировании, связанном с кооперативным поведением агентов. Эта компонента может использовать знания двух нижних уровней абстракции.

Компонента, ответственная за кооперацию агентов, участвует в конструировании планов совместного поведения агентов для достижения некоторых общих целей или выполнения своих обязательств перед другими агентами, а также выполнения соглашений. Этой компоненте доступны знания всех трех уровней абстракции. База знаний агента имеет трехуровневую структуру и построена по принципу доски объявлений. Уровни базы знаний фактически отвечают уровням абстракции знаний в соответствии со структурой управляющих компонент. Модель мира агента содержит убеждения агента в соответствии с уровнем, ориентированным на поведение. Второй уровень соответствует модели ментальных знаний агента и знаниям о текущем ментальном состоянии агента (намерения, цели, планы).

Наконец, третий уровень содержит знания и убеждения агента о других агентах, информацию о совместных планах, целях и намерениях, т.е. то, что связано с "общественным контекстом". Внутри базы знаний, как уже отмечалось, возможен доступ с верхних уровней к нижним. Например, компонента, ответственная за поведение, не имеет доступа к знаниям о ментальной модели и к знаниям о кооперативном поведении.

Общее управление поведением осуществляется путем коммуникаций между уровнями. При некотором входном событии агент пытается распознать ситуацию во внешнем мире и управление постепенно сдвигается снизу вверх до тех пор, пока не достигнет уровня, способного справиться с возникшей ситуацией.

Очевидно, существует три варианта реакции агента на внешние события:

· реакция с использованием только поведенческого уровня, когда этот уровень находит фрагмент поведения, адекватный ситуации, без явного привлечения локального планирования;

· реакция с использованием локального планирования, когда задача перемещается с нижнего уровня на уровень локального планирования, где и конструируется план;

· реакция с использованием уровня кооперативного планирования, когда поиск плана с уровня локального планирования перемещается дальше на уровень планирования кооперативного поведения

Рассмотрим гибридную систему, разработанную специально для системы здравоохранения. Она включает в себя многоуровневую структуру знаний, рабочую память, менеджера коммуникаций и человеко-машинный интерфейс.

Поскольку данная архитектура должна быть релевантной медицинским приложениям, агент должен обладать обоими типами поведения, как поведением на основе знаний (например, для выбора планов, декомпозиции задач, размещения задач), так и поведением на основе быстрой реакции на события (например, для формирования ответов в реальном времени на поступающие новые данные, изменение имеющихся данных, на изменение текущих соглашений с другими агентами).

В этой архитектуре интеллектуальное поведение поддерживается совместной работой таких компонент, как блок решающих правил для вычисления плана, блок правил для управления задачами, их декомпозицией и размещением, а также блок правил для поддержки соглашений с другими агентами при кооперативном решении задач. Реактивное поведение реализуется с помощью управляющего уровня, который реагирует на изменение состояния рабочей памяти (например, при поступлении новых результатов решения задачи, целей или сообщений, а также при изменении имеющихся данных, целей, между агентных соглашений или состояний задач).

Ключевым моментом данной архитектуры является трехуровневая организация знаний, при этом выделяются следующие уровни:

· Уровень специфических предметных знаний, в котором содержатся медицинские знания о болезнях, знания о планах управления лечением болезней ("протоколы"), база данных о пациентах (истории болезней) и база данных о доступных ресурсах. Однако предметные знания не содержат какой-либо информации о том, как их следует использовать, здесь представлены только свойства предметной области.

· Уровень знаний о процедурах вывода; он содержит декларативные правила вывода, которые должны применяться к предметным знаниям о конкретном пациенте, чтобы вывести новые данные. Этот уровень - основной в архитектуре. В свою очередь он подразделяется на компоненты принятия решений в условиях неопределенности, управления задачами и управления кооперацией агентов. Например, модуль управления задачами содержит декларативную схему вывода для управления переходами состояний задачи. Особенности системы вывода решений состоят в том, что она не использует понятия ментального состояния агента (убеждения, желания, намерения) и не использует какой-либо логический язык для вывода, для этого она использует стратегии аргументации в условиях неопределенности. Менеджер задач ответственен за декомпозицию задач на подзадачи и их распределение по соответствующим агентам, а также за управления переходами состояний задач. Управление кооперацией агентов использует механизм, основанный на взаимных обязательствах агентов ("любой агент согласен предпринимать схему действий, которая имеет целью исполнить задачу за подходящее время"), и соглашениях о том, при каких условиях агент вправе отказаться от своих обязательств и как он должен себя вести по отношению к другим агентам, когда такие обстоятельства возникнут.

· Уровень управляющих знаний, который применяет знания о процессе вывода к предметным знаниям, чтобы генерировать схему вывода, если в рабочую память добавляются новые знания. Авторы убеждены, что такое функциональное разделение знаний на предметные знания, знания о процедурах вывода и управляющие знания существенно упрощает их представление, повторное использование и эксплуатацию, поскольку эти компоненты могут создаваться и поддерживаться независимо. Кроме того, эта архитектура позволяет просто встраивать программы извлечения знаний, каждая из компонент которых может получаться и модифицироваться независимо друг от друга.

Другие три компоненты рассматриваемой архитектуры - это рабочая память, менеджер коммуникаций и человеко-машинный интерфейс.

Рабочая память служит для запоминания текущих данных, генерируемых уровнем управления, пользователя и менеджера коммуникаций. Типы информации, которая хранится в рабочей памяти, таковы: цели, которые должны быть достигнуты; состояния задач, которые находятся в текущем состоянии процесса выполнения соглашений с другими агентами. Фактически, в привычной нам терминологии, рабочая память есть ни что иное, как доска объявлений.

Менеджер коммуникаций содержит в себе сообщения, которые должны быть посланы другим агентам, представленные на языке коммуникаций с примитивами типа примитивов языка KQML: обратиться с просьбой, принять, отвергнуть, изменить, предложить, проинформировать, запросить данные, отказаться и подтвердить.

Человеко-машинный интерфейс определяет схему взаимодействия между системой и пользователем, поскольку данная многоагентная система не является автономной, что связано с личной ответственностью пользователя за здоровье пациента.

Чрезвычайно интересным примером гибридного агента действующего в условиях быстро меняющейся среды в составе многоагентного коллектива является виртуальный "робот-футболист" (или "футбольный агент").

Футбольный агент имеет многоуровневую поведенческую организацию, которая, по мнению авторов, в какой-то мере соответствующую структуре поведенческих функций футболиста-человека. Используя подход с позиций когнитивной психологии, авторы выделяют ряд поведенческих функций футболиста, связанных с мыслительными способностями. Такими функциями являются: оценка позиций партнеров и противников, принятие решений в атаке или защите в положении с мячом или без мяча; обучение при тренинге или в игре путем пополнения знаний о решениях в различных ситуациях игры и др. Эти функции определяют командную стратегию и тактику при противоборстве с противником.

Всех агентов на поле можно разделить на группы. Число групп и их состав определяется текущей стратегией игры. Текущее поведение агента определяется: текущей ситуацией на поле; группой, в которую он входит; текущими стратегическими (тренерскими) установками. Сначала по анализу текущей информации об игровой ситуации определяется категория поведения (атакующее или защитное, активное или пассивное).

Информация об игровой ситуации может быть как визуальной, так и вербальной. После выбора категории поведения, дальнейший выбор осуществляют с помощью оценочных функций или деревьев решений каждой из категории. Некоторые параметры функций задаются текущей стратегией. Кроме того, часть параметров являются адаптивными и меняются

в течение игры при неизменности стратегии. Сами функции могут содержать обучаемые модули, которые настраиваются (тренируются) в учебных ситуациях.

Коммуникации между агентами команды. Задачи коммуникации между распределенными объектами при ограниченной полосе пропускания канала конкретизируются в зависимости от вида информации, которая должна передаваться по коммуникационным каналам и частоты передачи того или иного вида информации. Используется информация о положениях игроков на поле, которая бы дополняла бы информацию каждого игрока и. информация о смене стратегии, как команды, так и группы, в которую входят игроки, так как все игроки команды должны знать о смене стратегии. Лидер внутри группы корректирует действия своей группы. Например, при выборе в качестве поведения пас партнеру сообщается об области, в которую будет сделан пас.


Подобные документы

  • Происхождение термина "архитектура ЭВМ", его содержание. Классическая архитектура ЭВМ и принципы фон Неймана, направления и перспективы ее совершенствования. Архитектура, основанная не на кремниевых технологиях: оптическая, квантовая, нейроархитектура.

    курсовая работа [132,0 K], добавлен 20.11.2013

  • Понятие "архитектура ЭВМ". Принципы построения ЭВМ, которые относятся к архитектуре. Архитектура электронной вычислительной машины, построенной на принципах Фон Неймана. Совершенствование и развитие внутренней структуры ЭВМ. Шинная архитектура ЭВМ.

    контрольная работа [133,5 K], добавлен 02.12.2010

  • Обзор существующих объектных архитектур. Архитектура программного обеспечения. Создание веб-сервиса "Библиотека", предоставляющего механизмы работы с данными на стороне клиентского приложения. WEB-сервис и трехуровневая архитектура в основе приложения.

    лабораторная работа [1,5 M], добавлен 16.06.2013

  • Принцип работы ядра процессора, типы архитектур ядер операционных систем. Сокет(Socket), кэш-память, контроллер ОЗУ, северный мост. Внутренняя архитектура процессоров Intel и AMD: расшифровка названий, технологии процессоров, сравнение производительности.

    реферат [214,9 K], добавлен 05.05.2014

  • Описание нетрадиционных и мультипроцессорных архитектур вычислительных систем. Принципы параллельной и конвейерной обработки данных. Теория массового обслуживания и управления ресурсами компьютерных систем. Базовые топологии локальных и глобальной сетей.

    книга [4,2 M], добавлен 11.11.2010

  • Главный недостаток систем с общей шиной. Использование матричного коммутатора в схемах. Соединения между процессорами с системах с распределенной памятью. Схема соединений процессоров в компьютере BBN Butterfly. Топологии типа гиперкуб. Архитектура NUMA.

    лекция [192,3 K], добавлен 22.10.2014

  • Архитектура ЭВМ как общее описание ее структуры, функций и ресурсов. Схема взаимодействия устройств компьютера согласно архитектуре фон Неймана. Базовый комплекс персонального компьютера. Центральные и периферийные устройства, внутренняя архитектура.

    презентация [335,2 K], добавлен 17.05.2010

  • Особенности и свойства операционной системы UNIX, ее история, файловая структура, функции и отличия от других. Архитектура ядра системы. Понятия диспетчеризации, прерываний, системного времени (таймера), кеша. Проблема построения многопроцессорных систем.

    курсовая работа [35,6 K], добавлен 10.05.2011

  • Классификация Флинна как наиболее ранняя и известная классификация архитектур вычислительных систем, ее структура и содержание, признаки. Общая характеристика используемых классов. Описание и значение других распространенных методов классификации.

    лекция [173,1 K], добавлен 22.10.2014

  • Классическая архитектура компьютера. Понятие разрядной сетки. Устройство ввода-вывода. Арифметическо-логическое устройство, структура регистров АЛУ, куда помещаются исходные и результирующие данные, а также размер регистров (число двоичных разрядов t).

    презентация [1,5 M], добавлен 29.11.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.