Методы оценки нечетких моделей знаний операторов информационно-управляющих систем
Разработка методов дихотомической оценки нечетких моделей знаний операторов информационной системы о государственных и муниципальных платежах. Механизмы и принципы управления базами нечетких моделей знаний операторов, методика и этапы их идентификации.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | диссертация |
Язык | русский |
Дата добавления | 30.01.2014 |
Размер файла | 2,0 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Методы оценки нечетких моделей знаний операторов информационно-управляющих систем
Диссертация на соискание учёной степени кандидата технических наук
Введение
Высокая эффективность функционирования горно-металлургического предприятия (ГМП) обеспечивается комплексом организационных, технологических и технических мероприятий, направленных на установление оптимальных соотношений между ними. К числу таких мероприятий относят повышение уровня механизации и автоматизации производственных процессов; повышение технологической дисциплины производственного персонала; строгое соблюдение положений о ремонтах; повышение квалификации технологического персонала; учет факторов инженерной психологии в системе человек-машина; усовершенствование системы поощрений и наказаний.
Важнейшей задачей такого подхода является задача повышения квалификации технологического персонала и автоматизация горно-металургического производственного процесса. Последнее связано с глобальной информатизацией общества. Работа с информационными ресурсами превращается в основу трудовой деятельности операторов информационно-управляющих систем (ИУС) ГМП. Начинает сказываться фактор ответственности операторов за использование ИТ и информации. ИУС ГМП построенные на базе современных ИТ, превратились в решающий фактор достижения целей ГМП. Изменчивость объектов управления (ОУ), сферы функционирования обуславливает изменчивость требований и запросов операторов ИУС ГМП, а отход от жестко фиксированного множества запросов порождает неопределенность решений операторов ИУС ГМП производственных ситуаций. ИУС ГМП все чаще ориентируются на непрограммирующих операторов как конечных пользователей, и именно переход от процедурности к дискриптивности позволяет операторам эффективно взаимодействовать с ИУС ГМП на всех этапах их жизненного цикла (ЖЦ), получать поддержку и объяснения при решении своих проблем.
Научные разработки коллективов, возглавляемых В.М. Глушковым, В.В. Павловым, А.А. Летичевским, Ф.И. Андоном, Е.Л. Ющенко, Г.Е. Цейтлиным, Ю.В. Капитоновой, Е.М. Лаврищевой и другими ученными, позволяют создавать ИУС, реализовывать и изменять их функциональность не путем программирования, а путем прототипирования, определения и изменения бизнес-логики приложений, не вмешиваясь в код. Задачи управления неявно реализуются в ответ на действия оператора ИУС ГМП над спецификациями. Завершен переход от систем автоматизации разработки программ к гибким технологиям (ГТ) создания компьютеризированных полифункциональных систем (КПС) в целом. КПС ГМП позволяют существенно повысить эффективность разработки и проекта, базируясь на логико-алгебраических формализмах, средства ИИ, объектно-ориентированных анализе и проектировании (ООАП), объектно-реляционных СУБД (ОРСУБД) и инструментальных средах. ГТ обеспечивают функционирование систем поддержки принятия решений (СППР), организуют кооперацию их элементов в процессе реализации предписанных им функций, предоставляют средства разработки, внедрения, развития ИУС в случае изменения бизнес-логики приложения.
Однако современным ГТ свойственна «внешняя» гибкость, предоставление инструментальных средств разработчику для быстрого проектирования и модернизации ИУС. в то же время изменчивость приложений (целей, функций и методов управления), среды функционирования ИУС, потоков требований и запросов операторов, базовых ИТ и комплекса технических средств обеспечивают придание ГТ «внутренней гибкости». Представляется естественным интегрированное исследование средств решения всех упомянутых проблем в рамках разработки технологий создание ИУС.
Развитие ИТ и ИИ в сфере автоматизации управления ГМП уже создали условия для перехода к собственно ГТ, в которых свойства мобильности и гибкости дополняются способностью к самоорганизации и саморазвитию, обеспечиваемых средствами обобщения, классификации, интеллектуального анализа данных (ИАД) и механизмами адаптации. Для этого ГТ должно быть свойственно самоопределение, основанное на многоуровневости, структурированности и комплексности представлений. Эффективная реализация новой концепции возможна лишь при разработке, внедрении, эксплуатации и развития ИУС ГМП, прикладная составляющая которой, базируется на подборе эффективной системы алгоритмов деятельности операторов в условиях неопределенности производственной ситуации и обеспечивает полную функциональность системы, а взаимодействие компонентов ИУС осуществляется благодаря системным средствам.
Таким образом, выкристаллизировалась важная научно-техническая задача исследования процессов разработки, внедрения, эксплуатации, развития, адаптации и самоорганизации организационно-технических объектов управления (ОТОУ) ИУС ГМП, а также разработки новых эффективных алгоритмов деятельности операторов ИУС ГМП в условиях неопределенности и риска. Общая направленность этих исследований - переход от локальных, с элементами мобильности и гибкости, CASE-технологий разработки ПО к комплексным гибким технологиям (КГТ). КГТ интегрируют новые эффективные пути развития ИТ. Необходимо разработать, исследовать и реализовать концепцию КГТ создания ИУС, которая охватывает все процессы ЖЦ ОТОУ. Эта концепция обобщает возможности гибких и мобильных технологий, дополняет их комплексом методов и моделей формализации процессов, подлежащих компьютеризации. Кроме того КГТ дополняет концепцию набором средств ИАД, адаптации и интеграции разнообразных механизмов разработки, функционирования и развития. Это позволяет интегрировать разные механизмы вывода, построения алгоритмов конструирования неопределенных решений операторов, алгоритмические методы и модели нечетких знаний операторов и т.п., что существенно облегчает, удешевляет и ускоряет создание ИУС для широкого класса ОТОУ.
Создание ИТ не представляется возможным без соответствующего решения проблем алгоритмизации деятельности оператора в условиях неопределенности и риска. Усилиями многих ученых, из которых, в первую очередь, следует назвать Гаврилову Т.А., Ходакова В.Е., Воинова Т.А., Григоряна Р.Д., Петрова К.Э, Стефанюка В., Орванта Дж. и др., разработка таких алгоритмов была систематизирована, создана система базовых алгоритмов решения многих классов задач, получены оценки алгоритмов [19, 22, 23, 30, 44, 70-74, 79, 105-107]. На сегодня проблема стоит гораздо шире - для обеспечения эффективности функционирования ОТОУ в современных условиях возникла необходимость разработки систем новых высокоэффективных взаимосвязанных алгоритмов нечетких моделей производственных процессов, которые позволили бы эффективно решать задачи автоматизации сложных объектов в комплексе. В настоящей диссертации эта задача решена для ИУС вибромониторинга оборудования эксгаустерного отделения аглоцеха №1 ОАО «АрселорМиттал Кривой Рог».
Связь работы с научно-исследовательскими программами и темами организации. Диссертационное исследование выполнено в соответствии с планами Министерства образования и науки Украины по разработке управляющих информационных систем и программных информационных технологий. В рамках этих планов результаты исследований связаны с целевой научно-практической темой Министерства промышленной политики «Разработка теории, методов и алгоритмов для создания интеллектуальных информационно-аналитических систем управления» (№гос. регистрации 0100U000718), темой «Розробка принципів та методів опису багатофакторних процесів в екосистемі», утвержденной приказом Министерства образования и науки Украины №37 от 13.02.97, темой Европейского университета «Економічні проблеми теорії і практики менеджменту сталого розвитку економічних систем» (№гос. регистрации 0101U000735), темой Криворожского филиала Европейского университета «Экономические, информационные и экологические аспекты энергосберегающих технологий в горно-металлургическом комплексе» (№ гос. регистрации 0106U003253), темой «Стратегія економічного розвитку промислових підприемств та організацій регіонального ресурсопостачання (забезпечення)» (№ гос. регистрации 0108U001335). Результаты диссертационных исследований используются для подготовки специалистов в области компьютерных наук Европейского университета на кафедре информационных технологий. Согласно акта (приложение А) результаты исследования внедрены в процесс разработки актуальных тем Криворожского института автоматики.
Целью диссертационной работы является повышение качества функционирования информационно-управляющих систем за счет более эффективного использования методов оценки нечетких моделей знаний операторов ИУС ГМП.
Для достижения поставленной цели нужно решить следующие задачи:
- разработать методы дихотомической оценки нечетких моделей знаний операторов ИУС ГМП;
- управления базами нечетких моделей знаний операторов ИУС ГМП;
- идентификации нечетких моделей знаний операторов ИУС ГМП.
Объектом настоящих исследований являются нечеткие модели знаний операторов ИУС ГМП.
Предметом исследований является класс плохо структурированных и неструктурированных задач ИУС ГМП, требующих обработки неполных, нечётких или противоречивых моделей знаний, а также трудно или вообще не формализуемых.
Методы исследований, реализованные для достижения цели работы, основаны на развитии существующих методов и подходов, а также создании новых, адекватных рассматриваемым процессам, происходящим в решаемых задачах. Исследования осуществлялись с использованием методов системного анализа (методология мягких систем, структурная и функциональная декомпозиция системы, функционально-структурный анализ, методы имитационного моделирования), методов теории нечётких множеств и нечеткой логики. Сравнительная оценка полученных результатов выполнялась с использованием статистических методов прогнозирования временных рядов (метода нелинейной регрессии).
Экспериментальные исследования выполнены с использованием программных пакетов STATISTICA Neural Networks V. 4.0, NeuroSolutions 4.10 фирмы Neuro-Dimentions, а также пакетов Simulink & Toolboxes MATLAB. Программные модули реализованы на языке программирования C# и Delphi.
Научная новизна полученных результатов
В диссертационной работе поставлена и решена актуальная проблема развития теоретических основ проектирования и создания ИУС управления нечёткими моделями знаний. Научная новизна работы определяется следующими основными результатами:
- приведены новые научные результаты, которые в соответствии с целью исследований в целом есть решением актуальной проблемы повышения качества функционирования ИУС за счет более эффективного использования методов оценки нечетких моделей знаний ИУС горно-металлургических предприятий;
- впервые предложен новый подход к проектированию ИУС ГМП нечёткими моделями знаний операторов, основанный на системной интеграции технологий искусственного интеллекта (теория нечётких множеств и нечёткой логики) с точными методами и моделями поиска решений, а также методами имитационного моделирования; предложенный подход позволяет создавать ИУС, обеспечивающие решение сложных, неструктурированных задач оценки нечетких моделей знаний в условиях статистической и структурной неопределённостей, обучающиеся на накопленном опыте и адаптирующиеся к изменениям условий функционирования;
- впервые использование разработанных в работе методов управления нечеткими моделями знаний позволяют значительно повысить эффективность оценки полученных знаний операторов при условии моделирования процессов подготовки и тестирования знаний, системной взаимодействии оператора и модели, которые имитируют предвиденные производственные ситуации и ситуации, которые характеризуются условиями неопределенности и риска;
- впервые разработан алгоритм процесса оценки нечетких моделей знаний операторов ИСУ эксгаустера ГМП, включающая описание статического и динамического режимов взаимодействия. С точки зрения класса формализации нечеткая модель знаний является интегральным уравнением Вольтерра 1-го рода;
- получил дальнейшее развитие новый подход к оценке эффективности ИУС ГРП. Установлено, что результаты управления зависят только от начального и конечного состояния информационно-управляющей системы.
Полученные в данной работе новые научные результаты, включающие в себя аналитические исследования алгоритмов деятельности операторов в условиях неопределенности и риска производственных процессов, формирования технологии проектирования ИУС, а также модели, алгоритмы, методы идентификации математических моделей, методики, отдельные формулы и соотношения, дополняют фундаментальное содержание математической теории системных и реальных тестов, обогащают научные основы построения ИУС, ставят на более высокую ступень задачи формирования баз нечетких моделей знаний ИУС.
Обоснование и достоверность научных положений и выводов, сформулированных в диссертации, обеспечивается математической строгостью и корректностью использования основ теории нечётких множеств и нечеткой логики при выведении основных зависимостей для построения информационно-управляющих систем нечеткими моделями знаний операторов ГМП. Кроме того многократным тестированием теоретических разработок на примерах, выполненными вычислительными экспериментами, а также сопоставлением с результатами решения выбранных прикладных задач с использованием методов и подходов, ранее известных в литературе.
Практическая ценность полученных результатов. Разработанный подход к проектированию ИУС ГМП позволяет создавать более универсальные системы, обеспечивающие возможность:
- эффективно решать сложные задачи в условиях неопределённости;
- ускорить процесс поддержки принятия решений;
- существенно повысить качество принимаемых решений.
Полученные в диссертационных исследованиях результаты имеют большое практическое значение, внедрены в системы и перспективные технологии, основанные на нечетких моделях знаний, позволяющих повысить их гибкость, эффективность, уровень автоматизации, а также объективность рекомендаций и оптимальность принимаемых решений.
Предложенные в диссертационной работе методология проектирования, алгоритмы и разработанная на их основе ИУС были использованы для решения важных производственных задач, в частности для разработки ИУС эксгаустера аглоцеха №1 ОАО «АрселорМиттал Кривой Рог» и оценки знаний студентов при модульной технологии подготовки.
Личный вклад диссертанта. В диссертации обобщены результаты теоретических и прикладных исследований в области моделирования процессов принятия решений диагностики и мониторинга в условиях неопределенности и риска на основе нечётких моделей знаний, а также проектирования ИУС в диагностике современного промышленного оборудования, выполненные диссертантом самостоятельно или при непосредственном участии.
Апробация результатов диссертации. Основные концепции, положения и результаты работы докладывались на ІX, Х Международной научно-практической конференции «Информационные технологии в образовании и управлении» (Новая Каховка, 2006, 2007, 2008), ІX, X, XI, XII Международных научно-практических конференциях Европейского университета «Інформаційні технології в економіці, менеджменті і бізнесі» (Київ, 2004, 2005, 2006, 2007, 2008).
Публикации. По теме диссертации опубликовано 11 работ, из них 6 - в ведущих научных журналах и изданиях ВАК Украины.
Структура и объём диссертации. Диссертация состоит из перечня условных сокращений, введения, 5 глав, выводов, списка использованных источников (152 позиции) и 3 приложений на 32 страницах. Общий объём диссертации составляет 212 страниц, включая 22 рисунка и 6 таблиц. Основное содержание изложено на 179 страницах.
1. Анализ предметной области и постановка задач исследований
1.1 Анализ методов оценки нечетких моделей знаний операторов информационно-управляющих систем
Особенностью ИУС является слабая формализация процессов организационно-технологического управления (ОТУ) и многокритериальность в процессе принятия решений. Неадекватность процессов воздействия окружающей среды моделям принятия решений, формируется на базе многомерных эвристик, в условиях неопределенности идентифицируемого состояния внешней среды и риска при управлении. Исходя из этого особенности многокритериального процесса ОТУ, следует искать в классе задач ИУС с развитой базой знаний. На основе полученной базы знаний определяют эффективность принятых решений и оцениваются нечеткие модели знаний операторов на компьютерных тренажерах, отражающих реальные процессы ОТУ на модельном, математическом и эвристическом уровнях. В этой связи возникла задача анализа методов оценки нечетких моделей знаний операторов ИУС.
Проблемы оценки нечетких моделей знаний можно считать основополагающими применительно к любой стратегии получения знаний или к любому способу подготовку. Главной особенностью любого процесса оценки нечетких моделей знаний является принципиальное отличие этого процесса от процессов измерения физических величин. Это отличие состоит в том, что контролируемая категория - «нечеткие модели знания» - не может быть измерена непосредственно, не имеет эталона, и является латентным (скрытым) признаком. Попытки ввести понятие меры эталона нечетких моделей знаний неизбежно приводят к одному, - о знании оператора мы можем судить лишь косвенно, по его действиям в некоторых производственных ситуациях. В самом деле, можно считать оператора «знающим», который может воспроизвести некоторый объем информации, либо решить заданное количество задач (умение), либо выполнить некоторые действия с обеспечением данного эффекта (навыки). Однако в любом случае это будет лишь условная оценка знаний. Под контролем уровня знаний в этом случае мы будем далее подразумевать систему правил, предписывающих поведение оператора таким способом, чтобы по реакции его можно было бы составить представление об его уровня знании в виде некоторой модели. Наиболее широко применяемым видом измерения уровня знаний является тестовый контроль, где контрольными реакциями оператора являются ответы на вопросы, совокупность которых и образует тест. Достоинством тестового контроля является, прежде всего, его экономичность, как в самом смысле сравнительной простоты разработки вопросов, так и в смысле практической реализации.
В настоящей диссертационной работе делается попытка построения общей теории гибкого управления нечеткими моделями знаний с помощью дихотомических тестов, позволяющей решать главную практическую задачу - синтезировать дихотомические тесты оценки нечетких моделей знаний. При этом под гибким управлением, в узком смысле, подразумевается тест, позволяющий получить максимум информации о латентном признаке оператора - его знании. Если считать главным назначением контроля знаний вообще и тестового, как его разновидности, в частности, то и установление некоторой системы представлений о нечетких моделях знаний интеллектуального объекта в виде модели можно отнести к особому виду моделирования - информационному моделированию. Анализ ранее проведенных исследований Р. Аткинсона, Г. Бауэра, Э. Кротерса, С.А. Батугина, Э.А. Майдановской и М.С. Бернштейна [7-9] показывает, что в подавляющем большинстве рассматривается одна и также разновидность теста, а именно: совокупность вопросов с приведенными ответами к ним и необходимостью для исследуемого объекта выбрать верный (неверный) ответ. Наиболее четко методологические предпосылки тестирования изложены в работе П. Лазарфельда [45], основным выводом которой является обоснование возможности оценки латентных параметров на основании данных эксперимента, т.е. применение теста. Следуя ей, будем рассматривать далее результаты исследований применительно лишь к так называемым дихотомическим тестам.
В одной из ранних работ Т.А. Ильиной [32] достаточно четко отмечены недостатки тестовой системы, применяемой за рубежом. Там же признавалось, что в США подавляющее большинство тестов дихотомического типа имеют выборочные ответы. По мнению М.С. Бернштейна [9], необходимо учитывать, что метод тестов не может претендовать на исключительное положение, что он никак не отмечает и не заменяет всех остальных методов исследований. Эти проблемы обсуждались и на международных семинарах по методологии подготовки операторов и методике исследований их систем подготовки. Оценка возможностей теста (в виде набора m вопросов) в плане его прямого назначения - контролировать нечеткие модели знаний испытуемых - связана с необходимостью оперировать числом верных ответов или так называемым «баллом теста». Практически все исследования, так или иначе затрагивающие эту проблему, опираются на отношение как на величину, позволяющую прямо или косвенно оценивать нечеткие модели знаний оператора. Так в работах В.А. Королева и В.И. Приходько [45] отношение числа верных ответов к общему числу вопросов определяется как коэффициент оценки; процент правильных ответов операторов используется как определяющий фактор в методических разработках службы педагогического тестирования США. Предел отношения при увеличении объема теста рассматривается как понятие истинной успешности подготовки оператора, т.е. балл теста связан с критерием усвоения знаний оператором для тестов всех уровней. Вместе с тем для большинства работ, выполненных в области исследования свойств тестов, характерным является вероятностный подход к тестовому баллу. Прямо или косвенно признается, что практически все количественные показатели тестирования являются случайными и поэтому исследование этих показателей требует использования методов математической статистики. Так в работах Н.Н. Ржецкого [87] отмечается, что при наблюдении факта верного ответа на некоторый вопрос реального теста можно говорить лишь о вероятности знаний оператора, т.е. сознательного выбора этого ответа. Эти же мысли приводятся в работах других исследователей в области практического контроля знаний: В.Я. Ожогина [49], Л.М. Зарецкого [25], В.М. Полонского [50] и других. Нельзя не отметить, что наиболее строго методологические обоснования необходимости вероятностного подхода к тестовому контролю изложены в работах Л.Б. Ительсона [30], Т.Э. Аврушкиной [1], Е.К. Войшвилло [11], а также в ряде работ зарубежных исследователей [65, 66, 68].
Но все, же главная причина малой популярности приложений теории тестов оценки знаний, разработанной, главным образом, в трудах зарубежных социологов, заключается, видимо, в другом. Частично эта причина состоит в общей ограниченности применения стохастических критериев и математических тестов в социологии из-за сложности социальных явлений и тем, что социолог имеет дело с фактами не только объективными, но и субъективными; кроме того, эти трудности связаны с тем, что в социологии очень трудно свести к минимуму связь между наблюдаемым явлением и наблюдателем. Таким образом, представления о могуществе статистических методов, о возможности получения только с их помощью новых закономерностей послужило, возможно, причиной явного противодействия их использования, в частности, в практике контроля знаний. Следуя теореме Гёделя, установлено, что в замкнутой системе аксиоматических определений, правил, методов могут существовать истины, выражаемые на языке этой системы (например, уровень знаний и т.п.), однако эти истины нельзя вывести из системы, как бы ни задавались аксиомы и конечные детерминированные правила вывода (например, правила статистической обработки итогов тестирования). Таким образом, использование статистического метода при построении теории тестов и практике их использования для контроля знаний возможно лишь при условии глубокого проникновения в дидактическую и психологическую сущность процесса. Это означает, в частности, что существующие разработки в теории тестов не всегда могут быть перенесены в теорию оценки знаний непосредственно, а иногда и вовсе оказываются непригодными в силу исходных допущений и предпосылок. Аналогичное положение по отношению к кибернетическим методам управления познавательными процессами отмечается в работе Н.Ф. Талызиной [63]. Вместе с тем, многие понятия, определяющие свойства тестов, приемы статистического моделирования процесса контроля, методы статистической обработки результатов тестирования, как и методы синтеза самих тестов, разработанные зарубежными социологами, могут оказаться полезными. Характерно, что попытки описания свойств как теста в целом, так и отдельных его вопросов, встречаются в работах, освещающих практику контроля знаний, довольно часто. Так, например, понятие «критерия оценки» и др. вводятся авторами с целью глобального описания теста, установления связи между баллом теста (числом верных ответов ) и оценкой знаний исследуемого объекта. Однако тот факт, что такая связь не является детерминированной, большей частью лишь признается формально, но не учитывается по существу. Стремление связывать балл теста с уровнем знаний едиными «нормами» означает также пренебрежение проблемой рассеяния свойств вопросов, образующих тест. Вполне возможно, что для тех тестов, которыми оперирует исследователь, любой им определенный уровень статистически достоверен и дает вполне удовлетворительные результаты. Но для других тестов такая установка может оказаться совершенно неприемлемой, особенно при формировании знаний когнитологов.
Следует обратить внимание на необходимость исследования сравнительных свойств вопросов теста. Определяя вопрос теста как порцию, учебный элемент, качество усвоения которого и проверяется тестом. Однако чрезвычайно важно сформулировать вопрос по этому элементу знаний, предполагая достоверным факт нечетких моделей знаний при условии получения верного ответа. Более четко формулируется задача оценки сравнительных свойств вопросов теста, где вводится понятие «диагностического веса» вопроса - как отношение числа ответивших верно на все вопросы к числу ответивших верно на данный вопрос. Но и здесь упускается из виду важный момент - диагностический вес вопросов в таком (или другом) определении суть случайная величина и для ее описания требуется, прежде всего, знание закона распределения.
Развитием идей о гносеологической сущности информационного моделирования является сформировавшийся ныне информативный подход к автоматизированному контролю знаний операторов с помощью тестов. Успехи науки в области теории информации показывают явную аналогию процесса контроля знаний операторов и процессов преобразования информации, побуждает исследователей все шире привлекать этот аппарат к практическим задачам тестового контроля. Безусловно, что прямой перенос методов теории информации в систему подготовки операторов вряд ли допустим - слишком велико значение семантической нагрузки сообщений, получаемых в процессе контроля знаний. Однако при выборе модели теста, возможности использования приемов кодировки и декодировки сообщений, оценки пропускной способности каналов связи, понятия избыточности языка и т.п. могут оказаться весьма полезными. В частности, заслуживает внимание одно из возможных определений эталонного теста как теста, позволяющего получить максимум количества информации о признаках операторов, или, при решении задач синтеза, о признаках самого теста. Разработки общей теории тестов, статистического их моделирования, а также оценка их информативных свойств, должны дать основание для разработки методики синтеза реальных тестов. Можно согласиться с мнением многих авторов [49], что составление вопросов для контроля знаний операторов в процессе подготовки больше искусство, чем наука, и тем в большей степени, чем выше научный уровень предмета подготовки. Однако нельзя не признать и возможность существования некоторых правил, алгоритмов, позволяющих «доводить» тесты до некоторого удовлетворительного уровня.
В самом деле, перед создателем теста уже после первого его составления встает ряд чисто практических вопросов: достаточен ли объем теста для выполнения поставленной задачи; возможно ли сокращение объема (числа вопросов) и к каким потерям информативности это приводит; все ли вопросы теста являются в равной степени действенными; как обнаружить вопросы с резко отличающимися от основной массы свойствами; как судить о нечетких моделях знаний исследуемого объекта на первых этапах тестирования до накопления достаточного статистического материала, позволяющего убедится в правильности построения теста в целом; имеет ли значение топология теста, т.е. порядок расположения вопросов по трудности или другому отличительному признаку; на каком этапе реконструкции теста (замены вопросов, не удовлетворяющих признаку оптимальности) можно считать задачу синтеза выполненной с некоторой наперед заданной точностью.
Этот, далеко неполный, перечень вопросов позволяет судить о сложности и, вместе с тем, несомненной актуальности проблемы синтезирования оптимальных тестов. К сожалению, в литературе практически нет примеров решения подобных задач в общем, плане. Отдельные, вытекающие из частных примеров, рекомендации можно найти в обзорах Т.А. Ильиной [28], Н.Д. Никандрова [44], М.С. Бернштейна [8], В.В. Хубулашвили [63], Ю.З. Гильбуха [15]. Поэтому даже простое обобщение рекомендаций по синтезу реальных тестов может принести несомненный эффект.
Проведенные выше аналитические исследования и обоснование необходимости проведения изысканий по вопросам общей теории знаний и тестового контроля при их использовании в информационных технологиях, хотя и не претендуют на исчерпывающую полноту, тем не менее, позволяют оценить актуальность поставленной настоящим исследованием научно-практической проблемы - разработка методологии оптимального управления нечеткими моделями знаний, базирующейся на принципах инженерии знаний и систем искусственного интеллекта, позволяющих связывать разнотипные управляемые состояния, а также реализовывать индуктивный и дедуктивный вывод искомых решений в условиях неопределенности и риска, опираясь на нечеткие модели знаний.
Анализ методов оценки нечетких моделей знаний операторов информационно-управляющих систем предопределил необходимость разработки методов дихотомической оценки нечетких моделей знаний операторов ИУС ГМП.
1.2 Анализ методов и моделей неточности и неопределенности данных в ИУС
информационный муниципальный платеж оператор
Не вызывает сомнения тот факт, что получение достоверных данных для принятия решений оператором ИУС в условиях неопределенности и риска требует достаточной полноты анализа методов и моделей неточности и неопределенности данных в ИУС. В связи с этим в этом разделе диссертационной работы проводится анализ методов и моделей неточности и неопределенности данных ИУС.
Традиционно используются два средства представления неполноты данных: теория вероятностей и теория ошибок. Однако они обладают рядом ограничений. В вероятностной модели плохо учитывается предельный случай полного нечеткого знания, поскольку в ней всегда предполагается заданным множество взаимно независимых событий, которым в силу принципа максимума энтропии [103] приписываются равные вероятности (в конечном случае). Тогда идентификация всех этих событий исключена и значения неопределенности, связанные с этими событиями, могут не зависеть от числа рассматриваемых альтернатив, как в случае вероятностей.
С практической точки зрения, очевидно, что числа, назначаемые субъектами для вероятностного описания уровня их информированности, должны рассматриваться как приближенные оценки. Теория субъективных вероятностей не затрагивает этот тип неточности и полагает, что «рациональный индивидуум» должен в результате процедур оценивания задавать точные числа.
Теория ошибок, часто используемая в физике, отражает лишь неточность средств измерения, выраженную в интервальной форме, в величинах, оцениваемых с помощью этих средств. В математическом плане определяется образ отображения, аргументы которого суть подмножества. Теория ошибок не приемлет оттенков: если неизвестно точное значение параметра, то точно известны пределы его изменения.
В настоящее время вероятностная мера рассматривается только как частный случай более общего класса мер, называемых нечеткими мерами [104].
Любая мера ставит в соответствие подмножествам заданного множества какие-либо действительные числа, характеризующие (измеряющие) количество некоего свойства, связанного с каждым подмножеством.
Рассмотрим множество событий, связанных с базой неточных и неопределенных знаний, понимаемых как подмножества универсального множества , называемого достоверным событием. Пустое множество отождествляется с невозможным событием. Предполагается, что каждому событию можно поставить в соответствие действительное число g(A), задаваемое субъектом - «хранителем» базы знаний (или получаемое с помощью процедуры переработки информации, хранящейся в памяти информационной системы). Значение g(A) оценивает степень уверенности, имеющейся у субъекта по отношению к событию А с учетом текущего уровня информированности. По определению величина g(A) растет с увеличением уверенности. Более того, если А - достоверное событие, то полагают g(A) = 1, а если А - невозможное событие, то полагают g(A) = 0.
Отсюда мера определяется функцией
где - мощность множества .
Чтобы функция являлась нечеткой мерой, она должна обладать следующими свойствами нечетких мер [96]:
1) - ограниченность
2) если , то ; - монотонность
3) если или , то . - непрерывность
Требование 1) (ограниченность) очевидно. Требование 2) (монотонность), не допускает, чтобы подмножество другого подмножества обладало большей мерой, чем включающее подмножество. Согласно требованию 3) (непрерывность), предел мер бесконечной монотонной последовательности подмножеств должен совпадать с мерой предела этой последовательности. К дискретным системам, в которых всегда является конечным множеством, требование непрерывности, естественно, неприменимо.
Такие функции множества g были предложены Сугено [97] для оценки неопределенности под названием нечеткие меры. Дюбуа и Прад применяют название мера неопределенности [107].
В литературе описаны самые разные классы нечетких мер, имеющих разные свойства [105, 108]. На рис. 1.1 приведена диаграмма, изображающая отношение включения для некоторых мер [104].
Рис. 1.1. Соотношения между нечеткими мерами
Так, например, класс вероятностных мер входит в класс мер правдоподобия и в класс мер доверия, но не пересекается с классами мер возможности или необходимости.
Рассмотрим меры возможности и необходимости. Следующие неравенства и непосредственно вытекают из аксиомы монотонности и характеризуют объединение или пересечение событий:
,
Предельным случаем мер неопределенности оказываются функции множества П такие, что
Они называются мерами возможности по Заде [100].
Меры возможности удовлетворяют соотношению
Это интерпретируется как факт, что из двух противоположных событий, одно возможно.
Когда множество конечно, то всякую меру возможности П можно определить по ее значениям на одноточечных подмножествах П:
где ; - есть отображение из в [0, 1], называемое функцией распределения возможностей.
Другой граничный случай мер неопределенности получается при достижении равенства в формуле . При этом определяется класс функций множества, называемых мерами необходимости и обозначаемых N, которые удовлетворяют аксиоме, двойственной аксиоме
Функцию распределения необходимости всегда можно построить исходя из функции распределения возможности с помощью формулы
Меры необходимости удовлетворяют соотношению
Кото3рое исключает одновременную необходимость двух противоположных событий.
Рассмотрим понятия возможность и вероятность. Когда имеется информация о появлении событий в форме измеренных частот элементарных событий, полученная мера неопределенности естественным образом удовлетворяет аксиоме аддитивности
т.е. становится вероятностной мерой, которая, конечно, является монотонной в смысле условия . Формула - вероятностный эквивалент аксиом и .
Условие, эквивалентное условиям и , для конечного случая записывается в виде
где .
Аналогом соотношений и является хорошо известное соотношение
в то время как
Из этих соотношений видно одно из главных различий между возможностью и вероятностью. Вероятность некоторого события полностью определяет вероятность противоположного события. Возможность (или необходимость) некоторого события и возможность (необходимость) противоположного ему события связаны слабее; в частности, для того, чтобы охарактеризовать неопределенность по отношению к событию А, требуются два числа П(А) и N(А).
Когда моделируется субъективное суждение, кажется естественным стремление не устанавливать жесткой связи между показателями, свидетельствующими в пользу некоторого события (степень необходимости), и показателями, свидетельствующими против него (степень возможности). В этой ситуации понятие вероятности оказывается менее гибким, чем понятие меры возможности.
Вероятностные меры естественным образом синтезируют базу точных и дифференцированных знаний, тогда как меры возможности суть отражение неточных, но связных (т.е. подтверждающих друг друга) знаний. Функции возможности в этом смысле более естественны для представления чувства неуверенности: от субъекта не ждут слишком точной информации, но желают услышать по возможности наиболее связную речь. Зато точные, но флуктуирующие данные чаще всего получают из наблюдений физического явления.
Приведенные выше оценки неполноты информации используются для получения логического вывода на основе той информации, которая уже введена в систему. Ниже рассматриваются вопросы оценки неполноты знаний по отношению к проблемной области, которую моделирует база знаний.
Проведенный анализ методов и моделей неточности и неопределенности данных в ИУС позволил сформулировать задачу управления базами нечетких моделей знаний в информационно-управляющих системах. Решение задачи управления базами нечетких моделей знаний в ИУС требует исследования следующих вопросов: основные понятия теории нечетких множеств и нечеткой логики для задач формирования БНЗ; необходимые и достаточные условия управления БНЗ в ИУС; модели взаимодействия ИУС и оператора с использованием методов нечеткой логики.
1.3 Анализ методов идентификации нечетких моделей знаний операторов ИУС
С помощью символьной обработки информации не удается решить прикладные задачи многих предметных областей, если для них невозможно получить полную информацию и если их определение недостаточно полно. Такая ситуация характерна для сложных технических систем таких как ИУС эксгаустера. Выходом является использование систем, основанных на мягких вычислениях, которые включают в себя нечеткую логику и вероятностные вычисления, системное моделирование и идентификация. Это составные части не конкурируют друг с другом, а создают эффект взаимного усиления (гибридные системы). Наряду с термином «мягкие вычисления» используется термин «вычислительный интеллект» - научное направление, где решаются задачи искусственного интеллекта на основе теории нечетких систем, нейронных сетей и эволюционных (генетических) вычислений. В этом части раздела рассматриваются вопросы, связанные с анализом методов и моделей идентификации неопределенности знаний операторов ИУС.
Исходным положением при энтропийном анализе семантической структуры информации является принципиальная общность изучаемых объектов, явлений и информационного когнитивного ресурса, как результата исследований. Существующая при этом структурная общность обусловлена наличием в когнитивном информационном ресурсе понятийного поля, т.е. предметной области, составленной из представляющих ее положений и отношений, отражающих объект исследования. В процессе накопления знаний понятийное поле структурируется так, что понятия и отношения все более адекватно отражают изучаемый фрагмент действительности, формируя ее фантом, собственно, и являющийся целостным когнитивным информационным ресурсом [101].
Сопоставить уровень знаний (т.е. полноту когнитивного поля информации) с отражаемым в них структурным уровнем организации объекта исследований можно, оценив степень симметрии (асимметрии) этой информации и действительности. Это утверждение следует из структурной общности изучаемых объектов, явлений и когнитивного поля информации, как результата исследований этих объектов, явлений. Такая общность, кроме того, обеспечивает возможность введения количественной меры симметрии информации и объективной реальности через оценку энтропии информации (т.е. оценку семантического количества недостающей информации).
Основа развития когнитивной структуры информации - мышление. Одна из логических форм мышления - суждение - содержит концептуальное отражение предмета исследований, трактуемое как адекватное действительности. Выводы, базирующиеся на суждениях и основанные на них доказательства, составляют когнитивный ресурс научных исследований.
Поэтому формирование когнитивного информационного ресурса осуществляется посредством законченных мыслей, отражающих обобщенную природу концептуального мышления и воображения оператора. Сама же законченная мысль в виде утверждения (т.е. суждение), имеющая отношение к предмету исследований, является синтезом семантических значений дескриптивных (описательных) и логических терминов, а значит, может быть принята за элементарную семантическую единицу (ЭСЕ) когнитивной структуры информации [101].
Очевидно, что содержание ЭСЕ либо адекватно описывает анализируемый объект, либо расходится с ним. Поэтому формально истинность ЭСЕ в общем случае условна. Ошибочная трактовка какого-либо суждения как истинного является лишь выражением специфики нашего мышления, но не недостатком введенного определения ЭСЕ.
Данное положение указывает и на то, что когнитивная структура научной информации не является копией явлений и объектов предметного мира, а лишь продуктом интеллектуальной деятельности людей, своего рода фантомом действительности, т.е. информационным фантомом (ИФ), согласованным с реальным миром и мозаично составленным из ЭСЕ. Согласование здесь обеспечивается результатами, получаемыми при исследованиях. Причем, даже если какая-либо информация является точной и исчерпывающей по отношению к отражаемому ею фрагменту действительности, то именно в силу этой фрагментарности она все равно обладает лишь относительной истинностью.
Для нахождения семантической меры количества информации рассмотрим закон распределения ЭСЕ различной истинности. Найти его можно, воспользовавшись вариационно-энтропийным принципом, когда вид распределения, описывающего анализируемую систему, определяется условием максимизации энтропии этой системы S при фиксированных условиях, отвечающих ее природе [110]:
где S - энтропия; Е(х) - мера усилий, необходимых для перевода данного элемента системы в состояние х; Е - мера усилий, необходимых для перевода всей системы в состояние, описываемое распределением f(x).
Последнее из приведенных условий означает нормировку распределения.
Суть вариационно-энтропийного принципа заключается в нахождении такого распределения f(x), которое минимизирует Е, максимизируя S.
В качестве меры разнообразия истинности ЭСЕ целесообразно выбрать энтропию распределения Ципфа, описывающего распределение числа ЭСЕ различной истинности
где х - характеристика истинности ЭСЕ в рамках данной теории или парадигмы [92].
Известно [102, 103], что с ростом максимального выборочного значения I случайной величины х она быстро сходится к конечному пределу:
где x0 - минимальное выборочное значение х; - параметр распределения Ципфа n(х); N - объем выборки.
Данное выражение является частным случаем энтропийной функции
где - мера на множестве состояний рассматриваемой системы для группы событий (i = 1, 2,…). Причем мера в общем случае не обязательно должна быть вероятностной, т.е. удовлетворять условию .
Это обязательно лишь для энтропии, являющейся частным случаем более широкого понятия «энтропийная функция». Так, например, «невероятностный» характер энтропийной функции Н используется при структурном анализе в теории графов [104]. Мера здесь основывается на соотношении числа возможных связей между элементами исследуемой системы и учете направлений этих связей.
В теории информации энтропию в используемом в настоящее время виде впервые широко применил К. Шеннон [105], рассматривая на синтаксическом уровне дискретный источник информации, представленный в виде марковского процесса. Выбор именно энтропийной (логарифмической) функции обусловлен рядом ее преимуществ, главное из которых заключается в свойстве аддитивности: при рассмотрении сообщений о независимых событиях полная информация оказывается равной сумме информации, содержащихся в отдельных сообщениях.
Пусть по каналу связи передается сообщение о событии, априорная вероятность которого равна P1. После приема сообщения апостериорная вероятность этого события для получателя становится равной P2. Прирост количества информации, связанный с приемом сообщения, определяется выражением
Именно оно лежит в основе теории информации.
Если канал передачи сообщений идеален, т.е. в нем полностью отсутствуют помехи и искажения сигнала, событие после приема сообщения о нем становится достоверным, т.е. P2 обращается в единицу, а выражение для Н принимает вид
Для группы событий, сообщения о которых передаются по каналу связи, средняя информация на один символ определяется следующим образом
Все эти выражения относятся к анализу информации на синтаксическом уровне. При ее рассмотрении на семантическом уровне и энтропийном подходе к оценке адекватности когнитивной структуры информации изучаемому фрагменту действительности смысл вероятностей P1 и P2 становится иным. Вероятность P1 здесь - характеристика истинности фрагмента действительности, т.е. априорная вероятность истинности фрагментов действительности, соответствующих ЭСЕ, формирующим уже сейчас или в будущем когнитивную структуру информации. Вероятность же P2 характеризует семантику относительно истинного события, а потому не равна единице.
Переход от синтаксического уровня к семантическому приводит к принципиальным изменениям: не P2, a P1 = 1. Это вызывает необходимость изменения знака в выражении, описывающем энтропию S распределения числа ЭСЕ различной истинности [92].
Смысл изменения знака у S кроется в том, что мы определяем не количество информации, которая уже имеется и в семантическом плане считается достоверной, т.е. величину положительную, а степень дезорганизации имеющейся информации в отношении ее истинности, т.е. количество отсутствующей, но потенциально возможной информации.
По существу, оценивая эту степень дезорганизации, мы рассчитываем количество информации, которой пока еще нет, или истинность которой вызывает сомнения. Поэтому в выражении для S и меняется знак. В остальном же оно сохраняется. Именно это количество информации и позволяет аналитически оценить адекватность когнитивной структуры научной информации изучаемому фрагменту действительности, т.е. их взаимную симметрию.
Таким образом, энтропия S распределения числа ЭСЕ различной истинности описывается выражением
т.е. без минуса перед суммой по сравнению с энтропией распределения Ципфа. Отсутствие знака минус в , как это указывалось выше, означает, что мы определяем не количество информации, а ее энтропию, т.е. степень дезорганизации информации за счет неизвестной нам, но потенциально существующей ее части, характеризуемой величиной S.
При и х0 = 1 имеем:
В то же время, очевидно, что в предельном случае (полная идентичность действительности и ее фантома), т.е. при n(хпр) = 0, или числе одинаковых меток, равном N, неопределенность информации о реальности отсутствует, а статистический вес такого состояния пренебрежимо мал. Энтропия равна нулю:
откуда нетрудно найти значение
=exp (l+l/),
или = 3.59, т.е. распределение n(х) гауссово.
Раскроем n(х) в . В общем случае получим:
Так как , а , то
или, учитывая , и что ln2 = 3,59 получим
Как видим, выражение позволяет оценить степень дезорганизации фантома действительности, т.е. его энтропию, через одну переменную х = I, т.е. через максимальное значение х в выборке, число элементов которой потенциально равно N. Наличие только одной переменной I в свидетельствует, что S может характеризовать ЭСЕ фантома в отношении их истинности и служить мерой ассиметрии информационного фантома по отношению к действительности, описывающей взаимное соотношение детерминированной (истинной) и случайной (менее истинной) составляющей когнитивной структуры научной информации данного научного направления.
Проведенный анализ исследований методов идентификации нечетких моделей знаний операторов ИУС позволяет сформулировать задачу идентификации моделей нечетких моделей знаний ИУС. Решение задачи идентификации моделей управления нечеткими моделями знаний в ИУС требует исследование следующих вопросов: анализ моделей нечетких моделей знаний ИУС; методы приведения некорректных задач ИУС к классу корректных; методы согласованности исходных данных при решении задач управления нечеткими моделями знаний ИУС; оценка эффективности управления нечеткими моделями знаний ИУС.
1.4 Анализ методов и моделей формализации взаимодействия конечного пользователя с ИУС
Проблема взаимодействия оператора с ИУС до сих пор остается одной из наиболее слабо развитой и формализованной при разработке ИУС. Деятельность оператора в ИУС осуществляется посредством интерфейса и носит характер интеллектуальной информационно-аналитической деятельности, а ее содержание - последовательное решение задач, направленных на достижение некоторой цели. Возлагая решение части задачи на ИУС, оператор вынужден включать в содержание своего труда новые задачи, связанные взаимодействием с ней. Система, решая возложенные на нее задачи, выступает в роли средства поддержки некоторой информационной технологии, реализованной в виде последовательности операций, каждая из которых является последовательностью актов взаимодействия. Объективно труд оператора в ИУС логично оценить операционной сложностью, отражающий количество операций и их содержание. Возникает задача анализа методов и моделей формализации взаимодействия конечного пользователя с ИУС.
Подобные документы
Понятия в области метрологии. Представление знаний в интеллектуальных системах. Методы описания нечетких знаний в интеллектуальных системах. Классификация интеллектуальных систем, их структурная организация. Нечеткие системы автоматического управления.
курсовая работа [768,2 K], добавлен 16.02.2015Представление знаний в когнитологии, информатике и искусственном интеллекте. Связи и структуры, язык и нотация. Формальные и неформальные модели представления знаний: в виде правил, с использованием фреймов, семантических сетей и нечетких высказываний.
контрольная работа [29,9 K], добавлен 18.05.2009Классы и группы моделей представления знаний. Состав продукционной системы. Классификация моделей представления знаний. Программные средства для реализации семантических сетей. Участок сети причинно-следственных связей. Достоинства продукционной модели.
презентация [380,4 K], добавлен 14.08.2013Исследование основных идей, касающиеся количественной оценки неопределенности и методов формирования нечетких суждений. Теоретические аспекты представления неопределенности, место данной проблематики в исследованиях по искусственному интеллекту.
презентация [180,8 K], добавлен 14.08.2013Преимущества и недостатки моделей представления знаний. Модель, основанная на правилах, фреймовая модель. Семантическая сеть. Структура экспертных систем и этапы их разработки. Механизмы логического вывода. Стратегия "вверх-снизу", "от цели к ситуации").
презентация [195,3 K], добавлен 29.10.2013Понятие информационных систем и принципы их проектирования. Изучение различных методов извлечения знаний, построение оптимальной информационной системы Data Mining, позволяющей разбивать набор данных, представленных реляционными базами данных на кластеры.
аттестационная работа [4,7 M], добавлен 14.06.2010Проблема представления знаний в компьютерных системах – одна из основных проблем в области искусственного интеллекта. Исследование различных моделей представления знаний. Определения их понятия. Разработка операции над знаниями в логической модели.
курсовая работа [51,9 K], добавлен 18.02.2011Особенности разработки системы автоматизированного контроля знаний специалистов по дефектоскопии. Обзор автоматизированных систем обучения и контроля знаний. Психологические механизмы усвоения знаний. Принципы создания эффективной тестирующей программы.
дипломная работа [1,8 M], добавлен 30.08.2010Сущность данных и информации. Особенности представления знаний внутри ИС. Изучение моделей представления знаний: продукционная, логическая, сетевая, формальные грамматики, фреймовые модели, комбинаторные, ленемы. Нейронные сети, генетические алгоритмы.
реферат [203,3 K], добавлен 19.06.2010Методы представления знаний заданной предметной области. Создание онтологии бортовых информационно управляющих систем автомобиля. Создание среды разработки и приложения для поиска в интернете с использованием онтологии. Проверка эффективности приложения.
презентация [1,6 M], добавлен 25.12.2014