Разработка элективного курса "Основы искусственного интеллекта"

Определения знаний и приобретения знаний человеком. Виды знаний и способы их представления. Приобретение и извлечение знаний. Визуальное проектирование баз знаний как инструмент обучения. Программное обеспечение для проведения лабораторных работ.

Рубрика Программирование, компьютеры и кибернетика
Вид дипломная работа
Язык русский
Дата добавления 12.12.2008
Размер файла 960,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

31

Введение

В настоящее время курс «Основы искусственного интеллекта» является базовым при подготовке учителей информатики по специальности 030100.00 информатика. Это обусловлено тем, что передовые информационные технологии всё более широко используют методы решения проблем и задач, развиваемые в такой научной дисциплине, как искусственный интеллект. Все современные устройства, использующие цифровую обработку информации уже применяют те или иные алгоритмы искусственно-интеллектуальной обработки. А тенденция развития техники и информационных технологий таковы, что интеллектуализация систем, устройств и программного обеспечения будет усиливаться. Поэтому учителю информатики необходимо быть готовым ответить на вызов времени, и быть способным ориентироваться в современных интеллектуальных технологиях обработки информации, и иметь представление об их основах. Это позволит ему уверенно чувствовать себя как в общении с современными широко информированными школьниками, так и в преподавании основ информатики, поскольку здание информатики, построенное на этих основах уже в достаточной степени пропитано интеллектуальными технологиями, методами и подходами.

Существующий базовый курс за индексом ДПП.Ф.10, опирающийся на государственный образовательный стандарт высшего профессионального образования от 2000г., предусматривает некоторое знакомство учащихся с основами представления знаний и построения экспертных систем. В стандарте оговорено следующее содержание по этому вопросу: «Система знаний. Модели представления знаний: логическая, сетевая, фреймовая, продукционная». Но для применения конкретных схем и языков представления знаний и построения баз знаний необходимо эти знания извлечь из различных носителей, например, людей-экспертов или текстовых описаний. Этот момент является очень существенным и не формальным. Есть много методов и технологий извлечения знаний. Они настолько обширны, что образуют целую отдельную научно-практическую область - инженерию знаний. К тому же среди всех этих методов и технологий нет универсальных, они лишь дополняют друг друга, и на практике необходимо комбинировать и сочетать самые различные подходы.

Но у инженерии знаний есть другой аспект, который не лежит на поверхности, и в некоторой степени является побочным эффектом. Это педагогически-дидактический аспект, т.е. возможности, технологий и инструментов инженерии знаний, которые позволяют их использовать в качестве средств обучения. Известны примеры такого использования [1].

Но не только поэтому этот раздел можно считать очень важным именно для будущих учителей информатики. С одной стороны учитель должен знать, как могут быть структурированы и представлены в формальном виде знания, которые мы традиционно привыкли видеть представленными в виде текстов на естественном языке, или в виде знаний, умений и навыков конкретных людей. С другой стороны особенно важно будет для будущего учителя познакомиться с методами извлечения знаний из эксперта альтернативные педагогическим методам «извлечения знаний из учащегося».

Всё это позволит будущему учителю с одной стороны углубить своё понимание в области формирования и приобретения знаний обучаемым, а с другой - даст ему возможность расширить свой педагогический арсенал приёмами выявления и структуризации знаний, применяемыми в инженерии знаний.

Но необходимо иметь ввиду, что данный раздел искусственного интеллекта - «инженерия знаний» представляет собой достаточно обширную и сложную область, поэтому является некоторой проблемой дать её адекватное представление за небольшое количество часов будущим учителям информатики, изучающим базовый курс «Основы искусственного интеллекта».

В связи с вышесказанным в данной работе была поставлена следующая цель: исследовать возможность адекватного изучения темы «Инженерия знаний» студентами, обучающимися по специальности «учитель информатики», при изучении курса «Основы искусственного интеллекта».

При этом была выдвинута следующая гипотеза: возможно разработать в поддержку курса «Основы искусственного интеллекта» курс по выбору по теме «Инженерия знаний» такой, что его изучение позволит обучающимся по специальности «учитель информатики» получить адекватное представление о современном состоянии данного раздела информатики.

Объектом исследования в данной работе являлся процесс обучения учащихся по специальности 030100.00-информатика, предметом исследования - изучение возможности построения курса по выбору по теме «Инженерия знаний» удовлетворяющего цели и гипотезе исследования.

Для выполнения поставленной цели было необходимо решить следующие задачи:

1. Ознакомиться с таким разделом искусственного интеллекта, как инженерия знаний.

2. Определить разделы, темы, понятия и методы области «инженерия знаний», представляющие значимость для освоения учащимися и формирования их взгляда на эту область.

3. Собрать материалы по теме «инженерия знаний», имеющие ценность для построения учебного курса и обучения.

4. Определить и найти программное обеспечение, позволяющее на практике закрепить необходимые знания по инженерии знаний.

5. Разработать тематическое планирование и рабочую программу курса по выбору, позволяющие при проведении занятий по ним достичь заявленную цель и доказать заявленную гипотезу.

6. Разработать лабораторные работы, упражнения и контрольные вопросы по темам курса.

В случае успешного выполнения задач и реализации цели данной работы ожидается получение следующих результатов: подтверждение положения о возможности построения курса «Инженерия знаний» в поддержку базового курса «Основы искусственного интеллекта» так, что будущие учителя информатики смогут познакомиться с методами и технологиями этой области исследований в искусственном интеллекте.

1. Инженерия знаний - приёмы структуризации и формализации знаний

1.1. Определения знаний и приобретения знаний человеком

Знания являются неотъемлемой и существенной составляющей деятельности человека. Что такое знания и их свойства можно определять по-разному, но все эти определения не взаимоисключающие, но дополняющие друг-друга. Приведём некоторые из них.

Знание - проверенный практикой и удостоверенный логикой результат познания действительности, отраженный в сознании человека в виде представлений, понятий, суждений и теорий. Знания формируются в результате целенаправленного педагогического процесса, самообразования и жизненного опыта. По Д.А.Поспелову для знаний характерны внутренняя интерпретируемость, структурированность, связанность и взаимная активность.

Можно выделить здравый смысл и научное знание. Здравый смысл - основанные на повседневном опыте знания и взгляды психически здоровых людей на окружающую среду и самих себя. Научное знание - система знаний о законах природы, общества, мышления. Научное знание составляет основу научной картины мира и отражает законы его развития. Научное знание:

· является результатом постижения действительности и когнитивной основой человеческой деятельности;

· социально обусловлено;

· обладает различной степенью достоверности.

Научные знания добываются путём научной деятельности (науки). Научная деятельность - это интеллектуальная деятельность, направленная на получение и применение новых знаний для:

· решения технологических, инженерных, экономических, социальных, гуманитарных и иных проблем;

· обеспечения функционирования науки, техники и производства как единой системы.

Можно выделить также формальные знания или знания - в информатике. Знания - в информатике - вид информации, отражающей опыт специалиста (эксперта) в определенной предметной области, его понимание множества текущих ситуаций и способы перехода от одного описания объекта к другому.

Кроме знаний существует также индивидуальный опыт. Опыт - это совокупность знаний и умений, приобретенных индивидом на основе и в процессе непосредственного практического взаимодействия с внешним миром. Часть индивидуального опыта является повседневное знание. Повседневное знание - это знание:

· основанное на здравом смысле и повседневном опыте;

· являющееся ориентировочной основой поведения человека в обыденной жизни.

Повседневное знание - в феноменологической социологии - основа научного знания и теоретических абстракций.

Существует также и здравый смысл - основанные на повседневном опыте знания и взгляды психически здоровых людей на окружающую среду и самих себя.

Следует отличать от знаний информацию. Например, по законодательству РФ, информация - это сведения о лицах, предметах, фактах, событиях, явлениях и процессах независимо от формы их представления. Информация уменьшает степень неопределенности, неполноту знаний о лицах, предметах, событиях и т.д.

Но в информатике более популярно другое определение. Информацией (от лат. Informatio -- «научение», «сведение», «оповещение») называется опосредованный формами связи результат отражения изменяемого объекта изменяющимся с целью сохранения их системной целостности. Информация первична и содержательна -- это категория, поэтому в категориальный аппарат науки она вводится портретно -- описанием, через близкие категории: материя, система, структура, отражение. В материальном мире (человека) информация материализуется через свой носитель и благодаря нему существует. Сущность материального мира предстаёт перед исследователем в единстве формы и содержания. Передаётся информация через носитель. Материальный носитель придаёт информации форму. В процессе формообразования производится смена носителя информации. Определения термин информация не имеет, так как не является понятием. Существует информация в каналах связи систем управления. Не следует путать категорию информация с понятием знание. Знание определяется через категорию информация.

В XX веке слово «информация» стало термином во множестве научных областей, получив особые для них определения и толкования.

Также, наряду с понятиями знание и информация существует понятие «данные». Данные - это сведения:

· полученные путем измерения, наблюдения, логических или арифметических операций;

· представленные в форме, пригодной для постоянного хранения, передачи и (автоматизированной) обработки.

Данные -- это представление фактов и идей в формализованном виде, пригодном для передачи и обработки в некотором информационном процессе. Данные - это выделенная (из системы, благодаря обособленности существования носителя) информация.

Для передачи знаний человеку используется обучение. Обучение - это целенаправленный и планомерный процесс передачи и усвоения знаний, умений, навыков и способов познавательной деятельности человека. Обучение - относительно постоянное изменение в человеческом поведении или способностях, являющееся следствием опыта.

От обучения можно отделить понятие «научение». Научение - в широком смысле - это класс психологических процессов, обеспечивающих формирование новых приспособительных реакций. Научение - в узком смысле - процесс и результат приобретения индивидуального опыта. Путем научения приобретаются:

· знания, умения и навыки у человека;

· новые формы поведения у животных.

Существует также инструментальное научение - научение, происходящее:

· за счет спонтанного порождения организмом множества разнообразных реакций на один и тот же стимул или ситуацию

· с последующим закреплением только тех реакций, которые оказались наиболее удачными с точки зрения полученного эффекта.

В процессе научения вырабатываются навыки. Навык - это последовательность развертывания во времени и пространстве действий и операций:

· выработанная в процессе обучения и тренировки;

· доведенная до автоматизма;

· оптимальная для некоторого вида деятельности.

В основе формирования навыка лежит образование динамического стереотипа. Устойчивость навыка зависит от особенностей памяти. Различают двигательные, сенсорные и интеллектуальные навыки.

1.2. Виды знаний и способы их представления

Существуют различные определения понятия «знания». В одном из наиболее емких определений под знаниями понимают формализованную информацию, на которую ссылаются или которую используют в процессе решения задачи. Знание о предметной области включает описание объектов, их окружения, необ-ходимых явлений, фактов, а также отношений между ними. Общение с ЭВМ на уровне знания предопределяет возможность ввода в машину и использование ею некоторой совокупности взаимосвязанной информации. Сложность понятия «знание» заключена в множественности его носителя и неразрывности с поня-тием «данные». Выделяют несколько уровней формализации знания о предмет-ной области: знания в памяти человека; знания в форме языковой модели пред-метной области, используемые человеком и зафиксированные на физических носителях с использованием контекстно-зависимых языков, графических обра-зов и т. п.; знания, формализованные для их представления при использовании в ЭВМ; фактографические сведения или данные.

1.2.1. Виды знаний

Фактические и стратегические знания

Знания определяются как «...основные закономерности предметной облас-ти, позволяющие человеку решать конкретные производственные, научные и другие задачи, то есть факты, понятия, взаимосвязи, оценки, правила, эвристики (иначе фактические знания), а также стратегии принятия решения в этой обла-сти (иначе стратегические знания)».

Факты и эвристики

Некоторые авторы разделяют знания на две большие категории: факты и эврис-тики. Первая категория (факты) указывает на хорошо известные в той или иной предметной области обстоятельства. Такие знания еще называют текстовыми, имея в виду достаточную их освещенность в специальной литературе и учебниках. Вторая категория знаний (эвристики) основывается на индивидуальном опыте специалиста (эксперта) в предметной области, накопленном в результате многолетней практики. Эта категория нередко играет решающую роль при построе-нии интеллектуальных программ. Сюда относятся такие знания, как «способы удаления бесполезных гипотез», «способы использования нечеткой информации», «способы разрешения противоречий» и т. п.

Декларативные и процедурные знания

Под декларативными знаниями подразумевают знания типа «А это В», и они характерны для баз данных. Это, например, такие факты, как «в час пик на улице много машин», «зажженная плита -- горячая», «скарлатина -- инфекционное) заболевание»...

К процедурным знаниям относятся сведения о способах оперирования или пре-образования декларативных знаний.

Интенсиональные и экстенсиональные знания

Интенсиональные знания -- это знания о связях между атрибутами (признака-ми) объектов данной предметной области. Они оперируют абстрактными объек-тами, событиями и отношениями.

Экстенсиональные знания представляют собой данные, характеризующие конк-ретные объекты, их состояния, значения параметров в пространстве и времени.

Глубинные и поверхностные знания

В глубинных знаниях отражается понимание структуры предметной области, на-значение и взаимосвязь отдельных понятий (глубинные знания в фундаменталь-ных науках -- это законы и теоретические основания). Поверхностные знания обычно касаются внешних эмпирических ассоциаций с каким-либо феноменом предметной области.

Например, для разговора по телефону требуется лишь поверхностное знание того, что, сняв трубку и правильно набрав номер, мы соединимся с нужным абонен-том. Большинство людей не испытывает необходимости в глубинных представ-лениях о структуре телефонной связи, конструкции телефонного аппарата, ко-торыми, безусловно, пользуются специалисты по телефонии.

Отмечается, что большинство экспертных систем основано на применении поверхностных знаний. Это, однако, нередко не мешает достигать вполне удов-летворительных результатов. Вместе с тем, опора на глубинные представления помогает создавать более мощные, гибкие и интеллектуальные адаптивные сис-темы. Наглядным примером может служить медицина. Здесь молодой и недос-таточно опытный врач часто действует по поверхностной модели: «Если кашель -- то пить таблетки от кашля, если ангина -- то эритромицин» и т. п. В то же время опытный врач, основываясь на глубинных знаниях, способен порождать разно-образные способы лечения одной и той же болезни в зависимости от индивиду-альных особенностей пациента, его состояния, наличия доступных лекарств в аптечной сети и т. д.

Глубинные знания являются результатом обобщения первичных понятий пред-метной области в некоторые более абстрактные структуры. Степень глубины и уровень обобщенности знаний непосредственно связаны с опытом экспертов и могут служить показателем их профессионального мастерства.

Жесткие и мягкие знания

Жесткие знания позволяют получать однозначные четкие рекомендации при заданных начальных условиях. Мягкие знания допускают множественные, «раз-мытые» решения и различные варианты рекомендаций (рис. П.16).

Характеристика различных предметных областей по глубине и жесткости дает возможность проследить тенденцию развития интеллектуальных систем.

Рис. П.16. Тенденция развития интеллектуальных систем

Как видно из рисунка, область практического применения интеллектуальных систем все более смещается в сферу задач с преобладанием глубинных и мягких знаний. Такие задачи еще называют трудно формализуемыми. Для них харак-терна одна или несколько следующих особенностей:

· задача не может быть определена в числовой форме (требуется символьное представление);

· алгоритмическое решение задачи не известно (хотя, возможно, и существует), или не может быть использовано из-за ограниченных ресурсов (памяти компьютера, быстродействия);

· цели задачи не могут быть выражены в терминах точно определенной целевой функции или не существует точной математической модели задачи

Системы, основанные на знаниях, не отвергают и не заменяют традиционных подходов к решению формализованных задач. Они отличаются тем, что ориентированы на решение трудно формализуемых задач. Интеллектуальные системы особенно важны там, где наука не может создать конструктивных определений, область определений меняется, ситуации зависят от контекстов и языковая (описательная) модель доминирует над алгоритмической.

1.2.2. Модели представления знаний

Наиболее распространенными моделями представления знаний являются:

· продукционные системы;

· логические модели;

· фреймы;

· семантические сети.

Продукционные системы

В продукционных системах знания представляются в виде совокупности специ-альных информационных единиц.

В общем случае продукционная система включает следующие компоненты:

· базу данных, содержащую множество фактов;

· базу правил, содержащую набор продукций;

· интерпретатор (механизм логического вывода) или правила работы с продук-циями.

База правил и база данных образуют базу знаний. Факты в базе данных пред-ставляют собой краткосрочную информацию и в принципе могут изменяться в ходе работы продукционной системы по мере накопления опыта. Правила явля-ются более долговременной информацией и предназначены для порождения гипотез (новых фактов) из того, что уже известно.

Продукционные системы делят на два типа -- с прямыми и обратными вывода-ми. При прямом выводе рассуждение ведется от данных к гипотезам, а при об-ратном производится поиск доказательства или опровержения некоторой гипотезы. Часто используются комбинации прямой и обратной цепи рассуждений.

Продукции по сравнению с другими формами представления знаний имеют сле-дующие преимущества:

· модульность;

· единообразие структуры (основные компоненты продукционной системы могут применяться для построения интеллектуальных систем с различной проблемной ориентацией);

· естественность (вывод заключения в продукционной системе во многом ана-логичен процессу рассуждений эксперта);

· гибкость родовидовой иерархии понятий, которая поддерживается только как связи между правилами (изменение правила влечет за собой изменение в иерархии).

Однако продукционные системы не свободны от недостатков:

· процесс вывода менее эффективен, чем в других системах, поскольку боль-шая часть времени при выводе затрачивается на непроизводительную проверку применимости правил;

· этот процесс трудно поддается управлению;

· сложно представить родовидовую иерархию понятий.

Представление знаний с помощью продукций иногда называют «плоским», так как в продукционных системах отсутствуют средства для установления иерар-хии правил. Объем базы знаний продукционных систем растет линейно, по мере включения в нее новых фрагментов знаний, в то время как в традиционных алго-ритмических системах, использующих деревья решений, зависимость между объ-емом базы знаний и количеством собственно знаний является логарифмической.

Логические модели

Логические модели представления знаний реализуются средствами логики пре-дикатов.

Предикатом называется функция, принимающая только два значения -- истина и ложь -- и предназначенная для выражения свойств объектов или связей между ними. Выражение, в котором утверждается или отрицается наличие каких-либо свойств у объекта, называется высказыванием. Константы служат для именова-ния объектов предметной области. Логические предложения или высказывания образуют атомарные формулы. Интерпретация предиката -- это множество всех допустимых связываний переменных с константами. Связывание представляет собой подстановку констант вместо переменных. Предикат считается общезна-чимым, если он истинен на всех возможных интерпретациях. Говорят, что выс-казывание логически следует из заданных посылок, если оно истинно всегда, когда истинны посылки.

Наиболее простым языком логики является исчисление высказываний, в котором отсутствуют переменные. Любому высказыванию можно приписать значение истинно или ложно. Отдельные высказывания могут соединяться связками И, ИЛИ, НЕ, которые называются булевыми операторами. Основу исчисления выс-казываний составляют правила образования сложных высказываний из атомар-ных.

Здесь переменные обозначают логические высказывания, о которых можно ска-зать, что они истинны или ложны. Логические операторы имеются в большин-стве языков программирования. Однако исчисление высказываний -- недоста-точно выразительное средство для обработки знаний, поскольку в нем не могут быть представлены предложения, включающие переменные с кванторами.

Исчисление предикатов с кванторами (логика предикатов) является расшире-нием исчисления высказываний, в котором для выражения отношений между объектами предметной области могут использоваться предложения, включающие не только константы, но и переменные.

В общем случае модели, основанные на логике предикатов, описываются фор-мальной системой, которая задается четверкой:

М = (Т, Р, А, П),

где Т -- множество базовых элементов или алфавит формальной системы; Р -- множество синтаксических правил, с помощью которых можно строить син-таксически корректные предложения; А -- множество аксиом или некоторых синтаксически правильных предложений, заданных априорно; П -- правила продукций (правила вывода или семантические правила), с помо-щью которых можно расширять множество А, добавляя в него синтаксически правильные предложения.

Главное преимущество логических моделей представления знаний заключается в возможности непосредственно запрограммировать механизм вывода синтакси-чески правильных высказываний. Примером такого механизма служит, в част-ности, процедура вывода, построенная на основе метода резолюций. Однако с помощью правил, задающих синтаксис языка, нельзя установить истинность или ложность того или иного высказывания. Причем это распространяется абсо-лютно на все языки. Высказывание может быть построено синтаксически пра-вильно, но оказаться совершенно бессмысленным.

Логические модели представления и манипулирования знаниями были особен-но популярны в 70-х годах. Тогда казалось, что с появлением языков программи-рования типа ПРОЛОГ процедуры логического вывода в исчислении предика-тов будут достаточны для решения всех типов задач в интеллектуальных системах. Вместе с тем, по мере того как в поле зрения исследователей включались все новые интеллектуальные задачи, стало ясно, что говорить о доказательном выводе можно только в небольшом числе случаев, когда проблемная область, в которой реша-ется задача, формально описана и полностью известна. Но большинство задач, где интеллект человека позволяет находить нужные решения, связано с областя-ми, где знания принципиально неполны, неточны, некорректны и характеризу-ются еще немалым числом характеристик, начинающихся с частицы «не». При таких условиях речь может идти только о правдоподобном выводе, при ко-тором окончательный результат получается лишь с некоторой оценкой уверен-ности в его истинности. Кроме того, специалисты, работающие в плохо форма-лизованных областях (например, в медицине), рассуждают совсем не так, как представители точных наук. Для них весомым аргументом в пользу принятия какого-либо положения может быть мнение ряда признанных в этих областях авторитетов или, например, сходство доказываемого положения с другим, для которого решение уже известно. Поэтому дальнейшее развитие баз знаний по-шло по пути работ в области индуктивных логик, логик «здравого смысла», ло-гик веры и других логических систем, имеющих мало общего с классической ма-тематической логикой.

Фреймы

Фрейм чаще всего определяют как структуру данных для представления стерео-типных ситуаций. Модель представления знаний на основе фреймов использует концепцию организации памяти, понимания и обучения человека, предложен-ную М. Минским (1979). Фрейм (дословно -- «рамка») -- это единица представ-ления знаний, детали которой могут изменяться в соответствии с текущей ситу-ацией. Фрейм в любой момент может быть дополнен различной информацией, касающейся способов применения данного фрейма, последствий этого примене-ния и т. п.

Структура фрейма состоит из характеристик описываемой стереотипной ситуации и их значений, которые называются, соответственно, слотами и заполнителями слотов.

Имя фрейма:

Имя первого слота, значение первого слота

Имя второго слота, значение второго слота

Имя К-го слота, значение К-го слота

Незаполненный фрейм называется протофреймом, а заполненный -- экзофреймом. Роль протофрейма как оболочки в экзофрейме весьма важна. Эта оболочка позволяет осуществлять процедуру внутренней интерпретации, благодаря кото-рой данные в памяти системы не безлики, а имеют вполне определенный, изве-стный системе смысл.

Слот может содержать не только конкретное значение, но и имя процедуры, позволяющей вычислить его по заданному алгоритму, а также одну или несколь-ко продукций (эвристик), с помощью которых это значение определяется. В слот может входить не одно, а несколько значений. Иногда этот слот включает ком-понент, называемый фасетом, который задает диапазон или перечень его воз-можных значений. Фасет указывает также граничные значения заполнителя слота.

Как уже отмечалось, помимо конкретного значения в слоте могут храниться процедуры и правила, которые вызываются при необходимости вычисления это-го значения. Среди них выделяют процедуры-демоны и процедуры-слуги. Первые запускаются автоматически при выполнении некоторого условия, а вторые ак-тивизируются только по специальному запросу. Если, например, фрейм, описы-вающий человека, включает слоты ДАТА РОЖДЕНИЯ и ВОЗРАСТ и в первом из них находится некоторое значение, то во втором слоте может стоять имя про-цедуры-демона, вычисляющей возраст по дате рождения и текущей дате и акти-визирующейся при каждом изменении текущей даты.

Совокупность фреймов, моделирующая какую-либо предметную область, пред-ставляет собой иерархическую структуру, в которую фреймы собираются с по-мощью родовидовых связей. На верхнем уровне иерархии находится фрейм, со-держащий наиболее общую информацию, истинную для всех остальных фреймов. Фреймы обладают способностью наследовать значения характеристик своих родителей, находящихся на более высоком уровне иерархии. Эти значения мо-гут передаваться по умолчанию фреймам, находящимся ниже них в иерархии, но если последние содержат собственные значения данных характеристик, то в качестве истинных принимаются именно они. Это обстоятельство позволяет без затруднений учитывать во фреймовых системах различного рода исключения.

Различают статические и динамические системы фреймов. В системах первого типа фреймы не могут быть изменены в процессе решения задачи, а в системах второго типа это допустимо.

О системах программирования, основанных на фреймах, говорят, что они явля-ются объектно-ориентированными. Каждый фрейм соответствует некоторому объекту предметной области, а слоты содержат описывающие этот объект данные, то есть в слотах находятся значения признаков объектов. Фрейм может быть представлен в виде списка свойств, а если использовать средства базы данных, то в виде записи.

Наиболее ярко достоинства фреймовых систем представления знаний проявля-ются в том случае, если родовидовые связи изменяются нечасто и предметная область насчитывает немного исключений. Во фреймовых системах данные о родовидовых связях хранятся явно, как и знания других типов. Значения слотов представляются в системе в единственном экземпляре, поскольку включаются только в один фрейм, описывающий наиболее общие понятия из всех тех, кото-рые содержит слот с данным именем. Такое свойство систем фреймов обеспечи-вает экономное размещение базы знаний в памяти компьютера. Еще одно досто-инство фреймов состоит в том, что значение любого слота может быть вычислено с помощью соответствующих процедур или найдено эвристическими методами. То есть фреймы позволяют манипулировать как декларативными, так и проце-дурными знаниями.

К недостаткам фреймовых систем относят их относительно высокую сложность, что проявляется в снижении скорости работы механизма вывода и увеличении трудоемкости внесения изменений в родовидовую иерархию. Поэтому большое внимание при разработке фреймовых систем уделяют наглядным способам ото-бражения и эффективным средствам редактирования фреймовых структур.

Семантические сети

Семантическая сеть описывает знания в виде сетевых структур. В качестве вер-шин сети выступают понятия, факты, объекты, события и т. п., а в качестве дуг сети -- отношения, которыми вершины связаны между собой. Так, семантичес-кая сеть, представляющая знания об автомобиле гр. Васильева, показана на рис. П. 17.

Семантические сети часто рассматривают как общий формализм для представ-ления знаний. Частным случаем таких сетей являются сценарии, в которых в качестве отношений выступают каузальные отношения или отношения типа «цель -- средство».

Вершины сети соединяются дугой, если соответствующие объекты предметной области находятся в каком-либо отношении. Самыми распространенными явля-ются следующие типы отношений:

БЫТЬ ЭЛЕМЕНТОМ КЛАССА (ЯВЛЯТЬСЯ) - означает, что объект входит в состав данного класса, например: ВАЗ 2106 является автомобилем;

ИМЕТЬ -- позволяет задавать свойства объектов, например: жираф имеет длин-ную шею;

ЯВЛЯТЬСЯ СЛЕДСТВИЕМ -- отражает причинно-следственные связи, напри-мер: астеническое состояние является следствием перенесенного простудного заболевания;

ИМЕТЬ ЗНАЧЕНИЕ -- задает значение свойств объектов, например: пациент может иметь двух братьев.

Как и в системе, основанной на фреймах, в семантической сети могут быть пред-ставлены родовидовые отношения, которые позволяют реализовывать наследо-вание свойств от объектов-родителей. Это обстоятельство приводит к тому, что семантические сети приобретают все недостатки и достоинства представления знаний в виде фреймов. Преимущества заключаются в простоте и наглядности описания предметной области. Однако последнее свойство с усложнением семан-тической сети теряется и, кроме того, существенно увеличивается время вывода. Также к недостаткам семантических сетей относят сложность обработки различ-ного рода исключений.

Другие методы представления знаний

Из других методов представления знаний популярностью пользуется представ-ление знаний по примерам. Работая с системой такого типа, пользователь задает ей несколько примеров решения задач из актуальной предметной облас-ти. На основе этих примеров система самостоятельно строит базу знаний, кото-рая затем применяется для решения других задач. При создании базы знаний пользователь имеет возможность в любой момент вызвать на экран дисплея мат-рицу, состоящую из примеров задач и их решений, с тем чтобы установить в ней наличие пустых мест, которые необходимо заполнить недостающими примера-ми «задача--решение».

Знания в такой системе могут храниться в различной форме. Это может быть, например, интенсиональная форма, когда пользователь вводит в систему прави-ла операций с атрибутами объектов предметной области, приводящие к требуе-мому решению. Также это может быть экстенсиональная форма, при которой каждый пример детально описывается пользователем и представляется в памя-ти компьютера в виде совокупности значений выделенных атрибутов. Возможно сочетание и той, и другой форм. В результате получается матрица примеров, ко-торая может быть расширена или изменена лишь путем корректировки приме-ров, содержащихся в матрице, или их добавлением.

Основным достоинством представления знаний по примерам является простота данного способа, поскольку пользователь может не иметь ни малейшего пред-ставления о продукционных правилах, исчислении предикатов, фреймах и семан-тических сетях. Вместе с тем, в качестве недостатков метода представления знаний по примерам отмечают отсутствие гибкости процесса построения интеллектуаль-ной системы. Пользователь оказывается отстраненным от собственно создания базы знаний и поэтому не может контролировать связи между содержащимися в ней понятиями.

Выбор способа представления знаний осуществляется инженером по знаниям после того, как им достигнуто понимание природы данных моделируемой обла-сти. При решении сложных задач возможны ситуации, когда источники знаний различаются по типам, и, соответственно, представление таких знаний требует использования разных способов (смешанное представление). Тогда для продук-тивного функционирования интеллектуальной системы нередко применяют прин-цип доски объявлений, с помощью которого реализуется взаимодействие различ-ных независимых источников знаний.

1.3. Приобретение знаний

Извлечение знаний - процесс взаимодействия инженера по знаниям с источником знаний (экспертом), в результате которого становятся явными процесс рассуждений специалистов при принятии решения и структура их представлений о предметной области. Занимается извлечением знаний инженер по знаниям. Инженер по знаниям - это специалист по искусственному интеллекту, проектирующий и создающий экспертную систему. Обычно инженер по знаниям выступает в роли посредника между экспертом и базой знаний.

Для получения знаний инженером по знаниям ему необходим эксперт. Эксперт - это специалист, который за годы обучения и практической деятельности научился эффективно решать задачи, относящиеся к конкретной предметной области. Эксперт - это специалист, который может делать экспертные оценки. Экспертные оценки - это основанные на суждениях специалистов количественные или бальные оценки процессов или явлений, не поддающихся непосредственному измерению.

Понятие «управление знаниями» (Knowledge Management, КМ) родилось в середине 90-х годов в крупных корпорациях, где проблемы обработки информации приобрели особую остроту, став критическими. Выяснилось, что основное узкое место - это обработка знаний, накопленных специалистами компании (именно такие знания обеспечивают ей преимущество перед конкурентами). Знание, которое не используется и не возрастает, и в конечном счете устаревает и становится бесполезным, точно так же, как деньги, которые хранятся, не превращаясь в оборотный капитал, в конечном счете обесцениваются. Знание же, которое распространяется, приобретается и обменивается, наоборот, генерирует новое знание. Существуют десятки определений знания, но в системах KM знания - это фундаментальный ресурс, базирующийся на практическом опыте специалистов и на данных, используемых на конкретном предприятии.

Ресурсы знаний различаются в зависимости от отраслей индустрии и приложений, но, как правило, в них входят методики, технологии, процедуры обработки информации, накопившиеся в процессе функционирования предприятия; руководства, письма, новости, сведения о заказчиках и конкурентах, схемы, чертежи и другие данные. Традиционно проектировщики систем КМ ориентируются в основном на менеджеров, хотя есть и тенденция принимать в расчет более широкий круг работников организации.

Для интеграции в единый комплекс системы KM используют ряд технологий:

· традиционные системы автоматизации и информационно-поисковые системы;

· электронную почту, корпоративные сети и Интернет-сервисы;

· базы и хранилища данных (data warehouse);

· системы электронного документооборота;

· специализированные программы обработки данных (например, статистического анализа);

· экспертные системы и базы знаний.

При разработке систем КМ можно выделить следующие этапы.

? Накопление. Стихийное и бессистемное накопление информации в организации.

? Извлечение. Процесс переноса компетентности специалистов на аналитика. Это один из наиболее сложных и трудоемких этапов, от его успешности зависит дальнейшая жизнеспособность системы.

? Структурирование и формализация. На этом этапе должны быть выделены основные понятия, выработана структура представления информации. Она должна быть максимально наглядной и такой, чтобы ее было легко изменять и дополнять. Именно на этом этапе создаются описания и модели бизнес процессов и структуры потоков информации.

? Проектирование системы. Предметная постановка задачи, разработка архитектуры и спецификаций для программирования.

? Программная реализация. Разработка собственно программного комплекса системы.

? Обслуживание. Под ним понимается корректировка формализованных данных и знаний (добавление, обновление); «чистка» - удаление устаревшей информации; фильтрация данных и знаний для поиска информации, необходимой пользователям.

Это не единственно возможное описание процесса разработки, но оно позволяет понять, что происходит при создании реальных систем управления знаниями. В литературе достаточно подробно описаны лишь этапы проектирования и реализации, при том, что основную сложность представляют этапы извлечения и структурирования. Мало кто из разработчиков знает, что существует наука под названием «инженерия знаний» (knowledge engineering), возникшая в русле разработки интеллектуальных систем, или систем, основанных на знаниях, примерно 15-20 лет назад.

Поскольку основная проблема инженерии знаний - это процесс извлечения знаний, разработчикам систем KM и в первую очередь аналитику необходимо четко понимать природу и особенности этих процессов. Можно выделить три основных аспекта процесса извлечения знаний:

A = {A1, А2, А3} = {психологический, лингвистический, гносеологический}.

Следует отметить, что даже если речь идет о разработке традиционной информационной системы, а не системы KM, проблемы инженерии знаний не теряют своей актуальности.

Из трех аспектов извлечения знаний наиболее важен психологический (А1), поскольку он определяет успешность и эффективность взаимодействия (общения) аналитика с основным источником знаний - специалистами предприятия.

1.3.1. Приобретение и извлечение знаний

Существует определение термина приобретение знаний: "Передача и преобразование опыта решения проблем, полученного от некоторого источника знаний, в программу".

Термин приобретение знаний носит обобщенный характер и совершенно нейтрален к способу передачи знаний. Например, передача может осуществляться с помощью специальной программы, которая в процессе обработки большого массива историй болезни устанавливает связь между симптомами и заболеваниями. А вот термин извлечение знаний относится именно к одному из способов передачи знаний -- опросу экспертов в определенной проблемной области, который выполняется аналитиком или инженером по знаниям. Последний затем создает компьютерную программу, представляющую такие знания (или поручает это кому-нибудь другому, обеспечивая его всей необходимой информацией).

Этот же термин применяется и для обозначения процесса взаимодействия эксперта со специальной программой, целью которого является:

· извлечь каким-либо систематическим способом знания, которыми обладает эксперт, например, предлагая эксперту репрезентативные задачи и фиксируя предлагаемые способы их решения;

· сохранить полученные таким образом знания в некотором промежуточном виде;

· преобразовать знания из промежуточного представления в вид, пригодный для практического использования в программе, например в набор порождающих правил.

Преимущество использования такой программы -- снижение трудоемкости процесса, поскольку перенос знаний от эксперта к системе осуществляется в один прием.

1.3.2. Теоретический анализ процесса приобретения знаний

Стадии приобретения знаний

Можно выделить несколько стадий приобретения знаний.

(1) Идентификация. Анализируется класс проблем, которые предполагается решать с помощью проектируемой системы, включая данные, которыми нужно оперировать, и критерии оценки качества решений. Определяются ресурсы, доступные при разработке проекта, -- источники экспертных знаний, трудоемкость, ограничения по времени, стоимости и вычислительным ресурсам.

(2) Концептуализация. Формулируются базовые концепции и отношения между ними. Сюда же входят и характеристика различных видов используемых данных, анализ информационных потоков и лежащих в их основе структур в предметной области в терминах причинно-следственных связей, отношений частное/целое, постоянное/временное и т.п.

(3) Формализация. Предпринимается попытка представить структуру пространства состояний и характер методов поиска в нем. Выполняется оценка полноты и степени достоверности (неопределенности) информации и других ограничений, накладываемых на логическую интерпретацию данных, таких как зависимость от времени, надежность и полнота различных источников информации.

(4) Реализация. Преобразование формализованных знаний в работающую программу, причем на первый план выходит спецификация методов организации управления процессом и уточнение деталей организации информационных потоков. Правила преобразуются в форму, пригодную для выполнения программой в выбранном режиме управления. Принимаются решения об используемых структурах данных и разбиении программы на ряд более или менее независимых модулей.

(5) Тестирование. Проверка работы созданного варианта системы на большом числе репрезентативных задач. В процессе тестирования анализируются возможные источники ошибок в поведении системы. Чаще всего таким источником является имеющийся в системе набор правил. Оказывается, что в нем не хватает каких-то правил, другие не совсем корректны, а между некоторыми обнаруживается противоречие.

1.3.3. Методы извлечение знаний из памяти эксперта

В этом разделе рассмотрены особенности процедуры взаимодействия инженера по знаниям с источником знаний (экспертом), позволяющей сделать явными рассуждения специалистов при принятии решений и структуру их представле-ний о предметной области.

Процедура взаимодействия инженера по знаниям с экспертом

Известен парадоксальный факт Джонсона о том, что по мере накопления опыта специалист-эксперт все больше утрачивает умение словесно выражать свои зна-ния. Имеются достаточно убедительные психологические доказательства того, что люди далеко не всегда в состоянии достоверно описать свои мыслительные про-цессы. Теоретик искусственного интеллекта Марвин Минский писал, что «само-сознание -- это сложная, но тщательно сконструированная иллюзия...» и что «.. .только как исключение, а не как правило, человек может объяснить то, что он знает».

Другое психологическое положение состоит в том, что опыт эксперта -- это инту-иция, которая трудно поддается выражению в форме правил типа «ЕСЛИ -- ТО». Широко известно высказывание Лао-Цзы («старого учителя»): «Кто скажет, тот не знает, кто знает, тот не скажет».

Тем не менее, инженерия знаний предлагает определенные методы (приемы, способы) работы с экспертами. Эти методы направлены на «раскручивание» лабиринтов памяти экспертов, в которых хранятся знания, часто имеющие не-вербальный характер.

Классификация методов работы с экспертами

В основу излагаемого материала положена классификация коммуникативных методов работы инженера по знаниям.

Под коммуникативными методами понимают все виды контактов инженера по знаниям с живым источником знаний -- экспертом. Среди этих методов выделя-ют две большие группы: активные и пассивные (рис. П.21).

Пассивные методы подразумевают, что ведущая роль в процедуре извлечения знаний принадлежит эксперту. При этом инженер по знаниям главным образом протоколирует рассуждения и действия эксперта.

В активных методах инициатива полностью в руках инженера по знаниям. Он ведет с экспертом беседу, предлагает различные «игры», организует «круглый стол» и т. д.

Пассивные методы на первый взгляд просты. Вместе с тем, они требуют от ин-женера по знаниям умения анализировать «поток сознания» эксперта и выде-лять в нем ценные фрагменты знания.

Активные методы разделяют на две группы в зависимости от числа экспертов, участвующих в процедуре извлечения знаний. В групповых методах большое значение имеет дискуссия между экспертами, в которой нередко выявляются нетривиальные аспекты знаний. В то же время, ведущую роль на сегодняшний день играют индивидуальные методы. В значительной степени это связано с де-ликатностью процедуры «отъема знаний».

Пассивные методы

Наблюдение

Метод наблюдения является единственным «чистым» методом, где инженер по знаниям не вмешивается в процесс работы эксперта и не навязывает ему какие-либо собственные представления. Выделяют две разновидности наблю-дений:

· Наблюдение за реальным процессом.

· Наблюдение за имитацией процесса.

Сначала обычно применяют первую разновидность и наблюдают за реальным процессом на рабочем месте эксперта. Это помогает глубже понять предметную область и отметить все внешние особенности процедуры принятия решений, необходимые для проектирования интерфейса пользователя.

На втором этапе эксперт имитирует процесс. В таком режиме он менее напря-жен и работает на «два фронта» -- ведет профессиональную деятельность и од-новременно демонстрирует ее.

Сеансы наблюдений предъявляют к инженеру по знаниям следующие требования:

· Владение техникой стенографии.

· Знакомство с методиками хронометрирования для четкого структурирования производственного процесса во времени.

· Развитые навыки «чтения по глазам», то есть наблюдательность к жестам, мимике и другим невербальным компонентам общения.

· Предварительное знакомство с предметной областью.

Протоколы наблюдений после проведения сеансов тщательно расшифровываются, а затем обсуждаются с экспертом.

Анализ протоколов «мыслей вслух»

При протоколировании «мыслей вслух» эксперта просят раскрыть всю цепочку рассуждений, объясняющих его действия и решения. При таком протоколирова-нии считается важным зафиксировать не только весь «поток сознания» экспер-та, но даже паузы и междометия в речи эксперта. Иногда данный метод называ-ют «вербальными отчетами».

При протоколировании «мыслей вслух» эксперт может проявить себя максималь-но ярко. Он ничем не скован, ему никто не мешает, он как бы свободно парит в потоке собственных рассуждений и умозаключений, может блеснуть своей эру-дицией и продемонстрировать глубину познаний. Для большого числа экспер-тов это самый приятный и лестный способ извлечения знаний.

Вместе с тем, как отмечалось выше, далеко не каждый специалист, даже из числа умеющих произносить впечатляющие монологи о своей работе, оказывается в состоянии формализовать и структурировать рассуждения. Однако существуют люди, склонные к рефлексии, способные к конструктивному изложению мыслей. Такие люди -- находка для инженера по знаниям.

Лекции

Лекторский дар встречается нечасто. Опытный лектор хорошо структурирует свои знания и ход рассуждений. Но бывает, некоторые люди обладают лекторским

даром, но не подозревают о его присутствии. В любом случае инженеру по зна-ниям стоит попробовать озадачить эксперта подготовкой лекции на интересую-щую тему. Если эксперт сумеет преодолеть специфический психологический барьер и войти в образ педагога, это может оказаться весьма эффективным для решения задачи извлечения знаний.

Хороший вопрос инженера по знаниям по ходу лекции имеет важное значение. Серьезные, глубокие и интересные вопросы, с одной стороны, стимулируют твор-ческое воображение лектора, и с другой -- повышают авторитет инженера по знаниям.

Продолжительность лекций рекомендуется стандартная -- от 40 до 50 минут, и через 5-10 минут -- еще столько же. Весь курс должен занимать, как правило, от двух до пяти лекций.

Метод извлечения знаний в форме лекций, как и все пассивные методы, применя-ют в начале многоэтапной процедуры извлечения знаний из памяти эксперта. Он способствует быстрому погружению инженера по знаниям в предметную область.

Активные индивидуальные методы

Анкетирование

Анкетирование является наиболее стандартизированным методом. Составление анкеты -- достаточно тонкий и ответственный момент. Вот несколько рекомен-даций:

· анкета не должна быть монотонной и однообразной, чтобы не вызывать ску-ку и усталость. Для этого вопросы должны варьироваться, тематика менять-ся. Кроме того, нередко в анкету вставляют специальные вопросы-шутки и игровые вопросы;

· анкета должна быть приспособлена к языку экспертов;

· следует учитывать, что вопросы влияют друг на друга. Поэтому последова-тельность вопросов должна быть хорошо продумана;

· анкета должна иметь «хорошие манеры». Ее нужно излагать ясным, понят-ным и предельно вежливым языком. Методическим мастерством составления анкеты можно овладеть только на практике.

Процедура анкетирования может проводиться двумя способами. В первом ана-литик вслух задает вопросы и сам заполняет анкету по ответам эксперта. Во вто-ром эксперт заполняет анкету самостоятельно после предварительного инструк-тирования.


Подобные документы

  • Проблема представления знаний в компьютерных системах – одна из основных проблем в области искусственного интеллекта. Исследование различных моделей представления знаний. Определения их понятия. Разработка операции над знаниями в логической модели.

    курсовая работа [51,9 K], добавлен 18.02.2011

  • База знаний - структурированная информация из области знаний для использования кибернетическим устройством (человеком). Классификация, структура, формат представления знаний, интеллектуальные системы поиска информации. Базы знаний на примере языка Пролог.

    презентация [51,3 K], добавлен 17.10.2013

  • Проблема представления знаний. Представление декларативных знаний как данных, наделенных семантикой. Представление процедурных знаний как отношений между элементами модели, в том числе в виде процедур и функций. Представление правил обработки фактов.

    курсовая работа [33,1 K], добавлен 21.07.2012

  • Представление знаний в когнитологии, информатике и искусственном интеллекте. Связи и структуры, язык и нотация. Формальные и неформальные модели представления знаний: в виде правил, с использованием фреймов, семантических сетей и нечетких высказываний.

    контрольная работа [29,9 K], добавлен 18.05.2009

  • Анализ процессов диагностики повреждений трубопровода. Разработка модели продукционной базы знаний: обзор методов представления знаний, описание создания базы знаний и разработки механизма логического вывода. Экономическое обоснование концепции проекта.

    дипломная работа [3,0 M], добавлен 16.04.2017

  • Понятие искусственного интеллекта в робототехнике и мехатронике. Структура и функции интеллектуальной системы управления. Классификация и типы знаний, представление их с помощью логики предикатов. Суть семантических сетей, фреймовое представление знаний.

    курс лекций [1,1 M], добавлен 14.01.2011

  • Изучение фреймового способа представления знаний, его специфики и основных характеристик. Обзор других методов представления знаний, их плюсы и минусы. Иерархическая структура данных фрейма. Механизм управления выводом с помощью присоединенной процедуры.

    реферат [2,6 M], добавлен 22.12.2014

  • Сущность данных и информации. Особенности представления знаний внутри ИС. Изучение моделей представления знаний: продукционная, логическая, сетевая, формальные грамматики, фреймовые модели, комбинаторные, ленемы. Нейронные сети, генетические алгоритмы.

    реферат [203,3 K], добавлен 19.06.2010

  • Особенности разработки системы автоматизированного контроля знаний специалистов по дефектоскопии. Обзор автоматизированных систем обучения и контроля знаний. Психологические механизмы усвоения знаний. Принципы создания эффективной тестирующей программы.

    дипломная работа [1,8 M], добавлен 30.08.2010

  • Классы и группы моделей представления знаний. Состав продукционной системы. Классификация моделей представления знаний. Программные средства для реализации семантических сетей. Участок сети причинно-следственных связей. Достоинства продукционной модели.

    презентация [380,4 K], добавлен 14.08.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.