Разработка элективного курса "Основы искусственного интеллекта"
Определения знаний и приобретения знаний человеком. Виды знаний и способы их представления. Приобретение и извлечение знаний. Визуальное проектирование баз знаний как инструмент обучения. Программное обеспечение для проведения лабораторных работ.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 12.12.2008 |
Размер файла | 960,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Выбор способа зависит от ряда условий (в частности от оформления анкеты, ее понятности, готовности эксперта). Вместе с тем, второй способ представляется предпочтительным, так как у эксперта появляется неограниченное время на об-думывание вопросов и снижается так называемый эффект присутствия.
Интервью
Перед проведением интервью неплохо спросить себя: «А умеем ли мы задавать вопросы?» В философии эта проблема обсуждается с древности. Рассмотрим клас-сификацию вопросов (рис. П.22).
Открытый вопрос обозначает тему или предмет, предоставляя эксперту свободу по форме и содержанию ответа.
При закрытом вопросе эксперту предлагается набор ответов, среди которых он должен сделать выбор.
Закрытые вопросы легче обрабатываются, но они в определенной мере «програм-мируют» ответ эксперта и «закрывают» ход его рассуждений. Поэтому при со-ставлении сценария интервью обычно чередуют открытые и закрытые вопросы и особенно тщательно продумывают «меню» и содержание закрытых вопросов.
Личный вопрос апеллирует к индивидуальному опыту эксперта. Личные вопро-сы обычно активизируют мышление эксперта, «играют» на его самолюбии, ук-рашают интервью.
Безличный вопрос нацелен на выявление наиболее распространенных и общепри-нятых закономерностей предметной области.
При подготовке вопросов учитывают, что языковые возможности эксперта, как правило, ограничены. Кроме того, имеют в виду, что из-за замкнутости, скован-ности и робости отдельные эксперты не могут сразу высказать свое мнение и предоставить требуемые! знания. Поэтому часто используют не прямые вопросы, которые непосредственно указывают на предмет или тему, а косвенные, опосре-дованно направляющие внимание на актуальную проблему. Иногда в интересах дела приходится задавать несколько косвенных вопросов вместо одного прямого.
Вербальные вопросы -- это традиционные устные вопросы.
Вопросы с использованием наглядного материала разнообразят интервью и сни-жают утомляемость эксперта. В качестве наглядного материала используют фо-тографии, рисунки и карточки.
Разделение вопросов по функции на основные, зондирующие и контрольные связано с тем, что нередко эксперт по каким-то причинам уходит в сторону от вопроса и основные вопросы интервью оказываются непродуктивными. Тогда аналитик применяет зондирующие вопросы, концентрирующие внимание эксперта в нужном направлении. Контрольные вопросы используют для проверки досто-верности и объективности полученной информации.
Нейтральные вопросы носят беспристрастный характер. В то же время, наводя-щие вопросы заставляют эксперта прислушаться или даже принять во внимание позицию интервьюера.
Кроме приведенных в классификации на рис. П.22, полезно различать и вклю-чать в интервью следующие виды вопросов:
· контактные («ломающие лед» между аналитиком и экспертом);
· буферные (для разграничения различных тем интервью);
· оживляющие память экспертов (для реконструкции отдельных случаев из практики);
· «провоцирующие» (для получения спонтанных, неподготовленных ответов).
Свободный диалог
При свободном диалоге инженера по знаниям с экспертом отсутствует какой-либо регламентированный план. Однако эта форма извлечения знаний требует самой серьезной предварительной подготовки. На рис. П.23 показана одна из рекомендуемых схем такой подготовки.
Квалифицированная подготовка к диалогу -- подлинная драматургия. В ее сце-нарии предусматривают плавное развитие процедуры извлечения знаний от при-ятного впечатления в начале беседы к профессиональному контакту через про-буждение интереса и завоевание доверия эксперта.
Для обеспечения желания эксперта продолжать беседу обычно производят «по-глаживания» типа: «Я Вас понимаю...», «...Это очень интересно» и т. п. При этом поведение аналитика должно быть искренним, ведь давно известно, что лучшая уловка -- избегать всяких уловок и относиться к собеседнику с истинным ува-жением и настоящим интересом.
Существует каталог свойств идеального интервьюера: «Он должен выглядеть здоровым, спокойным, уверенным, внушать доверие, быть искренним, веселым, проявлять интерес к беседе, быть опрятно одетым, ухоженным».
Активные групповые методы
Активные групповые методы сами по себе не могут служить источником более или менее полного знания. Они выступают как дополнительные и служат хоро-шей «приправой» к индивидуальным методам извлечения знаний, активизиру-ющей мышление и поведение экспертов.
«Круглый стол»
Метод круглого стола предполагает равноправное обсуждение интересующей проблемы несколькими экспертами. Задача дискуссии -- коллективно, с разных точек зрения, под разными углами исследовать спорные проблемы предметной области. Для остроты на «круглый стол» приглашают представителей различ-ных научных направлений и поколений. Число участников дискуссии обычно колеблется от трех до пяти-семи.
Перед началом дискуссии ведущему (инженеру по знаниям) необходимо убедить-ся, что все участники правильно понимают задачу. Затем нужно установить рег-ламент и четко сформулировать тему.
По ходу дискуссии важно проследить, чтобы слишком эмоциональные и разго-ворчивые эксперты не подменяли тему и чтобы критика позиций друг друга была обоснованной. Определенные усилия ведущий должен приложить для уменьше-ния «эффекта фасада», когда у участников превалирует желание произвести впечатление на других и они говорят совсем не то, что сказали бы в нормальной обстановке.
«Мозговой штурм»
«Мозговой штурм» или «мозговая атака» -- один из наиболее популярных мето-дов раскрепощения и активизации человеческого мышления. Впервые этот ме-тод был использован в 1939 году А. Осборном в США для генерации новых идей. Основное положение штурма -- отделение процедуры генерации идей в замкну-той группе специалистов от процесса их анализа и оценки.
Обычная продолжительность штурма -- порядка 40 минут. Количество участни-ков -- до 10 человек. Этим участникам предлагается высказать на заданную тему любые мысли, в том числе шутливые, фантастические и ошибочные. Критика зап-рещена. Регламент -- до 2 минут на выступление.
Из опыта известно, что число высказанных идей часто превышает 50. Наиболее существенный момент штурма -- наступление пика (ажиотажа), когда идеи на-чинают буквально «фонтанировать». Последующий анализ, который проводит группа сторонних экспертов, как правило, показывает, что всего лишь 10-15 % идей разумны, но среди них встречаются весьма оригинальные.
Искусство инженера по знаниям, проводящего «мозговой штурм», заключается в способности задавать вопросы аудитории, «подогревая» аудиторию. Вопросы служат своеобразным «крючком», которым извлекаются идеи.
Экспертные игры
Плодотворность моделирования реальных ситуаций в играх сегодня подтверж-дена практически во всех областях науки и техники. Ниже рассмотрены различ-ные виды экспертных игр в соответствии с классификацией.
Игры с экспертом
В играх с экспертом инженер по знаниям берет на себя какую-либо роль в моде-лируемой ситуации. Например, это может быть роль Ученика, который на глазах у эксперта (Учителя), поправляющего Ученика, выполняет работу на заданную тему. Такая игра -- хороший способ разговорить застенчивого эксперта. Другой пример -- игра в Специалиста (инженер по знаниям) и Консультанта (эксперт). Эта игра дает иногда впечатляющие результаты.
Для выявления скрытых пластов знания применяется игра, в которой специа-лист делает прогнозы в профессиональных ситуациях и дает им обоснования. Затем по истечении определенного времени специалисту предъявляют его соб-ственные обоснования и просят произвести по ним прогнозы. Как оказывается, такой простой прием нередко позволяет обнаружить пропущенные шаги в рас-суждениях эксперта.
В игре «фокусировка на контексте» эксперт выполняет роль экспертной систе-мы, а инженер по знаниям -- роль пользователя. Моделируется ситуация кон-сультации. Первые реакции эксперта концентрируются вокруг наиболее значи-мых понятий и самых важных аспектов проблемы.
В целом по играм с экспертом даются следующие основные советы инженеру по знаниям:
· Играйте смелее, придумывайте игры сами.
· Не навязывайте игру эксперту, если он не расположен.
· Не «давите» на эксперта, не забывайте цели игры.
· Не забывайте о времени и о том, что игра утомительна для эксперта.
· Играйте весело, нешаблонно.
Ролевые игры в группе
В каждой групповой игре заранее составляется сценарий, распределяются роли, готовятся портреты-описания ролей и разрабатывается система оценивания иг-роков.
Известны различные способы проведения ролевых игр. В одних играх участни-ки придумывают себе новые имена и выступают под ними. В других все игроки переходят на «ты». В третьих роли выбирают игроки, в четвертых для распреде-ления ролей вытягивается жребий.
Обычно в игре, предназначенной для получения знания, принимают участие от трех до шести экспертов. В случае большего числа экспертов они разбиваются на группы, между которыми организуется состязание: чей диагноз окажется ближе к истинному, чей план рациональнее использует ресурсы, кто быстрее опреде-лить неисправность в техническом блоке и т. п.
Создание игровой обстановки требует фантазии и выдумки от инженера по зна-ниям. Главное, чтобы эксперты в игре максимально погрузились в ситуацию, действительно «заиграли», раскрепостились и «раскрыли свои карты».
Игры с тренажерами
Тренажеры широко применяются для обучения профессиям, требующим дина-мического реагирования на изменяющуюся производственную ситуацию. Сюда относятся профессии летчиков, судоводителей, операторов атомных станций и др. Применение тренажеров для извлечения знаний позволяет фиксировать фраг-менты так называемых летучих знаний. Эти знания сиюминутны и, как правило, трудно воспроизводимы и выпадают из памяти в обычной обстановке при выхо-де из моделируемой ситуации.
1.3.4. Извлечение знаний: психологический аспект
Психологические проблемы извлечения знаний
Как известно, в процессе человеческого общения воспринимается далеко не вся возможная информация. В связи с этим актуальна проблема увеличения информативности общения аналитика и специалистов предприятия за счет использования психологических знаний.
Модель общения при извлечении знаний включает такие структурные компоненты: участники общения (партнеры); средства общения (процедура); предмет общения (знания). В соответствии с этой структурой выделим три «слоя» психологических проблем, возникающих при извлечении знаний.
Контактный слой
Разработка корпоративных систем - это коллективный процесс, для которого небезразлична атмосфера в группе разработчиков. Проводились эксперименты, результаты которых неоспоримо показывают, что дружеская атмосфера в коллективе больше влияет на результат, чем индивидуальные способности членов группы. Особенно важно, чтобы в коллективе разработчиков складывались кооперативные, а не конкурентные отношения.
Прогнозировать совместимость в общении со 100 %-ной гарантией невозможно. Однако можно выделить те факторы, черты личности, характера и другие особенности участников разработки, которые, несомненно, оказывают влияние на эффективность процедуры.
Пол и возраст. Значения этих параметров хотя и влияют на эффективность контакта, но не являются критическими. В литературе отмечается ,что хорошие результаты дают гетерогенные (смешанные) пары мужчина/женщина. Что касается соотношения возрастов, лучше, когда оно подчиняется следующей зависимости:
20 > (Вэ - Ва) > 5
где Вэ - возраст эксперта-специалиста; Ва - возраст аналитика.
Характеристики личности и темперамента. Под личностью обычно понимается устойчивая система психологических черт, характеризующая индивидуальность человека. Рекомендуемые составляющие для аналитика: доброжелательность, аналитичность, хорошая память, внимание, наблюдательность, воображение, впечатлительность, большая собранность, настойчивость, общительность, находчивость.
Со времен Галена и Гиппократа, выделивших четыре классических типа темперамента, используются понятия холерик, сангвиник, меланхолик, флегматик. Для эффективной работы аналитика предпочтительны сангвинический и холерический темперамент.
Мотивация. На эффективность коллективного решения задач влияет и мотивация участников - их стремление к успеху. Аналитик в зависимости от условий разработки должен изыскивать разнообразные стимулы для экспертов-специалистов. Эксперт передает аналитику один из самых дорогих в мире продуктов - знания. И если одни люди делятся опытом добровольно и с удовольствием, то другие весьма неохотно приоткрывают свои профессиональные тайны. Иногда оказывается полезно возбудить в эксперте дух соперничества, конкуренции (не нарушая, естественно, обстановки кооперативности в коллективе).
Процедурный слой
Параметры процедурного слоя описывают процесс проведения процедуры извлечения знаний.
Ситуация общения (место, время, продолжительность). Беседу с экспертом лучше всего проводить в небольшом помещении наедине, поскольку посторонние люди нарушают доверительность беседы и могут породить эффект «фасада». Рабочее место эксперта - не лучший вариант, так как его могут отвлекать телефонные звонки, сотрудники и пр. Американский психолог И. Атватер считает, что для делового общения наиболее благоприятна дистанция между собеседниками от 1,2 до 3 м. Минимальным «комфортным» расстоянием можно считать 0,7-0,8 м. Реконструкция знаний- трудоемкий процесс, и поэтому длительность одного сеанса обычно не превышает 1,5-2 часов. Лучше выбрать эти два часа в первой половине дня, если эксперт относится к типу «жаворонок», и во второй, если он «сова». Известно, что взаимная утомляемость партнеров при беседе наступает обычно через 20-25 минут, поэтому в сеансе нужно делать паузы.
Оборудование (вспомогательные средства, освещенность, мебель). Одно из основных средств увеличения эффективности процесса извлечения знаний - использование наглядного материала. При этом учитывается, что большую часть информации человек получает при помощи зрения. Совет активнее пользоваться схемами и рисунками можно считать универсальным. Для протоколирования результатов сейчас используются следующие способы:
? запись на бумагу непосредственно по ходу беседы;
? запись на диктофон, помогающая аналитику проанализировать весь ход сеанса и свои ошибки;
? запоминание с последующей записью после.
Наиболее распространен первый способ. Наибольшая опасность при этом - потеря знаний, поскольку любая запись ответов - это уже интерпретация, привносящая субъективное понимание предмета. Значения параметров освещенности очевидны и связаны с влиянием внешних факторов на эксперта.
Профессиональные приемы (темп, стиль, методы и др.). Учет индивидуального темпа и стиля эксперта позволяет аналитику снизить напряженность процедуры извлечения знаний. Типичная ошибка - навязывание собственных темпа и стиля.
На успешность также влияет длина фраз, которые произносит аналитик. Это было установлено американскими учеными - лингвистом Ингве и психологом Миллером - при исследовании причин низкой усвояемости команд на военно-морском флоте США. Причиной оказалась длина команд. Выяснилось, что человек лучше всего воспринимает предложения глубиной (или длиной) 7±2 слова. Эта величина получила название «число Ингве -- Миллера». Можно считать его мерой «разговорности» речи.
Большая часть информации поступает к аналитику в форме предложений на естественном языке. Однако внешняя речь эксперта есть воспроизведение его внутренней речи (мышления), которая гораздо богаче и многообразнее. Для передачи этой внутренней речи эксперт использует и невербальные средства, такие, как интонация, мимика, жесты. Опытный аналитик старается по возможности записывать в протоколы (в форме ремарок) и эту дополнительную интонацию.
Kогнитивный слой
Для эффективного моделирования когнитивных (от англ. cognition - познание), или познавательных, процессов необходимо учитывать их природу. На сегодняшний день эти вопросы наименее исследованы и требуют изучения так называемых когнитивных стилей. Под когнитивным стилем человека понимается совокупность критериев предпочтения при решении задач и познании мира, специфическая для каждого индивида. Когнитивный стиль определяет не столько эффективность деятельности, сколько способ достижения результата. Это способ познания, который позволяет людям с разными способностями добиваться одинаковых результатов в деятельности; система средств и индивидуальных приемов, к которым прибегает человек для организации своей деятельности.
Можно выделить несколько важных характеристик когнитивных стилей.
Полезависимость - поленезависимость. Поленезависимость позволяет человеку акцентировать внимание лишь на тех аспектах проблемы, которые необходимы для решения конкретной задачи, и отбрасывать все лишнее, т.е. не зависеть от фона или окружающего задачу шумового поля. Эта характеристика коррелирует с такими чертами личности, как невербальный интеллект, аналитичность мышления, способность к пониманию сути. Очевидно, что не только самому аналитику необходимо высокое значение этого параметра; поленезависимый эксперт - это тоже желательный фактор. Однако приходится учитывать, что полезависимые люди лучше общаются, они более контактны. Для общения особенно удачны гетерогенные (смешанные) пары: «полезависимый - поленезависимый».
Поленезависимость - одна из характерных профессиональных черт когнитивного стиля наиболее квалифицированных аналитиков. По некоторым данным, мужчины более поленезависимы, чем женщины.
Импульсивность - рефлективность (рефлексивность). Под импульсивностью понимается быстрое принятие решения (часто без достаточного обоснования), а под рефлексивностью - склонность к рассудительности. Рефлексивность, по экспериментальным данным, коррелирует со способностью к формированию понятий и продуктивностью стратегий решения логических задач. Таким образом, и аналитику, и эксперту желательно быть рефлексивными, хотя собственный стиль изменяется лишь частично и с большим напряжением.
Ригидность - гибкость. Этот фактор характеризует способность человека изменять установки и свою точку зрения в соответствии с изменяющейся ситуацией. Ригидные люди не склонны менять свои представления и структуру восприятия; гибкие, напротив, легко приспосабливаются к новой обстановке. Очевидно, что если эксперт еще может позволить себе ригидность (что характерно для долго работающих над одной проблемой специалистов, особенно старшего возраста), то аналитику эта характеристика когнитивного стиля явно противопоказана. Увеличение ригидности с возрастом отмечается многими психологами.
Когнитивная эквивалентность. Характеризует способность человека к различению понятий и разбиению их на классы и подклассы. Чем уже диапазон когнитивной эквивалентности, тем более тонкую классификацию способен провести индивид, тем большее количество признаков понятий он может выделить. Обычно у женщин диапазон когнитивной эквивалентности уже, чем у мужчин.
Психологические проблемы, рассмотренные в этой статье, далеко не исчерпывают всего комплекса теоретических и практических аспектов проблемы извлечения знаний. О других проблемах мы поговорим в следующих статьях этого цикла.
1.3.5. Оболочки систем приобретения знаний
Приведенное выше разделение на этапы реализованы в среде KADS. В основе этого подхода лежит идея о том, что экспертная система является не контейнером, наполненным представленными экспертом знаниями, а "операционной моделью", которая демонстрирует некоторое нужное нам поведение в столкновении с явлениями реального мира. Приобретение знаний, таким образом, включает в себя не только извлечение специфических знаний о предметной области, но и интерпретацию извлеченных данных применительно к некоторой концептуальной оболочке и формализацию их таким способом, чтобы программа могла действительно использовать их в процессе работы.
В основу оболочки KADS положено пять базовых принципов.
(1) Использование множества моделей, позволяющее преодолеть сложность процессов инженерии знаний.
(2) Четырехуровневая структура для моделирования требуемой экспертности -- набора качеств, лежащих в основе высокого уровня работы специалистов.
(3) Повторное использование родовых компонентов модели в качестве шаблонов, поддерживающих нисходящую стратегию приобретения знаний.
(4) Процесс дифференциации простых моделей в сложные.
(5) Важность преобразования моделей экспертности с сохранением структуры в процессе разработки и внедрения.
Первый из принципов, положенных в основу KADS, состоит в том, что оболочка должна содержать множество частных моделей, помогающих найти ответ на эти вопросы. Примерами таких моделей могут служить:
· организационная модель "социально-экономической среды", в которой должна функционировать система, например финансовые услуги, здравоохранение и т.п.;
· прикладная модель решаемой проблемы и выполняемой функции, например диагностика, планирование расписания работ и т.д.;
· модель задач, демонстрирующая, как должна выполняться специфицированная функция, для чего производится ее разбиение на отдельные задачи, например сбор данных о доходах, формирование гипотез о заболеваниях.
Описанные принципы построения оболочки системы приобретения знаний получили дальнейшее развитие в системе CommonKADS. Эта система поддержки инженерии знаний содержит редакторы каждого из перечисленных типов моделей и множество инструментальных средств и компонентов, облегчающих проектирование экспертной системы. Существенную помощь менеджеру проекта при планировании работ должна оказать модель жизненного цикла экспертной системы. В дополнение к тем моделям, которые входили в состав ранних версий оболочки KADS, в новую версию включено несколько новых, в частности модель агента, которая представляет саму экспертную систему, ее пользователей и подключенные вычислительные системы.
В рамках проекта KASTUS онтология и методология оболочки KADS была использована и при построении больших повторно используемых баз знаний. Наименование проекта KASTUS -- сокращение от Knowledge about Complex Technical Systems for Multiple Use (знания многоразового применения о сложных технических системах). Цель проекта -- создание системы знаний, которую можно было бы использовать в множестве разнообразных приложений.
Как правило, человек-эксперт знает о той предметной области, в которой он является специалистом, гораздо больше, чем может выразить на словах. Вряд ли можно добиться от него многого, задавая вопросы в общем виде, например: "Что вам известно об инфекционных заболеваниях крови?" Гораздо продуктивнее подход, реализованный в программе TEIRESIAS, который предполагает вовлечение эксперта в решение несложных репрезентативных задач из определенной предметной области и извлечение необходимых знаний в процессе такого решения.
Задавшись определенным набором базовых правил, представляющих прототип экспертной системы, TEIRESIAS решает в соответствии с этими правилами какую-нибудь из сформулированных репрезентативных проблем и предлагает эксперту критиковать результаты. В ответ эксперт должен сформулировать новые правила и откорректировать введенные ранее, а программа отслеживает внесенные изменения, анализирует их на предмет сохранения целостности и непротиворечивости всего набора правил, используя при этом модели правил. В процессе анализа используется обобщение правил различного вида.
Проект COMPASS можно считать одним из наиболее ярких примеров использования традиционной методики приобретения знаний, базирующейся на соответствующим образом организованном опросе экспертов. Такая методология "выросла" из предложенной Ньюэллом и Саймоном методики анализа протокола (protocol analysis). В этом разделе мы остановимся на проекте OPAL, в котором использована другая методика, отличающаяся от традиционной в двух важных аспектах.
· Эта методика ориентирована на частичную автоматизацию процесса извлечения знаний в ходе активного диалога интервьюируемого эксперта с программой.
· Методика приобретения знаний предполагает использование стратегии, направляемой знаниями о предметной области.
Мы уже рассматривали программу TEIRESIAS, в которой использовалось множество средств поиска ошибок в существующем наборе правил, редактирования и тестирования откорректированного набора правил. Но для построения начального набора правил или отслеживания изменений в них программа TEIRESIAS не использовала какие-либо знания о предметной области. Программа OPAL, напротив, пытается "вытянуть" из пользователя как можно больше деталей, касающихся представления знаний и их использования. OPAL не является программой общего назначения. Она разработана специально для диагностики онкологических заболеваний и предназначена для формирования правил принятия решений на основе полученных от эксперта знаний о планах лечения в том или ином случае.
Программа OPAL упрощает процесс извлечения знаний, предназначенных для использования в экспертной системе ONCOCIN. Последняя формирует план лечения больных онкозаболеваниями и заинтересована в использовании модели предметной области для получения знаний непосредственно от эксперта с помощью средств графического интерфейса. Понятие модель предметной области можно трактовать в терминах знаний различного вида, которыми обладает эксперт.
Независимо от того, о какой конкретной предметной области идет речь, игре в шахматы или медицинской диагностике, всегда существуют некоторые предварительные условия или предварительный опыт, которыми должен обладать субъект или техническая система, чтобы воспринимать знания об этой предметной области. Если речь идет об игре в шахматы, то по крайней мере нужно знать правила этой игры: как ходят фигуры, в чем цель игры и т.п. Применительно к медицинской диагностике нужно иметь представление о пациентах, заболеваниях, клинических тестах и т.п. Этот вид фоновых, или фундаментальных, знаний иногда в литературе по экспертным системам называют глубокими знаниями, противопоставляя их поверхностным знаниям, которые представляют собой хаотичный набор сведений о связях "стимул -- реакция".
При разработке прототипа системы ONCOCIN одной из наиболее сложных оказалась именно проблема приобретения знаний. Ввод информации, необходимой для создания протоколов лечения рака лимфатических узлов, занял около двух лет и отнял у экспертов около 800 часов рабочего времени. Формирование последующих наборов протоколов в процессе развития системы занимало, как правило, несколько месяцев. При этом было отмечено, что эффективность процесса приобретения знаний системой в решающей степени зависит от того, насколько успешно инженер по знаниям справляется с ролью переводчика в процессе передачи знаний от экспертов программе. Желание избавиться от этой зависимости и вдохновило разработчиков на создание программы OPAL, которая помогла бы автоматизировать процесс приобретения знаний.
Используя эту программу, эксперт может сформировать новый протокол в течение нескольких дней. За первый год эксплуатации программы OPAL в систему ONCOCIN было добавлено свыше трех дюжин новых протоколов. Эффективность использованного в этой программе метода заполнения формуляров при вводе новых знаний во многом объясняется тем, что в программу включены базовые знания о той предметной области, в которой она используется. Конечно, включение этих знаний потребовало значительных усилий от инженеров по знаниям, которые ранее занимались общением с экспертами, но эти затраты затем с лихвой окупились. Успешное применение программы OPAL показало преимущество представления знаний о предметной области на нескольких уровнях абстракции по сравнению с подходом, предполагающим переключение основного внимания на детали реализации.
Технология извлечения знаний о предметной области у эксперта посредством опроса через терминал в последнее время стала использоваться во множестве экспертных систем. В большинстве из них эксперту предлагается заполнить экранные формуляры, информация из которых затем считывается в структурированные объекты, аналогичные фреймам. Примерами таких систем могут служить ETS. Но далеко не во всех системах такого рода имеется столь развитый графический интерфейс, как в программе OPAL, и существует возможность компилировать полученные знания непосредственно в правила принятия решений. Реализация этих возможностей в OPAL существенно облегчается особенностями структурирования планов лечения больных, на что обращали внимание и авторы этой разработки.
Опыт, приобретенный в ходе разработки программы OPAL, был затем использован при создании PROTEGE -- системы более общего назначения. Последняя версия этой системы, PROTEGE-II, представляет собой комплект инструментальных средств, облегчающих создание онтологии предметной области и формирование программ приобретения знаний, подобных OPAL, для различных приложений. Вместо того чтобы разрабатывать инструментальные средства общего назначения с нуля, авторы этой разработки пошли по пути повышения уровня абстракции ранее разработанного и успешно используемого приложения, как это было сделано при разработке системы EMYCIN на основе MYCIN.
1.4. Экспертные системы
Практическим полем применения баз знаний являются экспертные системы (ЭС). Экспертная система - это система искусственного интеллекта, включающая знания об определенной слабо структурированной и трудно формализуемой узкой предметной области и способная предлагать и объяснять пользователю разумные решения. Экспертная система состоит из базы знаний, механизма логического вывода и подсистемы объяснений. Её основным компонентом является база знаний. База знаний - это семантическая модель, описывающая предметную область и позволяющая отвечать на такие вопросы из этой предметной области, ответы на которые в явном виде не присутствуют в базе. База знаний является основным компонентом интеллектуальных и экспертных систем.
Для построения базы знаний необходим интеллектуальный редактор базы знаний. Интеллектуальный редактор базы знаний - это программа, предоставляющая инженеру по знаниям возможность создавать базу знаний в интерактивном режиме. Интеллектуальный редактор включает в себя систему шаблонов языка представления знаний, подсказки и другие сервисные средства, облегчающих работу с базой.
Основной режим работы экспертной системы - консультационный режим. Консультационный режим - это интерактивный режим эксплуатации базы знаний, при котором пользователь продвигается к решению задачи.
Вторым существенным компонентом ЭС является машина логического вывода или дедуктивная машина (или блок логического вывода, или решатель). Машина логического вывода - это программа, моделирующая механизм рассуждений и оперирующая знаниями и данными с целью получения новых данных из знаний и других данных, имеющихся в рабочей памяти. Обычно машина логического вывода использует программно реализованный механизм дедуктивного логического вывода или механизм поиска решения в сети фреймов или семантической сети.
Для контакта с пользователем ЭС должна обладать подсистемой общения и подсистемой объяснений. Подсистема общения - это программа:
- входящая в состав экспертной системы;
- служащая для ведения диалога с пользователем, в ходе которого ЭС запрашивает у пользователя необходимые факты для процесса рассуждения;
- предоставляющая возможность пользователю в определенной степени контролировать и корректировать ход рассуждений экспертной системы.
Подсистема объяснений - это программа, позволяющая пользователю получить ответы на вопросы:
- "Как было получено то или иное решение?"; обычно ответ на этот вопрос представляет собой трассировку всего процесса вывода решения с указанием использованных фрагментов базы знаний; и
-"Почему было принято такое решение?"; обычно ответ на этот вопрос есть ссылка на умозаключение, непосредственно предшествовавшее полученному решению.
Хорошо если ЭС обладает подсистемой приобретения знаний. Подсистема приобретения знаний - это программа, предназначенная для корректировки и пополнения базы знаний.
Подсистема приобретения знаний - в простейшем случае - интеллектуальный редактор базы знаний. Подсистема приобретения знаний - в более сложных случаях - средства для извлечения знаний:
- из баз данных;
- из неструктурированного текста;
- из графической информации и т.д.
ЭС создаётся и существует для пользователя. Пользователь - это проблемный специалист, для которого предназначена экспертная система. Считается, что квалификация пользователя недостаточно высока, и поэтому он нуждается в помощи и поддержке своей деятельности со стороны экспертной системы.
ЭС является системой, основанной на знаниях. Система, основанная на знаниях - это система искусственного интеллекта, в которой предметные знания представлены в явном виде и отделены от прочих знаний системы.
1.5. Визуальное проектирование баз знаний как инструмент обучения
Визуальные методы спецификации и проектирования баз знаний и разработка концептуальных структур являются достаточно эффективным гносеологическим инструментом или инструментом познания. Использование ме-тодов инженерии знаний в качестве дидактических инструментов и в качестве формализмов представления знаний способствует более быстрому и более полно-му пониманию структуры знаний данной предметной области, что особенно ценно для новичков на стадии изучения особенностей профессиональной деятельности.
Методы визуальной инженерии знаний можно широко использовать в различ-ных учебных заведениях -- от школ до университетов -- как для углубления про-цесса понимания, так и для контроля знаний. Большинство учеников и студен-тов овладевают навыками визуального структурирования в течение нескольких
От понятийных карт к семантическим сетям
Было предложено определение поля знаний, которое позволяет инженеру по знаниям трактовать форму представления поля достаточно широ-ко, в частности семантические сети или понятийные карты (concept maps) являются возможной формой представления. Это означает, что сам процесс построения семантических сетей помогает осознавать познаватель-ные структуры.
Программы визуализации являются инструментом, позволяющим сделать види-мыми семантические сети памяти человека. Сети состоят из узлов и упорядочен-ных соотношений или связей, соединяющих эти узлы. Узлы выражают понятия или предположения, а связи описывают взаимоотношения между этими узлами. Поэтому разработка семантических сетей подразумевает анализ структурных взаимодействий между отдельными понятиями предметной области.
В процессе создания семантических сетей эксперт и аналитик вынуждены анали-зировать структуры своих собственных знаний, что помогает им включать новые знания в структуры уже имеющихся знаний. Результатом этого является более осмысленное использование приобретенных знаний.
Визуальные спецификации в форме сетей могут использоваться новичками и эк-спертами в качестве инструментов для оценки изменений, произошедших в их мышлении. Если согласиться, что семантическая сеть является достаточно пол-ным представлением памяти человека, то процесс обучения с этой точки зрения можно рассматривать как реорганизацию семантической памяти.
Kozma, один из разработчиков программы организации семанти-ческой сети Learning Tool, считает, что эти средства являются инструментами познания, усиливающими и расширяющими познания человека. Разработка се-мантических сетей требует от учеников:
· реорганизации знаний;
· исчерпывающего описания понятий и связей между ними;
· глубокой обработки знаний, что способствует лучшему запоминанию и извлечению из памяти знаний, а также повышает способности применять знания в новых ситуациях;
· связывания новых понятий с существующими понятиями и представлениями, что улучшает понимание;
· пространственного изучения посредством пространственного представления понятий в изучаемой области.
Полезность семантических сетей и карт понятий, пожалуй, лучше всего демонст-рируется их связями с другими формами мышления высшего порядка. Они тес-но связаны с формальным обоснованием в химии и спо-собностью аргументировать свои высказывания в биологии. Также было показано, что семантические сети имеют связь с выполнением исследований.
База знаний как познавательный инструмент
Когда семантическая сеть создается как прообраз базы знаний, разработчик дол-жен фактически моделировать знания эксперта. Особенно глубокого понимания ' требует разработка функциональной структуры.
Определение структуры ЕСЛИ-ТО области знаний вынуждает четко форму-лировать принципы принятия решения. Нельзя считать, что просто разработка поля знаний системы обязательно приведет к получению полных функциональ-ных знаний в данной области.
Разработка экспертных систем стала использоваться как инструмент познания сравнительно недавно. Lippert, который является одним из пио-неров применения экспертных систем в качестве инструментов познания, ут-верждает, что задания по созданию небольших базисов правил являются очень / полезными для решения педагогических проблем и структурирования знаний для учеников от шестого класса до взрослых. Изучение при этом становится более осмысленным, так как ученики оценивают не только сам процесс мышле-ния, но также и результаты этого процесса, то есть полученную базу знаний. Со-здание базы знаний требует от учеников умения отделять друг от друга факты, переменные и правила, относящиеся к связям между составляющими области знаний.
Например, Lai установил, что после того, как студенты-медики созда-дут медицинскую экспертную систему, они повышают свое умение в плане аргу-ментации и получают более глубокие знания по изучаемому предмету. Шесть студентов-первокурсников физического факультета, которые использовали экс-пертные системы для составления вопросов, принятия решений, формулировки правил и.объяснений относительно движения частицы в соответствии с законами классической физики, получили более глубокие знания в данной области благо-даря тщательной работе, связанной с кодированием информации и обработкой большого материала для получения ясного и связного содержания, а следователь-но, и большей семантической глубины.
Таким образом, создание базы знаний экспертной системы способствует более глубокому усвоению знаний, а визуальная спецификация усиливает прозрач-ность и наглядность представлений.
Когда компьютеры используются в обучении как инструмент познания, а не как контрольно-обучающие системы (обучающие компьютеры), они расширяют воз-можности автоматизированных обучающих систем (АОС), одновременно раз-вивая мыслительные способности и знания учеников. Результатом такого со-трудничества учащегося и компьютера является значительное повышение эф-фективности обучения. Компьютеры не могут и не должны управлять процессом обучения. Скорее, компьютеры должны использоваться для того, чтобы помочь ученикам приобрести знания.
2. Разработка курса «Инженерия знаний»
2.1. Анализ требований к содержанию курса с учётом заявленной цели
Исследуя проблему представления за небольшое количество часов будущим учителям информатики темы «Инженерия знаний», необходимо иметь в виду цель такого изучения. Этот раздел можно считать очень важным именно для будущих учителей информатики по следующим причинам. С одной стороны учитель должен знать, как могут быть структурированы и представлены в формальном виде знания, которые мы традиционно привыкли видеть представленными в виде текстов на естественном языке, или в виде знаний, умений и навыков конкретных людей. С другой стороны особенно важно будет для будущего учителя познакомиться с методами извлечения знаний из эксперта альтернативные педагогическим методам «извлечения знаний из учащегося». Всё это позволит будущему учителю с одной стороны углубить своё понимание в области формирования и приобретения знаний обучаемым, а с другой - даст ему возможность расширить свой педагогический арсенал приёмами выявления и структуризации знаний, применяемыми в инженерии знаний.
Поэтому необходимо разработать курс по выбору по теме «Инженерия знаний» такой, что его изучение позволит обучающимся по специальности «учитель информатики» получить адекватное представление о современном состоянии данного раздела информатики. При этом необходимо избежать излишних технических подробностей.
2.2. Содержание курса
Изучая построение курса, выделим темы, подлежащие изучению.
Во-первых, необходимо рассмотреть основы инженерии знаний. В данном разделе надо раскрыть следующие понятия: данные и знания, базы знаний, основные сферы применения баз знаний - экспертные системы, структура и классификация экспертных систем, этапы разработки экспертных систем, коллектив разработчиков экспертных систем.
Далее необходимо рассмотреть теоретические аспекты извлечения знаний. В данном разделе надо раскрыть следующие понятия: стратегии получения знаний, психологический аспект, лингвистический аспект, гносеологический аспект.
Следующая тема - когнитивная психология в инженерии знаний. В данном разделе надо раскрыть следующие понятия: основы когнитивной психологии, семантическая репрезентация знаний, образная репрезентация, восприятие информации, организация памяти.
Основные темы курса начинаются с темы «методы извлечения знаний». В данном разделе надо раскрыть следующие понятия: классификация методов, пассивные методы, активные индивидуальные методы, активные групповые методы, экспертные игры, текстологические методы.
Далее идёт тема «методология структурирования знаний». В данном разделе надо раскрыть следующие понятия: поле знаний, стадии структурирования, методы структурирования, психосемантика и методы многомерного шкалирования.
Следующая тема - машинно-ориентированные приобретение и формирование знаний. В данном разделе надо раскрыть следующие понятия: автоматическое формирование знаний, системы автоматического формирования знаний.
2.3. Тематическое планирование и рабочая программа курса
Цель и задачи курса
Цель - дать студентам систематическое представление о возможностях современных методов извлечения и представления знаний для ориентирования в современных информационных технологиях, и проведения аналогий с приобретением знаний у учащихся. Задача - дать студентам умения работы со знаниями, их извлечения и структуризации.
Требования к уровню освоения содержания курса
В результате изучения дисциплины студенты должны:
· Иметь представление о современных методах извлечения знаний
· Иметь практические умения работы со знаниями
· Иметь умения извлекать знания из экспертов и текстов
· Уметь организовать процесс извлечения знаний различными способами
·
Учебный план
Тема |
Содержание |
Часов |
|||
Лекций |
Практических |
||||
1 |
основы инженерии знаний |
данные и знания, базы знаний, основные сферы применения баз знаний - экспертные системы, структура и классификация экспертных систем, этапы разработки экспертных систем, коллектив разработчиков экспертных систем |
2 |
2 |
|
2 |
модели представления знаний |
семантические сети, фреймы, логические представления, продукции |
2 |
2 |
|
3 |
теоретические аспекты извлечения знаний |
стратегии получения знаний, психологический аспект, лингвистический аспект, гносеологический аспект |
2 |
2 |
|
4 |
когнитивная психология в инженерии знаний |
основы когнитивной психологии, семантическая репрезентация знаний, образная репрезентация, восприятие информации, организация памяти |
2 |
2 |
|
5 |
методы извлечения знаний |
классификация методов, пассивные методы, активные индивидуальные методы, активные групповые методы, экспертные игры, текстологические методы |
2 |
2 |
|
6 |
методология структурирования знаний |
поле знаний, стадии структурирования, методы структурирования, психосемантика и методы многомерного шкалирования |
2 |
2 |
|
7 |
машинно-ориентированные приобретение и формирование знаний |
автоматическое формирование знаний, системы автоматического формирования знаний |
2 |
2 |
|
14 |
14 |
||||
Всего часов |
28 |
Всего курсом предусматривается 14 часов лекций, 14 часов практических занятий, и 54 часа самостоятельной работы.
2.4. Учебно-методические материалы
В качестве учебных пособий можно рекомендовать следующие книги.
Гаврилова Т. А., Червинская К. Р. Извлечение и структурирование знаний для экспертных систем -- М.: Радио и связь, 1992. -- 200с. Книга посвящена одному из важнейших и недостаточно исследованных аспектов теории и практики искусственного интеллекта -- извлечению и структурированию знаний при разработке экспертных систем. При создании так систем наибольшую трудность вызывает домашинный этап, на котором разработчики выявляют знания специалистов в конкретной предметной области и структурируют их для последующей формализации и ввода в ЭВМ. Как и все исследования по искусственному интеллекту, данная тема носит междисциплинарный характер, и поэтому в книге освещены различные аспекты этой проблемы, (включая вопросы когнитивной психологии, психологии общения, лингвистики, гносеологии и др. Рассмотрены основные этапы разработки экспертных систем с акцентом на практические приемы и методы инженерии знаний, в том числе извлечение знаний из текстов, экспертные игры, техника интервьюирования и анкетирования и т. д. Введена классификация методов извлечения знаний и предложена методология структурного анализа знаний, которая проиллюстрирована на примере трех экспертных систем -- АВТАНТЕСТ, АВ-ТАНКЛИП и МИКРОЛЮШЕР. Дан обзор современного состояния других способов создания баз знаний экспертных систем, включающий анализ систем индуктивного формирования знаний и автоматизированных систем приобретения знаний в прямом диалоге «эксперт-ЭВМ».
Гаврилова Т. А., Хорошевский В. Ф. Базы знаний интеллектуальных систем: Учебник для вузов. СПб: Питер,2001 год, 384 стр. Учебник для технических вузов по входящим в различные дисциплины вопросам разработки интеллектуальных систем. Актуальность предмета определяется стремительно развивающейся сферой применения инженерии знаний и системного анализа в различных областях деятельности. Особенностью изложения является его практическая направленность: освоения имеющегося материала должно быть достаточно для начала самостоятельной работы над созданием интеллектуальной системы, основанной на знаниях. В учебнике учтена все возрастающая роль Интернета и потому подробно рассматривается применение инженерии знаний в Сети.
2.5. Рекомендуемое программное обеспечение для проведения лабораторных работ
Из рассмотренных выше специализированных средств работы со знаниями для проведения практических работ была выбрана система Prot?g?.
Prot?g? - локальная, свободно распространяемая Java-программа, разработанная группой медицинской информатики Стенфордского университета (первая версия - 1987, последняя Prot?g?-3.0 - июнь 2004). Программа предназначена для построения (создания, редактирования и просмотра) онтологий прикладной области. Её первоначальная цель - помочь разработчикам программного обеспечения в создании и поддержке явных моделей предметной области и включение этих моделей непосредственно в программный код. Prot?g? включает редактор онтологий, позволяющий проектировать онтологии разворачивая иерархическую структуру абстрактных или конкретных классов и слотов. Структура онтологии сделана аналогично иерархической структуре каталога. На основе сформированной онтологии, Prot?g? может генерировать формы получения знаний для введения экземпляров классов и подклассов. Инструмент имеет графический интерфейс, удобный для использования неопытными пользователями, снабжен справками и примерами.
Prot?g? основан на фреймовой модели представления знания OKBC и снабжен рядом плагинов, что позволяет его адаптировать для редактирования моделей хранимых в разных форматах (стандартный текстовый, в базе данных JDBC, UML, языков XML, XOL, SHOE, RDF и RDFS, DAML+OIL, OWL).
Prot?g? имеет 3-х уровневую архитектуру, где существует четкое разделение между хранением онтологий, модулями бизнес-логики логики приложений и приложениями интерфейса пользователя. Эти инструменты обладают большими возможностями по наращиванию (например, при помощи плагинов). Большинство инструментов хранит свои онтологии в текстовых файлах, что ограничивает размер онтологий. Только Prot?g? (и WebODE) могут хранить свои онтологии в базах данных и таким образом управлять большими онтологиями. Наконец, большинство инструментов реализовано на Java.
Prot?g? обеспечивает графические средства редактирования и просмотра онтологий, где классы обычно представлены узлами на графах, а отношения - дугами между ними. Дополнительно к этим графическим функциям, Prot?g? предоставляет некоторую поддержку в написании формальных аксиом и сложных выражений.
Описание Prot?g? - 2000
Prot?g?-2000 - это интегрированное инструментальное программное средство, которое используется разработчиками систем и экспертами по предметным областям для разработки систем, основанных на знаниях. Приложения, разработанные при помощи Prot?g?-2000, используются при решении задач и принятии решений в конкретной предметной области.
В то время как в более раннем средстве Prot?g?/Win, как в классической системе баз данных, отдельно определялись классы информации (схема) и хранились экземпляры этих классов, Prot?g?-2000 облегчает работу и с классами, и с экземплярами. Так, отдельный экземпляр может быть использован на уровне описания класса, а класс можно хранить, как экземпляр. Подобным образом, слоты, которые ранее использовались только внутри классов, сейчас поднялись до уровня, на котором находятся классы. Используя эту новую модель знаний, также обеспечивается соответствие протоколу ОКВС (Open Knowledge Base Connectivity) для доступа к базам данных, хранящимся в системах представления знаний. В конечном счете, приложения из этих компонентов также исполняются внутри интегрированной среды Prot?g?-2000.
Средство Prot?g?-2000 получает доступ ко всем этим частям при помощи унифицированного графического интерфейса пользователя, верхний уровень которого включает перекрывающиеся вкладки для компактного представления частей и удобного их совместного редактирования. Такой дизайн верхнего уровня со вкладками позволяет интеграцию (1) моделирования онтологии классов, описывающей определенную дисциплину, (2) создания средства приобретения знаний для сбора информации, (3) ввода отдельных экземпляров данных и создание базы знаний и (4) выполнения приложений. Онтология определяет набор понятий и их отношения. Средство приобретения знаний разрабатывается специально для предметной области, позволяя экспертам по предметной области легко и свободно вводить свои знания в предметной области. Конечная база знаний затем может быть использована вместе с методом поиска решения задач для ответа на вопросы и решения задач в предметной области. В конечном счете, приложение является конечным продуктом, созданным, когда база знаний используется для решения задачи конечного пользователя с использованием подходящих методов поиска решения задач, методов «эксперт-система» или методов поддержки принятия решений.
Подобные документы
Проблема представления знаний в компьютерных системах – одна из основных проблем в области искусственного интеллекта. Исследование различных моделей представления знаний. Определения их понятия. Разработка операции над знаниями в логической модели.
курсовая работа [51,9 K], добавлен 18.02.2011База знаний - структурированная информация из области знаний для использования кибернетическим устройством (человеком). Классификация, структура, формат представления знаний, интеллектуальные системы поиска информации. Базы знаний на примере языка Пролог.
презентация [51,3 K], добавлен 17.10.2013Проблема представления знаний. Представление декларативных знаний как данных, наделенных семантикой. Представление процедурных знаний как отношений между элементами модели, в том числе в виде процедур и функций. Представление правил обработки фактов.
курсовая работа [33,1 K], добавлен 21.07.2012Представление знаний в когнитологии, информатике и искусственном интеллекте. Связи и структуры, язык и нотация. Формальные и неформальные модели представления знаний: в виде правил, с использованием фреймов, семантических сетей и нечетких высказываний.
контрольная работа [29,9 K], добавлен 18.05.2009Анализ процессов диагностики повреждений трубопровода. Разработка модели продукционной базы знаний: обзор методов представления знаний, описание создания базы знаний и разработки механизма логического вывода. Экономическое обоснование концепции проекта.
дипломная работа [3,0 M], добавлен 16.04.2017Понятие искусственного интеллекта в робототехнике и мехатронике. Структура и функции интеллектуальной системы управления. Классификация и типы знаний, представление их с помощью логики предикатов. Суть семантических сетей, фреймовое представление знаний.
курс лекций [1,1 M], добавлен 14.01.2011Изучение фреймового способа представления знаний, его специфики и основных характеристик. Обзор других методов представления знаний, их плюсы и минусы. Иерархическая структура данных фрейма. Механизм управления выводом с помощью присоединенной процедуры.
реферат [2,6 M], добавлен 22.12.2014Сущность данных и информации. Особенности представления знаний внутри ИС. Изучение моделей представления знаний: продукционная, логическая, сетевая, формальные грамматики, фреймовые модели, комбинаторные, ленемы. Нейронные сети, генетические алгоритмы.
реферат [203,3 K], добавлен 19.06.2010Особенности разработки системы автоматизированного контроля знаний специалистов по дефектоскопии. Обзор автоматизированных систем обучения и контроля знаний. Психологические механизмы усвоения знаний. Принципы создания эффективной тестирующей программы.
дипломная работа [1,8 M], добавлен 30.08.2010Классы и группы моделей представления знаний. Состав продукционной системы. Классификация моделей представления знаний. Программные средства для реализации семантических сетей. Участок сети причинно-следственных связей. Достоинства продукционной модели.
презентация [380,4 K], добавлен 14.08.2013