Представление знаний в информационных системах
Определение понятия знания, модели его представления – фреймовая, продукционная, семантическая. Разбор аналитической платформы Deductor. Описание демо-примера программы Deductor– прогнозирование с помощью линейной регрессии, использование визуализатора.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 07.06.2011 |
Размер файла | 1,1 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
МИНОБРНАУКИ РОССИИ
ГОУ ВПО Тверской государственный технический университет
Кафедра ИС
КУРСОВАЯ РАБОТА
по теме
«Представление знаний в информационных системах»
Тверь, 2011
СОДЕРЖАНИЕ
Введение
1. Аналитическая часть
1.1 Данные и знания
1.2 Модели представления знаний
1.3 Аналитическая платформа Deductor
2. Проектная часть
Заключение
Список использованной литературы
ВВЕДЕНИЕ
Цель курсовой работы состоит в изучении и рассмотрении основных вопросов дисциплины «Представление знаний в ИС».
Для достижения цели курсовой работы необходимо выделить и разрешить следующие задачи:
· дать определения понятиям знания и данные;
· рассмотреть модели представления знаний;
· разобрать аналитическую платформу Deductor;
· Описать один из демо-примеров программы Deductor (в данном случае - прогнозирование с помощью линейной регрессии).
1. Аналитическая часть
1.1 Знания и данные
Данные - это информация, полученная в результате наблюдений или измерений отдельных свойств (атрибутов), характеризующих объекты, процессы и явления предметной области. Под предметной областью понимается множество объектов, значений их характеристик и связывающих их отношений.
При обработке на компьютере данные трансформируются, условно проходя следующие этапы:
- данные как результат измерений и наблюдений;
- данные на материальных носителях информации (таблицы,
протоколы, справочники);
- модели (структуры) данных в виде диаграмм, графиков, функций;
- данные в компьютере на языке описания данных;
- базы данных (БД) на машинных носителях информации.
Знания основаны на данных, полученных эмпирическим путем. Они представляют собой результат опыта и мыслительной деятельности человека, направленной на обобщение этого опыта, полученного в результате практической деятельности.
Знания - это связи и закономерности предметной области (принципы, модели, законы), полученные в результате практической деятельности и профессионального опыта, позволяющего специалистам ставить и решать задачи в данной области.
При обработке на компьютере знания трансформируются аналогично данным:
- знания в памяти человека как результат анализа опыта и мышления;
- материальные носители знаний (литература, учебники);
- поле знаний - условное описание основных объектов предметной области, их атрибутов и закономерностей, их связывающих;
- знания, описанные на языках представления знаний;
- база знаний (БЗ) на машинных носителях информации.
Ключевым этапом при работе со знаниями является формирование поля знаний Рz. Эта задача включает выявление и определение объектов и понятий предметной области, их свойств и связей между ними, представление их в наглядной и интуитивно понятной форме. Без тщательной проработки Рz не может быть создана БЗ. Рz представляет собой модель знаний о предметной области в том виде, в каком ее сумел выразить эксперт на некотором языке L, который должен обладать следующими свойствами:
- максимальная точность: идеал - математический язык; минимальная точность - естественный язык;
- однозначность терминов;
- L, либо символьный язык, либо графический.
Простейший прагматический подход к формированию Рz включает:
- определение входных и выходных данных;
- составление словаря терминов и набора ключевых слов;
- выявление объектов и понятий, т.е. формирование полного
систематического набора терминов из области знаний;
- выявление связей между понятиями;
- выявление метапонятий и детализация понятий на более низком уровне;
- построение пирамиды знаний - иерархической лестницы понятий,
подъем по которой означает углубление понимания и
повышение уровня обобщенности понятий;
- определение отношений между понятиями как внутри каждого из уровней пирамиды, так и между уровнями;
- определение стратегий принятия решений, т.е. выявление цепочек рассуждений, связывающих все сформированные ранее понятия и отношения;
- структурирование Рz.
1.2 Модели представления знаний
Центральным вопросом построения систем основанных на знаниях является выбор формы представления знаний.
Представление знаний - это способ формального выражения знаний о предметной области в компьютерно-интерпретируемой форме.
Соответствующие формализмы, обеспечивающие указами о представлении называют моделями представления знаний.
Распространенные модели представления знаний:
1. Продукционная модель;
2. Фреймовая модель;
3. Семантическая сеть;
4. Формально-логическая модель.
Продукционная модель представления знаний
Продукционная модель или модель, основанная на правилах, позволяет представит знания в виде предложения типа «ЕСЛИ (условие), ТО (действие).Часть правила «ЕСЛИ» называется посылкой (антецедентом) и состоит из элементарных предложений соединенных логическими связками И, ИЛИ, а «ТО» - выводом или действием (консеквентом), который включает одно ил несколько предложений, которые выражают либо некоторый факт, либо указание на определенное действие, подлежащее использованию.
В общем виде правило записывается так:
«ЕСЛИ А1 и А2 и ….Аn, ТО В».Это означает, что если все условия от А1 до Аn являются истинными, то В также истинно.
Системы обработки знаний, использующие представление знаний продукционными правилами, получили название продукционных систем. В состав продукционных систем входит база правил, база данных и интерпретатор правил. База правил - это область памяти, которая содержит БЗ; БД - это область памяти, содержащая фактические данные. БД могут быть описаны как группа данных, содержащих имя данных, атрибуты и значения атрибутов(триплет: объект, атрибут, знание).
Размещено на http://www.allbest.ru/
Фреймовая модель представления знаний
Фреймовая модель представления знаний предложена американским ученым Морвином Минским в 70- е годы ХХ века как универсальная модель, применимая в любой предметной области.
Фрейм- это абстрактный образ для представления стереотипа объекта, понятия или ситуации. Под абстрактным образом понимается некоторая обобщенная и упрощенная модель или структура. Например, произнесение вслух слова «комната» порождает у слушающих образ комнаты, т.е. жилого помещения. Фрейм может быть определен как форма описания знаний, которая очерчивает рамки рассматриваемого мира и использует для этого описания продукционные системы или предикаты.
Фрейм имеет имя, служащее для идентификации описываемого им понятия, и содержит ряд описаний - слотов, помощью которых определяются структурные основные элементы этого понятия. За слотами следуют шпации, в которые помещают данные, представляющие текущие значения слотов. Слот может содержать не только конкретное значение, но также имя процедуры, позволяющей вычислить это значение по данному алгоритму.
РУКОВОДИТЕЛЬ:
Имя слота Значение слота Тип значения
Ф.И.О. Иванов Н.Н. Строка символов
Рожден 01.01.1960 Дата
Возраст age(дата, рождение) Процедура
Специальность Юрист Строка символов
Отдел Юридический Строка символов
Зарплата 25 000 Число
Адрес ДОМ_АДРЕС Фрейм
Семантическая сеть
Семантическая сеть - это ориентированный граф, вершины которого - понятия, а дуги - отношения между ними. Семантика - это наука, устанавливающая отношения между символами и объектами, которые они обозначают. Т.е. наука, определяющая смысл знаков.
Предложено несколько классификаций семантических сетей, связанных с типами отношений между понятиями:
1. По количеству типов отношений:
- однородные ( с единственным типом отношений)
- неоднородные ( с различными типами отношений)
2. По типам отношений:
- бинарные, в которых отношения связывают два объекта;
- N- арные, в которых есть специальные отношения, связывающие более двух понятий.
Наиболее часто в семантических сетях используются следующие отношения:
- элемент класса ( роза- это цветок);
- атрибутивные связи / иметь свойство (память имеет свойство - емкость);
- значение свойства (цвет имеет значение - красный);
- пример элемента класса (роза, например, чайная);
- связи типа «часть- целое» (автомобиль имеет руль);
- функциональные связи («производит», «влияет»);
- количественные (больше, меньше);
- пространственные (далеко, близко, над, под);
- временные (раньше, позже);
- логические (и, или, не).
Формульно-логическая модель представления знаний
Формально-логическая модель представления знаний использует в качестве базовой теории исчисление предикатов первого порядка. Это формальный язык, используемый для представления отношений между объектами и для выявления новых отношений между объектами на основе существующих. Логика предикатов в соответствии со сложностью синтаксических правил языка предикатов имеет иерархическую организацию, которую образуют предикаты первого порядка, второго порядка, …, n-го порядка, однако на практике логика используется на уровне простейших предикатов первого порядка.
Исчисления предикатов перового порядка основывается на исчислении высказываний. Высказыванием называется предложение, смысл которого можно выразить значениями: истина (Т) или ложь (F). Например: «Иван студент». Элементарное (простое) высказывание нельзя разделить на части. Из простых высказываний могут формироваться сложные с помощью слов: и, или, не, если, то.
Логика высказываний оперирует логическими связями между высказываниями, то есть она решает вопросы типа: «Можно ли на основе высказывания А получить высказывание В?»; «Истинно ли В при истинности А?» при этом семантика высказываний не имеет значения. Элементарные высказывания рассматриваются как переменные логического типа, над которыми разрешены следующие логические операции:
(~) - отрицание;
- конъюнкция (логическое «или»);
- дизъюнкция (логическое «и»);
- импликация («если, то»);
- эквивалентность.
Аналитическая платформа Deductor
Deductor является аналитической платформой - основой для создания законченных прикладных решений в области анализа данных. Реализованные в Deductor технологии позволяют на базе единой архитектуры пройти все этапы построения аналитической системы от создания хранилища данных до автоматического подбора моделей и визуализации полученных результатов.
Deductor состоит из пяти частей:
Deductor Warehouse - многомерное хранилище данных, аккумулирующее всю необходимую для анализа предметной области информацию. Использование единого хранилища позволяет обеспечить непротиворечивость данных и централизованное хранение, а также автоматически обеспечивает всю необходимую поддержку процесса анализа данных. Deductor Warehouse оптимизирован для решения именно аналитических задач, что положительно сказывается на скорости доступа к данным. В ряде случаев имеет смысл отказаться от традиционного хранилища данных и воспользоваться альтернативой - виртуальным хранилищем Virtual Warehouse.
Deductor Studio - программа, реализующая функции импорта, обработки, визуализации и экспорта данных. Deductor Studio может функционировать и без хранилища данных, получая информацию из любых других источников, но наиболее оптимальным является их совместное использование. В Deductor Studio включен полный набор механизмов, позволяющий получить информацию из произвольного источника данных, провести весь цикл обработки (очистку, трансформацию данных, построение моделей), отобразить полученные результаты наиболее удобным образом (OLAP, таблицы, диаграммы, деревья и т.д.) и экспортировать их в наиболее распространенные форматы.
Deductor Viewer - программа, ориентированная на конечного пользователя и предназначенная для просмотра подготовленных при помощи Deductor Studio отчетов. Deductor Viewer позволяет минимизировать требования к пользователю системы, т.к. все требуемые операции выполняются автоматически при помощи подготовленных ранее сценариев обработки. Пользователю Deduсtor Viewer нужно только выбрать и настроить вариант отображения полученных результатов.
Deductor Server - служба, обеспечивающая удаленную аналитическую обработку данных. Она позволяет автоматически обрабатывать данные и переобучать модели на сервере, оптимизирует выполнение сценариев за счет кэширования проектов и использования многопоточной обработки.
Deductor Client - клиент доступа к Deductor Server. Он обеспечивает доступ к серверу из сторонних приложений и управление его работой.
Реализованная в Deductor архитектура позволяет добиться максимальной гибкости при создании законченного решения. Благодаря данной архитектуре можно собрать в одном аналитическом приложении все необходимые инструменты анализа и реализовать автоматическое выполнение подготовленного сценария.
Технологическая платформа включает средства, позволяющие максимально сократить сроки разработки, быстро создавать и выводить на рынок новые прикладные решения, а также адаптировать их в соответствии с изменяющимися требованиями предприятий.
Создание законченного решения занимает очень мало времени: достаточно получить данные, определить сценарий обработки и задать место для экспорта полученных результатов. Наличие мощного набора механизмов обработки и визуализации позволяет двигаться по шагам, от наиболее простых способов анализа ко все более мощным. Первые результаты пользователь получает практически сразу, но при этом можно легко наращивать мощность решения.
Применение системы.
Система Deductor предназначена для решения широкого спектра задач, связанных с обработкой структурированных и представленных в виде таблиц данных. При этом область приложения системы может быть практически любой - механизмы, реализованные в системе, с успехом применяются на финансовых рынках, в страховании, торговле, телекоммуникациях, промышленности, медицине, в логистических и маркетинговых задачах и множестве других.
Большинство задач анализа можно разделить на классы, внутри которых они решаются схожим образом. Этих классов немного, но для каждого необходимо использовать свои механизмы. Законченное решение может быть составлено из блоков, собранных из унифицированных компонентов для решения прикладной задачи. Именно возможность комбинировать различные механизмы анализа при создании прикладных решений позволяет говорить, что Deductor является аналитической платформой.
2. Практическая часть
Прогнозирование с помощью линейной регрессии.
Линейная регрессия необходима тогда, когда предполагается, что зависимость между входными факторами и результатом линейная. В основном ее применяют для прогнозирования временного ряда. Достоинством ее можно назвать быстроту обработки входных данных.
Исходные данные
Покажем нахождение линейных зависимостей на примере нахождения зависимости между двумя аргументами и их суммой.
Данные для решения задачи находятся в файле «Sum.txt». Он содержит таблицу с полями: «АРГУМЕНТ1», «АРГУМЕНТ2» - слагаемые, «СУММА» - их сумма.
Импортируем данные в Deductor Studio и просмотрим их в виде таблицы.
Прогнозирование суммы
Для линейного регрессионного анализа необходимо запустить мастер обработки и выбрать в качестве обработки данных линейную регрессию. На втором шаге мастера настроим поля исходных данных. Очевидно, что факторами будут являться аргументы, а результатом - сумма. Поэтому необходимо указать назначение поля «СУММА» как выходное, а назначение остальных полей - как входные.
На следующем шаге необходимо настроить способ разделения исходного множества данных на тестовое и обучающее, а также количество примеров в том и другом множестве. Укажем, что данные из обоих множеств берутся случайным образом, а остальные параметры оставим без изменения.
Следующий шаг мастера позволяет выполнить обработку, нажав на кнопку «Пуск». Во время обучения отображаются текущая величина ошибки и процент распознанных примеров.
После построения модели, можно, воспользовавшись визуализатором «Диаграмма рассеяния» для просмотра качества построенной модели.
На диаграмме рассеяния, что данную зависимость линейная регрессия распознала с большой точностью.
Выводы
Данный пример показал целесообразность применения линейного регрессионного анализа для прогнозирования линейных зависимостей. Простота настроек и быстрота построения модели иногда бывают необходимы. Аналитику достаточно указать входные столбцы - факторы, выходные - результат, указать способ разбиения данных ни тестовое и обучающее множество и запустить процесс обучения. Причем после этого будут доступны все механизмы визуализации и анализа данных, позволяющие построить прогноз, провести эксперимент по принципу «Что-если», исследовать зависимость результата от значений входных факторов, оценить качество построенной модели по диаграмме рассеяния. Также по результатам работы этого алгоритма можно подтвердить или опровергнуть гипотезу о наличии линейной зависимости.
Заключение
В ходе выполнения работы была достигнута цель курсовой работы - изучены и рассмотрены основные вопросы дисциплины «Представление знаний в ИС».
Для достижения цели курсовой работы были выделены и разрешены следующие задачи:
· дать определения понятиям знания и данные;
· рассмотреть модели представления знаний;
· разобрать аналитическую платформу Deductor;
· Описать один из демо-примеров программы Deductor (в данном случае - прогнозирование с помощью линейной регрессии).
знание фреймовый прогнозирование регрессия визуализатор
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ
1. Семенов Н.А. Представление знаний в информационных системах. (Конспект лекций). Тверь, 2010.
2. Аналитическая платформа Deductor. Описание демонстрационного примера./ BaseGroup Labs/2005.
Размещено на Allbest.ru
Подобные документы
Описание платформы Deductor, ее назначение. Организационная структура аналитической платформы Deductor, состав модулей. Принципы работы программы, импорт и экспорт данных. Визуализация информации, сценарная последовательность и мастер обработки.
курсовая работа [3,7 M], добавлен 19.04.2014Потребность отражения человеческих знаний в памяти компьютера. Модели представления знаний. Продукционные и формально-логические модели. Исчисление предикатов первого порядка. Основные свойства теории фреймов. Аналитическая платформа Deductor.
курсовая работа [538,2 K], добавлен 09.04.2015Короткі теоретичні відомості про Deductor – аналітичну платформу, призначену для створення логічно завершених прикладних рішень в області аналізу даних. Основи роботи з аналітичною платформою Deductor виробництва російської компанії BaseGroup Labs.
лабораторная работа [1,4 M], добавлен 14.10.2014Основные этапы и механизм процесса создания, ведения и модификации баз знаний в экспертных системах. Понятие предметного (фактуального) и проблемного (операционного) знания. Модели предоставления знаний: сетевая, фреймовая, логическая, продукционная.
презентация [243,0 K], добавлен 16.10.2013Понятие и сущность экспертной системы, ее внутренняя структура и назначение, этапы и принципы разработки. Продукционная и фреймовая модель представления знаний, порядок построения семантической сети. Разработка алгоритма программы, создание интерфейса.
курсовая работа [1,2 M], добавлен 22.01.2015Сущность данных и информации. Особенности представления знаний внутри ИС. Изучение моделей представления знаний: продукционная, логическая, сетевая, формальные грамматики, фреймовые модели, комбинаторные, ленемы. Нейронные сети, генетические алгоритмы.
реферат [203,3 K], добавлен 19.06.2010Преимущества и недостатки моделей представления знаний. Модель, основанная на правилах, фреймовая модель. Семантическая сеть. Структура экспертных систем и этапы их разработки. Механизмы логического вывода. Стратегия "вверх-снизу", "от цели к ситуации").
презентация [195,3 K], добавлен 29.10.2013Представление знаний в когнитологии, информатике и искусственном интеллекте. Связи и структуры, язык и нотация. Формальные и неформальные модели представления знаний: в виде правил, с использованием фреймов, семантических сетей и нечетких высказываний.
контрольная работа [29,9 K], добавлен 18.05.2009Проблема представления знаний в компьютерных системах – одна из основных проблем в области искусственного интеллекта. Исследование различных моделей представления знаний. Определения их понятия. Разработка операции над знаниями в логической модели.
курсовая работа [51,9 K], добавлен 18.02.2011Обоснование использования виртуальной модели, средства для разработки функциональных модулей. Разработка виртуальной модели "Представление знаний в информационных системах". Разработка алгоритмов построения виртуальной модели предметной области.
дипломная работа [1,4 M], добавлен 12.08.2017