Интеграция информационных ресурсов объектных хранилищ данных посредством рабочих процессов

Изучение общих понятий теории систем и системного анализа. Методика построения объектных репозиториев открытых информационных систем. Принципы восприятия визуальной информации. Средства визуального моделирования рабочих процессов по интеграции данных.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык русский
Дата добавления 04.06.2015
Размер файла 195,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Оглавление

Введение

1. Теория систем и методы анализа систем

1.1 Общие понятия теории систем и системного анализа

1.2 Сущность и принципы системного подхода

1.3 Формирование объектных депозитариев существующих информационных систем

2. Характеристика предметной области

2.1 Интеграция информационных ресурсов объектных хранилищ данных посредством рабочих процессов

2.2 Средства визуального моделирования рабочих процессов по интеграции данных

3. Визуальная модель и ее описание

Заключение

Список литературы

Введение

В наш век, когда происходит бурное развитие научных и исследовательских работ по различным направлениям, одной из важнейших задач становится интеграция накопленных знаний и данных. При этом любой ученый или исследователь должен иметь возможность не только обратиться к изолированной информационной системе для получения узкоспециализированной информации по интересующему его предмету, но получать агрегированные по многим источникам данные, которые помогли бы ему получить представление о конкретных объектах в целом. Все возрастающая потребность в получении «обобщенного» взгляда на информационные ресурсы различных систем привела к формированию механизмов интеграции данных, которые ориентируются на эффективную организацию доступа к внешним, гетерогенным источникам данных посредством единого интерфейса в рамках единой модели данных. При этом сам метод агрегирования информации должен быть настолько прозрачным для конечного пользователя, чтобы в его глазах процесс получения информации ничем не отличался от обращений к единому хранилищу данных. Процесс интеграции информации включает в себя этапы формирования и рассылки запросов внешним системам, преобразования запросов, их результатов между представлениями частных и канонической моделей и схем, сбора результатов и их объединения в соответствие с каноническими моделью и схемами данных, организации локального хранения данных о внешних системах и других рабочих ресурсах, кэширования промежуточных результатов, управление потоком запросов и агрегирования ответов и т.п.

1. Теория систем и методы анализа систем

1.1 Общие понятия теории систем и системного анализа

Термины теория систем и системный анализ или, более кратко -- системный подход, несмотря на период более 25 лет их использования, все еще не нашли общепринятого, стандартного истолкования.

Причина этого факта заключается, скорее всего, в динамичности процессов в области человеческой деятельности и, кроме того, в принципиальной возможности использовать системный подход практически в любой решаемой человеком задаче.

Даже в определении самого понятия система можно обнаружить достаточно много вариантов, часть из которых базируется на глубоко философских подходах, а другая использует обыденные обстоятельства, побуждающие нас к решению практических задач системного плана.

Выберем золотую середину и будем далее понимать термин система как совокупность (множество) отдельных объектов с неизбежными связями между ними. Если мы обнаруживаем хотя бы два таких объекта: учитель и ученик в процессе обучения, продавец и покупатель в торговле, телевизор и передающая станция в телевидении и т. д. -- то это уже система. Короче, с некоторой претензией на высокопарность, можно считать системы способом существования окружающего нас мира.

Более важно понять преимущество взгляда на этот мир с позиций системного подхода: возможность ставить и решать, по крайней мере, две задачи: расширить и углубить собственные представления о «механизме» взаимодействий объектов в системе; изучить и, возможно, открыть новые её свойства; повысить эффективность системы в том плане ее функционирования, который интересует нас больше всего.

Хотя хронология науки относит момент зарождения теории систем и системного анализа (далее ТССА) к средине текущего столетия, тем не менее, можно понять, что возраст ТССА составляет ровно столько, сколько существует Homo Sapiens.

Другое дело, что по мере развитие науки, прежде всего -- кибернетики, эта отрасль прикладной науки сформировалась в самостоятельный раздел. Ветви ТССА прослеживаются во всех «ведомственных кибернетиках»: биологической, медицинской, технической и, конечно же, экономической. В каждом случае объекты, составляющие систему, могут быть самого широкого диапазона -- от живых существ в биологии до механизмов, компьютеров или каналов связи в технике. Но, несмотря на это, задачи и принципы системного подхода остаются неизменными, не зависящими от природы объектов в системе. Для лиц вашей будущей профессии наибольший интерес представляют, естественно, экономические системы, а глобальной задачей системного подхода -- совершенствование процесса управления экономикой. Поэтому для нас с вами предметом системного анализа будут являться вопросы сбора, хранения и обработки информации об экономических объектах и, возможно, технологических процессах.

Используя классическое определение кибернетики как науки об общих законах получения, хранения, передачи и преобразования информации (кибернетика в дословном переводе -- искусство управлять), можно считать ТССА фундаментальным разделом экономической кибернетики.

1.2 Сущность и принципы системного подхода

ТССА, как отрасль науки, может быть разделена на две, достаточно условные части:

· теоретическую: использующую такие отрасли как теория вероятностей, теория информации, теория игр, теория графов, теория расписаний, теория решений, топология, факторный анализ и др.;

· прикладную, основанную на прикладной математической статистике, методах исследовании операций, системотехнике и т. п. Таким образом, ТССА широко использует достижения многих отраслей науки и этот «захват» непрерывно расширяется.

Вместе с тем, в теории систем имеется свое «ядро», свой особый метод -- системный подход к возникающим задачам. Сущность этого метода достаточно проста: все элементы системы и все операции в ней должны рассматриваться только как одно целое, только в совокупности, только во взаимосвязи друг с другом.

Плачевный опыт попыток решения системных вопросов с игнорированием этого принципа, попыток использования "местечкового" подхода достаточно хорошо изучен. Локальные решения, учет недостаточного числа факторов, локальная оптимизация -- на уровне отдельных элементов почти всегда приводили к неэффективному в целом, а иногда и опасному по последствиям, результату.

· Итак, первый принцип ТССА -- это требование рассматривать совокупность элементов системы как одно целое или, более жестко, -- запрет на рассмотрение системы как простого объединения элементов.

· Второй принцип заключается в признании того, что свойства системы не просто сумма свойств ее элементов. Тем самым постулируется возможность того, что система обладает особыми свойствами, которых может и не быть у отдельных элементов.

· Весьма важным атрибутом системы является ее эффективность. Теоретически доказано, что всегда существует функция ценности системы -- в виде зависимости ее эффективности (почти всегда это экономический показатель) от условий построения и функционирования. Кроме того, эта функция ограничена, а значит можно и нужно искать ее максимум. Максимум эффективности системы может считаться третьим ее основным принципом.

· Четвертый принцип запрещает рассматривать данную систему в отрыве от окружающей ее среды -- как автономную, обособленную. Это означает обязательность учета внешних связей или, в более общем виде, требование рассматривать анализируемую систему как часть (подсистему) некоторой более общей системы.

· Согласившись с необходимостью учета внешней среды, признавая логичность рассмотрения данной системы как части некоторой, большей ее, мы приходим к пятому принципу ТССА -- возможности (а иногда и необходимости) деления данной системы на части, подсистемы. Если последние оказываются недостаточно просты для анализа, с ними поступают точно также. Но в процессе такого деления нельзя нарушать предыдущие принципы -- пока они соблюдены, деление оправдано, разрешено в том смысле, что гарантирует применимость практических методов, приемов, алгоритмов решения задач системного анализа.

Все изложенное выше позволяет формализовать определение термина система в виде -- многоуровневая конструкция из взаимодействующих элементов, объединяемых в подсистемы нескольких уровней для достижения единой цели функционирования (целевой функции).

1.3 Формирование объектных депозитариев существующих информационных систем

Понятие «интеграция распределенных данных» подразумевает, как правило, интеграцию информационных ресурсов, которые расположены в уже существующих распределенных депозитариях. В настоящее время большая часть информационных хранилищ представлена реляционными базами данных. Поэтому первая задача, возникающая на пути решения проблемы семантически обоснованной интеграции информационных ресурсов - это представление данных, описанных реляционной моделью, семантически более богатым способом. Таким образом, необходимо наличие механизмов, позволяющих выделить из реляционной модели данных объектную модель и реализовать адаптер для работы с данными существующего хранилища информационных ресурсов через объектные интерфейсы доступа (такие как, например, ODMGAPI или ODMG OQL). Была использована методика, которая опиралась на реинжениринг реляционных схем данных существующих реляционных хранилищ данных, создание соответствующих объектных схем данных и возможности программного комплекса, базирующегося на Java-технологиях, которые позволяют сформировать «объектную» надстройку над имеющимся реляционным хранилищем информационных ресурсов для того, чтобы работать с его данными посредством технологий SemanticWeb в рамках канонической RDFS-модели данных. Реализованные в рамках работы средства включают:

· Автоматизированную пользовательскую среду подготовки унифицированного, ориентированного на поддержку семантической интероперабельности, описания схем данных (RDFS), предоставляемых хранилищами внешних систем, включающую:

· Реинженеринг (восстановление) исходной реляционной схемы БД учетом специфики провайдеров РСУБД.

· Преобразование реляционной схемы данных в объектную схему данных. Преобразование объектной схемы данных в RDFS схему данных.

· Формирование репозитория хранимых RDFS-объектов над реляционной БД внешней системы, включающее:

· Формирование объектной и RDF прослоек над реляционной БД, параметризованных RDFS-схемой данных репозитория. Соответствующее обеспечение объектно-реляционного и RDF-объектного отображений данных, параметризованных декларативными описаниями соответствующих отображений и схем данных.

· Поддержку диалекта объектного языка запросов ODMG OQL, обеспечивающую трансляцию OQL запросов в SQL запросы с учетом специфики провайдеров РСУБД.

· Представление данных хранилищ внешних систем, выбираемых «открытыми запросами», в унифицированной W3C RDF/XML форме, обеспечивающей возможность осуществления семантической интероперабельности данных.

· Предоставление удаленного обращения с «открытыми запросами» к репозиторию хранимых объектов на основе Web-сервисов, поддерживающих взаимодействие по протоколу SOAP.

Основные этапы формирования объектного репозитория открытой системы схематически представлены на рис. 1:

Рисунок 1. Методика построения объектных репозиториев открытых систем

Для выделения объектной схемы реляционных баз данных внешних систем в рамках разработанной методики необходимо выполнить следующую последовательность действий:

1) Формирование ER-схемы для БД целевой системы. На первом этапе необходимо получить схему существующей реляционной базы данных для того, чтобы впоследствии преобразовать ее к объектной схеме, внеся дополнительные семантические наполнение и структуризацию. Выделение ER-схемы существующей БД целевой системы можно выполнить следующими программными средствами:

· MS Visio 2000/2002/2003(позволяет построить системную ER-схему БД в ER-нотации );

· IBM RROSE 2000/2002/2003 (позволяет с помощью модуля Data Modeller сформировать системную ER-схему целевой БД).

2) Формирование UML-диаграммы классов по ER-схеме целевой системы. Второй этап в построении объектного репозитория над реляционной базой данных, это преобразование полученной ER-схемы данных к первому приближению RDFS-модели информационных ресурсов SemanticWeb. В качестве этого первого приближению удобно использовать UML-диаграмму классов. Формирование UML-диаграмм классов по ER-схемам можно выполнить следующими программными средствами:

· MS Visio 2000/2002/2003 (не умеет преобразовывать ER-схемы в UML-диаграммы классов, ввиду чего требуемое преобразование необходимо выполнить «руками», имея в редакторе две этих схемы);

· Poseidon for UML (не умеет преобразовывать ER-схемы в UML-диаграммы классов, ввиду чего требуемое преобразование необходимо выполнить «руками», имея в редакторе две этих схемы);

· IBM RROSE 2000/2002/2003 (представляет ER-схему в UML-нотации по собственной методике).

3) Запись UML-диаграммы классов в OMG XMI формате. На следующем этапе нам необходимо представить полученную UML-диаграмму классов в некоторой промежуточной, схемо-независимой форме для последующего преобразования к модели данных RDFS. В качестве такого промежуточного представления в данной методике выбран OMGXMI формат представления объектных схем. Запись UML-диаграмм классов в OMG XMI форме, необходимой для получения первого варианта RDFS-схемы, можно выполнить следующими программными средствами:

· MS Visio 2002/2003 (имеется addon, выгружающий UML-диаграммы классов в OMG XMI формате);

· Poseidon for UML CE (в рамках архивов zargo сохраняет UML-диаграммы в OMG XMI формате);

· IBM RROSE 2002/2003 (имеется plugin, записывающий UML-диаграммы классов OMG XMI формате).

4) Преобразование UML-диаграмм классов в OMG XMI форме в RDFS-схему. На данном этапе подготовлены все необходимые входные артефакты для построения первого варианта RDFS-схемы, описывающей схему данных объектной надстройки над реляционной базой данных.

Преобразование UML-диаграмм классов в OMG XMI форме в первый вариант RDFS схемы и последующее ее преобразование выполняется с помощью редактора онтологий Protйgй-2000, обеспечивающего поддержку RDF и RDF Schema.

5) Формирование прикладной RDFS-схемы. После выделения первого приближения RDFS-модели данных объектного репозитория необходимо выполнить доработку полученного первого варианта схемы до семантически более корректной формы. На данном этапе предполагается:

· Доработка RDFS-схемы данных: выделение введение дополнительной иерархии классов и их свойств;

· Введение системных классов технологической платформы, необходимых адаптеру объектного репозитория;

6) Формирование RDFS схемы, согласованной с совокупностью канонических RDFS подсхем. На данном этапе имеется выделенная RDFS-схема объектной надстройки над реляционным хранилищем данных. Для возможности интеграции информационных ресурсов репозиториев различных внешних систем, описанных подобными схемами, необходимо выделить из них канонические (общие) подсхемы, в рамках которых будут формироваться объектные запросы на доступ к информационным ресурсам и осуществляться интеграция полученных от различных внешних систем ответов. В свете этого на данном этапе пространство имен прикладной RDFS-схемы разбивается на следующие три:

· Пространство имен common - каноническая RDFS-подсхема общих классов, свойств, в соответствии с которыми могут формироваться объектные запросы;

· Пространство имен external - каноническая RDFS-подсхема общих прикладных классов, свойств, в соответствии с которыми пользователю могут возвращаться данные прикладной системы;

· Пространство имен external_own - RDFS-подсхема общих прикладных классов, свойств, которые поддерживаются репозиторием, но недоступны объектным запросам.

7) Реализация адаптера объектного репозитория - поддержка прикладных RDFS-схем, согласованных с совокупностью канонических RDFS-схем. На данном этапе сформированное полноценное описание объектной схемы данных репозитория используется как входной параметр для реализованного адаптера объектного репозитория, который позволяет:

· Осуществить объектно-реляционное отображение полученной объектной схемы данных на реляционную схему существующей реляционной БД; Выполнять объектные OQL-запросы к репозиторию, согласованные с канонической RDFS-схемы общих классов;

· Представлять результаты OQL-запросов к репозиторию в унифицированном RDF/XML формате;

· Предоставить Web-сервис для выполнения OQL-запросов к сформированному объектному репозиторию и получения RDF/XML ответов.

Таким образом, разработанный метод построения объектных репозиториев над имеющимися информационными хранилищами данных в довольно большой степени решает первую часть проблемы интеграции данных, обусловленную необходимостью повышения уровня семантического представления данных распределенных информационных систем.

2. Характеристика предметной области

2.1 Интеграция информационных ресурсов объектных хранилищ данных посредством рабочих процессов

Для управления интеграцией данных, поступающих из распределенных объектных репозиториев, методика формирования которых описана выше, были разработаны средства поддержки композиций Web-сервисов репозиториев внешних систем, которые базируются на стандарте BPEL4WS (Business Process Execution Language For Web-Services), разработанном совместно компаниями IBM и Microsoft. Данный стандарт был выбран в результате анализа и сравнения существующих подходов к описанию автоматизированных потоков работ ввиду того, что он обладает достоинствами обоих подходов (графового и блочного) и предоставляет гибкие средства для описания взаимодействий Web-сервисов[5]. Кроме того, он рекомендован к применению совместно с другими последними стандартами в области рабочих процессов, такими как WS-Transaction(протоколы координации транзакций Web-сервисов), WS-Security[ (безопасный протокол передачи данных в рамках процесса, гарантирующий их целостность) и т.д. Таким образом, Workflow-процесс, описанный на языке BPEL4WS, позволяет реализовать всю логику обработки пользовательских запросов, управления взаимодействием с распределенными репозиториями, интеграции поступающих данных и формирования агрегированного ответа пользователю.

В рамках описываемых работ для координации потока информации, поступающей из репозиториев внешних информационных систем, была разработана среда интерпретатора рабочих процессов, описанных с помощью языка BPEL4WS. Данное решение основано на Java-технологиях [15 -17] и реализует следующий набор функций: 1) Поддержка реестра рабочих процессов, описанных на языке BPEL и средств для:

· Регистрации в реестре новых описаний рабочих процессов;

· Обновления и удаления имеющейся информации;

· Получения информации о списке зарегистрированных в реестре процессов;

2) Внешнее представление рабочих процессов посредством отдельных WEB-сервисов с предопределенным интерфейсом для возможности конструирования композиций рабочих процессов;

3) Синхронное и асинхронное взаимодействие с участниками процесса;

4) Поддержка основных управляющих конструкций языка BPEL:

· элементарные операции;

· условные и циклические конструкции;

· динамический вызов операций внешних WEB-сервисов;

· обработчики системных событий и исключений;

· последовательное и параллельное исполнение заданий процесса;

· трансформация оперативных данных процесса от одного формата к другому; 5) Управление множественными экземплярами процессов и маршрутизация между ними поступающих в систему внешних сообщений.

Сценарий применения координирующих рабочих процессов для сбора и агрегирования полученной информации в ответ на пользовательский запрос разбивается на следующую последовательность действий:

1) Обработка пользовательского внешнего запроса на получение агрегированной информации из нескольких репозиториев внешних систем;

2) Трансформация этого запроса к форматам объектных OQL-запросов, воспринимаемых этими репозиториями и последовательный (или параллельный с последующей синхронизацией) опрос этих репозиториев с обработкой исключительных ситуаций (в частности, временных ограничений) и динамическим изменением списка опрашиваемых систем в случае возникновения ошибок; 3) Возможная предварительная трансформация и обработка поступивших из репозиториев внешних систем данных;

4) Агрегирование результатов опроса различных репозиториев. Данное агрегирование базируется на том факте, что возвращаемая репозиториями информация соответствует набору канонических RDFS-схем данных, что позволяет выполнить семантическое объединение распределенной информации об одном и том же ресурсе, уникально идентифицируемом значениями некоторого набора атрибутов канонической модели. Например, если информация о ФИО персоны попадает в каноническую RDFS-схему данных, описывающую ресурс «персона», то при семантически правильном построении репозиториев внешних систем, информация о персоне, поступающая из них, помимо специализированных данных будет в обязательном порядке содержать поля канонической схемы данных (ФИО). Если выбрать этот атрибут канонической модели как идентифицирующий данный ресурс, то может быть выявлена принадлежность информации из различных внешних систем одной и той же информационной сущности с последующим ее агрегированием.

Описанный механизм интеграции данных посредством координирующих рабочих процессов является одним из возможных применений технологии «открытых запросов» для интеграции распределенной информации.

На рис. 2 схематически представлен процесс взаимодействия компонентов подсистемы исполнения «открытых запросов»:

Рисунок 2. Процесс взаимодействия компонентов подсистемы исполнения «открытых запросов»

Таким образом, выбор и реализация гибких декларативных средств по описанию и исполнению динамических сценариев взаимодействия участников процесса, базирующихся на BPEL4WS описаниях рабочих процессов для сбора и агрегирования информации, дает широкие возможности для дальнейшего развития алгоритмов семантически обоснованной интеграции распределенных данных.

2.2 Средства визуального моделирования рабочих процессов по интеграции данных

Для эффективного построения, внедрения и модификации BPEL4WS описаний координирующих потоков работ необходимо наличие среды разработки, предоставляющей средства визуального конструирования спецификаций рабочих процессов. Был проведен сравнительный анализ существующих подходов к построению средств визуального моделирования графовых и блочных описаний потоков работ. В результате анализа были выделены следующие два широко использующиеся подхода к решению данной задачи:

1) Иерархическое редактирование описаний рабочих процессов. Данный подход позволяет построить унифицированное средство моделирования рабочих процессов, так как XML-описание потоков работ всегда можно представить иерархической визуальной моделью, иерархия уровней которой отражает иерархию уровней элементов XML-описания. Между тем реализованные по данной методике визуальные средства не обладают достаточной наглядностью и ориентированы скорее на искушенных разработчиков, чем на достаточно широкий круг пользователей;

2) Двумерный графический редактор описаний рабочих процессов. Визуальные средства, основанные на этом подходе, обладают достаточной наглядностью и функционалом. Они позволяют формировать новые сценарии взаимодействия участников интеграции распределенных данных, как профессиональным разработчикам, так и менее искушенным в плане знания синтаксиса блочной структуры описания рабочих процессов аналитикам и экспертам.

Для разработки описаний автоматизированных потоков работ были реализованы визуальные средства редактирования древовидной структуры описания рабочего процесса на языке BPEL4WS, предоставляющие оба указанных способа редактирования потоков работ, которые позволяют:

· загружать/выгружать описания автоматизированных потоков работ;

· представлять описание процесса в виде иерархической и двумерной структуры его элементов;

· выполнять редактирование структуры описания, атрибутов его отдельных узлов;

· осуществлять расширенные синтаксические и семантические проверки описаний рабочих процессов, позволяющие выявить статические ошибки до начала их функционирования;

· представлять рабочие процессы на разных уровнях выразительности, для разных ролевых участий формирования процессов, например, архитектор и разработчик.

С архитектурной точки зрения редактор описаний рабочих процессов поддерживает модульную структуру. К основным архитектурным блокам относятся:

· Модуль загрузки/выгрузки BPEL-документов;

· Модуль синтаксической и структурной верификации BPEL-описаний;

· Модуль редактирования атрибутов элементов BPEL-описания (набор XML-декларируемых форм);

· Модуль управления правами доступа к элементом описания и пользовательскими ролями (с расширенной поддержкой XML-декларации пользовательских ролей);

· Модуль управления локализацией пользовательских интерфейсов.

Для определения различных типов визуального представления BPEL-описаний и соответствующих средств редактирования его структуры редактор поддерживает понятие визуальных plugin-ов, каждый из которых может: Определять окно визуального редактора;

· Добавлять дополнительную палитру элементов и контекстное меню;

· Представлять свой локализационный ресурс;

· Назначать свою политику доступа к элементам описания для пользовательских ролей;

· Пользоваться услугами остальных модулей через стандартные интерфейсы.

Редактор поддерживает XML-регистрацию новых подключаемых plugin-ов визуальных редакторов и их автоматическое встраивание в пользовательский интерфейс. В данной версии визуального редактора BPEL-описаний потоков работ два реализовано два визуальных plugin-а:

· Иерархический (древовидный) редактор;

· Двумерный редактор описаний рабочих процессов.

В планах дальнейших работ по развитию средств визуального моделирования рабочих процессов среди наиболее важных задач стоит интеграция визуальных средств редактирования с интерпретатором описаний рабочих процессов для поддержки визуальной отладки и тестирования BPEL4WS процессов.

3. Визуальная модель и ее описание

Использование визуализации в качестве способа анализа данных обусловливает необходимость в качественных критериях, благодаря которым можно определять наиболее эффективные визуальные приемы, соответствующие специфике поставленной задачи и особенностям данных. Отсутствие полноценной классификации категорий данных, которая позволила бы быстро и с высокой степенью однозначности делать выбор необходимых инструментов визуализации, является обстоятельством, препятствующим превращению визуальных моделей данных в результативный исследовательский метод.

Одной из задач визуализации информации, в общем случае, является выполнение коммуникативной функции между произвольными данными и когнитивными усилиями исследователей. Эффективность этого процесса может быть обеспечена только при учете и понимании особенностей зрительного восприятия человека. С учетом этого визуализация позволяет решать две задачи: с одной стороны, выбирать способ визуального представления исходной информации, адекватный ее особенностям, с другой стороны, определять метафору визуализации, позволяющую производить эффективный анализ и поиск ответов на поставленные вопросы, используя преимущества визуального восприятия.

Построение метафоры представления происходит с учетом наличия в задаче двух основных форм данных: информации, описывающей объекты, и информации, характеризующей существующие в рамках задачи связи. Одновременная визуализация обеих форм данных накладывает на визуальную модель требование непротиворечивости визуальных образов, соответствующих информационным компонентам, относящимся к объектам, отношениям и их атрибутам. Предварительный анализ совокупности исходных данных с точки зрения бесконфликтности сопоставляемых им визуальных образов становится необходимым предварительным этапом при построении визуальной модели. Следует отметить, что активное применение визуализации к задачам, оперирующим сложными, в том числе комплексными и разнотипными источниками данных, делает необходимым наличие внутренних для визуальной модели регулирующих механизмов, которые позволяют уточнять или изменять метафору представления любого источника данных при появлении визуальных составляющих, затрудняющих интерпретацию информационной основы модели.

Изменение визуальной метафоры является приемом, существенно снижающим интерпретируемость модели, а точнее, приемом, который требует дополнительного времени для уточнения восприятия исследователя в соответствии с измененным представлением информации. Скорость и эффективность интерпретации являются преимуществами визуализации, поэтому использование изменяющегося представления целесообразно лишь после оценки возможных затрат времени и когнитивных усилий.

В традиционном понимании информационная основа визуальной модели определяется источниками данных, которые определяют состояние объектов, составляющих модель. К данным этого типа относятся числовые переменные заданной размерности, а также параметры и атрибуты объектов, которые могут быть охарактеризованы с использованием какой-либо из шкал измерения. Организация одностороннего информационного обмена происходит при помощи импорта числовых данных и выполнения алгоритмов, ответственных за использование импортированных значений для изменения состояния визуальной модели.

Визуальные модели данных используют свойства восприятия как естественного инструмента, обеспечивающего очень быстрый анализ информации, полученной при помощи зрения. Так как восприятие не ограничивается только количественной интерпретацией свойств наблюдаемого объекта, предполагается, что на уровне визуальной модели может быть организовано объединение процессов анализа информации, имеющей как числовую, так и иную природу. Управление свойствами представления, в том числе независимыми визуальными метафорами отдельных информационных каналов, должно обеспечивать согласованную параллельность их интерпретации наблюдателем. Зрительная сопоставимость и одновременный анализ разнородной информации, относящейся к объекту визуализации, позволяют достигать понимания сути изучаемого явления с меньшей затратой усилий.

Включение в визуальную модель данных произвольного типа, структуры и сложности приводит к появлению соответствующих информационных потоков, важнейшим регулятором которых является эффективность использования полученного образа при решении поставленной задачи. На этапе определения приемлемых способов подключения к визуальной модели каждого конкретного источника данных и создания соответствующей визуальной метафоры формулируются ответы на большинство вопросов, связанных с восприятием визуальной информации. В случае, когда представление отдельной информационной составляющей в рамках уже существующей модели данных признается труднореализуемым, происходит либо изменение визуальной метафоры, либо в модель вводятся новые данные после этапа предварительной обработки, который может быть вынесен за пределы визуальной модели.

Все аспекты использования информации - с точки зрения получения визуальных моделей однозначной или прогнозируемой интерпретируемости - представляют собой комплекс вопросов, основу которого составляет проблема произвольного толкования визуальных образов. Понимание многих образов считается естественным и обоснованным с точки зрения многовековой эволюции восприятия и должно опираться на индивидуальный опыт или знания, являющиеся отражением социально-культурного окружения. Известны эксперименты, которые могут считаться аргументированным подтверждением этого подхода. Однако не менее обоснованной является интерпретация восприятия визуальных образов как произвольного соглашения в рамках лишь определенного социального круга. Подтверждением последнего суждения можно считать существование многочисленных примеров абсолютно несовпадающих трактовок одних и тех же символов или образов.

Неоднозначность соответствия между исходными данными и сопоставляемыми им визуальными образами существует как в прямом, так и в обратном направлении и, в общем случае, может считаться фактором, уменьшающим эффективность использования визуализации, так как требует дополнительных усилий при интерпретации. Однако это же обстоятельство становится очень результативным для задач, в которых целью визуализации является не только представление информации в форме, облегчающей и ускоряющей ее понимание, но и поиск неизвестных решений, получение новых знаний. В этом случае использование множественности визуальных метафор, перебор существующих или создание новых, позволяет обнаруживать решения, не только опираясь на существующие алгоритмы, но и используя когнитивный потенциал исследователя. Обеспечение такой функции визуальных моделей возможно при наличии управляющего воздействия со стороны наблюдателя, стремящегося согласовать особенности своего понимания и степень информированности об изучаемой системе с ее визуальной моделью. Тогда визуальная модель получает информацию о характеристиках самого исследователя. Создается дополнительный информационный канал, который участвует в формировании визуальной модели.

Модель системы восприятия

Возможность рассматривать наблюдателя как элемент визуальной модели является следствием предложенной в модели системы восприятия человека, включающей три стадии (рис.). Согласно ей, восприятие зрительной информации на первом этапе происходит в виде многочисленных параллельных процессов захвата особенностей потока визуальных данных. Отличительными признаками этого этапа являются высокая скорость поступления данных, выделение простейших атрибутов - цвет, положение в пространстве, ориентация, структура поверхности и т.д. На следующем этапе происходит обработка полученной информации, поиск и выделение структур и областей, обладающих близкими значениями параметров. Обнаружение изменяющихся параметров и пространственных перемещений также происходит на этом этапе. Последний этап в системе восприятия, описываемой таким образом, ответственен за выделение визуальных объектов, соответствующих вопросам, поставленным задачей визуализации или просто актуальных для наблюдателя.

На третьем этапе рассмотренной системы восприятия происходит подключение исследователя и его предпочтений к образу данных, реализованному в модели данных посредством метафоры визуализации. Если интерес наблюдателя к свойствам исходных данных, существующим для него как часть визуального образа, формирует акцентированное внимание к определенной составляющей модели, то наличие в свойствах модели возможности управлять ее характеристиками инициирует процедуру обратной коррекции. Этот процесс может происходить до тех пор, пока исследователь не сочтет поиск ответа законченным, либо последовательное преобразование визуального образа не приведет к оправданному изменению всей метафоры представления.

Визуальный образ, предназначенный прежде всего для понимания сути его информационной основы, должен строиться с учетом принципов гештальт-психологии. Восприятие является сложным процессом, и существование системы правил, которые считаются объяснением основных закономерностей зрительной идентификации, позволяет минимизировать усилия по созданию метафоры представления.

Наиболее очевидными из этих принципов являются следующие.

Близость. Утверждается, что объекты, расположенные рядом друг с другом, воспринимаются как группа или как самостоятельный объект. На этапе быстрого выделения особенностей визуального образа этот принцип играет существенную роль.

Простота. В ситуации, когда объектом визуального анализа становится совокупность элементов, приносящая в интерпретацию изучаемого образа существенную неоднозначность, восприятие стремится ограничить диапазон возможных объяснений наиболее простыми из них. Опираясь на это утверждение, можно использовать визуальные модели данных в качестве оперативного инструмента для решения некоторых задач оптимизации.

Непрерывность и целостность. Согласно этому правилу, в нашем восприятии происходят неосознаваемые, т.е. не требующие дополнительных усилий, процессы интерполяции и экстраполяции зрительных образов, направленные на достижение восприятия образа как единой формы. Использование этого обстоятельства имеет широкое применение при определении допустимых форм метафоры визуализации.

Схожесть. В этом случае происходит мысленное объединение в общую группу всех элементов, которые имеют сходные видимые признаки. Действие этого принципа отчетливо проявляется при наблюдении за динамикой визуальных моделей, содержащих значительное количество одинаковых элементов. В таких задачах наблюдение за отдельным элементом группы вызывает ожидание подобной динамики изменений и от остальных ее элементов, хотя она существует лишь как мысленное объединение.

Смежность. Объекты и события, находящиеся близко друг от друга в пространстве и времени, формируют восприятие, убеждающее нас в их взаимном влиянии. Значимость этого принципа при построении эффективной визуальной модели очень велика. Множество задач, использующих визуализацию как метод решения, ставят своей целью именно обнаружение неизвестных ранее связей и процессов влияния. Кроме того, сами связи, указатели отношений и маркеры событий являются полноценными визуальными компонентами. Управление восприятием при помощи обдуманного расположения или перемещения частей визуальной модели, опирающееся на принцип смежности, может считаться действенным когнитивным инструментом.

Осведомленность. Это принцип имеет значение для создания условий высокой продуктивности процессов, относящихся к третьему этапу в системе восприятия, описанной выше. Согласно ему, объединение элементов визуальной модели в группу или структуру может происходить автоматически в том случае, если возникающий образ группы воспринимается наблюдателем как осмысленный или знакомый. Следуя этой идее, формирование метафоры представления должно происходить в расчете и на личностный опыт исследователя, свойственные ему ожидания и предвосхищение. Таким образом, появление наблюдателя в визуальной модели данных в качестве самостоятельного и значимого элемента становится оправданным и необходимым шагом, так как обеспечивает функционирование одной из ступеней системы восприятия. Более того, возникает аргументированная постановка подзадачи для построения визуальной модели, заключающаяся в определении механизмов настройки и корректировки свойств модели с учетом особенностей конкретного исследователя при условии, что модель предназначена для взаимодействия многих людей. Применение этих принципов в качестве системы ограничивающих правил позволяет прежде всего увеличить эффективность использования визуализации, снизить ее ресурсоемкость и тем самым обеспечить конкурентные преимущества. Необходимость осмысленной регламентации для принципиально возможных вариаций использования произвольной исходной информации в качестве основы для создания системы визуальных образов продиктована следующими факторами:

· время, затрачиваемое на интерпретацию образов, является наиболее доступным ресурсом повышения эффективности;

· коллективное использование визуальных моделей может быть обеспечено только при условии понимания и правильного применения принципов, управляющих восприятием;

· взаимное влияние визуальной модели и исследователя при недостаточной контролируемости процесса решения задачи визуализации способно сделать поиск ответов трудоемким или неоправданно продолжительным.

В настоящее время, не существует обоснованной системы правил, позволяющей эффективно и с высокой степенью предопределенности сопоставлять различным типам данных те способы создания визуальных образов, которые максимально полно отражают их суть и представляют собой инструмент анализа с заранее известной результативностью. Создание подобной обобщающей классификации позволило бы говорить о визуализации как о полновесном и необходимом научном направлении .

Типология данных, которые являются исходными в визуализации, широка и дополняема. Фундаментальное разделение на класс объектов и класс связей применительно к визуальным моделям также существует, хотя использование метафоры представления, в общем случае, позволяет не воспринимать его как строгое. Атрибуты как объектов, так и связей, являющиеся параметрами, описываемыми посредством других типов данных, также могут выступать в качестве самостоятельных элементов визуальной модели . Кроме того, операции, которые определены для исходных объектов или для визуальных образов, построенных на основе данных, описывающих состояние системы, в некоторых случаях также могут быть визуализиованы как компоненты визуальной модели. Среди подобных операций проще всего осуществить представление математических операций с пространственными объектами, группирование нескольких объектов в новый, инверсию состояния, уничтожение объектов или отношений между ними, переход в качественно иное состояние, создание или разрушение структуры. Важным аспектом, возникающим при постановке или в ходе решения многочисленных задач, оперирующих как с числовыми, так и с некоторыми другими типами данных, является наличие состояния неопределенности и, соответственно, необходимости его включения в визуальный образ. Считается, что реализация неопределенности как наблюдаемого образа сопряжена со сложностью его адекватного восприятия, потому что зафиксированный зрительный объект воспринимается сознанием наблюдателя как вполне определенный. Однако современные графические программные решения и средства трехмерного динамического моделирования уже вполне готовы предлагать способы создания визуальных моделей, которые могут передать состояние неопределенности в степени, соответствующей специфике поставленной задачи. Наиболее удачными приемами зрительного представления подобных моделей можно считать метафоры, основывающиеся на применении разнообразных алгоритмов управления визуальными системами частиц. Восприятие динамически изменчивого образа облака частиц во многом соответствует естественному представлению наблюдателя о неустойчивом состоянии или неопределенном пространственном положении.

В качестве источников данных для визуальных моделей могут использоваться информационные потоки, относящиеся не только к символьным или числовым типам, в том числе и высоких размерностей. На этапе решения задач, в ходе определения наиболее уместной метафоры представления или при взаимодействии с визуальной моделью, часто возникают условия для конструирования типов данных, определяемых как метаданные или данные об уже существующих данных. Подобные переменные содержат в себе информацию, характеризующую происходящие трансформации исходных данных или визуальных образов, построенных на их основе, описание имеющихся взаимосвязей, а также результаты их влияния на поведение изучаемой системы. Кроме того, метаданные могут создаваться как способ хранения и использования информации, описывающей процесс и результаты взаимодействия исследователя и визуальной модели.

Полезным преимуществом метаданных является возможность их использования в качестве предполагаемых объектов. В рамках созданной визуальной модели данных могут быть определены гипотетические структуры, дополняющие, корректирующие или объясняющие поведение визуальных компонентов модели данных. Помимо этого, могут быть описаны операции, возможные между метаобъектами, и их взаимодействие с другими структурами. Разумеется, визуализация этих возможностей, поиск представления, которое может передать наблюдателю смысл и особенности информации метапеременных, является более трудоемкой задачей. Разработка визуальных метафор, способных посредством зрительных образов сообщать не просто значения отдельных параметров, описывающих функционирование системы, но и формировать восприятие незнакомых исследователю объектов, передавая особенности информации при помощи визуальных выразительных средств, может рассматриваться как отдельное и очень важное направление визуализации.

Исследование и понимание принципов восприятия визуальной информации является ключевым обстоятельством, определяющим эффективность визуализации как инструмента решения научных, исследовательских и технических задач. Не менее важной целью является построение классификации задач визуализации с точки зрения используемых ими типов источников информации. Это позволит определить пути повышения эффективности визуальных методов решения за счет уменьшения времени, необходимого на определение метафоры представления, а также за счет создания инструментов, управляющих когнитивными характеристиками визуальных моделей данных.

информационный визуальный моделирование интеграция

Заключение

Наша жизнь настолько насыщена различной информацией, что хранить ее без помощи средств вычислительной техники уже практически невозможно. Работа с большими объемами информации без помощи компьютера уже оказывается неприемлемой как с точки зрения затрат на ее хранение, так и с точки зрения управления информацией и скорости доступа к ней.

Таким образом, совершенно очевидна столь острая необходимость в упорядочивании данных, создании БД. Динамика, склонность к изменчивости информации вынуждает нас искать новые методы и средства, позволяющие управлять этой динамикой, а не сугубо под неё подстраиваться. Таким образом, рассмотренная нами система, которая как раз и позволяет управлять данными, несомненно найдет себе применение не только в торговом бизнесе, но и в других отраслях народного хозяйства.

Список литературы

1. Ware C. Information, Visualization. Third Edition. Perception for Design (Interactive Technologies). 2012.

2. Steele J., Iliinsky N. Beautiful visualization: Looking at data through the eyes of experts. O'Reilly Media, 2010.

3. Захарова А.А., Шкляр А.В. Построение многокомпонентных визуальных 3D-моделей с использованием разнородных источников информации, на примере создания геологических моделей // Известия Томского политехнического университета. 2012. Т. 320. № 5. C. 73-79.

4. Сапков В.В. Информационные технологии и компьютеризация делопроизводства. - М.: Academia, 2010.

5. Чистов Д.В. Информационные системы в экономике. - М.: Инфра-М, 2010.

Размещено на Allbest.ru


Подобные документы

  • Формы представляемой информации. Основные типы используемой модели данных. Уровни информационных процессов. Поиск информации и поиск данных. Сетевое хранилище данных. Проблемы разработки и сопровождения хранилищ данных. Технологии обработки данных.

    лекция [15,5 K], добавлен 19.08.2013

  • Общая характеристика экспертных программ как систем искусственного интеллекта. Описание реализации в реляционной системе управления базами данных. Рассмотрение особенностей интеграции объектных таблиц принятия решения в проект по распознаванию символов.

    дипломная работа [662,5 K], добавлен 20.07.2015

  • Создание функциональной структуры фирмы. Методологии проектирования информационных систем. Состав стандарта IDEF. Средства структурного системного анализа. Метод функционального моделирования SADT. Стратегии декомпозиции. Диаграмма потоков данных DFD.

    презентация [324,1 K], добавлен 27.12.2013

  • Методология структурного анализа и проектирования информационных систем. Базовый стандарт процессов жизненного цикла программного обеспечения. Цели и принципы формирования профилей информационных систем. Разработка идеальной модели бизнес-процессов.

    презентация [152,1 K], добавлен 07.12.2013

  • Концепции хранилищ данных для анализа и их составляющие: интеграции и согласования данных из различных источников, разделения наборов данных для систем обработки транзакций и поддержки принятия решений. Архитектура баз для хранилищ и витрины данных.

    реферат [1,3 M], добавлен 25.03.2013

  • Общее понятие и признаки классификации информационных систем. Типы архитектур построения информационных систем. Основные компоненты и свойства базы данных. Основные отличия файловых систем и систем баз данных. Архитектура клиент-сервер и ее пользователи.

    презентация [203,1 K], добавлен 22.01.2016

  • Понятие, модели и назначение информационных систем. Функциональное моделирование ИС. Диаграмма потоков данных. Декомпозиция процессов и миниспецификации. Реализация макета системы средствами MS SQL Server 2005. Создание базы данных. Скалярные функции.

    курсовая работа [1,0 M], добавлен 16.09.2012

  • Определения теории баз данных (БД). Элементы приложения информационных систем. Реляционные модели данных. Задача систем управления распределенными базами данных. Средства параллельной обработки запросов. Использование БД при проведении инвентаризации.

    курсовая работа [518,9 K], добавлен 01.05.2015

  • Понимание хранилища данных, его ключевые особенности. Основные типы хранилищ данных. Главные неудобства размерного подхода. Обработка информации, аналитическая обработка и добыча данных. Интерактивная аналитическая обработка данных в реальном времени.

    реферат [849,7 K], добавлен 16.12.2016

  • Причины возникновения объектных СУБД. Основные принципы осуществления концепции объективно-ориентированного подхода, история и этапы ее развития. Наиболее значительные недостатки реляционной модели данных и реляционных баз данных. Перспективы их развития.

    курсовая работа [60,5 K], добавлен 02.03.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.