Корпоративная информационная система
Проектирование архитектуры корпоративной информационной системы (КИС), учитывающей применение методов извлечения смыслового и структурного содержания электронного документа. Понятие и сущность электронного документа. Оценка эффективности архитектуры КИС.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 11.07.2016 |
Размер файла | 3,9 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
ОГЛАВЛЕНИЕ
электронный документ информационная система
Список условных обозначений и сокращений
Введение
Глава 1. Управление электронными документами в корпоративной информационной системе
1.1 Корпоративная информационная система
1.1.1 Понятие КИС
1.1.2 Архитектура КИС
1.2 Электронный документооборот
1.2.1 Понятие и сущность электронного документа
1.2.2 Недостатки традиционного подхода к ЭД
1.2.3 Структура электронного документа
1.2.4 Жизненный цикл электронного документа
1.2.5 Стандарты по управлению ЭД
1.2.6 Понятие электронного документооборота
1.3 Семантические технологии в КИС
1.3.1 Обзор технологий классического подхода для проектирования архитектуры КИС
1.3.2 Обзор технологий семантического подхода для проектирования архитектуры КИС
1.3.3 Применение классических и семантических технологий в КИС
Глава 2. Моделирование бизнес-процессов по управлению электронными документами
2.1 Бизнес-процесс «Ввод документа в ИС»
2.2 Бизнес-процесс «Регистрация документа в ИС»
2.3 Процесс «Выполнение заявки на выдачу документа из архива»
2.4 Процесс «Выполнение запроса на удаление документа из ИС»
2.5 Процесс «Выполнение запроса на редактирование документа»
2.6 Бизнес-процесс «Формирование, согласование, утверждение»
Глава 3. Проектирование архитектуры КИС
3.1 Разработка методики оценки эффективности архитектуры КИС
3.3.1 Методы оценки архитектуры КИС
3.3.2 Методика оценки архитектуры КИС
3.2 Формирование требований к разрабатываемой архитектуре
3.3 Проектирование архитектуры КИС
3.3.1 Проектирование концептуального уровня архитектуры КИС
3.3.2 Проектирование логического уровня архитектуры КИС
3.3.3 Проектирование физического уровня архитектуры КИС
Заключение
Библиографический список
Приложение A. Реквизиты оформления организационно-распорядительных документов по ГОСТ Р 6.30-2003
Приложение B. Элементы схем БП в нотации ARIS eEPC
Приложение C. Бизнес-процесс «Ввод документов в ИС (сканирование)»
Приложение D. Бизнес-процесс «Регистрация документа в ИС»
Приложение E. Бизнес-процесс «Выполнение заявки на предоставление документа из электронного архива»
Приложение F. Бизнес-процесс «Выполнение запроса на удаление документа из ИС»
Приложение G. Бизнес-процесс «Выполнение запроса на редактирование документа в архиве»
Приложение H. Схема бизнес-процесса «Формирование, согласование, утверждение документа»
Приложение I. Схема архитектуры КИС
Список условных обозначений и сокращений
- ИТ - информационные технологии;
- ИС - информационная система;
- КИС - корпоративная информационная система;
- ЭД - электронный документ;
- ЭДО - электронный документооборот;
- СЭД - система электронного документооборота;
- БП - бизнес-процесс;
- СОА - сервис-ориентированная архитектура.
ВВЕДЕНИЕ
Ежедневно каждая организация в процессе своей деятельности создает и обрабатывает десятки, сотни и тысячи документов. Естественно, что по мере роста предприятия неизбежен этап, когда процесс документооборота перестает быть эффективным. Для решения этой проблемы в управление предприятием вводятся определённые способы управления бизнес-процессами, которые связаны с потоком документов в организации. С учетом того, что современной экономике свойственен быстрый рост доли информационных технологий, а также интеллектуализации технологий бизнеса, все в большей степени повышается роль информации и знаний, находящихся в организации. В связи с этим компании стремятся эффективно управлять и распоряжаться имеющимися у них знаниями.
Предметные области управления знаниями и семантические технологии в настоящее время сильно развиваются и идея всеобщей структуризации информации становится все более возможной. А поскольку большинство неструктурированной информации содержится в электронных документах, электронный документооборот требует особого внимания. Именно поэтому, объектом исследования являются процессы электронного документооборота, протекающие в корпоративной информационной системе, а предметом исследования является применение методов семантического подхода к анализу электронных документов в архитектуре КИС.
Целью данной работы является проектирование архитектуры корпоративной информационной системы, учитывающей применение методов извлечения смыслового и структурного содержания электронного документа.
Осуществление перечисленных особенностей возможно за счет применения в архитектуре КИС методов извлечения из электронных документов метаданных и знаний, которые впоследствии могут быть применены на разных этапах прохождения жизненного цикла управления ЭД на предприятии. Таким образом, для достижения поставленной цели необходимо решить следующие задачи:
- анализ литературы, сбор, систематизация и обобщение материалов, обзор архитектуры КИС, электронного документооборота, семантических технологий, применяемых в КИС;
- моделирование бизнес-процессов, связанных с управлением электронными документами, их анализ;
- разработка методики оценки эффективности проектируемой архитектуры КИС.
- сбор и формирование требований к разрабатываемой архитектуре КИС;
- проектирование архитектуры КИС, ориентированной на работу с неструктурированными электронными документами.
Проведенный в ходе данной выпускной квалификационной работы анализ предметной области, формулировка требований и определение технологий семантического анализа, применимых к архитектуре КИС позволят спроектировать архитектуру КИС с ориентацией работы на семантические возможности системы в плане оптимизации процессов работы с ЭД.
Глава 1. УПРАВЛЕНИЕ ЭЛЕКТРОННЫМИ ДОКУМЕНТАМИ В КОРПОРАТИВНОЙ ИНФОРМАЦИОННОЙ СИСТЕМЕ
В настоящее время сфера применения электронного документооборота неуклонно расширяется и в любых организация большого и среднего масштаба каждый день выполняется множество операций с электронными документами. Эффективный и прозрачный документооборот во многом определяется его организацией и налаженностью в корпоративной информационной системе.
В данной главе представлен взгляд на организацию с точки зрения информационной системы масштаба предприятия, выявлена структура электронного документа, а также рассмотрен процесс документооборота в компании и место, которое он занимает в рамках всей корпоративной информационной системы предприятия.
1.1 Корпоративная информационная система
В настоящее время, с точки зрения системной концепции все компании, независимо от области их деятельности, достаточно сильно похожи друг на друга. В структуру каждой из них входят многочисленные подразделения, непосредственно выполняющие тот или иной вид детальности. Подразделения организации пронизаны, как вертикальными, так и горизонтальными связями, выполняют свои бизнес-процессы в рамках единого бизнес-процесса компании и обмениваются различными потоками данных, как материальными, так и информационными. Таким образом, любая компания - это совокупность элементов, взаимодействующих между собой, и выполняющих тот или иной вид деятельности, в рамках стратегии компании. Учитывая, что последние десятилетия развитие компании протекает в ракурсе применения информационных технологий в автоматизации деятельности компаний, нельзя упускать из виду важность использования информационных технологий в оптимизации и совершенствовании деятельности компании.
Проектирование и построение комплексных систем автоматизации предприятия в XXI веке переросло в отдельно взятую область развития информационных технологий. Проектирование информационных систем на уровне всего предприятия достаточно трудоемкий и масштабный процесс. Но поскольку большинство организаций по структуре похожи между собой, общий взгляд на организацию позволил сформировать общие принципы построения корпоративных информационных систем.
1.1.1. Понятие КИС
Информация в современном мире превратилась в один из наиболее важных ресурсов, а информационные системы (ИС) стали необходимым инструментом во всех сферах деятельности. Разнообразие задач, решаемых с помощью ИС, привело к появлению множества разнотипных систем, отличающихся принципами построения и заложенными в них правилами обработки информации [1]. На предприятиях используется достаточно большое количество классов систем: ERP (Enterprise Resource Planning - система планирования ресурсов предприятия), ECM (Enterprise Content Management - системы управления корпоративным информационным контентом), BPM (Business Process Management) - системы управления бизнес-процессами предприятия) и пр. Под этими системами понимаются такие системы, в которых функционально объединены, как системы для решения задач автоматизации, учета и управления производством, финансовыми, человеческими и информационными ресурсами.
Корпоративная информационная система - это инфраструктура предприятия, задействованная в процессе управления всеми информационно-документальными потоками и обеспечивающая основные бизнес-процессы предприятия [9]. Важно отметить, что использование КИС на предприятии предполагает использование информационной системы на основе концепции сквозной автоматизации бизнес-процессов, выполняемых взаимодействующими подразделениями организации.
Эта особенность позволяет сформулировать ряд требований, предъявляемых современным корпоративным информационным системам при их проектировании:
1) должно выполняться управление полным циклом выполнения заказов клиентов на всех этапах делового процесса;
2) должно быть доступно оперативное получение аналитической информации для обеспечения и повышения качества принятия управленческих решений;
3) необходимо внедрение системы управленческого учета затрат в разрезе различных видов деятельности, проектов, подразделений предприятия;
4) должна быть реализована технология бюджетирования и обеспечения динамической связи необходимых ресурсов с утвержденными проектами и направлениями деятельности;
5) необходимо наличие системы бизнес-планирования;
6) необходимо наличие систем электронного документооборота и управления рабочими потоками.
Для реализации КИС, удовлетворяющей вышеперечисленным требованиям многие методы и средства канонического проектирования информационных систем, предназначенные для локальной автоматизации процессов, не подходят, следовательно, применяются средства индустриального проектирования ИС на основе CASE (Computer-Aided Software/System Engineering - автоматизированная разработка программного обеспечения) и компонентных технологий. Также из приведенного перечня требований видно, что создание КИС - это очень сложный и трудоемкий процесс, требующий решения многочисленных задач и немалых затрат.
Однако в большинстве случаев выполнения проектов по созданию ИС, особенно больших и охватывающих организацию целиком, цель создания ИС достигается редко, а также сопровождается рядом больших временных и ресурсных затрат. Причиной возникновения таких проблем является не столько нечеткая постановка целей, сколько отсутствие комплексного системного подхода ко всем этапам жизненного цикла создания ИС.
Системный подход, в свою очередь, также оказывается недостаточным для выполнения сложных проектов масштаба предприятия. Поскольку требуется еще большее применение комплексных подходов, применение архитектурного подхода позволит повысить эффективность, масштабируемость и управляемость создаваемой ИС с точки зрения всех аспектов архитектуры ИС.
1.1.2. Архитектура КИС
Корпоративная информационная система представляет собой более узкое понятие, чем просто информационная система, поэтому целесообразно первоначально разобраться с понятием архитектуры для ИС, а уже потом определить особенности архитектуры ИС масштаба предприятия. Следует отметить, что в настоящее время, как в российской, так и в зарубежной практике проектирования ИС, понятие «архитектуры системы» используется очень широко, и при этом имеет множество трактовок и объяснений, тем самым порождая неизбежную путаницу в терминологии. Все варианты определений вместе дополняют друг друга и помогают понять существенные аспекты архитектуры корпоративной информационной системы.
Одно из наиболее употребляемых формальных определений архитектуры приведено в стандарте ANSI / IEEE Std 1471 - 2000 Института инженеров-электриков и электронщиков, который предоставляет метамодель для определения архитектуры [38]. Согласно данному стандарту, архитектура - это фундаментальная организационная система, заключенная в своих компонентах, их взаимоотношениях и окружении, а также, включающая в себя принципы, определяющие проектирование, создание и развитие системы. В соответствии с данным стандартом система обладает архитектурой, которая может быть описана с различных точек зрения заинтересованных лиц, рассматривающих архитектуру системы. Однако стандарт не определяет саму структуру архитектуры ИС, иными словами говорится о том, что необходимо представлять архитектуру с разных ракурсов, но при этом не указывается, какие это должны быть представления.
Также заслуживает внимания стандарт, являющийся стандартом РФ, ГОСТ 34.320-96. Отечественный стандарт не использует термин «архитектура системы», но определяет вид структуры ИС и основные компоненты ИС. Данный стандарт интересен тем, что, в отличие от предыдущего, содержит конкретные знания об архитектуре ИС, которая состоит из трех уровней: внешняя схема, внутренняя схема и уровень концептуальной схемы, информационной базы и информационного процессора [19].
Один из самых известных специалистов, работающих в области архитектуры систем, Дж.Захман в своей методологии архитектуры предприятия представляет архитектуру ИС в виде структурированного набора моделей [32], которые отражают различные содержательные точки зрения на структуру системы того круга лиц, которые вовлечены в ее создание и развитие - собственника, менеджеров, проектировщика, конструкторов, субподрядчиков, пользователей. При этом различные точки зрения обращаются на различные структурные аспекты системы (структура данных, функции, сетевая инфраструктура, организация, время и пр.).
Анализ различных источников на предмет определения архитектуры ИС позволяет сделать вывод о том, что, несмотря на разнообразие понятий, подходов к определению, в большинстве случаев, термин «архитектура системы» является синонимичным к понятию «структура системы». Также, важно отметить, что большое количество методологий дает определения и обозначает рамки архитектуры, но на практике большинство организаций при проектировании архитектуры ИС не соблюдает все пункты методологий по ряду различных причин. Одной из ключевых проблем для организаций, в настоящее время, является построение связующего звена между существующими бизнес-процессами компании и средствами их автоматизации. Вопрос построения ИТ-архитектуры - один из наиболее приоритетных для развивающихся компаний, следящих за тенденциями развития комплексных информационных технологий масштаба предприятий.
Исходя из всего вышеперечисленного можно сказать, что архитектура КИС - это концепция, определяющая модель, структуру, выполняемые функции и взаимосвязь компонентов ИС масштаба предприятия. Для того чтобы определить, как модель, так и структуру КИС, необходимо выбрать способ организации архитектуры КИС.
Проследим текущее состояние архитектуры современной КИС, опираясь на эволюцию программных архитектур. Распределённые ИС, в которых компоненты распределены по нескольким компьютерам, по типу архитектуры разделяют на: файл-серверные и клиент-серверные ИС [13]. Далее под сервером следует понимать процесс, который обслуживает информационную потребность клиента, а задачей клиента является инициирование связи с сервером.
Файл-серверная архитектура КИС представляет наиболее простой случай распределенной обработки данных в ИС, согласно которой на сервере распределяются только файлы данных, а на клиентской части находятся приложения пользователей вместе с СУБД. Использование файл-серверов предполагает, что вся обработка данных выполняется на рабочей станции, а файл-сервер лишь выполняет функции накопителя данных и средств доступа. Взяв за основу файл-серверную архитектуру можно спроектировать, разработать и отладить простое, работающее с небольшими объемами информации и рассчитанное на применение в однопользовательском режиме файл-серверное приложение. Такая архитектура ИС подходит небольшой компании, например, для ведения кадрового учета достаточно иметь изолированную систему, работающую на отдельном компьютере. Минусом такого решения можно назвать риск нарушения надежности хранения и поддержания целостности данных. А в сложных случаях, требующих от такой ИС поддержание проекта, выполняемого группой, файл-серверной архитектуры становится недостаточно.
На смену файл-серверной архитектуре со временем пришла клиент-серверная архитектура. Такой вид архитектуры упрощает взаимодействие пользователей с информационной системой и между собой в процессе исполнения бизнес-процессов. Клиент-серверная архитектура в КИС может быть реализована по-разному, а выбор конкретной схемы реализации данной архитектуры основывается на различных наборах требований, связанных с территориальным распределением, эксплуатационной надежности, быстродействием, простотой обслуживания и др. Существует две схемы реализации клиент-серверной архитектуры КИС:
1) двухуровневая клиент-серверная архитектура;
2) трехуровневая клиент-серверная архитектура.
Двухуровневая клиент-серверная архитектура, в отличие от файл-серверной архитектуры основана на том, что данные и СУБД размещаются на серверах, в то время как остальные компоненты программного обеспечения (графический интерфейс пользователя и логика приложений) размещаются на настольных компьютерах («толстые» клиенты). Такая архитектуры ИС решает проблемы файл-серверной архитектуры. Здесь становится возможным полная поддержка многопользовательского режима работы с ИС, а также есть гарантия целостности данных. Масштабируемость, централизованность администрирования и способность архитектуры к развитию позволяют использовать такой тип архитектуры для быстрого создания приложения для небольшого количества пользователей. Двухуровневая клиент-серверная архитектура на сегодняшний день может считать устаревшей, и для построения распределенных КИС она не подходит, в силу существующих недостатков (ограниченная масштабируемость, ограниченное использование сетевых вычислительных ресурсов). Все это снижает быстродействие системы и негативно сказывается на стоимости аппаратных компонент, которые необходимы для ее функционирования.
Для решения этих проблем была предложена трехуровневая клиент-серверная архитектура. Основное ее отличие от двухуровневой состоит в том, что в ней присутствует физическое разделение программ (промежуточное звено), отвечающих за хранение данных (СУБД) от программ, обрабатывающих эти данные (сервер приложений). Такое разделение программных компонент позволило оптимизировать нагрузки, как на сетевое, так и на вычислительное оборудование комплекса. По сравнению с двухуровневой клиент-серверной или файл-серверной архитектурой можно выделить следующие достоинства трехуровневой клиент-серверной архитектуры, это: масштабируемость, конфигурируемость (изолированность уровней друг от друга), высокая безопасность, высокая надежность, низкие требования к скорости канала (сети) между терминалом и сервером приложений, низкие требования к производительности и техническим характеристикам терминалов, как следствие снижение их стоимости.
Трехуровневая архитектура сложнее двухуровневой, но благодаря тому, что функции распределены между серверами второго и третьего уровня, эта архитектура представляет, как высокую степень гибкости и масштабируемости, высокую безопасность (т.к. защиту можно определить для каждого сервиса или уровня), так и высокую производительность (т.к. задачи распределены между серверами).
Несмотря на то, что клиент-серверную архитектуру на сегодняшний день можно назвать классической, сейчас наблюдается устоявшийся интереса к сервис-ориентированной архитектуре (SOA - Service-Oriented architecture), связанный с постоянно возрастающим интересом к Web-сервисам, на технологиях которых основана эта концепция. Практические аспекты сервис-ориентированной технологии позволяют решить проблемы масштабируемости, интегрировать сети передачи данных, упростить процедуры проектирования и управления сетями, а также создать другие распределенные приложения, прозрачно взаимодействующие с ресурсами систем при помощи прикладных программных интерфейсов и открытых стандартов. Следует отметить, что сервис-ориентированная архитектура - это подход к разработке ПО, в основе которого лежат сервисы со стандартизированными интерфейсами. КИС, построенная на основе сервис-ориентированной архитектуре, состоит из набора сущностей, доступных через прикладные программные интерфейсы. Нередко сервис-ориентированную архитектуру называют третьей ступенью развития ИС, последующей за мэйнфреймами и клиент-серверной архитектурой.
Рассмотрим эволюцию архитектуры ИС на примере компании SAP и ее решений. Классическим примером первой ступени мэйнфрейма может служить система SAP R/2. В клиент-серверной архитектуре таким образцом стала широко распространенная SAP R/3, а в качестве сервис-ориентированного решения компания SAP позиционирует интеграционную платформу NetWeaver, в которой сервис-ориентированный подход позволит облегчить и ускорить внедрение КИС на предприятии.
Каждый тип архитектуры имеет ряд преимуществ и недостатков, а также справляется с решением тех или иных задач, продиктованных потребностями компаний на протяжении временного периода развития информационных технологий. Какой бы ни была архитектура ИС, в каждой системе происходит работа с различными ресурсами. Документ, в свою очередь, в не зависимости от его формата и вида, основной ресурс и источник информации для компаний.
Для того чтобы понять связь архитектуры КИС и документа, рассмотрим пример. Чаще всего документ создается в формате некоторого офисного приложения; затем после утверждения, документ публикуется на сайте в HTML-формате или преобразуется в PDF для дальнейшего распространения. С точки зрения потребителя информации это один и тот же документ, а с точки зрения архитектуры ИС - три разных. Содержимое документа, его семантика представляют собой важную составляющую документа, однако в современной архитектуре КИС не предусмотрено наличие семантических технологий, позволяющим усовершенствовать концепции существующих архитектур ИС.
1.2 Электронный документооборот
Автоматизация документооборота компании, в настоящее время, стала одной из типичных задач компании, стремящейся к автоматизации своего производства, а также всех процессов, протекающих в ней. Данное явление обусловлено тем, что документы в компании - это самое распространенное средство поддержки выполнения бизнес-процессов, обеспечивающее фиксацию и перенос информации от одного исполнителя к другому. Таким образом, эффективность выполнения бизнес-процессов организации во многом определяется скоростью и качеством протекания процессов в рамках жизненного цикла документов.
Важность таких ключевых показателей при управлении бизнес-процессами компании, как количество и качество, совместно с развитием технологий автоматизации, неизбежно влечет за собой повсеместное использование электронных документов в организации.
1.2.1. Понятие и сущность электронного документа
Документы содержат информацию, являющуюся ценным ресурсом и важным элементом деловой деятельности. Системный подход к управлению документами позволяет организациям и обществу защищать и сохранять документы в качестве доказательства действий.
С точки зрения ИС документ представляет собой мощный информационный поток, который нуждается в контроле и тщательной организации, если стоит задача совершенствования бизнес-процессов документооборота. Поскольку базовый термин, на котором фокусируется данная глава - это электронный документ, в первую очередь необходимо обозначить, что будет пониматься под понятием «Документ», и, основываясь на данном определении, выявить особенности понятия «Электронный документ».
За время своего существования термин «Документ» не получил единого, общепринятого определения. В различных государственных документноориентированных нормативных актах не содержится однозначного указания на то, что можно считать документом, а что - нет, однако, несмотря на различные толкования термина и его определение, можно опереться на “Национальный стандарт РФ. Система стандартов по информации, библиотечному и издательскому делу. Управление документами”. Таким образом, в соответствии с ГОСТ Р ИСО 15489-1-2007 документ - это зафиксированная на материальном носителе идентифицируемая информация любой формы, в виде текста, звукозаписи, изображения и (или) их сочетания, также имеющая реквизиты, созданная, полученная и сохранённая организацией или физическим лицом в качестве доказательства при подтверждении правовых обязательств или деловой деятельности [13].
В определении «Документа» характерны следующие моменты. Документом признается, прежде всего, материальный носитель, в то время как наличие зафиксированной на ней информации является вторичным признаком. Центр фокусировки перенесен на наличие реквизитов. Однако, учитывая наличие разрозненных определений данного понятия, трактовка понятия с той точки зрения, когда документ - это, прежде всего, информация, а материальный носитель - признак вторичный, имеет право на существование. Таким образом, следует отметить, что «Документ», как более обобщенное понятие «Электронного документа» позволяет перенести признаки «Документа» на понятие «Электронного документа» и также считать основой «Электронного документа» информацию.
В новейшей (с изменениями от 1 января 2011 г.) редакции Федерального закона «Об информации, информационных технологиях и о защите информации» (№ 149_ФЗ) электронный документ понимается как «документированная информация, представленная в электронной форме, то есть в виде, пригодном для восприятия человеком с использованием электронных вычислительных машин, а также для передачи по информационно-телекоммуникационным сетям или обработки в информационных системах» [20].
В определении «Электронного документа», соответственно, акцент переносится на то, что это в первую очередь, это информация, которая представлена в электронной форме. Исходя из определения, формируется ряд требований, которым ЭД должен отвечать:
- содержать реквизиты, которые позволяют подтвердить его целостность и подлинность;
- создаваться, обрабатываться, храниться, приниматься и передаваться при помощи технических программных средств;
- быть воспроизведенным (отображенным) в понятной для восприятия форме.
Очевидно, что при использовании ЭД есть как положительные, так и отрицательные стороны. Преимущества применения ЭД:
- упрощается и ускоряется сбор, обработка и систематизация всей информации;
- существенно ускоряется компьютерная обработка докумен-тов;
- оперативная (практически мгновенная) передача документов на любые расстояния при рассылке их по электронной почте;
- при хранении электронных документов не требуются большие площади для архивов;
- создание электронных архивов позволяет использовать уже полученную информацию для подготовки новых документов;
- повышается эффективность работы;
- наличие базы шаблонов документов уменьшает время на создание новых;
- уменьшение расходования бумаги при работе с проектом электронного документа и внесении каких-либо изменений до вывода на бумагу;
- рассылка проекта документа одновременно нескольким визирующим;
- рассылка документа одновременно нескольким адресатам по электронной почте.
Недостатки ЭД:
- необходимость наличия определенных технических средств для создания и дальнейшей работы, а также хранения документов;
- защита информации, содержащейся в документах, от несанкционированных изменений.
Существует еще одна проблема, которая вытекает из особенности представления информации в электронном виде - копирование электронной информации. Одним из наиболее важных преимуществ, представленной в электронной форме информации, является легкость ее копирования. Поэтому при передаче по каналам связи электронного документа его необходимо защитить, во избежание инцидентов, от несанкционированного копирования. Однако на передающем конце остается контрольная копия. Она может рассматриваться как заверенная исполнителем копия документа. Но если заверить ее электронно-цифровой подписью, снабдив при этом всеми необходимыми атрибутами, тогда будет изготовлен один документ в двух экземплярах, которые имеют равную юридическую силу.
Следовательно, ЭД можно приравнять, проводя аналогию:
- к юридически значимому документу - электронный документ при передаче его со всеми соответствующими атрибутами по каналам связи;
- к рабочей копии документа - электронную копию документа, которая осталась у респондента;
- ко второму экземпляру или заверенной копии самого юридически значимого документа, которые равносильны первому экземпляру - электронную копию документа, оставшуюся у респондента и заверенную электронно-цифровой подписью;
- к заверенной копии документа - его распечатку, которая заверена в установленном законом порядке.
Кроме проблем, вытекающих из рамок правового статуса ЭД, есть еще один трудный вопрос, требующий разрешения, особенно в условиях текущего развития ИТ, в частности, развитие систем электронного документооборота. Проблема заключается в том, что, в настоящее время, КИС, работающие с ЭД, в большинстве своем, оперируют документом, как целостной единицей. Такая концепция принятия документа не позволяет извлечь из документа данные, которые содержаться непосредственно внутри неструктурированного ЭД. В свою очередь, потенциальные возможности технологий «интеллектуализации» содержат множество возможностей для обработки большого количества документов и данных, содержащихся в них.
Данные, находящиеся внутри документа являются неструктурированными, следовательно, для работы с ними, а также для последующего превращения человеком данных в информацию, необходим подход, позволяющий рассматривать документ, как набор структурированных данных.
Рассмотрев некоторые особенности ЭД, преимущества и недостатки его использования, а также некоторые юридические аспекты, следует обратить внимание также на структуру ЭД и базовые задачи управления документами, которые объяснят причину рассмотрения концепции документа как объекта, состоящего из множества составляющих, полезных для бизнес-процессов документооборота.
1.2.2. Недостатки традиционного подхода к ЭД
Накопление документов, существующих в электронном виде, а также критически важных для бизнеса, растет в компаниях в быстрых темпах. Одной из основных проблем последнего десятилетия является не столько количество документов, сколько потребность во взаимосвязанной системе для работы с ними.
Раньше, в большинстве случаев, система управления документами поддерживалась за счет разрозненных средств, начиная от папок на файловой системе и электронной почты и заканчивая специализированными приложениями. При этом бизнес-логика, иными словами совокупность правил, принципов и зависимостей работы с документами в ИС, формально нигде не была закреплена, а с документами работали сотрудники отдела документационного отдела. Соответственно, возникла потребность в системе, которая решает проблему организации информации в рамках единого процесса.
Первые три десятилетия развития информационных технологий основное внимание уделялось структурированным данным, процессам их сбора, хранения и обработки. Для работы с неструктурированной информацией использовались простые инструменты, на примере текстовых редакторов. Однако в конце 90-ых годов сложилась ситуация критической точки, когда более 80-ти % всей корпоративной информации стало храниться в виде неструктурированных документов, при этом системы, которые должны были обеспечивать надежное хранение и доступ отсутствовали.
Таким образом, следует вывод о том, что накопленные массивы электронной информации, хранящейся в электронных документах, являются ценнейшим интеллектуальным активом организации, ее корпоративной памятью, следовательно, нуждаются в механизмах анализа содержимого документов. При этом интеллектуальные активы должны быть легкодоступны и надежно сохранены. Обеспечить эти потребности позволяет концепция управления корпоративной информацией призванная объединить разрозненные технологии, поддерживающие работу с неструктурированной информацией.
КИС, обладающая такой концепцией обработки корпоративной информации, должна быть настраиваема и адаптируема к окружающим внешним факторам. Невыполнение этого требования может привести к тому, что ИС, по истечении некоторого времени, перестанет выполнять свои функции из-за изменений в организационной структуре компании, ее внешнем окружении, спектре выполняемых работ. Все эти изменения неизбежно ведут к соответствующим изменениям системы понятий, которыми оперирует компания, тематике и структуре документов, классификации документов и способах организации архива.
Проблемы, возникающие при создании такой КИС, не охватываются традиционными подходами к автоматизации документооборота в компании и не решаются статистическими и лингвистическими методами полнотекстового поиска в базе данных документов.
В таком случае требуется применение интеллектуальных решений, семантических технологий с ориентацией задач управления документами (поиск, анализ, классификация, каталогизация, хранение) на понимание информационной системой содержания документа, его семантики. Одной из главных проблем анализа неструктурированных электронных документов является большое количество разнородного содержимого в документе. Если каждый элемент (слово или строку) подвергать анализу, то время извлечения данных и знаний резко возрастет и, в таком случае, не будет удовлетворять требованиям пользователей.
В то же время очевидно, что не все элементы документа несут полезную информацию, а в силу гибкости естественных языков формально различные слова (синонимы и пр.) на самом деле означают одинаковое понятие. Все эти процессы проходят в рамках выполнения процесса семантического индексирования - механизма, с помощью которого поисковый инструмент определяет не только соответствие содержимого документа ключевым запрашиваемым словам, но и определяет неявные семантические связи ключевого запроса. Таким образом, устранение описанных проблем выполняется на этапе предварительной обработки документа.
В связи с этим, первым этапом семантического индексирования, предшествующим непосредственному извлечению данных из документа и последующей их обработки, является этап структурирования данных документа. При системном подходе к вопросу извлечения из ЭД знаний, необходимо иметь соответствующий подход к определению структуры документа и его элементов.
1.2.3. Структура электронного документа
Согласно определению «документа», формулировку которого в 1997 году дает спецификация организации DMA (Document Management Alliance) [32]: «Документ - это набор информации, который имеет отношение к выделенной теме или к родственным темам». Это определение является обобщающим, не привязывает документ к наличию носителя или реквизитов. Объект неструктурированных данных, другими словами, называемый документом, может принимать множество различных форм: это может быть закодированный текст, оцифрованное изображение бумажного документа, графика, выходные файлы САПР (система автоматизированного проектирования), цифровое видео. Таким образом, любой типы неструктурированных данных, которые могут быть автоматизированы, храниться в цифровой форме и воспроизводиться в виде, воспринимаемом человеком - это документ.
Документам, как живым и интеллектуальным объектам, принадлежит три основные характеристики, за которые ответственны три различных технологических средства. Во-первых, это объекты хранения всевозможных данных от текста до графики и звука. Во-вторых, это связи, которые «оживляют» документы. В-третьих, это атрибуты и индексы, появляющиеся в результате обработки документов в ИС. Все три характеристики можно назвать синтаксической нотацией документа, с которой также связано понятие стиля документа - его форма, проявляющаяся при воспроизведении документа при его обработке текстовыми редакторами.
По всем признакам документ является структурированным объектом, однако структурированным частично. Определение документа, как неструктурированного позволяет перейти от концепции построения архитектур ИС, ориентированных на построение полнотекстовых баз данных хранения документов к архитектуре с гибким и универсальным хранилищем данных с интеллектуальными технологиями анализа содержимого документов. Для этого необходимо учесть следующие характеристики структуры документа, накладываемые понятием ЭД:
a) структура документа, то есть его формат и взаимосвязи между составляющими документ элементами, должна оставаться неизменной;
b) в документе должен быть отражен контекст его создания, получения и использования документа (в том числе процесс деловой деятельности, частью которого является данная операция, дата и время данной операции и ее участники);
c) должны быть представлены связи между отдельными записями, составляющими в совокупности документ.
Вышеописанные характеристики структуры ЭД отображены на схематическом изображении модели ЭД (см. рис. 1.1). Рассмотрим схему более подробно.
Рис. 1.1 Схема структуры ЭД
Как видно на схеме структуры ЭД, структура документа имеет несколько основных составляющих: содержимое и метаданные. Содержимое документа состоит из элементов, которые, с вою очередь, могут быть связаны друг с другом и состоять из различных реквизитов. Набор реквизитов - обязательных элементов оформления официальных документов, зависит от вида документа [11] и в первую очередь позволяет определить структуру ЭД для человека, тем самым являясь важной частью документа.
Состав реквизитов, использующиеся, к примеру, при подготовке и оформлении организационно-распорядительных документов (см. приложение A), определяется ГОСТом Р 6.30-2003 «Унифицированные системы документации. Унифицированная система организационно-распорядительной документации. Требования к оформлению документов» [20]. Кроме того, данный стандарт устанавливает требования к оформлению реквизитов и закрепляет схемы их расположения на макете документа. Несмотря на то, что в стандарте описаны 30 реквизитов, необходимо помнить, что различные документы состоят из разного набора реквизитов. Более того, некоторые реквизиты являются взаимоисключающими, например, «Адресат» и «Гриф утверждения». Данные реквизиты располагаются в одной и той же части макета документа и, с точки зрения документационного управления, занимают одну и ту же площадь в отведенной им части, тем самым, являясь взаимоисключающими.
Содержательный элемент документа может иметь два типа: структурированные и полуструктурированные (неструктурированные). Особенностью структурированных документов является наличие фиксированной структуры для сбора данных, четко обозначенных полей, некоторых служебных элементов. Примером структурированного документа может служить бланк регистрации, изображенный на рис. 1.2, а. Использование такого типа документов значительно повышает время и качество ввода документа в ИС, распознавания образа, обработки документа.
Полуструктурированные (неструктурированные) документы отличаются от структурированных тем, что их поля не имеют фиксированного размера и расположения. В таком случае при распознавании ИС ориентируется на статический текст, осуществляя его поиск по всему документу, что требует значительных затрат времени и снижает качество распознавания изображения. Пример полуструктурированного документа в виде извещения на оплату представлен на рис. 1.2, b.
а) b)
Рис. 1.2 Типы форм документов: a) пример структурированной формы, b) Пример полуструктурированной формы
Независимо от типа формы документа, «машиночитаемая форма» содержит следующие основные элементы: информационные поля, идентификаторы, сервисные поля и декоративные элементы. Каждый элемент формы имеет свое значение.
Информационные поля служат для ввода текста при заполнении формы, в них размещаются группы знакомест, метки, группы меток. Сервисные поля позволяют выявлять принадлежности формы к определенному образцу и служат для ориентации документа во время ввода в ИС, за счет фокусировки на статическом тексте и реперных точках (черных квадратов). Идентификаторами служат штрих-коды, однозначно характеризующие принадлежность формы к определенному образцу (в том случае, если реперные точки у форм различных образцов совпадают). Декоративные элементы, такие как подписи и печати не подлежат распознаванию.
Кроме содержимого, обладающего набором элементов и реквизитов, в ЭД необходимо наличие метаданных об управлении документами, а также объясняет принципы, лежащие в основе управления ими. Сформулировать требования и основы для создания и управления метаданными позволяет национальный стандарт Российской Федерации «Система стандартов по информации, библиотечному и издательскому делу. Процессы управления документами. Метаданные для документов» ГОСТ Р ИСО 23081-1-2008 [13].
В стандарте [13] говорится, что управление метаданными - это неотъемлемая часть управления документами, обеспечивающая выполнение множества различных функций и целей. В рамках управления документами метаданные определяются как данные, описывающие контекст, содержание и структуру документов, а также процессы управления ими на протяжении всего жизненного цикла (ЖЦ) документа. Сами по себе метаданные являются структурированной или полуструктурированной информацией, позволяющей создавать, регистрировать, классифицировать, обеспечивать доступ, хранение и размещение документов, в рамках и за пределами одной или нескольких областей деятельности.
В схеме структуры ЭД (см. рис. 1.1) обозначены два типа метаданных: метаданные свойств содержимого и метаданные контекстной связи. Метаданные свойств содержимого допускается использовать для идентификации, подтверждения подлинности и статуса документа. Чем больше и качественнее определен набор метаданных свойств содержимого, тем больше возможности использования метаданных в процессе управления документами в ИС. Метаданные контекстной связи, в свою очередь, содержат информацию о контекстуализации документов, процессов и систем, в рамках которых создаются, управляются и используются ЭД. Такие метаданные важны при анализе и оптимизации бизнес-процессов. В целом, все метаданные представляют интерес в рамках управления ЭД на протяжении ЖЦ ЭД.
Управление документами всегда включает в себя управление метаданными. Однако электронная среда требует иного выражения традиционных требований и иных механизмов для идентификации, ввода, определения свойств и использования метаданных. В электронной среде документы нормативного характера - это документы, сопровождаемые метаданными, определяющими их нормативный статус. Этот нормативный статус должен быть четко документирован, а не подразумеваться, как в некоторых процессах управления бумажными документами. С ЭД очень важно предоставить гарантию того, чтобы в ИС, которые создают, осуществляют ввод и управление документами, осуществлялось создание и ввод метаданных об управлении документами. И наоборот, электронная среда предоставляет новые возможности для определения и создания метаданных, а также для обеспечения полного, своевременного ввода документов.
Важно отметить, что структура ЭД может рассматривать с нескольких точек зрения. Структура документа, воспринимаемая человеком, и структура, необходимая ИС для обработки документа (машиночитаемая), различаются. Более того, в документе содержится, как структурированная информация, так и неструктурированная. Для работы с неструктурированными данными, их необходимо первоначально обработать. Также отмечено, что каким бы ни был тип документа, структурированным или полуструктурированным, при управлении ЭД в ИС должны учитываться метаданные.
На основе построенной схемы структуры ЭД, а также описанной информационной модели ЭД в работе [19], была построена информационная модель структуры ЭД (см. рис. 1.3), которая отображает основные информационные блоки ЭД, с которыми предстоит работа в ИС. Информационная модель - это модель объекта, в нашем случае ЭД, представленная в виде информации, описывающей существенные для данного рассмотрения параметры и переменные величины, связи между ними, входы и выходы объекта и позволяющая путём подачи на модель информации об изменениях входных величин моделировать возможные состояния объекта.
Рис. 1.3 Информационная модель структуры ЭД
В целом, модель состоит из трех блоков, соответствующих составным частям схемы структуры ЭД. Соответствие элементов схемы и информационной модели представлено в табл. 2.1. Далее рассмотрим предназначение каждой модели, входящей в состав всей информационной модели структуры ЭД.
Таблица 2.1. Соответствие элементов схемы и информационной модели структуры ЭД
Элемент схемы структуры ЭД |
Элемент информационной модели структуры ЭД |
|
Содержание |
Модель семантического описания |
|
Метаданные свойств содержимого |
Модель описания свойств содержимого |
|
Метаданные контекстной связи |
Модель описания контекстной связи |
Модель семантического описания представляет собой набор конечного числа семантических сущностей, иными словами описание следующих элементов: объектов, сущностей, понятий содержания документа. Также в этой модели учитываются отношения между этими элементами, состояния, причины и следствия.
В свою очередь, модель описания свойств содержимого выражается в описании статических характеристик, как общих для всех типов документов (создатель, формат, дата создания), так и дополнительных, характерных для определенного контекста документов. Так, например характеристика «Идентификатор» или «Дата создания документа» являются обязательными для всех документов, в то время как такая характеристика, как «Приложение, в котором создан документ» будет встречаться только у документов, созданных с помощью приложений.
Модель описания контекстной связи необходима для описания движения документа и принадлежности его к бизнес-процессам. Для этого в данной модели предусмотрены такие характеристики, как «переход», «варианты» и «состояния». Последовательность переходов, которой обладает документ, выражается в показателях: «время», «характер», «причина» и др., а характеристика «варианты» отображает потенциальные способы переходов, заложенные в маршруты движения ЭД. В свою очередь характеристика «состояния» отображает перечень состояний документа на пути его движения. Более того, вся модель описания контекстной связи функционирует в условиях временной шкалы.
Таким образом, в данном разделе была обозначена схема структуры ЭД и модель структуры ЭД, что позволит в последующих главах проектировать архитектуру КИС с базовым объектом - документ, в противовес стандартным системам электронного документооборота, в которых основным объектом является запись в базе данных. Кроме того, исходя из понятия и структуры ЭД, целесообразно также обозначить жизненный цикл ЭД, который отражает все фазы ЭД, которые присутствуют во время работы с ЭД в ИС.
1.2.4. Жизненный цикл электронного документа
В любой организации и вне ее происходит непрерывный процесс движения ЭД, а также, что немаловажно информации и знаний. Жизненный цикл ЭД отличается от традиционного «бумажного» документа большей гибкостью и прозрачностью.
Проводя анализ электронного документооборота (ЭДО), в качестве объекта исследования можно рассматривать отдельный документ (бумажный / электронный), документопоток, документационный технологический процесс. Однако основополагающим объектом исследования и совершенствования можно назвать документопоток.
Согласно ГОСТ Р 51141-98 [5] документопоток - это поток документов, циркулирующих между пунктами обработки и создания информации (руководителями организации и структурных подразделений, специалистами) и пунктами технической обработки документов: секретариатом, канцелярией и др.
В каждой организации можно выделить следующие потоки документов:
1) поток входящей документации, состоящий из поступающих в организацию документов;
2) потоки внутренней документации, состоящие из документов, созданных в организации и не предназначенных к выходу за ее пределы;
3) поток исходящей документации, состоящий из документов, предназначенных для отправки в другие организации [5].
Основные этапы ЖЦ ЭД
Исходя из определения ЭД, можно сделать вывод о том, что управление корпоративными ЭД - это технология, используемая для ввода, управления, хранения, сохранности, доставки и вывода, как документов, так и содержимого этих документов, относящихся к важнейшим процессам организации. За основу жизненного цикла ЭД возьмем принятую в концепции систем типа ECM структурную схему управления корпоративным контентом, предложенную ассоциацией по вопросам управления информацией и изображениями (AIIM _ Association for Information and Image Management) [33].
ЖЦ ЭД в ИС будет состоять из следующих этапов:
1) ввод документа в ИС;
2) хранение документа в ИС;
3) обеспечение сохранности документа в ИС;
4) управление документом;
5) доставка документа;
6) вывод документа из ИС.
Кроме этого, следует обозначить, что ЖЦ, состоящий из шести вышеописанных этапов, также должен включать в себя целый перечень состояний документа, что является очень важным компонентом в понимании управления ЭД. Список состояний документа, принятый в системе описания организации - ARIS [13] представляется достаточным и наиболее полным и включает в себя: планирование; создание (разработка); согласование; визирование; утверждение; регистрация; публикация; регламентация доступа; извещение об изменениях; оперативное хранение; выполнение основных функций; архивное хранение информации; экспертиза ценности; уничтожение.
На основе ЖЦ ЭД становится возможным определение таких понятий как управление ЭД и электронный документооборот (ЭДО).
1.2.5. Стандарты по управлению ЭД
Согласно основным этапам ЖЦ ЭД обратимся к нормативным документам и стандартам, относящимся к управлению электронными документами в организации, содержащими четко сформулированные требования к работе с документами и информацией. В настоящее время общепризнанными международным сообществом документами, устанавливающими требования к управлению ЭД, являются следующие стандарты: ГОСТ Р ИСО 15489-1 - 2007, ГОСТ Р ИСО 23081-1 - 2008, ISO 15836:2003, ISO/TR 15801:2004, ISO/TR 18492:2005, ISO/TR 12037:1998, ISO 2142:2001, ISO 19005-1:2005, XKMS, MoReq2.
Подобные документы
Сущность автоматизации управления документооборотом. Понятие электронного документа и функции традиционного документа. Системы электронного документопроизводства. Новый подход к созданию документов и использование корпоративных информационных порталов.
реферат [26,2 K], добавлен 27.02.2009Подача заявления на разработку электронного документа. Свойства элементов документа. Методы устранения недостатков технологических процессов. Изменение формата хранения данных. Установление контрольных точек в операционных технологических процессах.
курсовая работа [137,8 K], добавлен 15.10.2012Сущность, структура и значение приложения Microsoft Office 2003, его основные возможности. Концепция электронного документа и его обязательные реквизиты. Особенности технологии создания и редактирования текстового документа в Microsoft Word 2003.
реферат [23,0 K], добавлен 23.11.2010Понятие электронного документа, отличие от иных видов документов. Юридическая сила и правовой режим электронного документа и документооборота. Процедуры разрешения конфликтов. Основные типы текстовых электронных документов и выбор средств их оформления.
реферат [24,5 K], добавлен 22.08.2010Особенности функционирования документной информации в обществе. Возникновение и развитие электронного документа. Нормативно-правовые основы работы с электронными документами. Электронный документ в управленческой деятельности современных организаций.
курсовая работа [57,6 K], добавлен 07.01.2015Разработка структуры корпоративной информационной системы (иерархия взаимодействия отдельных элементов на программном и аппаратном уровнях). Выбор компьютерного оборудования (клиентские станции, серверы), системного и прикладного программного обеспечения.
курсовая работа [1,8 M], добавлен 13.02.2016Описания систем планирования ресурсов предприятия. Документирование и стандартизация процесса разработки корпоративной информационной системы. Создание основных объектов конфигурации, документов, регистров, отчетов, ролей и интерфейсов пользователей.
курсовая работа [3,0 M], добавлен 18.05.2016Понятие и типология электронных предприятий, методы автоматизации их деятельности. Особенности функционирования и архитектуры современного электронного предприятия, анализ и оценка экономической эффективности методов его деятельности, автоматизации.
дипломная работа [127,4 K], добавлен 28.06.2010Разработка универсальной системы электронного документооборота HotDoc с разграничением прав доступа пользователей, с эффективной системой поиска документа, с возможностью внедрения в различные организации. Реализация программы в виде веб-приложения.
дипломная работа [5,5 M], добавлен 24.09.2012Проектирование функционального модуля по учету кадров на предприятии в отделе кадров. Анализ предметной области. Создание документа, формально определяющего существование проекта, то есть технического задания на проект фрагмента информационной системы.
курсовая работа [2,2 M], добавлен 11.12.2012