Электронные библиотеки как информационные ресурсы
Характеристика общих вопросов организации электронных ресурсов. Принципы взаимодействия Интернет-ресурсов и процесса формирования каталогов электронных изданий. Анализ концепции построения электронных библиотек и организации информационных ресурсов в них.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 24.11.2012 |
Размер файла | 111,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
111
Размещено на http://www.allbest.ru/
- Содержание
- Введение 2
- Глава I. Электронные библиотеки как информационные ресурсы 5
- 1.1 Организация создания электронных книг 5
- 1.2 Понятие и организация электронных библиотек 12
- 1.3 Современные системно-технологические тенденции развития электронных библиотек 16
- Глава II. Практика организации электронных ресурсов крупнейших российских библиотек 37
- 2.1 Российская государственная библиотека 37
- 2.2 Российская национальная библиотека 56
- 2.3 Методика поиска информации в электронных библиотеках 71
- Заключение 101
- Список использованной литературы 107
Введение
Актуальность темы работы состоит в том, что отличительной чертой сегодняшнего этапа развития общества является то, что информация существует как в традиционной печатной, так и в электронной форме. Более того, современные информационные технологии позволили не только приступить к широкомасштабному переводу накопленной человечеством информации в электронную форму, но и к созданию большого числа новых информационных ресурсов сразу в электронном виде. Эта форма представления информации помимо значительного ускорения коммуникативных процессов позволяет на качественно новом уровне организовать процессы производства, хранения и распространения информации.
Информационные методы и технологии все глубже проникают практически во все виды деятельности. Информатизация, конвергенция информационных, коммуникационных технологий (ИКТ) и мультимедиа, переход к применению современных информационных систем в сфере науки и образования обеспечивают принципиально новый уровень получения и обобщения знаний, их распространения и использования.
Обеспечение публичного (в том числе удаленного) доступа пользователей к электронным информационным ресурсам стало одной из первоочередных задач информационного обслуживания науки, образования и культуры. В нынешних условиях уже не требует доказательств, что концепция информационного обслуживания, базирующегося только на основе печатных носителей устарела, и ей на смену пришла другая, - основанная на электронном представлении самой разнообразной информации, тиражируемой в неограниченном количестве и мгновенно доступной через глобальные сети передачи данных независимо от времени и местонахождения пользователя.
В связи с этим существенно меняется роль и функции такого социального института, как библиотека - основного хранилища и распространителя информации.
Общепризнанно, что наиболее эффективно информационно - библиотечное обслуживание для нужд науки, культуры и образования сегодня (и, тем более, завтра) достигается путем создания электронных библиотек (digital libraries), не столько состоящих из коллекций электронных документов (как оцифрованных традиционных материалов, так и созданных сразу в электронном виде), сколько представляющих из себя систему, реализующую унифицированный подход к производству, хранению и организации разнообразной информации с целью поиска, анализа и доступа к ней с использованием глобальных компьютерных сетей.
Основное различие традиционной библиотеки и электронной библиотеки заключается в том, что пользователь обращается к сервисам последней за необходимой информацией, а не просто за отсылками к документу и/или самими документами. Отличительной чертой электронной библиотеки является возможность параллельного использования различных поисковых механизмов и средств доступа к гетерогенным коллекциям электронных данных. Так как в качестве ответа на запрос к электронной библиотеке пользователю может быть представлен далеко не единственный электронный документ (или его фрагмент) и совсем не обязательно в текстовой форме, необходимы такие информационные системы, которые могут обеспечить эффективный комплексный поиск и анализ информации в коллекциях разнородных объектов.
В силу целого ряда причин периода социально - экономических преобразований уровень информационного обеспечения науки и образования в России на один - два порядка ниже, чем в развитых странах. Вследствие жестких финансовых ограничений резко снизился уровень комплектования даже ведущих библиотек и информационных центров как отечественными, так и зарубежными научно - техническими периодическими изданиями. Очевидно, что в ближайшие годы традиционными методами изменить ситуацию к лучшему не представляется возможным, поэтому стали необходимы новые нетрадиционные подходы для решения проблемы повышения уровня информационного обеспечения ученых и специалистов на основе использования ИКТ и электронизации информационных фондов. Этим объясняется то внимание, которое государственные ведомства проявили к деятельности по созданию и использованию электронных библиотек в России.
Цель дипломного исследования - анализ особенностей организации информационных ресурсов в электронных библиотеках
Задачи исследования:
1. характеристика общих вопросов организации электронных ресурсов;
2. обзор принципов взаимодействия Интернет-ресурсов и процесса формирования каталогов электронных изданий;
3. отслеживание тенденций развития организационно-технологических основ электронных библиотек;
4. анализ концепции построения электронных библиотек и принципов организации информационных ресурсов в них
Объект исследования - электронные библиотеки (ЭБ).
Предмет исследования - формирование ЭБ и технология их использования в обслуживании запросов удаленных пользователей.
Методы исследования, логический анализ, синтез, обобщение и эксперимент по поиску информации в электронных каталогах.
Источниковедческая база: монографии, статьи из сборников научных трудов и конференций, статьи из профессиональных журналов, ресурсы сети Интернет.
Экспериментальной базой являются электронные библиотеки Российская Национальная Библиотека и Российская Государственная Библиотека.
Глава I. Электронные библиотеки как информационные ресурсы
1.1 Организация создания электронных книг
информационный ресурс электронная библиотека
Электронные издания возникли в конце 80-х годов. Фирма «Columbia Tristar Home Video» (США) выпустила первую серию электронных книг для использования со специальным портативным плеером Data Discman фирмы «Sony» (Япония), с помощью которого можно было читать компакт-диски диаметром 3,5дюйма. Так, возник рынок «электронных книг», и в Японии к 1992 г, было продано свыше 130 тыс. К тому времени в связи с быстрым распространением персональных компьютеров производители электронных книг и устройств для их чтения стали ориентироваться на стандарты СО-RОМ и предусматривать возможность подключения выпускаемых плееров к вычислительным машинам.
В 1998 году, на американском рынке появилось «новое» поколение электронных книг: The Rocket eBook, SoftBook, Millenium Reader и EveryBook.
Несомненным преимуществом электронной книги является компактность - электронная книга намного вместительнее обычной книги и может вместить не то, что информацию многотомной энциклопедии, а содержание книг целой библиотеки. Электронная книга сокращает время поиска информации, поскольку текст получается в виде битов через Интернет, и любая книга может быть доставлена мгновенно. Электронная книга обеспечивает легкость аннотирования, позволяя добавлять собственные электронные замечания, выделять текст и вносить аннотации, примечания, ссылки, Возможность манипулировать текстами этих изданий вызвала к жизни гипертекст, который создает возможность поиска и объединения по смыслу фрагментов текста, т.е, появляется возможность навигации по гипертексту. [11]
Электронная книга экономически более выгодна для читателя, чем печатное издание, что связано с отсутствием затрат на издание, минимальной стоимостью хранения и доставки. На практике нет никаких препятствий к тому, чтобы классическую литературу и другие общедоступные тексты можно было загружать из электронных хранилищ бесплатно.
В России компания «Электронная книга» появилась в начале 2000 года; её издания выставлялись уже в апреле 2000 года на ярмарке «Книги России».
Среди электронных изданий следует в первую очередь отметить научные и учебные издания.
Как правило, электронные учебники и энциклопедии как любительского, так и профессионального характера выпускаются в основном на компакт-дисках, хотя начинают появляться аналогичные издания и в Интернет. Чем легче сам процесс создания, тем большее число разработчиков начинает производить подобные приложения. Создателями электронных изданий становятся и книжные издательства (т.е владельцы информации) и журналисты, выпускающие электронные версии периодических изданий, и, наконец, преподаватели. Промежуточное положение занимают группы, объединяющие владельцев информации и программистов.
Электронный учебник, как правило, представляет собой мультимедийный продукт и должен обеспечить эффективное обучение школьников и студентов в режиме самообразования и в режиме, при котором преподаватель от обычного инструктированного переходит к консультированию учащихся. Из этого следует, что учебник должен обеспечивать обучение студентов как по всему курсу, так и по отдельным темам. Каждый выделенный заранее смысловой фрагмент курса должен заканчиваться практическими и контрольными занятиями, а каждый большой раздел курса - тестовым занятием или зачетом.
В процессе разработки обучающей программы возникают следующие проблемы:
1.адаптация к уровню знаний и индивидуальным характеристикам обучаемых
2.повышение активности обучаемых на занятиях разработка оптимальных тестов для контроля знаний по всему материалу модуля
Все тексты готовятся с использованием современных программных средств, с учетом особенностей оформления текста: выделение заголовков, подзаголовков, определений, ключевых слов, перечислений, кроме этого вставка графического материала, который может содержать рисунки, графики, поясняющие ссылки, а также в соответствии с принципами цветового визуального восприятия информации и наглядности подачи материала. [59]
Характерные черты электронных изданий, созданных средствами прямого программирования: разнообразие стилей реализации (цветовая палитра, интерфейс, структура ЭУ, способ подачи материала и т.д.); сложность модификации и сопровождения; большие затраты времени и трудоемкость; отсутствие аппаратных ограничений, т.е. возможность создания ЭУ, ориентированного на имеющуюся в наличие техническую базу.
Инструментальные средства общего назначения (ИСОН) предназначены для создания ЭУ пользователями не являющимися квалифицированными программистами. ИСОН, применяемые при проектировании ЭУ, как правило, обеспечивают следующие возможности: формирование структуры ЭУ; ввод, редактирование и форматирования текста (текстовый редактор); подготовка статической иллюстративной части (графический редактор); подготовка динамической иллюстративной части (звуковых и анимационных фрагментов); подключение исполняемых модулей, реализованных с применением других средств разработки и др.
К достоинствам инструментальных средств общего назначения следует отнести: возможность создания ЭУ лицами, которые не являются квалифицированными программистами; существенное сокращение трудоемкости и сроков разработки ЭУ; невысокие требования к компьютерам и программному обеспечению. Вместе с тем ИСОН имеют ряд недостатков, таких как: далеко не дружественный интерфейс; меньшие, по сравнению с мультимедиа и гипермедиа системами, возможности; отсутствие возможности создания программ дистанционного обучения.
При создании электронных учебников обязательно должны использоваться мультимедийные устройства; мультимедиа означает объединение нескольких способов подачи информации - текст, неподвижные изображения (рисунки и фотографии), движущиеся изображения (мультипликация и видео) и звук (цифровой и MIDI) - в интерактивный продукт. Аудиоинформация включает в себя речь, музыку, звуковые эффекты. Наиболее важным вопросом при этом является информационный объем носителя. По сравнению с аудио видеоинформация представляется значительно большим количеством используемых элементов. Прежде всего, сюда входят элементы статического видеоряда, которые можно разделить на две группы: графика (рисованные изображения) и фото. К первой группе относятся различные рисунки, интерьеры, поверхности, символы в графическом режиме. Ко второй - фотографии и сканированные изображения. Динамический видеоряд практически всегда состоит из последовательностей статических элементов (кадров). Здесь выделяются три типовых элемента: обычное видео (около 24 фото в секунду), квазивидео (6-12 фото в секунду), анимация. Использование видеоряда в составе мультисреды предполагает решение значительно большего числа проблем, чем использование аудио. Среди них наиболее важными являются: разрешающая способность экрана и количество цветов, а также объем информации. [12]
Характерным отличием мультимедиа продуктов от других видов информационных ресурсов является заметно больший информационный объем, поэтому в настоящее время основным носителем этих продуктов является оптический диск CD-ROM стандартной емкостью 640 Мбайт. Для профессиональных применений существует ряд других устройств (CD-Worm, CD-Rewritaeble, DVD и др.), однако они имеют очень высокую стоимость.
Гипертекст - это способ нелинейной подачи текстового материала, при котором в тексте имеются каким-либо образом выделенные слова, имеющие привязку к определенным текстовым фрагментам. Таким образом, пользователь не просто листает по порядку страницы текста, он может отклониться от линейного описания по какой-либо ссылке, т.е. сам управляет процессом выдачи информации. В гипермедиа системе в качестве фрагментов могут использоваться изображения, а информация может содержать текст, графику, видеофрагменты, звук.
Использование гипертекстовой технологии удовлетворяет таким предъявляемым к учебникам требованиям, как структурированность, удобство в обращении. При необходимости такой учебник можно “выложить” на любом сервере и его можно легко корректировать. Но, как правило, им свойственны неудачный дизайн, компоновка, структура и т.д. В настоящее время существует множество различных гипертекстовых форматов (HTML, DHTML, PHP и др.).
Созданные продукты, как правило несут на себе отпечаток личных взглядов создателя. Так, например, если разработчиками электронного издания являются программисты, то в этом случае можно наблюдать недостаточное внимание к информации, к ее доставерности и качеству. Основное внимание здесь уделяется компьютерным эффектам или особым навигационным приемам, реализуемом в продукте. Достаточно взглянуть на характеристики компакт-дисков, наиболее часто представляемых в компьютерных изданиях и рекламных проспектах: на первом месте стоит объем записанной информации, количество иллюстраций, аудио - и видеофрагментов и их продолжительность. Данные о качестве информации обычно отсутствуют, в лучшем случае указывается, что продукт представляет собой электронную копию печатного издания.
Рассмотрим теперь вопросы, связанные с использованием электронных изданий в библиотечном деле. Наиболее значительным из них является указатель литературы по библиографическим источникам «Электронные издания» (2005-2006 гг.). Это пособие снабжено алфавитным каталогом авторов и предметным указателем. Электронные журналы, книги, приложения к печатным изданиям направляются в отраслевые и специализированные читальные залы. Для организации использования первоисточников в рабочую группу должен быть включен сотрудник отдела обслуживания. Многие базы данных (БД) применяются как для информационного обслуживания, так и для библиографических разысканий. Поскольку справочный аппарат БД совершеннее по сравнению даже с их печатными аналогами, то они позволяют проводить более сложные библиографические разыскания с использованием названия журнала, ключевых слов из названия публикации, а также получать сведения, отсутствующие в большинстве традиционных изданий (адрес автора, издателя).
Обеспеченность зарубежными источниками информации на машиночитаемых носителях значительно выше чем отечественными. Их ценность неизмеримо возрастает по мере сокращения подписки на библиографические издания и первоисточники. [58]
Состав БД и интенсивность их использования весьма неоднородны. Ядро библиографических БД составляют политематическая Science Citation Index Compact Disk Edition с достаточной ретроспективой (с 1991 г.) и отраслевые серии Current Contents (с 1993 г.). Дополнением к ним служат различные специализированные и отраслевые БД с различной хронологией. Эти базы пользуются популярностью, так как обеспечивают доступ к мировому информационному потоку при минимальных затратах сил и времени и одновременно при высокой оперативности. Гораздо меньше спрос на универсальные справочники (Ulrich's Plus, CD-ROM Directory), так как они представляют интерес для более узкого круга специалистов
При работе с полнотекстовыми БД возникает ряд трудностей: более сложное программное обеспечение, необходимость больших затрат времени пользователя для просмотра текста, языковой барьер, невозможность без специальных знаний по соответствующей отрасли ориентироваться в БД. В идеале их эксплуатацией должны заниматься специалисты, имеющие два образования: по информатике и по какой-либо из наук. По своей специфике они больше подходят для использования в отраслевых или специализированных читальных залах.
Автоматизация справочно-библиографического обслуживания началась по существу с введением в промышленную эксплуатацию электронного каталога (ЭК) ГПНТБ РАН. На этапе освоения справки по ЭК выполняли сотрудники Центра научной обработки документации - создатели каталога - и члены Межотдельской группы. [52]
Весомым дополнением к электронному каталогу служат электронные версии региональных указателей - продукция Отдела научной библиографии. Они облегчают поиск книг, статей из журналов и сборников о природе, экономике, науке и культуре региона. Пока функционирует только часть из них. С завершением этого проекта библиографы получат ценный инструмент для повышения оперативности и качества справочно-информационного обслуживания.
Большим шагом вперед в автоматизации справочно-библиографического обслуживания явилось применение информационно-правовой БД «Консультант Плюс». Ее использование, с одной стороны, позволяет ликвидировать малопроизводительный труд по ведению ручной картотеки, а с другой - предоставлять читателям виды и тексты документов, которые в традиционном режиме были практически недоступны. Все это, наряду с высокой оперативностью, значительно повышает эффективность работы библиографов. [13]
К сожалению, на этом исчерпывается перечень отечественных электронных источников информации. Очевидно, что малочисленность российских БД и справочников на машинных носителях затрудняют и библиографический, и информационный поиск, делая его малопроизводительным. Очень часто высококвалифицированным специалистам приходится выполнять чисто механическую работу, пролистывая десятки и даже сотни страниц.
Необходимы такие электронные каталоги, как Книжная летопись, Летопись журнальных статей, Летопись газетных статей на КОД, причем первую желательно иметь с начала ее издания, а две последних достаточно за последние 3 - 5 лет. Но самая высокая потребность, конечно же, в оперативной информации. Это Сводный каталог иностранных книг по естественным наукам и технике, Сводный бюллетень новых иностранных книг по общественным наукам. [14]
Повышая оперативность выполнения справок, способствуя экономии высококвалифицированного труда, перенос информации на машиночитаемые носители обеспечивает сохранность фонда, экономию библиотечного пространства, улучшение микроклимата (за счет отсутствия библиотечной пыли), предоставляет возможность одновременного использования одного источника несколькими потребителями, копирования нужных фрагментов текста, размножения информации в необходимом количестве экземпляров - иначе говоря, значительно повышает уровень справочно- библиографического обслуживания.
1.2 Понятие и организация электронных библиотек
Электронная библиотека с одной стороны выполняет функции традиционной библиотеки: предоставление информации читателю, с другой -выполняет роль, характерную для АИБС,- организация и хранение локальных и удаленных электронных ресурсов и доступа к ним на основе компьютерных и телекоммуникационных технологий.
В последнее время появляются различные множество толкований термина "Электронная библиотека". Обычно же под электронной библиотекой понимается информационная система, позволяющая надёжно сохранять и эффективно использовать разнообразные коллекции электронных документов.
Цели создания электронных библиотек:
· обеспечение сохранности печатного материала;
· создание условий для обеспечения большей доступности печатного материала, расширение информационных услуг;
· выравнивание уровней технологического развития учреждений, работающих на пользу обществу.
Фундаментом, основой, объединяющей традиционные и электронные библиотеки, является принцип обслуживания пользователей.
Функции электронной библиотеки отличаются от классических библиотечных. С формальной точки зрения существенная часть электронных ресурсов - есть копии печатных версий и в этом смысле электронная коллекция состоит из копий, а не из оригиналов, первоисточников. Электронная библиотека (ЭБ) на сегодняшний день вторична по отношению к традиционной классической библиотеке
Подетально рассмотрим структуру ЭБ:
1. Требование к электронным ресурсам: их должно быть много, нужно превзойти некую "критическую массу", что бы обеспечить привлекательность фондов для пользователя, как удаленных, так и локальных.
2. Требование к персональным компьютерам: их должно быть достаточное количество для создания необходимого количества рабочих мест.
3. Среда передачи данных - Интернет. Хорошее качество связи читателей с Интернет будет характеризовать работу библиотеки, кроме того Интернет может выступать как распределенное хранилище множества сетевых ресурсов.
4. Хорошо подготовленный теоретически и профессионально библиотечный работник, знающий не только библиотечное дело, но и владеющий навыками работа с компьютером, в среде Интернет.
Развитие электронной библиотеки идет по трем направлениям:
1. Совершенствование существующей системы электронных каталогов;
2. Формирование фонда электронных ресурсов;
3. Развитие сетевого доступа к ресурсам электронной библиотеки на территории вуза. [16]
По мере увеличения компьютеров предоставленных читателям для доступа к электронному каталогу возникла потребность расширить область информационных услуг. Одно из решений: создание сайта библиотеки .
Первым этапом создания подобного сайта является проведение детального анализа информационных потребностей его потенциальных посетителей. Следует сразу принять за правило, что сайт создается именно для читателей, а не для самих библиотекарей.
Существует ряд общих требований, которым должны отвечать виртуальные представительства библиотек. Все они базируются на общих критериях для web-серверов. К ключевым показателям качества web-серверов в настоящее время относятся:
· глубина содержания;
· простота навигации;
· стабильность информационных ресурсов;
· оперативность обновления информации;
· доступность для пользователей;
Информация, доступная с подобного сайта:
· Полезные советы читателям и рекомендации по пользованию библиотекой;
· Информация о новинках Электронной библиотеки;
· Сведения о доступных ресурсах в сети Интернет;
· Электронный каталог библиотеки и консорциума МАРС;
· Электронная библиотека
· Гостевая книга
· Коллекция Интернет-адресов
· Сведения о библиотеке, режиме работы, правила пользования, сведения о фондах и каталогах.
Помимо собственно информации о библиотеке и ее ресурсах, весьма ценным является представление перечня ссылок на наиболее богатые в информационном отношении источники с других серверов.
Основа любой Электронной библиотеки является Электронный каталог и доступ к библиографическим базам данных, бюллетени новых поступлений, информация о текущих событиях в библиотеке: конференциях, книжных выставках. [18] Создается коллекция электронных книг и статей -собственно сама электронная библиотека.
Программно-аппаратная реализация электронной библиотеки базируется на технологии клиент-сервер, web-технологиях. Информационно-ресурсные составляющие электронной библиотеки формируется по двухуровневой схеме:
1. уровень ресурсов соответствует первоисточникам - это фонд электронных документов - файловое хранилище, к которому обеспечен онлайновый доступ;
2. уровень - электронные ресурсы со вторичной информацией о первоисточниках: библиографические базы данных, которые составляют информационно-поисковый аппарат электронной библиотеки.
Доступ к электронному фонду осуществляется с помощью поискового аппарата: имеется возможность контекстного поиска по рубрикам.
Основной критерий отбора книг для конверсии печатного материала в электронный формат - это недоступность их для читателя.
Конверсия поврежденных, ветхих книг - самый эффективный способ обеспечения сохранности, широкого и удобного доступа, компактного хранения. Оцифровка осуществляется сканированием печатных материалов. Материалы электронной библиотеки хранятся частично на компакт дисках, частично доступны через ЛВС с локального web-сервера. [21]
1.3 Современные системно-технологические тенденции развития электронных библиотек
Существующие в настоящее время и разрабатываемые новые системы электронных библиотек характеризуются большим разнообразием поддерживаемых в них информационных ресурсов, способов организации их коллекций, функциональными возможностями пользовательских интерфейсов, архитектурных особенностей этих систем и других их технологических характеристик. Не случайно поэтому, что в разработках информационных систем этой категории востребован практически весь спектр ключевых технологий управления информацией, созданных научно-техническим сообществом и индустрией программного обеспечения в области баз данных, текстового поиска, Всемирной паутины и Интернет.
Действительно, Web-технологии являются непременной составной частью технологического оснащения многих электронных библиотек. Web является средой «обитания» электронных библиотек, обеспечивающей доступ пользователей к их ресурсам. Электронные коллекции информационных ресурсов многих электронных библиотек организованы в виде Web-сайтов. Кроме того, Web является средой доступа к различным системам баз данных, содержащим метаданные и/или коллекции структурированных данных, непосредственно интересующих пользователей электронной библиотеки. Более того, Web может рассматриваться как уникальная гигантская общечеловеческая универсальная (по предметной области) электронная библиотека.
Вероятно, наиболее распространенным видом информационных ресурсов электронных библиотек являются тексты на естественных языках. Этим обусловлено широкое применение в таких системах технологий текстового поиска. Они используются при этом не только в системах, построенных по принципу традиционных текстовых систем, но и для поиска в коллекциях, организованных в виде вебсайтов, а также для поиска в глобальной среде Web. Технологии текстового поиска, созданные первоначально для использования в рамках централизованно администрируемых коллекций текстовых документов уже более десятилетия назад стали применяться в децентрализованной среде Web. В последнее время адаптированные к Web технологии текстового поиска возвращаются в централизованно администрируемую информационную среду. Так, компанией Яндекс разработана свободно распространяемая поисковая система для поиска ресурсов на платформе персональных компьютеров. Аналогичную систему создала компания Google. [22]
Нужно отметить также важную роль технологий баз данных в электронных библиотеках. В рамках электронных библиотек используются СУБД, основанные на различных моделях данных -- реляционные, объектные, объектно-реляционные, XML-ориентированные системы. Управляемые ими базы данных поддерживают в электронных библиотеках разнообразные коллекции структурированных данных и обеспечивают эффективный доступ к ним. Это, например, данные, полученные в результате научных экспериментов, наблюдений и измерений, компьютерного моделирования реальных процессов, экономическая статистика и т.п. Системы баз данных обеспечивают в электронных библиотеках поддержку разнообразных структурированных метаданных (например, классификаторов, каталогов, тезаурусов, словарей и др.). Создание XML-ориентированных систем баз данных позволило поддерживать в таких системах слабоструктурированные и структурированные XML-данные. Помимо этого, целый ряд коммерческих СУБД позволяет еще с середины 90-х годов хранить текстовые документы, осуществлять их полнотекстовое индексирование и на этой основе осуществлять поиск хранимых текстовых документов по элементам их содержания. [23]
Все перечисленное показывает ключевую роль технологий управления информацией в электронных библиотеках. Развитие этих технологий обогащает функциональные возможности электронных библиотек. В свою очередь, возникающие в многочисленных разработках электронных библиотек различного назначения новые требования к технологиям управления информацией стимулируют их дальнейшее развитие.
Конечно же, сфера применения технологий управления информацией не ограничивается электронными библиотеками. Однако анализ наиболее значимых тенденций развития этого пласта информационных технологий, сформировавшихся и зарождающихся в последние годы, даст возможность оценить перспективы развития разработок в области электронных библиотек.
Создание Всемирной паутины, развитие информационных технологий, процессы формирования информационного общества -- все это стимулирует быстрый рост объема информационных ресурсов, поддерживаемых в информационных системах, в частности, и в электронных библиотеках. Темпы роста информационных ресурсов особенно интенсифицировались в последнее десятилетие. Именно в этот период сформировались указанные выше предпосылки. [25]
Достигнутые масштабы объема информационных ресурсов, генерируемых, хранимых и обращающихся в различных сферах жизнедеятельности, уже не позволяют обойтись перечнем единиц измерения, которые стали привычными и широко используются на практике -- биты, байты, килобайты (Kb), мегабайты (Mb), гигабайты (Gb), терабайты (Tb) и, наконец, петабайты (Pb). Введены в лексикон специалистов новые единицы измерения объема информации - экзабайт (Exabyte, Eb = 1K петабай-тов), зетабайт (Zettabyte, Zb = 1K экзабайтов) и йо-табайт (Yottabyte, Yb= 1Kзетабайтов).
Исследования, направленные на получение оценки объемов накопленных человечеством информационных ресурсов и темпов их ежегодного роста, проводятся в Калифорнийском университете (Беркли) в Школе управления информацией и информационных систем (School of Information Management and Systems) при поддержке компаний Microsoft, Intel, Hewlett-Packard и EMC.
В 1999 и 2002 гг. в рамках указанного проекта были получены оценки хранимых на машиночитаемых носителях информационных ресурсов, а также объемов потоков информации -- телефон, радио, TV, Интернет, печатных изданий и документооборота организаций. Объемы информации, представленной в аналоговом виде, для сопоставимости пересчиты-вались в объемы эквивалентной оцифрованной информации. По материалам этого проекта поддерживается «живой» документ в Web.
Приведем лишь несколько оценок, представленных в этом документе. В 2002 г. продуцировано около 5 Eb новой информации. Из них около 92% хранится на магнитных носителях. В период 1999-- 2002 гг. объем хранимой информации возрастал в среднем на 30% в год и за три года примерно удвоился. Объем оцифрованных информационных ресурсов Библиотеки Конгресса США мог бы составить 10 терабайтов. Примерно в 2 Pb можно оценить объем ресурсов всех университетских библиотек США. Объемы информационных ресурсов Web в 2002 г. могут быть приблизительно оценены следующим образом: стандартный гипермедийный Web ("Surface" Web) 167 Tb; «скрытый» Web (FTP-архивы и базы данных, доступные в среде стандартного Веб) - 92 Pb. [29]
Без сомнения, можно предполагать, что в составе этих гигантских объемов информационных ресурсов значительную долю составляют информационные ресурсы электронных библиотек. Так, например, чрезвычайно крупной коллекцией информационных ресурсов обладает прототип «цифровой Земли» - Alexandria Digital Earth Prototype (ADEPT) [13], разработанный в рамках проекта электронной библиотеки Alexandria совместно университетами в Санта Барбара и Лос-Анджелесе (Калифорния), Техническим научно-исследовательским институтом и университетом штата Джорджия (США). Другими крупными коллекциями информационных ресурсов обладают электронные библиотеки, созданные в области космического зондирования земной поверхности и экологического мониторинга.
В ряде источников отмечается характерный для многих областей научных исследований в последние годы экспоненциальный рост данных, полученных в результате научных экспериментов, наблюдений, измерений, компьютерного моделирования. Так, этот факт отмечается в области молекулярной биологии для последнего десятилетия. В астрономических исследованиях также имеют место высокие темпы роста объема данных, накапливаемых в обсерваториях. Объем этих данных примерно удваивается за период от шести двенадцати месяцев. Крупнейшими «генераторами» информационных ресурсов являются исследования в области физики частиц, проводимые в ряде крупных исследовательских центров (ЦЕРН, Стэн-фордский университет и др.). Как известно, именно потребности управления гигантскими объемами данных, которые генерируются на современных ускорителях, привели к рождению грид-технологий и концепции грида данных.
Возможности использования коммуникационной среды Интернет и Web-технологий в разработках электронных библиотек и других информационных систем стимулировали процессы распределения и глобализации как формирования коллекций информационных ресурсов, так и доступа к ним. Глобальный доступ к информационным ресурсам системы в любой точке, где имеется доступ в Интернет, и в любое время является одним из необходимых условий отнесения такой информационной системы к категории систем, которые принято называть электронными библиотеками.
Наряду с электронными библиотеками, коллекции информационных ресурсов которых администрируются централизованно, создаются такие электронные библиотеки, коллекции которых поддерживаются во множестве автономно формируемых и администрируемых децентрализованным образом источников, доступных в глобальной среде. [30]
Примерами крупных электронных библиотек такого вида являются международная электронная библиотека по общественным наукам RePec и выступающая в ней в качестве одного из источников информационных ресурсов, а также и в виде крупной самостоятельной научной электронной библиотеки Отделения общественных наук РАН, отечественная система Соционет.
К электронным библиотекам рассматриваемого вида можно отнести и другие многочисленные системы регионального, национального и международного уровня, например, корпоративные библиотечные системы. К их числу относятся, в частности, крупнейшая международная система OCLC WorldCat, а также отечественная автоматизированная система Российского сводного каталога по научно-технической литературе.
В электронных библиотеках рассматриваемого вида и в других информационных системах используются различные подходы и методы интеграции информационных ресурсов.
Важной тенденцией последнего десятилетия в развитии технологий управления информацией стала интеграция таких технологий в реализациях многочисленных конкретных систем. Наряду с информационными системами вообще и системами электронных библиотек, в частности, основанными на каком-либо одном из пластов технологий управления информацией (технологии баз данных, Web-технологии, технологии текстовых систем) имеются многочисленные примеры совместного использования различных сочетаний этих технологий в рамках одной системы. [31]
Многие организации стали обладать источниками структурированных данных наряду с текстовыми системами. Стремление к упрощению технологических процессов в организации в таких ситуациях и необходимость интеграции информационных ресурсов привели к производству СУБД, способных поддерживать наряду со структурированными данными также и текстовые документы и выполнять их поиск по запросам пользователей. Развитыми средствами текстового поиска обладают в настоящее время многие серверы баз данных, например, DB2 (IBM), Oracle (Oracle Corp.), SQL Server (Microsoft Corp.) и др.
Другое развивающееся направление интеграции технологий управления информационными ресурсами -- это интеграция технологий баз данных и Web-технологий. Доступность коммуникационных возможностей Интернет и комфортный доступ пользователей в среду Web с помощью легко осваиваемых программ просмотра - Web-браузеров - стимулировали обеспечение удаленного доступа к базам данных в этой среде многих пользователей без необходимости разработки специальных средств пользовательского интерфейса. Разработки новой технологической платформы Web, основанной на языке XML, привели к созданию нового класса систем баз данных, называемых XML-ориентированными системами. Разработка технологий семантического Web и создание широко признанных стандартных средств описания онтологий создают предпосылки для решения одной из важных перспективных задач развития технологий баз данных -- создание пользовательских интерфейсов в системах баз данных, основанных на онтологиях предметной области системы. Актуальность решения этой задачи была отмечена на состоявшейся в июне 2003 году Лоуэлл-ской дискуссии (штат Массачусетс, США) о перспективах развития технологий баз данных, в которой участвовал ряд крупнейших специалистов в области технологий баз данных.
Развитые комплексы инструментальных средств систем баз данных, соответствующих стандартам платформы XML, поддерживаются в настоящее время SQL-серверами баз данных компаний Oracle, IBM, Microsoft и других поставщиков программного обеспечения систем баз данных. Углублению интеграции технологий баз данных и Web-технологий способствует также завершенная в 2003 году ISO разработка новой версии стандарта объектно-реляционного языка запросов для систем баз данных SQL-2003. В составе этого стандарта имеется компонент SQL/XML, обеспечивающий интеграцию технологий SQL-баз данных и XML-технологий. [32]
Нужно отметить также еще одно активно развиваемое направление интеграции технологий управления информационными ресурсами. Оно связано с Web-технологиями и технологиями текстового поиска. После создания Всемирной паутины и интенсивного наращивания ее информационных ресурсов стало ясно, что навигационный доступ к информационным ресурсам, который обеспечивается технологиями этой системы, не может эффективно удовлетворять информационные потребности пользователей. Для решения этой проблемы в Web начали использоваться традиционные технологии текстового поиска. Стали создаваться поисковые машины Web, которые сегодня активно используются многими миллионами пользователей этой гигантской электронной библиотеки.
Сегодняшние версии таких систем радикально отличаются от ранних их версий функциональными возможностями, учитывают особенности поиска ресурсов в Web, существенно отличающиеся от условий поиска в традиционных системах текстового поиска. Действительно, в отличие от традиционных систем текстового поиска, в Web нет централизованного администрирования информационными ресурсами, не поддерживаются метаданные коллекций, существенную роль играют взаимосвязи между документами с помощью гиперссылок, огромные объемы пространства поиска, высокая динамичность информационных ресурсов - изменчивость состава коллекции и отдельных документов (вебстраниц). При поиске в Web необходимо учитывать также низкое качество документов, связанное с легкостью публикации ресурсов в этой среде и отсутствием администрирования, многоязычность ресурсов, значительная избыточность коллекций - наличие многих копий документов, содержащихся на разных Web-сайтах и т.д.
В разработках информационных систем с использованием рассмотренных вариантов интеграции технологий управления информационными ресурсами каждый из базовых пластов таких технологий привносит свои специфические возможности в создаваемые системы. Их можно кратко охарактеризовать следующим образом:
1. На основе технологий баз данных обеспечиваются полнофункциональное управление структурированными данными, обработка запросов в терминах поддерживаемой модели данных и в транзакционном режиме, хранение традиционных текстовых ресурсов и XML-документов и эффективный доступ к ним в среде хранения с использованием техники индексирования данных и других методов прямого доступа.
2. Технологии текстового поиска привносят возможности поддержки естественных языков в качестве языков пользовательского интерфейса, использование различных подходов к структуризации содержания текстовых документов, представленных в системе, и пользовательских запросов, сформулированных на естественных языках.
3. Вклад Web-технологий состоит в обеспечении распределения информационных ресурсов между узлами Интернет и возможности децентрализованного управления ими, глобального доступа к информационным ресурсам в среде Web без предъявления высоких требований к квалификации пользователей благодаря существованию средств навигационного доступа, обеспечении поддержки семантики информационных ресурсов средствами технологий Web нового поколения, основанного на стандартах платформы XML (семантический web), и, соответственно, доступа к ним на семантическом уровне. [33]
Одним из следствий указанных тенденций интеграции технологий стало индустриальное производство ряда серверов баз данных, которые уже неправомерно, строго говоря, относить к продуктам указанной категории. Это, скорее, теперь уже технологические «комбайны». Действительно, такие, например, продукты, как сервер баз данных Oracle Database 10g или флагманский программный продукт для систем баз данных компании IBM -- сервер баз данных DB2 Universal Database v.8 - способны не только выполнять функции управления традиционными объектно-реляционными SQL-базами данных. Они могут эффективно оперировать текстовыми, пространственными и мультимедийными данными. Как уже отмечалось, они поддерживают также важнейшие стандарты платформы XML, управляют XML-ориентированными базами данных, обладают Web-интерфейсами, поддерживают технологии потоков работ, интеграции бизнес-процессов и выполняют многие другие функции.
В развитии технологий управления информационными ресурсами можно проследить также тенденцию конвергенции, идейного сближения разных пластов указанных технологий, их взаимного влияния, миграции проверенных временем идей и концепций из одних областей в смежные технологические области. Эта тенденция наиболее масштабно проявляется в разработках технологий Web нового поколения. Рассмотрим кратко, каким образом это происходит на примере стандартов платформы XML, где можно обнаружить воплощение многих идей, заимствованных из технологий баз данных.
Прежде всего, о значительном влиянии традиционных «базоданновых» подходов на эту область убедительно свидетельствует активное применение в ее техническом лексиконе таких терминов, как «модель данных», «база данных», «схема», «метаданные», «ограничение целостности», «язык запросов» и др. [42]
Как и в системах баз данных, в Web нового поколения предусматривается многоуровневая архитектура данных - различаются хранимые данные («хранимые сущности» XML, файлы -- физический уровень) и XML-документы (логический уровень). Физическое и логическое представления данных определяются по принципу самоописываемости с помощью встроенных метаданных, выраженными средствами XML-разметки. Для логического представления XML-данных может быть определена отчужденная от них схема (DTD и/или XML Schema). Более высокий уровень абстракции данных в архитектуре XML-данных -- семантический уровень. Для описания семантики XML-документов используются RDF-спецификации в терминах понятий, определяемых описанием онтологии предметной области. Онтологии описываются средствами языков RDFS или OWL, и это описание представляет онтологический уровень архитектуры.
Со структурной точки зрения, XML-документ является частным случаем записи базы данных CODASYL, представляющей собой иерархию элементов данных, которые могут быть простыми (атомарными), повторяющимися группами, в том числе, и с переменным числом повторений. В записи базы данных CODASYL, однако, могут содержаться производные (виртуальные) элементы данных. Более развитым является и множество типов данных, представляющих значения атомарных элементов данных записи.
Как и в технологиях баз данных, фундаментальным понятием в рассматриваемых Web-технологиях является понятие модели данных, хотя оно и интерпретируется в отличие от современной «базоданно-вой» трактовки не как инструмент моделирования данных, а как его результат - как структура XML-документа. В рамках многоуровневой архитектуры данных Web, основанного на платформе XML, поддерживается комплекс моделей данных (в «базоданновом» смысле). На логическом уровне используются альтернативные модели: (XML + XQuery), DOM, XPath, (XML + XSLT). На семантическом уровне предоставляется модель данных (RDF + SPARQL). Наконец, для уровня онтологий создается вариант полнофункциональной модели (OWL + язык правил). Язык SPARQL - это язык запросов консорциума W3C в терминах RDF-спецификации [42]. Язык правил для семантического Web находится в настоящее время в стадии разработки. Требования к одному из возможных претендентов на роль стандарта такого языка в настоящее время обсуждаются в W3C, и он получил название Rule Interchange Format (RIF). [49]
Приведенные факты, убедительно подтверждают наличие тенденции конвергенции технологий управления информационными ресурсами.
Хотя проблема интеграции данных в различных ее постановках привлекает внимание специалистов по управлению данными уже около трех десятилетий, до недавнего времени связанные с нею разработки все еще не выходили из стен исследовательских лабораторий. Однако в последние годы создание систем интеграции данных стало весьма актуальным направлением практических разработок информационных систем различного назначения, в том числе и электронных библиотек.
Под интеграцией данных в информационных системах понимается обеспечение единого унифицированного интерфейса для доступа пользователей к совокупности автономных источников данных, которые, как правило, обладают неоднородностью относительно некоторых их свойств.
Проблема интеграции данных характеризуется большим разнообразием постановок задач, подходов и методов, используемых для их решения. Обсуждению различных аспектов технологий интеграции данных посвящены многочисленные публикации в периодике, в трудах многих авторитетных научно-технических конференций.
В исследования систем интеграции данных чаще всего рассматриваются случаи интеграции структурированных данных либо комбинации структурированных и слабоструктурированных данных. При этом принимаются во внимание логическая (различие моделей данных источников, различие схем и т.п.) и/или семантическая неоднородность источников данных (различие онтологий). Состав источников интегрируемых данных может быть статическим и динамическим. Содержимое источников может быть неизменным или изменяемым.
Рассматриваются разнообразные способы интеграции -- материализованная и виртуальная, а также разные уровни интеграции - логическая и семантическая интеграция.
При использовании материализованной интеграции данных создается новый материализованный источник интегрированных данных, который используется автономно от породивших его источников. При необходимости его состояние приходится синхронизироваться с их актуальным состоянием.
В случае виртуальной интеграции, напротив, не предусматривается создание нового материализованного источника интегрированных данных, Система интеграции поддерживает виртуальный источник, который в любой момент времени «содержит» актуальные данные интегрируемых источников, и синхронизации его состояния не требуется. Права владельцев исходных интегрируемых источников сохраняются. Они продолжают автономно поддерживать их в своих интересах, предоставляя вместе с тем права доступа к их ресурсам пользователям системы интеграции данных в соответствии с установленным регламентом. Авторизованные пользователи системы интеграции получают непосредственный доступ только к виртуальному источнику, воплощаемому данной системой.
Используются различные подходы к построению архитектуры данных систем виртуальной интеграции. Наиболее популярной является архитектура посредника-адаптеров. Посредник - это функциональный компонент системы интеграции данных, который обеспечивает поддержку глобальной схемы для интегрированного виртуального источника и организует обработку пользовательских запросов, выраженных в терминах глобальной схемы, декомпозируя их на подзапросы, адресуемые соответствующих источникам, осуществляя композицию получаемых частичных результатов и выдачу полного результата пользователю. Адаптеры источников обеспечивают их «гомогенизацию», представляют информационные ресурсы источников однородным образом в терминах глобальной модели данных, принимают на обработку подзапросы от посредника, активизируют их обработку источником и возвращают полученные результаты посреднику.
На практике чаще всего используются две разновидности архитектуры данных систем виртуальной интеграции с посредником - Global as View и Local as View. Они различаются способами определения отображений между схемами данных источников и глобальной схемой.
Первая из них (Global as View) предусматривает определение глобальной схемы в терминах схем локальных источников. Такой подход более эффективен в случае, когда множество всех используемых источников предопределено. При использовании второй разновидности рассматриваемой архитектуры (Local as View) предполагается, что схема для каждого из локальных источников данных определяется в терминах глобальной схемы. Хотя в этом случае усложняется отображение пользовательских запросов в среду локальных источников данных, такой подход имеет важное достоинство -- он допускает динамичность состава множества интегрируемых источников данных. Новые источники данных могут подключаться к системе как на стадии разработки, так и на стадии функционирования.
Подобные документы
Понятие и виды электронных ресурсов муниципальных библиотек. Организация и использование электронных ресурсов в муниципальных библиотеках РФ. Анализ современного состояния и основные тенденции развития электронных ресурсов муниципальных библиотек.
курсовая работа [77,9 K], добавлен 16.05.2017Необходимость существования, критерии анализа и выбора электронных библиотек. Виды электронных библиотек - универсальные, электронные библиотеки периодических изданий и книг. Особенности распространения информационно-коммуникационных технологий.
курсовая работа [5,6 M], добавлен 04.05.2013Эволюция электронных библиотек (ЭБ) в Российской Федерации. Понятие, структура и основные направления деятельности ЭБ. Современные тенденции развития электронных библиотек РФ. Характеристика деятельности Президентской библиотеки им. Б.Н. Ельцина.
дипломная работа [2,4 M], добавлен 29.10.2017История появления электронных книг, их виды, характеристика. Использование электронных книг в библиотеках, их достоинства и недостатки. Формирование электронных библиотек и коллекций. Критерии предоставления электронных книг пользователям, хранение фонда.
курсовая работа [66,9 K], добавлен 05.02.2017Концепция развития образовательных электронных изданий и ресурсов. Разработка модуля электронного учебного издания на тему "Компьютерные сети. Принципы, технологии, протоколы". Представление страницы учебника в Paint. Теги для создания документа HTML.
курсовая работа [1,3 M], добавлен 17.10.2012Программные средства выполнения, обращения и хранения электронных документов на предприятии. Правовое и методическое обеспечение сохранности информационных ресурсов в организациях Республики Беларусь. Создание электронной регистрационной карточки.
реферат [25,4 K], добавлен 17.04.2015Библиотека, обладающая крупной распределенной коллекцией документов в электронной форме, доступной через сети передачи данных. Основные задачи электронных библиотек. Цели создания и концепция электронных библиотек. Профильность хранимой информации.
контрольная работа [26,0 K], добавлен 27.11.2012Виды информационных ресурсов и носителей электронной информации. Принципы ее аккумулирования, систематизации и сохранения в онлайн и оффлайн хранилищах. Электронные книги и их виды. Информационные технологии в краеведческой деятельности библиотек.
реферат [22,4 K], добавлен 06.12.2015Становление системы электронных библиотек и соответствующих информационных инфраструктур в современной России. Проблемы создания электронных каталогов. Организация массива данных и разработка программного кода поисковой машины на языке JavaScript.
курсовая работа [43,7 K], добавлен 03.09.2012Функциональное назначение информационных ресурсов. Использование push-технологий для распространении различного рода сведений среди пользователей Internet. Создание электронных библиотек даных и организация общих телеконференций во всемирной сети.
презентация [301,7 K], добавлен 06.05.2011