Принципы построения и проектирования базы данных
Понятие информации, автоматизированных информационных систем и банка данных. Общая характеристика описательной модели предметной области, концептуальной модели и реляционной модели данных. Анализ принципов построения и этапы проектирования базы данных.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 18.01.2012 |
Размер файла | 1,7 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Министерство образования и науки
Российской Федерации
Нижегородский государственный университет им. Н.И. Лобачевского
(ННГУ)
КУРСОВАЯ РАБОТА
По предмету: Информационные системы в экономике
На тему: Принципы построения и этапы проектирования базы данных
Содержание
ВВЕДЕНИЕ
1. Основные понятия и определения
2. Описательная модель предметной области
3. Концептуальные модели данных
4. Реляционная модель данных
ЗАКЛЮЧЕНИЕ
Список литературы
ВВЕДЕНИЕ
В современном мире информация приобретает все большее значение, объемы и размеры её увеличиваются. Необходимость систематизирования информации заставила человека изобретать различные схемы, каталоги, таблицы для удобного использования данных. Век компьютеризации предоставляет возможность быстрого и удобного систематизирования данных с помощью баз данных.
База данных является организованной на машинном носителе совокупностью взаимосвязанных данных и содержит сведения о различных сущностях одной предметной области - реальных объектах, процессах, событиях или явлениях. В настоящее время базы данных расцениваются как электронные хранилища информации, доступ к которым осуществляется с одного или нескольких компьютеров в зависимости от архитектуры. Работа с подобными автоматизированными информационными системами осуществляется при помощи систем управления базами данных - это программные средства, предназначенные для создания, наполнения, обновления и удаления баз данных.
Таким образом, данная тема весьма актуальна.
Целью данной курсовой работы является изучение принципов построения и этапов проектирования базы данных.
Перед нами стоит задача подробно рассмотреть описательную модель предметной области, концептуальные модели данных и реляционную модель данных.
1. Основные понятия и определения
Автоматизированные информационно-справочные системы (АИСС) в настоящее время получили весьма широкое распространение, что связано прежде всего со сравнительной простотой их создания и исключительно высоким эффектом от внедрения. Методологической основой информационных технологий, реализуемых в АИСС, являются концепции централизованной (в рамках разработки баз и банков данных) и распределенной (в рамках создания информационных сетей) обработки информации.
Под информацией будем понимать любые сведения о процессах и явлениях, которые в той или иной форме передаются между объектами материального мира (людьми, животными, растениями, автоматами и др.).
Если рассмотреть некоторый объект материального мира, информация о котором представляет интерес, и наблюдателя (в роли которого и выступают АИС), способного фиксировать эту информацию в определенной, понятной другим форме, то говорят, что в памяти (сознании) наблюдателя находятся данные, описывающие состояние объекта. Таким образом, данными будем называть формализованную информацию, пригодную для последующей обработки, хранения и передачи средствами автоматизации профессиональной деятельности.
Информацию в ЭВМ можно хранить в виде различных данных (числовых, текстовых, визуальных и т.п.). Более того, для описания одной и той же информации можно предложить различные варианты их состава и структуры. Иными словами, правомерно говорить о моделировании в АИС информации о некотором множестве объектов материального мира совокупностью взаимосвязанных данных.
Информационное обеспечение АИС -- совокупность единой системы классификации и кодирования информации; унифицированных систем документации и используемых массивов информации. Уткин В.Б. Основы автоматизации профессиональной деятельности.
В качестве главных задач создания информационного обеспечения АИС можно выделить, во-первых, определение состава и структуры данных, достаточно «хорошо» описывающих требуемую информацию, во-вторых, обоснование способов хранения и переработки данных с использованием ЭВМ.
Прежде чем определить понятие «банк данных», необходимо остановиться на другом ключевом понятии -- «предметная область».
Под предметной областью будем понимать информацию об объектах, процессах и явлениях окружающего мира, которая с точки зрения потенциальных пользователей должна храниться и обрабатываться в информационной системе. В этом определении особое внимание следует уделить важности роли потенциальных потребителей информационных ресурсов АИС. Именно этот аспект обусловливает и структуру, и основные задачи, и вообще целесообразность создания того или иного банка. В.Б. Уткин, К.В. Балдин. Информационные системы в экономике, с. 71
Банк данных -- ИС, включающая в свой состав комплекс специальных методов и средств для поддержания динамической информационной модели предметной области с целью обеспечения информационных потребностей пользователей. Дейт К. Введение в системы баз данных; Першиков В. И., Савинков В. М. Толковый словарь по информатике. Очевидно, что банк данных может рассматриваться как специальная обеспечивающая подсистема в составе старшей по иерархии АИС.
Поддержание динамической модели предметной области предусматривает не только хранение информации о ней и своевременное внесение изменений в соответствии с реальным состоянием объектов, но и обеспечение возможности учета изменений состава этих объектов (в том числе появление новых) и связей между ними (т.е. изменений самой структуры хранимой информации).
Обеспечение информационных потребностей (запросов) пользователей имеет два аспекта Системы управления базами данных и знаниями. Под ред. А. Н. Наумова. :
* определение границ конкретной предметной области и разработка описания соответствующей информационной модели;
* разработка банка данных, ориентированного на эффективное обслуживание запросов различных категорий пользователей.
С точки зрения целевой направленности профессиональной деятельности принято выделять пять основных категорий пользователей4: аналитики, системные программисты, прикладные программисты, администраторы, конечные пользователи.
Различают пользователей постоянных и разовых; пользователей-людей и пользователей-задач; пользователей с различным уровнем компетентности (приоритетом) и др., причем каждый класс пользователей предъявляет собственные специфические требования к своему обслуживанию (прежде всего с точки зрения организации диалога «запрос --ответ»). Так, например, постоянные пользователи, как правило, обращаются в банк данных с фиксированными по форме (типовыми) запросами; пользователи-задачи должны иметь возможность получать информацию из банка данных в согласованной форме в указанные области памяти; пользователи с низким приоритетом могут получать ограниченную часть информации и т.д. Наличие столь разнообразного состава потребителей информации потребовало включения в банк данных специального элемента -- словаря данных. Б. Уткин, К.В. Балдин. Информационные системы в экономике, с. 72
Уровень сложности и важности задач информационного обеспечения АИС в рамках рассматриваемой технологии определяет ряд основных требований к банку данных Уткин В. Б. Основы автоматизации профессиональной деятельности.:
* адекватность информации состоянию предметной области;
* быстродействие и производительность;
* простота и удобство использования;
* массовость использования;
* защита информации;
* возможность расширения круга решаемых задач.
(Отметим, что все названные требования можно предъявить и к любому финансовому банку.)
По сравнению с традиционным обеспечением монопольными файлами каждого приложения централизованное управление данными в банке данных имеет ряд важных преимуществ:
* сокращение избыточности хранимых данных;
* устранение противоречивости хранимых данных;
* многоаспектное использование данных (при однократном вводе);
* комплексная оптимизация (с точки зрения удовлетворения разнообразных, в том числе и противоречивых, требований «в целом»);
* обеспечение возможности стандартизации;
* обеспечение возможности санкционированного доступа к данным и др.
Все названные преимущества, по существу, связаны с такими основополагающими принципами концепции банка данных, как интеграция данных, централизация управления ими и обеспечение независимости прикладных программ обработки данных и самих данных.
Структура типового банка данных, удовлетворяющего предъявляемым требованиям, представлена на рис. 1.1.
Рис. 1.1. Основные компоненты банка данных
Подробнее остановимся на составляющих банка данных, представляющих наибольший интерес.
База данных -- совокупность специальным образом организованных (структурированных) данных и связей между ними. Иными словами, БД -- это так называемое датологическое (от англ. data -- данные) представление информации о предметной области. Если в состав банка данных входит одна БД, банк принято называть локальным; если БД несколько -- интегрированным.
Словарь данных предназначен для хранения единообразной и централизованной информации обо всех ресурсах данных конкретного банка:
* об объектах, их свойствах и отношениях для данной ПО;
* данных, хранимых в БД (наименование, смысловое описание, структура, связи и т.п.);
* возможных значениях и форматах представления данных;
* источниках возникновения данных;
* кодах защиты и разграничении доступа пользователей к данным и т. п.
Система управления базами данных -- специальный комплекс программ и языков, посредством которого организуется централизованное управление БД и обеспечивается доступ к ним. Б. Уткин, К.В. Балдин. Информационные системы в экономике, с. 73
В состав любой СУБД входят языки двух типов:
* язык описания данных (с его помощью описываются типы данных, их структура и связи);
* язык манипулирования данными (его часто называют «язык запросов к БД»), предназначенный для организации работы с данными в интересах всех типов пользователей.
Администратор БД -- это лицо (группа лиц), реализующее управление БД. В этой связи сам банк данных можно рассматривать как автоматизированную систему управления БД. Функции администратора БД являются долгосрочными; он координирует все виды работ на этапах создания и применения банка данных. На стадии проектирования администратор БД выступает как идеолог и главный конструктор системы; на стадии эксплуатации он отвечает за нормальное функционирование банка данных, управляет режимом его работы и обеспечивает безопасность данных. Основные функции администратора БД Дейт К. Введение в системы баз данных; Уткин В. Б., Сазанович А.Н., Мдичарадзе В. Г. Информатика.:
* решать вопросы организации данных об объектах ПО и установления связей между этими данными с целью объединения информации о различных объектах; согласовывать представления пользователей;
* координировать все действия по проектированию, реализации и ведению БД; учитывать текущие и перспективные требования пользователей; следить, чтобы БД удовлетворяли актуальным потребностям;
* решать вопросы, связанные с расширением БД в связи с изменением границ ПО;
* разрабатывать и реализовывать меры по обеспечению защиты данных от некомпетентного их использования, от сбоев технических средств, по обеспечению секретности определенной части данных и разграничению доступа к ним;
* выполнять работы по ведению словаря данных; контролировать избыточность и противоречивость данных, их достоверность;
* следить за тем, чтобы банк данных отвечал заданным требованиям по производительности, т. е. чтобы обработка запросов выполнялась за приемлемое время;
* выполнять при необходимости изменения методов хранения данных, путей доступа к ним, связей между данными, их форматов; определять степень влияния изменений в данных на всю БД;
* координировать вопросы технического обеспечения системы аппаратными средствами, исходя из требований, предъявляемых БД к оборудованию;
* координировать работы системных программистов, разрабатывающих дополнительное программное обеспечение для улучшения эксплуатационных характеристик системы;
* координировать работы прикладных программистов, разрабатывающих новые прикладные программы, и выполнять их проверку и включение в состав ПО системы и т. п.
На рис. 1.2 представлен типовой состав группы администратора БД, отражающий основные направления деятельности специалистов.
Рис. 1.2. Типовой состав группы администратора БД
2. Описательная модель предметной области
Процесс проектирования БД является весьма сложным. По сути, он заключается в определении перечня данных, хранимых на физических носителях (магнитных дисках и лентах), которые достаточно полно отражают информационные потребности потенциальных пользователей в конкретной предметной области. Проектирование БД начинается с анализа предметной области и возможных запросов пользователей. В результате этого анализа определяется перечень данных и связей между ними, которые адекватно--с точки зрения будущих потребителей -- отражают предметную область. Завершается проектирование БД определением форм и способов хранения необходимых данных на физическом уровне.
Весь процесс проектирования БД можно разбить на ряд взаимосвязанных этапов, каждый из которых обладает своими особенностями и методами проведения. На рис. 2.1 представлены типовые этапы.
Рис. 2.1. Этапы проектирования БД
На этапе инфологического (информационно-логического) проектирования осуществляется построение семантической модели, описывающей сведения из предметной области, которые могут заинтересовать пользователей БД. Семантическая модель -- представление совокупности о предметной области понятий в виде графа, в вершинах которого расположены понятия, в терминальных вершинах -- элементарные понятия, а дуги представляют отношения между понятиями.
Сначала из объективной реальности выделяется предметная область, т. е. очерчиваются ее границы. Логический анализ выделенной предметной области и потенциальных запросов пользователей завершается построением инфологической модели -- перечня сведений об объектах предметной области, которые необходимо хранить в БД, и связях между ними.
Анализ информационных потребностей потенциальных пользователей имеет два аспекта: определение собственно сведений об объектах предметной области; анализ возможных запросов к БД и требований по оперативности их выполнения.
Анализ возможных запросов к БД позволяет уточнить связи между сведениями, которые необходимо хранить.
Хранение большого числа связей усложняет БД и приводит к увеличению памяти ЭВМ, но часто существенно ускоряет поиск нужной информации. Поэтому разработчику БД (администратору БД) приходится принимать компромиссное решение, причем процесс определения перечня хранимых связей, как правило, имеет итерационный характер. Б. Уткин, К.В. Балдин. Информационные системы в экономике, с. 74
Этап датологического проектирования подразделяется на логическое (построение концептуальной модели данных) и физическое (построение физической модели) проектирование.
Главной задачей логического проектирования является представление выделенных на предыдущем этапе сведений в виде данных в форматах, поддерживаемых выбранной СУБД.
Задача физического проектирования -- выбор способа хранения данных на физических носителях и методов доступа к ним с использованием возможностей, предоставляемых СУБД.
Инфологическая модель «сущность--связь» (entity-relationship model; ER-model) П.Чена представляет собой описательную (неформальную) модель предметной области, семантически определяющую в ней сущности и связи. Саукап Р. Проектирование реляционных систем баз данных.
Относительная простота и наглядность описания предметной области позволяет использовать ее в процессе диалога с потенциальными пользователями с самого начала инфологического проектирования. Построение инфологической модели П.Чена, как и любой другой модели, является творческим процессом, поэтому единой методики ее создания нет. Однако при любом подходе к построению модели используют три основных конструктивных элемента: сущность, атрибут, связь.
Сущность -- это собирательное понятие некоторого повторяющегося объекта, процесса или явления окружающего мира, о котором необходимо хранить информацию в системе. Сущность может определять как материальные (например, «студент», «грузовой автомобиль» и т.п.), так и нематериальные объекты (например, «экзамен», «проверка» и т.п.). Главной особенностью сущности является то, что вокруг нее сосредоточен сбор информации в конкретной предметной области. Тип сущности определяет набор однородных объектов, а экземпляр сущности -- конкретный объект в наборе. Каждая сущность в модели П.Чена именуется. Для идентификации конкретного экземпляра сущности и его описания используется один или несколько атрибутов.
Атрибут -- это поименованная характеристика сущности, которая принимает значения из некоторого множества значений. Спортак М., Паппас Ф. Компьютерные сети и сетевые технологии. Например, у сущности «студент» могут быть атрибуты «фамилия», «имя», «отчество», «дата рождения», «средний балл за время обучения» и т. п.
Связи в инфологической модели выступают в качестве средства, с помощью которого представляются отношения между сущностями, имеющими место в предметной области. При анализе связей между сущностями могут встречаться бинарные (между двумя сущностями) и в общем случае n-арные (между п сущностями) связи. Например, сущности «отец», «мать» и «ребенок» могут находиться в 3-арном отношении «семья» («является членом семьи»).
Связи должны быть поименованы; между двумя типами сущностей могут существовать несколько связей.
Наиболее распространены бинарные связи. Учитывая, что любую n-арную связь можно представить в виде нескольких бинарных, подробнее остановимся именно на таких связях между двумя типами сущностей, устанавливающими соответствие между множествами экземпляров сущностей. Б. Уткин, К.В. Балдин. Информационные системы в экономике, с. 75
Различают четыре типа связей:
* один к одному (1: 1);
* один ко многим (1: М);
* многие к одному (М: 1);
* многие ко многим (М: N).
Связь один к одному определяет такой тип связи между типами сущностей А и В, при котором каждому экземпляру сущности А соответствует один и только один экземпляр сущности В, и наоборот. Таким образом, имея некоторый экземпляр сущности А, можно однозначно идентифицировать соответствующий ему экземпляр сущности В, а по экземпляру сущности В -- экземпляр сущности А. Например, связь типа 1: 1 «имеет» может быть определена между сущностями «автомобиль» и «двигатель», так как на конкретном автомобиле может быть установлен только один двигатель и один двигатель, естественно, нельзя установить сразу на несколько автомобилей.
Связь один ко многим определяет такой тип связи между типами сущностей А и В, для которой одному экземпляру сущности А может соответствовать 0, 1 или несколько экземпляров сущности В, но каждому экземпляру сущности В соответствует один экземпляр сущности А. При этом однозначно идентифицировать можно только экземпляр сущности А по экземпляру сущности В. Примером связи типа 1 : М является связь «учится» между сущностями «учебная группа» и «студент». Для такой связи, зная конкретного студента, можно однозначно идентифицировать учебную группу, в которой он учится, или, зная учебную группу, можно определить всех обучающихся в ней студентов.
Связь многие к одному по сути эквивалентна связи один ко многим. Различие заключается лишь в том, с точки зрения какой сущности (А или В) данная связь рассматривается.
Связь многие ко многим определяет такой тип связи между типами сущностей А и В, при котором каждому экземпляру сущности А может соответствовать 0, 1 или несколько экземпляров сущности В, и наоборот. При такой связи, зная экземпляр одной сущности, можно указать все экземпляры другой сущности, относящиеся к исходному, т. е. идентификация сущностей неуникальна в обоих направлениях. В качестве примера такой связи можно рассмотреть связь «изучает» между сущностями «учебная дисциплина» и «учебная группа». Б. Уткин, К.В. Балдин. Информационные системы в экономике, с. 74
Реально все связи являются двунаправленными, т.е., зная экземпляр одной из сущностей, можно идентифицировать (однозначно или многозначно) экземпляр (экземпляры) другой сущности. В некоторых случаях целесообразно рассматривать лишь однонаправленные связи между сущностями в целях экономии ресурсов ЭВМ. Возможность введения таких связей полностью определяется информационными потребностями пользователей. Различают простую и многозначную однонаправленные связи, которые являются аналогами связей типа 1: 1 и 1 : М с учетом направления идентификации. Так, для простой однонаправленной связи «староста» («является старостой») между сущностями «учебная группа» и «студент» можно, зная учебную группу, однозначно определить ее старосту, но, зная конкретного студента, нельзя сказать, является ли он старостой учебной группы. Примером многозначной однонаправленной связи служит связь между сущностями «пациент» и «болезнь», для которой можно для каждого пациента можно указать его болезни, но нельзя выявить всех обладателей конкретного заболевания.
Введение однонаправленных связей означает, что в результате анализа потенциальных запросов потребителей установлено, что потребности в информации, аналогичной приведенной в двух последних примерах, у пользователей не будет (и они не будут формулировать соответствующие запросы к БД).
Графически типы сущностей, атрибуты и связи принято изображать прямоугольниками, овалами и ромбами соответственно. На рис. 2.2 представлены примеры связей различных типов; на рис. 2.3 и 2.4 -- фрагменты инфологических моделей «студенты» (без указания атрибутов) и «учебный процесс факультета».
Рис. 2.2 Примеры связей между сущностями:
а - двунаправленные связи; б - однонаправленная связь
Рис. 2.3. Фрагмент ER-модели «Студенты»
Рис. 2.4. Фрагмент ER-модели «Учебный процесс факультета»
Несмотря на то что построение инфологической модели есть процесс творческий, можно указать два основополагающих правила, которыми следует пользоваться всем проектировщикам БД Дейт К. Введение в системы баз данных; Саукап Р. Проектирование реляционных систем баз данных.:
* при построении модели должны использоваться только три типа конструктивных элементов: сущность, атрибут, связь;
* каждый компонент информации должен моделироваться только одним из приведенных выше конструктивных элементов для исключения избыточности и противоречивости описания.
Моделирование предметной области начинают с выбора сущностей, необходимых для ее описания. Каждая сущность должна соответствовать некоторому объекту (или группе объектов) предметной области, о котором в системе будет накапливаться информация. Существует проблема выбора конструктивного элемента для моделирования той или иной «порции» информации, что существенно затрудняет процесс построения модели. Так, информация о том, что некоторый студент входит в состав учебной группы, можно в модели представить:
* как связь: «входит в состав» для сущностей «студент» и «учебная группа»;
* как атрибут: «имеет в составе «студента» сущности «учебная группа»;
* как сущность: «состав учебной группы».
В этих случаях приходится рассматривать несколько вариантов и с учетом информационных потребностей пользователей разбивать предметную область на такие фрагменты, которые, с их точки зрения, представляют самостоятельный интерес. Б. Уткин, К.В. Балдин. Информационные системы в экономике, с. 77
При моделировании предметной области следует обращать внимание на существующий в ней документооборот. Именно документы, циркулирующие в предметной области, должны являться основой для формулирования сущностей. Это связано с двумя обстоятельствами. Во-первых, эти документы, как правило, достаточно полно отражают информацию, которую необходимо хранить в БД, причем в виде конкретных данных. Во-вторых, создаваемая ИС должна предоставлять пользователям привычную для них информацию в привычном виде, что в последующем существенно облегчит ввод БД в эксплуатацию.
При описании атрибутов сущности необходимо выбрать ряд атрибутов, позволяющих однозначно идентифицировать экземпляр сущности. Совокупность идентифицирующих атрибутов называют ключом.
Помимо идентифицирующих используются и описательные атрибуты, предназначенные для более полного определения сущностей. Число атрибутов (их тип) определяется единственным образом -- на основе анализа возможных запросов пользователей. Существует ряд рекомендаций по работе с атрибутами, например, по исключению повторяющихся групп атрибутов (рис. 2.5). Все они направлены на улучшение качества инфологической модели.
Рис. 2.5. Исключение повторяющейся группы атрибутов
При определении связей между сущностями следует избегать связей типа М : N, так как они приводят к существенным затратам ресурсов ЭВМ. Устранение таких связей предусматривает введение других (дополнительных) элементов -- сущностей и связей. На рис. 2.6 приведен пример исключения связи «многие ко многим».
Рис. 2.6. Исключение связи типа М : N
Типовая последовательность работ (действий) по построению инфологической модели:
* выделение в предметной области сущностей;
* введение множества атрибутов для каждой сущности и выделение из них ключевых;
* исключение множества повторяющихся атрибутов (при необходимости);
* формирование связей между сущностями;
* исключение связей типа М: N (при необходимости);
* преобразование связей в однонаправленные (по возможности).
Помимо модели П.Чена, существуют и другие инфологические модели. Все они представляют собой описательные (неформальные) модели, использующие различные конструктивные элементы и соглашения по их использованию для представления в БД информации о предметной области. Иными словами, первый этап построения БД всегда связан с моделированием предметной области. Б. Уткин, К.В. Балдин. Информационные системы в экономике, с. 78
3. Концептуальные модели данных
В отличие от инфологической модели предметной области, описывающей по некоторым правилам сведения об объектах материального мира и связи между ними, которые следует иметь в БД, концептуальная модель описывает хранимые в ЭВМ данные и связи. В силу этого каждая модель данных неразрывно связана с языком описания данных конкретной СУБД.
По существу, модель данных -- это совокупность трех составляющих Дейт К. Введение в системы баз данных; Саукап Р. Проектирование реляционных систем баз данных.: типов структур данных, операций над данными, ограничений целостности.
Используя в качестве классификационного признака особенности логической организации данных, можно привести следующий перечень известных моделей:
* иерархическая модель данных;
* сетевая модель данных;
* реляционная модель данных;
* бинарная модель данных;
* семантическая сеть.
Рассмотрим основные особенности перечисленных моделей.
Иерархическая модель данных. Наиболее давно используемой (можно сказать классической) является модель данных, в основе которой лежит иерархическая структура типа дерева. К основным понятиям иерархической структуры относятся: уровень, элемент (узел), связь. Б. Уткин, К.В. Балдин. Информационные системы в экономике, с. 81
Узел - это совокупность атрибутов данных, описывающих некоторый объект. На схеме иерархического дерева узлы представляются вершинами графа.
Каждый узел на более низком уровне связан только с одним узлом, находящимся на более высоком уровне. Иерархическое дерево имеет только одну вершину (корень дерева), не подчиненную никакой другой вершине и находящуюся на самом верхнем (первом) уровне. Зависимые (подчиненные) узлы находятся на втором, третьем и т.д. уровнях. Количество деревьев в БД определяется числом корневых записей. К каждой записи БД существует только один (иерархический) путь от корневой записи. Каждому узлу структуры соответствует один сегмент, представляющий собой поименованный линейный кортеж полей данных. Каждому сегменту (кроме S1-корневого) соответствует один входной и несколько выходных сегментов. Каждый сегмент структуры лежит на единственном иерархическом пути, начинающемся от корневого сегмента (рис. 3.1). Разработка и эксплуатация автоматизированных информационных систем: учеб. пособие / Под ред. проф. Л.Г. Гагариной, с. 158
Рис. 3.1. Иерархическая модель данных
Достоинства такой модели несомненны: простота представления предметной области, наглядность, удобство анализа структур и простота их описания. К недостаткам следует отнести сложность добавления новых и удаления существующих типов записей, невозможность отображения отношений, отличающихся от иерархических, громоздкость описания и информационную избыточность.
Сетевая модель данных. В сетевой структуре при тех же основных понятиях (уровень, узел,связь) каждый элемент может быть связан с любым другим элементом. Сетевая модель СУБД во многом подобна иерархической: если в иерархической модели для каждого сегмента записи допускается только один входной сегмент при N выходных, то в сетевой модели допускается несколько входных сегментов наряду с возможностью наличия сегментов без входов с точки зрения иерархической структуры.
Графическое изображение структуры связей сегментов такого типа моделей представляет собой сеть. Сегменты данных в сетевых БД могут иметь множество связи с сегментами старшего уровня. Разработка и эксплуатация автоматизированных информационных систем: учеб. пособие / Под ред. проф. Л.Г. Гагариной, с. 160 На рис. 3.2 представлен пример структуры сетевой модели данных.
Рис. 3.2. Сетевая модель данных
По сравнению с иерархическими сетевые модели обладают рядом существенных преимуществ: возможность отображения практически всего многообразия взаимоотношений объектов предметной области, непосредственный доступ к любой вершине сети (без указания других вершин), малая информационная избыточность. Вместе с тем в сетевой модели невозможно достичь полной независимости данных -- с ростом объема информации сетевая структура становится весьма сложной для описания и анализа. Уткин В. Б., Сазанович А.Н., Мдичарадзе В. Г. Информатика.
Известно, что применение на практике иерархических и сетевых моделей данных в некоторых случаях требует разработки и сопровождения значительного объема кода приложения, что иногда может вызвать перегрузку ИС. MegaPlus: Электроника, компьютеры, связь.
Реляционная модель данных. В основе реляционной модели данных лежат не графические, а табличные методы и средства представления данных и манипулирования ими (рис. 3.3).
Рис. 3.3. Реляционная модель данных
В реляционной модели для отображения информации о предметной области используется таблица, называемая «отношением». Строка такой таблицы называется кортежем, столбец -- атрибутом. Каждый атрибут может принимать некоторое подмножество значений из определенной области -- домена. Райордан Р. Основы реляционных баз данных.
Табличная организация БД позволяет реализовать ее важнейшее преимущество перед другими моделями данных, а именно возможность использования точных математических методов манипулирования данными, и прежде всего аппарата реляционной алгебры и исчисления отношений. Уткин В. Б., Сазанович А.Н., Мдичарадзе В. Г. Информатика. К другим достоинствам реляционной модели можно отнести наглядность, простоту изменения данных и организации разграничения доступа к ним.
Основным недостатком реляционной модели данных является информационная избыточность, что ведет к перерасходу ресурсов ВС. Однако именно реляционная модель данных находит все более широкое применение в практике автоматизации информационного обеспечения профессиональной деятельности.
Подавляющее большинство СУБД, ориентированных на персональные ЭВМ, являются системами, построенными на основе реляционной модели данных -- так называемыми «реляционными» СУБД. Б. Уткин, К.В. Балдин. Информационные системы в экономике, с. 82
Бинарная модель данных. Это графовая модель, в которой вершины являются представлениями простых однозначных атрибутов, а дуги -- представлениями бинарных связей между атрибутами (рис. 3.4).
Рис. 3.4. Бинарное отношение
Бинарная модель не получила особо широкого распространения, но в ряде случаев находит практическое применение.
Так, в области ИИ уже давно ведутся исследования с целью представления информации в виде бинарных отношений. Рассмотрим тройку «объект -- атрибут -- значение». Тройка «Кузнецов -- возраст -- 20» означает, что возраст некоего Кузнецова равен 20 годам. Эта же информация может быть выражена, например, бинарным отношением ВОЗРАСТ. Понятие бинарного отношения положено в основу таких моделей данных, как, например, Data Semantics и DIAM II.
Бинарные модели данных обладают возможностью представления связей любой сложности (и это их несомненное преимущество), но вместе с тем их ориентация на пользователя недостаточна .
Семантическая сеть. Семантические сети как модели данных были предложены исследователями, работавшими над различными проблемами ИИ. Так же, как в сетевой и бинарной моделях, базовые структуры семантической сети могут быть представлены графом, множество вершин и дуг которого образует сеть. Однако семантические сети предназначены для представления и систематизации знаний самого общего характера . Уткин В. Б. Основы автоматизации профессиональной деятельности.
Таким образом, семантической сетью можно считать любую графовую модель (например, помеченный бинарный граф) при условии, что изначально четко определено, что обозначают вершины и дуги и как они используются.
Семантические сети являются богатыми источниками идей моделирования данных, чрезвычайно полезных в плане решения проблемы представления сложных ситуаций. Они могут быть использованы независимо или совместно с идеями, положенными в основу других моделей данных. Их интересной особенностью является то, что расстояние, измеренное на сети (семантическое расстояние или метрика), играет важную роль, определяя близость взаимосвязанных понятий. При этом предусмотрена возможность в явной форме подчеркнуть, что семантическое расстояние велико. Как показано на рис. 3.5, «СПЕЦИАЛЬНОСТЬ» соотносится с личностью «ПРЕПОДАВАТЕЛЬ», и в то же время «ПРЕПОДАВАТЕЛЮ» присущ «РОСТ». Взаимосвязь личности со специальностью очевидна, однако из этого не обязательно следует взаимосвязь «СПЕЦИАЛЬНОСТИ» и «РОСТА». Б. Уткин, К.В. Балдин. Информационные системы в экономике, с. 83
Рис. 3.5. Соотношение понятий в семантической сети
Следует сказать, что моделям данных типа семантической сети при всем присущем им богатстве возможностей при моделировании сложных ситуаций присуща усложненность и некоторая неэкономичность в концептуальном плане. Уткин В. Б. Основы автоматизации профессиональной деятельности.
4. Реляционная модель данных
Как уже было отмечено, в основе реляционной модели данных лежит их представление в виде таблиц, что в значительной степени облегчает работу проектировщика БД и -- в последующем -- пользователя в силу привычности и распространенности такого варианта использования информации. Данная модель была предложена Э.Ф.Коддом в начале 70-х гг. XX в., и вместе с иерархической и сетевой моделями составляет множество так называемых великих моделей. Можно сказать, что сегодня именно эта модель используется во всех наиболее распространенных СУБД.
Определение любой модели данных требует описания трех элементов:
* определение типов (структур) данных;
* определение операций над данными;
* определение ограничений целостности.
Сначала рассмотрим структуры данных и ограничения целостности, а затем более подробно остановимся на операциях реляционной алгебры. Б. Уткин, К.В. Балдин. Информационные системы в экономике, с. 84
Типы структур данных. Рассмотрение этого вопроса требует введения определений нескольких основных понятий.
Множество возможных значений некоторой характеристики объекта называется доменом (domain):
Например, в качестве домена можно рассматривать такие характеристики студента, как его фамилия, курс, рост и т.п.:
Dкурс = {1, 2, 3, 4, 5};
Dфамилия = {Иванов, Петров, Сидиров, …}
Dрост = {160, 161, 162, …, 190}.
Очевидно, что можно сопоставить понятия «атрибут» инфологической и «домен» реляционной моделей данных. Возможные значения характеристик объектов могут принимать числовые или текстовые значения, а их множества могут быть как конечными, так и бесконечными. Отметим, что в случае конечности домена можно организовать проверку явных ограничений целостности: в нашем примере домен Dpoст определяет, что все студенты должны иметь рост от 160 до 190 см, а номер курса не может превышать 5.
Вектор размерности k, включающий в себя по одному из возможных значений k доменов, называется кортежем (tuple). Для приведенного выше примера кортежами являются
(1, Иванов, 172);
(3, Сидоров, 181);
(5, Уткин, 184).
Если в кортеж входят значения всех характеристик объекта предметной области (т. е. атрибутов сущности инфологической модели), ему можно сопоставить такую типовую структуру данных, как запись (объектная запись). Б. Уткин, К.В. Балдин. Информационные системы в экономике, с. 84
Декартовым произведением k доменов называется множество всех возможных значений кортежей
D = D1D2…Dk.
Пусть для того же примера определены три домена:
D1 = {1, 4};
D2 = {Иванов, Петров};
D3 = {168, 181}.
Тогда их декартовым произведением будет множество D, состоящее из восьми записей:
При увеличении размерности любого из доменов увеличивается и размерность их декартова произведения. Так, если в первом домене определены три элемента D1 = {1, 4, 5}, декартово произведение имеет вид
Иными словами, декартово произведение -- множество всех возможных комбинаций элементов исходных доменов.
Наконец, важнейшее определение: отношением (relation) R, определенным на множествах доменов D1, D2, ..., Dk, называют подмножество их декартова произведения
R D1D2…Dk,
Элементами отношения являются кортежи. Отношение может моделировать множество однотипных объектов (сущностей), причем экземпляр сущности может интерпретироваться как кортеж. С помощью отношения можно моделировать и связи, в которых находятся объекты предметной области (сущности в ее инфологической модели). При этом кортеж такого отношения состоит из идентифицирующих атрибутов связываемых сущностей.
Таким образом, понятие «отношение» позволяет моделировать данные и связи между ними. В силу этого можно определить реляционную базу данных (РБД) как совокупность экземпляров конечных отношений.
Если учесть, что результат обработки любого запроса к РБД также можно интерпретировать как отношение (возможно, не содержащее ни одного кортежа), то возникает возможность построения ИС, основным инструментом которой будет алгебра отношений (реляционная алгебра). Любой запрос в такой системе может быть представлен в виде формулы, состоящей из отношений, объединенных операциями реляционной алгебры. Создав СУБД, обеспечивающую выполнение этих операций, можно разрабатывать И С, в которых любой запрос потребителя программируется формулой. Б. Уткин, К.В. Балдин. Информационные системы в экономике, с. 85
Ограничения целостности. Отношение может быть представлено таблицей, обладающей определенными свойствами (которые, по сути, и определяют внутренние ограничения целостности данных) Уткин В. Б., Сазанович А.Н., Мдичарадзе В. Г. Информатика.:
* каждая строка таблицы -- кортеж;
* порядок строк может быть любым;
* повторение строк не допускается;
* порядок столбцов в отношении фиксирован.
Понятие «отношение» весьма схоже с понятием «файл данных». Поэтому в дальнейшем будем использовать следующую терминологию: отношение -- файл; кортеж -- запись; домен -- поле. Идентификация конкретной записи файла осуществляется по ключу (набору полей, по значению которого можно однозначно идентифицировать запись). В файле можно определить несколько ключей. Один из них, включающий минимально возможное для идентификации записи число полей, называется первичным ключом.
Применительно к понятию «файл данных» внутренние ограничения целостности формулируются следующим образом:
* количество полей и их порядок в файле должны быть фиксированными (т. е. записи файла должны иметь одинаковые длину и формат);
* каждое поле должно моделировать элемент данных (неделимую единицу данных фиксированного формата, к которому СУБД может адресоваться непосредственно);
* в файле не должно быть повторяющихся записей.
СУБД, основанные на РБД, поддерживают и явные ограничения целостности. На практике они определяются зависимостями между атрибутами.
информация данные концептуальный проектирование
ЗАКЛЮЧЕНИЕ
Итак, подведем итоги.
База данных -- совокупность специальным образом организованных (структурированных) данных и связей между ними.
Система управления базами данных -- специальный комплекс программ и языков, посредством которого организуется централизованное управление БД и обеспечивается доступ к ним.
В состав любой СУБД входят языки двух типов:
* язык описания данных (с его помощью описываются типы данных, их структура и связи);
* язык манипулирования данными (его часто называют «язык запросов к БД»), предназначенный для организации работы с данными в интересах всех типов пользователей.
Проектирование БД начинается с анализа предметной области возможных запросов пользователей. Завершается проектирование БД определением форм и способов хранения необходимых данных на физическом уровне.
Весь процесс проектирования БД можно разбить на 2 этапа:
· этап инфологического проектирования осуществляется построение семантической модели, описывающей сведения из предметной области, которые могут заинтересовать пользователей БД. Семантическая модель - представление совокупности о предметной области понятий в виде графа, в вершинах которого расположены понятия, в терминальных вершинах - элементарные понятия, а дуги представляют отношения между понятиями.
· этап датологического проектирования подразделяется на логическое и физическое проектирование. Главной задачей логического проектирования является представление выделенных на предыдущем этапе сведений в виде данных в форматах, поддерживаемых выбранной СУБД. Задача физического проектирования -- выбор способа хранения данных на физических носителях и методов доступа к ним с использованием возможностей, предоставляемых СУБД.
Концептуальная модель описывает хранимые в ЭВМ данные и связи. В силу этого каждая модель данных неразрывно связана с языком описания данных конкретной СУБД.
Используя в качестве классификационного признака особенности логической организации данных, можно привести следующий перечень известных моделей:
* иерархическая модель данных. В ее основе лежит иерархическая структура типа дерева. К основным понятиям иерархической структуры относятся: уровень, элемент (узел), связь.
* сетевая модель данных. В сетевой структуре каждый элемент может быть связан с любым другим элементом.
* реляционная модель данных. В основе реляционной модели данных лежат табличные методы и средства представления данных и манипулирования ими.
* бинарная модель данных. Это графовая модель, в которой вершины являются представлениями простых однозначных атрибутов, а дуги -- представлениями бинарных связей между атрибутами.
* семантическая сеть. Семантической сетью можно считать любую графовую модель при условии, что изначально четко определено, что обозначают вершины и дуги и как они используются.
Автоматизированные информационно-справочные системы (АИСС) в настоящее время получили весьма широкое распространение, что связано прежде всего со сравнительной простотой их создания и исключительно высоким эффектом от внедрения. Методологической основой информационных технологий, реализуемых в АИСС, являются концепции централизованной и распределенной обработки информации.
Список литературы
1. Информационные системы в экономике: Учебник для студ. высш. учеб, заведений / В.Б. Уткин, К.В. Балдин. -- М.: Издательский центр «Академия», 2004. -- 288 с.
2. Разработка и эксплуатация автоматизированных информационных систем: учеб. пособие / Под ред. проф. Л.Г. Гагариной. - М.: ИД «ФОРУМ»: ИНФРА-М, 2007. - 384 с.: ил. - (Профессиональное образование).
3. Дейт К. Введение в системы баз данных. -- М.: Диалектика, 2000.
4. Першиков В. И., Савинков В. М. Толковый словарь по информатике. -- М.: Финансы и статистика, 2001.
5. Райордан Р. Основы реляционных баз данных. -- М.: Русская редакция, 2001.
6. Саукап Р. Проектирование реляционных систем баз данных. -- М.: Русская редакция, 2006.
7. Системы управления базами данных и знаниями / Под ред. А. Н. Наумова. -- М.: Финансы и статистика, 2005.
8. Спортак М., Паппас Ф. Компьютерные сети и сетевые технологии. -- Киев: ООО «ТИД «ДС», 2002.
9. Уткин В. Б. Основы автоматизации профессиональной деятельности. -- М.: РДЛ, 2001.
10. Уткин В. Б., Сазанович А.Н., Мдичарадзе В. Г. Информатика. -- М.: РДЛ, 2007.
11. MegaPlus: Электроника, компьютеры, связь.2010. -- № 5.
Размещено на Allbest.ru
Подобные документы
Процесс проектирования базы данных на основе принципов нормализации. Применение инфологической модели на втором этапе проектирования. Семантика предметной области в модели базы данных. Оформление, выдача и обмен паспорта. Модель "сущность-связь".
курсовая работа [67,9 K], добавлен 27.02.2009Построение концептуальной модели, процесс моделирования смыслового наполнения базы данных. Основные компоненты концептуальной модели. Построение реляционной модели. Целостность данных в реляционной базе. Нормализация. Проектирование базы данных в ACCESS.
курсовая работа [1,8 M], добавлен 29.10.2008Анализ предметной области, этапы проектирования автоматизированных информационных систем. Инструментальные системы разработки программного обеспечения. Роль CASE-средств в проектировании информационной модели. Логическая модель проектируемой базы данных.
курсовая работа [410,6 K], добавлен 21.03.2011Сущность базы данных. Процесс построения концептуальной модели. Построение реляционной модели, создание ключевого поля. Процесс нормализации. Проектирование базы данных в ACCESS. Порядок создание базы данных. Создание SQL запросов и работа в базе данных.
курсовая работа [185,6 K], добавлен 08.11.2008Особенности разработки инфологической модели и создание структуры реляционной базы данных. Основы проектирования базы данных. Разработка таблиц, форм, запросов для вывода информации о соответствующей модели. Работа с базами данных и их объектами.
курсовая работа [981,4 K], добавлен 05.11.2011Базы данных - важнейшая составная часть информационных систем. Проектирование базы данных на примере предметной области "Оргтехника". Сбор информации о предметной области. Построение информационно-логической модели данных. Разработка логической структуры.
курсовая работа [318,6 K], добавлен 24.12.2014Составление схемы концептуальной модели данных. Разработка структуры реляционной базы данных и интерфейса пользователя. Особенности главных этапов проектирования базы данных. Способы реализации запросов и отчетов. Специфика руководства пользователя.
курсовая работа [186,9 K], добавлен 18.12.2010Понятие и внутренняя структура, стадии и объекты процесса проектирования баз данных. Требования, предъявляемые к данному процессу. Ограниченность реляционной модели. Группы CASE-средств. Анализ предметной области: функциональный и объектный подходы.
презентация [114,6 K], добавлен 19.08.2013Изучение реляционной модели данных. Выявление потребности задач в данных и определение состава и структуры информационных объектов. Построение концептуальной модели предметной области. Создание форм, запросов и отчетов с помощью конструктора запросов.
курсовая работа [6,3 M], добавлен 09.10.2021Разработка концептуальной модели базы данных "Чемпионат авто": описание предметной области, каталог задач, описание таблиц, схема данных, ER-диаграмма. Проектирование реляционной модели "Спортивный комплекс". Реализация и результат работы базы данных.
курсовая работа [3,7 M], добавлен 14.06.2011