Аналитическая обработка данных (OLAP). Информационное хранилище данных. Модели данных, используемые для построения информационных хранилищ
Понимание хранилища данных, его ключевые особенности. Основные типы хранилищ данных. Главные неудобства размерного подхода. Обработка информации, аналитическая обработка и добыча данных. Интерактивная аналитическая обработка данных в реальном времени.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | реферат |
Язык | русский |
Дата добавления | 16.12.2016 |
Размер файла | 849,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Федеральное агентство по образованию
Государственное образовательное учреждение высшего профессионального образования
“Санкт-Петербургский государственный инженерно-экономический университет”
РЕФЕРАТ
“Аналитическая обработка данных (OLAP). Информационное хранилище данных. Модели данных, используемые для построения информационных хранилищ”
по дисциплине “Информатика”
Руководитель О.Д.Мердина
Исполнитель Е.В.Крюкова
Группа С-1503
Санкт-Петербург
2015
ОГЛАВЛЕНИЕ
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ
ИНФОРМАЦИОННОЕ ХРАНИЛИЩЕ ДАННЫХ.
понимание хранилища данных
КЛЮЧЕВЫЕ ОСОБЕННОСТИ ХРАНИЛИЩА ДАННЫХ
ХРАНИЛИЩЕ ДАННЫХ ПРИЛОЖЕНИЯ
типы хранилищ данных
ПРЕИМУЩЕСТВА
ХРАНЕНИЕ ИНФОРМАЦИИ
главные неудобства размерного подхода - СЛЕДУЮЩЕЕ:
АНАЛИТИЧЕСКАЯ ОБРАБОТКА ДАННЫХ (OLAP).
ПОНЯТИЕ OLAP
ОСНОВЫ OLAP
ПРЕИМУЩЕСТВА ПРИМЕНЕНИЯ OLAP:
ТИПЫ OLAP:
1. MOLAP:
2.ROLAP:
3. HOLAP:
УСЛОВИЯ OLAP:
OLAP FASMI ТЕСТ
КУБ OLAP
МОДЕЛИ ДАННЫХ, ИСПОЛЬЗУЕМЫЕ ДЛЯ ПОСТРОЕНИЯ ИНФОРМАЦИОННЫХ ХРАНИЛИЩ.
СППР
ВВЕДЕНИЕ НОВЫХ ИСХОДНЫХ ДАННЫХ
ПРЕИМУЩЕСТВА СППР
НЕДОСТАТКИ
OLTP (ONLINE TRANSACTION PROCESSING).
ФУНКЦИИ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ OLTP ВКЛЮЧАЮТ:
ДЛЯ OLTP ХАРАКТЕРНЫ:
ПРЕИМУЩЕСТВА СЕКЦИОНИРОВАНИЯ ДЛЯ OLTP -СРЕД:
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ
ВВЕДЕНИЕ
10 лет назад технологией мало кто пользовался, а сегодня она получила широкое применение. Например, операции в банке были частично проведены "на бумажках", и важная информация хранилась сотрудниками "в головах". Было необходимо разработать комплекс программ для расчета показателей регламентированной отчетности, быстроты и четкости разработки новых продуктов и оперативности реагирования на любые изменения в спросе на банковские услуги. Целью создания было полномасштабное единое корпоративное хранилище данных, которое отвечало бы требованиям для подготовки отчетов, предоставления всех видов отчетов в контролирующие органы и являлось бы мощным аналитическим инструментом для ускорения роста бизнеса. И сегодня хранилища данных интегральная часть современных корпоративных систем поддержки принятия решения.
Хранилище данных - это место, где хранятся данные для архивирования, анализа, в целях безопасности. Как правило, хранилища данных, либо один или несколько компьютеров (серверов) связаны вместе, чтобы создать один гигантский компьютер системы.
Данные состоят из необработанных данных или отформатированных данных. Она может быть на различные типы вопросов, включая организацию продаж, зарплата, эксплуатационные данные, сводки данных, включая отчеты, копии данных, данных о людских ресурсах, кадастровых данных, внешних данных и обеспечения анализа и моделирования и др.
Информационное хранилище данных
Термин "Хранилище данных" был впервые придуман Биллом Инмоном в 1990 г. По Инмону, информационное хранилище данных является предметно-ориентированным, интегрированным и энергонезависимым сбором данных. Эти данные помогают аналитикам принимать обоснованные решения в организации.
Оперативная база данных подвергается частым изменениям на ежедневной основе за счет сделок, которые происходят. Предположим, что хозяйственник хочет проанализировать предыдущую обратную связь по любым данных, таких как продукт, поставщика, или любой потребительский данных, то исполнительный не будут иметь данные, имеющиеся для анализа, так как предыдущие данные были обновлены в результате операций.
А хранилищ данных предоставляет нам обобщенные и консолидированные данные в многомерном представлении. Наряду с обобщенным и консолидированным представлением данных, хранилища данных и предоставляет нам Online Analytical Processing (OLAP) инструменты. Эти инструменты помогают нам в интерактивном и эффективного анализа данных в многомерном пространстве. Этот анализ приводит к обобщению данных и интеллектуального анализа данных.
Добыча данных функции, такие как ассоциации, кластеризация, классификация, прогнозирование может быть интегрирована с операций OLAP для повышения интерактивной добычи знаний на нескольких уровнях абстракции. Вот почему хранилище данных теперь стал важной платформой для анализа данных и оперативной аналитической обработки.
Понимание хранилища данных
· Хранилище данных представляет собой базу данных, которая хранится отдельно от рабочей базы данных организации.
· Там нет частое обновление сделано в хранилище данных.
· Обладание объединенными историческими данными, которые помогают для организации анализа бизнеса.
· Хранилище данных помогает руководителям организации, понять и использовать свои данные, чтобы принимать стратегические решения.
· Хранилища данных системы помогают в интеграции разнообразия прикладных систем.
Ключевые особенности хранилища данных
· Тема ориентированная - Хранилище данных является предметом ориентированных, поскольку она обеспечивает информацию вокруг предмета, а не текущих операций организации. Эти предметы могут быть продукт, клиенты, поставщики, продажи, доход и т.д. Хранилище данных не сосредоточиться на текущих операций, а она сосредоточена на моделировании и анализе данных для принятия решений.
· Интегрированная - Хранилище данных построено на основе интеграции данных из разнородных источников, таких как реляционные базы данных, плоские файлы и т.д. Эта интеграция повышает эффективный анализ данных.
· Время Вариант - Данные, собранные в хранилище данных идентифицируется с определенным периодом времени. Данные в хранилище данных содержит информацию из исторической точки зрения.
· Энергонезависимая - энергонезависимая особенность означает, что предыдущие данные не стираются, когда добавляются новые данные. Хранилище данных хранится отдельно от рабочей базы данных и, следовательно, частые изменения в рабочей базе данных не отражается в хранилище данных. Примечание: Хранилище данных не требует обработки транзакций, восстановления и управления параллелизмом, потому что это физически хранятся и отдельно от рабочей базы данных.
Хранилище данных Приложения
Как обсуждалось ранее, хранилище данных помогает бизнес - руководителям организовать, анализировать и использовать свои данные для принятия решений. Хранилище данных служит в качестве единственной части: план - выполнить - оценка «замкнутого цикла» системы обратной связи для управления предприятием. Хранилища данных широко используются в следующих областях:
· Финансовые услуги
· Банковские услуги
· Потребительские товары
· Розничные сектора
· Контролируемое производство
Типы хранилищ данных
Обработка информации, аналитическая обработка и добыча данных трех типов хранилищ данных приложений, которые обсуждаются ниже:
· Обработка информации - Хранилище данных позволяет обрабатывать данные, хранящиеся в нем. Эти данные могут быть обработаны с помощью поиску информации основного статистического анализа, с помощью кросс - таблицах отчетности, таблицы, диаграммы, графики или.
· Аналитическая обработка - Хранилище данных поддерживает аналитическую обработку информации, хранящейся в нем. Эти данные могут быть проанализированы с помощью основных операций OLAP, в том числе среза - и - кости, развернуть, свернуть, и поворот.
· Добыча данных - добыча данных поддерживает открытие знаний, находя скрытые закономерности и ассоциации, аналитические модели построения, выполняющих классификацию и прогнозирование. Эти результаты добыча может быть представлена с помощью инструментов визуализации.
Преимущества
Хранилища данных сохраняет копию информации, полученной от источника транзакционные системы. Эта архитектурная сложность обеспечивает возможность:
· Собирать данные из нескольких источников в единую базу, так что одним запросом двигателя могут быть использованы для представления данных.
· Смягчить проблему базе уровня изоляции блокировок в системах обработки транзакций, вызванных попытками запуска больших, длительных, анализ запросов в транзакции обработки базы данных.
· Сохранить данные истории, даже если исходные транзакционные системы не.
· Интегрировать данные из нескольких исходных систем, включение центрального зрения всего предприятия.
· Улучшить качество данных, предоставляя последовательные коды и описания
· Представить организации информацию последовательно.
· Предоставление единой модели данных для всех данных интересов независимо от источника данных.
· Реорганизовать данные так, чтобы бизнес - пользователям было легко работать с клиентами (CRM) системы.
Хранение информации
Есть три или более ведущих подходов к хранению данных в хранилища данных -- наиболее важные подходы размерный и нормированный.
Размерный подход обращается к подходу Ральфа Кимбола, в котором установлено, что склад данных должен быть смоделирован, используя Размерную схему Модели/звезды. Нормализованный подход, также названный 3NF модель (Третья Нормальная Форма) обращается к подходу Билла Инмона, в котором установлено, что склад данных должен быть смоделирован, используя E-R.
Ключевое преимущество размерного подхода состоит в том, что склад данных легче для пользователя понять и использовать. Кроме того, поиск данных от склада данных имеет тенденцию работать очень быстро. Размерные структуры легко понять деловым пользователям, потому что структура разделена на размеры/факты и контекст/измерения. Факты связаны с бизнес-процессами организации и эксплуатационной системой, тогда как измерения, окружающие их сдерживают контекст об измерении.
Главные неудобства размерного подхода
- следующее
ь Чтобы поддерживать целостность фактов и измерений, загруженных со склада данных данными от различных эксплуатационных систем.
ь Трудно изменить структуру склада данных, если организация, принимающая размерный подход изменяет путь, которым это ведет бизнес.
В нормализованном подходе, данные в складе данных после хранятся, в известной степени, правила нормализации базы данных. Столы группируются предметными областями, которые отражают общие категории данных (например, данные относительно клиентов, продукции, финансов, и т.д.). Нормализованная структура делит данные на объекты, которые создают несколько столов в реляционной базе данных. Когда применено в больших предприятиях результат - множества столов, которые соединены сетью соединений. Кроме того, каждый из созданных объектов преобразован в отдельные физические столы, когда база данных осуществлена. Главное преимущество этого подхода состоит в том, что можно прямо добавить информацию в базу данных. Некоторые неудобства этого подхода - то, что, из-за числа вовлеченных столов, может быть трудным для пользователей присоединиться к данным из различных источников в нужную информацию и получить доступ к информации без точного понимания источников данных и структуры данных склада данных.
Аналитическая обработка данных (OLAP)
Доктор Е.Ф. (Тэд) Кодди придумал фразу оперативной аналитической обработки (OLAP) в 1993 г., которая была упомянута в статье под названием «Обеспечение OLAP (оперативной аналитической обработки) для пользователей-аналитиков: как некий “мандат” информационной технологии. Вскоре после опубликования этой статьи, OLAP и стал последним модным словечком в базе данных арены и каждый профессионал изо всех сил пытался понять принцип работы OLAP и как она вписывается в парадигму системы поддержки принятия решений (СППР) приложений. Учитывая в последнее время популярность OLAP, можно сказать, что данная технология очень проста в использовании.
Большой интерес всплыл в применение хранилищ данных и многомерных баз данных в продвинутых системах. Современные системы, такие как экспертные системы и системы поддержки принятия решений были использованы на протяжении десятилетий, чтобы решить слабоструктурированные и неструктурированные проблемы. Традиционно, эти типы систем комбайна вывода двигателей и реляционных баз данных для того, чтобы хранить знание компонентов обработки, и они все сделано этими задачами без выгоды в связи с огромным количеством данных склад.
хранилище данные аналитический обработка
Понятие OLAP
Модель OLAP (online analytical processing) создана для интерактивной аналитической обработки данных в реальном времени. Выполняет OLAP для многомерного анализа бизнес - данных и предоставляет возможность для сложных вычислений, анализ тенденций, моделирование и сложные данные. Она является основой для бизнес-приложений для управления эффективностью бизнеса, планирования, бюджетирования, прогнозирования, финансовой отчетности, анализа, хранилища данных и отчетности. OLAP позволяет конечным пользователям выполнять специальный анализ данных в нескольких измерениях, обеспечивая тем самым возможность для более эффективного принятия решений.
Основы OLAP
По сути, технология OLAP это анализ любой системы обобщения информации, которая захватывает и позволяет резюме отображаться в виде кросс - таблицы между двумя переменными. В следующем примере мы рассмотрим OLAP с помощью сводной таблицы Excel характеристика таблицы.
Термины OLAP и многомерные базы данных стали синонимами. По сути, многомерные базы данных - это базы данных архитектуры, которые хранят обобщенную информацию таким образом, что все основные элементы данных (называемые измерениями) являются перекрестные ссылки друг другу. Например, многомерная база данных может хранить итоги продаж перекрестных ссылок по месяцам, продукт линии, территории и продавца. Многомерные базы данных также могут отображать итоги продаж в соответствии с возможными сочетаниями кросс - таблицы.
Так что, если это многомерная база данных, тогда что такое OLAP, так? OLAP - это презентация переднего плана, позволяющая конечным пользователям выбрать размеры и факты, которые будут перекрестными ссылками. Данные не обязательно должны прийти непосредственно из многомерной базы данных. Возможные источники данных для приложений OLAP включают:
* Многомерные базы данных
* Реляционные базы данных (ROLAP с помощью инструментов)
* Данные электронной таблицы (извлечено из любой базы данных архитектура)
Преимущества применения OLAP
OLAP предоставляет следующие преимущества аналитическим пользователям:
· Предварительная агрегация часто запрашиваемых данных, что позволяет очень быстро время ответа на нерегламентированные запросы.
· Интуитивно понятный многомерной модели данных, что делает его легким для выбора, навигации и исследования данных.
· Мощный инструмент для создания новых представлений данных на основе богатый выбор специальной функции расчета.
· Технологий для управления безопасностью, клиент/сервер запросов и управления данными кэширование, услуг и оптимизации производительности системы на основе потребностей пользователей.
Типы OLAP
Классификация продуктов OLAP, которая делается только на основе физического способа хранения. Физические параметры хранения влияют на производительность и требования к хранению данных для кубов. На основе OLAP существует три типа хранения данных (Рис.1.):
1. MOLAP
2. ROLAP
3. HOLAP
1. MOLAP
MOLAP для хранения использует многомерные структуры для хранения агрегатов и копию базовых данных.
MOLAP для хранения обеспечивает потенциал для наиболее быстрого времени отклика на запрос, завися только от процента и проекта скоплений куба. В общем, MOLAP является более подходящим для кубов при частом использовании и необходимости быстрого ответа на запрос.
2.ROLAP
ROLAP для хранения данных использует таблицы в реляционной базе данных хранилища для хранения скопления куба. В отличие от хранения MOLAP, ROLAP не хранит копию базовых данных, получая доступ к исходной таблице фактов, когда это необходимо, чтобы ответить на запросы.
ROLAP ответ на запрос, как правило, дает медленнее, чем это было бы доступно с двух других стратегий хранения. Типичное использование ROLAP для больших наборов данных, которые редко запрашиваются.
3. HOLAP
HOLAP для хранения сочетает в себе атрибуты MOLAP и ROLAP. Данные скопления хранятся в структурах MOLAP, и базовые данные, оставленные в реляционной базе данных склада данных, которые обращаются к резюме данных, HOLAP является эквивалентом режиму MOLAP.
Запросы, которые обращаются к базе данных, такие как, добраться вплоть до единственного факта, должны извлекаться из реляционной базы данных и так быстро, как если базы данных хранились в структуре MOLAP. Кубы хранятся в виде HOLAP меньше, чем эквивалентные кубы обработки MOLAP и реагируют быстрее, чем кубы ROLAP, для запросов со сводными данными.
Размещено на http://www.allbest.ru/
ROLAP MOLAP HOLAP
Рис.1. Структура OLAP
Условия OLAP
1. Меры:
Меры или факты являются количественным значением базы данных, которое вы хотите проанализировать. Типичные меры - продажи, затраты и бюджетные данные. Анализируются меры против разных категорий измерения Куба.
2. Измерения:
Размеры - это описательные категории, по которым числовые данные (меры) в кубе разделены для анализа. Например, если куб - это мера производственного графа, и его измерения - время, фабричное местоположение и продукт, пользователи куба могут отделить производство в различные категории времени, фабричного местоположения, и продукта.
3. Иерархия:
Измерения обычно организовываются в иерархии информации, которые отображаются к колонкам в реляционной базе данных. Иерархии измерений сгруппированы в уровни, состоящие из элементов измерения. Каждый уровень измерения может быть скручен вместе, чтобы сформировать значения для следующего уровня. Например, в измерении времени, дни переводятся в месяцы, а рулон месяцев в четверти.
4. Куб:
Подмножество данных, как правило, изготовлены из хранилища данных и организованы в виде многомерной структуры, которая определяет собой набором измерений и мер.
5. Таблица Фактов:
Центральная таблица в хранилище данных, содержит числовые меры и ключи, касающиеся фактов и таблиц измерений. Таблицы фактов содержат данные, описывающие конкретные мероприятия в рамках бизнеса, таких как банковские сделки или продажи продукции.
OLAP FASMI тест
Быстро: Применение средств, под которыми система предназначена, чтобы поставить ответ на ров вопросов конечного пользователя 5 секунд, с самыми простыми исследованиями, занимающими не больше, чем секунду и очень немного взятия вопросов больше чем 20 секунд (по различным причинам, которые будут обсуждены).
Анализ: Выполняет основной числовой и статистический анализ данных. Система способна к выполнению любой бизнес-логики и статистического анализа, который необходим для применения и также сохраняет его достаточно легким для пользователя. Разделенный: Осуществляет требования безопасности, необходимые для разделения потенциально конфиденциальных данных через многочисленное пользовательское население.
Многомерный: Существенная особенность OLAP. Система обеспечивает многомерное логическое представление о соединенных данных, включая полную поддержку иерархий и многократных иерархий, поскольку это является, конечно, самым логичным способ проанализировать организации и компании.
Информация: Доступны все данные и информация, необходимая и важная для применения, везде, где это может быть использовано без ограничения в объеме.
Куб OLAP
Что такое - Куб OLAP? В определении OLAP ключевое требование - многомерность. Куб OLAP обеспечивает многомерный способ просмотра на данные. Куб сопоставим столу в реляционной базе данных. Определенный проект куба OLAP обеспечивает оптимизацию сообщения.
Данные куба OLAP таким способом способствуют сделать легкую и эффективную отчетность. Традиционная реляционная база данных рассматривает все данные аналогично. Однако кубы OLAP имеют категории данных называемые измерением и мерами. Мера представляет некоторый факт (или число), типа стоимости или подразделений обслуживания. Измерение представляет описательные категории данных, типа времени или местоположения.
Куб срока прибывает от геометрического объекта и подразумевает три измерения, но в фактическом использовании, куб может иметь больше чем три измерения.
Следующая иллюстрация графически представляет понятие куба OLAP.(рис.2)
Рис.2. Куб OLAP
Фрагмент
Срез - это подмножество многомерного массива, соответствующее одно значение для одного или нескольких членов Габариты не в подмножестве.
Кости
Кости операция кусочек на более чем два измерения Куба данных (или более чем двух последовательных срезов).
Переход Вниз/Вверх
Переход вниз или вверх - это конкретный аналитический метод, посредством которого пользователь осуществляет переходы между уровнями данных, от самого сводного (вверх) для наиболее детального (нижнего).
Модели данных, используемые для построения информационных хранилищ
СППР
В настоящее время информационное хранилище данных способствует созданию модели данных современных Систем Поддержки Принятия Решений (СППР)
СППР считается интерактивная компьютеризированная система, которая анализирует данные и представляет его так, что знающие работники могут принимать деловые решения с большей легкостью в тех средах, которые быстро меняются и не всегда прогнозируемы. Она может включать в себя экспертные системы искусственного интеллекта и помогает менеджерам и плановикам для извлечения полезной информации из данных, собранных из различных источников, включая документы в различные электронные форматы, личных знаний, бизнес моделей, промышленных данных и т. д., так что они могут идентифицировать и решить.
В настоящее время информационное хранилище данных способствует созданию модели данных современных Систем Поддержки Принятия Решений (СППР)
СППР считается интерактивная компьютеризированная система, которая анализирует данные и представляет его так, что знающие работники могут принимать деловые решения с большей легкостью в тех средах, которые быстро меняются и не всегда прогнозируемы. Она может включать в себя экспертные системы искусственного интеллекта и помогает менеджерам и плановикам для извлечения полезной информации из данных, собранных из различных источников, включая документы в различные электронные форматы, личных знаний, бизнес моделей, промышленных данных и т. д., так что они могут идентифицировать и решить проблемы.
Главной особенностью СППР является качественно новый метод организации взаимодействия человека и компьютера. Выработка решения происходит в результате итерационного процесса (рис.2), в котором участвуют:
· система поддержки принятия решений в роли вычислительного звена и объекта управления;
· человек как управляющее звено, задающее входные данные и оценивающее полученный результат вычислений на компьютере.
Вариант вычислений Решение выработано
Введение новых исходных данных
Рис.2. Информационная технология поддержки принятия решений как итерационный процесс
Преимущества СППР
- Повышает производительность и эффективность работы пользователя
- Позволяет для быстрого принятия решений
- Сокращает время, необходимое для решения проблемы
- Сокращает время обучения, потому что опыт экспертов предоставляется в рамках программ, алгоритмов
- Предоставляет больше доказательств в поддержку решения
- Предоставление разных точек зрения на ситуацию
- Помогает автоматизировать различные бизнес - системы
Недостатки
- Слишком много внимания/контроля уделено машинам
- Может уменьшить навык в персонал, потому что они становятся зависимыми от компьютеров
- Снижение эффективности из-за информационной перегрузки
OLTP (Online Transaction Processing)
Основная задача для модели OLTP быстрая обработка запросов, поддержание целостности данных, мультидоступ к среде, её эффективность измеряется количеством транзакций в секунду.
Функции программного обеспечения OLTP включают:
- управление пользовательским интерфейсом
- восстановление и изменение данных
- прослеживание местоположений данных и пользователя
- обработка коммуникаций
- установление связи с защитным программным обеспечением
Для OLTP характерны:
- короткое время отклика. Для OLTP системы требуется малое время отклика для того, чтобы оставаться продуктивными для пользователя.
- мелкие сделки. Система OLTP обычно манипулирует весьма избирательно, небольшим объемом данных. Обработка данных - это в основном простые действия и сложные соединения являются относительно редкими.
- операции по техническому обслуживанию. Это программы, которые запускаются в фоновом режиме, пока пользователи продолжают работать над другими задачами, которые могут потребовать большого числа ресурсоемких вычислений.
- большое количество пользователей. OLTP система может подключать большое количество пользователей, которые пытаются получить доступ к одни и тем же данным одновременно.
- высокий параллелизм. Благодаря большому количеству пользователей и короткое время отклика, малые операции, параллелизм в средах OLTP очень высок. Требование для тысяч одновременно работающих пользователей - не редкость.
- большие объемы данных. В зависимости от типа приложения и время удерживания данных, OLTP систем могут стать очень большими.
- высокая доступность. На недоступность OLTP системы могут влиять очень большое число пользователей, и организаций могут получить серьезные убытки, если OLTP система будет недоступна. Например, фондовая биржа система имеет чрезвычайно высокие требования к доступности во время торговых часов.
- жизненный цикл данных, связанных с использование. В аналогичных средах хранилищ данных OLTP системы часто требуют различные схемы доступа к данным с течением времени. Например, в конце месяца, ежемесячные проценты рассчитываются за каждый активный аккаунт.
Преимущества секционирования для OLTP -сред
- поддержка больших баз данных
- резервное копирование и восстановление, как часть стратегии высокой доступности, могут быть выполнены на низком уровне детализации, чтобы эффективно управлять размером базы данных. Система OLTP обычно находится “онлайн” во время резервного копирования, и пользователи могут продолжать получать доступ к системе, пока выполняется резервное копирование.
- перегородки помогают снизить требования к пространству для OLTP системы, поскольку часть объекта хранилища данных может храниться сжатой, в то время как другие части могут оставаться без сжатия. Обновление операций на несжатые строки эффективнее, чем обновления на сжатых данных.
- перегородки могут хранить данные прозрачно на разных уровнях хранения, чтобы снизить затраты, связанные с сохранением огромные объемы данных.
Для эффективного сбора, хранения, анализа и компьютерных систем, необходимо сочетание OLTP и OLAP приложений. (Табл.1)
Таблица 1
Sr.No. |
Хранилище данных (OLAP) |
Оперативная база данных (OLTP) |
|
1 |
Она включает в себя историческую обработку информации. |
Она включает в себя обработку изо дня в день. |
|
2 |
Системы OLAP используют знания работников, таких как руководитель, менеджер, аналитик. |
OLTP системы используют клерков, администраторов баз данных, специалистов по базам данных или. |
|
3 |
Используется для анализа бизнеса. |
Используется для запуска бизнеса. |
|
4 |
Она сосредоточена на информации. |
Она сосредоточена на данных. |
|
5 |
Она основана на схеме звезда, снежинка схеме, и фактов созвездия. |
Она основана на Entity Model о взаимоотношениях. |
|
6 |
Она содержит исторические данные. |
Она содержит текущие данные. |
|
7 |
Она обеспечивает обобщенные и объединенные данные. |
Она обеспечивает примитивные и высоко детализированные данные. |
Таблица 1
8 |
Она обеспечивает обобщенный и многомерный вид данных. |
Она обеспечивает подробное и плоское реляционное представление данных. |
|
9 |
Количество пользователей - сотни. |
Количество пользователей - тысячи. |
|
10 |
Количество записей, доступ в миллионы. |
Количество записей, доступ в десятки раз. |
|
11 |
Размер базы данных от 100 ГБ до 100 ТБ. |
Размер базы данных от 100 Мб до 100 Гб. |
|
12 |
Она очень гибкая. |
Обеспечивает высокую производительность. |
ЗАКЛЮЧЕНИЕ
Для развития и процветания бизнеса недостаточно просто владеть информацией, нужно уметь быстро и четко определять категорию показателей, на основании которых требуется принимать решение, проводить анализ определенных значений данных показателей с учетом всех параметров. Информационное хранилище данных является прекрасным инструментом для решения этой задачи. Владельцы, обладающие средствами, которые позволяют четко представить картину бизнес - данных, их взаимосвязь, историю возникновения, оказывается в выигрыше.
Информационное хранилище данных предоставляет возможность получения интересующих сотрудника данных, в удобном и привычном для него формате или виде. Создание хранилищ данных начинается с тщательного планирования и определения сроков работ.
СПИСОК ЛИТЕРАТУРЫ
1. Gupta V. R., An Introduction to Data Warehousing , System Services corporation, Chicago, Illinois, 1997
2. Инмон Б., Типы хранилищ данных (Перевод Intersoftlab), 2001
3. Кривко О.Б., Информационные технологии. М.: СОМИНТЭК. 2001
4. Малыхина М.П., Базы данных: основы, проектирование, использование, БХВ-Петербург, 2004
Размещено на Allbest.ru
Подобные документы
Формы представляемой информации. Основные типы используемой модели данных. Уровни информационных процессов. Поиск информации и поиск данных. Сетевое хранилище данных. Проблемы разработки и сопровождения хранилищ данных. Технологии обработки данных.
лекция [15,5 K], добавлен 19.08.2013Концепции хранилищ данных для анализа и их составляющие: интеграции и согласования данных из различных источников, разделения наборов данных для систем обработки транзакций и поддержки принятия решений. Архитектура баз для хранилищ и витрины данных.
реферат [1,3 M], добавлен 25.03.2013Определение многомерной модели данных для удовлетворения основных информационных потребностей предприятия. Экстракция, загрузка и перенос данных из различных источников данных. Разработка собственных ETL–систем. Оптимизация работы хранилища данных.
презентация [9,1 M], добавлен 25.09.2013Режимы компьютерной обработки данных. Понятие и типы данных, структура и отличительные особенности. Характеристика основных операций, проводимых с данными, приемы их кодирования. Порядок и инструменты измерения информации и единицы хранения данных.
контрольная работа [104,1 K], добавлен 22.11.2010OLAP: общая характеристика, предназначение, цели, задачи. Классификация OLAP-продуктов. Принципы построения OLAP системы, библиотека компонентов CubeBase. Зависимость производительности клиентских и серверных OLAP-средств от увеличения объема данных.
курсовая работа [113,6 K], добавлен 25.12.2013Хранилище данных, принципы организации. Процессы работы с данными. OLAP-структура, технические аспекты многомерного хранения данных. Integration Services, заполнение хранилищ и витрин данных. Возможности систем с использованием технологий Microsoft.
курсовая работа [1,0 M], добавлен 05.12.2012Методы построения хранилища данных на основе информационной системы реального коммерческого предприятия. Основные аналитические задачи, для решения которых планируется внедрение хранилищ данных. Загрузка процессоров на серверах. Схемы хранения данных.
контрольная работа [401,0 K], добавлен 31.05.2013Основные сведения об OLAP. Оперативная аналитическая обработка данных. Классификация продуктов OLAP. Требования к средствам оперативной аналитической обработки. Использование многомерных БД в системах оперативной аналитической обработки, их достоинства.
курсовая работа [67,5 K], добавлен 10.06.2011Принципы и критерии построения распределенных баз данных. Ряд свойств, которым по К. Дейту должна удовлетворять распределенная база данных: независимость узлов, прозрачность расположения, обработка распределенных запросов. Типы распределенных баз данных.
реферат [131,5 K], добавлен 18.06.2013Системы автоматизированной обработки информации. Хранение большого объема информации. Понятие базы данных (БД). Обеспечение секретности данных. Уровни представления данных в БД. Логическая структура данных. Ограничения, накладываемые на данные.
реферат [65,2 K], добавлен 26.11.2011