Разработка методических материалов и лабораторных работ к специализированному курсу "Использование систем бизнес анализа"

Разработка лабораторных работ, организованных как программный продукт – электронный учебник. Обзор компаний-лидеров в производстве и поставке систем управления бизнесом, их основные продукты. Установка и конфигурирование SAP Business Intelligence.

Рубрика Программирование, компьютеры и кибернетика
Вид дипломная работа
Язык русский
Дата добавления 20.03.2011
Размер файла 8,4 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

· Основные инструменты и средства SAP Business Intelligence.

Целью данного курса является изучение методики бизнес анализа и инструментов его реализации в SAP Business Intelligence.

Задачи курса:

· дать целостное представление о системах бизнес анализа;

· вооружить знаниями, навыками и умениями, необходимыми для проектирования хранилищ данных, загрузки данных, анализа и построения отчётов.

2.3 Требования к учебному курсу по системе SAP Business Intelligence

Курс по системе SAP Business Intelligence содержит:

· методические указания;

· комплекс лабораторных работ.

Комплекс лабораторных работ состоит из двух частей. В первой лабораторной работе рассматривается подготовка данных для загрузки в BW, создание инфо-объектов, инфо-кубов, источников данных, перенос данных в BW. Вторая лабораторная работа посвящена изучению инструментов анализа загруженных данных и построения отчётов.

2.4 Требования к аппаратному обеспечению

Для работы с системой SAP BI необходимы следующие компоненты:

а) сервер, реализованный на базе ЭВМ типа IBM PC не ниже следующей конфигурации:

· процессоры 2 x AMD Opteron Quadcore;

· оперативная память 32 GB;

· жёсткие диски 6 х 300GB 15000rpm;

· монитор с разрешением от 800x600;

· мышь и клавиатура;

б) клиент, реализованный на базе ЭВМ типа IBM PC не ниже следующей конфигурации:

· процессор Intel Pentium 166 МГц и выше или с ним совместимый;

· 128 MB RAM;

· монитор с разрешением 1280x1024;

· мышь и клавиатура.

2.5 Требования к программному обеспечению

Минимальные требования для установки SAP BI:

Должна быть установлена операционная система Windows 2003, а также СУБД MS SQL 2005.

2.6 Требования к численности и квалификации персонала

Пользователями электронного курса лекций и комплекса лабораторных работ являются студенты.

Студенты должны обладать навыками работы с Internet-технологиями.

Обслуживающим персоналом для проведения лабораторных работ являются администратор сети кафедры АСУ и администратор SAP BI системы.

Администратору сети необходимы знания сетевых технологий, Internet-технологий.

Администратор SAP BI-системы должен обладать следующими навыками:

· установка систем SAP BI;

· настройка и обслуживание пользовательских учетных записей;

· создание и настройка профилей полномочий;

· поддержка правильного функционирования системы;

· назначение и мониторинг заданий резервного копирования;

· создание, тестирование и исполнение плана восстановления в случае краха системы.

3 Установка и конфигурирование SAP BI

3.1 Описание необходимой конфигурации SAP BI

Для проведения лабораторных работ по SAP BI необходима система, включающая следующие компоненты:

· SAP BW 7.0 - последняя версия компонента SAP Business Information Warehouse

· SAP SEM 6.0 - последняя версия компонента SAP Strategic Enterprise Management

· BI_CONT 7.03 - Бизнес-контент - набор предварительно сконфигурированных информационных моделей и шаблонов для системы отчетности и анализа с соответствующими техническими и бизнес-определениями (инфо-объекты, ODS-объекты, инфо-кубы, экстракторы, правила переноса, запросы)

Уже использующаяся для проведения лабораторных работ (курс «Введение в SAP») система mySAP ERP 2005 IDES включает в себя компоненты SAP BW 7.0 и SAP SEM 6.0.

Таким образом необходимо:

· установить Бизнес-контент

· установить обновления

· выполнить конфигурирование компонента SAP BW

3.2 Установка бизнес-контента

BI_CONT 7.03 является аддоном, входящим в состав поставки SAP Netweaver 2004s.

Далее кратко перечислены этапы установки бизнес-контента:

· проверка выполнения всех необходимых условий

· распаковка и закачка дистрибутива на сервер

· установка BI_CONT 7.03 в транзакции SAINT

· проверка успешности установки.

3.3 Установка обновлений

Поставляемые компанией SAP обновления служат для устранения ошибок и добавления новой функциональности. Данные обновления скачиваются с сайта service.sap.com

Обновлены следующие компоненты:

· ядро SAP KERNEL 7.00 32-BIT UNICODE MSSQL win

· SAP_BASIS - базисная система

· SAP_ABA - компоненты, общие для всех приложений

· SAP_BW - Бизнес-хранилище и аналитика

· SEM-BW - стратегическое управление предприятием

· BI_CONT 7.03 - бизнес-контент

После установки обновлений выполнена повторная генерация исполняемого кода ABAP-программ перечисленных компонентов.

3.4 Конфигурирование SAP BW

Выполнены основные действия по настройке:

· настройка транспортной системы и RFC-соединений

· активирование и тиражирование метаданных

· активация и репликация исходной системы

· настройка загрузки из плоских файлов

· ведение разрешённых дополнительных знаков в загружаемых данных

· создание учётных записей и ролей для разработчиков учебных курсов по SAP BI и проведения лабораторных работ

4 Подготовка исходных данных для проведения лабораторных работ

4.1 Требования к исходным данным

Исходные данные должны быть представлены в виде таблицы фактов с реляционной построчной формой организации, содержащей не менее трёх измерений и четырёх показателей. В случае с меньшим количеством признаков и показателей применение OLAP-технологий теряет смысл.

4.2 Анализ имеющихся в наличии данных и их дополнение

Источником исходных данных послужили документ «ИсходныеТаблицы.doc» и книга «Екатеринбург: итоги социально-экономического развития в 2002 году и основные тенденции развития города за последние 5 лет».

По сути своей это не сырые данные, а подборка отчётов. Это уже понятно из названия книги. В результате потребовалось немало усилий на извлечение исходных данных из готовых отчётов.

В качестве примера для анализа взята предметная область «Транспорт».

Далее были выполнены следующие действия:

· определение подходящих данных для построения инфо-куба

· конвертация исходных данных в таблицу фактов

· определение недостающих для интересного анализа признаков и показателей

· генерация псевдореальных данных для таблицы фактов

4.3 Определение подходящих данных для построения инфо-куба

В нижеприведённой таблице выделены данные, которые целесообразно использовать для построения инфо-куба Транспорт.

В инфо-кубе три показателя и два признака:

Показатели:

· кол-во пассаж

· кол-во ед. ПС

· регулярность.

Признаки:

· вид транспорта

· год.

Таблица 4.1 - Городской транспорт и организация дорожного движения

№ п/п

Наименование показателя

Ед.изм.

Контр. значение 2005 г.

2004 г.

2005 г.

2005г.

к 2004г., %

1

Перевозка пассажиров общественным транспортом - всего

млн. чел.

681,7

711,6

608,7

85,5

- автобусом

- // -

156,6

211,2

144,6

68,5

- трамваем

- // -

223,0

243,0

202,2

83,2

- троллейбусом

- // -

111,8

122,6

95,5

77,9

- метро

- // -

43,0

42,8

43,6

101,9

2

Перевозка платных пассажиров муниципальными транспортными предприятиями - всего

млн. чел.

340,7

293,3

274,3

93,5

в том числе по видам транспорта:

- автобусом

- // -

98,1

81,7

62,1

76,0

- трамваем

- // -

139,7

121,2

121,3

100,1

- троллейбусом

- // -

70,0

61,1

57,3

93,8

- метро

- // -

32,9

29,3

33,6

114,7

3

Средний выпуск на линию единиц подвижного состава муниципального транспорта в «часы пик»

- автобусов

шт.

280,0

282

261

92,6

- трамваев

- // -

350,0

354

356

100,6

- троллейбусов

- // -

202,0

209

209

100,0

- вагонов метро

- // -

36,0

36

36

100,0

4

Регулярность движения муниципального транспорта МТП

кол-во рейсов, выполненных по расписанию, к предусмотренному расписанием, %

- автобус

96,1

93,7

94,2

100,5

- трамвай

96,0

97,4

96,9

99,5

- троллейбус

95,5

94,7

95,6

101,0

- метро

99,8

99,89

99,99

100,2

4.4 Конвертация исходных данных в таблицу фактов

Результат конвертации исходных данных приведён на рисунке 4.1.

Рисунок 4.1 - Таблица фактов в Microsoft Excel

Выше приведён пример формата «сырых данных» с реляционной построчной формой организации, подходящей для загрузки в BW. Порядок столбцов (признаков и показателей) не имеет значения.

4.5 Определение недостающих для полноценного анализа признаков и показателей

Нас не устраивают имеющиеся реальные данные, так как получающийся куб имеет лишь два измерения и анализ взаимосвязанности показателей вряд ли выявит что-либо интересное.

Принято решение добавить признак Район. Во избежание излишнего увеличения таблицы фактов придумано только два района - Северный и Южный.

Также добавим детализацию по кварталам.

Показатель Регулярность отражает качество обслуживания. В таком случае интересно было бы проследить его зависимость от затрат на тех. обслуживание. Добавим такой показатель.

А также добавим показатель - стоимость проезда. Он позволит высчитывать доход от перевозки пассажиров.

4.6 Генерация псевдо-реальных данных

Сгенерированы данные для новых показателей и признаков. В результате получено несколько таблиц с «сырыми» данными для лабораторных работ.

Рисунок 4.5 - Стоимость проезда

5. Комплекс лабораторных работ и методических указаний

5.1 Описание комплекса лабораторных работ и методических указаний

Руководство для выполнения лабораторных работ оформлено в виде набора связанных между собой html-страниц (Рисунок 5.1).

Рисунок 5.1 - Внешний вид комплекса лабораторных работ

Для удобства руководство поделено непосредственно на лабораторные работы и справочник (методические указания). В тексте каждой лабораторной существуют ссылки на соответствующий раздел справочника. Кроме того, в верхней части можно осуществлять переключение между лабораторными работами и справочником и просматривать интересующие разделы справочника независимо от выполнения лабораторных работ.

5.2 Порядок проведения лабораторных работ

Лабораторные работы выполняются в системе SAP ERP 2005 IDES

Перед проведением лабораторных работ администратор на каждом рабочем месте должен инсталлировать пакет клиентских программ SAP Frontend для доступа к SAP-системе.

Для аутентификации в системе используется учетная запись, соответствующая варианту. Номер варианта определяется преподавателем. На данный момент в системе зарегистрировано 10 пользователей с именами SAPUSER1 - SAPUSER10.

5.3 Лабораторная работа №1. Создание инфо-объектов и инфо-кубов. Загрузка данных в BW

5.3.1 Введение и цели работы

В первой лабораторной работе вам предстоит познакомиться с инструментами проектирования хранилища и загрузки данных.

Задача следующая: имеющиеся исходные данные о транспорте загрузить в SAP BW, предварительно подготовив мета-описания инфо-объектов.

Данная лабораторная работа состоит из следующих этапов:

· подготовка данных для загрузки в BW

· создание мета-описания инфо-объектов и инфо-куба

· создание источника данных

· организация загрузки данных в инфо-кубы

Цель работы: научиться работать с инструментами проектирования хранилища и загрузки данных.

Порядок выполнения работы. Выполняйте задание по порядку, руководствуясь html-документом, который прилагается к заданию.

Отчет по лабораторной работе оформляется в программе MS Word. Отчет должен содержать краткие сведения со снимком экрана по каждому пункту выполненной работы.

5.3.2 Аутентификация. Вход в SAP систему

При входе в систему SAP используйте учетную запись согласно Вашему варианту (см. таблицу 5.2, вариант определяется преподавателем).

Таблица 5.2 - Учетные данные

№ варианта

Пользователь

Пароль

1

sapuser1

sapuser1

2

sapuser2

sapuser2

3

sapuser3

sapuser3

4

sapuser4

sapuser4

5

sapuser5

sapuser5

6

sapuser6

sapuser6

7

sapuser7

sapuser7

8

sapuser8

sapuser8

5.3.3 Задание к лабораторной работе

1. Просмотрите руководство "Создание инфо-объектов и инфо-кубов. Загрузка данных в BW"

2. Подготовьте исходные данные из файла «Транспорт_XLS.xls» к загрузке в BW

3. Запустите SAP Logon. Зайдите в систему, указав идентификатор пользователя и пароль.

4. Запустите транзакцию RSA1

5. Создайте свою инфо-область с техническим именем «XX_Y» (XX - последние две цифры номера группы, Y - номер варианта). Описание должно начинаться на «XX_Y».

6. В своей инфо-области создайте каталоги инфо-объектов. Технические имена и описания этого и всех последующих создаваемых объектов должны начинаться на «XX_Y».

7. В соответствии с исходными данными создайте два признака.

8. В соответствии с исходными данными создайте показатели.

9. Создайте инфо-куб.

10. Создайте исходную систему.

11. Создайте прикладной компонент.

12. Создайте источник данных.

13. Создайте процесс переноса данных и выполните загрузку данных.

14. Скомпонуйте отчет по данной лабораторной работе. Создайте сообщение об успешном завершении лабораторной работы и отправьте его вместе с отчетом на адрес преподавателя: <указывается преподавателем>. Введите тему письма вида «BW1 Р-XXXXX Фамилия1, Фамилия2».

5.3.4 Методические указания к лабораторной работе №1

5.3.4.1 Проектирование хранилища данных в SAP

SAP Business Information Warehouse (SAP BW) - это компонент mySAP BI, который включает в себя механизм хранения данных в масштабах предприятия, платформу для бизнес - информации и набор инструментов для работы с бизнес - информацией. Он был спроектирован изначально для предоставления самых эффективных инструментов моделирования бизнеса и методологий - и сегодня возможности SAP в этой области признаны лучшими среди подобных решений. Подход SAP к моделированию бизнеса основан на нескольких фундаментальных концепциях:

· Технология следует за бизнес - структурой, а не наоборот.

· Информация должна предоставляться в ракурсе бизнеса.

· Модели данных быстро адаптируются к изменениям, и при этом необходимость в повторной конфигурации отсутствует.

На основании этих концепций SAP BW поставляет информационную модель, которая формирует основу для ответа на все связанные с бизнесом вопросы. Эта способность базируется, в основном, на предоставлении тех данных, которые обладают соответствующей структурой, степенью детализации и своевременны для данного анализа. Вес этих факторов различен в зависимости от ситуаций и пользователей компании.

Для удовлетворения этих разнообразных потребностей SAP BW поддерживает три концептуальных уровня хранения данных: хранилище операционных данных, хранилище данных и многомерные модели. В следующих разделах рассматривается информационная модель, на основании которой строятся эти три слоя.

5.3.4.2 Информационная модель SAP BW

Информационная модель SAP BW основывается на фундаментальном структурном блоке, который называется инфо-объектом. Инфо-объекты содержат данные о клиентах, заказе клиента и т. д. Они также являются носителями метаданных, которые описывают данные, содержащиеся в инфо-объекте, такие как их происхождение, история и технические свойства.

В инфо-объекте есть три класса метаданных:

· Технические метаданные описывают технические свойства, такие как тип данных и длина поля.

· Метаданные пользователя несут информацию о полномочиях.

· Бизнес-определения формируют основу для общего понимания бизнес-терминов, например, показатели производительности.

Бизнес-определения особенно важны в информационной модели SAP BW. Они устраняют семантические несоответствия в элементах данных в разных системах и организационных единицах и следят за тем, чтобы данные были непротиворечивыми и достоверными

Метаданные играют фундаментальную роль в преобразовании данных в информацию. В этом процессе метаданные предоставляют контекст и понимание того, каким образом соединены разные элементы данных. Для создания полезной бизнес-информации к комбинации данных и метаданных применяются бизнес-правила. Информационная модель SAP BW предоставляет последовательные и интегрированные метаданные для всех объектов по всему процессу хранения данных.

5.3.4.3 Элементы информационной модели

Инфо-объекты - основополагающие элементы информационной модели SAP BW. Инфо-объект может быть легко использован повторно в элементах информационной модели, как показано на рисунке 5.2.

Рисунок 5.2 - Информационная модель SAP BW

Основными элементами в информационной модели являются:

· Источник данных: данные переносятся в SAP BW в плоской, а не в многомерной структуре данных. Источники данных содержат определения исходных данных.

· Persistent Staging Area (PSA): информационной модели SAP BW данные физически хранятся в PSA-объекте, прозрачной таблице базы данных. PSA - это первичная область хранения данных, где запрошенные данные сохраняются неизмененными из исходной системы в соответствии со структурой, определенной в источнике данных.

· Инфо-источник: инфо-объекты, которые логически объединены друг с другом - с точки зрения бизнеса, группируются в инфо-источники. Инфо - источники (и входящие в них инфо-объекты) могут заполняться любыми данными в пределах предприятия или данными из внешних источников. Они могут содержать как переменные, так и основные данные. Переменные данные генерируются из операций в системе OLTP, например, в системе ERP; они количественные и могут быть гранулярными.

· Объект операционного хранения данных (ODS-объект): SAP BW использует технологию ODS-объектов для построения уровня хранилища операционных данных (ODS). ODS-объект содержит консолидированный набор данных из одного или нескольких инфо - источников. В противоположность многомерным моделям данных (инфо-кубы) данные в ODS - объектах хранятся в плоских прозрачных таблицах базы данных. Данные ODS - объекта можно загружать в инфо - кубы или другие ODS - объекты при помощи дельта - обновления. Данные в ODS - объекте можно анализировать при помощи инструмента SAP BW Business Explorer (BEx).

· Инфо-куб - это контейнер, который организует данные на основе многомерной модели в плане бизнес - измерений. Это означает, что пользователи имеют возможность анализировать информацию с разных точек зрения, таких как географический регион или вид канала сбыта. SAP BW Business Explorer осуществляет доступ к инфо - кубу с целью построения отчетов, а OLAP - для выполнения анализа.

Измерение - это группирование логически связанных по содержанию признаков. Если в измерении содержится признак, значением которого однозначно с организационно-экономической точки зрения определяются значения всех других признаков, измерение называется по имени этого признака. Например, измерение "Клиент" можно составить из номера клиента, группы клиентов и уровней иерархии клиентов. В измерении "Сбыт" могут содержаться признаки "Продавец", "Группа сбыта" и "Отдел сбыта"'. В измерении "Время" могут содержаться признаки "День"' (в формате ГГГГММДД), "Неделя" (в формате ГГГГ.НН), "Месяц" (в формате ГГГГ.ММ), "Год" (в формате ГГГГ) и "Период" (в формате ГГГГ.ППП).

Пример модели SAP BW изображен на рисунке 5.2. Возможны и другие комбинации элементов. Например, данные можно загружать непосредственно в инфо - куб, или несколько источников данных могут быть присвоены одному инфо - источнику.

Источник данных присваивается инфо - источнику через правила переноса в SAP BW. Правила переноса отображают поля источника данных в инфо - объектах, которые составляют инфо - источник. На этом этапе можно применять обширную библиотеку функций преобразования, представляющих бизнес - логику. Правила обновления SAP BW обрабатывают последующий поток данных из инфо - источников в ODS - объекты и инфо - кубы.

Во многих случаях данные, которые хранятся в PSA (и описаны в источнике данных), обладают неполным набором метаданных. Метаданные добавляются во время создания инфо - объектов и объединения инфо - объектов при формировании инфо - источника. Именно во время процесса перемещения из источника данных в инфо - источник данные преобразуются в информацию. Информационная модель SAP BW может быть представлена в виде "завода по очистке данных", на котором данные обогащаются, приобретая больше бизнес - стоимости по мере того, как они поступают в репозитарий.

5.3.4.4 Инфо-провайдеры

В SAP BW объекты, которые можно проанализировать, называются инфо-провайдерами. Существует два вида инфо - провайдеров - один вид содержит физические данные, а другой нет. Инфо - объекты, инфо - кубы и ODS - объекты содержат физические данные.

Мультипровайдеры используются для объединения данных из разных объектов. Cам мультипровайдер не содержит никаких данных. Мультипровайдер обеспечивает доступ к данным из нескольких инфо - провайдеров и делает их доступными для построения отчетов и анализа. Мультипровайдер можно собрать из различных комбинаций инфо - провайдеров.

Рисунок 5.3 - Доступ к данным через мультипровайдер

5.3.4.5 Экстракция, Преобразование и Загрузка (ETL)

Во многих компаниях данные фрагментарны и разбросаны по десяткам, если не сотням, баз данных и приложений. Сотрудникам, ответственным за принятие решений, необходима точная и полная информация для разработки всесторонней информационной картины компании и ответа на основные бизнес - вопросы. Чтобы быть действительно полезными, данные должны быть интегрированы, стандартизированы, синхронизированы и агрегированы. Это осуществляется через процесс, известный как экстракция, преобразование и загрузка (ETL).

ETL является жизненно важной и, возможно, наиболее проблематичной частью хранения данных, а значит таковой она является и для всего проекта управления бизнес - информацией. Надо определять правильные источники данных, оценивать значимость и достоверность этих данных и отслеживать потоки данных. Необходимо удостовериться, что процесс ETL охватывает и загружает весь диапазон требуемых данных, одновременно избегая перегрузки за счет "лишних" данных. Данные необходимо собрать и очистить, чтобы удалить дубликаты и неправильные значения. И их необходимо обогатить (агрегировать), чтобы преобразовать в удобную для практического применения информацию, релевантную для Вашего бизнеса.

Экстракцию данных можно выполнять на двух уровнях: на уровне приложения и на уровне базы данных или файла ("техническом уровне"). На уровне приложения экстракция данных выполняется в виде бизнес - объектов. Так как он быстрее и проще, этот метод наиболее предпочтительный, особенно когда в экстракции участвует много приложений и требуется длительный период времени для реализации данной задачи. Например, такой бизнес - объект, как "заказ клиента", может быть представлен несколькими основными таблицами СУБД. Отношение между таблицами определяется логикой приложения. Экстракция на уровне базы данных или файла означает, что полный набор данных и соответствующие метаданные берутся непосредственно из этих разных таблиц, а это трудная задача, занимающая много времени и требующая высокой квалификации.

Однако есть ситуации, при которых требуется экстракция на уровне базы данных или файла:

· Данные хранятся в файлах (плоских файлах)

· Данные отправляются через XML

· Данные существуют в базах данных, которые находятся под прежними или специальными приложениями

· Структуры таблицы прозрачны

· Экстракция на уровне приложения невозможна

5.3.4.6 ETL SAP BW

SAP BW предоставляет пользователям широкий набор возможностей ETL, который поддерживает экстракцию данных на уровнях приложения и файла. Он также предлагает открытые интерфейсы для внешних инструментов ETL, которые обеспечивают дополнительные возможности. Данные могут загружаться практически из любого источника, как показано на Рис. 5.4.

Данные становятся доступными в SAP BW в соответствии с определениями исходных данных в каждом источнике данных. Фактические данные из разных источников физически хранятся в объекте Persistent Staging Area (PSA), прозрачной таблице базы данных. PSA - это первичная область хранения в информационной модели SAP BW, в которой содержаться данные, запрошенные в неизменном виде из исходной системы. PSA создается для каждого источника данных и исходной системы.

Данные перемещаются из источника данных в инфо - источник (см. информационную модель на рисунке 5.2). В инфо - источнике содержатся данные, которые связаны друг с другом с точки зрения бизнеса.

Когда данные перемещаются из источника данных в инфо - источник, они очищаются и преобразовываются при помощи правил переноса. SAP BW предлагает богатую библиотеку правил переноса, которые прилагают бизнес - логику к данным через такие действия, как преобразование даты и времени, строковые операции и агрегация. Эти правила можно легко применять при помощи формул, что означает, что необходимость в кодировании отсутствует.

Рисунок 5.4 - Экстракция, преобразование и загрузка в SAP BW

Для поддержки мэппинга (мэппинг - процесс установления взаимно однозначного соответствия между объектами) в SAP BW отдельные поля источника данных присваиваются соответствующим инфо - объектам, которые составляют инфо - источник. Также в процессе мэппинга точно определяется, какие данные будут переноситься в инфо - источник из источника данных.

В SAP BW данные переносятся в инфо - пакетах. Инфо - пакет определяет, какие данные, содержащиеся в источнике данных, должны запрашиваться из исходной системы. Инфо - пакет может запрашивать как переменные, так и основные данные при помощи точных параметров, например, только контроллинговая единица 0001 за октябрь 2006 года. Это означает, что инфо - пакеты могут описывать целевые поднаборы данных, содержащиеся в источнике данных. С помощью инструментальных средств администратора SAP BW можно планировать и отслеживать перенос инфо-пакетов.

5.3.4.7 Экстракция на уровне приложения

Экстракция из компонентов SAP SAP BW предлагает бесшовную интеграцию с другими компонентами SAP, которые поддерживают и упрощают экстракцию бизнес - объектов на уровне приложения. Эта интеграция основана на API-сервисе, технологии, которую SAP поставляет со всеми своими компонентами. Она предоставляет основу для обширного тиражирования данных на основании экстракции данных, которые определяют логику приложения.

Экстрактор данных - это программа, которая заполняет структуру экстракции источника данных данными из источника SAP. Существуют специальные экстракторы для конкретных объектов в пределах исходной системы; например, заказ клиента в SAP CRM. Общие экстракторы не присваиваются конкретному источнику данных и могут быть вызваны любым источником данных.

Экстракторы могут использовать достаточно сложные способы обработки изменений (дельта - процессы). Пользователь может определять, каким образом данные должны обновляться и каким образом должно происходить управление версиями. Помимо поддержки экстракторов, API-сервис также предоставляет онлайн-доступ через технологию дистанционного куба и гибкое управление иерархиями.

5.3.4.8 Экстракция из внешних источников

Чтобы обеспечить экстракцию данных, включая метаданные, из внешних источников на уровне приложения, SAP BW предоставляет открытый интерфейс, который называется Staging BAPI (Business Application Programming Interface). Этот интерфейс имеет две цели. Во-первых, он соединяет внешние инструменты ETL с SAP BW. SAP BW можно использовать с целым рядом внешних инструментов экстракции, преобразования и загрузки ETL. Во-вторых, он предоставляет доступ к объектам SAP BW, обеспечивая возможность использования обычных способов экстракции. Вторая цель особенно важна для компаний, которые предпочитают использовать свои собственные программы экстракции данных.

5.3.4.9 Экстракция на уровне базы данных или файла DB Connect

Все больше данных перемещаются в реляционные базы данных, и SAP BW предоставляет гибкие возможности для экстракции данных непосредственно из таблиц СУБД. Доступ к отдельным таблицам или ракурсам таблиц может осуществляться для СУБД, которые поддерживаются SAP. DB Connect - это сервис, обеспечивающий загрузку метаданных, реализующий тиражирование таблиц метаданных и ракурсов в репозитарий метаданных SAP BW

Плоские файлы

Переменные данные и метаданные (включая иерархии) могут загружаться в SAP BW из плоских файлов, таких как файлы CSV Microsoft Excel и файлы ASCII. При необходимости метаданные можно также вводить вручную. В SAP BW можно создавать процедуры, которые автоматизируют экстракцию данных из плоских файлов.

XML

SAP BW может импортировать метаданные в формате XML, который де-факто становится стандартом для переноса данных. Для файлов XML SAP BW использует модель, основанную на стандарте общей метамодели хранилища данных (CWM). Файлы XML могут импортироваться или экспортироваться через инструментальные средства администратора в SAP BW. Кроме того, также доступна услуга HTML, чтобы метаданные можно было запрашивать таким же образом, как и на веб - сервере. Интерфейс XML реализует push-механизм, в котором перенос данных в SAP BW инициируется исходной системой.

В целом SAP BW предоставляет всесторонние возможности для экстракции, преобразования и загрузки данных из самых разнообразных источников. Как результат, концепция хранения данных в рамках mySAP BI предоставляет лицам, принимающим решения, полный обзор бизнеса, преодолевающий границы изолированных блоков данных и барьеры между подразделениями компании - тот обзор, который является ключевым для обеспечения точных своевременных ответов на все вопросы, связанные с бизнесом.

5.3.4.10 Многомерные модели и агрегаты

Многомерные модели (OLAP - кубы) предоставляют ракурсы данных, необходимые для выполнения анализа, которые отражают одновременно несколько измерений данных, такие как время, место и продукт. При помощи многомерного анализа (OLAP) можно отвечать на такие сложные вопросы бизнеса, как "Какова наша выручка по регионам и офисам в пределах каждого региона, год нарастающим итогом и насколько она отличается от того же периода в прошлом году?" или "Какие продукты в пределах подразделения "А" вместе составляют 80% общей прибыли этого подразделения на основании сбыта и связанных прямых и косвенных затрат за последние три года?" Процессор OLAP SAP BW выполняет запросы, которые сформулированы на основании бизнес - требований.

В SAP BW многомерные модели - это инфо-кубы. Инфо - куб содержит два типа данных, которые используются для анализа:

· Показатели, такие как выручка, постоянные затраты, объем сбыта или количество сотрудников.

· Признаки, такие как продукт, тип клиента, финансовый год, период или регион. Признаки используются для создания групп оценки для анализа.

Размещено на http://www.allbest.ru

Рисунок 5.5 - Многомерная модель

Основные инфо - объекты, которые составляют инфо - куб, распределяются по категориям относительно этих двух типов данных. То есть данный инфо - объект представляет собой либо показатель, либо признак. Третий тип инфо - объектов - атрибуты - содержит метаданные, описывающие другие инфо - объекты.

Эти два типа несущих данных инфо - объектов объединяются для выполнения анализа многомерных объектов. На приведенном выше рисунке показатели представлены в выручке для таких продуктов, как стекло и керамика. Признаки (или группы оценки) представлены как регионы (Север, Юг и Восток) и группы клиентов (розничные, оптовые и супермаркеты). Анализ при помощи этой модели может показать, например, "выручку за керамические изделия, проданные в магазинах в северном регионе".

Инфо - куб представлен в СУБД как набор реляционных таблиц, организованных в соответствии со схемой "звезда" технологией, которая организует данные в соответствии с бизнес - измерениями (см. Рисунок 5.5). В определении инфо - куба признаки суммируются в таблицы измерений. Схема "звезда" размещает несколько таблиц измерений вокруг центральной таблицы фактов. Таблица фактов хранит показатели, в то время как окружающие таблицы измерения хранят признаки, необходимые для оценки и отчета по этим показателям. Таблицы измерения не зависят друг от друга. Таблица фактов соединяет таблицы измерений и показатели.

5.3.4.11 Схема "звезда"

SAP BW использует расширенную схему "звезда", которая строится на основной схеме, сохраняя основные данные об атрибутах, иерархиях и тексте в отдельных таблицах, которые используются разными инфо - кубами. Это сокращает избыточность данных, потому что основные данные сохранятся только один раз, а затем используются разными инфо - кубами. Схема "звезда" также поддерживает подход к моделированию бизнеса mySAP BI двумя способами. Во-первых, можно легко строить иерархии для отражения бизнес - структуры. Во-вторых, изменения в данных обрабатываются немедленно и последовательно. Еще одним преимуществом расширенной схемы "звезда" является то, что изменения в инфо - кубе автоматически применяются к соответствующим агрегатам (уплотнениям данных в схеме "звезда", оптимизированным для быстрого доступа). Также известная как реорганизация данных, эта важная функция постоянно синхронизирует инфо - кубы и агрегаты, несмотря на постоянные изменения в бизнес - процессах.

Рисунок 5.6 - Схема "звезда"

Как и предварительно рассчитанные варианты данных, агрегаты сокращают время запроса, подготавливая ответы до того, как задаются вопросы. Агрегат хранит краткий вариант набора данных инфо - куба, т.е. он уплотняет исходную таблицу фактов инфо - куба. Эта сжатая таблица обеспечивает быстрый доступ к данным в инфо - кубе, что повышает производительность запроса. Система поддерживает в агрегатах самую последнюю информацию. Когда изменяется основной инфо - куб, связанный с ним агрегат автоматически модифицируется, чтобы отразить новые данные. В SAP BW система генерирует предложения для создания оптимальных агрегатов, и системный администратор может после этого решить, создавать эти агрегаты или нет.

Инфо - кубы, хранящиеся в SAP BW, основаны на реляционном хранении данных и могут использоваться для ROLAP-процессов (данные хранятся в таблицах, сгруппированных по схеме "звезда"). Связанные с ними агрегаты известны как агрегаты ROLAP. Если SAP BW работает на сервере Microsoft SQL, компании могут также строить агрегаты при помощи многомерного хранилища данных для создания агрегатов MOLAP. В этом случае для хранения используется Microsoft Analysis Services, и доступ к ним осуществляется процессором OLAP SAP BW.

На выбор между двумя типами агрегатов - MOLAP и ROLAP - оказывают влияние несколько факторов: количество данных в инфо - кубе, уровень детализации данных, спрос на подробный анализ и количество "стандартных" запросов. Всеобщей идеальной архитектуры OLAP, такой, которая предлагала бы наиболее эффективное решение для каждой организационной и функциональной потребности, не существует.

Независимо от типа хранения, агрегаты обеспечивают повышение производительности. Благодаря гибкой архитектуре SAP BW можно внедрять модели данных, которые охватывают все аналитические сценарии, независимо от основной базы данных SAP BW.

5.3.4.12 Интегрированный подход

В целом SAP BW обеспечивает интегрированный подход к хранению данных и соответствующим передвижениям данных. Есть два основных принципа: сокращение количества перемещений данных и использование одного набора данных разными способами. Это обеспечивает точность данных, сокращает задержки и, в конечном счете, повышает управляемость системой. При этом также повышаются прозрачность данных и возможность бесшовного и легкого развертывания.

5.3.4.13 Постановка задачи

Итак, рассмотрим использование инструментария SAP BW на конкретном примере.

В качестве исходных данных используется упрощённая таблица фактов в формате .xls

На основе этих данных надо построить инфо-куб Транспорт, в котором будут три показателя и два признака:

Показатели:

· кол-во пассаж

· кол-во ед. ПС

· регулярность.

Признаки:

· вид транспорта

· год.

Рисунок 5.7 - Таблица фактов

Для достижения поставленной задачи необходимо выполнить следующие действия:

· подготовить данные для загрузки в BW

· создать мета-описания инфо-объектов и инфо-куба

· создать источник данных

· организовать загрузку данных в инфо-кубы.

5.3.4.14 Подготовка данных к загрузке в BW

В качестве источника данных для SAP BW могут использоваться SAP-системы, приложения других разработчиков, базы данных и плоские файлы.

В нашей случае источником данных служит плоский файл. Он должен быть в формате CSV Microsoft Excel или ASCII.

Таким образом, исходный файл необходимо перевести в формат .csv

Для того чтобы загрузка прошла без ошибок, в качестве знака отделения десятичной части в числах должна использоваться точка (используйте автозамену в Блокноте), а текст должен состоять только из заглавных букв.

Рисунок 5.8 - Таблица фактов в формате CSV

5.3.4.15 Создание инфо-области

Инфо-область представляет из себя каталог инфо-объектов, принадлежащих одной предметной области. Для создания инфо-области необходимо:

1. Запустить транзакцию RSA1.

2. Выбрать путь по меню Моделирование > Инфо-провайдер.

3. Используя контекстное меню создать инфо-область

Рисунок 5.9 - Создание инфо-области

4. Указать техническое имя длиной от 3 до 9 латинских букв или цифр и краткое описание.

5.3.4.16 Создание каталогов инфо-объектов

В инфо-области можно создавать 2 типа каталогов инфо-объектов : показатели и признаки . Для создания каталога инфо-объекта необходимо:

1. Запустить транзакцию RSA1.

2. Выбрать путь по меню Моделирование > Инфо-объекты

3. Используя контекстное меню в новой инфо-области создать каталог инфо-объектов.

Рисунок 5.10 - Создание каталогов инфо-объектов

4. Указать тип инфо-объекта Признак или Показатель и выбрать Создать (F5).

5.3.4.17 Создание показателей

Для создания показателя в разделе Инфо-объекты необходимо:

1. Используя контекстное меню в новом каталоге показателей создать инфо-объект

Рисунок 5.11 - Создание инфо-объекта

2. Ввести техническое имя и название показателя

Рисунок 5.12 - Ввод имени показателя

3. Для созданного показателя нужно задать:

· Тип данных (количество, число,…) и единицу измерения (активно в зависимости от типа)

· Агрегация (суммирование, максимум,…)

· Прочие атрибуты (десятичные разряды, представление,…)

Рассмотрим содержание основных закладок.

Закладка Тип/единица

Тип данных. Для показателей суммы, количества и количества позиций можно выбрать десятичные числа или числа с плавающей запятой для большей точности. Для показателей даты и времени можно выбрать десятичные числа.

Возможны следующие комбинации показателя и типа данных:

Таблица 5.3 - Комбинации показателя и типа данных

Тип показателя

Тип данных

AMO: сумма

CURR: поле валюты, тип данных - десятичные числа (DEC)

FLTP: число с плавающей запятой (точность 8 байт)

QUA: количество

QUAN: поле количественных данных, тип данных - DEC

FLTP: число с плавающей запятой (точность 8 байт)

NUM: количество позиций

DEC: поле вычисления или поле суммы с запятой и знаком +/-.

FLTP: число с плавающей запятой (точность 8 байт)

INT: целое число

INT4: целое число из 4 байт со знаком +/-

DAT: дата

DATS: поле даты (ГГГГММДД), тип данных - символьный (8)

DEC: поле вычисления или поле суммы с запятой и знаком +/-.

TIM: время

TIMS: поле времени (ччммсс), тип данных - символьный (8)

DEC: поле вычисления или поле суммы с запятой и знаком +/-.

Валюта/единица измерения. Показателю можно присвоить постоянную валюту. Если это поле заполнено, валюта показателя в BW остается неизменной. Показателю можно присвоить также переменную валюту. В поле Единица/валюта необходимо определить инфо-объект, несущий единицу измерения показателя. Для показателей количества или суммы это поле должно быть заполнено, либо необходимо ввести постоянную единицу измерения валюты или суммы.

Закладка Агрегация

Существуют три варианта агрегации:

· Минимальное значение

· Максимальное значение

· Сумма

Специальная агрегация. В этом поле определяется способ агрегации показателя в Business Explorer по отношению к специальному признаку. Это относится главным образом ко времени.

Ссылочный признак для специальной агрегации. Выберите в этом поле признак, относительно которого показатель должен агрегироваться с помощью специальной агрегации. В основном, следует выбирать временной признак. Тем не менее, можно выбрать любой требуемый признак.

Рисунок 5.13 - Редактирование показателя

5. Далее следует сохранить и активировать объект (также это надо делать при изменении).

5.3.4.18 Создание признаков

Для создания признака в разделе Инфо-объекты необходимо:

1. Используя контекстное меню в созданном каталоге признаков создать инфо-объект

2. Ввести техническое имя и название признака

Рисунок 5.14 - Ввод имени признака

3. Для созданного признака нужно задать:

· Общие данные (тип данных)

· Business Explorer (представление, вид текста)

· Основные данные/тексты (без основных данных, с текстами)

· Иерархия (без иерархий)

· Соединение (без изменения)

Рассмотрим содержание основных закладок.

Закладка Общее

На этой закладке определяются основные свойства признака.

ABAP-словарь. Здесь определяется тип данных и длину данных. Система предоставляет список для выбора из справки по допустимым значениям ввода.

Для признаков поддерживаются следующие типы данных:

Char:

цифры и буквы

Длина: 1 - 60 символов

Numc:

только цифры

Длина: 1 - 60 символов

Dats:

Дата

Длина: 8 символов

Tims:

Время

Длина: 6 символов

В полномочиях интерпретируются только первые 32 символа.

Строчные буквы допустимы/недопустимы. Если этот индикатор установлен, система разграничивает строчные и заглавные буквы при использовании маски экрана для ввода значений. Если этот индикатор не установлен, система преобразовывает все буквы в заглавные при использовании маски экрана для ввода значений. Если в атрибуте используются строчные буквы, система не может создать таблицу основных данных. Атрибут не может иметь иерархий или использоваться в качестве атрибута навигации.

Признак как свойство документа. Можно задать использование признака в качестве свойства документа. Это позволяет присваивать примечание (в качестве которого может выступать любой документ) комбинации значений признака и показателя. Поскольку использовать функцию примечания для всех признаков нецелесообразно, нужно четко определить признаки, которые должны появиться в примечаниях. При использовании этого свойства система генерирует свойство (атрибут) для данного признака в метамодели системы управления документами. По техническим причинам данное свойство (атрибут) должно записываться в (фиктивный) запрос на перенос, что сопровождается открытием соответствующего диалогового окна, но фактического переноса не происходит.

Константы. Присвоение признаку константы означает присвоение признаку постоянного значения. Таким образом, признак становится доступным в базе данных (например, для верификаций), однако уже не может использоваться в отчетах (агрегация/развертка для этого признака невозможна). Присвоение константы целесообразно в основном для составных признаков.

Подпрограмма переноса. После создания подпрограмма переноса действует для признака глобально и включается во все правила переноса. В частности, при загрузке данных из различных исходных систем ведение подпрограммы переноса выполняется только один раз. С другой стороны, при ведении правил переноса из структуры переноса в структуру связи локальную подпрограмму переноса можно присвоить признаку. После создания как локальной, так и глобальной подпрограммы переноса используются обе подпрограммы переноса (сначала локальная, затем глобальная).

Закладка Business Explorer

На этой закладке определяются релевантные для отчетов свойства признака, которые требуются для Business Explorer.

Формат описывает содержимое ключевого столбца для данного признака в Business Explorer. Существуют различные опции просмотра: без просмотра, текст, ключ, текст и ключ, подробный текст или средний текст.

Вид текста. Это поле позволяет выбрать текст, появляющийся для этого признака в Business Explorer. Можно выбрать подробное или краткое описание признака.

Выбор. С помощью выбора описывается метод ограничения (если таковое необходимо) значения признака в запросах. При выборе опции Уникально для каждой ячейки признак необходимо ограничить одним значением в каждом столбце и в каждой структуре во всех запросах. Это признак нельзя использовать в агрегатах. Типичными примерами этого вида признака являются Идентификатор план/факт или Тип значения.

Атрибут валюты. Выберите инфо-объект единицы типа валюты, созданный в качестве атрибута признака. Эта валюта используется в качестве целевой валюты по умолчанию для пересчета валют в Business Explorer.

Релевантность полномочий. Определенный признак можно включить в проверку полномочий или исключить из нее при работе с запросом. Признак следует пометить как релевантный для проверки полномочий при создании полномочий, ограничивающих для этого признака условия выбора отдельным значением признака. Признак можно пометить как нерелевантный для проверки полномочий только в том случае, если он уже не используется в качестве поля для объекта полномочий.

Географический тип. Для каждого географически релевантного признака требуется определить географический тип. Различают 4 географических типа:

Статический геопризнак: для просмотра признака на карте в Business Explorer этот тип геопризнака позволяет использовать Shapefile (например, границы страны).

Динамический геопризнак: для этого типа геопризнака система генерирует геоатрибуты, позволяющие, в частности, просмотреть клиентов на карте.

Динамический геопризнак со значениями атрибута: для этого типа геопризнака используются геоатрибуты геопризнака типа 2 (который является атрибутом).

Статический геопризнак с геоатрибутами: то же, что и статический геопризнак, но с добавлением сгенерированных геоатрибутов.

Если выбирается опция Без геопризнаков, этот признак не может использоваться в качестве геопризнака для просмотра информации на карте BЕх. Географические атрибуты (например, 0LONGITUDE, 0ALTITUDE) из инфо-объекта удаляются.

Геоатрибут. При выборе географического типа Динамический геопризнак со значениями атрибута здесь необходимо определить атрибут признака, геоатрибуты которого предполагается использовать.

Загрузка Shapefile. Эта функция позволяет загрузить файлы, в которых содержатся географические данные, присвоенные признаку. Эти файлы, как логически связанные с признаком, хранятся в сервисе бизнес-документов (BDS).

Выгрузка географических данных. Эта функция используется для загрузки основных данных признака в компьютер пользователя, где они геокодируются при помощи инструмента ГИС (графической информационной системы). Затем данные необходимо загрузить посредством плоского файла в соответствующую таблицу основных данных BW.

Закладка Основные данные/тексты

На этой закладке определяется, будет ли признак иметь доступ к основным данным и/или текстам.

С основными данными. Здесь определяется, будет ли признак иметь основные данные. Нужно создать таблицу основных данных для признака, если признак должен иметь атрибуты. При выборе этой опции система генерирует таблицу основных данных. При помощи функции ведения основных данных выполняется переход в соответствующее диалоговое окно ведения. Таблица основных данных состоит двух частей: зависящей от времени и не зависящей от времени. В ведении атрибута задается зависимость или независимость атрибута от времени. Зависящие от времени атрибуты навигации в агрегатах использовать нельзя.

С текстами. Здесь определяется, будет ли признак иметь тексты. Если нужно, чтобы признак имел тексты, выберите по крайней мере один текст. По умолчанию установлен краткий текст (20 символов), однако можно выбрать средний текст (40 символов) или подробный текст (60 символов).

Зависящие от языка тексты. Можно выбрать, будут ли тексты в текстовой таблице зависеть от языка. Если решено, что тексты будут зависящими от языка, язык становится ключевым полем в текстовой таблице. Если решено, что тексты не будут зависящими от языка, текстовая таблица не получает поле языка.

Некоторые признаки бизнес-содержимого, например, клиент (0CUSTOMER), не должны быть зависящими от языка.

Зависящие от времени тексты. Если нужно, чтобы тексты были зависящими от времени, т.е. чтобы дата была включена в ключ текстовой таблицы, здесь устанавливаются соответствующие параметры настройки

Закладка Иерархия

Если необходимо создать иерархию или загрузить существующую иерархию из исходной системы, нужно установить индикатор С иерархией. Система генерирует таблицу иерархии с иерархическими отношениями для признака.

Для иерархий задаются следующие свойства:

· Необходимость создания версий для иерархии;

· Зависимость от времени всей иерархии или только иерархической структуры;

· Возможность использования интервалов иерархии;

· Активация/деактивация функции смены знаков +/- для узлов. При активированной функции смены знаков +/- для иерархий можно определить для каждого узла иерархии, представленного в запросе, нужно ли менять знак +/- для переменных данных, присвоенных каждому из узлов.

· Определение допустимых признаков для показа в узлах.

Закладка Атрибуты

На этой закладке определяется наличие или отсутствие атрибутов или навигационных атрибутов у признака, а также свойства признаков. Атрибуты - это уже существующие и логически присвоенные новому признаку инфо-объекты.

Закладка Соединение

На этой закладке определяется соединение признака с другими инфо-объектами. Иногда для отображения модели данных требуются связанные инфо-объекты. Некоторые инфо-объекты не могут получить уникального определения без соединения.

Рисунок 5.15 - Редактирование признака

5. Далее следует сохранить и активировать объект.

5.3.4.19 Создание инфо-куба

Для создания инфо-куба в разделе Инфо-провайдеры необходимо:

1. Используя контекстное меню в инфо-области создать инфо-куб

Рисунок 5.16 - Создание инфо-куба

2. Ввести техническое имя и название инфо-куба

Рисунок 5.17 - Обработка инфо-куба

3. Нажатием на кнопку добавить каталог показателей в область образцов

4. Затем перетащить необходимые показатели направо в папку Показатели

Рисунок 5.18 - Редактирование инфо-куба

6. Присвоить признаки соответствующим измерениям.

7. Переименовать измерения, зайдя в их свойства.

8. Нажатием на кнопку Все инфо-объекты добавить временные признаки в область образцов.

9. Перетащите необходимый временный признак в измерение Время.

Рисунок 5.19 - Редактирование инфо-куба

9. Сохранить и активировать инфо-куб.


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.