Автоматизация процессов обработки потоков новостей в сети Интернет с целью интеграции контента

Технико-экономическая характеристика предметной области. Анализ существующих разработок, выбор и обоснование стратегии автоматизации и способа приобретения ИС. Характеристика первичных документов с нормативно-справочной и входной оперативной информацией.

Рубрика Программирование, компьютеры и кибернетика
Вид дипломная работа
Язык русский
Дата добавления 10.03.2013
Размер файла 3,6 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Объекты «Новость», «Тело новости» заполняются данными из сущности «Новость RSS потока из сети Интернет» на протяжении всего времени работы системы. При этом, программными средствами реализовывается сохранение целостности Тела новости и новости. Поле объекта «Тело новости» Код тела новости, заполняется Кодом новости из объекта «Новости», если не удалось найти привязку новостей и записей «Тела новости».

Объект «Источник RSS новости» заполняется из сущности «Источник RSS потока». И заполняется на стадии создания системы.

Рис. №2.4. Схема инфологической модели

Данная модель, отражающая взаимосвязи объектов, отражает детальную картину проектируемых задач. На модели проиллюстрированы все взаимосвязи объектов.

Детально рассмотрим представленную модель. На данной модели сущности Тело новости и Новость имеют связь один ко многим, процессе работы системы. Данная связь отражает, что у одного тела новости может быть несколько новостей. При этом новости связываются с телом новости по заранее разработанному алгоритму определения схожести новостей, что позволяет сформировать сюжеты по одной теме. Таким образом, новости, связанные с телом новости образуют новостной сюжет. Подобные новостные сюжеты впоследствии и передаётся автоматизированной системе в качестве ответа на запрос.

Так же на модели имеется сущность категория новости. Данная сущность отражает классификацию новостей по разным категориям. Ответ автоматизированной системе составляется на основании выбранной категории. Сами сущности связанны связью один ко многим. Что показывает, что у каждой категории может быть несколько новостей.

Сущность источник новости также связан с сущностью новость связью. Один ко многим, что отражает, что у каждого источника может быть по несколько новостей. Данная связь помогает исключить попадание в базу дубликатов новостей, а так же если в дальнейшем потребуется, вывод сюжетов в зависимости от источников.

Даталогическая модель представляет собой отображение инфологической модели в компьютеро-ориентированном виде, то есть в виде понятным для СУБД. На основании инфологической модели рисунок 2.4 была построена даталогическая модель. Структура даталогической модели представлена на рисунке 2.5.

Рис. 2.5 Структура даталогической модели

Описание полей даталогической модели представлены в таблице 2.6.

Таб. 2.6 Описание полей даталогической модели

Сущность

Название таблицы

Атрибут

Идентификация поля

Тип поля

Тело новости

NEWSBODY

Код тела новости

ID_NEWSBODY

VARCHAR

Название категории новости

DATA_NEWSBODY

INTEGET

Новость

NEWS

Код новости

ID_NEWS

VARCHAR

Код категории новости

ID_CATALOG_NEWS

INTEGET

Код источника RSS потока

ID_RSSBOT

INTEGET

Код тела новости

ID_NEWSBODY

VARCHAR

Название новости

TITLE_NEWS

VARCHAR

Текст новости

MINITEXT_NEWS

TEXT

Гиперссылка новости

URL_NEWS

TEXT

Автор новости

AUTOR_NEWS

VARCHAR

Дата новости

DATE_NEWS

INTEGET

Картинка новости

IMAGE_NEWS

VARCHAR

Видео новости

VIDEO_NEWS

VARCHAR

Аудио новости

AUDIO_NEWS

VARCHAR

Категория новости

NEWS_CAT

Код категории новости

ID_NEWS_CAT

INTEGET

Название категории новости

NAME_NEWS_CAT

VARCHAR

Источник RSS потока

RSSBOT

Код источника RSS потока

ID_RSSBOT

INTEGET

Название RSS потока

NAME_RSSBOT

VARCHAR

Домен RSS потока

URL_SITE_RSSBOT

VARCHAR

Гиперссылка RSS потока

URL_RSSBOT

TEXT

Точное время сканирования RSS потока

UPDATE_RSSBOT

INTEGET

Интервал сканирования RSS потока

INTERVAL_RSSBOT

INTEGET

Время последнего сканирования RSS потока

TIMEU_RSSBOT

INTEGET

В результате работы система, а именно при обращении к ней автоматизированной системы получения релевантных новостей. Составляется запрос к базе данных на получение наиболее релевантных новостей по названию и описанию книг, в определённом каталоге, которые были получены от автоматизированной системы. Результатом выполнения запроса, ответ от SQL сервера в виде таблицы, которая не требует дальнейшего сохранения. Данная таблица получается из нескольких таблиц в базе: Тело новости, новости, категория, источник. Таблица имеет от нуля до пяти записей, и отсортирована по убыванию степени релевантности. Для определения релевантности используется встроенные возможности СУБД MySQL. В частности SQL код MATCH (название поля в таблице) AGAINST ('Текст для определения релевантности'). Пример таблицы с результатной информации представлен в таблице 2.7.

Таблица 2.7 Пример таблицы с результатной информацией

Название поля

Идентификатор Поля

Тип поля

Значность Поля

1

Код новости

ID_NEWS

Числовой

15

2

Код тела новости

ID_NEWSBODY

Числовой

15

3

Код источника новости

ID_NEWS_FROM

Числовой

15

4

Период обновлений

PERIOD_OBN

Строковый

23

5

Название новости

TITLE_NEWS

Строковый

150

6

Текст новости

MINITEXT_NEWS

Строковый

500

7

Название категории новости

CATALOG_NEWS

Строковый

200

8

Код категории новости

ID_CATALOG_NEWS

Числовой

15

9

Гиперссылка новости

URL_NEWS

Текстовый

-

10

Автор новости

AUTOR_NEWS

Строковый

200

11

Дата новости

DATE_NEWS

Числовой

11

12

Картинка новости

IMAGE_NEWS

Строковый

300

13

Видео новости

VIDEO_NEWS

Строковый

300

14

Аудио новости

AUDIO_NEWS

Строковый

300

15

Показатель релевантности

score

Числовой

7

Далее, на основании получаемой таблицы с данными формируется исходящий файл, как ответ для автоматизированной системы. В этот файл входят все поля кроме полей: Период обновления, и показателя релевантности. Эти поля являются важными только для внутренней работы системы. Из остальных полей, формируется файл ответа для автоматизированной системы. При это поля: Картинка новости, Видео новости, Аудио новости и Автор новости могут иметь пустые значения. Все остальные поля обязательны при составлении результатного документа.

На основании результатной таблицы 2.7, составляется результатный файл в формате XML, который отправляется как ответ, автоматизированной системы получения новостей. Электронный вид документа представлен в приложении 1 рисунок 1.2. На рисунке видно, что документ имеет человекопонятный вид. Однако этот документ предназначен для автоматизированной системы, которая в соответствии с требованиями формирует на сайте сформированные сюжеты новостей, данные для которых расположены в тегах ITEM разметки XML. Данный документ является весьма важным для предприятия. Так как он является частью полезного ключевого контента для привлечения большего числа пользователей, а следовательно, и увеличение заказов в Интернет-магазине.

Используя полученные данные из этого документа можно строить различные варианты вывода информации, что продемонстрировано в приложении 1 рисунки 1.8 и 1.9.

2.2 Программное обеспечение задачи

2.2.1 Общие положения

Для разработки данного проекта принято решение использовать скриптовая язык программирования PHP версии 5. А в качестве среди разработки была использована программа PHP Expert Editor. Данная программа обладает множеством встроенных функций, удобной подсветкой кода, а так же способностью подключаться по защищённому SSH2 SSH - сетевой протокол прикладного уровня, подробнее см. [21] каналу связи для редактирования программного кода на лету.

Все действия и манипуляции с автоматизированной системой происходят через удалённый доступ по каналам связи сети Интернет и не имеют пользовательского интерфейса. При этом если учесть то, что все функции системы разделены на основные и служебные, можно изобразить структуру системы в виде дерева функций. Учитывая все особенности системы, её удалённое расположение на выделенном сервере, возможность доступа к ней по защищённому каналу SSH2, при использовании бесплатного встроенного функционала в Unix системах или при использовании так же бесплатной программы Putty Putty - свободно распространяемый клиент для протокола SSH, подробнее см. [22] в операционных системах Windows, архитектура проектируемой системы представлена в виде дерева функций на рисунке 2.7.

Сценарий диалога позволяет детально определить иерархию выполняемых операций в реализованном проекте. Схема сценария диалога представлена на рисунке 2.6.

Рисунок 2.6. Сценарий диалога

Рисунок 2.7. «Дерево функций»

2.2.2 Структурная схема пакета

Основываясь на дереве функций, представленном на рисунке 2.7 было построено дерев программных модулей, в состав которого вошли все программные составляющие. На рисунке 2.8. представлено дерево программных модулей.

Рисунок 2.8. «Дерево программных модулей»

2.2.3 Описание программных модулей

В процессе разработки автоматизированной средства на языке программирования PHP был использован весь доступный функционал среды разработки PHP Expert Editor, а так же встроенной среды разработки портала farseer.ru, которая также ориентирована на язык PHP. Стало возможным, выделить основной функционал в отдельные модули, такие как:

· Добавление источника RSS новостей.

· Автоматизированная обработка RSS потоков новостей.

· Поиск релевантных RSS новостей.

Все выделенные модули расположены на удалённом сервере в сети интернет. Их запуск и автоматизированная работа осуществляется с встроенного функционала связи по защищённому протоколу передачи данных SSH2, Unix систем, либо с использованием бесплатного продолжения putty для Windows систем.

Модуль «Добавление источника RSS новостей» - процесс, позволяющий добавлять источники RSS каналов непосредственно в базу. При этом в качестве информации выступаю: название источника, домен источника гиперссылка источника, и временные правила для организации расписания сканирования источника.

Модуль «Автоматизированная обработка RSS новостей» - набор процессов связанных для выполнения общей поставленной задачи. Среди таких процессов можно выделить:

· Процесс загрузки новостей из RSS источника.

· Процесс обработки новой записи.

· Процесс рубрицирования записи.

Процесс загрузки новостей из RSS источника отвечает за то, что по заранее сформированному временному сценарию, обращается к RSS источникам новостей, получает файл в формате RSS. Использую служенную функцию для работы XML и RSS, переводит информацию в новостной массив данных.

Процесс обработки новой записи, получает данные в виде новостного массива данных и начинает проверять каждую новость в отдельности на то, что есть ли такая новость уже в базе или нет. Если новость уже есть то процесс переходит к другой новости для обработки. Если же новости нет то новость сохраняется в базу. При этом идёт проверка на релевантное сходство обрабатываемой новости с имеющимися новостями в базе. Если сходство обнаружено, то вновь добавленная новость связывается с телом похожей новости, если нет, то обрабатываемая новость сама получает собственное тело новости.

Процесс рубрицирования записи, даны процесс заключается в том, что все поступающие новости сводятся к 19 категорий заложенных в базу при разработке. При этом если у новости нет категории, то она получает категорию родительской новости.

Модуль «Поиск релевантных RSS новостей» - набор процессов организующих релевантную выдачу по определённо заданному запросу. В качестве запроса участвуют описания и название книг, по заранее определённым разделам. Данный модуль также состоит из нескольких важных процессов:

· Процесс преобразования запроса поиска

· Получения кода релевантных новостей

· Составление ответа

Процесс преобразования запроса поиска заключается в том, что поступивший запрос от автоматизированной системы после обработки преобразовывает в строку с SQL запросом.

Процесс получения кода релевантных новостей, получает сформированную строку SQL запроса и выполняет её, для получения списка кодов наиболее релевантных новостей.

Процесс составления отчёт заключается в том, что по полученным спискам составляет ответ для автоматизированной системы в формате XML

Подобное разделение модуля на отдельные процессы позволяет распределить нагрузку между несколькими процессами, что значительно повышает производительность.

2.3 Технологическое обеспечение задачи

Технология сбора обработки и выдачи информации наглядно продемонстрирована на рисунках 2.9, 2.10, 2.11. Сам технологический процесс начинается с добавления в систему RSS источников новостей. Это происходит путём введения данных об источниках, с помощью использования файла запроса к процессу обработки. В котором содержится информация об RSS источнике новостей. Данная обработка, входящей информации, происходит на стадии запуска автоматизированной системы. Это наглядно продемонстрировано на рисунке 2.9. В результате система получает базу со всей информацией об источниках RSS новостей.

Далее с использованием базы RSS источников новостей, и расписания автоматизированной работы идёт обращение ко всем источникам новостей. Вся новостная информация поступает в электронном виде от источников новостей и имеет формат RSS. Данная информация переводится из RSS формата в массив данных, который временно хранится в оперативной памяти. Дальнейшая цель системы, это поочерёдно обработать все вновь полученные новости. В начале, идёт проверка на наличие новостей хотя бы одной новости в массиве данных, который хранится в оперативной памяти. Если массив данных пуст, то система заканчивает обработку. Если массив данных не пуст, то начинается обработка массива. Каждая обработка заключается в поочерёдном обращении к каждой записи в массиве данных. Каждая отдельная запись в данном массиве является отдельной новостью. В начале, берётся запись, и базы новостей и тел новостей. На этом этапе запись сравнивается с уже существующими новостями в базе. Если удалось найти сходство новостей по заранее определённым параметрам в системе. То запись становится новой новостью с прикреплением её к телу новости и сохраняется в виде новости в базу новостей. Если не удалось найти сходство обрабатываемой записи и новостей в базе, то запись записывается в базу тела новости и в базу новостей с организацией связи между телом новости и самой новостью. После операции по сравнению новостей идёт рубрицирование вновь добавленной новости. При этом если в данных о новой новости есть привязка, к какой-то рубрике, то она сводится к одной из 19 рубрик, заранее зафиксированных в системе. Если таковой привязки нет, то новая новость получает туже привязку к каталогу что и тело новости, к которой она относится. Далее процесс заключается в том, что бы удалить из месива данных только что обработанную новость и перейти к обработке всех новостей. После того как все вновь поступившие новости обработаны. Система заканчивает работу. Схема технологического процесса обработки информации представлена на рисунке 2.10.

Схема технологического процесса обработки и выдачи результатной информации представлена на рисунке 2.11. На этой схеме показано, что в начале идёт запрос от автоматизированной системы в виде данных о запросе. В данном запросе содержится указание каталога новости, по которой следует производить поиск новостей, и непосредственно текс, по которому будет производиться поиск. В начале, идёт преобразование поступившего запроса в строку с SQL кодом обращение к базе данных новостей. Далее идёт обращение составленного запроса к базе новостей для получения массива с кодами новостей, который временно содержится в оперативной памяти. Следующей задачей является определить, найдены новости или нет, поэтому следующим этапом идёт проверка массива в оперативной памяти. Если в этом массиве есть хоть одна новость, то из базы данных собирается информация о новостях код которых содержится в массиве котов. Все полученные данные переводятся в электронный формат XML. Если в массиве не найдено ни одной новости, то формируется электронный ответ об этом так же в формате XML. Сформированный XML ответ отправляется в виде электронного файла для той системы, которая отправляла запрос на поиск новостей.

Рис. 2.9 Схема технологического процесса «Добавление источников RSS новостей»

Рис. 2.10 Схема технологического процесса «Автоматизированная обработка RSS потоков новостей»

Рис. 2.11 Схема процесса поиск релевантных RSS новостей»

2.4 Описание контрольного примера реализации проекта

В данном разделе будет описан контрольной пример работы с системой. Это одна из важнейших частей данного дипломного проекта. Так как здесь демонстрируется работоспособность всех разрабатываемых элементов системы

В рамках данного проекта была разработана полностью автоматизированная система, которая не требует наличие экранных форм на этапе её эксплуатации. Однако на этапе запуска системы требуется внесение начальных данных разработчиком. Данная функция реализована с использованием удалённого подключение по защищённому каналу связи SSH2. Для демонстрации подобного подключения используется программа putty работающая в Windows системах. При этом в unix системах никаких дополнительных приложений не требуется, так как в них есть встроенная утилита связи SSH.

Поскольку подключение удалённое, оно может производиться с любого компьютера и из любого места. При этом встроенная система защиты на удалённом сервере иллюстрирует в приложении 1 на рисунках 1.3 и 1.4.

В начале, разработчиком вводится сценарий автоматизированной работы, который можно ввести при использовании команды crontable -e. При этом открывается консольный редактор, в котором можно задать сценарий автоматизированной работы. Пример подобного задания сценария продемонстрирован в приложении 1 на рисунке 1.1. После задания сценария, разработчик сохраняет его, что является стартом для начала работы автоматизированной системы.

Ещё одно действие, которое выполняет разработчик, это ввод в базу RSS источников новостей. Разработчик может это сделать так же через приложение putty но для большей наглядности пример заполненной базу продемонстрирован с подошью возможностей сервера и скрипта работы с базами phpMyAdmin phpMyAdmin - веб-интерфейс для администрирования СУБД MySQL, подробнее см. [23]. Представление базы представлено в приложении 1 рисунок 1.5.

Дальнейший функционал разработанной системы полностью автоматизирован и не имеет экранных форм. Но для того что б продемонстрировать работоспособность системы не мешать нормальному функционированию сайта zone-x.ru, были построены ряд демонстрационных примеров.

Для того что бы проиллюстрировать обращение автоматизированной системы получение новостей, будет использован стандартный браузер Mozilla Firefox 3. Самим обращением к разработанной системе будет, является запрос в адресной строке. А ответом та информация которая выведется окне браузера. Подобный вариант обращения к серверу для получения новостей полностью идентичен обращению автоматизированной системы получения новостей.

В качестве ключевых параметров будет выступать ключи cat и text. Ключ cat соответствует номеру категории. Ключ text содержит текст, по которому требуется находить наиболее подходящие новости. В данной демонстрации cat= 892345579 что соответствует разделу Интернет. Для параметра text возьмём действующую страницу на сайте zone-x.ru, а именно список книг в разделе Интернет, демонстрацию самой страницы можно посмотреть в приложении 1 рисунок 1.6. В ответ получается файл в формате XML с новостями. Подобный запрос продемонстрирован в приложении 1 рисунок 1.7.

С данными новостями в формате XML возможны любые манипуляции. Например, выдача пользователям для чтения, показ пред просмотр и расширенно на отдельной странице, трансляция в виде дополнительного RSS канала. Для демонстрации было создано пара макетов, которые можно просмотреть в приложении 1 на рисунках 1.8 и 1.9. На данных рисунках продемонстрирована возможность вывода новостных блоков, используя соответственно с оформлением сайта zone-x.ru. Вид и сложность таких новостных блоков очень разнообразна. А использование системы в целом на много проще, функциональней и эффективнее.

3. Обоснование экономической эффективности проекта

3.1 Выбор и обоснование экономической эффективности проекта

Экономическая эффективность - результативность экономической системы, выражающаяся в отношении полезных конечных результатов ее функционирования к затраченным ресурсам. Показатель экономической эффективности складывается из производственных оценок процесса до внедрения автоматизированной системы и после. При этом следует учитывать затраты, требующиеся для автоматизации процесса. В конечном итоге экономическая эффективность помогает определиться с тем, есть или нет необходимость во внедрение автоматизированного варианта системы обработки информации.

В данном дипломном проекте базовым вариантом является ручная система обработки новостной информации в ООО “Зона Икс”.

В качестве предлагаемой системы обработки информации предлагается система, на базе технологий портала farseer.ru, которыми предполагается заменить ручную обработку информации.

Экономическая эффективность проекта складывается из двух составляющих: «косвенного эффекта», который характеризуется увеличением объёмом обрабатываемой информации, повышением точности обрабатываемой информации, снижением затрат на обработку; «прямого эффекта», который характеризуется сокращением времени на обработку итоговых данных; сокращением трудоемкости работы и стоимостных затрат обработки при обработке информации; повышением достоверности и точности обработки информации.

Для расчета прямого эффекта необходимо рассмотреть показатели трудовых и стоимостных затрат.

К трудовым показателям затрат относятся следующие:

Абсолютное снижение трудозатрат () в часах за год

(1)

где T0 - трудовые затраты в часах за год на обработку информации при существующем процессе,

T1 - трудовые затраты в часах за год на обработку информации по предлагаемому варианту.

Относительное снижение трудовых затрат (KT)

(2)

Индекс снижения трудозатрат (YT)

(3)

К стоимостным показателям относятся:

Абсолютное снижение стоимостных затрат в рублях в год ()

(4)

где C0 - стоимостные затраты в рублях за год при существующем процессе,

С1 - стоимостные затраты в рублях за год по предлагаемому варианту.

Относительное снижение стоимостных затрат в рублях в год (KC)

(5)

Индекс снижения стоимостных затрат (YC)

(6)

Период окупаемости проекта (TOK)

(7)

где КП - затраты в рублях на создание и эксплуатацию проекта.

3.2 Расчёт показателей экономической эффективности

Для расчёта показателей экономической эффективности были использованы следующие показатели из реального процесса управления контентом.

· Стоимость одной добавленной записи оператором составляет шесть рублей

· На обработку и добавление одной записи оператором требуется примерно восемь с половиной минут, что составляет 7 записей в час.

В качестве накладных расходов для процесса обработки новостной информации выступает покупка и обслуживание персональной рабочей станции для оператора, так, например стоимость приобретения одной рабочей станции составляет пятнадцать тысяч рублей. Так как вся работа заключается в обработке электронной информации, дополнительных расходов на канцелярские товары не требуется. На основании приведенной выше информации построим таблицы расчёта трудовых и стоимостных затрат по базовому и проектному варианту. Расчёт стоимостных и трудовых затрат по базовому варианту приведён в таблице 3.1. расчёт стоимостных и трудовых затрат по проектному варианту приведён, в таблице 3.2.

Таблица 3.1. Расчет стоимостных и трудозатрат базового процесса обработки новостной информации

№ п/п

Наименование базовых операций

Оборудование

Ед. измерения

Объем работы в год

Норма выработки (зап./час)

Трудоемкость (гр.4 / гр.5)

Среднечасовая з/п специалиста (руб.)

Часовая стоимость накладных расходов (руб.)

Стоимостные затраты для операций, вып. на ЭВМ ((гр.7+гр.8)*гр.6)

1

2

3

4

5

6

7

8

11

1

Обработка новости

Компьютер;

запись

13909

7

1987

7

7,5

28811,5

Opera

Итого

1987

28811,5

Таблица 3.2. Расчет стоимостных и трудозатрат внедрённой системы автоматизации обработки новостной информации.

№ п/п

Наименование базовых операций

Оборудование

Ед. измерения

Объем работы в год

Норма выработки (зап./час)

Трудоемкость (гр.4 / гр.5)

Среднечасовая з/п специалиста (руб.)

Часовая стоимость накладных расходов (руб.)

Стоимостные затраты для операций, вып. на ЭВМ ((гр.7+гр.8)*гр.6)

1

2

3

4

5

6

7

8

11

1

Поиск и вывод записей

Сервер

запись

547500

400

1368,75

0

1,25

1710,9375

Итого

1368,75

1710,9375

Для автоматизированного варианта обработки данных отсутствуют такие статьи расходов как оплата ручной обработки, так как обработка производится полностью автоматизировано. Следовательно сокращается стоимость затрат на оборудование так как не требуется содержать рабочее место и обслуживать компьютер.

Для расчёта абсолютных показателей эффективности проекта должны быть использованы показатели, рассчитанные в таблицах 3.1. и 3.2. Основываясь на данных показателях, построим таблицу 3.3. Показатели затрат и таблицу 3.4. Показатели от внедрения автоматизированной системы обработки новостной информации.

Таблица 3.3 Показатели затрат

Трудовые затраты

Стоимостные затраты

Базовый вариант

T0=1987 часов

С0=28811,5+0=28811,5руб.

Проектный вариант

T1=1369 часов

С1=0 руб.

Таблица 3.4. Показатели от внедрения автоматизированной системы обработки новостной информации

Затраты

Абсолютное изменение затрат

Относительное изменение затрат

Индекс изменения затрат

Базовый вариант

Проектный вариант

Трудоемкость

T0.(час)

T1.(час)

Рассчитывается по формуле 1

Т=Т0 -Т1,(час)

Рассчитывается по формуле 2 КТ=Т/T0*100%

Рассчитывается по формуле 3

YT=T0/T1

1987

1368,75

618,25

31,11%

0,88

Стоимость

C0.(руб)

С1.(руб)

Рассчитывается по формуле 4

C=C0-C1, (руб.)

Рассчитывается по формуле 5

КC=C/C0*100 %

Рассчитывается по формуле 6

YC=C0/C1

28811,5

1710,9375

27100,5625

94%

0,07

Для более наглядной демонстрации результатов расчётов экономической эффективности трудовых и стоимостных затрат на рисунке 3.1 и 3.2 приведены две круговые диаграммы, диаграмма трудовых затрат и диаграмма стоимостных затрат соответствующе.

Рис. 3.1 диаграмма сравнения трудовых затрат

Рисунок 3.2 диаграмма сравнения стоимостных затрат

Для оценки расходов на разработку и создание автоматизированного варианта решения задачи необходимо выяснить следующие показатели:

· Приобретение удалённого сервера

· Настройка удалённого сервера;

· Разработка и внедрение системы.

Так как в проекте используется сервер, предоставляемый иностранным провайдером, цены на обслуживание оборудования во многом зависят от колебаний стоимости валюты, но в среднем стоимость одного месяца обслуживания оборудования составляет тысячу восемьсот рублей. Стоимость настройки оборудования сервера рассчитывается исходя из стоимости часовой оплаты сотрудника обладающего необходимыми навыками по настройки удалённого доступа к серверу. В настоящий момент в организации есть программист, в должностные обязанности которого входит настройка и обслуживание всего оборудования. Оплата труда программиста составляет двести пятьдесят рублей в час, время необходимое для настройки сервера составляет два часа. Для разработки и внедрения проекта потребуется привлечение одного программиста обладающего знаниями разработки приложений на языке PHP в среде разработки PHP Expert Edition, знать принципы совместной работы СУБД MySQL и PHP, основные знания по пользованию и формированию формата XML. Исходя из обзора рынка вакансий на настоящий момент, час работы подобного специалиста стоит триста рублей. Основываясь на приведенных выше данных рассчитаем затраты на разработку и внедрение автоматизированной системы. Затраты на разработку и внедрение системы приведены в таблице 3.5.

Таб. 3.5 Затраты на разработку и внедрение

Наименование работ

Трудовые затраты (час.)

Стоимостные затраты (руб.)

Проектирование

48

14000

Разработка

72

21000

Интеграция

4

1200

Тестирование

16

4000

Внедрение

2

600

Документирование

8

2000

Итого:

150

41000

Стоимость разработки системы складывается из приведённых выше расходов на работу собственного программиста, наёмного программиста и стоимости ежемесячной оплаты сервера.

КП=1800 + 500 + 41000 = 43300 рублей.

Период окупаемости для проекта рассчитывается по формуле (7) раздела 3.1

Заключение

В данном дипломном проекте была поставлена цель, полностью автоматизировать обработку поступающей информации. Сократить издержки на её обработку. Повысить количество обрабатываемой информации.

Из поставленных задач удалось полностью автоматизировать функцию сбора и обработки новостной информации, тем самым избавившись от дорогостоящего и не производительного ручного труда. Отказ от ручной обработки значительно снижает, издержи и повышает количество обрабатываемой информации.

Для достижения поставленных задач было изучено множество новостных ресурсов, информационных агентств, а так же имеющихся на рынке новостных интеграторов, таких как Рамблер Новости и Яндекс Новости. Так же были проведении измерения схожести новостей, для из дальнейшей интеграции. Так же было принято решение о выводе системы обработки новостной информации на отдельный сервер. Это должно полностью исключить препятствие нормальной работе Интернет-магазина. На удалённом сервере было разработано информационное и программное обеспечение для автоматизированной обработки новостной информации. А передача новостей реализована через xml файлы данных.

После внедрения разработанной системы на предприятии планируется её дальнейшее совершенствование и сопровождение. Так как рассматриваемая, в данном дипломе сфера интернет деятельности, является перспективной и имеет большой потенциал для развития.

Список литературы

1. Базы данных. Описание системы управления реляционными базами данных. http://ru.wikipedia.org/wiki/Microsoft_SQL_Server

2. Системы управления содержимым. Основные понятия. http://ru.wikipedia.org/wiki/Система_управления_содержимым

3. Веб-ориентированные платформы для организации работы. Основные понятия. http://ru.wikipedia.org/wiki/SharePoint

4. Услуги связи. Основные понятия и описание. http://ru.wikipedia.org/wiki/Колокейшн

5. Массивы данных. Описание и основные понятия. http://ru.wikipedia.org/wiki/RAID-массив

6. Семейства форматов XML основные понятия и описание видов. http://ru.wikipedia.org/wiki/RSS

7. Стандарты оперативной памяти. Основные понятия. http://ru.wikipedia.org/wiki/DDR2_SDRAM

8. Стандарты IEEE, касающиеся функционирования сетей. Основные понятия и спецификации. http://ru.wikipedia.org/wiki/IEEE_802.3

9. Языки разметки документов в сети интернет. Основные понятия. http://ru.wikipedia.org/wiki/HTML

10. Запросы и виды методов получения содержимого. Основные понятия. http://ru.wikipedia.org/wiki/HTTP

11. Алгоритмы вычисления контрольной суммы. Основные понятия. http://ru.wikipedia.org/wiki/CRC32

12. 128-битный алгоритм хеширования. Основные понятия. http://ru.wikipedia.org/wiki/MD5

13. Расширяемый язык разметки. Основные понятия. http://ru.wikipedia.org/wiki/XML

14. Unix подобные операционные системе. Описане и основные понятия. http://ru.wikipedia.org/wiki/FreeBSD

15. Операционные системе основанные на дистрибутиве GNU/Linux. Основные понятия. http://ru.wikipedia.org/wiki/Ubuntu_(operating_system)

16. Описание PHP. Основные понятия. http://ru.wikipedia.org/wiki/PHP

17. Описание видов таблиц MyISAM. Основные понятия. http://ru.wikipedia.org/wiki/MyISAM

18. Объектно-реляционнаые системы управления СУБД. Основные понятия. http://ru.wikipedia.org/wiki/PostgreSQL

19. Свободные системы управления базами данных. Описание. http://ru.wikipedia.org/wiki/Mysql

20. Описание редактора языка PHP Expert Editor. http://www.ankord.com/ru/phpxedit.php

21. Сетевые протоколы прикладного уровня для защищённой передачи данных. Основные понятия. http://ru.wikipedia.org/wiki/SSH

22. Клиенты для работы с сетевыми протоколами. Основные понятия. http://ru.wikipedia.org/wiki/Putty

23. Веб интерфейс для работы с СУБД. Основные понятия. http://ru.wikipedia.org/wiki/PhpMyAdmin

24. Базы данных: проектирование и использование, Диго С.М. - Москва: Финансы и статистика, 2005.

25. Сетевые операционные системы, Олифер В. Г., Олифер Н. А. - СПб.: Питер, 2005.

26. Проектирование экономических информационных систем, Г.Н. Смирнова, А.А. Сорокин, Ю.Ф. Тельнов - Москва: Финансы и статистика, 2001.

Приложение 1

Рисунок 1.1. Редактирование документа Запрос на начало обработки информации

Рисунок 1.2 Пример результатного документа

Рисунок 1.3. Ввод логина пользователя

Рисунок 1.4 Успешная авторизация при вводе логина и пароля

Рисунок 1.5 Иллюстрация базы RSS источников новостей

Рисунок 1.6 Пример страницы с информацией

Рисунок 1.7 Пример запроса и ответа от разработанной системы

Рисунок 1.8 Пример использования xml выдачи новостей

Рисунок 1.9 Пример использования xml выдачи новостей

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.