Разработка программного обеспечения "Empirical-statistical comparison of texts"

Анализ существующего программного обеспечения эмпирико-статистического сравнения текстов: сounter оf сharacters, horos, graph, advanced grapher. Empirical-statistical comparison of texts: функциональность, процедуры и функции тестирование и внедрение.

Рубрика Программирование, компьютеры и кибернетика
Вид дипломная работа
Язык русский
Дата добавления 29.11.2013
Размер файла 4,4 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

При выборе одного из элементов списка, в соответствующей панели объекта ZedGraph, выполняется метод drawGraph, тем самым осуществляется построение графика выбранного профиля.

Рисунок 24 - Построение графика при выборе профиля из списка

2.12.4 Кнопка проведения анализа AnalysisButton

При нажатии на кнопку запускается метод Analize, в том случае если все условия были выполнены, то есть были выбраны два разных профиля из списков listProf и listProf2.

В противном случае, пользователю сообщается об ошибке.

Рисунок 25 - Ошибка, возникающая при нарушении условий

2.12.5 Текстовое поле errorReport

Поле служит для отображения сообщений об ошибках, успешном выполнении действий, а также для вывода результатов.

Рисунок 26 - Отчет о загрузке профилей из базы.

При проведении анализа, в отчёт помещаются следующие данные:

Название обоих сравниваемых профилей.

Названия всех опорных точек, в которых находятся локальные максимумы.

Значения всех локальных максимумов.

Отрезок профиля, на котором локальные максимумы коррелируют.

Значение взаимозависимости текстов, выраженное в процентах.

Рисунок 27 - Отчёт о проведении анализа сравнения

Данные могут быть использованы в качестве доказательства или опровержения работоспособности метода при публикации отчёта о проделанном испытании метода.

2.13 Описание справочной системы пользователя

Для удобства использования «ESCT» была создана справочная система пользователя help.chm, которая была выполнена при помощи программы Dr.Explain.

Рисунок 28 - Общий вид справочной системы «ESCT»

Содержание справочной системы:

1. Введение.

2. Работа с текстом.

2.1 Загрузка текста.

2.2 Добавление опорных точек.

2.3 Удаление опорных точки.

3. Работа с профилями.

3.1 Сохранение графиков.

3.2 Сохранение профиля.

3.3 Проведения анализа.

4. Ошибки при работе с ПО.

Каждая страница содержит необходимую информацию для работы с ПО «ESCT» и графические изображения элементов пользовательского интерфейса с указателем на тот элемент, который необходим для текущей операции.

Рисунок 29 - Страница справочной системы «Добавление опорных точек»

Также справочная система содержит встроенную поисковую систему, которая осуществляет поиск по ключевому слову и отображает все страницы, содержащие искомую информацию.

Рисунок 30 - Встроенная поисковая система справочной системы

ГЛАВА 3. ТЕСТИРОВАНИЕ И ВНЕДРЕНИЕ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ «ESCT»В ОПЫТНУЮ ЭКСПЛУАТАЦИЮ

Для тестирования ПО «ESCT» проведено:

Сравнение результатов анализа текста при помощи ПО «ESCT» и результата анализа, проведённого А.Т.Фоменко.

Сравнение результатов анализа зависимости двух исторических источников при помощи ПО «ESCT» с результатом анализа сравнения этих источников, проведённого А.Т.Фоменко.

На основе полученных результатов можно установить, правильно ли выполняется алгоритм сравнения текстов методом эмпирико-статистического анализа текстов.

Если в обоих случаях результат будет совпадать с результатом, полученным автором метода, значит ПО работает корректно и его можно вводить в опытную эксплуатацию.

Также, дальнейший анализ подтвердит корректность работы метода, если результатом анализа будет корреляция максимумов заведомо зависимых текстов и противоположный результат для заведомо независимых источников.

3.1 Сравнение результатов анализа текста при помощи программного обеспечения «ESCT» с результатом анализа, проведённого А.Т. Фоменко

Для проведения анализа была выбрана историческая летопись “Повесть временных лет”. Общее количество символов - 364486. Дискретным расстоянием был выбран временной отрезок в 5 лет.

Для сравнения был выбран участок текста, описывающий события от 850 года до 1110 года.

Рисунок 31 - График профиля текста ”Повесть временных лет”, полученный А.Т. Фоменко

Результаты анализа “Повесть временных лет”, проведённого А.Т. Фоменко был взят из книги “ Истину можно вычислить. Хронология глазами математики” [11].

Рисунок 32 - график профиля текста ”Повесть временных лет”, полученный при помощи «ESCT»

Результат анализа показал наличие следующих локальных максимумов:

Таблица 3 - Сравнение локальных максимумов, полученных при помощи ПО «ESCT» со значениями локальных максимумов, полученными автором метода [15]

Локальные максимумы, полученные А.Т. Фоменко

Локальные максимумы, полученные при помощи ПО ESCT

855

855

865

865

875

875

885

885

915

915

930

930

955

955

995

995

1005

1005

1015

1015

1025

1025

1035

1035

1070

1070

1085

1085

1095

1095

Таким образом, все локальные максимумы, полученные при помощи ПО «ESCT», совпадают с данными, полученными автором метода.

На этом основании можно сделать вывод, что при помощи ПО «ESCT» было корректно осуществлен поиск локальных максимумов и построение графика исследуемого профиля.

3.2 Сравнение результатов анализа зависимости двух исторических источников при помощи программного обеспечения «ESCT» с результатом анализа сравнения этих источников, проведённого А.Т. Фоменко

Для сравнения текстов были выбраны исторические источники:

1. Т. Ливий. - История Рима от основания города [7].

2. Ф. Грегоровиуса - История города Рима в средние века [1].

Анализ, проведённый при помощи ПО «ESCT», показал взаимозависимость этих исторических источников.

Дискретным расстоянием был выбран временной отрезок в 5 лет.

Рисунок 33 - Результат сравнения текстов Т. Ливия и Ф. Григоровиуса при помощи «ESCT»

Анализ, проведённый А.Т. Фоменко, показал аналогичный результат:

Проведённый анализ древних текстов показал, что тексты, по-видимому, описывают одни и те же события, несмотря на существующий сдвиг в традиционной хронологической шкале между этими событиями. Сдвиг составляет порядка 1123 лет [11].

В этом случае также можно сделать вывод, что при помощи ПО «ESCT» было корректно осуществлен поиск локальных максимумов и построение графика исследуемого профиля.

3.3 Введение программного обеспечения «ESCT» в опытную эксплуатацию

Заказчиком ПО является крупное закрытое интернет-сообщество под названием «Общество скептиков», в которую входят представители различных областей науки. Группа занимается проверкой существующих научных и лженаучных теорий и методов. Результаты анализа публикуются на различных Интернет-ресурсах.

Независимая проверка работоспособности метода эмпирико-статистического сравнения текстов требует анализа большого количества исторических источников: не менее 30-ти на каждый из двух групп текстов:

1.Заведомо независимые источники.

2.Заведомо зависимые источники.

В случае, если метод докажет свою работоспособность на этих источниках, методом можно будет проводить анализ источников, взаимозависимость которых не установлена.

При таком большом количестве материала, работая без специального ПО, этот процесс может занять несколько месяцев или даже лет, так как выполнение анализа первого профиля заняло 11 дней.

Хранение информации не было структурировано. Текст был разделён на разные текстовые документы. Приходилось использовать несколько программ, каждая из которых выполняла лишь маленькую часть задач.

Процесс оказался очень трудоёмким и занимал много времени, вследствие чего появилась необходимость в разработке программного обеспечения, адаптированного под поставленные задачи.

3.4 Результаты использования программного обеспечения «ESCT»

После введения ПО «ESCT» в опытную эксплуатацию, заказчиком был выполнен анализ 7-ми исторических источников:

1. Т. Ливий. - История Рима от основания города;

2. Ф. Грегоровиуса - История города Рима в средние века;

3. Симеоновская летопись;

4. Троицкая летопись;

5. Пополь-Вух;

6. Белорусско-литовская летопись;

7. Степенная книга.

До применения ПО среднее время обработки текста и составления профиля составляло около 5-9 дней (в зависимости от объёма и сложности прочтения и установления точек разделения глав). Используя ПО «ESCT», за период в 29 дней был осуществлён анализ 7-ми исторических источников. То есть, в среднем 2-3 дней на составление профиля.

Заметно был упрощён процесс работы с профилями и процесс хранения общей базы профилей. Данные из XML файла легко конвертируются в файлы необходимых форматов, сохраняются графики, на основе которых в дальнейшем осуществляется публикация работы.

Таким образом, применение разработанного ПО значительно ускорило и облегчило процесс анализа.

ЗАКЛЮЧЕНИЕ

В рамках дипломной работы были проанализированы существующие программные решения на предмет наличия возможности проведения независимой проверки эффективности эмпирико-статистического метода сравнения текстов, а также выявлены их достоинства и недостатки.

На основании этого анализа была поставлена задача реализации программного обеспечения, способного включить в себя все необходимые функции, при помощи которых можно будет существенно ускорить и упростить процесс проведения независимой проверки метода.

Разработаны и реализованы соответствующие программные модули и интерфейс ПО «ESTC». Также были исследованы эксплуатационные возможности разработанного ПО.

Вывод: В ходе выполнения выпускной квалификационной работы была достигнута поставленная цель, а именно разработано программное обеспечение для эмпирико-статистического сравнения текстов по принципу корреляции локальных максимумов.

СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ

1. Грегоровиус Ф. История города Рима в Средние века (от V до XVI столетия) / Перевод с немецкого М. Литвинова, В. Линде, В. Савина. - М.: Издательство АЛЬФА-КНИГА, 2008. - 1280 с.

2. Макки Алекс Введение в.NET 4.0 и Visual Studio 2010 для профессионалов, Вильямс ISBN: 978-5-8459-1639-6, 2010. - 416с.

3. Носовский Г.В. Математико-статистические модели распределения информации в исторических хрониках. Математические вопросы кибернетики/ Фоменко А.Т. - М., Наука, физматлит. 1966, вып.6, с. 71-116.

4. Нестор Летописец - Повесть временных лет. Лаврентьевский список, исторический источник.

5. Павловская Т.А. - C#. Программирование на языке высокого уровня, СПб.: Питер, 2009. - 432 с.

6. Рихтер Д. - CLR via C#. Программирование на платформе Microsoft.NET Framework 4.0 на языке C#, СПб Питер, - 928 с.

7. Тит Ливий - История Рима от основания города. Том I. Изд-во «Наука» М., 1989, Перевод В.М. Смирина. Комментарий Н.Е. Боданской.

8. Троелсен Э. - С# 2008 и платформа.NET 3.5 Framework = Pro C# 2008 and the.NET 3.5 Framework. - 4-е изд. - М.: Вильямс, 2009. - С. 1368. - ISBN 978-5-8459-1589-4.

9. Фоменко А.Т. Методы статистического анализа нарративных текстов и приложения к хронологии. (Распознавание и датировка зависимых текстов, статистическая древняя хронология, статистика древних астрономических сообщений). - Москва, изд-во МГУ, 1990. - 439 с.

10. Фоменко А.Т. Методика статистической обработки параллелей хронографических текстах и глобальная хронологическая карта. - Исследование операций и АСУ. - Киев, изд-во Киевского ун-та, 1983, вып.22, с.29-40. Объем 1 п.л.

11. Фоменко А.Т. Истину можно вычислить. Хронология глазами математики, Москва. АСТ, Астрель, 2007, 475с.

12. Фоменко А.Т. Методы математического анализа исторических текстов: приложения к хронологии: распознавание и датировка зависимых текстов, статистическая древняя хронология, статистика древних астрономических сообщений, Наука, 1996, 475 с.

13. Фоменко А.Т. Новые методики хронологически правильного упорядочивания текстов и приложения к задачам датировки древних событий - Исследование операций и АСУ. Киев, изд-во Киевского ун-та, 1983, вып.21, с.40-59. Объем 1,5 п.л.

14. Фоменко А.Т. Методы статистического анализа исторических текстов, часть 1. Москва, 1999. - 446 с.

15. Фоменко А.Т. Числа против лжи (Математическое расследование прошлого). Критика хронологии Скаллигера. Сдвиг дат и сокращение истории. Новая хронология,Том I, АСТ, 2011. - 720 с.

16. Фоменко А.Т. Новая эмпирико-статистическая методика упорядочения текстов и приложения к задачам датировки. - Доклады АН СССР, 1983, т.268, No.6, с.1322-1327. Объем 0,5 п.л.

17. Сайт ИТ-группа «Два капитана» [Электронный ресурс] http://grmm.ru/ (Дата обращения: 14.03.2013).

18. Сайт «Новая Хронология» [Электронный ресурс] http://chronologia.org/ (Дата обращения: 12.03.2013).

19. Сайт «Alentum Software Ltd» [Электронный ресурс] http://alentum.com (Дата обращения: 12.03.2013).

20. Сайт «Englishelp.ru» [Электронный ресурс] http://englishelp.ru (Дата обращения: 14.03.2013).

21. Сайт «PRC Products» [Электронный ресурс] http://ptc.com (Дата обращения: 11.03.2013).

22. Сайт «SciDAVis» [Электронный ресурс] http://scidavis.sourceforge.net/ (Дата обращения: 14.03.2013).

23. Сайт «GNA Products» [Электронный ресурс] http://home.gna.org (Дата обращения: 28.03.2013).

24. Сайт «Microsoft» [Электронный ресурс] http://microsoft.com (Дата обращения: 02.03.2013).

25. Сайт «Graphviz - Graph Visualization Software» [Электронный ресурс] http://graphviz.org/ (Дата обращения: 22.03.2013).

26. Сайт «Википедия» [Электронный ресурс] http://ru.wikipedia.org (Дата обращения: 23.03.2013).

27. Сайт «DrexPlain» [Электронный ресурс] http://drexplain.ru (Дата обращения: 04.03.2013).

28. Сайт «XMLCON Products» [Электронный ресурс] http://xmlcon.ru (Дата обращения: 12.03.2013).

29. Сайт «SForge» [Электронный ресурс] ресурсу http://sourceforge.net (Дата обращения: 22.02.2013).

30. Сайт «Полезный Soft» [Электронный ресурс] http://softsoft.ru (Дата обращения: 16.03.2013).

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.