Организация поисковой системы во всемирной глобальной сети

Описание и классификация современных информационно–поисковых систем. Гипертекстовые документы. Обзор и рейтинги основных мировых поисковых систем. Разработка информационно–поисковой системы, демонстрирующей механизм поиска информации в сети Интернет.

Рубрика Программирование, компьютеры и кибернетика
Вид дипломная работа
Язык русский
Дата добавления 16.06.2015
Размер файла 1,3 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

2) динамический SQL-запрос - создается и изменяется в ходе выполнения приложения. Эти запросы являются наиболее гибкими и могут отвечать конкретным действиям пользователя.

Все операторы и команды языка SQL можно разделить на три группы. Ниже представлены эти группы, а также операторы, входящие в каждую из групп.

Операторы определения данных - предназначены для создания, удаления и изменения структуры данных. Основные из них перечислены в таблице 2.2.

Таблица 2.2.

Основные операторы определения данных

Оператор

Описание

CREATE TABLE

Предназначен для создания таблицы базы данных

ALTER TABLE

Удаляет таблицу

DROP TABLE

Изменяет структуру таблицы

CREATE INDEX

Создает индекс

DROP INDEX

Удаляет индекс

CREATE VIEW

Создает представление

DROP VIEW

Удаляет представление

Операторы управления данными - предназначены для управления привилегиями доступа к данным. Основные операторы представлены в таблице 2.3.

Таблица 2.3

Основные операторы управления данными

Оператор

Описание

GRAND

Назначает привилегии пользователям

REVOKE

Удаляет привилегии пользователей

Операторы манипулирования данными - предназначены для работы с записями таблиц. Основные операторы кратко описаны в таблице 2.4.

Таблица 2.4

Основные операторы манипулирования данными

Оператор

Описание

SELECT

Предназначен для выборки записей по определенному формату

UPDATE

Предназначен для изменения и обновления записей

INSERT

Вставляет новые записи в таблицу

DELETE

Удаляет записи из таблицы

Результатом выполнения запроса обычно является набор данных, который называется результирующим набором данных.

Осталось отметить, что регистр букв команд SQL-запросов не влияет на их выполнение. Точка с запятой также не обязательна в конце каждой SQL-команды. Элементы списков, такие как имена таблиц и полей, обязательно разделяются запятыми. Имена таблиц и полей заключаются в одинарные или двойные кавычки, например 'Number', "Table 1". В случае если имя не содержит пробелов и других специальных символов, его можно не заключать в кавычки [34].

Для отображения таблицы базы данных используется визуальный компонент TDBGrid. Данный компонент используется для табличного отображения заданных полей таблиц баз данных, а также позволяет осуществлять редактирование записей.

Источник данных - обеспечивает интерфейс между компонентом набора данных и средствами визуализации

Компонент TDataSource представляет собой источник данных, который обеспечивает связь между набором данных и компонентами отображения и редактирования данных [35].

Взаимодействие с web-интерфейсом программы производится при помощи компонентов TidHTTP и TWebBrowser.

Компонент TWebBrowser используется для отображения web-страниц в приложении. Для извлечения кода html-страницы служит компонент TidHTTP [36].

Для оформления графического интерфейса использованы компоненты TMemo, TImage, TPageControl. Компонент TMemo позволяет отображать и редактировать многострочый текст.

Компонент TImage отображает на форме графическое изображение. Свойство Picture типа TPicture содержит отображаемый графический объект типа битовой матрицы, пиктограммы, метафайла или определенного пользователем типа [37].

Компонент TPageControl относится к группе многостраничных панелей, которые позволяют экономить пространство окна приложения, размещая на одном и том же месте страницы разного содержания.

Компонент TMainMenu отображает на форме главное меню. Проектирование меню производится с помощью конструктора меню.

С помощью процедуры индексирования в приложении «Бета-поиск» осуществляется поиск ключевых слов, заключенных в определенные тэги и тэги описания заголовка HTML-документа. Вывод результатов поиска осуществляется с помощью сгенерированного html-документа в компоненте TWebBrowser.

HTML-документ представляет собой текст, в который помимо обычного текста включены специальные последовательности символов-теги. Тег начинается символом < и заканчивается символом >. Теги используются программами отображения HTML-документов для форматирования текста в окне просмотра (сами теги не отображаются).

Большинство тегов парные. Например, пара тегов <Н2> </H2> сообщает программе отображения HTML-документа, что текст, который находится между этими тегами, является заголовком второго уровня и должен быть отображен соответствующим стилем [38].

Описания набора используемых тэгов страницы выдачи результатов поиска под названием «Result.html» представлен в таблице 2.5:

Таблица 2.5

Используемые HTML-теги

Тег

Пояснение

<TITLE> Название </TITLE>

Задает название HTML-документа. Программы отображения HTML-документов, как правило, выводят название документа в заголовке окна, в котором документ отображается. Если название не задано, то в заголовке окна будет выведено название файла

<BODY BACKGROUND = "Файл" BGCOLOR=" Цвет" ТЕХТ="Цвет">

Параметр BACKGROUND задает фоновый рисунок, BGCOLOR-цвет фона, TEXT-цвет символов НТМ L-документа

<BASEFONT FАСЕ="Шрифт" SIZE=n>

Задает основной шрифт, который используется для отображения текста: FACE-название шрифта, SIZE-размер в относительных единицах. По умолчанию значение параметра SIZE равно 3. Размер шрифта заголовков берется от размера, заданного параметром SIZE

<Н1> </Н1>

Определяет текст, находящийся между тегами <Н1> и </Н1> как заголовок уровня 1. Пара тегов <Н2></Н2> определяет заголовок второго уровня и т.д.

<BR>

Конец строки. Текст, находящийся после этого тега, будет выведен с начала новой строки

<B> </B>

Текст, находящийся внутри этой пары тегов, будет выделен полужирным

<I> </I>

Текст, находящийся внутри этой пары тегов, будет выделен курсивом

<А HREF="Файл.htm#Закладка"> </А>

Выделяет фрагмент документа как гиперссылку, при выборе которой происходит перемещение к закладке, имя которой указано в параметре HREF

<IMG SRC=" Иллюстрация" >

Выводит иллюстрацию, имя файла которой указано в параметре SRC

<meta name="keywords" content="набор ключевых слов ">

Текст, находящийся внутри данной пары тэгов определяется как набор ключевых слов

Набирается HTML-текст обычным образом. Теги можно набирать как прописными, так и строчными буквами. Однако, чтобы лучше была видна структура документа, рекомендуется записывать все теги строчными (большими) буквами. Следующее, на что надо обратить внимание-программы отображения HTML-документов игнорируют "лишние" пробелы и другие "невидимые" символы (табуляция, новая строка). Это значит, что для того, чтобы фрагмент документа начинался с новой строки, в конце предыдущей строки надо поставить тег <BK>, а чтобы между строками текста появилась пустая строка, в HTML-текст нужно вставить два тега <BK> подряд [39].

В качестве примера можно указать сгенерированный HTML-код страницы выдачи результатов поиска под названием «Result.html»:

Большинство функций манипулирования данными автоматически осуществляются не визуальными и визуальными компонентами, то есть инкапсулированными в них методами.

Для обработки записей в базе данных выполняются следующие основные процедуры:

- добавление индекса;

- поиск индекса;

- просмотр индекса;

- редактирование ключевых слов;

- очистка индексов.

В качестве примера приводятся некоторые процедуры работы с базой данных:

Добавление индекса.

При первичном индексировании web-страницы в базу данных заносится информация об ее адресе и ключевые слова. Рейтинг web-страницы при этом обнуляется, т.е. в поле rating таблицы Index заносится значение «0».

При повторном индексировании этой же страницы в базе данных происходит поиск соответствия по адресу web-страницы. При совпадении адреса, в базу данных уже заносится только обновленные ключевые слова, значение рейтинга и адреса остаются без изменения. Таким образом, механизм добавления новых web-страниц исключает повторное индексирование одинаковых данных. Процедура добавления индекса в базу индексов представлена на рисунке 2.3.

Размещено на http://www.allbest.ru/

Рисунок 2.3. Блок-схема процедуры добавления индекса.

Редактирование ключевых слов.

В случае редактирования ключевых слов происходит изменение данных. Процедура редактирования информации о ключевых словах представлена на рисунке 2.4.

Размещено на http://www.allbest.ru/

Рисунок 2.4. Блок-схема процедуры добавления индекса.

2.3 Описание интерфейса информационно-поисковой системы

В самом начале развития персональных компьютеров, пользователи работали с программами в основном через командную строку. Программа запускалась и затем приостанавливалась для получения ввода данных пользователем. Данный процесс был неудобен в силу трудности своего представления. Большая часть программ, используемых в настоящее время, работают в одном или нескольких окнах. Эти окна позволяют пользователю работать с программой, или реализуют интерфейс, путем ввода, использования кнопок, выбора элементов меню и т. д [40].

Оконный интерфейс относится к графическому представлению информации и очень удобен для восприятия пользователя. Программа «Бета-поиск» как раз таки реализована в графическом интерфейсе для удобства восприятия информации и привлечения внимания оператора.

Для запуска приложения «Бета-поиск» рекомендуется скопировать папку с названием «BetaSearch» на жесткий диск для лучшего функционирования программы. После этого открыть в указанной папке исполняемый файл «Beta.exe». После запуска появится загрузочное окно программы, которое будет иметь вид, показанный на рисунке 2.5.

Рисунок 2.5. Загрузочное окно программы.

Далее происходит загрузка главной формы программы.

Приложение имеет дружественный интерфейс с понятными для пользователя описанными элементами. Навигация по функциональным структурам осуществляется либо с помощью вкладок с их названиями, либо с помощью элементов главного меню программы.

Главное окно программы состоит из следующих элементов, в соответствии с рисунком 2.6:

1) Заголовок;

2) Главное меню;

3) Набор вкладок;

Рисунок 2.6. Главное окно программы.

На вкладке «Строка поиска», изображенной на рисунке 2.7, осуществляется ввод искомой информации в текстовое поле. После нажатия на кнопку «Найти» происходит вывод результата поиска.

В результат поиска входят:

- количество web-страниц, на которых найдены заданные ключевые слова;

- ссылки на данные web-страницы;

- контекст, в котором употреблены искомые слова.

Рисунок 2.7. Содержимое вкладки «Строка поиска».

При нажатии на любую из отображенных в результате поиска ссылок происходит переход по ее адресу в Интернет прямо в окне web-браузера программы.

На вкладку «Строка поиска» также можно перейти с помощью главного меню, для этого в нем необходимо выбрать: Опции -> Строка поиска.

На вкладке «Индексирование» производится добавление web-страницы сайта в индекс базы данных приложения.

Содержимое вкладки изображено на рисунке 2.8 и представляет собой: текстовое поле «Имя страницы сайта» вместе с кнопкой «Индексировать», расположенные в верхнем левом углу панели, ниже расположено текстовое поле под названием «Код страницы». В правой части вверху расположено текстовое поле «Найденные ключевые слова», а ниже расположено окно web-браузера.

Чтобы добавить web-страницу в индекс базы данных, необходимо в текстовом поле ввести ее адрес и нажать кнопку «Индексировать», после чего в соответствующих панелях отобразятся: индексируемая web-страница, ее html-код и находящиеся на ней ключевые слова, извлеченные из html-кода.

Рисунок 2.8. Содержимое вкладки «Индексирование».

На вкладку «Индексирование» также можно перейти с помощью главного меню, для этого в нем необходимо выбрать: Опции -> Добавить в индекс.

На вкладке «База индексов» происходит редактирование индексов базы данных имеющихся web-страниц.

Содержимое вкладки изображено на рисунке 2.9 и представляет собой: текстовое поле «Ключевые слова» вместе с кнопкой «Внести изменения», расположенные в левой части панели, правее расположена таблица, в которой имеются поля названия web-страниц и, соответственно, их рейтинг.

C помощью клика мыши на соответствующую запись таблицы с названием web-страницы происходит отображение ее ключевых слов в текстовом поле. Текстовое поле «Ключевые слова» является редактируемым. После завершения редактирования для сохранения записи необходимо нажать на кнопку «Внести изменения», после чего соответствующие данные внесутся в базу данных.

Рисунок 2.9. Содержимое вкладки «База индексов».

На вкладку «База» также можно перейти с помощью главного меню, для этого в нем необходимо выбрать: Опции -> База данных индекса.

Для удаления выбранной записи необходимо в таблице индексированных страниц выбрать удаляемую запись и нажать на кнопку «Удалить запись», после чего появится окно предупреждения о подтверждении удаления, изображенное на рисунке 2.10. Подтверждения удаления выбранной записи необходимо нажать кнопку «Yes», для отмены удаления следует нажать «No».

Рисунок 2.10. Предупреждение об удалении выбранной записи.

Иногда требуется полностью очистить базу индекса, для этого стоит нажать на кнопку «Очистить базу», в результате чего появится предупреждающее окно, изображенное на рисунке 2.11. При нажатии кнопки «Yes» произойдет удаление всех записей индекса базы данных, при нажатии «No» окно предупреждения закроется и очистки базы данных индекса не произойдет.

Рисунок 2.11. Предупреждение об очистке записей.

При удалении записей индекса из базы данных, информация не восстанавливается.

Окно, отображающее информацию о программе (рисунок 2.11) можно открыть при помощи главного меню: Помощь -> О программе.

Рисунок 2.11. Окно «О программе».

Для вызова справочной информации достаточно перейти с помощью главного меню: Помощь -> Вызов справки или при помощи «горячей клавиши» - «F1». Окно справочной информации изображено на рисунке 2.12.

Рисунок 2.12. Окно «Справочная информация».

Требования к системе

Программа, осуществляющая поиск информации во Всемирной Глобальной сети «Бета-поиск» работает на любых IBM-совместимых компьютерах, под управлением операционных систем семейства Windows. Размер занимаемой памяти не превышает 15 Мбайт. Запуск программы осуществляется как с жесткого диска компьютера, так и со сменного накопителя.

Минимальные требования для работы информационно-поисковой системы:

- компьютер типа IBM с процессором Intel Pentium III и выше;

- операционная система Windows 2000/XP/7;

- наличие CD-ROM или USB-порта для копирования приложения на жесткий диск;

- наличие 15 Мбайт свободного пространства на жестком диске в случае копирования приложения на жесткий диск.

Данный программный продукт не вызовет затруднений в использовании, так как в нем используются достаточно понятные визуальные компоненты. Для комфортной работы желательно выставить разрешение экрана не ниже чем 1024*768 пикселей.

Заключение

Интернет продолжает развиваться с неослабевающей интенсивностью, по сути дела стирая ограничение на распространение и получение информации в мире. Однако в этом информационном океане бывает не очень легко найти необходимый документ. Следует также иметь в виду, что в сети наряду с давно действующими серверами возникают новые. Путем решения данной проблемы выступают информационно-поисковые системы, организующие поиск во Всемирной Глобальной сети.

Поисковые системы уже давно стали неотъемлемой частью Интернета. Поисковые системы сейчас - это огромные и сложные механизмы, представляющие собой не только инструмент поиска информации, но и заманчивые сферы для бизнеса.

Проанализировав материал дипломной работы, были сделаны следующие выводы:

- Поисковые системы разделяются на 3 класса: поисковые каталоги, полнотекстовые поисковые системы и метапоисковые системы.

- Поисковые системы обычно состоят из трех компонентов:

1) агент (паук или кроулер), который перемещается по Сети и собирает информацию;

2) база данных, которая содержит всю информацию, собираемую пауками;

3) поисковый механизм, который люди используют как интерфейс для взаимодействия с базой данных.

Также был рассмотрен подробный механизм поиска информации во Всемирной Глобальной сети и произведен обзор рейтинга наиболее популярных мировых информационно-поисковых систем.

На основе анализа теоретических данных об организации поиска в Интернете разработана информационно-поисковая система под названием «Бета-поиск», демонстрирующая обобщенный механизм работы действующих мировых поисковых систем. Данная программа написана на языке программирования Object Pascal в визуальной среде программирования Delphi 7 с использованием базы данных, визуальных и не визуальных стандартных компонентов среды. Благодаря понятному графическому интерфейсу и информативному описанию справочного руководства программы «Бета-поиск», пользователь сможет ознакомиться с механизмом поиска информации в Интернет и составить весомую базу данных индексов web-страниц для расширения границ поиска информации на данной поисковой машине.

Список использованной литературы

1. www.ru.wikipedia.org/wiki/Поисковая_система

2. Крупник А.Б. Поиск в Интернете: самоучитель. - 2-е изд. - СПБ.: Питер, 2004. - 572 с.

3. Комер Д. Принципы функционирования Интернета: Пер. с англ./ Д. Комер. - СПБ.; М.; Харьков; Минск: Питер, 2002.-379 с.

4. www.marillion.blogseo.ru/archives/99

5. Солоницын Ю.А., Холмогоров В. Интернет. Энциклопедия. - 3-е из. - СПб.: Питер, 2003. - 592 с.

6. www.info-highsol.ru/seo_poisk.php

7. Дубинский А. Г. Модель мультиагентной системы информационного поиска в глобальной сети // Искусственный интеллект. - Донецк: ДГИИИ.-1999.- №2.- с. 271-279.

8. Ландэ Д.В. Поиск знаний в INTERNET. Профессиональная работа.: Пер. с англ. - М.: «Вильямс», 2005. - 200 c.

9. Ландэ Д.В. Алгоритмы поиска. Профессиональная работа.: Пер. с англ. - М.: «Вильямс», 2004. - 260 с.

10. Гусев В.С. Google: эффективный поиск. Краткое руководство. - М.:

11. «Вильямс», 2006. - 140 с.

12. www.citforum.ru/internet/search/art_1.shtml

13. Севостьянов И. О. Поисковая оптимизация. Практическое руководство по продвижению сайта в Интернете.-СПб.: «Питер», 2010.-240 с.

14. www.osp.ru/cw/1996/20/31.htm

15. www.titorov.ru/

16. www.citforum.ru

17. www.mir.dilibrium.ru/

18. Д. Н. Колисниченко. Поисковые системы и продвижение сайтов в Интернете:-- Москва, Диалектика, Вильямс, 2007 г.- 272 с.

19. www.clx.ru

20. www.vanta.ru/lib/yahoo1.php

21. www.axoft.ru/lib/yahoo1.php

22. www.axoft.ru/software/Yandex/

23. www.seo-ua.com/obzor/rambler.php

24. В. И. Копыл. Поиск в Интернете./-- М.: ACT, Мн.: Харвест, 2006.-- 64 с

25. Егоров А.Б. Поиск в Интернете - Санкт - Петербург.: НиТ, 2007г.

26. www.vsychina.vo.uz/news/2007-04-21-11

27. www.delphi-club.ru/

28. Фаронов В.В. Delphi 7. Учебный курс. - М.: Издатель Молгачева С.В., 2003. - 20 с.

29. Гаевский А.Разработка программных приложений на Delphi 6 - М.:Киев, 2000. - 210 c.

30. www.askit.ru/custom/progr_admin/m13/13_02_ado_connection.htm

31. Кузнецов С.Д. Основы современных баз данных. - М.: АСТ-ПРЕСС КНИГА: ИнформкомПресс, 2000. - 202 с.

32. Базы данных в Delphi 7. Самоучитель/В.Понамарев - СПб: Питер, 2003, - 193 с.

33. www.intbook.info/delphi/Glava19/Index34.html

34. www.intbook.info/delphi/Glava19/Index35.html

35. Карпова Т. Базы данных: модели, разработка, реализация. - СПб.: Питер, 2001 - 156 с.

36. www.snkey.net/books/delphi/ch4-3.html

37. Журавлев В. В. Delphi 7. Начальный курс. - СПБ.: БХВ-Петербург, 2003. - 398 с.

38. www.delphidevelop.ru/publ/28-1-0-135

39. Рева О. HTML просто как 2 х 2. - Москва: Эксмо, 2006 -20 с.

40. Муссиано Ч., и Кеннеди Б. "HTML и XHTML. Подробное руководство" 6-е издание. Издательство: Символ-Плюс, 2008 г. - 215 с.

41. www.msdn.microsoft.com/ru-ru/library/

Размещено на Allbest.ru


Подобные документы

  • Хранение данных в сети Internet. Гипертекстовые документы, виды файлов. Графические файлы, их виды и особенности. Поисковые системы и правила поиска информации. Обзор поисковых систем сети Internet. Все о поисковых системах Yandex, Google, Rambler.

    курсовая работа [918,3 K], добавлен 26.03.2011

  • Понятие информационно-поисковых систем, их сущность и особенности, история возникновения и развития, роль на современном этапе. Внутреннее устройство и элементы поисковой системы. Принцип работы поисковой машины Рамблер, прядок обработки запроса.

    научная работа [222,0 K], добавлен 29.01.2009

  • Понятие информационно-поисковых систем. История возникновения сети Internet. Основные алгоритмы работы современных словарных информационно-поисковых систем. Быстрый поиск в базе данных и быстрое реагирование системы. Ранжирование результатов поиска.

    курсовая работа [101,1 K], добавлен 01.06.2012

  • Характеристика методов поиска информации в Интернете, а именно - с использованием гипертекстовых ссылок, поисковых машин и специальных средств. Анализ новых интернет ресурсов. История возникновения и описание западных и русскоязычных поисковых систем.

    реферат [17,2 K], добавлен 12.05.2010

  • Понятие, структура и классификация информационных систем. Информационно поисковые системы. Исторические предпосылки развития поисковых систем. Понятие поисковых систем. Особенности поисковых систем: структура сети, структура работы поисковых систем.

    курсовая работа [81,9 K], добавлен 28.03.2005

  • Основные принципы построения информационно-поисковых систем. Архитектура современных информационно-поисковых систем WWW. Принцип работы поисковых систем. Процесс поиска, информационный язык, перевод, дескриптор, критерий соответствия, индексирование.

    курсовая работа [70,2 K], добавлен 10.06.2014

  • Анализ существующих поисковых систем и используемых ими алгоритмов поиска документов. Разработка информационно-поисковой системы словарного типа, способной осуществлять релевантный поиск документов, особенности ее структуры и информационно-поисковой базы.

    дипломная работа [942,1 K], добавлен 19.05.2011

  • Структура и принципы построения сети Интернет, поиск и сохранение информации в ней. История появления и классификация информационно-поисковых систем. Принцип работы и характеристики поисковых систем Google, Yandex, Rambler, Yahoo. Поиск по адресам URL.

    курсовая работа [3,6 M], добавлен 29.03.2013

  • Методы и инструментарий хранения данных во Всемирной сети. Понятие и разновидности гипертекстовых документов и графических файлов. Принципы работы поисковых систем и правила поиска нужной информации. Характеристика некоторых поисковых систем Сети.

    курсовая работа [30,9 K], добавлен 18.04.2010

  • Краткая история развития поисковых систем. Обзор мировых и российских поисковых систем: Google, Yahoo, Baidu, Yandex, Rambler, Апорт, Mail.ru. Текстовый процессор Microsoft Word. Табличный редактор Excel. Организация рабочего места оператора ЭВМ.

    курсовая работа [66,3 K], добавлен 20.12.2008

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.