Поисковые системы
Рассмотрение поисковых систем интернета как программно-аппаратного комплекса с веб-интерфейсом, предоставляющего возможность поиска информации. Виды поисковых систем: Archie, Wandex, Aliweb, WebCrawler, AltaVista, Yahoo!, Google, Яндекс, Bing и Rambler.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | реферат |
Язык | русский |
Дата добавления | 10.05.2013 |
Размер файла | 24,3 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
СИБИРСКИЙ УНИВЕРСИТЕТ ПОТРЕБИТЕЛЬСКОЙ КООПЕРАЦИИ
Поисковые системы
Выполнила:
Томилова Н.А.
Проверила:
Железняк Н.С.
Новосибирск
2011
Содержание
- Введение
- 1. Понятие и сущность поисковой системы. Первые поисковые системы интернета
- 2. Характеристика основных поисковых систем
- Заключение
- Список литературы
Введение
Поисковая система -- программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в Интернете. Под поисковой системой обычно подразумевается сайт, на котором размещён интерфейс (фронт-энд) системы. Программной частью поисковой системы является поисковая машина (поисковый движок) -- комплекс программ, обеспечивающий функциональность поисковой системы и обычно являющийся коммерческой тайной компании-разработчика поисковой системы.
Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на FTP-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet.
Актуальность темы. Поиск - один из непременных атрибутов нашей жизни. Процесс бесконечного поиска, путешествия по ссылкам с сайта на сайт - занятие весьма и весьма захватывающее. Такое развлечение имеет массу поклонников и даже получило свое собственное название - веб-серфинг.
Целью настоящей работы является знакомство с поисковыми система Интернета.
Задачи работы: рассмотреть понятие и сущность поисковой системы, ознакомиться с первыми поисковыми системами Интернета, дать характеристику основным популярным поисковым системам.
Предмет исследования: поисковая система как программно-аппаратный комплекс.
Объект исследования: современные поисковые системы интернета.
1. Понятие и сущность поисковой системы. Первые поисковые системы интернета
Поисковые системы - это сервисы, предназначенные для поиска информации в мировой сети Интернет. В базе данных поисковых систем находится информация, практически, обо всех сайтах сети Интернет и эта база постоянно обновляется автоматизированными системами, следящими за появлением новых сайтов.
Одним из первых инструментов поиска в интернете (до Всемирной паутины) был Archie.
Первой поисковой системой для Всемирной паутины был "Wandex", уже не существующий индекс, который создавал "World Wide Web Wanderer" -- бот, разработанный Мэтью Грэем (англ. Matthew Gray) из Массачусетского технологического института в 1993. Также в 1993 году появилась поисковая система "Aliweb", работающая до сих пор. Первой полнотекстовой (т. н. "crawler-based", то есть индексирующей ресурсы при помощи робота) поисковой системой стала "WebCrawler", запущенная в 1994. В отличие от своих предшественников, она позволяла пользователям искать по любым ключевым словам на любой веб-странице -- с тех пор это стало стандартом во всех основных поисковых системах. Кроме того, это был первый поисковик, о котором было известно в широких кругах. В 1994 был запущен "Lycos", разработанный в университете Карнеги Мелона.
Вскоре появилось множество других конкурирующих поисковых машин, таких как "Excite", "Infoseek", "Inktomi", "Northern Light" и "AltaVista". В некотором смысле они конкурировали с популярными интернет-каталогами, такими, как "Yahoo!". Позже каталоги соединились или добавили к себе поисковые машины, чтобы увеличить функциональность. В 1996 году русскоязычным пользователям интернета стало доступно морфологическое расширение к поисковой машине Altavista и оригинальные российские поисковые машины "Рамблер" и "Апорт".
23 сентября 1997 была открыта поисковая машина Яндекс.
В последнее время завоёвывает всё большую популярность практика применения методов кластерного анализа и поиска по метаданным. Из международных машин такого плана наибольшую известность получила "Clusty" компании Vivisimo. В 2005 году на российских просторах при поддержке МГУ запущен поисковик "Нигма", поддерживающий автоматическую кластеризацию. В 2006 году открылась российская метамашина Quintura, предлагающая визуальную кластеризацию в виде облака тегов. "Нигма" тоже экспериментировала с визуальной кластеризацией.
Помимо поисковых машин для Всемирной паутины, существовали и поисковики для других протоколов, такие как Archie для поиска по анонимным FTP-серверам и "Veronica" для поиска в Gopher.
Пополнение информационных ресурсов Интернета происходит высокими темпами, и найти необходимую информацию становиться всё труднее. Различные печатные справочники устаревают ещё до выхода в свет. Единственным надёжным способом поиска информации является использование различных поисковых систем, которые постоянно отслеживают изменение информации в сети.
За время существования Интернета предпринимались различные попытки организации поисковых средств. Многие из этих попыток оказались неудачными, другие же привели к созданию удобных средств поиска информации. Наиболее удачные проекты появились в последние пять лет. Мы рассмотрим поиск информации во Всемирной паутине с помощью нескольких наиболее распространённых систем поиска. Всего же в мире существуют сотни различных поисковых систем, и выбор той или иной системы зависит только от ваших личных пристрастий. Отметим, что поисковые системы часто называют поисковыми машинами или машинами поиска.
Многие поисковые системы позволяют искать информацию не только в Web-страницах, но и в группах новостей и хранилищах файлов. Таким образом, в результате поиска вы можете найти сообщение в группе новостей или какой-то файл. Поэтому чаще применяют вместо термина страница более общий термин - документ. Под документом подразумеваются Web-страница, сообщение или файл, содержащие различную информацию.
Поисковые cистемы обычно состоят из трех компонентов:
1. агент (паук или кроулер), который перемещается по Сети и собирает информацию;
2. база данных, которая содержит всю информацию, собираемую пауками;
3. поисковый механизм, который люди используют как интерфейс для взаимодействия с базой данных.
2. Характеристика основных поисковых систем
Google -- самая популярная в мире поисковая система. Наглая, как и все американцы, но предоставляющая много возможностей. В общем, бесспорный мировой лидер среди поисковых роботов.
Помимо поиска у Google имеется множество других сервисов различной направленности.
Крупнейшая поисковая система, принадлежащая корпорации Google Inc.
Первая по популярности (79.65 %), обрабатывает 41 млрд 345 млн запросов в месяц (доля рынка 62,4 %)., индексирует более 25 миллиардов веб-страниц, может находить информацию на 191 языке (c 15 октября 2009).
Поддерживает поиск в документах форматов PDF, RTF, PostScript, Microsoft Word, Microsoft Excel, Microsoft PowerPoint и других.
Яндекс
Из поисковых систем Яндекс, пожалуй, пользуется наибольшей популярностью среди русскоязычных посетителей Интернета.
"Ямндекс" -- российская ИТ-компания, владеющая одноимённой системой поиска в Сети и интернет-порталом. Поисковая система "Яндекс" является 5-ой среди поисковых сайтов мира по количеству обработанных поисковых запросов (более 3 млрд, 1,7% от мирового количества, статистика за сентябрь 2011 года).
Яндекс -- отечественная поисковая система. Это одно из её немногих достоинств. В остальном имеем медленное обновление поисковой базы, постоянную смену правил игры (как для пользователей, так и для владельцев сайтов), своеобразное понимание качества поисковой выдачи и т.д. В общем, она популярна в Рунете лишь потому, что большинство пользователей не догадывается о существовании других искалок.
Поисковая система Yandex.ru была официально анонсирована 23 сентября 1997 года, и первое время развивалась в рамках компании CompTek International. Как отдельная компания "Яндекс" образовался в 2000 году.
Компания вышла на самоокупаемость в 2002 году. В 2010 году выручка "Яндекса" составила $439,7 млн (рост на 43 %), операционная прибыль -- $169,7 млн (рост -- 82,8 %), чистая прибыль -- $134,3 млн (рост -- 89,9 %). В мае 2011 г. Яндекс провёл первичное размещение акций, заработав на этом больше, чем кто-либо из Интернет-компаний со времён IPO поисковика Google в 2004 году
Основным и приоритетным направлением компании является разработка поискового механизма, но за годы работы "Яндекс" стал мультипорталом. В 2011 году "Яндекс" предоставляет более 30 сервисов. Самыми популярными являются: Яндекс.Картинки, Яндекс.Почта, Яндекс.Карты, Яндекс.Новости, Яндекс.Погода и другие.
Здесь есть список сервисов Яндекса для решения других проблем.
Отличительная особенность Яндекса -- возможность точной настройки поискового запроса. Это реализовано за счёт гибкого языка запросов.
Bing
Новая поисковая система от Microsoft -- Bing заменила все предыдущие поисковики от этой всемирно известной компании. И, надо сказать, не случайно. Bing на порядок лучше старых поисковых систем от Microsoft. поисковый информация яндекс google
Rambler
Rambler Media Group (AIM: RMG) -- интернет-холдинг, включающий в качестве сервисов поисковую систему, рейтинг-классификатор ресурсов российского Интернета, информационный интернет-портал.
Поисковая система Рамблер понимает и различает слова русского, английского и украинского языков. По умолчанию поиск ведётся по всем формам слова. По умолчанию в Рамблере результаты ранжируются по степени соответствия (релевантность) запросу и группируются по сайтам.
Настройки языка поиска: любой, русский, английский, украинский, казахский, белорусский, татарский, французский, немецкий. Учитывается морфология
Поисковая система содержит информацию о более чем 12 миллионах документов, расположенных на серверах России и стран СНГ. Рамблер обрабатывает ежесуточно не менее 500 тысяч поисковых запросов (в среднем - 5 запросов в секунду), сканируя 48 тысяч web-серверов и используя несколько одновременно работающих программ-роботов.
Поисковые слова
Запрос может состоять из одного или нескольких слов, разделенных пробелами. Могут быть использованы как русские, так и английские слова и словосочетания. По умолчанию находятся только те документы, в которых встретились все введенные Вами слова. Чтобы найти документы, содержащие хотя бы одно слово из запроса, используйте логическую связку Or (см. ниже) или выберите на странице детального запроса: "Слова запроса: любое". Чтобы исключить документы, содержащие те или иные слова, укажите на странице детального запроса: "Исключить документы, содержащие следующие слова ...".
Регистр
Все равно, с какой буквы написаны слова запроса: с большой или с маленькой. И при построении индекса, и при поиске по запросу все заглавные (большие) буквы "понижаются".
Логические связки
Слова запроса могут быть соединены логическими связками And ("и"), Or ("или"). Вместо связок (или в сочетании с ними) могут использоваться также символы '&', '|'.
Логические группы
Части запроса могут быть сгруппированы с помощью круглых скобок ( ). Возможна многократная вложенность скобок в сочетании с логическими операторами.
Словоформы
Рамблер умеет искать слова во всех формах (например, аминокислота, аминокислоты, аминокислотой и т. д.). Чтобы слово находилось во всех формах, перед ним надо поставить служебный символ '#'. В меню детального запроса такой режим может быть включен для всех слов: "Расширение запроса: все формы слов". Служебный символ '@' перед словом позволяет находить не только само это слово, но и однокоренные слова. В меню детального запроса символу '@' соответствует режим "Расширение запроса: все однокоренные".
Усечение слов
По умолчанию наша система ищет слова запроса так, как Вы их ввели, чтобы уменьшить "шум" в найденных документах. Если Вы не помните, как пишется слово, или хотите расширить запрос, можно использовать метасимволы '*' и '?' для обозначения произвольной части слова и произвольного символа.
Поиск в части документа
Ограничить поиск частями документов, такими как название документа, его заголовок, URL и т.п., можно через меню детального запроса "Искать в...".
Язык документов
Можно ограничить поиск документами только на русском или только на английском языке. Для этого надо выбрать соответствующий режим в меню детального запроса "Язык документа...". По умолчанию поиск выполняется по документам на всех языках.
Сортировка результатов
По умолчанию найденные документы сортируются по релевантности (соответствию запросу). Однако Вы можете потребовать, чтобы вместо этого в начало списка были помещены самые свежие (или, наоборот, самые старые документы). Для этого надо выбрать соответствующую установку в меню "Сортировать по..." на странице детального запроса. Также можно ограничить поиск документами, созданными в определенный период времени: для этого необходимо на странице детального запроса указать "От даты ... до даты ...".
Расстояние между словами
Можно потребовать, чтобы Рамблер возвращал только те документы, где слова из запроса находятся на минимальном расстоянии друг от друга. Режим "Ограничить расстояние между словами" может быть включен в детальном запросе. Все перечисленные выше правила могут быть использованы совместно друг с другом в необходимой Вам последовательности.
Выдача результатов
По умолчанию результаты поиска выдаются порциями по 15 документов. Меню "Выдавать по..." на странице детального запроса позволяет увеличить это число до 30 или 50. Меню "Форма вывода..." позволяет получать описания документов с увеличенной или уменьшенной подробностью.
Aport
Особенностью данной системы является то, что в запросах вы можете использовать русские слова в любой грамматической форме. Интеллектуальный механизм преобразования запросов разберётся с самыми сложными фразами
Впервые была продемонстрирована в феврале 1996 года на пресс-конференции "Агамы" по поводу "Русского клуба". На тот момент поисковая машина искала только по сайту russia.agama.com. В дальнейшем был поиск по четырём серверам, потом по шести. В итоге день рождения Апорта и фактический старт системы сильно "размазались" по времени. Официальная презентация Апорта состоялась только 11 ноября 1997 года, тогда машина уже индексировала весь рунет.
На текущий момент Апорт является частью портала РОЛ. Принадлежит Golden Telecom. При поиске учитываются особенности русского языка.
Yahoo
Yahoo! (произносится как яху!) -- американская компания, владеющая второй по популярности (5.88 %) в мире поисковой системой и предоставляющая ряд сервисов, объединённых интернет-порталом Yahoo! Directory; портал включает в себя популярный сервис электронной почты Yahoo! Mail, один из старейших и наиболее популярных в Интернете. В 2004 году была запущена новая версия почтового интерфейса, основанная на AJAX.
Компания Yahoo! была основана аспирантами Стэнфордского университета Дэвидом Файло (англ. David Filo) и Джерри Янгом (англ. Jerry Yang) в январе 1994 года; стала корпорацией 2 марта 1995 года. Главный офис компании находится в городе Саннивейл (англ. Sunnyvale), штат Калифорния, США.
Cамая известная поисковая машина. Её сайты разбиты по категориям и ключевым словам. Она содержит полезную информацию на своей домашней странице. Может подключаться к другим поисковым машинам
Базы данных: в ведении находится служба поиска Internet-ресурсов, новостей, карт, рекламных информаций, спортивная информация, бизнес, номера телефонов, персональные WWW-страницы, и email-адреса (отдельная база данных).
Содержание: Основная директория содержит: адреса (URLs) для Internet-ресурсов и краткое описание для этих связей.
Поиск: Все Yahoo страницы предлагают не только простое поисковое окно, но и опции для этого поиска, а так же поиск Usenet или Email-адреса. Поиск может ограничиваться указанием определённого промежутка времени. Boolean операторы (и, или) и последовательный поиск также поддержаны. Отметим: если поиск в Yahoo! не привёл к положительному результату, то процесс поиска автоматически переходит на Alta Vista, которая продолжает поиск, и в случае положительных результатов автоматически возвращает найденную информацию в Yahoo!.
Если Yahoo! не может установить связь достаточно быстро с Alta Vista, то в этом случае Yahoo! будет обеспечивать страницу связи с набором инструментов поиска. После того как одна из этих связей выбирается, ключевые слова передаются к поисковой машине на ваше усмотрение.
Средством, облегчающим поиск, является наличие "tip search"(TS) - поиск с помощью "намека": Yahoo! Является подчиненным справочником, что означает, что система не имеет так много страниц, как поисковые машины, однако задание наиболее общих ключевых слов позволит найти необходимую тему на странице высокого уровня (первая страница, которая возникает перед пользователем при посещении сайта) для организации или компании.
Результаты: Связи отображаются в соответствии с очерёдностью задаваемых слов последовательностью поиска наряду с их описательным текстом и подчиненной иерархией.
Адрес: http://www.yahoo.com/
Принципиальное отличие поисковой системы Yahoo (Яхо) от других систем в том, что вы можете найти необходимую вам информацию без использования запросов, а просто переходя по ссылкам разделов встроенного справочника и последовательно уточняя область ваших интересов.Yahoo является самой популярной системой в США, так как не требует специальной подготовки для поиска информации. Не надо знать правила формирования запросов, достаточно просто переходить по ссылкам в нужные разделы. Однако для русскоязычных пользователей эта система не слишком удобна, так как разбиение на разделы проводилась с учётом американской специфики. Кроме того, в справочнике Yahoo содержится намного меньше ссылок на русскоязычные документы, чем в базе данных Alta Vista. Однако для поиска информации по конкретной тематике данная система может оказаться достаточно полезной.
Согласно статистике Alexa Internet, на сегодняшний день Yahoo! -- четвертый по посещаемости веб-сайт в сети Интернет, и примерно 28 % посещений состоят из просмотра только одной страницы.
Систему Yahoo удобно использовать для поиска спортивных событий, новостей, прогнозов погоды, развлечений и тому подобной информации. Это обусловлено особенностями разбиения информации на разделы в данной системе.
Заключение
Сегодня трудно представить себе мир без компьютера, и мало кто задумывается, а что же на самом деле мы называем умными машинами. И уж точно никто не знает насколько стали умными данные аппараты. Для многих людей Искусственный интеллект и компьютер который стоит на вашем столе это одно и тоже. Но как люди просвещенные мы знаем, что до разума человека, или даже собаки любой самой умной машине еще далеко.
За время существования Интернета предпринимались различные попытки организации поисковых средств. Многие из этих попыток оказались неудачными, другие же привели к созданию удобных средств поиска информации. Наиболее удачные проекты появились в последние пять лет. Мы рассмотрели наиболее распространенные системы поиска. Всего же в мире существуют сотни различных поисковых систем, и выбор той или иной системы зависит только от личных пристрастий. Если поиск не принес желаемых результатов, первое, что нужно сделать, так это проверить орфографию введенного слова. Часто поисковая система ничего не может найти только из-за того, что введенного термина просто не существует в природе. Чтобы выяснить это, нужно взглянуть на количество найденных ресурсов, содержащих искомое слово (большинство поисковиков выводят эти данные в самом начале листа результатов). Если слово не встречается ни разу, то велика вероятность его ошибочного написания. Следующий шаг - убедиться в чувствительности (или нечувствительности) системы к заглавным буквам. Соответственно, нужно скорректировать свой запрос, уже исходя из этого обстоятельства. Если же слово написано верно, а поиск все равно не дает результатов, то можно попробовать поискать требуемую информацию, используя синонимы. Наконец, не нужно бояться расширенного поиска - функции, предоставляемой большинством поисковиков, да и языком запросов пренебрегать не стоит.
Список литературы
1. Ашманов И. С., Иванов А. А. Продвижение сайта в поисковых системах -- М.: Вильямс, 2007. -- 304 с.
2. Байков Владимир Дмитриевич Интернет. Поиск информации. Продвижение сайтов -- СПб.: БХВ-Петербург, 2000. -- 288 с.
3. Гусев Владимир Сергеевич. Яндекс: эффективный поиск информации в Интернет. Краткое руководство -- М.: Диалектика, 2007. -- 224 с.
4. Колисниченко Д. Н. Поисковые системы и продвижение сайтов в Интернете -- М.: Диалектика, 2007. -- 272 с.
5. Колисниченко Д.Н. Часть IV. Поисковая система Рамблер // Поисковые системы и продвижение сайтов в Интернете -- М.: Диалектика, 2007. -- 272 с.
6. Маннинг К., Рагхаван П., Шютце Х. Введение в информационный поиск -- Вильямс, 2011.
Размещено на Allbest.ru
Подобные документы
Анализ возможностей поисковых систем Яндекс и Google, их сравнение с точки зрения полезности. История создания поисковых систем, характеристика их интерфейса, поисковых инструментов и алгоритмов. Формирование вопроса и критерий к ответу на него.
реферат [30,0 K], добавлен 07.05.2011Структура справочно-поисковых систем сети Интернет, работа механизмов поиска. Сравнительный обзор справочно-поисковых систем (Gopher, WAIS, WWW, AltaVista, Yahoo, OpenText, Infoseek). Поисковые роботы, наиболее популярные справочно-поисковые системы.
реферат [28,4 K], добавлен 14.01.2010Краткая история развития поисковых систем. Обзор мировых и российских поисковых систем: Google, Yahoo, Baidu, Yandex, Rambler, Апорт, Mail.ru. Текстовый процессор Microsoft Word. Табличный редактор Excel. Организация рабочего места оператора ЭВМ.
курсовая работа [66,3 K], добавлен 20.12.2008История развития поисковых систем, особенности механизма поиска. Сравнительный обзор справочно-поисковых систем Интернета. Понятие поисковых роботов. Наиболее популярные поисковики для русскоязычного пользователя. Перспективы развития поисковых систем.
реферат [64,0 K], добавлен 20.12.2012Хранение данных в сети Internet. Гипертекстовые документы, виды файлов. Графические файлы, их виды и особенности. Поисковые системы и правила поиска информации. Обзор поисковых систем сети Internet. Все о поисковых системах Yandex, Google, Rambler.
курсовая работа [918,3 K], добавлен 26.03.2011Структура и принципы построения сети Интернет, поиск и сохранение информации в ней. История появления и классификация информационно-поисковых систем. Принцип работы и характеристики поисковых систем Google, Yandex, Rambler, Yahoo. Поиск по адресам URL.
курсовая работа [3,6 M], добавлен 29.03.2013Понятие, структура и классификация информационных систем. Информационно поисковые системы. Исторические предпосылки развития поисковых систем. Понятие поисковых систем. Особенности поисковых систем: структура сети, структура работы поисковых систем.
курсовая работа [81,9 K], добавлен 28.03.2005Изучение классификации поисковых средств по В.В. Дудихину. Поиск информации с помощью поисковых ресурсов. Формирование запросов. Использование ключевых слов. Индексация документов, размещенных на различных серверах. Зарубежные лидеры поисковых систем.
презентация [775,3 K], добавлен 10.03.2015Сущность поисковых систем интернета. Google и Yahoo! как крупнейшие в интернете поисковые машины. Характеристика Baidu как лидера среди китайских поисковиков. Обзор технологии QDR SRAM. Архитектура строения памяти QDR, ее достоинства и недостатки.
реферат [186,5 K], добавлен 27.09.2014Основные принципы построения информационно-поисковых систем. Архитектура современных информационно-поисковых систем WWW. Принцип работы поисковых систем. Процесс поиска, информационный язык, перевод, дескриптор, критерий соответствия, индексирование.
курсовая работа [70,2 K], добавлен 10.06.2014