Источники информации, методы поиска и сбора данных в сети Интернет
Интернет как глобальная компьютерная сеть, связывающая между собой пользователей компьютерных сетей и персональных компьютеров; знакомство с основными источниками информации. Рассмотрение важных функций поисковых машин. Общая характеристика баз знаний.
Рубрика | Маркетинг, реклама и торговля |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 28.08.2013 |
Размер файла | 1,9 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
"Источники информации, методы поиска и сбора данных в сети Интернет"
интернет компьютерный сеть
Введению
Сеть Интернет похожа на огромную мировую библиотеку, имеющую только одно, но существенное отличие: для поиска книги в библиотеке есть каталог, в крайнем случае, можно обратиться к опытному библиотекарю. Полного каталога Интернета не существует. Но, тем не менее, поиск в глобальной компьютерной сети возможен, и это, пожалуй, является одной из наиболее важных его сторон. Для поиска данных в сети используются специальные серверы, информация на которых поддерживается и обновляется практически автоматически.
Сегодня, когда Интернет стал одним из основных источников информации, поиск в Сети приобретает все большую практическую ценность. Но с быстрым увеличением объема доступных данных все более усложняется и сама процедура поиска.
Интернет - это глобальная компьютерная сеть, которая связывает между собой как пользователей компьютерных сетей, так и пользователей ПК. Интернет медленно, но верно становится основным средством корпоративного общения, уступая пока телефону.
В Сети наличествует гигантское количество информационных ресурсов. По некоторым оценкам, число документов превысило 65 млн. и продолжает стремительно расти. Такой объем информации требует правильной организации процесса поиска и применения специальных технических средств, таких как поисковые машины. Простой поиск по достаточно распространенному ключевому слову дает обычно от десятков тысяч до нескольких миллионов ссылок. Очевидно, что работа с таким большим количеством документов практически невозможна, тем более что подавляющая их часть содержит информацию, не относящуюся к делу.
Источники информации в Интернете различаются по способу представления информации, а следовательно, и по методу доступа к ним.
Из всего выше сказанного вытекает актуальность темы данной курсовой работы.
Целью курсовой работы является выявление основных источников информации, методов поиска и сбора данных в сети Интернет
Для реализации поставленной цели необходимо решить следующие задачи:
Изучить источники маркетинговой информации и методы поиска;
оценить ситуации на рынке рекламных услуг в РБ при помощи источников Интернет;
оценить эффективность методов сбора и источников информации в интернет
Объектом исследования в данной курсовой работе является источники информации
Предметом исследования курсовой работы является оценка эффективности методов поиска, источников информации в Интернет.
Следует отметить, что вопросы, связанные с рассматриваемой темой освещены в научной и периодической литературе в объеме, достаточном для написания работы.
Теоретической и методологической основой работы послужили теоретические положения работ отечественных и зарубежных ученых. Весомый вклад в теорию исследуемых проблем внесли Ф. Котлер, М. Портер, А.М.Годин, Т.П. Данько, Н.Б. Завьяловой, О.В. Сагиновой. Нэреш К. Малхотра, дал основные теоретические сведения о проведения опроса и анализа полученных данных.
В числе основных информационных источников работы использовались публикации в таких периодических изданиях, как «Маркетинг в России и за рубежом», «Маркетинг. Идеи и технологии», «Маркетинг и маркетинговые исследования».
1.Интернет как источник маркетинговой информации. Методы поиска информации
Каждый пользователь Всемирной паутины сталкивается с проблемой поиска информации. Будь то реферат, курсовая, поиск этой информации может занять от пяти минут до нескольких часов - все зависит от умения искать и находить нужные данные в Интернете. В этом случае на помощь приходят всевозможные поисковые машины, каталоги и базы знаний. Рассмотрим их по отдельности.
1.1 Каталоги сайтов
С этой категорией все довольно просто. Каталог представляет собой электронную библиотеку ссылок на ресурсы (сайты) определенной направленности. Здесь действительно все как в настоящей библиотеке - все сайты разложены по категориям, с краткими описаниями для более удобного восприятия. Главным минусом данной системы является так называемый «ручной набор» сайтов, т. е. далеко не все странички глобальной сети размещены.
Поисковые машины
Рис. 1.1 поисковик Google
Если, во всевозможных каталогах, вы так и не нашли, что искали. На помощь уже спешат многочисленные поисковики, благо их существует достаточное количество. Главными русскоязычного рынка являются Яндекс, Рамблер и Google. Также, вы можете обратиться к таким поисковикам, как Апорт, Yahoo! и прочим.
Рис. 1.2 поисковик Яндекс
Главный плюс любой поисковой машины кроется в механизме ее работы. В отличие от каталогов, поисковики для добавления сайтов в свою базу данных, используют специального робота-паука, который вполне удачно просматривает и индексирует все общедоступные сайты своей Глобальной Паутины. Но для удачного поиска будет мало лишь огромной базы спутника, ведь среди всех этих терабайт информации нам нужно найти именно нужную. Поэтому на любой из предложенных поисковиков и рассмотрим главные правила поискового дела.
1.2 Точность и простота запроса
Рис. 1.3 поисковик Апорт[17]
Важнейшим фактором и залогом нашего успеха является правильность поискового запроса. К примеру, если вы хотите найти информацию о чемпионате по футболу Евро 2012 в Украине, вам следует вводить в строке поиска Евро 2012 Украина, а не просто футбол Украине. Машина ищет именно слова и словосочетания, она не знает, что вы имели ввиду, запросив какую-либо информацию, она не будет думать за вас! Также полезно знать, что любой современный поисковик сортирует найденную информацию по релевантности (степени совпадения вашего запроса с информацией на сайте), т. е. самый подходящий вам сайт будет находиться на первом месте и т. д. Также, обратите внимание, что поисковая система не индексирует и не ищет по предлогам и таким частым словам, как «где», «когда», «кто»; также она опускает знаки пунктуации (исключения составляют лишь очень распространенные комбинации, как $10 или С++).
1.3 Поиск цитаты или точного названия
С поиском цитат или точных названий фирм, музыкальных групп и пр., если поисковик не берет во внимание сильно распространенные слова? Очень просто. Стоит лишь заключить в кавычки весь запрос, и система тотчас же воспримет его как единое целое, не смея менять слова местами либо опускать какие-либо слова или символы. К примеру, если вы ищете текст песни «Белые розы», просто наберите фразу «что с вами сделали лед и морозы». Также можно заставить поисковую машину искать любое слово или символ, поставив пред ним «+». Результатом запроса «Обитель зла +3», будет именно ссылки на сайты о третьей части этого фильма.
1.4 Поиск по сайту или домену
Предположим, вы читали интереснейшую статью на каком-либо сайте, однако забыли сохранить ссылку в Избранном и теперь не можете ее найти. И с этой задачей способен справиться поисковик. К примеру, Google стоит лишь указать, на каком сайте искать, например: Как купить компьютер Данный запрос направит поисковую систему на указанный сайт, и найдет там нужную информацию. В Яндексе такой запрос выполняется немного сложнее: Как собрать компьютер. Также эта функция позволяет искать информацию в определенном домене, например, для поиска с помощью Google информации, расположенной на сайтах с адресом *.ru, можно ввести: Как купить компьютер site:ru - что может быть полезно для поиска данных определенного региона. Исключение из поиска. Поисковую машину можно не только «заставлять» искать нужный текст в Интернете, но и исключать некоторые слова из запроса. Если вы не хотите, что бы при поиске реферата на тему «История Древнего Египта» вам были предложены документы с его Культурой, просто введите в поисковое поле Google: история древнего египта -культура. В Яндексе вместо знака «-» используется сочетание знаков «~~». При таком запросе, слово «культура» было полностью исключено из критериев поиска.
1.5 Поиск с учетом регистра
Поисковые системы не учитывают регистр, все заглавные символы воспринимаются машинами как строчные, за исключением использования специального операнда. Таковым является знак восклицания «!», стоящий перед словом. Эта функция очень полезна, чтобы искать села или города с распространенными названиями, к примеру «село !Кошки». В данном случае, поисковик не будет искать сайты, где речь ведется о селе, где живут кошки, а будет вести поиск с учетом заглавной буквы.
1.6 Базы знаний
Рис. 1.4 поисковик Wikipedia
Существуют сайты, которые не только предоставляют нам информацию, но и позволяют дополнять и редактировать ее. Такие проекты развиваются с огромной скоростью и очень быстро превращаются в огромные Базы знаний, к которым ежедневно обращаются люди, ищущие информацию в сети. Одним из самых грандиозных проектов по праву считается Википедия (http://wikipedia.org/), основанная на технологии Web 2.0 и имеющая множество языковых локализаций (русская версия http://ru.wikipedia.org/). В ней организован собственный поисковый механизм, позволяющий легко и быстро искать нужные статьи для будущих рефератов или научных работ. На основе програмного кода Википедии, создан, так называемый, движок wiki, позволяющий другим проектам Интернета создавать свои собственные Базы знаний, что позволяет пополнять Всемирную Паутину нужной и важной информацией, заполняя оставшиеся ниши информационной прослойки Интернета. [1, с337]
По источнику происхождения маркетинговую информацию можно разделить на первичную и вторичную. Первичная информация получается в результате специально проведенных исследований, вторичная уже существует в информационном пространстве как результат деятельности других субъектов.
Любое предприятие, в практической деятельности имеет дело преимущественно с вторичной информацией, получаемой как из внешней, так и внутренней среды. И только при отсутствии необходимой информации вторичного характера возникает необходимость в проведении маркетинговых исследований. Под маркетинговым исследованием понимают систематическое определение круга данных, необходимых в связи со стоящей перед фирмой маркетинговой задачей: их сбор, анализ и отчет о полученных сведениях, выводах и рекомендациях.
Интернет предоставляет отличные возможности для проведения маркетинговых исследований, даже силами самого предприятия, не прибегая к помощи специалистов по маркетингу. Маркетинговыми исследованиями могут заниматься как менеджеры по направлениям, так и руководители.
Можно выделить несколько направлений сбора информации с помощью сети Интернет:
- мониторинг ключевых запросов;
- изучение сайтов конкурентов;
- изучение потребительского спроса.
Рассмотрим все эти направления подробнее.
Мониторинг ключевых запросов.
Ключевые запросы - это слова или комбинации слов, которые пользователи набирают в поисковых системах с целью нахождения необходимой информации. По статистике, около 70 % пользователей попадают на коммерческие сайты через различные поисковые системы. Самые популярные поисковые системы русскоязычной зоны Интернет:
*Yandex
*Rambler
*Mail.Ru
Мониторинг ключевых запросов - это изучение ключевых запросов в различных поисковых системах, по различным категориям и признакам с целью выявления потенциального потребительского спроса среди пользователей Интернет. Мониторингом ключевых слов может заниматься отдел маркетинга совместно с ИТ-отделом, а при их отсутствии - менеджеры по направлениям или штатный веб-мастер компании. Небольшие фирмы могут прибегать к помощи специалистов извне (сейчас очень много фирм занимаются продвижением сайтов), но крупным фирмам, которые хотят использовать возможности Интернет на 100 %, лучше иметь в своем штате специалиста по интернет-маркетингу и продвижению веб-сайтов.
Изучение сайтов конкурентов.
Любая фирма должна учитывать не только запросы потребителей, но и поведение конкурентов. Каждый товар или услуга имеет свою конкурентную среду, особенности которой влияют на сложность работы на конкретном рынке. Фирмы подвержены влиянию факторов, с которыми сталкивается любая компания, работающая на конкурентном рынке.
Поведение фирмы обусловлено конкуренцией и рыночными условиями. Она вынуждена реагировать не только на изменение структуры отрасли, но и выбирать свою позицию в этой структуре. Конкурентная стратегия каждой фирмы разрабатывается в соответствии со структурой спроса, своим положением в отрасли и на конкретном рынке. Даже небольшие предприятия нуждаются в собственной стратегии, от которой зависит успех их дела. Хорошо разработанная стратегия позволяет фирме активнее влиять на происходящие на рынке события.
Таким образом, руководитель предприятия либо отдел, занимающийся маркетинговым анализом и ценообразованием, может сразу видеть реальную картину конкуренции, как по ценовому признаку, так и по привлекательности и насыщенности предоставленной информации на сайтах конкурентов. Изучая веб-сайты конкурентов можно отслеживать последние тенденции и инновации в бизнесе.
Так, на сегодняшний день все большее распространение получают следующие инновации:
- тиражирование сайта (экспорт базы данных);
- создание аккаунтов («кабинетов»);
- размещение видеороликов;
- возможность оплаты с помощью кредитных карточек.
Интернет - это особая информационная среда, где за достоверность информации ответственность несет лишь ее автор, поэтому к отзывам стоит относиться объективно. Бывает такое, что один и тот же объект размещения может получить абсолютно противоположные отзывы от разных отдыхающих. [2, с37-44]
2. Методы поиска информации в Интернете
Более или менее серьезный подход к любой задаче начинается с анализа возможных методов ее решения. Поиск информации в Интернете может быть произведен несколькими методами, значительно различающимися как по эффективности и качеству поиска, так и по типу извлекаемой информации. В ряде случаев приходится использовать весьма трудоемкие методы - результат того стоит.
Можно выделить следующие основные методы поиска информации в Интернете, которые, в зависимости от целей и задач ищущего, используются по отдельности или в комбинации друг с другом:
Непосредственный поиск с использованием гипертекстовых ссылок
Использование поисковых машин
Поиск с применением специальных средств
Анализ новых ресурсов
Непосредственный поиск с использованием гипертекстовых ссылок
Поскольку все сайты в пространстве WWW фактически оказываются связанными между собой, поиск информации может быть произведен путем последовательного просмотра связанных страниц с помощью браузера. Хотя этот полностью ручной метод поиска выглядит полным анахронизмом в Сети, содержащей сотни миллионов узлов, "ручной" просмотр Web-страниц часто оказывается единственно возможным на заключительных этапах информационного поиска, когда механическое "копание" уступает место более глубокому анализу. Использование каталогов, классифицированных и тематических списков и всевозможных небольших справочников также относится к этому виду поиска.
2.1 Использование поисковых машин
Сегодня этот метод является одним из основных и фактически единственным при проведении предварительного поиска. Результатом последнего может являться список ресурсов Сети, подлежащих детальному рассмотрению. Как правило, применение поисковых машин основано на использовании ключевых слов, которые передаются поисковым серверам в качестве аргументов поиска: что искать. Если делать все правильно, то формирование списка ключевых слов требует предварительной работы по составлению тезауруса.
2.2 Поиск с применением специальных средств
Этот полностью автоматизированный метод может оказаться весьма эффективным для проведения первичного поиска. Одна из технологий этого метода основана на применении специализированных программ - спайдеров, которые в автоматическом режиме просматривают Web-страницы, отыскивая на них искомую информацию. Фактически это автоматизированный вариант просмотра с помощью гипертекстовых ссылок, описанный выше (поисковые машины для построения своих индексных таблиц используют похожие методы). Нет нужды говорить, что результаты автоматического поиска обязательно требуют последующей обработки. Применение данного метода целесообразно, если использование поисковых машин не может дать необходимых результатов (например, в силу нестандартности запроса, который не может быть адекватно задан существующими средствами поисковых машин). В ряде случаев этот метод может быть очень эффективен. Выбор между использованием спайдера или поисковых серверов являет собой вариант классического выбора между применением универсальных или специализированных средств.
2.3 Анализ новых ресурсов
Поиск по новообразованным ресурсам может оказаться необходимым при проведении повторных циклов поиска, поиска наиболее свежей информации или для анализа тенденций развития объекта исследования в динамике. Другой возможной причиной может явиться то, что большинство поисковых машин обновляет свои индексы со значительной задержкой, вызванной гигантскими объемами обрабатываемых данных, и эта задержка обычно тем больше, чем менее популярна интересующая вас тема. Это соображение может оказаться весьма существенным при проведении поиска в узкоспециальной предметной области.
2.4 Технология поиска с использованием поисковых машин. Определение географических регионов поиска
Рассмотрим основные этапы, которые так или иначе присутствуют при поиске информации с использованием поисковых машин.
Поскольку проведение информационного поиска преследует практические цели - маркетинговые, производственные, сугубо утилитарные и тому подобные, - практическая ценность информационного ресурса может зависеть и от географического расположения соответствующего источника.
2.5 Составление тезауруса
Для эффективного использования поисковых серверов необходим список ключевых слов, организованный с учетом семантических отношений между ними, т.е. тезаурус. При составлении тезауруса необходимо предусмотреть обработку синонимов, омонимов и морфологических вариаций ключевых слов.
2.6 Использование законов Зипфа
Число, показывающее сколько раз встречается слово в тексте, называется частотой вхождения слова. Если расположить частоты по мере убывания и пронумеровать, то порядковый номер частоты называется рангом частоты. Вероятность обнаружения слова в тексте = частота вхождения слова / число слов в тексте. Зипф нашел, что если умножить вероятность обнаружения слова в тексте на ранг частоты, то получившаяся величина приблизительно постоянна для всех текстов на одном языке:
С = (частота вхождения слов X ранг частоты) / число слов
Это значит, что график зависимости ранга от частоты - равносторонняя гипербола. Зипф также установил, что зависимость количества слов с данной частотой от частоты - также гипербола и постоянная для всех текстов в пределах одного языка.
Что можно извлечь из этих законов? Исследования вышеуказанных зависимостей для различных текстов показали, что наиболее значимые слова текста лежат в средней части диаграммы, так как слова с максимальной частотой как правило являются предлогами, частицами, местоимениями, в английском языке - артиклями (так называемые "стоп-слова"), а редко встречающиеся слова в большинстве случаев не имеют решающего значения. Основываясь на этой закономерности, можно предложить следующую методику.
2.7 Составление списка ключевых слов
Правильный набор ключевых слов имеет определяющее значение для оптимального поиска информации. К примеру, задав поисковой машине в качестве ключевого слова "МАРП", мы получим список документов, в которых встречается эта аббревиатура (Московское Агентство по Развитию Предпринимательства). Но если нас интересуют документы по более широкой теме, например: развитие предпринимательства, и мы сформируем простой запрос из этих двух слов, то поисковая машина выдаст нам список из сотен тысяч наименований, ориентироваться в котором будет весьма непросто.
Поэтому для составления оптимального набора ключевых слов используют процедуру, основанную на применении законов Зипфа, которая заключается в следующем: берут любой текст-источник, близкий к искомой теме, т.е. "образец", и анализируют его, выделяя значимые слова. В качестве текста-источника может служить книга, статья, Web-страница, любой другой документ.
Анализ текста производится таким образом:
Удаление из текста стоп-слов
Вычисление частоты вхождения каждого слова и составление списка, в котором слова расположены в порядке убывания их частоты.
Выбор диапазона частот, лежащего в середине списка, и отбор из этого диапазона слов, наиболее полно соответствующих смыслу текста.
Составление запроса к поисковой машине в форме перечисления отобранных таким образом ключевых слов, связанных логическим оператором ИЛИ (OR). Запрос в таком виде позволяет обнаружить тексты, в которых встречается хотя бы одно из перечисленных слов.
Число документов, полученных в результате поиска по этому запросу, может быть огромно. Однако, благодаря ранжированию документов (расположению их в порядке убывания частоты вхождения слов запроса в документ), применяемому в большинстве поисковых машин, на первых страницах списка практически все документы окажутся релевантными, причем документ-источник может находиться далеко от начала.
Более адекватной представляется структура тезауруса в виде так называемых семантических срезов, где для каждого основного термина отдельно строится таблица сопутствующих слов и слов шумовых (которые не должны встречаться в источнике), - некоторые поисковые машины (AltaVista) позволяют это использовать. Таким образом, вместо единой иерархической структуры терминов мы получаем пакет таблиц, которые могут расширяться и модифицироваться отдельно.
Отбор поисковых машин
Устанавливается последовательность использования поисковых машин в соответствии с убыванием ожидаемой эффективности поиска с применением каждой машины. Всего известно около 180 поисковых серверов, различающихся по регионам охвата, принципам проведения поиска (а следовательно, по входному языку и характеру воспринимаемых запросов), объему индексной базы, скорости обновления информации, способности искать "нестандартную" информацию и тому подобное. Основными критериями выбора поисковых серверов являются объем индексной базы сервера и степень развитости самой поисковой машины, то есть уровень сложности воспринимаемых ею запросов.
Составление и выполнение запросов к поисковым машинам
Это наиболее сложный и трудоемкий этап, связанный с обработкой большого количества информации (в основном шумовой). На основе тезауруса формируются запросы к выбранным поисковым серверам, после чего возможно уточнение запроса с целью отсечения очевидно нерелевантной информации. Затем производится отбор ресурсов, начиная с наиболее интересных, с точки зрения целей поиска. Данные с ресурсов, признанных релевантными, собираются для последующего анализа.
Формирование запросов
Как формат, так и семантика запросов варьируются в зависимости от применяемой поисковой машины и конкретной предметной области. Запросы составляются так, чтобы область поиска была максимально конкретизирована и сужена. Предпочтение отдается использованию нескольких узких запросов по сравнению с одним расширенным. В общем случае для каждого основного понятия из тезауруса готовится отдельный пакет запросов. Так же производится пробная реализация запросов - как для уточнения и пополнения тезауруса, так и с целью отсечения шумовой информации.
Языки запроса различных машин поиска в основном являются сочетанием следующих функций:
Операторы булевой алгебры AND, OR, NOT:
AND (И) - осуществляется поиск документов, содержащих все термины, соединенные данным оператором;
OR (ИЛИ) - искомый текст должен содержать хотя бы один из терминов, соединенных данным оператором;
NOT (НЕ) - поиск документов, в тексте которых отсутствуют термины, следующие за данным оператором.
Операторы расстояния - ограничивают порядок следования и расстояния между словами, например:
NEAR - второй термин должен находиться на расстоянии от первого, не превышающем определенного числа слов;
FOLLOWED BY - термины следуют в заданном порядке;
ADJ - термины, соединенные оператором, являются смежными.
Возможность усечения терминов - использование символа " * " вместо окончания термина позволяет включить в искомый список все слова, производные от его начальной части (шаблона).
Учет морфологии языка - машина автоматически учитывает все формы данного термина, возможные в языке, на котором ведется поиск.
Возможность поиска по словосочетанию, фразе.
Ограничение поиска элементом документа (слова запроса должны находиться именно в заголовке, первом абзаце, ссылках и т.д.).
Ограничения по дате опубликования документа.
Ограничения на количество совпадений терминов.
Возможность поиска графических изображений.
Чувствительность к строчным и прописным буквам.
Результат запроса (список ссылок) обрабатывается в два этапа. На первом этапе производится отсечение очевидно нерелевантных источников, попавших в выборку в силу несовершенства поисковой машины или недостаточной "интеллектуальности" запроса. Параллельно проводится семантический анализ, имеющий целью уточнение тезауруса для модификации последующих запросов. Дальнейшая обработка производится путем последовательного обращения на каждый из найденных ресурсов и анализа находящейся там информации.
2.8 Проблемы, возникающие в процессе поиска
Одна из проблем является чисто методологической. Для проведения эффективного поиска мы заинтересованы в одновременном решении двух противоположных задач:
увеличение охвата с целью извлечения максимального количества значимой информации;
уменьшение охвата с целью минимизации шумовой информации.
Нетрудно видеть, что одновременно осуществить это довольно сложно, хотя зачастую все-таки возможно. Один из методов, если поисковая машина позволяет, - это введение явных ограничений (запрещенных слов). Другой состоит в правильном формировании запросов, в частности, в предпочтении нескольких конкретизированных запросов одному общему. К сожалению, весьма ограниченный входной язык большинства машин не оставляет особенного простора для творчества в этом направлении.
Другая проблема - многовариантность человеческого языка. Если в английском языке некоторые слова имеют множество различных значений, то русский отличается богатством морфологических вариаций слов, а для полноты поиска необходимо учитывать еще и синонимы.
Часто в области российского Интернета возникают чисто технические трудности из-за различных кодировок информации. Российские поисковые машины распознают кодировки пользователя и искомого сайта, но совместить их удается не всегда.
Еще одна особенность русскоязычной части сети - ее нестабильность. Постоянно изменяются адреса и структура сайтов, они появляются и исчезают, и поисковые машины не успевают обновлять свои базы индексированных данных, поэтому значительная часть списка документов, выданного вам машиной, может оказаться недоступной.[1, с318-323]
Вывод: Поиск информации в сети - это достаточно специфическая и кропотливая работа, требующая определенных знаний и навыков. Для проведения поисковых работ пригодятся: знания основных информационных ресурсов и умение хорошо в них ориентироваться, практические навыки работы - это приходит со временем, хорошая зрительная память и умение быстро читать, а так же некоторые навыки аналитической работы.
Основной проблемой при поиске можно назвать неумение пользователя эффективно искать информацию в сети.
Поисковые машины ищут информацию по всей сети Internet. На самом деле это не совсем верно. Если бы при реализации алгоритма работы поисковых машин был использован такой подход, то для обработки только одного запроса и выдачи результатов потребовалось бы несколько дней.
Каждая поисковая машина имеет и постоянно пополняет свою (локальную) базу данных. База данных поисковой машины содержит основные параметры (индексы) каждого известного данной машине (проиндексированного) документа. Каждая поисковая машина использует свои методы индексации. Кроме того, различные поисковые машины имеют разные объемы базы данных.
В результате, механизм обработки запроса пользователя поисковой машиной выглядит следующим образом:
в соответствии с заданным в запросе ключевым словом или словосочетанием, машина проводит поиск в своей локальной базе данных, сверяя ключевое слово с наборами ключевых слов, соответствующих каждому документу из её базы данных;
затем, используя соответствующие алгоритмы, поисковая машина сортирует результаты поиска и выдает их пользователю;
в результате сортировки результатов, в начало списка помещаются наиболее соответствующие (с точки зрения поисковой машины) ключевым словам документы.
В связи с огромным количеством информации, размещенной в сети, ни одна из поисковых машин не в состоянии просмотреть все документы. Каждая поисковая машина индексирует только часть их. Все остальные документы, а к сожалению это большая часть ресурсов, найти с ее помощью не удастся.
3. Описание ситуации на рынке рекламных услуг в РБ при помощи источников Интернет
Проведем исследование при помощи различных медовов поиска информаии в сети Интернет на примере вторичных данных.
Поисковые системы предназначены для поиска информации в глобальной сети Интернет. Информации сегодня в Сети существует огромное количество, и без поисковых систем практически невозможно было бы найти что-либо. Основные поисковые системы:
Яндекс- Выполняет поиск по русской части Интернет с учетом русской морфологии. Имеет очень мощный язык запросов. Результаты поиска упорядочиваются по степени значимости и содержат удобную аннотацию. Апорт- Поисковая система работает со всеми русскими кодировками, имеет гибкий язык запросов, есть возможность перевода запроса с русского на английский язык и наоборот. Результаты поиска сортируются по степени значимости, вместе со ссылкой отображается фрагмент текста, где встречается термин, а также дата и время последней модификации файла.
Google- Поисковая система позволяют выделять нужные результаты сразу несколькими способами:
Просмотр страниц с заданным типом контента: можно указать, что результаты поиска должны содержать только видео или только форумы.
Просмотр похожих запросов: вы можете просмотреть список запросов, близких по смыслу к вашему. Более того, вы можете получить визуальное представление взаимосвязей между запросами, воспользовавшись опцией «Колесо обозрения».
Фильтр по дате: вы можете получить самые свежие результаты, ограничив поиск последними сутками, неделей, годом или заданным периодом времени.
Цель исследования: анализ тенденции рынка Интернет рекламы в РБ, при помощи источников Интернет.
Будем использовать наиболее популярные поисковые машины такие как: Google, Яндекс, Апорт. Вводим в поисковик словосочетания: «Интернет- реклама в Беларуси.» Результат: Google 5 010 000 ссылок,
Рис.2.1-Поисковик Google
Яндекс по тому же запросы выдает 2 000 000 ссылок
Рис.2.2- поисковик Яндекс
Рис.2.3- поисковик Апорт
Задаем другое словосочетание: «Сегмент интернет рынка Беларуси». Результат: 425 000 ссылок.
Рис.2.4-Поисковик Google
Рис.2.5- поисковик Яндекс
Рис.2.6- поисковик Апорт
Рис.2.7-Поисковик Google
Рис.2.8- поисковик Яндекс
Рис.2.10- поисковик Апорт
Запрос Google:» прогнозы ZenithOptimedia интернет рекламы в РБ». Результат: 14 800 ссылок.
Рис.2.11-Поисковик Google
Яндекс: 21 000 ссылок.
Рис.2.12- поисковик Яндекс
Апорт: 33 943 ссылок.
Рис.2.13- поисковик Апорт
Исходя из поиска наиболее часто встречаемые сайты- это http://www.electroname.com, www.zenithoptimedia.com, marketing.by.
Полученная информация позволяет сделать следующее :
Согласно последним данным компании ZenithOptimedia, рекламный рынок Беларуси упадет почти на 14%. По итогам 2011 года он может составить около 84 млн. долларов, в то время как в прошлом году эта цифра была равна 97,7 млн. долларов.
Более того, согласно прогнозу ZenithOptimedia,, к 2012 году рынок рекламы не достигнет уровня 2010 года - в 2012 объем рекламы в Беларуси составит только 96 млн. долларов, пишет сайт Marketing.by.
Пожалуй, интернет-реклама - единственный сектор в рекламном бизнесе, который демонстрирует устойчивый рост в кризисных условиях , который покажет рост в 2011 году - по итогам года он покажет рост в 6,1%. Однако, согласно апрельскому прогнозу ZenithOptimedia, рынок интернет-рекламы должен был бы вырасти на 26,8%. Объем рынка интернет-рекламы к концу 2011 года составит 7,7 млн.долларов.
Причина длительного стабильного роста данного сегмента рекламного рынка, в том, что рекламодатели все больше верят в действенность интернет рекламы, которая за время своего развития превратилась из экзотики в мейнстрим, без которого не обходится ни один успешный деловой проект.
В Беларуси наблюдается активная динамика регистрации новых доменов для корпоративного использования. Предприятия Беларуси активней разрабатывают корпоративные сайты для своего бизнеса, что доказывает интенсивное развитие интернет рынка.
Одно из знаковых явлений- рост популярности поисковой (контекстной)рекламы в Интернете. Преимущество контекстной рекламы заключается в том, что ее невозможно блокировать (в отличие от баннеров и всплывающих окон), что и делает ее настолько эффективной. Радио, телевидение, печатные СМИ не могут даже приблизиться к уровню таргетивности контекстной рекламы. Ведущие электронные издания моментально оценили ситуацию и занялись активным размещением поисковой рекламы на своих виртуальных страницах.
По оценкам экспертов на контекстную рекламу в Байнете в этом году будет потрачено $1,1 млн, а на медийную - $6 млн. Classified (реклама в каталогах, частные объявления, строчная реклама и пр.) в данных оценках не учитывается. ZenithOptimedia
Данная динамика свидетельствует о том, что интернет остается для рекламодателей наиболее перспективным каналом на фоне государственного регулирования других медиа (ТВ, пресса, радио).
Проникновение интернета в Беларуси на начало 2010 года составило 32%. Год назад этот показатель составлял 26%. Однако относительно высокая стоимость доступа в Сеть сдерживает более быстрый рост этого показателя.
По мнению исследователей бурный рост интернет-рекламы обусловлен излишним государственным регулированием других средств массовой информации в нашей стране, что тормозит их развитие. В 2009 году затраты на рекламу в Сети превысят затраты на радиорекламу. Также рост интереса к интернет-рекламе связан с увеличением количества белорусских интернет-пользователей и появлением возможности размещать рекламу на иностранных ресурсах, популярных у белорусов.
Т.к. доля интернета в общем рекламном рынке пока малозаметна (6,5%), положительная динамика в этом секторе не повлияет на общие результаты. В Беларуси по-прежнему сегмент телевизионной рекламы остается доминирующим и занимает более 60% рынка.
Рис. Динамика общих рекламных затрат в Республике Беларусь 2005-2011 гг, в $ млн., net-затраты с учетом НДС
Рис. Динамика рекламных затрат на интернет-рекламу в Республике Беларусь 2005-2011 гг, в $ млн., net-затраты с учетом НДС
Рис. Доли основных сегментов в рекламных затратах в Беларуси, 2010 год, в $ млн.
На сегодняшний день на белорусском рынке контекстной рекламы официально представлены три системы контекстной рекламы: Yandex, Google и «Бегун». Основное преимущество контекстной рекламы это то, что рекламодатели платят за реальные результаты
Тенденция развития рынка интернет рекламы является постоянно возрастающая целевая аудитория. Это связано с непрерывным развитием скоростного широкополосного доступа в сеть. В Европе и США широкополосный доступ в Интернет имеет более 30% населения, другие страны пока уступают, но демонстрируют высокие темпы роста этого показателя. В РБ подключения к интернету увеличиваются с каждым днем. Согласно данным провайдеров рост за первое полугодие 2010 года составляет более 50%.
Непрерывный рост числа подключений к Интернету через широкополосный доступ позволяет сделать вывод, что, помимо контекстной рекламы, наибольшим потенциалом для развития обладает медийная реклама, в основе которой - новые технологии психологического таргетинга. В Европе более чем в 50% заявок на проведение рекламных интернет кампаний упоминается необходимость использования Flash-ролики рекламного характера, которые осуществляют заданный сценарий коммуникации с клиентом. Уровень дохода этого сегмента на мировом рынке в 2009 году составлял 3-3,3 млрд. долларов при ежегодном росте 15-25%.
Медийная интернет реклама наиболее популярная среди рекламодателей. Медийная интернет реклама представлена в виде баннеров. Издатели предлагают баннерную рекламу за физическое размещение, что уже практически не используется во всем мире. Однако, на рынке интернет рекламы есть возможность размещения баннерной рекламы по показам. Для рекламодателей это наиболее эффективный способ размещения, который позволяет точно определить количество показов, переходов, покрытия аудитории.
Высоким потенциалом развития на мировом рынке интернет рекламы обладают многопользовательские ролевые онлайн, годовой денежный оборот. До сих пор первенство по обороту денег в игровой сфере успешно удерживали США - 29% мирового рынка, но Китай с 27% приблизился вплотную и показывает более высокий ежемесячный прирост.В отчете за 2009 год аналитики и эксперты «Digital Strategy Consulting» выделили следующие тенденции развития мирового рынка интернет рекламы до 2012 года:
Рост доли поисковой рекламы. Активное развитие как модели «плата за клики», так и схемы оптимизации сайтов в интересах повышения рейтинга.
Переход от телевидения к онлайн-просмотру, особенно с появлением новых интернет платформ.
Превращение в реальность мобильного Web: социальные медиа и geo-location based advertising (реклама по географическому положению) значительно расширят зону эффективности интернет рекламы.
Глобализация процессов интернет торговли. Постепенная систематизация рынка и разработка глобальных стратегий.
Повышение роли аналитики в оценке аудитории и подборе схемы оплаты.
В целом, специалисты уверены, что в 2011 году рост Интернет-рекламы продолжится, причем особенно заметен он будет в контекстной и нетрадиционной рекламе.
Как и во многих других странах, интернет стал практически единственной областью рынка рекламы, где в 2009 году возросли доходы издателей.
На 2009 год количество уникальных пользователей составило более 400 000 человек (около 9% населения) при объеме рынка интернет рекламы 1 440 000 долларов. Таким образом, каждый уникальный пользователь приносит участникам (издателям) рыка 3 доллара в год. Казалось бы, неплохо. Однако в развитых странах этот показатель может достигать 100 и более долларов. Так, при численности уникальных пользователей в США 227 млн. (74,7% населения), каждый из них приносит доход 132 доллара, или около 100 евро на человека в год.
Рынок интернет-рекламы при наличии отличных возможностей по большинству показателей в десятки, а то и в сотни, раз уступает рынкам ведущих Интернет держав.
На сегодняшний день рынок интернет-рекламы является одним из наиболее перспективных. Постоянно растущее число подключений к интернету, возрастающий интерес общественности, набирающий обороты PR позволяют прогнозировать рост посещаемости белорусских ресурсов.
С точки зрения экспертов, рынок интернет рекламы(в полном смысле этого слова - с большим количеством игроков и относительно стабильными ценами) - сформируется через 3-5 лет. Они предсказывают рост рынка за этот период в десятки раз. Пика популярности интернет-технологий следует ожидать через 5 лет, когда вырастет поколение, воспитанное на интернете и приученное покупать, продавать и потреблять при помощи интернет-технологий.
По мнению экспертов,поисковая реклама будет расти в следующие 5 лет в среднем на 23% в год, баннерная - на 17%, а нетрадиционная - на 14%. К 2015 году продажи интернет рекламы должны достигнуть верхних показателей.
Рынок интернета уже сегодня составляет миллионы евро, а рынок интернет рекламы является составляющим первого. Дальновидные рекламодатели, чувствуя это, делают уже сегодня ставки на интернет, готовясь к встрече грядущей эры интернет-потребления. Особые надежды возлагаются на новые интерактивные виды рекламы.
Те бизнес-проекты, которые останутся за бортом рекламного интернет-пространства, будут довольствоваться низкоэффективной традиционной рекламой в газетах, журналах и радио, которая сегодня работает лишь в тандеме с интернет-рекламой и в самостоятельном виде является практически бесполезной тратой рекламного бюджета.
Выводы: По прогнозам, за пять лет у самых успешных интернет проектов оборот средств от продажи рекламы и рекламных услуг и продуктов будет измеряться десятками тысяч долларов в месяц. Так устроен человек, ему достаточно сложно менять свои привычки и однажды сложившееся мнение. Единицы меняют мир.
Поисковая система Google эффективна т.к по заданному словосочетанию (указанному выше ) было найдено большое количество совпадений, так же Google отыскивает страницы, которые другие системы найти не могут. А если производить поиск в Интернете по 30 раз в день, то эффективность имеет большое значение.
Google, отличается от других систем тем ,что ищет сайты и страницы в интернете не по ключевым словам, а по статистики ссылок или обращений на них. Именно поэтому результаты поиска в этой системе ранжируются иначе.
4. Оценка эффективности методов сбора, источников информации в Интернет
Под маркетинговыми исследованиями понимается систематический сбор, отображение и анализ данных по разным аспектам маркетинговой деятельности.
Маркетинговые исследования -- это функция, которая через информацию связывает маркетологов с рынками, потребителями, конкурентами, со всеми элементами внешней среды маркетинга.
Первичная информация - это информация, которую исследователь самостоятельно получает специально для решения проблемы маркетингового исследования.
Для сбора информации о потребительских предпочтениях и предпочтениях квалифицированных специалистов в области методов сбора, источников информации в Интернете, использован метод опроса.
Опрос заключается в сборе первичной информации путем прямой постановки респондентом вопросов относительно уровня их знаний, отношению к продукту, предпочтений и покупательского поведения. [9, с. 228]
В зависимости от типов респондентов был выбран опрос, с участием категории населения, профессиональная деятельность которых не связана с предметом анализа.
Маркетинговое исследование проводилось с целью выявление особенностей поиска и использование информации в сети Интернет. Целевой аудиторией данного исследования является население Республики Беларусь до 18 лет и старше. Сбор данных проводится в городе Гомеле.
Для определения необходимого объема выборки была использована формула:
где n - объем выборки;
z - нормированное отклонение, определяемое исходя из выбранного уровня доверительности;
p - найденная вариация для выборки;
q - (100 - p);
e - допустимая ошибка.[3, с. 169]
Следовательно, объем вариации равен человек.
Любое маркетинговое исследование начинается с определения проблемы. Так, в нашем исследовании, проблема, требующая исследования, будет формулироваться следующим образом: « Как потребители относятся к использованию и поиску информации в сети Интернет?
Поисковые вопросы уточняют отдельные компоненты проблемы, каждый из которых может быть в свою очередь разбит на составляющие -- поисковые вопросы. Поисковые вопросы определяют круг конкретной информации, которая потребуется для решения проблемы исследования. Так, поисковыми вопросами, в нашем исследовании могут выступать следующие: 1. Кто является пользователем поисковых машин»: каков пол, возраст, уровень дохода, социальный статус. 2.Какую поисковую машину выбирают пользователи? 3.Какие сайты чаще всего посещают пользователи? 4.С какой целью пользователи используют Интернет? 5.Какая информация наиболее интересна в Интернете? На основе поисковых вопросов можно сформулировать гипотезы: 1.Пользователи выбираю поисковую машину Google 2. Чаще всего пользователи поисковых машин являются население в возрасте:от19-25лет 3.Пользователи чаще всего посещают развлекательные сайты 4.Большинство пользователей используют Интернет для общения 5. Для пользователей наиболее интересна информация о развлечениях и отдыхе 6.Большинство пользователи находят нужную информацию 7. Пользователи пользуются Интернетом чаще дома
В сентябре - ноябре 2011 года было проведено маркетинговое исследование, в процессе которого было опрошено 150 граждан проживающих в городе Гомеле. Опрашиваемым было предложено заполнить анкету, состоящей из 17 вопросов. Временной период исследования составляет 12 недель с учетом составления анкеты и обработки полученных данных.
Для выявления предпочтений потребителей была разработана анкета (ПРИЛОЖЕНИЕ А).
В процессе маркетингового исследования при опросе респондентов были были выявлены следующие возрастные группы потребителей.(рис 3.1)
Рисунок 3.1- Диаграмма распределения респондентов по возрасту
Как видно из рисунка 3.1 по возрастному критерию использование поисковых систем большую доля составляют респонденты, чей возраст находится в приделах 19-25 лет, что составляет 35%. Граждане, чей возраст находится в приделах 56 лет и старше, составило в процентном отношении 3%. Целевая аудитория с точки зрения их сферы деятельности представлена на рисунке 3.2.
Рисунок 3.2 - Диаграмма распределения респондентов по социальному статусу
Анализируя ответы респондентов, можно сделать вывод, что значительная часть пользователей поисковых систем - это служащие (36 %) и рабочие (30 %). Далее с небольшой разницей следуют студенты( 17 %) и предприниматели (15 %).
Полученные данные об уровне дохода населения представлены на рисунке 3.3
Рис. 3.3 - Диаграмма уровня дохода населения, %
Из рисунка 3.3 видно, что большее количество опрошенных респондентов имеют средний уровень дохода, который находится в приделах от 1 000 000 до 2 000 000 рублей, что составило 65,3%. Опрашиваемые с низкий уровень дохода составили 26,3%, а с высоким - 8%.
Рис. 3.4 - Диаграмма поисковых систем, %
Из рисунка 3.4 видно, что количество видов и наименований поисковой системы очень велико. Наибольшей популярностью пользуется системы Google.-45%, за тем Mail.ru, потом Yandex-20% и на последнем месте Rambler-10%. в целом существует большое различие в потребительских предпочтениях Google, Mail.ru, Yandex и Rambler наблюдается.
Рис. 3.5 - Диаграмма опрошенных потребителей в выборе посещения сайта, %
Рисунок 3.5 показывает, что сайты которые посещают чаще других.- это развлекательные-35%, за тем информационные -33%,потом корпоративные-25% и другое-7%
Рис. 3.6 - Диаграмма опрошенных потребителей в выборе поисковых систем, %
Из рисунка видно, что большинство опрошенных респондентов пользуются поисковыми системами-90,2%
Рис. 3.7 - Диаграмма выбора поисковых систем, %
По результатам исследования было выявлено, что для 61 % опрошенных поисковая системв является удобное средство коммуникации, для 34% простой эффективный способ нахождения информации и для 5% что-то другое. Наглядно структура ответов представлена на рисунке 3.7
Рис. 3.8 - Диаграмма пользования интернетом, %
Данное исследование дало информацию о частоте пользовании интернетом, где потребители которые посещают интернет ежедневно составило-74%, 3-4 раза в неделю- 16% и 3-4 раза в месяц-10 Наглядно структура ответов представлена на рисунке 3.8
Рис. 3.9 - Диаграмма места пользования интернетом , %
Как видно из рисунка 3.9 большинство респондентов пользуются интернетом дома(75%), 16% на работе, 5% в гостях и 4% в интерет кафе.
Рис. 3.10 - Диаграмма использование интернета , %
Рисунок 3.10 показывает, что респонденты чаще всего пользуются интернетом для общения(48%),а так же поиск информаии(26%),просмотр новостей (19%) и почта(7%)
Рис. 3.11 - Диаграмма информации в интернете, %
По результатам исследования было выявлено, что для 44 % опрошенных наиболее интересна информация о отдых и развлечение-44%, интернет-42%,бизнес 31%,компьютеры 29%, общество 27%, наука и образование 25%, культура и искусство 20%, медицина и здоровья 19%,дом и семья 18%. Наглядно структура ответов представлена на рисунке 3.11
Рис. 3.12 - Диаграмма распределения респондентов по ответу на вопрос: « Удается ли Вам найти нужную информацию в сети?», %
Из рисунка 3.12 видно, что большее количество опрошенных респондентов всегда находят информацию которую ищут-52%, за тем часто находят -33%, редко -12%, никогда 3%.
Таким образом, в ходе опроса были выявлены следующие предпочтения потребителей: большинство опрошенных предпочитают поисковую систему такую как Google, при этом, использование Mail.ru и не имеет большого разрыва между собой (5,%).
35% выборки чаще всего посещают развлекательные сайты.58% потребителей посещают Интернет ежедневно, но как показал анализ, посещение ежедневно увеличивается. И делая прогноз на будущее роста предвидеться. Поэтому разработчикам поисковых систем нужно:
- совершенствование алгоритмов поиска (или разработку новых стратегий поиска), и на сопутствующие «навороты» типа дизайна и дополнительных сервисов;
- обеспечить разбор запросов (вопросов), заданных естественным языком;
Подобные документы
Классификация систем поиска информации в интернете, их разновидности и характеристика, преимущества и недостатки. Сущность языка поисковых запросов, особенности и правила. Порядок регистрации сайта в каталогах. Правила пользования интернет-магазинами.
реферат [2,2 M], добавлен 01.04.2009Рассмотрение исторического происхождения феномена реклама. Изучение маркетинговых концепций рекламной деятельности. Выявление особенностей работы с сетью Интернет в рамках средства передачи рекламной информации. Анализ эффективности сети Интернет.
дипломная работа [1,0 M], добавлен 18.06.2017Виды рекламы в Интернет. Размещение информации в каталогах интернет-ресурсов. Регистрация в поисковых системах, организация рейтинга. Доски объявлений и форумы, e-mail – маркетинг, обмен ссылками, партнерские программы, спонсорство и баннерная реклама.
реферат [19,7 K], добавлен 13.12.2009Общая характеристика сети Интернет. Маркетинговые принципы построения виртуальных страниц Internet. Преимущества использования интернет-технологий, его недостатки и моральные аспекты. Маркетинг в социальных сетях и блогах. Корпоративный Twitter.
дипломная работа [315,8 K], добавлен 31.05.2013Анализ эффективности функционирования представительства (веб-сайта) предприятия "Эльдорадо" в сети. Ёмкость интернет-рынка, аудитория пользователей. Оценка наличия доставки товара до потребителя. Анализ уровня покупательной способности у аудитории.
контрольная работа [1,9 M], добавлен 19.05.2015Характеристика маркетинговых исследований. Роль этапов исследований: формулирования целей, сбора информации, планирования и анализа результатов. Характеристика источников данных и методов сбора информации. Особенности проведения интернет-опросов.
курсовая работа [285,3 K], добавлен 18.01.2014Средства получения информации, среда ее распространения и влияния на потребителя. Сеть Интернет как возможность создания благоприятного имиджа современной фирмы или продукции, повышение доступности информации о предприятии, сокращение издержек на рекламу.
курсовая работа [29,8 K], добавлен 23.02.2015Рассмотрение Интернет как рекламной площадки для оптимального выбора средств рекламирования, а также их эффективного использования. Особенности продвижения в социальных сетях; поисковая оптимизация. Рассмотрение перспектив развития Интернет-рекламы.
курсовая работа [60,0 K], добавлен 24.05.2015Рассмотрение способов и особенностей продвижения творческих коллективов через сеть интернет, как в российском, так и в мировом шоу-бизнесе. Создание запоминающегося имиджа исполнителя через сеть интернет. Положение дел на настоящем музыкальном рынке.
курсовая работа [38,1 K], добавлен 15.12.2013Характеристика бизнес-процессов и необходимость их автоматизации. Комплекс задач автоматизации и стратегия разработки интернет-магазина, этапы его жизненного цикла. Организация технологии сбора, передачи, обработки и выдачи информации, ожидаемые риски.
дипломная работа [342,3 K], добавлен 22.01.2010