Анализ методов продвижения и мониторинга посещаемости и улучшение защищенности Интернет-сайта

Особенности структуры сайта, система управления контентом. Создание и размещение в Интернете web-сайта. Сущность возможных методов продвижения сайтов. Основы Web-аналитики, характеристика мониторинга посещаемости, улучшения защищенности Интернет-сайта.

Рубрика Программирование, компьютеры и кибернетика
Вид дипломная работа
Язык русский
Дата добавления 15.06.2012
Размер файла 4,1 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Введение

интернет сайт посещаемость продвижение

Актуальность исследования обусловлена тем, что в настоящее время Интернет - один из самых быстроразвивающихся видов СМИ и рекламных площадок. Эффективное использование возможностей сети Интернет представляется невозможным без наличия у компании собственного представительства в сети. Интенсивное развитие возможностей глобальной сети и использование ее в качестве инструмента ведения бизнеса предъявило новые требования к созданию web-сайтов.

Использование Интернет, как сети передачи данных при реализации проектов, позволяет достигать снижения финансовых затрат компаний. После публикации, web-сайт становится доступен пользователям Интернет всего мира. За последние годы посещаемость сайтов Интернет начала превышать тиражи традиционных изданий.

После того как Интернет привнес недостающие ранее технологические инновации, с появлением социальных сетей и сервисов, таких как Facebook, Twitter, YouTube, Вконтакте работа по продвижению всевозможных товаров и услуг перешла на новый уровень.

Важнейшей проблемой, определяющей темпы и будущее развитие Интернета, является информационная, безопасность. Архитектурные недостатки сетевых: протоколов и многочисленные уязвимости в программном обеспечении сетевых платформ обуславливают невысокую в целом защищенность сети Интернет. Особенно остро проблемы информационной безопасности проявились в последние годы. Участившиеся эпидемии сетевых червей охватывают с каждым годом все большее количество компьютеров во всем, мире и наносят значительный урон. А сетевые атаки хакеров на корневые DNS-сервера сети Интернет продемонстрировали реальную возможность внесения сбоев в инфраструктуру Интернета.

Учитывая необходимость создания Инетрнет-сайта для фирмы «Ремонт компьютеров» было проведено создание web-сайта. До сих пор, в связи с актуальностью расширения аудитории пользователей и клиентов продолжается работа по продвижению данного сайта в Интернет. Поэтому целью данной выпускной квалификационной работы является анализ возможных методов продвижения и мониторинга посещаемости, а также улучшение защищенности данного Интернет-сайта.

Для достижения поставленной цели предполагается решить следующие задачи:

сравнительный анализ эффективности различных методов продвижения Интернет-сайтов;

сравнительный анализ методов привлечения посетителей;

анализ методов мониторинга посещаемости;

анализ методов улучшения защиты сайта и способы противодействия различным атакам.

Практическая значимость данной дипломной работы состоит в том, что ее выводы и рекомендации могут быть использованы при продвижении web-сайта, так как в ней содержатся необходимые методы и алгоритмы для достижения поставленной цели.

1. Теоретические аспекты предметной области

1.1 Виды сайтов, разработка структуры сайта

Сайт - это не просто полная информация о компании, ее сфере деятельности и контактах - это возможность решения различных маркетинговых и коммерческих задач бизнеса. Самые лучшие главные страницы сайтов не только информативны, просты и понятны. Они еще адресованы лично посетителю. В зависимости от целей, сайты условно можно разделить на несколько категорий:

Персональные странички или сайты обычных пользователей, которые создают одну, две или несколько страничек в сети интернет на одном сайте. На этих сайтах пользователи обычно выкладывают любую информацию, например: о себе, о друзьях и т.д. Данные сайты не относятся к коммерческой деятельности. Подобные виды сайтов в большинстве случаев создаются любителями и в основном для своих нужд.

Сайты визитки обычно выбирают организации, которым в большинстве случаев не нужен сайт в сети интернет, поэтому подобные сайты создаются для престижа. То есть показать, что у компании тоже есть сайт. Сайты визитки в основном несут небольшую информацию, в качестве поверхностного ознакомления. В основном они содержат от 5 до 10 страниц на сайте. Такие виды сайтов распространены среди среднего бизнеса.

Информационные сайты в интернете очень распространены. Ими пользуются организации, предприятия, индивидуальные предприниматели или обычные пользователи интернет для выкладывания информации, для большой аудитории. На данном виде сайта может быть создано большое количество страниц, посвященных одной тематике или широкого круга информационной направленности, все зависит от назначения информационно сайта.

Промо-сайты - посвящены разовым событиям и акциям используются чаще всего крупными брендами. Выставка или конференция, праздник или концерт. Освещение таких мероприятий через специальные web-ресурсы, называемые «промо-сайтами», является хорошим тоном и показателем высокого уровня их организации и проведения. Эксклюзивный дизайн таких сайтов, создается с учетом всех особенностей акции. Единственным отличием данного вида сайтов является то, что время жизни его ограниченно, конкретным мероприятием или акцией. Чаще всего на промо-сайтах отсутствует текст, но на некоторых он все же есть.

Сайт фотогалереи - предназначен для организации на сайте в основном не для информации, а для размещения на нем картинок, изображений и других иллюстраций. Например, подобный вид сайтов применим для организации выставки картин, любительских фото или еще что-нибудь, все зависит от специфики самой фотогалереи. Подобные виды сайтов не предназначены для размещения какой-бы то ни было информации, они выступают в роли выставок.

Информационные интернет-издания СМИ - это особые виды сайтов. Относятся они к категории крупных новостных порталов, которые публикуют мегабайты информации на своих сайтах. Основная тематика данных сайтов - это новости различного рода. Это могут быть как новости региональные, города, так и глобальные новости всего интернета. Такие сайты имеют сложную структуру категорий.

Корпоративные сайты - это полнофункциональный ресурс, обладающий большим объемом и разветвленной структурой представления данных, позволяющей разместить всю интересующую потенциального клиента информацию. Весь ассортимент продукции фирмы обычно представлен в электронном каталоге с яркими красочными фотографиями.

Корпоративные представительства - это облегченная версия корпоративного сайта. В распоряжении корпоративного представительства входят все инструменты для создания многоуровневой структуры сайта, создания оригинального дизайна, не имеет ограничений по функциональности. Но в свою очередь корпоративное представительство не имеет интерактивных модулей взаимодействия с посетителями, такие например, как форум, регистрация на сайте и т.д.

Крупный информационный портал - это сайт, который не только содержит большой объем информации, но имеет всю предоставленную информацию в текстовом или графическом варианте, предоставляя ее для скачивания посетителю. Примерами, таких крупных информационных порталов могут являться портал, посвященный большой коллекции рефератов, курсовых или дипломных работ, либо сайт, посвященный юридической тематике, на котором посетитель может не только почитать законы, постановления, но и скачать все эти доху ленты для просмотра на своем компьютере.

Интернет-магазин - может включать в себя различные интерактивные формы (гостевая книга, форум, задай вопрос), но обязательно каталог товаров и корзину заказов. Часто на главную страницу выносятся новинки товаров, «хиты продаж», специальные предложения.

Еще один вид сайтов - новостные сервисы, которые имеются практически во всех поисковых системах. Яндекс. Новости - первая в России служба автоматической обработки и систематизации новостей. Поступающие в Яндекс данные анализируются компьютерной программой, которая объединяет близкие по содержанию новости в сюжеты и выделяет главные темы дня. Информация на сайте предоставлена ведущими мировыми и российскими СМИ. Формируется она автоматически, что гарантирует беспристрастное отражение текущей картины дня.

На рекламу в Интернете все большее внимание обращают традиционные рекламодатели. Любая коммерческая реклама подразумевает возврат вложений, поэтому оценка эффективности рекламы является одной из важнейших задач, стоящих перед рекламодателем и рекламным агентством. Именно оценка эффективности позволяет определить, насколько результативно было рекламное воздействие, окупились ли затраты, какие рекламные носители оказали решающее влияние, правильно ли был распределен рекламный бюджет, как повысить эффективность рекламных мероприятий.

Чтобы сайт стал эффективным PR-инструментом, т.е. приносил пользу компании, надо, чтобы он точно соответствовал идее бизнеса. Т.к. часто бывает, что на многих Интернет-магазинах главная страница пестрит скидками на популярные товары, а вот отыскать контактную информацию крайне сложно. В Интернет-рекламе фундаментальных исследований, затрагивающих тему разработки методов оценки эффективности, также крайне мало; отсутствуют общепризнанные методы по оценке эффективности, мало литературы, научных публикаций. Такая ситуация, как правило, объясняется тем, что эффективность рекламной деятельности зависит не только от самой рекламы, но и целого ряда как контролируемых, так и неконтролируемых факторов, таких как: экономическая ситуация в стране, время года, цены на товар, квалификация персонала и т.п. Следует также учитывать, что эффект от рекламы может наступать не сразу и быть растянут во времени. Что создает значительные трудности в разработке объективных методов оценки эффективности рекламных кампаний.

Прежде чем переходить непосредственно к созданию сайта, разрабатывают структуру основных входящих в него страниц, чтобы пользователю легко было перемещаться между страницами различных уровней, а также, чтобы он в любой момент мог вернуться на домашнюю страницу. Первая страница, на которой оказывается посетитель, это домашняя страница. Она, несомненно, должна содержать запоминающийся заголовок, краткое описание разделов web-сайта, ссылки на разделы второго уровня иерархии в структуре, а также информацию об авторских правах информацию для контактов, которую можно разместить в колонтитуле.

Количество страниц второго уровня определятся количеством основных разделов сайта. На этих страницах размещается наиболее важная информация, относящаяся к разделам, а также, если в них есть необходимость, ссылки на страницы третьего уровня иерархии. На страницах третьего уровня размещается уточняющая информация к основным разделам сайта.

Важным понятием в разработке web-сайта является схема навигации, определяющая, как пользователь будет перемещаться между страницами. С помощью схемы, навигации пользователь получает представление о структуре сайта, а также представление о том, в каком месте узла он находится в данный момент. Правильно разработанная схема позволит пользователю легко перемещаться между страницами сайта в поисках нужной ему информации. Существует много вариантов организации навигационной схемы. Один вариантов может дать возможность пользователю перемещаться по иерархии страниц только вверх или вниз без возможности перехода между страницами одного иерархического уровня.

При такой схеме навигации для перехода к странице, расположенной на другой ветви иерархии, необходимо вернуться назад, и лишь затем, перейдя на нужную ветвь, перемещаться по дереву вниз. Заблудиться на сайте с такой структурой тяжело, но и для перехода к нужной информации требуется больше времени. Другой подход, это когда пользователь получает возможность с любого уровня иерархии переходить на любую страницу сайта. В этом случае достигается максимум возможностей по перемещению, но с другой стороны пользователю тяжело определить, в каком месте сайта он находится в данный момент.

После разработки схемы навигации, продумывают названия навигационных ссылок, а также заголовков: страниц, на которые с их помощью осуществляется переход. Названия ссылок должны соответствовать названиям представляемых ими материалов. В этом случае посетитель сайта имеет возможность определить, какую ссылку надо выбрать для просмотра той пли иной информации. При этом название ссылки не должно быть длинным, например если, заголовок раздела «Контактная информация и схема проезда в наши офисы», то ссылка может иметь название «Контактная информация».

Навигационные ссылки объединяют в панели ссылок, называемые также панелями навигации - это несколько расположенных рядом ссылок, предназначенных для перемещения между страницами сайта. Размещаются панели ссылок, как правило, на страницах в специально отведенных для них местах, называемых общими областями, в верхней части или с левой стороны страницы. Панели ссылок могут быть отображены на web-странице в виде кнопок или текста.

Под юзабилити чаще всего подразумевается удобство пользовательских интерфейсов, навигации, дизайна и прочих визуальных объектов на сайте. Но львиная доля контента, который нужен пользователю - это текст: описание товаров, способа заказа услуги, сравнение марок и так далее. Многие пользователи не просто ищут в интернете, а сравнивают, читают аналитические материалы и статьи на сайтах, поэтому важно правильно разместить текст.

1.2 CMS. Определение, виды

Система управления содержимым (контентом) (англ. Content management system, CMS) - информационная система или компьютерная программа, используемая для обеспечения и организации совместного процесса создания, редактирования и управления контентом (содержимым). Главной целью такой системы является возможность собирать в единое целое и объединять на основе ролей и задач все разнотипные источники знаний и информации, доступные как внутри организации, так и за ее пределами, а также возможность обеспечения взаимодействия сотрудников, рабочих групп и проектов с созданными ими базами знаний, информацией и данными так, чтобы их легко можно было найти, извлечь и повторно использовать привычным для пользователя образом.

В системе управления содержимым могут быть определены самые различные данные: документы, фильмы, фотографии, номера телефонов, научные данные и так далее. Такая система часто используется для хранения, управления, пересмотра и публикации документации. Контроль версий является одним из основных её преимуществ, когда содержимое изменяется группой лиц.

Разновидность систем управления контентом:

система управления содержания масштаба предприятия (англ. Enterprise Content Management System системы управления содержанием предприятий);

система управления веб-содержимым (англ. Web Content Management System).

В силу того, что ECMS имеют глубокую внутреннюю классификацию по предметным областям (HRM, DMS, CRM, ERP и т. д.), термин CMS заместил собой WCMS, превратившись в синоним системы управления сайтами. Подобные CMS позволяют управлять текстовым и графическим наполнением web-сайта, предоставляя пользователю интерфейс для работы с содержимым сайта, удобные инструменты хранения и публикации информации, автоматизируя процессы размещения информации в базах данных и её выдачи в HTML.

Существует множество готовых систем управления содержимым сайта, в том числе и бесплатных. Их можно разделить на три типа по способу работы:

генерация страниц по запросу. Системы такого типа работают на основе связки (Рисунок. 1.2.1). Модуль представления генерирует страницу с содержанием при запросе на него, на основе информации из базы данных. Информация в базе данных изменяется с помощью модуля редактирования. Страницы заново создаются сервером при каждом запросе, что в свою очередь создаёт дополнительную нагрузку на системные ресурсы. Нагрузка может быть многократно снижена при использовании средств кэширования, которые имеются в современных web-серверах;

Рис.

Генерация страниц при редактировании. Системы этого типа суть программы для редактирования страниц, которые при внесении изменений в содержание сайта создают набор статических страниц. При таком способе в жертву приносится интерактивность между посетителем и содержимым сайта.

Смешанный тип. Как понятно из названия, сочетает в себе преимущества первых двух. Может быть реализован путём кэширования - модуль представления генерирует страницу один раз, в дальнейшем она в несколько раз быстрее подгружается из кэша. Кэш может обновляться как автоматически, по истечении некоторого срока времени или при внесении изменений в определённые разделы сайта, так и вручную по команде администратора. Другой подход - сохранение определённых информационных блоков на этапе редактирования сайта и сборка страницы из этих блоков при запросе соответствующей страницы пользователем.

Система управления - программа, предоставляющая инструменты для добавления, редактирования, удаления информации на сайте. Существуют разнообразные системы управления сайтом, среди которых встречаются платные и бесплатные, построенные по разным технологиям. Каждый сайт имеет панель управления, которая является только частью всей программы, но достаточна для управления им (Рисунок 1.2.2). Термин контент-менеджер обозначает род профессиональной деятельности - редактор сайта.

Рис.

Большая часть современных систем управления содержимым реализуется в виде визуального (WYSIWYG) редактора -- программы, которая создаёт HTML-код из специальной упрощённой разметки, позволяющей пользователю проще форматировать текст.

1.3 Сравнительный анализ популярных CMS: Joomla!, Drupal, WordPress. Выбор CMS

В конце 2011 года компания iTrack провела анализ популярности различных систем управления содержимым и получила следующие результаты (Рисунок 1.3.1):

Рис.

Как видно, первое место с большим отрывом занимает система управления содержимым с открытым исходным кодом под названием Joomla!. Рассмотрим преимущества и недостатки этой системы.

Преимущества CMS Joomla!:

бесплатность и открытый исходный код. Для многих пользователей именно цена системы играет решающую роль при выборе того или иного продукта. Конечно, как и в случае с другими системами, у вас может возникнуть необходимость потратить некоторую сумму на дополнительные компоненты, а также услуги программиста и дизайнера при персонализации сайта, но изначально система распространяется свободно, и каждый может вносить в её код изменения по собственному желанию;

ориентированность на дизайнеров и разработчиков. Благодаря чрезвычайно простой модификации внешнего вида сайта вы можете всего в несколько кликов изменить внешний вид сайта до неузнаваемости. Это ещё одна отличная возможность максимально персонализировать свой сайт, подстроить его внешний вид под ваши нужды;

наличие множества дополнительных компонентов, расширений, плагинов, инструментов. Такая ситуация стала почти стандартной для любого популярного продукта с открытым исходным кодом. Благодаря тысячам дополнительных компонентов вы сможете встроить в свой сайт практически что угодно. Важный отличием Joomla! от WordPress в данном случае является то, что вам как правило необходимо меньше дополнительных компонентов, к тому же эти компоненты практически не повлияют на производительность системы в целом, чего нельзя сказать о WordPress;

привлекательность готового продукта. Даже если у вас небольшой опыт работы с сайтами, на выходе вы получите очень профессионально выглядящий сайт. Это большой плюс для тех, кто решил создать коммерческий продукт, который должен выглядеть солидно для пользователя.

постоянные обновления и повышение качества и безопасности системы. Сообщество Joomla! является одним из крупнейших. Среди поклонников этой CMS огромное количество разработчиков, которые постоянно создают новые расширения, а также находят недоработки и способы улучшения работы системы. В итоге конечный пользователь получает всё более и более качественную систему;

универсальность. Как и в случае с Drupal, возможности Joomla! позволяют создать сайт любой сложности и содержания с минимальным использованием дополнительных инструментов и расширений. Это очень большой плюс в случае, если вам нужен продукт, реализация которого не слишком соответствует возможностям той же популярной и простой WordPress.

Недостатки CMS Joomla!:

одним из недостатков Joomla! можно назвать трудности при переходе на более новую версию, когда возможно нарушение некоторых установленных компонентов, причём возможно лишь последовательное обновление через промежуточные версии;

для ранних версий Joomla! актуальна и сложность самих обновлений. Однако, в последней версии реализован автоматический поиск и установка обновлений;

Joomla! лидирует и в числе систем подвергающихся взломам. Сайты на этой системе довольно часто подвергаются атакам. Не последней причиной здесь является и недостаточно высокая защищённость системы, но ситуация постоянно улучшается благодаря оперативной работе сообществ Joomla!;

сложность освоения. Приходится признать, что функциональность и универсальность всегда требуют некоторых усилий от пользователя для их освоения. Если до этого вы работали лишь на WordPress, то сразу вникнуть в процесс работы с CMS не получится так легко;

другим общим недостатком, свойственным для всех бесплатных систем, является отсутствие службы поддержки, но взамен пользователь получает сотни обучающих материалов и руководств, а также десятки площадок (форумы и т.д.) для обмена опытом и решения возникающих проблем.

Преимущества CMS Drupal:

открытый код. Drupal распространяется с открытым исходным кодом, что означает доступность всех плюсов программного обеспечения с открытым исходным кодом;

гибкость конфигурирования. Главное достоинство Drupal кроется в его гибкой архитектуре. Вы можете применять его для построения сайтов любых типов: от социальных медиа-сайтов, позволяющих пользователям размещать собственное содержимое и голосовать за него, форумов и сайтов с вакансиями до галерей или публикаций портфолио дизайнеров. Drupal отлично справится с поставленной задачей при определённых затраченных усилиях со стороны разработчика;

многочисленное и грамотное сообщество разработчиков. Вокруг Drupal сложилось многочисленное, яркое и открытое сообщество пользователей и разработчиков. Это значит, вам доступны отличные модули, своевременное исправление ошибок и обновление ядра, а также неиссякаемый поток документации и руководств в сети;

модули. Для Drupal разработано огромное число модулей, расширяющих его исходный функционал. Легкость для разработчиков. Веб-разработчик не ощущают ограничений при работе с Drupal. Drupal разрабатывался с учетом потребностей именно разработчиков. Ошибкой некоторых основных CMS является чрезмерное акцентирование на пользовательском интерфейсе, что часто влечет недостаток внимания к нуждам тех, кто будет разрабатывать и продвигать систему в дальнейшем;

встроенная система кеширования. Drupal располагает встроенной системой кеширования, способной снизить нагрузку на сервер и сократить время генерации страницы. Кеширование позволяет избежать сложных запросов к базе данных, что повышает производительность сервера;

достойная встроенная поисковая система. В отличие от других CMS, в Drupal есть очень неплохая система поиска, реализованная на уровне ядра. Конечно, она не может конкурировать с такими поисковыми сервисами как Google, или Yahoo, но тем не менее вполне пригодна для работы.

Недостатки CMS Drupal:

длительный процесс обучения. Изучение Drupal даётся несколько труднее, чем изучение других CMS. Сложно рекомендовать Drupal, если вы хотите сделать первый сайт уже через неделю. На освоение Drupal, для создания полноценного Интернет-сайта уйдет не один месяц. Однако следует заметить, что небольшой сайт можно создать меньше, чем за день;

сложность для не-разработчиков. Поскольку потребности разработчиков здесь стоят во главе угла, тем, кто не очень знаком с информационными технологиями, потребуется некоторое время, чтобы привыкнуть к Drupal. Это значит, что специалистам, разбирающимся в web-разработке лишь поверхностно, будет сложно создавать и администрировать сайты на Drupal;

сложный интерфейс. Интерфейс администрирования сайта в Drupal несколько сложен для понимания. В целом он не такой дружелюбный к пользователю, каким мог бы быть.

Преимущества CMS WordPress:

WordPress получила репутацию чрезвычайно простой в использовании системы. Благодаря предустановленным шаблонам пользователь может всего в несколько кликов развернуть работоспособный блог, а подключив несколько необходимых плагинов, получим уже полноценную CMS. Кроме того, пользователю совершенно не потребуется знание HTML для работы с сайтом. Это идеальная платформа для неопытных пользователей;

начиная с версии 3.0 WordPress предоставляет очень удобные навигационные меню, значительно повышающие юзабилити сайта. При этом меню и страницы легко настраиваются, позволяя лучше адаптировать сайт под конкретные нужды;

существуют сотни бесплатных тем, которые можно использовать на своём сайте. При желании всегда можно приобрести эксклюзивные темы за дополнительную плату;

WordPress в сочетании со специальными плагинами очень хорошо адаптируется с SEO. В результате ваш сайт имеет гораздо больше шансов получить новых посетителей через поисковые системы;

на данный момент существует около 13000 бесплатных плагинов, доступных для загрузки. Вопрос с возможностью расширения функционала неуместен.

Недостатки CMS WordPress:

К сожалению, не все изменения внутри сайта выполняются в WordPress так просто. К примеру, если требуется изменить или удалить даты постов, то без некоторых дополнительных знаний здесь уже не обойтись;

Несмотря на то, что существует множество готовых шаблонов для WordPress, некоторые пользователи захотят создать собственные уникальные шаблоны, и здесь не обойтись без знаний в CSS. В то же время те, кто обладает подобными навыками, могут предпочесть более универсальную CMS;

универсальность WordPress скрыта в сотнях доступных плагинов. Благодаря им функционал этой CMS приблизился к таким системам как Drupal и Joomla. Однако, установка слишком большого количества плагинов может негативно сказаться на скорости загрузки страниц. Зачастую возникают ситуации, когда для достижения необходимого функционала потребуется такое количество плагинов, что рациональнее будет выбрать другую платформу;

частые обновления, которые можно отнести как недостаткам, так и к достоинствам системы. В любом случае, все обновления преследуют цель повысить надёжность, безопасность и юзабилити системы, хоть и доставляют при этом некоторое неудобство администратору сайта.

Несмотря на наличие других CMS, Joomla! используется не только частными лицами, но и общественными организациями, корпорациями, некорммерческими и другими организациями.

Одна из причин популярности Joomla! - легкость использования. Это обусловлено ее внутренним устройством. В дополнение к стандартным встроенным функциям Joomla! доступно огромное количество бесплатных и коммерческих расширений, позволяющих построить на базе Joomla! сайт практически любой сложности. Расширения Joomla! позволяют за несколько минут создать форум, чат, интернет-магазин, аукцион и т.д.

Однако главное - простой, интуитивно понятный интерфейс. Шаблоны оформления, разработанные профессиональными дизайнерами, позволяют в одно мгновение преобразить любой сайт. Если раньше для того, чтобы сайт имел привлекательный вид, нужно было привлекать профессионального дизайнера. Некоторые шаблоны Joomla! выглядят лучше, чем дизайны некоторых сайтов, за разработку которых были выложены миллионы долларов. А все это благодаря присутствию профессиональных дизайнеров, тщательно продумавших каждую деталь того или иного шаблона.

К тому же многие CMS требуют от пользователя некоторой квалификации для настройки и обслуживания сайта. Joomla!, напротив, позволяет производить все операции по обслуживанию сайта через простую панель управления (Рисунок. 1.3.2). А поскольку у панели управления Web-интерфейс, то управлять своим сайтом можно с любой точки Земного шара - на работе, дома - при наличии доступа к Интернету.

Рис.

Функции Joomla!:

полноценное управление сайтом через Web-интерфейс;

Web-интерфейс позволяет управлять основными элементами сайта - страницами, графикой, файлами и другими данными;

функции одобрения контента, позволяющие модерировать материал, публикуемый удаленными авторами;

иерархическое управление группами пользователей;

автоматизированное управление меню сайта;

возможность автоматической публикации и удаления материала по расписанию;

защита пользовательских учетных записей;

встроенные WYSIWYG-редакторы (What You See Is What You Get), позволяющие создавать страницы сайта без знания HTML;

автоматический поиск по сайту;

полная поддержка новостных лент форматов RSS и Atom;

встроенная возможность создания опроса (голосования);

управление рекламными баннерами;

плагины для организации интернет-магазинов, например, корзина, галерея изображений и др.;

многоязычность (полная поддержка русского языка и русских кодировок символов);

поддержка операционных систем Linux и Windows;

поддержка кэширования страниц для повышения производительности сайта.

1.4 Поисковые машины. Принцип работы. Обзор поисковых машин

Поисковые системы уже давно стали неотъемлемой частью российского Интернета. В силу того, что они, хотя и различными средствами, самостоятельно обеспечивают все этапы обработки информации от ее получения с узлов-первоисточников до предоставления пользователю возможности поиска, их часто называют автономными поисковыми системами.

Поисковые системы сейчас - это огромные и сложные механизмы, представляющие собой не только инструмент поиска информации, но и заманчивые сферы для бизнеса. Эти системы могут различаться по принципу отбора информации, который в той или иной степени присутствует и в алгоритме сканирующей программы автоматического индекса, и в регламенте поведения сотрудников каталога, отвечающих за регистрацию. Как правило, сравниваются два основных показателя:

пространственный масштаб, в котором работает ИПС;

ее специализация.

Большинство пользователей поисковых систем никогда не задумывались о принципе работы поисковых систем, о схеме обработки запросов пользователей, о том, из чего эти системы состоят и как функционируют… Поисковые системы можно сравнить со справочной службой, агенты которой обходят предприятия, собирая информацию в базу данных. При обращении в службу информация выдается из этой базы. Данные в базе устаревают, поэтому требуется периодическое обновление. Иными словами, справочная служба имеет две функции: создание и постоянное обновление данных в базе и поиск информации в базе по запросу клиента.

Поисковая система - это программно-аппаратный комплекс, предназначенный для осуществления поиска в сети Интернет и реагирующий на запрос пользователя, задаваемый в виде текстовой фразы (поискового запроса), выдачей списка ссылок на источники информации, в порядке релевантности (в соответствии запросу). Наиболее крупные международные поисковые системы: «Google», «Yahoo», «MSN». В русском Интернете это - «Яндекс», «Рамблер», «Апорт».

Аналогично, поисковая машина состоит из двух частей: так называемого робота (или паука), который обходит серверы Сети и формирует базу данных поискового механизма. База робота в основном формируется им самим (робот сам находит ссылки на новые ресурсы) и в гораздо меньшей степени - владельцами ресурсов, которые регистрируют свои сайты в поисковой машине. Помимо робота (сетевого агента, паука, червяка), формирующего базу данных, существует программа, определяющая рейтинг найденных ссылок.

Принцип работы поисковой машины сводится к тому, что она опрашивает свой внутренний каталог (базу данных) по ключевым словам, которые пользователь указывает в поле запроса, и выдает список ссылок, ранжированный по релевантности. Следует отметить, что, отрабатывая конкретный запрос пользователя, поисковая система оперирует именно внутренними ресурсами (а не пускается в путешествие по Сети, как часто полагают неискушенные пользователи), а внутренние ресурсы, естественно, ограниченны. Несмотря на то, что база данных поисковой машины постоянно обновляется, поисковая машина не может проиндексировать все web-документы: их число слишком велико. Поэтому всегда существует вероятность, что искомый ресурс просто неизвестен конкретной поисковой системе.

В работе поисковый процесс представлен четырьмя стадиями: формулировка (происходит до начала поиска); действие (начинающийся поиск); обзор результатов (результат, который пользователь видит после поиска); и усовершенствование (после обзора результатов и перед возвращением к поиску с иной формулировкой той же потребности). Более удобная нелинейная схема поиска информации состоит из следующих этапов:

фиксация информационной потребности на естественном языке;

выбор нужных поисковых сервисов сети и точная формализация записи информационной потребности на конкретных информационно-поисковых языках (ИПЯ);

выполнение созданных запросов;

предварительная обработка и выборка полученных списков ссылок на документы;

обращение по выбранным адресам за искомыми документами;

предварительный просмотр содержимого найденных документов;

сохранение релевантных документов для последующего изучения;

извлечение из релевантных документов ссылок для расширения запроса;

изучение всего массива сохраненных документов;

если информационная потребность не полностью удовлетворена, то возврат к первому этапу.

Задача любой поисковой системы - доставлять людям ту информацию, которую они ищут. Научить людей делать «правильные» запросы, т.е. запросы, соответствующие принципам работы поисковых систем невозможно. Поэтому разработчики создают такие алгоритмы и принципы работы поисковых систем, которые бы позволяли находить пользователям именно ту информацию, которую они ищут. Это означает, поисковая система должна «думать» также как думает пользователь при поиске информации. Поисковые системы в большинстве своем работает по принципу предварительного индексирования. По такому же принципу работают база данных большинства поисковых систем.

Есть и другой принцип построения. Прямой поиск. Он заключается в том, что вы в поиске ключевого слова перелистываете книгу страницу за страницей. Конечно, этот способ гораздо мене эффективен.

В варианте с инвертированным индексом поисковые системы сталкиваются с проблемой величины файлов. Как правило, они значительно велики. Эту проблему обычно решают двумя методами. Первый заключается в том, что из файлов удаляется все лишнее, а остается лишь то, что действительно нужно для поиска. Второй метод заключается в том, что для каждой позиции запоминается не абсолютный адрес, а относительный т.е. разница адресов между текущей и предыдущей позициями.

Таким образом, два главных процесса, выполняемых поисковой системой - это индексирование сайтов, страниц и поиск. В общем, процесс индексирования для поисковиков проблем не вызывает. Проблемой является обработка миллиона запросов в сутки. Это связано с большими объемами информации, которая подвергается обработке больших компьютерных комплексов. Главный фактор, определяющий количество участвующих в поиске серверов, - поисковая нагрузка. Это объясняет некоторые «странности» возникающие при поиске информации.

Поисковые системы состоят из пяти отдельных программных компонент:

spider (паук): браузероподобная программа, которая скачивает web-страницы;

crawler: «путешествующий» паук, который автоматически идет по всем ссылкам, найденным на странице;

indexer (индексатор): «слепая» программа, которая анализирует web-страницы, скаченные пауками;

the database (база данных): хранилище скаченных и обработанных страниц;

search engine results engine (система выдачи результатов): извлекает результаты поиска из базы данных.

Spider: Паук - это программа, которая скачивает web-страницы. Он работает точно как браузер, при соединении с web-сайтом и загрузке страницы. Паук не имеет никаких визуальных компонент.

Crawler: Как и паук скачивает страницы, он может найти все ссылки на странице, его задача - определять, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов.

Indexer: Индексатор разбирает страницу на различные ее части и анализирует их. Элементы типа заголовков страниц, заголовков, ссылок, текста, структурных элементов, элементов BOLD, ITALIC и других стилевых частей страницы вычленяются и анализируются.

Database: База данных - это хранилище всех данных, которые поисковая система скачивает и анализирует. Это часто требует огромных ресурсов.

Search Engine Results: Система выдачи результатов занимается ранжированием страниц. Она решает, какие страницы удовлетворяют запросу пользователя, и в каком порядке они должны быть отсортированы. Это происходит согласно алгоритмам ранжирования поисковой системы. Эта информация является наиболее ценной и интересной для нас - именно с этим компонентом поисковой системы взаимодействует оптимизатор, пытаясь улучшить позиции сайта в выдаче, поэтому в дальнейшем мы подробно рассмотрим все факторы, влияющие на ранжирование результатов.

Работа поискового указателя происходит в три этапа, из которых два первых являются подготовительными и незаметны для пользователя. Сначала поисковый указатель собирает информацию из World Wide Web. Для этого используют специальные программы, аналогичные браузеры. Они способны скопировать заданную web-страницу на сервер поискового указателя, просмотреть ее, найти все гиперссылки, которые на ней имеются ресурсы, которые найдены там, снова разыскать имеющиеся в них гиперссылки и т. д. Каждый поисковый указатель эксплуатирует для этой цели свою уникальную программу, которую нередко сам и разрабатывает. Многие современные поисковые системы родились из экспериментальных проектов, связанных с разработкой и внедрением автоматических программ, занимающихся мониторингом Сети. Теоретически, при удачном входе спайдер способен проанализировать все web-пространство за одно погружение, но для этого требуется очень много времени.

После копирования разысканных Web-ресурсов на сервер поисковой системы начинается второй этап работы - индексация. Индексирование страниц производится специальной программой называемой роботом. У каждой поисковой машины таких роботов очень много. Все это служит целью параллельного скачивания документов из различных мест сети. Скачивать документы по очереди не имеет смысла, так как это малоэффективно.

Технически модуль скачивания бывает либо мультимедийным (Altavista Merkator), либо используется асинхронный ввод-вывод (GoogleBot). В мультитредовой схеме скачивающие треды называются «червями» (worms), а их менеджер - «погоняльщиком червей» (wormboy).

Целью скачивания является уменьшение сетевого трафика при максимальной полноте. Абсолютно все поисковые роботы подчиняются файлу robots.txt, где web-мастер может ограничить индексацию страниц роботом.

У моделей скачивания в поддержке есть другие модули, выполняющие вспомогательные функции. Они помогают уменьшать трафик, увеличивать глубину поиска, обрабатывают часто обновляемые ресурсы, хранят URL и ссылки, чтобы повторно не скачивать ресурсы. Существуют модули отслеживания дубликатов. Они помогают отсеивать страницы с повторной информацией. Т.е. если робот находит дубликат уже существующей страницы или со слегка измененной информацией, то он не идет дальше по ссылкам страницы. Есть отдельный модуль определения кодировки и языка документа.

После того как страница было скачена, она обрабатывается html-парсером. Он оставляет лишь ту информацию от документа, которая действительно важна для поиска: текст, шрифты, ссылки и т.д. В ходе индексации создаются специальные базы данных, с помощью которых можно установить, где и когда в Интернете встречалось, то или иное слово. Индексированная база данных необходима для того, чтобы поисковая система могла быстро отвечать на запросы пользователей. Современные системы способны выдавать ответы за доли секунды, но если не подготовить индексы заранее, то обработка одного запроса будет продолжаться часами.

На третьем этапе происходит обработка запроса клиента и выдача ему результатов поиска в виде списка гиперссылок. По своим базам указателей поисковая система в доли секунды разыскивает подходящие web-ресурсы и формирует страницу результатов поиска, на которой рекомендации представлены в виде гиперссылок. Далее клиент может пользоваться этими ссылками для перехода к интересующим его ресурсам. Но основная проблема современного Интернета связана с изобилием web-страниц. Достаточно ввести в поле поиска такое простое слово, как, например, футбол, и российская поисковая система выдаст несколько тысяч ссылок, сгруппировав их по 10-20 штук на отображаемой странице. Несколько тысяч - это еще не так много, потому что зарубежная поисковая система в аналогичной ситуации выдала бы сотни тысяч ссылок. Как правило, клиенты просматривают не более 50 ссылок, стоящих первыми. Однако клиентов очень и очень беспокоит качество самых первых ссылок. Клиент вправе ожидать, что самыми первыми будут стоять наиболее полезные ссылки. Вот здесь и возникает проблема. Человек легко отличает полезный ресурс от бесполезного, но как объяснить это программе? Поэтому лучшие поисковые системы проявляют чудеса искусственного интеллекта в попытке отсортировать найденные ссылки по качественности их ресурсов. Строго говоря, все поисковые системы черпают исходную информацию из одного и того же web-пространства, поэтому исходные базы данных у них могут быть относительно похожи. И лишь на третьем этапе, при выдаче результатов поиска, каждая поисковая система начинает проявлять свои лучшие (или худшие) черты. Операция сортировки полученных результатов называется ранжированием. Каждой найденной web-странице система присваивает рейтинг, который должен отражать качество материала. Но качество -- понятие субъективное, а программе нужны объективные критерии, которые можно выразить числами, пригодными для сравнения. Высокие рейтинги получают web-страницы, у которых ключевое слово, использованное в запросе, входит в заголовок. Уровень рейтинга повышается, если это слово встречается на web-странице несколько раз, но не слишком часто. Благоприятно влияет на рейтинг вхождение нужного слова впервые 5-6 абзацев текста -- они считаются самыми важными при индексации. По этой причине опытные web-мастера избегают в начале своих страниц таблицы. Для поисковой системы каждая ячейка таблицы выглядит, как абзац, и потому содержательный основной текст отодвигается назад. Очень хорошо, если ключевые слова, использованные в запросе, входят в альтернативный текст, сопровождающий иллюстрации. Для поисковой системы это верный признак того, что данная страница точно соответствует запросу. Еще одним признаком качества web-страницы является тот факт, что на нее есть ссылки с каких-то других web-страниц. Чем их больше, тем лучше. Значит, эта Web-страница популярна и обладает высоким показателем цитирования. Самые совершенные поисковые системы следят за уровнем цитирования зарегистрированных ими web-страниц и учитывают его при ранжировании. Создатели web-страниц всегда заинтересованы в том, чтобы их просматривало больше людей, поэтому они специально готовят страницы так, чтобы поисковые системы давали им высокий рейтинг. Хорошая, грамотная работа web-мастера способна значительно поднять посещаемость web-страницы.

К числу самых признанных поисковых систем принадлежит AltaVista, мощнейший аппаратный и программный потенциал, которой позволяет проводить поиск по любому слову из текста web-страницы или статьи в телеконференции (данные 1998 г.). AltaVista содержит сведения о 30 миллионах web-страниц и статьях из 14 тысяч телеконференций.

Данная система использует довольно сложный механизм составления запроса, включающий комбинации отдельных слов, словосочетаний и знаков пунктуации: кавычек, точек с запятой, двоеточия, скобок, плюса и минуса или привычных булевых операторов AND, OR, NOT и NEAR (последние в рамках усложненного поиска - Advanced search). Их сочетание дает возможность наиболее точно составить поисковое предписание.

Так, знак плюс, стоящий перед словом означает, что этот термин обязательно должен присутствовать в документе, знак минус, наоборот, - отсевает все материалы, содержащие это понятие. Система допускает поиск по целой фразе (в этом случае все словосочетание заключается в кавычки), а также поиск с усечением окончаний, при этом в конце слова ставится "*". Пользователям также предоставлена возможность ограничивать запрос по дате создания/последнего обновления документа. Поиск по всем словам текста декларирован и в HotBot, который на сегодня является самым мощным поисковым средством именно для World Wide Web (содержит сведения о 54 миллионах документов). Углубленный поиск - Expert Search в HotBot дает поразительно широкие возможности для детализации запроса. Это достигается за счет использования многоступенчатого меню, предлагающего различные варианты составления поискового предписания. Можно осуществить поиск по сочетанию в документе нескольких различных терминов, поиск по отдельной фразе, поиск конкретного лица или электронного адреса. Для детализации запроса возможно применение условий SHOULD - "может содержать", MUST -"должен обязательно содержать", MUST NOT - "не должен содержать" по отношению к каким-либо понятиям.

Интересным поисковым средством является Excite, также обеспечивающий полнотекстовый поиск на более чем 50 миллионах web-страниц. Особенность работы с ним заключается в том, что запросы в эту систему водятся на естественном языке (конечно же на английском) так, как если бы мы спрашивали человека. Специальная система, сконструированная на основе Интеллектуального извлечения понятий (Intelligent Concept Extraction) анализирует запрос и выдает ссылки на релевантные, по ее компьютерному мнению, документы. Практика, однако, показывает, что Excite корректно обрабатывает только односложные запросы. Для получения информации по многосложной тематике лучше пользоваться другими поисковыми средствами.

Одной из современных систем, обеспечивающих поиск по всем словам текста является OpenText. Пользователь, однако, может по желанию ограничить рамки поиска только главными и наиболее значимыми фрагментами web-страницы: заглавием, первым заголовком, резюме, электронным адресом (URL). Это очень удобно, если требуется найти лишь главные работы по какой-либо широкой тематике.

Как и в предыдущих случаях наиболее трудные запросы выполняются с помощью усложненного поиска - Power Search. Его интерфейс позволяет довольно просто составить поисковое предписание, используя многоступенчатое меню. Это меню представляет собой строки для ввода терминов с указанием того в каких полях должны содержаться искомые данные в сочетании с привычными операторами AND (и), OR (или), BUT NOT (но не), NEAR (рядом с) и FOLLOWED BY (следует за).

В последние годы сложилась и практика коммерческого рейтингования. Технически они оснащены самыми современными средствами, соответствующими уровню 2000 года, а общий размер Рунета (российского сектора Интернета) сегодня примерно таков, каким был западный сектор в 1994-1995 гг. Поэтому сегодня в России особых проблем с поиском информации нет, и в ближайшее время они не предвидятся. А в западном секторе проблемы с поиском очень большие, и разные поисковые системы пытаются по-разному их преодолеть.

Из поисковых указателей в России сегодня действуют три «кита». Это «Рамблер» (www.rambler.ru), «Яндекс» (www.yandex.ru) и «Апорт» (www.aport.ru).

Исторически наиболее популярной поисковой системой является «Рамблер». Она начала работать раньше других и долгое время лидировала по размеру поискового указателя и качеству услуг поиска. Увы, сегодня эти достижения в прошлом. Несмотря на то, что размер поискового указателя «Рамблер» примерно равен 12 миллионам web-страниц, он давно толком не обновлялся и выдает устаревшие результаты. Сегодня «Рамблер» - это популярный портал, лучшая в России классификационно-рейтинговая плюс рекламная площадка. Традиционно эта система держит первое место в России по посещаемости и имеет хорошие доходы от рекламы. Но в развитие средств поиска средства не вкладываются. Самый большой указатель лежит в основе системы «Яндекс» - примерно 27 миллионов web-страниц, но дело не только в размере. Это не просто указатель на ресурсы, а указатель на самые актуальные ресурсы. По уровню актуальности «Яндекс» сегодня - безусловный лидер. Система «Апорт» выигрывает на третьем этапе: в момент представления информации клиенту. Она не стремится к созданию самого большого указателя автоматическими средствами, а вместо этого широко использует информацию из каталога @Rus, проходящую ручную обработку. Поэтому система выдает не так много результатов, как ее ближайшие конкуренты, но зато эти результаты, как правило, точны и наглядно представлены.

Однако для того, чтобы выжить в мире динамичного Интернета, при разработке необходимо закладывать большой запас устойчивости, постоянно заглядывать в завтрашний день и примерять будущую нагрузку на сегодняшний поиск. Такой подход позволяет заниматься не только постоянной борьбой и приспособлением поисковой машины к растущим объемам информации, но и реализовывать что-то новое, действительно важное и нужное для повышения эффективности поиска в сети Интернет.

1.5 Оценка посещаемости сайта

Информация, распространяемая в рамках конкретного web-проекта, доступна не только для тех, кто сам посещает сайт данного проекта. Через личные контакты и связи она доступна также и тем, кто сам не посещает web-сайт, но может входить в целевую аудиторию сайта (целевая аудитория сайта). Так возникает понятие зоны влияния web-проекта

Показатель максимальной аудитории позволяет оценить, сколько людей видело сайт. Объём максимальной аудитории, привлечённой в ходе рекламной кампании, есть полный охват рекламной кампании -- один из основных её показателей. Именно на основе этих данных вычисляются многие стоимостные показатели: CPM, ROI (показатели сферы инвестиционного проектирования, отражающие скорость возврата вложенных средств) и другие.

В зависимости от полученных данных строятся работа с аудиторией и последующие рекламные акции, так как степень знакомства потенциальной аудитории с предлагаемым продуктом, очевидно, определяет характер рекламных материалов.

Полученное разделение имеет большое значение для анализа хода рекламной компании. Например, если динамика отношения этих групп друг к другу смещается в сторону случайных посетителей, то очевидно, что рекламная кампания построена неправильно.

В большинстве исследований по интернет-маркетингу (интернет-маркетинг) используется понятие постоянной аудитории или постоянных пользователей. Выявление постоянной аудитории недоступно лог-анализаторам (лог-анализатор), в силу того, что без cookie-файлов (HTTP cookie) (которые лог-анализаторы самостоятельно устанавливать пользователям не могут) идентификация пользователей значительно затруднена. Следовательно, для проведения такого рода анализа необходимо использование специальных программ простановки и учёта cookie-файлов.


Подобные документы

  • Понятие сайта как Интернет-ресурса. Специфические особенности сайтов учебных заведений. Видимость сайта в поисковых выдачах. Анализ сайта учебного заведения на примере сайта Тираспольского межрегионального университета. Составляющие (рубрики) сайта.

    курсовая работа [403,8 K], добавлен 27.04.2013

  • Анализ структуры и технологий создания сайтов машиностроительных предприятий, автоматизирующих систему продвижения товара через интернет. Установка и конфигурация системы управления контентом Joomla. Дизайн сайта, подбор необходимых модулей и плагинов.

    дипломная работа [2,6 M], добавлен 21.06.2015

  • Особенности создания сайта интернет-магазина для частных лиц и организаций. Анализ финансовой и технико-экономической деятельности фирмы. Создание информационной модели сайта, ее базовые элементы. Выбор программного и аппаратного обеспечения сайта.

    дипломная работа [1,5 M], добавлен 08.12.2013

  • Понятие и виды хостинга. Характеристика способов раскрутки веб-сайта. Обоснование необходимости и особенности разработки сайта для гостиничного предприятия, его назначение. Анализ сайтов-конкурентов. Выбор хостинга и домена, метода продвижения сайта.

    контрольная работа [310,6 K], добавлен 25.12.2012

  • Сайтостроение. Классификация сайтов. CMS, выбор системы управления контентом для сайта. Регистрация домена, хостинг, размещение сайта в сети. VPS или виртуальный выделенный сервер. Поисковая оптимизация сайта. Файл robots.txt. Карта сайта sitemap.xml.

    курсовая работа [139,4 K], добавлен 18.02.2015

  • Формулировка требований к разработке и оформлению информационного сайта предприятия. Описание архитектуры сайта, меню навигации и алгоритма работы, листинг программного кода. Выбор серверной части и процесс отладки. Методы продвижения сайта в Интернете.

    курсовая работа [4,6 M], добавлен 18.01.2014

  • Выбор инструментальных и программных средств для создания сайта. Структура программного продукта. Создание сайта при помощи программы WordPress. Тестирование разработанной программы. Разработка структуры и дизайна сайта. Наполнение сайта контентом.

    курсовая работа [1,0 M], добавлен 09.01.2014

  • Создание основы интернет-сайта - набора таблиц, которые расположены в нужном порядке. Использованные теги и их атрибуты. Кодовое оформление сайта, наложение второго слоя. Стильный текст в HTML. Использование скриптов для большей информативности сайта.

    методичка [813,6 K], добавлен 08.11.2013

  • Инструментальные возможности для реализации программы. Позиционирование сайта в Интернете, разработка дизайна и информационное наполнение. Создание анимированного баннера и добавления в поисковые системы для продвижения данного сайта в Интернете.

    курсовая работа [1,9 M], добавлен 29.09.2012

  • Технические характеристики компьютерных систем. Анализ интернет-сайта филиала предприятия и выявление основных проблем. Обновление структуры и подгонка сайта под современные стандарты с помощью программы WebSite X5. Создание дизайна веб-страницы.

    отчет по практике [410,2 K], добавлен 14.01.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.