Информационные ресурсы сети Интернет

Понятие глобальной компьютерной сети "Интернет". Основы классификации ее информационных ресурсов. Виды информации, хранимой в Интернете и профессиональных базах. Вопросы эффективности и технологии поиска информации в Интернете и профессиональных базах.

Рубрика Программирование, компьютеры и кибернетика
Вид реферат
Язык русский
Дата добавления 22.06.2011
Размер файла 26,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

РЕФЕРАТ

по дисциплине «Информатика»

на тему «Информационные ресурсы сети Интернет»

1. Понятие глобальной компьютерной сети «Интернет»

информационный ресурс интернет сеть

Обычно под словом «Интернет» понимается глобальная компьютерная сеть, или «Сеть сетей». С точки зрения пользователя Интернет можно рассматривать как мощное глобальное средство обмена информацией. Одним из распространенных и перспективных сервисов Интернет является сервис прямого доступа Word Wide Web -- WWW, представляющий собой систему документов, включающих текстовую и графическую информацию, размещенных на узлах Интернет и связанных между собой гиперссылками.

Классификация источников информации в Интернете может проводиться по разным основаниям. По способам представления информации могут быть выделены следующие виды:

- web-страницы -- наиболее распространенный и используемый из информационных ресурсов. Этот ресурс представляет собой страницы гипертекста. Страницы наряду с текстовой могут содержать графическую, звуковую, видеоинформацию;

- файловые серверы представляют собой реализацию в Интернете традиционного способа представления информации;

- телеконференции могут являться важным источником информации. Они разбиваются на группы (рубрики) по тематике. Участвующие в телеконференциях могут написать свое сообщение или послать комментарии на чужое сообщение;

- базы данных могут быть доступны через сеть Интернет. В них часто содержатся, кроме текстовой, также и другие виды информации.

Информационные ресурсы также могут быть разделены по языковому признаку, В сети Интернет представлены практически все основные языки, однако главным языком в силу исторически сложившихся традиций является английский. Ряд сайтов представляет информацию на нескольких языках.

В сети имеет место классификация и по территориальному признаку. Ряд сайтов предоставляет свою информацию для потребителей определенного региона, хотя доступ к сайту возможен и из любой точки сети.

Наиболее важным аспектом классификации информационных ресурсов сети Интернет является содержание информации. Деловая информация, необходимая в предпринимательской деятельности, по этому критерию может быть разделена на следующие группы.

1. Сведения о фирмах, организациях. Эта группа сведений существенно различается по своему наполнению для различных организаций. Различия определяются степенью освоения организацией возможностей Интернета по продвижению продукции или услуг. Различают три типа серверов данной группы (категории):

серверы присутствия в Интернете. Эти серверы могут быть разделены на рекламные и информирующие серверы. Рекламный сервер обычно содержит одну или несколько страниц. Информирующий сервер содержит более подробную информацию о фирме и производимой ею продукции или оказываемых услугах;

информационные серверы. Целью этих серверов является предоставление различного рода информации потребителям. Серверы данной группы ведут информационно-аналитические агентства и другие структуры, в том числе государственные, чья деятельность связана с предоставлением различного рода информации потребителям;

интерактивные магазины. Серверы этой группы обеспечивают продажи товаров посредством Интернета. При этом могут быть реализованы в электронном виде следующие функции:

предоставление клиенту необходимой информации о товаре или услуге;

оформление заказа;

оплата заказа (при использовании онлайновых платежных систем);

отправка полученного товара, если товаром является информация.

Сведения о состоянии мировой экономики и экономики отдельных стран. Данная информация представлена достаточно широко в профессиональных базах крупнейших информационно-аналитических агентств мира. Серверы этих агентств входят в состав информационных ресурсов сети Интернет. Однако сама информация, как правило, платная. Информация о состоянии национальной экономики обычно размещается на серверах государственных структур, отвечающих за государственную поддержку экономики, государственных статистических органов, различных экономических институтов.

3. Сведения о состоянии отраслевых рынков. Анализ, отраслевых рынков осуществляют специализированные маркетинговые и консалтинговые агентства, а также маркетинговые службы фирм или организаций. Результаты этих исследований, используя Интернет, можно получить:

из профессиональных баз крупнейших мировых информационных агентств, найдя сведения о технологиях доступа к этим базам на сайтах Интернета;

в самих консалтинговых или маркетинговых агентствах, чьи сайты также представлены в Интернете;

в многопрофильных и отраслевых журналах, регулярно публикующих обзоры рынков. Одни издания, например многопрофильный журнал «Эксперт», представляют на сайтах оглавления номеров журналов. Другие, как, например, журнал «Профиль», размещают в открытом доступе публикуемые материалы.

4. Деловые новости. Подавляющее большинство мировых информационных агентств предоставляют потребителям доступ к профессиональным базам, содержащим деловые новости. Из зарубежных агентств крупнейшими поставщиками деловых новостей являются LEXIS-NEXIS, Dialog, Reuters. Среди отечественных агентств следует выделить:

«Интегрум-Техно», предоставляющий доступ к материалам 250 центральных и крупнейших региональных газет, а также к зарубежным новостям;

РИА «Новости» -- государственное информационно-аналитическое агентство РФ;

«ИТАР-ТАСС» -- государственное информационное телеграфное агентство РФ;

* агентство «Интерфакс», входящее в состав международной информационной группы Interfax Information Services. Интернет предоставляет бесплатный доступ к ежедневной электронной интернет-газете «Gazeta.ni». Ряд крупнейших газет имеют в Интернете электронные версии. Доступ к некоторым из них платный, например к электронным версиям печатных изданий Издательского дома «Коммерсанть». К другим, например к электронной версии газеты «Аргументы и факты», -- бесплатный.

5. Справочная информация представлена в сети Интернет весьма широко. Это и списки web-сайтов компаний, отобранных по определенному принципу, и телефонно-адресный справочник «Желтые страницы» с возможностью поиска информации по названию фирмы и виду деятельности, и телефонные справочники городов Российской Федерации, стран СНГ и Балтии. Также в Интернете имеется информация о расписании движения поездов, авиарейсов, о погоде и многое другое.

2. Виды информации, хранимой в Интернете и профессиональных базах

В соответствии с Законом от 20 февраля 1995 г. №'224-ФЗ «Об информации, информатизации и защите информации» под термином «информация» понимаются сведения о лицах, предметах, фактах, событиях, явлениях и процессах независимо от формы их представления. Специалисты в области теории познания утверждают, что человек познает реальный мир через объекты, свойства и отношения. Лица, предметы, факты, события, явления и процессы являются классами объектов. Предметная область -- это классы объектов, информация о которых необходима в данном виде деятельности человека. В каждой предметной области потребителей интересует четко определенный перечень свойств и глубина описания этих свойств. Очевидно, что перечни интересующих потребителя свойств о лице в экономике и в медицине будут различны.

Информация о предметной области, то есть об объектах и их связях, может быть представлена в двух видах: формализованном и в виде текста на естественном языке.

Формализованное описание конкретного объекта включает имя свойства (характеристики) и значение этого свойства для данного объекта. Имя свойства отражает ту грамматическую роль, которую играет значение этого свойства по отношению к данному классу объектов. Значение свойства (характеристики) может задаваться нормированным словарем или произвольно. Например, значение свойства «организационно-правовая форма фирмы, организации» должно выбираться из нормированного словаря, а значение свойства «название организации» является произвольным. Формализованное описание объекта во многом схоже с анкетной формой описания объекта. Некоторые авторы называют формализованное описание информации числовым. Это не совсем точное определение, так как фамилия лица или название организации задается не числовым значением, но может быть представлено в формализованном виде.

Названия классов объектов, свойств и областей возможных значений этих свойств (характеристик), то есть язык формализованного описания для каждой предметной области, разрабатывают квалифицированные специалисты данного вида деятельности. С помощью отдельных свойств устанавливаются связи между объектами. Так, например, если описаны два объекта: фирма и товар, -- то между ними устанавливается связь -- отношение, указывающее, что данная фирма выпускает этот товар. Описание такого формализованного языка после согласования с источниками и потребителями информации в данной предметной области издается в виде нормативного документа, и на основе его создаются базы данных формализованной информации. Описание информации в таких базах в максимальной степени приближено к представлению специалиста о предметной области, в которой он работает. Формализованный язык описания предметной области выполняет следующие основные функции:

позволяет источнику отбирать лишь ту информацию и описывать ее так, как это необходимо потребителю;

позволяет в базах данных отражать информацию в том же виде, в каком она отражена в сознании специалиста в данной предметной области;

позволяет в информационных системах по указанию потребителя производить автоматическую обработку формализованной информации;

существенно облегчает поиск необходимой информации в базах данных.

Другим видом информации о предметной области является информация, представленная в виде текста на естественном языке.

Для того чтобы понять, в какой степени информация на естественном языке, накапливаемая в информационных системах, подходит для удовлетворения информационных потребностей пользователя, рассмотрим в самых общих чертах природу восприятия человеком реальной действительности и отображение этой действительности на естественном языке. Индивидуальное знание предметной области источником и потребителем информации складывается из совокупности представлений и понятий. Представления -- это чувственно наглядные образы объектов реального мира. Источником формирования представлений являются психологические процессы ощущения и восприятия, а также информация, получаемая от других членов общества в процессе общения. В результате создаются представления об объектах реального мира. Представления носят субъективный характер, который определяется внутренним психологическим миром данного человека. Хотя у разных людей создаются разные представления о реальном мире, в них присутствует элемент общности, которой позволяет использовать представления в процессе общения.

Понятия образуются в результате логического осмысления представлений об объектах реального мира и являются формой абстрактного мышления, отражающей и фиксирующей существенные признаки данных объектов. Понятия более объективны и в большей степени отражают коллективный опыт. Понятия и представления тесно связаны друг с другом и являются формой отражения реальной действительности в мышлении.

Язык -- это средство, с помощью которого люди передают друг другу информацию о реальном мире. Словарные выражения являются материальной формой понятий и представлений. Естественный язык сформировался в результате длительного развития общества, Поскольку для различных слоев общества характерна разная степень общности представлений, возникла многозначность слов естественного языка: одно и то же слово приобретало множество различных значений, и для одного и того же слова использовалось несколько словесных выражений. Таким образом, общими недостатками естественного языка с позиций оценки эффективности поиска являются избыточность и недостаточность.

Избыточность проявляется в следующем:

активную роль в процессе передачи содержания текста играют только некоторые слова или словосочетания, так называемые ключевые слова Другие можно отбросить практически без ущерба для понимания смысла;

в естественном языке используются синонимы, то есть слова, различающиеся по звучанию и написанию, но тождественные или близкие по смыслу;

имеет место неоднозначность выражения, то есть возможность выразить одну и ту же мысль словами, не являющимися синонимами {например, «уменьшение сопротивления» -- «увеличение проводимости»).

Недостаточность выражения на естественном языке проявляется в следующем:

многозначность отдельных слов -- омонимия (совпадение по звучанию и написанию разных по значению слов). Например, «ключ» (для двери), «ключ» (источник);

2) эллипсность естественного языка. Под эллипсностью понимается пропуск в тексте подразумеваемых слов.

Если рассматривать процесс отражения объектов реального мира текстом на естественном языке, то в нем можно выделить план содержания -- смысл сообщения, то есть результат процесса мышления, и план выражения -- произвольный текст на естественном языке. Таким образом, тексты на естественном языке, хранящиеся в информационных системах, находятся на уровне плана выражения и характеризуются всеми недостатками естественного языка, которые были отмечены выше. Следует иметь в виду, что выявленные недостатки следует рассматривать лишь с позиций эффективного поиска сообщений в информационных системах. Причина неоднозначности выражений, например эллипсность, при рассмотрении под другим углом будет отнесена к достоинствам естественного языка.

Отметим, что потребитель информации, пользователь нуждается в получении информации о предметной области в соответствии со своими представлениями об объектах, свойствах и отношениях в этой области. Свой запрос он также формулирует на уровне плана выражения.

Таким образом, в самой информационной системе, содержащей тексты на естественном языке, мы имеем массив планов выражения источников на естественном языке, а на входе информационной системы мы имеем множество запросов в виде планов выражения, сформулированных потребителями информации.

Для того чтобы решить задачу поиска необходимой потребителю информации, необходимо смоделировать (представить) -- о каком фрагменте предметной области потребитель хочет получить информацию. Далее необходимо просмотреть хранящиеся документы -- планы выражения, составленные источниками, представить (смоделировать), что хотел сказать источник о предметной области, и на основе научно обоснованной методики отобрать те из документов, которые отвечают на поставленный вопрос полностью или частично.

Работы в области машинного перевода и теории построения документальных информационных систем, проводимые в течение последних 50 лет в нашей стране и за рубежом, показали, что процесс выявления смысла произвольного текста на естественном' языке не подлежит автоматизации и может быть реализован лишь человеком, обладающим глубокими знаниями в данной предметной области.

Однако общество нуждалось в построении документальных информационных систем, в первую очередь в области научно-технической информации. Для того чтобы облегчить поиск в больших массивах текстовой информации, стали строить информационно-поисковые системы, в которых документы описывались с помощью специальных поисковых языков. С помощью элементов этих же языков отписывались и запросы. Для отбора документов в ответ на запрос осуществлялось сравнение поисковых образов запросов и поисковых образов документов, которое проводилось на одном и том же искусственном языке. Такой подход является вынужденным.

Из-за недостатков естественного языка, отмеченных выше, документальные информационные системы не дают ответа на вопрос потребителя, а выдают ему документы, в которых может содержаться ответ на его запрос, предоставляя потребителю самому выявить смысловое содержание этих документов. Вопросы оценки эффективности поиска информации в документальных информационных системах будут рассмотрены ниже.

3. Вопросы эффективности поиска информации в Интернете и профессиональных базах

Одними из наиболее важных показателей эффективности информационных систем, содержащих текстовую информацию, являются семантические показатели. Семантические показатели основаны на оценке релевантности между документами и запросами.

Релевантность -- объективно существующее смысловое соответствие между содержанием документа и запроса. Объективность оценок релевантности обеспечивается тем, что они устанавливаются экспертным путем, а не автором запроса.

Пертинентностъ -- это субъективно оцениваемое соответствие содержания документов или текстов информационным интересам потребителя. Пертинентность может оценить только автор запроса, работающий с информационной системой. Оценки пертинеитности, как правило, отличаются от результатов, полученных на основе оценок релевантности.

Рассмотрим вопросы оценки эффективности поиска в профессиональных базах и информационных ресурсах Интернета.

Анализ содержимого профессиональных баз за последние 15 лет показывает неуклонный рост доли текстовой информации в общем объеме информации в профессиональных базах. Если в 1985 г. доля текстовой информации составляла 47 %, то в 2000 г. эта доля составляла уже 84 %. Представляется, что основная информация в Интернете также является текстовой. Эти обстоятельства позволяют сделать вывод о том, что подходы к оценке эффективности поиска в документальных системах в полной мере распространяются и на профессиональные базы, и на информационные ресурсы Интернета.

Информационные ресурсы Интернета и имеющиеся в среде Интернет поисковые средства обладают определенной спецификой, которая оказывает существенное влияние на эффективность поиска в этой среде.

Основными поисковыми средствами в Интернете являются поисковые системы и каталоги. Поисковые системы состоят из трех частей:

робот -- программа, которая посещает web-серверы, считывает и индексирует полностью или частично их содержимое и далее следует по ссылкам, найденным на сервере. Просмотры серверов осуществляются периодически, например раз в месяц, раз в две недели;

индексные массивы и копии текстов просмотренных страниц, хранящиеся в поисковой системе;

программа, которая, просматривая в соответствии с запросом пользователя индексные массивы, отбирает и выдает потребителю найденные документы.

В каталогах имеются иерархические тематические рубрики. Отнесение серверов к тем или иным рубрикам каталога осуществляется человеком. Пользователь ищет информацию в каталоге вручную, используя рубрики.

В связи с тем, что в средствах поиска в Интернете не используются информационно-поисковые языки, на которых могли бы быть описаны исходные документы и запросы, полнота поиска в Интернете с учетом указанных выше поисковых средств будет значительно ниже, чем в документальных системах, построенных на базе информационно-поисковых языков.

В 2000 г. специалисты компаний AltaVista, IBM и Compag исследовали ресурсы и гиперсвязи существующего информационного пространства WWW. Просмотрев с помощью поисковых средств AltaVista свыше 600 млн. web-страниц и 1,5 млрд. ссылок, размещенных на этих страницах, они пришли к выводу, что исследуемое пространство состоит из следующих компонентов:

- центральное ядро -- тесно связанные между собой web-страницы, с каждой из которых можно попасть на любую другую (27 %);

- отправные страницы. В них могут быть ссылки, ведущие к ядру, но из ядра к отправным страницам попасть нельзя (22 %);

- оконечные web-страницы, к которым можно прийти по ссылкам из ядра, но к ядру от них попасть нельзя (22 %);

- полностью изолированные от центрального ядра страницы (22 %);

- web-страницы, не пересекающиеся с остальными ресурсами Интернета (7 %).

Исследования показали, что при увеличении общего объема информационных ресурсов Интернета установленные отношения компонентов остаются прежними. Проведенный анализ позволяет сделать вывод о том, что информационное пространство Интернета является достаточно сложным и неоднородным. К отдельным ресурсам Интернета поисковые машины не имеют доступа.

У каждой поисковой машины свой процент индексирования документов и своя стратегия выбора -- какие из ресурсов индексировать. Анализ доли документов, заиндексированных крупнейшими зарубежными поисковыми системами, от общего числа документов в Интернете, проведенный в 1999 г., показал, что доля заиндексированных документов у лидеров в этой области не превышает 30%. Следует отметить, что количество документов в Интернете значительно увеличивается с каждым годом, при этом доля просмотренных и заиндексированных документов уменьшается.

Информационные ресурсы Интернета делятся на «видимую» и «невидимую» части сайтов.

«Видимая» - часть сайтов -- это та часть, которая обрабатывается поисковыми системами и индексируется. «Невидимая» -- часть сайтов, которая не предназначена для обработки поисковыми системами. Американская фирма BrightPIanet разработала программное обеспечение по исследованию «невидимой» части сайтов. Полученные результаты показывают, что число документов «невидимой» части превышает более чем в 500 раз число документов, относящихся к «видимой» части.

Перечисленные особенности информационных ресурсов Интернета и поисковых средств позволяют сделать вывод о том, что эффективность поиска информации в Интернете существенно уступает эффективности поиска в документальных информационно-поисковых системах, использующих специальные информационно-поисковые языки, и эффективности поиска в профессиональных базах. Указанные обстоятельства определяют высокие требования к профессиональной подготовке пользователя, которая необходима для получения нужной информации из информационных ресурсов Интернета.

Организация информации в профессиональных базах отличается от организации информации в Интернете в первую очередь тем, что информация накапливается и постоянно обновляется в базах данных, которых в настоящее время свыше 13 тыс. В каждой базе собрана специфичная информация. Отбор достоверных источников и накопление информации ведут информационные агентства-генераторы. Они же поддерживают эти базы в актуальном состоянии, то есть обновляют. Получение информации из баз потребителями обеспечивают агентства-поставщики. Потребителю предоставляется язык запроса и документация, характеризующая базы данных, которая включает следующие сведения по каждой базе: название, отражающее вид информации, хранимой в базе, с какого времени ведется база, объем накопленной информации, период обновления, источники информации.

Указанные особенности обеспечивают высокие показатели по достоверности, полноте и точности предоставляемой информации.

4. Технология поиска информации в Интернете и профессиональных базах

Наилучшим вариантом работы с информационными ресурсами Интернета является вариант, когда пользователь знает адрес сайта и получает возможность ознакомиться с его содержимым. Адрес сайта может быть получен из различных справочников, например желтых страниц Интернета, рекламных материалов и других источников. На сайт можно прийти по гиперссылкам, просматривая другие сайты

Опытный специалист в области информации всегда будет иметь список, .каталог адресов самых важных для ведения бизнеса фирмы сайтов. В этом случае необходимо лишь отслеживать появление новых сайтов, информация в которых может представлять интерес.

Если пользователь исследует новую проблему в бизнесе, ищет информацию среди ресурсов, которые он еще не освоил, одним из основных методов является использование поисковых машин и каталогов.

В этом случае может быть предложена следующая технология подготовки и проведения поиска.

1. Определение общей направленности запроса, его содержания.

2. Определение географических регионов поиска. В первую очередь для практических задач ценность информационного ресурса может зависеть от его географического расположения.

Отбор поисковых машин. Осуществляется отбор и устанавливается последовательность использования поисковых машин в соответствии с убыванием ожидаемой эффективности поиска в каждой из машин. Качество выполнения этого этапа будет зависеть от опыта работы пользователя с поисковыми машинами.

Составление запросов к поисковым машинам. Это наиболее сложный этап. Для эффективного использования поисковых машин запрос составляется так, чтобы область поиска была сужена в максимальной степени. Предпочтение должно отдаваться не одному расширенному, а нескольким узким запросам. Необходимо смоделировать, представить себе, как может выглядеть искомая информация. По ключевым словам следует составить тезаурус. Для этого необходимо хорошее знание языка, на котором работает пользователь, и специфических терминов предметной области.

Выполнение запроса и его уточнение. Составленный запрос передается на обработку. Анализ полученных результатов позволяет корректировать запрос, чаще всего с целью сужения области поиска.

Поиск деловой информации в Интернете -- это творческий процесс, требующий глубоких знаний в области информатики, лингвистики, принципов построения информационных и поисковых ресурсов Интернета.

Список литературы

1. Попов И.Г., Мамонов С.Г. Информационные системы. М.: Инфра, 2007.

2. Абросимов А.Г. Бородинова М.А. Теория экономических информационных систем. Учебное пособие - Самара. Изд-во Самарск.гос. экон. акад., 2007.

3. Информационные системы. Учебник /Петров В.Н. - СПб.: Питер, 2008.

4. Информационное обеспечение систем управления. Учебное пособие/Голенищев Э.П., Клименко И.В. - Ростов н/Д: Феникс, 2009.

5. Интеллектуальные информационные системы в экономике. Учебное пособие/Тельнов Ю.Ф. Издание третье, расширенное и доработанное. Серия «Экономика и бизнес». - Москва.: СИНТЕГ, 2009.

Размещено на Allbest


Подобные документы

  • Интернет - мощное глобальное средство обмена информацией. Классификация источников информации в Интернете. Электронная почта - один из видов информационных услуг, которые предоставляют компьютерные сети. Понятие и особенности телеконференции в Интернете.

    презентация [440,9 K], добавлен 18.04.2012

  • Понятие, развитие, формы организации Интернет. Сеть Интернет как информационный канал. Особенности средств массовой информации в глобальной сети, ее функции и возможности. Исследование электронных версий газет и информационных агентств в сети Интернет.

    курсовая работа [2,6 M], добавлен 09.04.2011

  • Средства поиска информации в сети Интернет. Основные требования и методика поиска информации. Структура и характеристика поисковых сервисов. Глобальные поисковые машины WWW (World Wide Web). Планирование поиска и сбора информации в сети Интернет.

    реферат [32,2 K], добавлен 02.11.2010

  • Рост количества информации в мире, его увеличение в сети Интернет в геометрической прогрессии. Количество сайтов, зарегистрированных в поисковой системе Яндекс. Особенности эффективного поиска информации в сети Интернет. Схема информационных потоков.

    презентация [52,6 K], добавлен 27.08.2013

  • Теоретические основы Интернет-технологий и основных служб сети Интернет. Ознакомление с возможностями подключения к сети Интернет. Основные службы сети. Принципы поиска информации в WWW. Обзор современных Интернет браузеров. Программы для общения в сети.

    курсовая работа [385,2 K], добавлен 18.06.2010

  • Особенности поиска информации в Интернет: стратегия и методика. Поисковые машины, каталоги и порталы информационных ресурсов. Подбор и введение ключевых слов. Использование режима "расширенный поиск", который имеет каждая из поисковых систем в Интернете.

    реферат [27,3 K], добавлен 06.08.2014

  • Понятие системы "Интернет", использование, размер сети, количество абонентов и пользователей. Поисковые системы, подход к сбору информации о ресурсах Интернет. Современные поисковые серверы. Работа с каталогами ресурсов, сохранение информации в Интернете.

    реферат [17,6 K], добавлен 02.12.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.