Информатика и программное обеспечение ПЭВМ
Понятие, содержание, объект, предмет информатики. Основные виды и способы обработки и кодирования данных. Информация, информационные процессы и системы как объект правового регулирования общественных отношений. Архитектура, программное обеспечение ПЭВМ.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | курс лекций |
Язык | русский |
Дата добавления | 20.06.2009 |
Размер файла | 6,5 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
1.6.2 Процесс сбора информации
Восприятие информации - процесс преобразования сведений, поступающих в техническую систему или живой организм из внешнего мира, в форму, пригодную для дальнейшего использования. Благодаря восприятию информации обеспечивается связь системы с внешней средой, в качестве которой могут выступать человек, наблюдаемый объект, явление или процесс и т. д.
Для развитых систем восприятия можно выделить несколько этапов переработки поступающей информации: предварительная обработка для приведения входных данных к стандартному для такой системы виду, выделение в поступающей информации семантически и прагматически значимых информационных единиц, распознавание объектов и ситуаций, коррекция внутренней модели мира. Важнейшей проблемой восприятия информации является интеграция информации, поступающей из различных источников и от анализаторов разного типа в пределах одной ситуации.
Сбор информации - это процесс ее получения из внешнего мира и приведения к виду, стандартному для данной информационной системы, с целью обеспечения достаточной полноты для принятия решения.
Обмен информацией между воспринимающей информацию системой и окружающей средой осуществляется посредством сигналов.
Сигнал можно определить как средство перенесения информации в пространстве и времени. В качестве носителя сигнала могут выступать звук, свет, электрический ток, магнитное поле и т. д.
Совокупность технических средств ввода информации в ЭВМ, программ, управляющих всем комплексом технических средств, обеспечивающих ввод информации с отдельных устройств ввода (драйверов устройств), - вот что представляет собой современная развитая система сбора информации.
В процессе сбора происходит комплектование системы информационного обеспечения массивами первичных и вторичных документированных источников информации.
К первичным документированным источникам информации относятся опубликованные, неопубликованные и непубликуемые документы, содержащие исходную информацию; к вторичным - документы, полученные в результате аналитико-синтетической переработки одного или нескольких первичных источников, например: информационные издания (библиографические, реферативные, обзорные).
Применительно к информационным системам, созданным с применением ЭВТ, используется понятие "сбор данных".
Сбор данных - процесс идентификации и получения данных от различных источников, группирования их и представления в форме, необходимой для ввода в ЭВМ.
Сбор информации связывает систему информационного обеспечения с внешней средой. Эффективность процесса сбора информации (информационного массива) оценивается показателями полноты, точности, оперативности, стоимости, трудоемкости.
Полнота - количественная мера содержания в массиве пертинентных документов (информации), существующих на данный момент времени с точки зрения всех пользователей системы.
Пертинентность - соответствие содержания документа (информации) информационным потребностям пользователей.
Точность - количественная мера содержания в информационном массиве (системе) только пертинентных документов (информации). Этот показатель характеризует внутреннее состояние процесса сбора, его способность удовлетворять информационные запросы независимо от времени на поиски информации.
Оперативность - способность процесса сбора выполнить задачу в минимально возможное время.
Стоимость - способность процесса сбора минимизировать затраты ресурса на единицу массива информации.
Трудоемкость - способность процесса сбора минимизировать трудозатраты на единицу массива информации.
В рамках процесса сбора осуществляется структуризация информации, информационных потребностей объекта (пользователя) и выбор источника информации.
Структуризация информации представляет системную классификацию информации по показателям удобства ее использования человеком в процессе решения практических задач обработки и хранения с использованием современных средств и методов (гл. 1.4.1).
Решение задачи структуризации информационных потребностей пользователя связано с формированием информационного кадастра, представляющего организованную совокупность всех данных, необходимых и достаточных для информационного обеспечения деятельности современного объекта.
Выбор источника информации должен осуществляться исходя из следующих требований: полноты информационного кадастра достоверности, актуальности, релевантности информативности, толерантности, функциональной направленности, легальности поставляемой, регулярности поступающей информации, минимизации затрат ресурса на поддержание информационного кадастра.
Задача оптимального выбора источников информации заключается в выборе из всего имеющегося потенциального множества такой совокупности, которая при минимальных расходах средств и трудозатратах обеспечила бы удовлетворительное регулярное поступление необходимой информации, отвечающей перечисленным выше требованиям.
1.6.3 Процесс передачи информации
Информационные потоки на объекте делятся на входные, внутренние и выходные. В канале телекоммуникации они могут быть разделены на односторонние и двухсторонние.
Циркуляцией информационных потоков называется факт регулярного их движения между различными объектами или элементами одного и того же объекта.
Важен процесс передачи информации, заключающийся в ее транспортировке от места генерации (источника) к местам хранения, обработки или использования (потребителю).
Информация передается в виде сообщений от некоторого источника информации к ее приемнику посредством канала связи (информационного канала) между ними. Источник посылает передаваемое сообщение, кодируемое в передаваемый сигнал, посылаемый по каналу связи. В результате в приемнике появляется принимаемый сигнал, который декодируется и становится принимаемым сообщением. Схематично процесс передачи информации показан на рисунке 1.12.
Рис. 1.12. Процесс передачи информации
В таком процессе информация представляется и передается в форме некоторой последовательности сигналов, символов, знаков. Например, при непосредственном разговоре между людьми происходит передача звуковых сигналов - речи, при чтении текста человек воспринимает буквы - графические символы. Передаваемая последовательность называется сообщением. От источника к приемнику сообщение передается через некоторую материальную среду (звук - акустические волны в атмосфере, изображение - световые электромагнитные волны).
Если в процессе передачи используются технические средства связи, то их называют каналами связи (информационными каналами).
Канал связи - совокупность технических средств (передатчик, линия связи, приемник), обеспечивающих передачу сигналов от источника к получателю сигнала.
По физической природе каналы связи делятся:
- на механические - используются для передачи материальных носителей информации;
- акустические - передают звуковой сигнал;
- оптические - передают световой сигнал;
- электрические - передают электрический сигнал.
Электрические каналы связи могут быть проводные и беспроводные (радиоканалы).
По форме представления передаваемой информации каналы связи делятся на аналоговые и дискретные. По аналоговым каналам передается информация, представленная в виде непрерывного ряда значений какой-либо физической величины; по дискретным - в виде дискретных (цифровых, импульсных) сигналов той или иной физической природы.
К каналам связи относят телефон, радио, телевидение.
Передача информации по каналам связи часто сопровождается воздействием помех, вызывающих искажение и потерю информации.
В существующих информационных системах различных классов в зависимости от видов используемых носителей информации и средств обработки можно выделить несколько систем передачи, в которых информация распространяется посредством передачи устной речи при непосредственном общении; бумажных носителей с помощью фельдъегерско-почтовой связи; машиночитаемых носителей (магнитных карт, перфокарт, перфолент, магнитных дисков и лент) с помощью фельдъегерско-почтовой связи; в виде различных электрических сигналов по каналам телекоммуникаций, в том числе автоматизированным каналам связи.
В системах управления информация передается как путем переноски (перевозки) информационных документов курьером (фельдъегерем), так и использования систем автоматизированной передачи информации по каналам связи.
Ручная и механическая перевозка документов - весьма распространенный способ передачи информации. При минимальных капитальных затратах он полностью обеспечивает достоверность передачи информации, предварительно зафиксированной в документах и проконтролированной непосредственно в пунктах ее регистрации. Однако данный способ передачи имеет существенный недостаток - низкую оперативность (скорость) передачи.
Схема передачи информации посредством фельдъегерско-почтовой связи представлена на рисунке 1.13.
Рис. 1.13. Общая схема процесса передачи информации по каналам
фельдъегерско-почтовой связи
Для оперативной передачи информации используют системы автоматизированной передачи информации. Американским ученым Клодом Шенноном была предложена схема процесса передачи информации по техническим каналам связи (рис. 1.14).
Источником информации и ее получателем могут быть как человек, так и различные технические устройства (средства связи, ЭВТ и др.).
С помощью кодера устройства источника (КИ) информация, имеющая любую физическую природу (изображение, звук и т. п.), преобразуется в первичный электрический сигнал b(t). Для непрерывной информации, например речевого сообщения, эта операция сводится к преобразованию звукового давления в пропорционально изменяющийся электрический ток микрофона, который в каждый момент отсчета (времени) можно представить конечным числом сигналов, соответствующих отдельным буквам алфавита источника. В телеграфии последовательность элементов сообщения (букв алфавита) большого объема заменяется (кодируется) символами (буквами) другого алфавита меньшего объема.
Рис. 1.14. Общая схема системы передачи информации по каналам
телекоммуникаций (связи)
Процесс преобразования информации в систему символов, обеспечивает:
- простоту технических средств распознавания элементарных символов сообщения;
- снижение избыточности символов, требующихся на букву сообщения;
- минимальное время передачи или минимальный объем запоминающих устройств хранения информации;
- простоту выполнения арифметических и логических действий с хранимой информацией.
В дальнейшем с помощью технического устройства последовательность кодовых символов преобразуется в последовательность электрических сигналов. Связь, при которой передача производится в форме непрерывного электрического сигнала, называется аналоговой связью. В настоящее время широко используется цифровая связь, когда передаваемая информация кодируется в двоичную форму ("0" и "1" - двоичные цифры), а затем декодируется в текст, изображение, звук. Цифровая связь является дискретной.
Рассмотренное кодирование при отсутствии помех в канале связи дает выигрыш во времени передачи или объеме запоминающего устройства, т. е. повышает эффективность системы. Оно получило название эффективного, или оптимального, кодирования.
В процессе передачи сигнала по каналу связи на него оказывают негативное воздействие различного рода помехи, искажающие передаваемый сигнал и приводящие к потере информации. Такие помехи возникают по техническим причинам: плохое качество линий связи, незащищенность друг от друга различных потоков информации, передаваемой по одним и тем же каналам. В этих случаях применяются технические способы защиты каналов связи от воздействия шумов. Например, использование экранного кабеля вместо "голого" провода; применение разного рода фильтров, отделяющих полезный сигнал от шума и пр.
Клодом Шенноном была разработана специальная теория кодирования, описывающая методы борьбы с шумом. Одна из важных идей этой теории состоит в том, что передаваемый по линии связи код должен быть избыточным. За счет этого потеря какой-то части информации при передаче может быть компенсирована.
Однако нельзя делать избыточность слишком большой. Это приведет к задержкам и подорожанию связи. В современных системах цифровой связи часто применяется следующий прием борьбы с потерей информации при передаче. Все сообщение разбивается на порции - блоки. Для каждого блока вычисляется контрольная сумма (сумма двоичных цифр), передаваемая вместе с данным блоком. В месте приема заново вычисляется контрольная сумма принятого блока, и если она не совпадает с первоначальной, то передача данного блока повторяется. Так будет происходить до тех пор, пока исходная и конечная контрольные суммы не совпадут. Такое кодирование называется помехоустойчивым.
Выбор кодирующих и декодирующих устройств зависит от статистических свойств источника сообщений, уровня и характера помех в канале связи.
В передатчике (ПРД) первичный электрический сигнал преобразуется во вторичный u(t), пригодный для передачи по соответствующему каналу (линии) связи. Такое преобразование осуществляется с помощью модулятора.
Преобразование сообщения в сигнал должно быть обратимым. Это позволит по выходному сигналу восстановить входной первичный сигнал, т. е. получить всю информацию, содержащуюся в переданном сообщении. В противном случае часть информации будет потеряна.
Линия связи - среда, используемая для передачи сигналов от передатчика к приемнику.
В системах электросвязи такими линиями являются кабели, волноводы, в системах радиосвязи пространства, в которых распространяются электромагнитные волны от передатчика к приемнику.
При передаче по линии связи на сигналы могут накладываться помехи , в результате чего сигналы искажаются.
Приемное устройство в составе приемника (ПРМ) и декодирующего устройства информации (ДИ) обрабатывает принятый сигнал z(t) = s(t) + n(t) и восстанавливает по нему передаваемое сообщение а', адекватное сообщению источника информации a.
Система связи - совокупность технических средств передачи сообщений от источника к потребителю, включающая передающие (КИ, ПРД) и приемные (ДИ, ПРМ) устройства и линию связи.
По виду передаваемых сообщений различают следующие системы связи: передачи речи (телефонная), текста (телеграфная), неподвижных изображений (фототелеграфная), изображений (телевизионная), данных, радиовещание, видеотекста, телетекста, конференцсвязи, телеизмерения и телеуправления и др.
По количеству передаваемых сообщений по одной линии связи системы делятся на одноканальные и многоканальные.
Одной из важных характеристик системы передачи информации является скорость передачи информации.
Основными качественными показателями системы передачи информации являются пропускная способность, достоверность, надежность работы.
Пропускная способность системы передачи информации - наибольшее теоретически достижимое количество информации, которое может быть передано по системе за единицу времени. Она обусловливается скоростью преобразования информации в передатчике и приемнике и допустимой скоростью передачи информации по каналу связи, определяемой физическими свойствами канала связи и сигнала.
Достоверность передачи информации - это передача информации без искажения.
Надежность канала связи - полное и правильное выполнение системой всех своих функций.
Скорость передачи информации - это информационный объем сообщения, передаваемого в единицу времени. Единицы измерения скорости информационного потока: бит/с, байт/с и др.
Скорость передачи дискретной информации по каналу связи измеряется в бодах. Бод - это элемент сигнала, передаваемый в единицу времени (всплеск частоты, переворот фазы).
По пропускной способности каналы связи можно классифицировать на виды:
- низкоскоростные, скорость передачи информации в которых от 50 до 200 Бд; это дискретные (телеграфные) каналы связи как коммутируемые (абонентский телеграф), так и некоммутируемые;
- среднескоростные, использующие аналоговые (телефонные) линии связи; скорость передачи в них от 300 до 9 600 Бд, а в новых Стандартах Международного совета электросвязи (МСЭ) (ранее Международного консультационного комитета по телеграфии и телефонии - МККТТ) до 33 600 Бд (Стандарт V.34 бис);
- высокоскоростные (широкополосные), обеспечивающие скорость передачи информации выше 36 000 Бд; по этим каналам связи можно передавать и дискретную, и аналоговую информации.
Физической средой передачи информации в низкоскоростных и среднескоростных каналах связи (КС) обычно являются группы параллельных, либо скрученных проводов, называемых "витая пара" (скручивание проводов уменьшает влияние внешних помех).
В широкополосных каналах связи используются коаксиальные и оптоволоконные кабели. К ним относятся и беспроводные радиоканалы связи. Возможности широкополосных каналов связи огромны, например, по одному радиоканалу для миллиметровых волн можно одновременно организовать несколько тысяч телефонных, несколько тысяч видеотелефонных и около тысячи телевизионных каналов, при этом скорость передачи может составлять несколько миллионов бод. Не меньше возможностей и у волоконно-оптических каналов.
Следует особо отметить, что телефонный канал связи является более узкополосным, нежели телеграфный, но скорость передачи данных по нему выше ввиду обязательного наличия специального устройства согласования - модема.
Модем выполняет следующие функции:
- при передаче преобразование широкополосных импульсов (цифрового кода) в полосные аналоговые сигналы (амплитудно-, частотно- или фазомодулированные);
- при приеме фильтрацию принятого сигнала от помех и детектирование, т. е. обратное преобразование узкополосного аналогового сигнала в цифровой код.
Благодаря фильтрации сигнала повышается помехоустойчивость, что, в свою очередь, позволяет увеличивать пропускную способность системы. Модемы, выпускаемые промышленностью, различаются:
- конструкцией (автономные и встраиваемые в аппаратуру);
- интерфейсом с КС (контактные и бесконтактные (аудио));
- назначением для разных каналов связи и систем (например, для систем передачи данных - модемы, для систем передачи факсов - факс-модемы);
- скоростью передачи. Существует стандарт скоростей передачи данных, соответствующий стандарту протоколов (алгоритмов управления) МСЭ для телефонных КС; он включает скорости (в бодах): 300, 600, 1 200, 2 400, 4 800,12 000, 14 400, 16 800,19 200, 28 800, 33 600.
Ранее модемы выпускались каждый на определенную скорость работы. Современные модемы более универсальны: некоторые из них (МТ 1932, МТ 2834 и др.) могут работать как с коммутируемыми, так и с некоммутируемыми КС, поддерживают почти всю шкалу названных скоростей, имеют режимы модема и факс-модема.
Классификация систем передачи информации:
1. Передача недокументированной информации. Телефонная связь - самый распространенный вид оперативной административно-управленческой связи. Ее абонентами являются как физические лица, так и организации. Телефонную связь можно разделить на общегосударственную и внутриучрежденческую. Виды телефонной связи: радиотелефонная, видеотелефонная, пейджинговая.
2. Передача документированной информации. Телеграфная связь предназначена для передачи на расстояние по электрическим проводным каналам связи алфавитно-цифровой информации для автоматизированного приема-передачи коротких текстовых документированных сообщений:
1. Телетайпная связь, при которой ввод информации в телетайп может осуществляться вручную с клавиатуры и автоматизированно с перфоленты.
2. Дейтефонная связь использует для передачи информации телефонные каналы связи, а в качестве приемопередающей аппаратуры может использоваться как обычная телетайпная аппаратура совместно с модемами, так и специальная. Примерный состав и назначение аппаратуры абонента дейтефонной связи:
1) телефонный аппарат - первоначальный вызов абонента;
2) фотосчитывающее устройство - автоматическое считывание информации с перфоленты при передаче;
3) перфоратор ленты - регистрация принятой информации на перфоленту;
4) модулятор-демодулятор (модем) - согласование приемопередающей аппаратуры с телефонным каналом связи;
5) устройство защиты от ошибок - для обеспечения достоверности передачи информации;
6) устройство алфавитно-цифровой печати (принтер, телетайп).
Факсимильный способ передачи информации заключается в дистанционном копировании документов. Назначение факсимильной связи - передача на расстояние информации в виде текстов, чертежей, рисунков, схем, фотоснимков и т. п.
1.6.4 Обработка информации
На различных этапах информационного цикла данные преобразовываются из одного вида в другой с помощью различных методов. Общая схема процесса обработки информации выглядит следующим образом (рис. 1.15).
Рис.1.15. Схема процесса обработки информации
В процессе обработки информации решается некоторая информационная задача, для которой должны быть определены исходная (некоторый набор исходных данных) и итоговая (требуемые результаты) информация. Переход от исходных данных к результату и есть процесс обработки. Тот объект или субъект, который осуществляет обработку, называется исполнителем обработки. Это может быть человек или техническое устройство, в том числе компьютер.
Для успешного выполнения обработки информации исполнителю должен быть известен способ обработки, т. е. последовательность действий, которую нужно выполнить, чтобы достичь нужного результата. Описание такой последовательности действий в информатике принято называть алгоритмом обработки.
Можно выделить два типа обработки информации:
1. Обработка, связанная с получением новой информации, нового содержания знаний. К ней относится решение различных задач путем применения логических рассуждений.
2. Обработка, связанная с изменением формы, но не изменяющая содержания, например, перевод текста с одного языка на другой.
Обработка данных включает в себя множество разных операций, представляющих собой комплекс совершаемых технологических действий, в результате которых информация преобразуется. Основными операциями являются:
- формализация (приведение данных, поступающих из разных источников, к единой форме);
- фильтрация (устранение лишних данных, которые не нужны для принятия решений);
- сортировка (приведение в порядок данных по заданным признакам с целью удобства использования);
- архивация (сохранение данных в удобной и доступной форме);
- защита (комплекс мер, направленных на предотвращение потерь при воспроизведении и модификации данных);
- преобразование (преобразование данных из одной формы в другую или из одной структуры в другую или изменение типа носителя).
Обработка информации - это получение одних информационных объектов из других информационных объектов путем выполнения некоторых алгоритмов.
Обработка является одним из основных процессов, выполняемых над информацией, и главным средством увеличения объема и разнообразия информации.
Средства обработки информации - всевозможные устройства и системы, созданные человечеством, и в первую очередь компьютер.
При обработке информации производится структурирование данных. Это определенный порядок, определенная организация в хранилище информации: расположение данных в алфавитном порядке, группировка по некоторым признакам классификации, использование табличного или графового представления - все это примеры структурирования. От способа организации информации зависит алгоритм поиска. Если информация структурирована, то поиск осуществляется быстрее.
Живые организмы и растения обрабатывают информацию с помощью своих органов и систем, компьютеры путем выполнения некоторых алгоритмов.
Вычислительные алгоритмы должны объединяться в вычислительный граф системы обработки информации в соответствии с требуемой технологической последовательностью решения задач.
По мере развития вычислительной техники совершенствуются и формы ее использования. Существуют разнообразные способы доступа и общения с ЭВМ. Индивидуальный и коллективный доступ к вычислительным ресурсам зависит от степени их концентрации и организационных форм функционирования. Централизованные формы применения вычислительных средств, которые существовали до массового использования ПЭВМ, предполагали их сосредоточение в одном месте и организацию информационно-вычислительных центров индивидуального (ИВЦ) и коллективного пользования (ИВЦКП).
Деятельность ИВЦ и ИВЦКП характеризовалась обработкой больших объемов информации, использованием нескольких средних и больших ЭВМ, квалифицированным персоналом для обслуживания техники и разработки программного обеспечения. Централизованное применение вычислительных и других технических средств позволяло организовать их надежную работу, планомерную загрузку и квалифицированное обслуживание.
Централизованная обработка информации наряду с положительными сторонами имеет и некоторые отрицательные черты, порожденные прежде всего отрывом конечного пользователя от технологического процесса обработки информации.
Децентрализованные формы использования вычислительных ресурсов начали формироваться со второй половины 80-х г ХХ в. Децентрализация предусматривает размещение ПЭВМ в местах возникновения и потребления информации, где создаются автономные пункты ее обработки. К ним относят абонентские пункты и автоматизированные рабочие места.
Автоматизированное рабочее место (АРМ) специалиста включает персональную ЭВМ, работающую автономно или в вычислительной сети, набор программных средств и информационных массивов для решения функциональных задач.
Технология электронной обработки информации - человеко-машинный процесс исполнения взаимосвязанных операций, протекающих в установленной последовательности с целью преобразования исходной (первичной) информации в результатную. Технологические операции разнообразны по сложности, назначению, технике реализации, выполняются на различном оборудовании, многими исполнителями.
Различают два основных типа организации технологических процессов: предметный и пооперационный.
Предметный тип организации технологии предполагает создание параллельно действующих технологических линий, специализирующихся на обработке информации и решении конкретных комплексов задач (учет нагрузки, качества прохождения сигнала и т. п.) и организующих пооперационную обработку данных внутри линии.
Пооперационный (поточный) тип построения технологического процесса предусматривает последовательное преобразование обрабатываемой информации согласно технологии, представленной в виде непрерывной последовательности сменяющих друг друга операций, выполняемых в автоматическом режиме.
Различают следующие режимы взаимодействия пользователя с ЭВМ: пакетный и интерактивный (запросный, диалоговый). Сами ЭВМ могут функционировать в следующих режимах: одно- и многопрограммном, разделения времени, реального времени, телеобработки.
Организация вычислительного процесса при пакетном режиме строилась без доступа пользователя к ЭВМ. Его функции ограничивались подготовкой исходных данных по комплексу информационно-взаимосвязанных задач и передачей их в центр обработки, где формировался пакет, включающий задание для ЭВМ на обработку, программы, исходные и справочные данные. Он вводился в ЭВМ и реализовывался в автоматическом режиме, при этом работа ЭВМ могла проходить в одно- или многопрограммном режиме.
Интерактивный режим предусматривает непосредственное взаимодействие пользователя с информационно-вычислительной системой, может носить характер запроса (как правило регламентированного) или диалога с ЭВМ.
Запросный режим необходим пользователям для взаимодействия с системой через значительное число абонентских терминальных устройств, в том числе удаленных на значительное расстояние от центра обработки. Такая необходимость обусловлена решением оперативных задач справочно-информационного характера.
Диалоговый режим открывает пользователю возможность непосредственно взаимодействовать с вычислительной системой в допустимом для него темпе работы, реализуя повторяющийся цикл выдачи задания, получения и анализа ответа. При этом ЭВМ сама может инициировать диалог, сообщая пользователю последовательность шагов (представление меню) для получения искомого результата.
Обе разновидности интерактивного режима (запросный, диалоговый) основываются на работе ЭВМ в режимах реального времени и телеобработки, которые являются дальнейшим развитием режима разделения времени, поэтому обязательными условиями функционирования системы в этих режимах являются, во-первых, постоянное хранение в запоминающих устройствах ЭВМ необходимой информации и программ и лишь в минимальном объеме поступление исходной информации от абонентов и, во-вторых, наличие у абонентов соответствующих средств связи с ЭВМ для обращения к ней в любой момент времени.
Рассмотренные технологические процессы и режимы работы пользователей в системе "человек-машина" особенно четко проявляются при интегрированной обработке информации, которая характерна для современного автоматизированного решения задач в многоуровневых информационных системах.
1.6.5 Хранение информации
Хранение и накопление информации вызвано ее многократным использованием, применением постоянной информации, необходимостью комплектации первичных данных до их обработки; осуществляется на машинных носителях в виде информационных массивов, где данные располагаются по установленному в процессе проектирования группировочному признаку.
Хранение информации - это ее запись во вспомогательные запоминающие устройства на различных носителях для последующего использования.
Хранение является одной из основных операций, осуществляемых над информацией, и главным способом обеспечения ее доступности в течение определенного промежутка времени.
Основное содержание процесса хранения и накопления информации состоит в создании, записи, пополнении и поддержании информационных массивов и баз данных в активном состоянии (рис. 1.16).
В результате реализации такого алгоритма документ, независимо от формы представления поступивший в информационную систему, подвергается обработке и после этого отправляется в хранилище (базу данных), где помещается на соответствующую "полку" в зависимости от принятой системы хранения. Результаты обработки передаются в каталог.
Этап хранения информации может быть представлен на следующих уровнях: внешнем, концептуальном (логическом), внутреннем, физическом.
Рис. 1.16. Алгоритм процесса подготовки информации к хранению
Внешний уровень отражает содержательность информации и представляет способы (виды) представления данных пользователю в ходе их хранения.
Концептуальный уровень определяет порядок организации информационных массивов и способы хранения информации (файлы, массивы, распределенное хранение, сосредоточенное и др.).
Внутренний уровень представляет организацию хранения информационных массивов в системе ее обработки и определяется разработчиком.
Физический уровень хранения означает реализацию хранения информации на конкретных физических носителях.
Способы организации хранения информации связаны с ее поиском - операцией, предполагающей извлечение хранимой информации.
Хранение и поиск информации являются не только операциями над ней, но и предполагают использование методов осуществления этих операций. Информация запоминается так, чтобы ее можно было отыскать для дальнейшего использования. Возможность поиска закладывается во время организации процесса запоминания. Для этого используют методы маркирования запоминаемой информации, обеспечивающие поиск и последующий доступ к ней и применяемые для работы с файлами, графическими базами данных и т. д.
Маркер (mark, marker) - метка на носителе информации, обозначающая начало или конец данных либо их части (блока).
В современных носителях информации используются маркеры:
- адреса (адресный маркер) - код или физическая метка на дорожке диска, указывающие на начало адреса сектора;
- группы - маркер, указывающий начало или конец группы данных;
- дорожки (начала оборота) - отверстия на нижнем диске пакета магнитных дисков, указывающие физическое начало каждой дорожки пакета.
- конца файла - метка, используемая для указания окончания считывания последней записи файла;
- ленты (ленточный маркер) - управляющая запись или физическая метка на магнитной ленте, обозначающая признак начала или конца блока данных или файла;
- сегмента - специальная метка, записываемая на магнитной ленте для отделения одного сегмента набора данных от другого.
Хранение информации в ЭВМ связано с процессом ее арифметической обработки и с принципами организации информационных массивов, поиска, обновления, представления информации и др.
Важным этапом автоматизированного этапа хранения является организация информационных массивов.
Массив (от англ. array) - упорядоченное множество данных.
Информационный массив - система хранения информации, включающая представление данных и связей между ними, т. е. принципы их организации.
С учетом этого рассматриваются следующие структуры организации информационных массивов: линейная, многомерная.
В свою очередь, линейная структура данных делится на строки, одномерные массивы, стеки, очереди, деки и др.
Строка - это представление данных в виде элементов, располагающихся по признаку непосредственного следования, т. е. по мере поступления данных в ЭВМ.
Одномерный массив - это представление данных, отдельные элементы которых имеют индексы, т. е. поставленные им в соответствие целые числа, рассматриваемые как номер элемента массива.
Индекс обеспечивает поиск и идентификацию элементов, а следовательно, и доступ к заданному элементу, что облегчает его поиск по сравнению с поиском в строке.
Идентификация - процесс отождествления объекта с одним из известных объектов.
Стек - структура данных, учитывающая динамику процесса ввода-вывода информации, использующая линейный принцип организации хранения, реализующий процедуру обслуживания "последним пришел - первым ушел" (первым удаляется последний поступивший элемент).
Очередь - структура организации данных, при которой для обработки информации выбирается элемент, поступивший ранее всех других.
Дека - структура организации данных, одновременно сочетающая рассмотренные виды.
Нелинейные структуры хранения данных используют многомерные структуры (массивы) следующих видов: деревья, графы, сети.
Элемент многомерного массива определяется индексом, состоящим из набора чисел. Формой представления прямоугольного массива является матрица, каждое значение которой определяется индексом требуемого элемента массива. Так, в двухмерном массиве элементы обозначаются двумя индексами, а в трехмерном - тремя.
Массивы по своей структуре близки к файлам и отличаются от последних двумя основными признаками:
- каждый элемент массива может быть явно обозначен, и к нему имеется прямой доступ;
- число элементов массива определяется при его описании.
Организация хранения данных в многомерном массиве может быть представлена в виде логических структур информационных массивов. В этих массивах структуры данных компонуются в виде записей, располагающихся различным образом. С учетом этого выделяют следующие основные структуры информационных массивов: последовательную, цепную, ветвящуюся, списковую.
В последовательной структуре информационного массива записи располагаются последовательно, нахождение требуемой записи осуществляется путем просмотра всех предшествующих. Включение новой записи в информационный массив требует смещения всех записей, начиная с той, которая добавляется. Обновление информационных массивов при последовательной структуре требует перезаписи всего массива.
В цепной структуре информационные массивы располагаются произвольно. Для логической связи отдельных записей необходима их адресация, т. е. каждая предыдущая запись логически связанного информационного массива должна содержать адрес расположения последующей записи. Если с определенного уровня, значения в записях повторяются в различных сочетаниях, то в целях экономии памяти возможен переход от цепной структуры к ветвящейся.
В ветвящейся структуре информационного массива сначала размещается запись, отображающая признак объекта с небольшим числом значений, далее они повторяются в записях в различных сочетаниях. Это дает возможность перейти от некоторой основной записи к другим в зависимости от запроса, не повторяя основную запись.
Чтобы устранить повторяющиеся записи и соответствующие им поля из памяти, их удаляют из основного массива и объединяют в дополнительный небольшой информационный массив. В нем записи упорядочиваются по какому-либо признаку без повторений, тогда в основном массиве вместо удаленного информационного поля указываются адреса записей, размещенных в дополнительном массиве. Данная структура является удобной при реорганизации информационной базы, поскольку повторяющиеся записи легко могут быть заменены, так как хранятся в дополнительном массиве, основной массив подвергается при этом незначительным изменениям. Однако эта структура требует дополнительного объема памяти.
Списковая структура информационных массивов характеризуется наличием списка, который содержит набор данных, определяющих логический порядок организации информационного массива.
Список включает имя и адрес поля данных. В памяти ЭВМ элементы списка физически разнесены, но связаны друг с другом логически за счет адресных ссылок.
Поле данных в зависимости от характера хранимой информации может быть выражено двоичным разрядом, словом фиксированной либо переменной длины, а также набором отдельных слов.
Формализовано список может быть реализован в виде таблицы, где имена списка и поля данных сопоставлены с адресами, выбранными произвольно по мере наличия свободных мест в запоминающем устройстве. В случае необходимости повторений какой-либо информации рекомендуется многократно обращаться по адресу, который может входить в несколько списков, т. е. применить механизм многократных адресных ссылок.
Списковая структура с механизмом адресных ссылок может быть представлена в виде графа древовидной структуры. В нем каждый элемент списка включает в себя маркерное поле, поле данных и адресное поле. Маркерное поле предупреждает, имеется ли ссылка на другой список или она отсутствует. В зависимости от этого в маркерном поле ставится знак минус или плюс.
Списки так же могут быть показаны ориентированными графами с полями, в которых возможна ссылка вперед и назад. Возникает так называемый симметричный список, и появляется возможность движения в структуре данных в разных направлениях.
Рассмотренные списковые структуры информационных массивов имеют следующие особенности:
- высокую логическую простоту;
- относительно большое количество времени доступа, обусловленное адресным обращением к данным, при котором к каждому элементу списка необходимо иметь ссылку;
- значительное возрастание объема памяти запоминающего устройства по сравнению с последовательной структурой организации информационных массивов, обусловленное адресным обращением к данным.
С учетом рассмотренных структур формирования информационных массивов можно представить ряд способов организации массивов (рис. 1.17) в запоминающих устройствах ЭВТ.
Рис. 1.17. Способы организации массивов информации в запоминающем устройстве ЭВТ
На физическом уровне любые записи информационного поля представляют в виде двоичных символов. Обращение к памяти большого объема требует большой длины адреса. Если память имеет емкость 2n слов, то для поиска таких слов потребуются n-разрядные адреса. В микропроцессорах восьмиразрядные слова дают возможность обращаться к 256 ячейкам памяти, что оказывается недостаточно для хранения информации в автоматизированных системах. Если непосредственно обращение к любой ячейке невозможно, переходят к страничной организации памяти.
В этом случае выбирают область памяти емкостью 2n слов и называют страницей, обращение к которой осуществляется командой, содержащей n-разрядное адресное поле. В микропроцессорах обычно используют страницы размером 256 слов.
Принципы адресации, объемы памяти, количественные характеристики зависят от функционального назначения запоминающих устройств, разделяющимся по уровням функциональной иерархии на сверхоперативные, оперативные, постоянные, полупостоянные, внешние, буферные.
С хранением информации связаны следующие понятия: носитель информации (память), внутренняя память, внешняя память, хранилище информации.
Носитель информации - это физическая среда, непосредственно хранящая информацию. Основным носителем информации для человека является его собственная биологическая память (мозг), которую можно назвать оперативной (быстрой) памятью или внутренней памятью, поскольку ее носитель находится внутри нас.
Другие носители информации можно назвать внешними (по отношению к человеку), например бумага, которая, непригодна в обычных (не специальных) условиях для длительного хранения информации: на нее оказывают вредное воздействие температурные условия.
Для ЭВТ по материалу изготовления различают бумажные, металлические, пластмассовые, комбинированные и другие носители; по принципу воздействия и возможности изменения структуры выделяют магнитные, полупроводниковые, диэлектрические, перфорационные, оптические и др.; по методу считывания различают контактные, магнитные, электрические, оптические. Хранение информации осуществляется на специальных носителях.
Особое значение при построении информационного обеспечения имеют характеристики доступа к информации, записанной на носителе, которые бывают прямого и последовательного доступа. Пригодность носителя для хранения информации оценивается такими параметрами, как время доступа, емкость памяти и плотность записи. Хранение больших объемов информации оправдано только при условии, если поиск нужной информации можно осуществить достаточно быстро, а сведения получить в доступной форме.
Хранилище информации - это определенным образом организованная информация на внешних носителях, предназначенная для длительного хранения и постоянного использования, например архивы документов, библиотеки, справочники, картотеки. Основной информационной единицей хранилища является определенный физический документ: анкета, книга, дело, досье, отчет и пр. Под организацией хранилища понимается наличие определенной структуры, т. е. упорядоченность, классификация хранимых документов. Она необходима для удобства ведения хранилища: пополнения новыми документами, удаления ненужных, поиска информации и т. д.
Основные свойства хранилища информации: объем хранимой информации, надежность хранения, время доступа (т. е. время поиска нужных сведений), наличие защиты информации.
Информацию, хранимую на устройствах компьютерной памяти, принято называть данными. Для описания хранения данных используют те же понятия: носитель, хранилище данных, организация данных, время доступа, защита данных. Организованные хранилища данных на устройствах внешней памяти компьютера принято называть базами данных и банками данных.
Таким образом, хранение информации представляет собой процесс передачи информации во времени, связанный с обеспечением неизменности состояния материального носителя.
1.6.6 Системы хранения данных
В последнее время применение компьютерной техники претерпевает значительные изменения, связанные с переходом к созданию интегрированных (объединенных) информационных систем, предназначенных осуществлять согласованное управление данными в пределах предприятия (организации), координировать работу отдельных подразделений, автоматизировать операции по обмену информацией как в пределах отдельных групп пользователей, так и между несколькими организациями, отстоящими друг от друга на десятки и сотни километров. Основой для построения подобных систем служат локальные вычислительные сети (ЛВС). Их характерной чертой является предоставление пользователям возможности работать в универсальной информационной среде с функциями коллективного доступа к данным.
Рост объемов данных, возросшие требования к надежности хранения и быстродействию доступа к данным делают необходимым выделение средств хранения в отдельную подсистему вычислительного комплекса - систему хранения данных. Роль и важность ее определяются постоянно возрастающей ценностью информации в современном обществе, возможность доступа к данным и управления ими является необходимым условием для успешного выполнения информационных процессов.
Система хранения данных предназначена для организации их надежного хранения, а также отказоустойчивого, высокопроизводительного доступа серверов к устройствам хранения. В настоящее время объем и стоимость обрабатываемой информации с каждым годом увеличиваются и, как следствие, повышаются требования по надежности, доступности и совокупной стоимости владения используемых систем хранения данных. Помимо высоких показателей производительности, доступности и низкой стоимости необходимо обеспечить требуемую функциональность - объем хранения и число подключаемых серверов.
Дисковые массивы сегодня являются основными устройствами хранения данных, однако обработка информации, формирование логической структуры ее хранения (дисковых томов и файловых систем) осуществляется на серверах. В процесс доступа к данным, помимо процессоров и памяти сервера, вовлечены установленные в нем адаптеры (Host Bus Adapter - HBA), работающие по определенному протоколу, драйверы, обеспечивающие взаимодействие HBA с операционной системой, менеджер дисковых томов, файловая система и менеджер памяти операционной системы.
Если дисковый массив выполнен в виде отдельного устройства, то для его подключения к серверам используется определенная инфраструктура. В зависимости от протокола доступа (транспорта), реализованного в HBA и дисковом массиве, она может быть как простой шиной (протокол SCSI), так и сетью (протокол Fibre Channel (FC)). Если это сеть, то в ней используется активное оборудование - концентраторы и коммутаторы, работающие по протоколу FC, маршрутизаторы протокола FC в другие протоколы (обычно в SCSI). Таким образом, помимо устройств хранения данных в состав СХД необходимо еще добавить инфраструктуру доступа, связывающую серверы с устройствами хранения.
Сетевой инфраструктурой, объединяющей большое количество серверов и устройств хранения, необходимо управлять и отслеживать ее состояние. Это реализуется "подручными" средствами - встроенными утилитами серверов, массива и операционной системы, бесплатными утилитами или "самописными" скриптами. Каждое из устройств в СХД имеет несколько объектов, требующих управления и контроля состояния, например дисковые группы и тома у массивов, порты у массивов и коммутаторов, адаптеры в серверах. Как только число объектов управления в СХД начинает исчисляться десятками, управление такой конфигурацией отнимает у администраторов слишком много времени и сил и неизбежно приводит к ошибкам. Справиться с такой задачей можно, только используя полномасштабную систему управления.
Система хранения данных должна включать следующие подсистемы и компоненты:
1. Устройства хранения данных: дисковые массивы и ленточные библиотеки. Современные высокопроизводительные дисковые массивы используют технологию Fibre Channel для подключения к ним серверов и доступа к дискам внутри массива. Они могут масштабироваться до десятков терабайт дискового пространства и обладают встроенным интеллектом для выполнения специальных функций: виртуализации дискового пространства, разграничения доступа к дисковому пространству, создания Point-In-Time (PIT) копий данных и репликации данных между массивами. К устройствам хранения данных также относятся ленточные, магнитооптические и CD/DVD библиотеки.
2. Инфраструктуру доступа серверов к устройствам хранения данных, которая создается в настоящее время на основе технологии "сеть хранения данных" (Storage Area Network - SAN). SAN является высокопроизводительной информационной сетью, ориентированной на быструю передачу больших объемов данных.
В основе концепции SAN лежит возможность соединения любого из серверов с любым устройством хранения данных, работающим по протоколу Fibre Channel. Сеть хранения данных образуют волоконно-оптические соединения, Fibre Channel Host Bus Adapters (FC-HBA) и FC-коммутаторы, обеспечивающие в настоящее время скорость передачи 200 Мбайт/с и удаленность между соединяемыми объектами до нескольких десятков километров.
3. Систему резервного копирования и архивирования данных, предназначенную для создания резервных копий и восстановления данных. Она позволяет защитить данные от разрушения не только в случае сбоев или выхода из строя аппаратуры, но и в результате ошибок программных средств и пользователей.
4. Программное обеспечение управления хранением данных, предназначенное для решения задач управления хранением данных, например, для разметки дисковых томов или повышения производительности доступа к данным прикладного ПО. Это достигается за счет того, что встроенное в массивы программное обеспечение собирает статистику по интенсивности работы с данными и исходя из нее принимает решение о перемещении данных на диски, производительность которых соответствует скорости обращения к данным.
5. Систему управления, предназначенную для мониторинга и управления уровнем качества сервиса хранения данных. Она тесно интегрируется с системой управления вычислительным комплексом. Основой системы управления СХД являются средства управления аппаратными ресурсами сети хранения данных. Их интеграция с другими системами дает возможность контролировать ресурсы СХД и управлять ими на всех уровнях - от дисков в массиве до файловой системы сервера.
Для защиты от отказов отдельных дисков используют технологии RAID (кроме RAID-0), использующие дублирование данных, хранимых на дисках. Уровень RAID-5 хотя и не создает копий блоков данных, но все же сохраняет избыточную информацию, что тоже можно считать дублированием. Для защиты от логического разрушения данных (разрушение целостности базы данных или файловой системы), вызванного сбоями в оборудовании, ошибками в программном обеспечении или неверными действиями обслуживающего персонала, применяется резервное копирование, которое тоже является дублированием данных. Для защиты от потери данных вследствие выхода из строя устройств хранения по причине техногенной или природной катастрофы данные дублируются в резервный центр.
Отказоустойчивость доступа серверов к данным достигается дублированием путей доступа. Применительно к SAN дублирование заключается в следующем: сеть строится как две физически независимые сети, идентичные по функциональности и конфигурации. В каждый из серверов устанавливается как минимум по два адаптера FC-HBA. Первый из них подключается к одной половинке SAN, а второй - к другой. Отказ оборудования, изменение конфигурации или регламентные работы на одной из частей SAN не влияют на работу другой. В дисковом массиве отказоустойчивость доступа к данным обеспечивается дублированием RAID-контроллеров, блоков питания, интерфейсов к дискам и к серверам. Для защиты от потери данных зеркалируют участки кэш-памяти, участвующие в операции записи, а электропитание кэш-памяти резервируют батареями. Пути доступа серверов к дисковому массиву тоже дублируются. Внешние интерфейсы дискового массива подключаются к обеим половинкам SAN.
Подобные документы
Информатика - технология сбора, хранения и защиты информации. Обработка текстовой информации, специализированное и прикладное программное обеспечение. Технические средства; базы данных; автоматизированные информационные системы; антивирусные средства.
реферат [24,6 K], добавлен 09.12.2012Программное обеспечение как совокупность программ системы обработки информации и программных документов, необходимых для эксплуатации этих программ. Системное ПО (программы общего пользования), прикладное и инструментальное (системы программирования).
реферат [73,1 K], добавлен 04.06.2010Архитектура персональных компьютеров, классификация сетей (глобальные, региональные, локальные), методы доступа к передаче данных и протоколы. Динамические структуры данных; списки, их основные виды и способы реализации; технологии программирования.
шпаргалка [584,9 K], добавлен 09.03.2010Системное и прикладное программное обеспечение. Выполнение программ, хранение данных и взаимодействие пользователя с компьютером. Возможности операционных систем. Системы технического обслуживания. Системы обработки электронных таблиц и текста.
презентация [15,9 K], добавлен 06.01.2014Информатика как наука, ее функции. Виды, свойства и кодирование информации. Системы счисления. Высказывания и предикаты. Алгоритмы и их исполнители. Программное обеспечение. Языки и грамматики. Моделирование систем. Новые информационные технологии.
тест [89,0 K], добавлен 10.12.2011Основные направления информатики. Технические, программные и алгоритмические средства. Информация и единицы ее измерения. Схема устройства персонального компьютера. Аппаратная конфигурация и программное обеспечение. Локальные сети, компьютерные вирусы.
реферат [78,4 K], добавлен 16.12.2009Изучение сущности информации - сведений, знаний, которые получаются, передаются, преобразуются, регистрируются с помощью некоторых знаков. Способы передачи информации электрическими, магнитными и световыми импульсами. Программное обеспечение компьютеров.
контрольная работа [18,6 K], добавлен 27.02.2011Области исследований информатики. Схема постановки и решения предметных задач. Представление о системном подходе. Компьютеры, поколения ЭВМ, программное обеспечение. Информационные системы организационного управления. Основные тенденции развития.
шпаргалка [180,9 K], добавлен 28.06.2009Программное обеспечение по автоматизации работы автосервиса. Электронные информационные базы данных по диагностике и ремонту, геометрическим размерам автомобилей. Каталоги запчастей, справочники нормо-часов. Программы для ведения управленческого учета.
реферат [509,0 K], добавлен 23.03.2012Системное, инструментальное и прикладное программное обеспечение. Современные настольные издательские системы. Программные средства мультимедиа. Системы искусственного интеллекта. Прикладное программное обеспечение автоматизированного проектирования.
реферат [59,4 K], добавлен 18.12.2013