Автоматизация процесса распознавания объектов застроенных территорий

Задачи и содержание дешифрирования снимков застроенных территорий. Методы дешифрирования материалов аэро- и космических съемок. Классификация демаскирующих признаков. Процесс автоматизированного распознавания образов на основе нейросетевых методов.

Рубрика Геология, гидрология и геодезия
Вид дипломная работа
Язык русский
Дата добавления 15.02.2017
Размер файла 2,8 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Для опознавания объектов на снимках используют геометрические и оптические характеристики этих объектов - прямые демаскирующие признаки: фотометрические и геометрические характеристики объектов (форма, размеры объекта, цвет, яркость, рисунок и детали его поверхности); тени, дым, пыль, выброшенный грунт, следы на грунте, снеге, воде; характеристики и расположение элементов группового (сложного) объекта; расположение защищаемого объекта относительно других известных объектов.

Геометрические характеристики объектов образуют наиболее устойчивую и информативную информационную структуру, так как они присущи объекту и относятся к прямым признакам. Размеры объекта наблюдения определяются по максимальному и минимальному линейным размерам, площади и периметра проекции объекта и его тени на плоскость, перпендикулярную к линии визирования (наблюдения), высоте объекта и др.

Форма - один из основных демаскирующих признаков, в большинстве случаев является достаточным признаком для разделения объектов природного и антропогенного происхождения. Объекты, созданные человеком, как правило, отличаются правильностью конфигурации. Так, любые здания и сооружения имеют обычно правильные геометрические формы. То же можно сказать о каналах, шоссейных и железных дорогах, парках и скверах, пахотных и культурных кормовых угодьях и других объектах. Проявление определенной «геометричности» искусственных объектов наблюдается даже при преднамеренном стремлении специалистов придать проектируемым объектам свободные естественные формы 2.

На плановых снимках, полученных камерой с узкоугольным объективом, видна форма возвышающихся объектов в плане. С увеличением угла поля зрения объектива и по мере приближения изображения этих объектов к краю кадра начинает отображаться их форма по высоте. Общие очертания изображения возвышающихся объектов будут изменяться.

Форма не возвышающихся над земной поверхностью объектов, например полей пашни, изменяется в зависимости от рельефа местности (величины и направления наклона поля относительно центра проекции) и их удаленности от точки надира. На плановом снимке перспективные искажения формы объектов визуально не воспринимаются.

Размеры дешифрируемых объектов в большинстве случаев, оценивают относительно. Об относительной высоте объектов судят непосредственно по их изображению на краях снимков, полученных с помощью широкоугольных съемочных систем. О размерах, а также и о форме по высоте можно судить по падающим от объектов теням. Разумеется, площадка, на которую падает тень, должна быть горизонтальной 10.

Размеры приобретают значение основного демаскирующего признака для объектов примерно одинаковой формы.

Детали объектов, их количество, характер расположения дают представление о сложном объекте и позволяют отличить его от подобных по форме.

Тени объектов возникают в условиях прямого солнечного освещения и являются важными демаскирующими признаками. По тени легче судить о форме и высоте объекта. Некоторые объекты (например, линии электропередач, антенные мачты, ограждения и т. д.) часто распознают только по тени. Различают два вида тени: собственную, которая ложится на поверхность самого объекта в зависимости от его формы, и падающую, отбрасываемую объектом на фон или поверхность других объектов. По падающей тени можно обнаружить объект, определить его боковые размеры, высоту, а также в ряде случаев и форму.

Тон изображения является функцией яркости объекта в пределах спектральной чувствительности приемника излучений съемочной системы. Тон оценивают визуально путем отнесения его интенсивности к определенной ступени нестандартизированной ахроматической шкалы, например тон светлый, светло-серый, серый и т. д. Число ступеней определяется порогом световой чувствительности зрительного аппарата человека.

Значимость тона изображения в дешифровочном процессе довольно противоречива. С одной стороны, именно непостоянство тона формирует изображение -- изменение тона связано с изменением формы некоторого объекта, его свойств, состояния или с появлением иного объекта. При правильно выбранных спектральной чувствительности приемника излучения съемочной системы (при фотосъемке -- типа аэропленки и светофильтра) и условиях съемки на снимках хорошо разделяются по тону участки обнаженных почв с различным содержанием гумуса, локальные изменения их увлажненности, эродированности, засоленности и др 12.

С другой стороны, этот признак не обладает достаточной специфичностью и инвариантностью. Одинаковый тон могут иметь на снимке совершенно разные объекты, например поверхность водоемов и чистых сенокосов. Наряду с этим важнейший объект дешифрирования при создании кадастровых планов и карт -- пашня на снимке может изобразиться любым тоном в зависимости от ее состояния (вспаханная, боронованная, сухая, влажная и др.) и времени съемки, а также от вида культур, фазы их развития на занятых полях.

Тон изображения объектов одного класса может существенно изменяться в пределах кадра и на перекрывающихся снимках вследствие неортотропности их поверхности, различной спектральной яркости компонентов полихроматических геосистем и других факторов.

Важнейшим свойством поверхности объекта, определяющим его цвет и яркость, является коэффициент отражения поверхности на различных частотах: в видимом, инфракрасном и радиодиапазоне.

Объекты по-разному отражают падающие на них лучи света. Отражательные свойства объектов однозначно определяются спектральным или интегральным коэффициентом яркости в сочетании с индикатрисой отражения (рассеяния). Индикатриса отражения характеризует распределение отраженного излучения в пространстве.

Яркость оценивается спектральным и интегральным коэффициентами. Интегральный коэффициент яркости или просто коэффициент яркости определяется в результате усреднения коэффициентов яркости для сравнительно широкого интервала длин волн.

Графики спектральных коэффициентов яркости различных типов объектов различаются конфигурацией и положением максимума, что используется для различения объектов. Например, коэффициенты отражения растительности в инфракрасном диапазоне в несколько раз выше, чем в видимом, а коэффициенты отражения искусственных покрытий заметно не отличаются. Например, коэффициент отражения от листвы летом в ближнем инфракрасном в 3-5 выше, чем в видимом, а от бетонных и асфальтовых покрытий изменяется незначительно. Кроме того, при оценке излучений в инфракрасном диапазоне необходимо учитывать теплопроводность материалов объектов наблюдения. Нагреваясь от солнечных лучей, они к отраженному свету добавляют повышающуюся с ростом температуры долю собственных излучений. В диапазоне выше трех мкм мощность собственного теплового излучения объекта может превышать мощность отраженного им света 2.

Цвет изображения -- более информативный признак, чем тон черно-белого изображения. Хроматическая чувствительность зрительного аппарата человека, примерно на два порядка выше, чем ахроматическая. Использование псевдоцветных изображений (спектрозональных, синтезированных) существенно повышает достоверность решения некоторых дешифровочных задач за счет создания искусственных цветовых контрастов. Но одновременно в ряде случаев использование более дорогих цветных снимков не дает заметного преимущества в достоверности решения дешифровочных задач. К таким задачам можно отнести, например, дешифрирование сельскохозяйственных угодий. Цвет при их распознавании не имеет существенного значения. Необходимые топографические объекты, дешифрируемые при этом, достаточно надежно опознаются и характеризуются по черно-белым снимкам.

Рассмотренные ранее факторы, обусловливающие непостоянство тона изображения, примерно так же влияют и на изменчивость цвета изображения в полости кадра. Поэтому при решении дешифровочных задач, в которых тон или цвет изображения имеют большое значение, особое внимание должно быть обращено на некоторые параметры используемой для съемки съемочной системы.

Текстура изображения -- характер распределения оптической плотности по полю изображения объекта на снимке. Через текстуру передаются структурные особенности объекта (форма, размер и взаимное положение слагающих объект или образующих его поверхность элементов и их яркость). Например, текстура массива леса образуется изображением на снимках крон отдельных деревьев, а при высоком разрешении съемочной системы и укрупнении масштаба съемки -- изображением также элементов крон (ветвей или даже листьев); текстура чистой пашни формируется отображением пахотных борозд или отдельных комьев 10.

По мере уменьшения масштаба съемки текстура создается более крупными элементами местности, например отдельными полями пашни.

В формировании текстуры значительное значение имеют собственные и падающие тени. Текстура является признаком, производным от совокупности рассмотренных ранее признаков. Ее иногда относят к группе комплексных признаков.

При визуальном дешифрировании текстура достаточно описывается одним-двумя прилагательными, например линейчатая, губчатая, радиально-струйчатая.

Текстура относится к наиболее информативным признакам. Именно по текстуре человек безошибочно опознает леса, сады, населенные пункты и многие другие объекты. Для перечисленных объектов текстура сравнительно устойчива во времени. Текстура изображения пашни может существенно меняться в течение съемочного сезона, так как после вспашки, боронования, всходов рядовых посевов, смыкания растений, уборки урожая структура поверхности преобразуется. Кроме того, на текстуру пашни и даже таких устойчивых по структуре объектов, как леса, сады, виноградники, будет заметно влиять положение солнца в момент съемки.

В зависимости от фактуры поверхности различают направленное (зеркальное), рассеянное (диффузное) и смешанное отражение. Граница между ними условная и определяется соотношением величин неровностей поверхности и длины падающей волны. Поверхность считается зеркальной, если отношение среднеквадратичное значение высоты неровностей h к длине волны менее единицы, шероховатой, если более двух. Следовательно, шероховатая поверхность в видимом свете может в ИК-диапазоне выглядеть как зеркальная. Диффузное отражение присуще мелкоструктурным элементам, таким как песок, свежевыпавший снег. Большинство объектов земной поверхности имеют смешанную индикатрису отражения, которая мало отличается от диффузной.

Любые тела излучают электромагнитные волны в широком диапазоне частот. В ближней (0.75 - 1.3 мкм) и средней (1.2 - 3.0 мкм) зонах ИК-излучения мощность теплового (собственного) излучения объектов значительно меньше мощности отраженного от объекта потока солнечной энергии. С переходом в длинноволновую область ИК-диапазона мощность собственного излучения объектов становится соизмеримой с мощностью отраженной солнечной энергии. Чем выше температура тела, тем больше излучаемая энергия, а ее максимум смещается в сторону более коротких волн. Поэтому нагретые тела с помощью соответствующих приборов могут наблюдаться в полной, с точки зрения человека-наблюдателя, темноте, как в инфракрасном, так и радиодиапазонах. В связи с этими свойствами в инфракрасном диапазоне появляется дополнительный признак - температура различных участков поверхности объекта по отношению к температуре фона 10.

Зрительный анализатор человека не воспринимает лучи в инфракрасном диапазоне. Поэтому видовые демаскирующие признаки в этом диапазоне добываются с помощью специальных приборов (ночного видения, тепловизоров), имеющих худшее разрешение, чем глаз человека. Кроме того, видимое изображение на экранах этих приборов одноцветное. Но изображение в инфракрасном диапазоне может быть получено при малой освещенности объекта или даже в полной темноте. В этом случае к демаскирующим признакам добавляются признаки, характеризующие температуру поверхности объекта. В общем случае к демаскирующим признакам объекта в ИК-диапазоне относятся следующие: фотометрические и геометрические характеристики внешнего вида объекта (форма, размеры, яркость, детали); температура поверхности.

Максимальное количество признаков внешнего вида объекта обеспечивают в видимом оптическом диапазоне фотоприемники с высоким разрешением, к которым в первую очередь относится глаз человека. В инфракрасном диапазоне количество и качество признаков уменьшается. Отсутствует такой информативный признак как цвет. С увеличением длины волны ухудшается разрешение характеристик признака, например, точность оценки размеров объекта и его деталей. Однако в инфракрасном и радиодиапазонах проявляются дополнительные признаки, которые в видимом диапазоне отсутствуют 10.

Таким образом, видовые демаскирующие признаки объектов и окружающей среды (фона) образуют признаковые структуры, отличающиеся в различных диапазонах длин электромагнитной волны. Эти свойства видовых демаскирующих признаков используются при комплексном добывании информации об объектах.

Во многих случаях прямые признаки не могут обеспечить достаточную достоверность результатов дешифрирования. Уровень достоверности может быть повышен за счет привлечения к анализу дополнительной информации -- путем использования, например, известных взаимосвязей и взаимообусловленностей элементов ландшафта. Эти признаки принято называть косвенными. Их можно разделить на три основные группы: природные, антропогенные и природно-антропогенные.

Природные косвенные признаки выражают взаимосвязи и взаимообусловленности естественных объектов и явлений. Их называют также ландшафтными. Такими признаками могут быть, например, зависимость вида естественного травяного покрова от типа почвы, ее засоленности, кислотности и увлажненности или связь рельефа с геологическим строением местности и их совместная роль в почвообразовательном процессе. В некоторых случаях по косвенным признакам дешифрируют объекты, вообще не изобразившиеся на снимках, например, по изобразившимся растениям ведут разведку залежей грунтовых вод в аридной зоне, полезных ископаемых.

Объекты, с помощью которых ведется поиск и определение характеристик не дешифрирующихся напрямую объектов, называют индикаторами, а дешифрирование индикационным. Такое дешифрирование может быть многоэтапным, когда непосредственные индикаторы опознаются с помощью вспомогательных индикаторов

С помощью антропогенных косвенных признаков опознают объекты, созданные человеком. При этом используют функциональные связи между объектами, их положение в общем комплексе сооружений, зональную специфику организации территорий, коммуникационное обеспечение объектов и др. Например, животноводческая ферма сельскохозяйственного предприятия может быть опознана по совокупности основных и вспомогательных построек, внутренней планировке территории, интенсивно выбитым прогонам, положению дешифрируемого комплекса относительно жилой зоны, характеру обслуживающей дорожной сети. Каждое из сооружений комплекса отдельно, вне связи с прочими, не дешифрируется.

К природно-антропогенным косвенным признакам относятся: зависимость хозяйственной деятельности человека от определенных условий, проявление свойств природных объектов в деятельности человека и др. Например, по размещению некоторых видов культур можно составить суждение о свойствах почв, их увлажненности; по изменению влажности поверхности и соответствующему изменению мощности травостоя, по регулярно расположенным линиям дешифрируют элементы закрытой осушительной системы.

Сигнальные демаскирующие признаки. Понятие «сигнал» достаточно емкое и в общем случае обозначает условный знак для передачи на расстояние каких-нибудь сведений или сообщений. В данных материалах под сигналом понимается носитель в виде поля или потока микрочастиц (электронов) с конфиденциальной информацией. Состав естественных и искусственных сигналов многообразен. К ним относятся собственные (обусловленные тепловым движением электронов, световые, радиоактивные) излучения объектов, отраженные от объектов поля и излучения, а также разнообразные созданные человеком источники электромагнитных излучений (радио и электрические устройства, приборы, средства). Последние могут рассматриваться как самостоятельные объекты защиты, например радиостанции, так и входить в состав других объектов.

Демаскирующими признаками сигналов различной физической природы являются формы движения материи (движение элементарных частиц и полей (акустического, электрического, магнитного, электромагнитного), изменения в структуре макроскопических тел, вызванных колебаниями вибрацией). Вид информации, содержащейся в сигнале, изменяет его демаскирующие признаки: форму, ширину спектра, частотный и динамический диапазон. Например, стандартный речевой сигнал, передаваемый по телефонной линии, имеет ширину спектра 300 - 3400 Гц, звуковой - 16 - 20000 Гц, телевизионный - 8 МГц и т. д.

Статистические характеристики проявления сигналов во времени могут представлять собой достаточно информативные демаскирующие признаки источников, прежде всего, об их принадлежности и режимах функционирования.

Можно сделать вывод о том, что демаскирующие признаки обычно используют совокупно, без разделения их на какие-либо группы. Изображение на дешифрируемом участке воспринимается человеком как единое целое -- модель местности. На основе результатов анализа модели создается предварительная гипотеза о сути объекта (явления). Правильность подтверждается или отвергается (иногда многократно) с помощью дополнительных признаков.

Следует отметить, что с уменьшением масштаба дешифрируемых материалов в силу естественной оптической генерализации изображенных на них природных объектов и явлений уменьшается значение прямых демаскирующих признаков и возрастает значение косвенных.

2.3 Объекты дешифрирования застроенных территорий и их демаскирующие признаки

Дешифрирование снимков застроенных территорий -- процесс обнаружения, распознавания и изображения в специальных условных знаках видимых объектов города (построек, земельных угодий, водных объектов, зеленых насаждений) [5].

В границах сельских населенных пунктов и городов подлежат дешифрированию следующие объекты:

- строения, здания и сооружения;

- улицы, площади, проспекты, дороги, проезды, переулки, парки, лесопарки, бульвары, скверы, набережные, пляжи и др.;

- земли под промышленной, коммунальной и складской застройкой; транспорта, связи, инженерных коммуникаций (железные и автомобильные дороги, речной транспорт; земли под трубопроводами, линиями электропередач, под сооружениями радиовещания и телевидения и т. д.);

- земли природно-заповедного, природоохранного, оздоровительного, рекреационного и историко-культурного назначения;

- земли водного фонда (занятые водными объектами: реками, озерами, водохранилищами, водоохранными зонами, гидротехническими и водохозяйственными сооружениями и другими водными объектами);

- земли сельскохозяйственного назначения (сельскохозяйственные угодья, земли акционерных и фермерских хозяйств, колхозов, муниципальных и подсобных хозяйств, земли под коллективными садами и огородами и т. п.); запаса;

- земли военных объектов, режимных зон и иные земли; прочие земли (карьеры, копаные места, каменистые территории и т. п.).

Классификатор объектов может быть расширен или уменьшен в зависимости от поставленной задачи (Приложение В).

Дешифрирование снимков выполняется по прямым и косвенным демаскирующим признакам и, как правило, с привлечением дополнительных картографических материалов.

При дешифрировании снимков сверхвысокого разрешения, которым присуща большая детализация изображения, может эффективно использоваться визуальное дешифрирование по эталонам, когда для успешного решения задач дешифрирования используют тестовые фрагменты снимков, на которых показан пример изображения определенного объекта 5.

Здания и сооружения отличаются геометрически правильной формой. Здания отображаются различными оттенками -- от серого до почти белого тона. На панхроматических снимках сверхвысокого разрешения можно выделить четко определенную квартальную структуру, т.е. массивы строений, расположенные определенным образом и разделенные полотнами улиц и дорог различного ранга. Кварталы образуют ячеистую правильную структуру. Форма зданий -- геометрически правильная, различная, в зависимости от типа домов. Для некоторых домов можно определить этажность и количество подъездов. Возле многих домов видны гаражи-ракушки и просто гаражи. Возле многих строений видны участки зеленых насаждений -- пятна с неровными краями. Строящиеся здания отличаются более серым тоном и меньшей контрастностью изображения.

Рисунок 6 - Вид зданий на космическом снимке

Фонтаны распознаются по форме и структуре, содержащей водные объекты и инженерные конструкции. Церкви распознаются по структурным признакам -- основное здание характерной формы, наличие двора и вспомогательных сооружений.

Кладбища могут быть определены по правильной форме, наличию четко выраженных границ и главного входа. В ряде случаев этих признаков бывает недостаточно и для идентификации объекта, как кладбище, необходимо привлечение дополнительной информации рисунок.

Дешифрирование водных станций и лодочных пристаней не вызывает затруднений. Они уверенно дешифрируются по характерной структуре и приуроченности к водным объектам 1.

Рисунок 7 - Вид реки на космическом снимке

Оборудованные пляжи распознаются по тону -- от светло-серого до белого, приуроченности к водным объектам и четким контурам границ.

Водоочистные сооружения уверенно распознаются по геометрически правильной круглой форме, темному тону водной поверхности и характерной структуре.

Трубы дымоходные котельных установок дешифрируются по форме и наличию падающей тени. Здания фабрик, заводов отображаются различными оттенками серого тона. Характеризуются геометрически правильной прямоугольной формой.

Промышленные сооружения отличаются от жилых зданий более крупными размерами.

Основными демаскирующими признаками бензоколонок являются приуроченность к автомобильным дорогам и характерная структура (техническое здание, заправочная площадка, подъездные пути). Теплофикационные трубопроводы наземные на опорах на снимках отображаются в виде светлых прямых линий с характерными прямоугольными изломами.

ЛЭП на незастроенных территориях определяются по полосам отчуждения в виде прямых линий с резкими поворотами. Трубопроводы над железными дорогами представляют собой светлые прямые линии, приуроченные к железным дорогам.

Рисунок 8 - Вид ЛЭП на космическом снимке

Основным демаскирующим признаком оранжерей и теплиц является четко просматриваемая на снимках линейная структура (текстура объекта).

Огороды дешифрируются по геометрически правильной прямоугольной форме и четким очертаниям границ. Отличаются от пашен более маленькими размерами.

Пашни определяются по геометрически правильной форме, линейной текстуре и приуроченности к автомобильным дорогам. Основным демаскирующим признаком фруктовых садов является структура объекта-- упорядоченное расположение деревьев, наличие троп.

Рисунок 9 - Вид пашен на космическом снимке

Железные дороги дешифрируются по форме -- широкие серые линии без резких поворотов (рис. 10).

Рисунок 10- Вид железных дорог на космическом снимке

По снимкам сверхвысокого разрешения можно выявить различные классы автомобильных дорог: улицы; шоссе; автострады; проселочные (грунтовые) дороги; тропинки. Автомобильные дороги представляют собой протяженные линейные объекты. Они имеют различную толщину и отображаются различными оттенками -- от темно-серого до почти белого цвета, в зависимости от типа дороги.

Форма дорог -- прямолинейные объекты со сглаженными, плавными, округлыми поворотами. На снимках сверхвысокого разрешения хорошо видны развязки дорог, разворотные круги.

Шоссе -- это широкие протяженные линии. Автострады отличаются от шоссе большей толщиной. На них видны более темные иногда более светлые, чем сами автострады линии разделительной полосы.

Грунтовые дороги -- тонкие, достаточно извилистые линии светло-серого тона, приуроченные к незастроенным территориям (полям, пустырям и т.д.). Улицы отличаются прежде всего приуроченностью к массивам сооружений. Тропинки -- тонкие извилистые линии: как правило, более светлого тона, чем фон 5 (рис 11).

Рисунок 11- Вид улиц и тропинок на космическом снимке

На дорогах хорошо виден автомобильный транспорт. Основные дороги делят местность на различные области кварталов и растительности.

Основными демаскирующими признаками инженерных и спортивных сооружений являются форма и структура объекта

Объекты гидрографии на панхроматических снимках характеризуются достаточно четкими очертаниями границ. Тон изображения водоемов определяется оптическими условиями съемки, глубиной водоема, цветом его дна, прозрачностью воды, волнением и водной растительностью. Глубоководные водоемы с темным грунтом дна имеют темный тон изображения. Мелководные объекты со светлым дном имеют более светлый тон. Мутность и волнение воды приводят к более светлому тону. Водохранилища и пруды отличают по перегораживающим русла плотинам, подходящим каналам.

На снимках сверхвысокого разрешения дешифрируются основные жизненные формы растительности: древесная, кустарниковая, полукустарниковая, кустарничковая, травянистая, степная, моховая и лишайниковая.

Тон или цвет изображения леса зависят от его видового состава и тона подстилающей поверхности, просвечивающей сквозь кроны. Хвойные леса характеризуются более темными тонами, чем лиственные и лиственничные. Сухостойные леса отличаются светлым тоном и тенями от отдельных деревьев. Вырубленные леса имеют геометрически правильные контуры.

Кустарниковая растительность определяется в основном по косвенным признакам, связанным с особенностями произрастания, размещения, расселения на конкретной территории 9.

Важное значение при дешифрировании растительности имеет расположение в рельефе. Именно этот признак часто позволяет разграничить разные виды, изображающиеся на снимке одинаковым тоном. Зоны древесной растительности занимают сравнительно большие по площади территории. Они имеют пятнистую текстуру и отображаются достаточно темным цветом. Редколесья отображаются серым тоном с пятнами деревьев более темного серого тона, которые имеют разный размер и расположены нерегулярно.

Молодые леса (поросль) выделяются меньшей зернистостью изображения, чем зрелые, меньшей высотой, ровным пологом. Их правильные контуры часто повторяют границы вырубок. Посадки леса размещаются правильными рядами с четкими геометрической формы границами. Лесные питомники внешне похожи на пашни и огороды; размещаются, как правило, вблизи дома лесника (видны постройки) 2.

Пустыри имеют равномерную однородную текстуру серого тона. Цвет фона пустырей отличается по густоте тона на различных участках отображаемой на снимке территории.

Таким образом, основными объектами при решении задач дешифрирования застроенных территорий являются: здания, строения, сооружения, земельные участки, улицы, площади, проспекты, дороги, инженерные коммуникации, водные объекты, земли сельскохозяйственного назначения и использования, земли военных объектов, режимных зон и иные земли. Информация о данных объектах может быть получена на основе регистрации видовых, сигнальных, вещественных, именных, прямых и косвенных признаков. Наибольшей информативностью обладают именные признаки объекта, однако получение данных признаков требует создания специализированных средств и приводит к необходимости использования большого количества регистрационной аппаратуры, так как именные признаки для объектов дешифрирования разнообразны.

С целью получения необходимой информации об объектах наиболее целесообразным способом является регистрация и комплексная обработка прямых и косвенных демаскирующих признаков.

3. Автоматизация процесса распознавания объектов застроенных территорий

3.1 Перспективы автоматизации процесса дешифрирования

Существующие на рынке геоинформационных технологий современные решения по автоматизированному дешифрированию ДДЗ и подготовке геопространственных данных для геоинформационного картографирования, как правило, используют алгоритмы высокой степени автоматизации, основанные на объектно-ориентированном подходе при выполнении классификации.

Возможности выбора и получения нужных для решения текущей задачи данных дистанционного зондирования достаточно широки, и пользователям этой информации необходимо выбрать программное обеспечение, которое позволит быстро и с наименьшими производственными затратами эти данные обработать и получить итоговый результат в виде карты, трёхмерного представления или геопространственной информации, хранимой в базе геоданных.

При использовании данных дистанционного зондирования для создания и обновления картографического материала, помимо базовых процессов подготовки данных (таких как геометрическая и радиометрическая коррекция), наибольшую роль играет дешифрирование, или классификация.

Ведущие поставщики программного обеспечения для обработки ДДЗ десятилетиями развивали инструменты классификации растров, переводящие спектральную информацию в тематическую и создающие тематические изображения, в которых значение пиксела отображает его принадлежность к определённому классу. В последние годы наметилась тенденция к созданию программных продуктов, осуществляющих не только дешифрирование, но и перевод итоговой информации в векторную форму для более лёгкой интеграции этих данных в ГИС. При этом основной тенденцией является стремление к минимальному вмешательству пользователя в процесс классификации, т.е. достижение высокой степени автоматизации процесса.

Одним из пионеров в этой области был немецкий концерн Definiens, чьи программные продукты серии eCognition завоевали определённую популярность у специалистов в конце девяностых годов прошлого века. Однако подобные решения уже не являются чем-то уникальным, так как через несколько лет после eCognition американская компания Visual Learning Systems выпустила на рынок программные продукты Feature Analyst и Lidar Analyst, удачно интегрировав их в оболочки популярных программ для обработки ДДЗ и ГИС: ArcGIS, ERDAS IMAGINE, SOCET SET и GeoMedia. В 2008 году два других ключевых игрока рынка продемонстрировали свои инструменты для автоматизированного дешифрирования данных спутниковой съёмки: это корпорация ERDAS, выпустившая модуль для объектно-ориентированного дешифрирования - Imagine Objective для ERDAS IMAGINE 9.3, и компания ITT, разработавшая первую версию модуля ENVI Fx 4.5.

Все перечисленные программные продукты выполняют сходные задачи по автоматизированному дешифрированию определённых пользователем объектов по космическим снимкам и получению готовых к использованию в ГИС слоёв геопространственных данных. Благодаря высокой степени автоматизации процессов в вышеперечисленных программных продуктах (это особенно касается Feature Analyst и Imagine Objective), они могут быть использованы как неотъемлемая часть процесса создания и обновления карт с использованием ДДЗ, помогая достичь высокой оперативности в получении итоговой информации в форме цифрового картографического материала.

На современном этапе ведутся разработки по автоматизации дешифрирования в направлениях:

а) отбора аэроснимков, обладающих нужной информацией, и преобразования их с целью улучшения изображения изучаемых объектов, для чего используются методы оптической, фотографической и электронной фильтрации, голографии, лазерного сканирования и др.;

б) распознавания объектов сопоставлением при помощи ЭВМ закодированных формы, размеров данного изображения и плотности фототона данного изображения и эталонного, что может быть эффективным только при стандартизованных условиях аэросъемки и обработки снимков.

В связи с этим ближайшие перспективы автоматизации дешифрирования связывают с применением так называемой многоканальной аэросъемки, позволяющей получать синхронные изображения местности в различных зонах спектра.

В настоящее время разработано большое число алгоритмов автоматизированного дешифрирования (классификации космических снимков), под которым понимается процесс разбиения пикселов изображения на классы, т.е. на однородные по некоторому критерию области [15]. Первичным признаком при классификации объектов космических снимков служит яркость пикселов в различных спектральных диапазонах съемки. В качестве вторичных признаков используется характерный размер, форма и текстура объектов. Полученное изображение называется тематической картой, на которой каждому цвету соответствует определенный класс объектов [16].

Современный эксперт в области дешифрирования космических снимков имеет возможность выбирать себе подходящее программное решение в зависимости от того, в какой ГИС он будет создавать карты на основе полученного материала, а также от системы обработки ДДЗ, в которой он выполняет предварительную подготовку данных и анализирует результаты дешифрирования, выполненного модулем, от объёма задач (предусматривающих несложную классификацию единичных растров или потоковую обработку терабайтов информации), и многих других факторов. В некоторых случаях модули автоматизированной классификации позволяют существенно сократить трудовые затраты на производство картографической продукции, внедрив в процесс компьютерное дешифрирование космических снимков.

3.2 Методы автоматизированного дешифрирования

Использование многозональных снимков для распознавания объектов основано на различиях в их спектральной отражательной способности, следствием которых являются не одинаковые яркостные характеристики на зональных снимках.

Модуль Feature Analyst содержит набор инструментов, позволяющих автоматизировать процесс выделения двухмерных и трёхмерных объектов, таких как дороги, здания, водные объекты, растительность, проницаемые/непроницаемые покровы, а также разделённые по типу землепользования объекты.

Алгоритм классификации использует как множественные пространственные признаки (размер, форма, текстура, структура, пространственные связи, тени и пр.), так и спектральные особенности стереоскопических или моноскопических изображений.

На выходе пользователь получает векторный файл в формате ESRI Shape, который он может тут же использовать в ГИС, так как Feature Analyst полностью интегрирован в программную среду ArcGIS (рис. 12).

Можно отметить несколько ключевых особенностей Feature Analyst, таких как: инструмент Learning Explorer для объектно-ориентированного выделения информации с использованием алгоритмов обучения, система иерархического обучения для выделения определённых типов объектов на снимках территорий с высокой степенью неоднородности ландшафтов, технология Software Agent, включающая возможность выделять как мелкие объекты (автомобили, самолёты), так и крупные объекты (границы типов землепользования, ареалы распространения растений), а также группу алгоритмов для пост-классификационного редактирования.

Эти инструменты и алгоритмы дают возможность «очистить» результаты классификации еще до её начала, на стадии обучения алгоритма. Пользователь также получает доступ к инструментам оценки изменений объектов, при условии использования в анализе разновременных снимков на одну и ту же территорию. Не менее интересны инструменты выделения трёхмерных объектов, позволяющие осуществить выделение объектов на основе данных лазерного сканирования или ЦМР, и группа инструментов классификации, которые позволяют проводить классификацию в режиме пакетной обработки.

Рисунок 12 - Пример выполнения автоматического выделения лесной растительности по панхроматическому снимку в модуле Feature Analyst под ArcGIS 9.3.

В 2012 году компания ERDAS объединила свой опыт и опыт своих конкурентов и выпустила на рынок модуль для объектно-ориентированной классификации - Imagine Objective, работающий в среде ERDAS IMAGINE 9.2 и 9.3.

Модуль IMAGINE Objective содержит набор инновационных инструментов для векторизации, выявления изменений по разновременным данным, а также создания и поддержания в актуальном состоянии геопространственной информации, полученной с помощью космических и аэроснимков (рис. 12).

Компания ERDAS разработала и запатентовала механизм классификации, комбинирующий методы работы искусственного интеллекта, компьютерных алгоритмов и традиционных методов обработки ДДЗ.

Работа модуля сводится не только к оконтуриванию растровых объектов, но также и к многоуровневой векторизации, созданию пространственно-целостного результата и точному отображению реальной формы каждого существующего объекта.

Из ключевых особенностей модуля можно выделить возможность использования настраиваемых и надстраиваемых моделей дешифрирования определённых типов объектов, возможность очень тонкой настройки классификатора для получения адекватных результатов и, безусловно, объектно-ориентированный подход, означающий, что, помимо спектральных характеристик объектов, при классификации также используются и их пространственные свойства.

IMAGINE Objective также позволяет провести дискретное выделение объектов и включение различных алгоритмов фильтрации в процесс дешифрирования, чтобы на выходе получать готовые к использованию в ГИС слои с геопространственной информацией.

Полная интеграция в рабочую среду ERDAS IMAGINE предоставляет готовое решение для сложной объектно-ориентированной классификации в рамках единого программно-аппаратного комплекса. При этом для вспомогательных слоёв может привлекаться дополнительная информация, например, карты уклонов, экспозиции, данные лазерной съёмки, текстуры для объектов и пр., наряду с элементами объектно-ориентированного подхода, учитывающего метрику, близость, связность и прочие пространственные характеристики объектов.

Компания Definiens специализируется на разработке алгоритмов анализа изображений с использованием своей патентованной технологии Definiens Cognition Network Technology. Эта технология реализует объектно-ориентированную методику распознавания изображений, во многом имитирующую человеческое восприятие. Эта технология эффективна в анализе любых изображений: черно-белых и цветных, качественных и зашумленных, простых, как детский рисунок, и сложных, как космический снимок (рис. 13).

Рисунок 13 - Выполнение автоматизированной классификации растительного покрова в модуле IMAGINE Objective

Анализ цифрового снимка осуществляется построчно, предварительно задаются значения пороговой величины, т.е. предельного расстояния от пиксела до центра кластера, и среднего квадратического отклонения.

В качестве центра первого кластера выбирается первый элемент строки. Далее последовательно вычисляется евклидово расстояние от этого центра до следующего пиксела в строке.

Это расстояние сравнивается с выбранным порогом. Если расстояние от анализируемого пиксела до центра первого кластера меньше порогового значения, то пиксел относится к сформированному кластеру, центр которого перевычисляется, т.е. вычисляется среднее из двух значений. В противном случае формируется новый кластер, а второй пиксел становится его центром. Аналогично рассматривается каждый следующий пиксел в строке.

Рисунок 14 - Выделение зданий по космическому снимку в программной среде Definiens

После просмотра всей первой строки выполняется анализ следующей. На изображении, полученном в результате кластеризации, количество выделенных кластеров зависит от выбора порогового значения: чем оно меньше, тем больше кластеров будет образовано [17].

Часто неконтролируемая классификация выполняется в два этапа: на первом используется алгоритм быстрого выделения кластеров, а на втором -- итерационный алгоритм последовательной кластеризации. В отличие от первого алгоритма он требует задания числа кластеров, значений их центров или числа итераций. Первый шаг работы алгоритма заключается в отнесении пикселов изображения к одному из кластеров. В качестве критерия может быть взято минимальное расстояние до центра кластера. Вторым шагом является вычисление нового положения центра кластера с учетом отнесенных к нему пикселов. Задача считается решенной, если вычисленные координаты центров совпадут с заданными. В противном случае выполняется вторая итерация и снова вычисляется положение центров кластеров. Критериями качества кластеризации служат значения среднеквадратических отклонений расстояния от центра кластера до каждой включенной в него точки и сумма этих отклонений для всех кластеров. Процесс продолжается до достижения заданных значений числа кластеров или среднеквадратического отклонения или до выполнения заданного числа итераций [17].

Смысл контролируемой классификации заключается в отнесении каждого из пикселов снимка к определенному классу объектов на местности, которому соответствует некоторая область в пространстве признаков. Независимо от того, какой способ выбран для решения этой задачи, контролируемая классификация включает несколько этапов.

Первый этап заключается в определении, какие классы объектов будут выделены в результате выполнения всей процедуры. Это могут быть виды растительности, сельскохозяйственные культуры, породы леса, гидрографические объекты и т.д.

На втором этапе для каждого из классов объектов выбираются типичные для него пикселы, т.е. формируется обучающая выборка. Обязательным условием выполнения этой процедуры является наличие на снимке эталонов, т.е. фрагментов изображения, однозначно относящихся к своему классу объектов. Процедура создания обучающей выборки реализуется выбором в пределах изображения эталонного объекта участков в несколько пикселов. По отношению к целому снимку обучающая выборка должна составлять 1-5% всех пикселов, а количество пикселов, относящихся к одному классу, достаточно большим (обычно не меньше 20--30).

Третий этап -- вычисление параметров, «спектрального образа» каждого из классов, сформированного в результате набора эталонных пикселов. Набор параметров зависит от алгоритма, который предполагается использовать для классификации[17].

При разработке алгоритмов контролируемой классификации используются два подхода: детерминированный и статистический.

Детерминированный подход применяется, когда классы объектов не пересекаются в пространстве признаков. Однако, природные объекты, как правило, неоднородны, а спектральные характеристики изучаемых объектов довольно близки и частично пересекаются (например, разных видов растительного покрова или почв). Поэтому широкое распространение получили методы классификации, основанные на статистическом подходе, которые позволяют учитывать вариации признаков и допускают отнесение пикселов к «чужим» классам, если частота их появления относительно мала.

Метод классификации по минимальному расстоянию - один из методов классификации, основанный на детерминированном подходе. Смысл метода заключается в отнесении пиксела к тому эталонному классу, евклидово расстояние до центра которого в пространстве признаков минимально. Этот способ целесообразно использовать при ограниченном числе классов в обучающей выборке.

Метод параллелепипедов заключается в отнесении пикселов изображения к эталонным классам. В качестве эталонных характеристик классов задаются некоторые интервалы значений яркости. Они выбираются в результате анализа гистограммы распределения яркости на изображении. В пространстве признаков интервалы значений яркости определяют замкнутую область, которая в зависимости от размерности поля признаков может иметь форму параллелограмма, параллелепипеда или гиперпараллелепипеда для четырех и более зон.

Метод максимального правдоподобия основан на статистическом подходе. Смысл этого метода сводится к определению вероятности попадания пиксела в тот или иной класс. В общем случае вероятностное распределение спектральных признаков, которыми характеризуется каждый класс, определяет возможность нахождения пиксела в любом месте пространства признаков. Но в обучающей выборке распределение значений яркости подчинено нормальному закону, поэтому вероятность быть отнесенными к «чужому» классу имеют не многие значения. Область признаков каждого класса в многомерном пространстве имеет форму эллипса (точнее, гиперэллипса), относительные размеры и ориентация которого характеризует распределение вероятности и определяется ковариационной матрицей. Среднее значение яркости этого класса в каждой из съемочных зон, т.е. центр класса, определяет положение эллипса в пространстве признаков. Следовательно, по обучающей выборке необходимо вычислить элементы ковариационной матрицы и центр каждого из классов, а затем проанализировать положение пикселов изображения.

В качестве критерия отнесения пиксела к данному классу используется значение расстояния Махаланобиса, зависящее от вектора средних значений яркости (положения центра) и ковариационной матрицы класса. Это расстояние сопоставляется с величиной порога, задаваемого исполнителем.

Отличительная особенность классификации по методу максимального правдоподобия заключается в том, что все пикселы относятся к тому или иному классу; отсутствуют неклассифицированные пикселы, что характерно для этого алгоритма, как и для алгоритма минимального расстояния.

Четвертый этап процедуры классификации -- просмотр всего изображения и отнесение каждого пиксела к тому или иному классу. Результатом этого этапа является изображение, часто не вполне обоснованно называемое «картой классификации», а также таблица, в которой даны координаты пиксела и имя класса, к которому он отнесен [17].

Одной из перспективных возможностей изменения ситуации в области автоматизированного дешифрирования является разработка и внедрение технических и программно-технологических средств, основанных на использовании нейросетевых методов. Эти методы обеспечивают:

- выполнение операций над целыми образами (например, над фрагментами изображений);

- ассоциативный поиск информации; возможность нейрокомпьютера;

- преимущественное использование логико-лингвистических моделей при формализации информации;

- отсутствие необходимости внешнего программирования;

- параллельный ввод и параллельную обработку информации.

3.3 Процесс автоматизированного распознавания образов на основе нейросетевых методов

Получение информации о топографических объектах по материалам космических съемок выполняется на этапе дешифрирования снимков.

Традиционные методы автоматизированного дешифрирования позволяют повысить полноту дешифрирования изображений топографических объектов на 10-15% по сравнению с визуальными методами.

Низкая полнота автоматизированного дешифрирования вызвана многообразием топографических объектов, изменениями их отражательной способности, вызванными нестабильностью условий съемки и обработки исходных изображений, а также преобладанием в технологии дешифрирования снимков визуальных способов классификации и оконтуривания объектов [15].

Повысить полноту дешифрирования изображений топографических объектов, снизить временные затраты на дешифрирование позволит использование нейросетевых методов.

Искусственные нейронные сети представляют собой набор математических и алгоритмических методов для решения широкого круга задач [18].

В основу известных искусственных нейросетей положены следующие принципы работы нейронов человеческого мозга:

- простота обрабатывающего элемента -нейрона;

- использование в обработке информации большого числа нейронов;

- глобальность связей (связь одного нейрона с большим числом других);

- возможность изменения весов связей между нейронами;

- параллельность обработки информации.

Широкую популярность искусственные нейронные сети приобрели благодаря способности сравнительно легко адаптироваться к требованиям различных практических приложений. Они реализуют одну из парадигм искусственного интеллекта - коннекционистскую, когда возможности сети полностью определяются ее топологией, а вместо характерного для традиционных электронно-вычислительных машин программирования используется обучение нейронной сети, сводящееся к настройке весовых коэффициентов межнейронных связей с целью оптимизации заданного критерия качества функционирования сети.

Присущие искусственным нейронным сетям нелинейность, адаптивность, потенциальная отказоустойчивость делают их универсальным средством обработки информации, особенно эффективным при решении трудноформализуемых задач распознавания образов, построения ассоциативной памяти, динамического управления и т.п. [18]

Существуют два подхода к созданию искусственных нейронных сетей - информационный и биологический.

В первом безразлично, какие механизмы лежат в основе функционирования искусственных нейронных сетей, достаточно, чтобы процессы обработки информации были аналогичны биологическим, во втором важно полное биоподобие, но в любом варианте необходимо детальное изучение работы биологических нервных клеток и сетей с точки зрения химии, физики, теории информации и синергетики.

С точки зрения обработки информации каждый нейрон можно считать своеобразным процессором, который суммирует с соответствующими весами сигналы от других нейронов, выполняет нелинейную обработку полученной суммы и формирует результирующий сигнал для передачи связанным с ним нейронам.

На основе принципов функционирования биологических нейронов были созданы различные математические модели. Основу большинства таких моделей составляет структура формального нейрона МакКаллока-Питтса (1943 г.), представленная на рис. 3.4, где компоненты входного вектора (х1, х2, …, хN) суммируются с учетом весов wij и сравниваются с пороговым значением wi0. Выходной сигнал формального нейрона yi определяется как

(1)

где в общем случае нелинейная функция преобразования f(ui) называется функцией активации.

Функция активации формального нейрона - это пороговая функция вида

(2)

хотя в принципе набор используемых в моделях нейронов f(u) достаточно разнообразен (табл. 1), поскольку их свойства, особенно непрерывность, оказывают значительное влияние на выбор способа обучения нейрона (подбор wij).

Таблица 1 - Функции активации нейронов

Название

Формула

Область значений

Линейная

(-, )

Полулинейная

(0, )

Логистическая

(сигмоидальная)

(0, 1)

Гиперболический тангенс (сигмоидальная)

(-1, 1)

Экспоненциальная

(0, )

Синусоидальная

(-1, 1)

Сигмоидальная

(рациональная)

(-1, 1)

Линейная с насыщением

(-1, 1)

Пороговая

(0, 1)

Модульная

(0, )

Сигнатурная

(-1, 1)

Квадратичная

(0, )

Наиболее распространенными функциями активации являются пороговая, линейная (в том числе с насыщением) и сигмоидальные - логистическая и гиперболический тангенс (рис. 16).


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.