Сравнительный анализ компонентов растительного покрова

Историко-методологические аспекты сравнительного анализа в экологии. Меры разнообразия и близости, используемые в сравнительном анализе компонентов растительного покрова: флоры водорослей-макрофитов; субассоциации лесов р. Амур. Биоинформационная система.

Рубрика Экология и охрана природы
Вид диссертация
Язык русский
Дата добавления 17.01.2016
Размер файла 3,2 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Содержание

экология анализ растительный покров

Введение

Глава 1. Схема анализа данных: основные методы

1.1 Историко-методологические аспекты сравнительного анализа в экологии

1.2 Выбор элементарного описания

1.3 Составление серии описаний

1.4 Меры разнообразия и близости, используемые в сравнительном анализе компонентов растительного покрова

1.4.1 Унарные индексы

1.4.1.1 Коэффициент вариации

1.4.1.2 Параметрические семейства унарных мер

1.4.1.3 Другие индексы для оценки разнообразия

1.4.2 Бинарные индексы

1.4.2.1 Множественная интерпретация

1.4.2.2 Дескриптивная интерпретация

1.4.2.3 Вероятностная интерпретация

1.4.2.4 Информационная интерпретация

1.4.3 Определение n-арных отношений

1.4.3.1 Множественная интерпретация

1.4.3.2 Дескриптивная интерпретация

1.4.3.3 Вероятностная интерпретация

1.4.3.4 Информационная интерпретация

1.4.4 Другие интерпретации мер конвергенций и их применение

1.4.5 Меры близости, не удовлетворяющие системе аксиом

1.4.6 Матрица абсолютных мер конвергенции

1.4.7 Матрица относительных несимметричных мер конвергенции

1.4.8 Матрица относительных симметричных мер конвергенции

1.4.9 Алгоритмы упорядочивания данных

1.4.9.1 Кластерный анализ

1.4.9.2 Диаграмма Чекановского

1.4.9.3 Неориентированные графы

1.4.9.4 Ориентированные графы

1.4.10 Интерпретация результатов

Глава 2. Сравнительный анализ компонентов растительного покрова

2.1 Флоры водорослей-макрофитов дальневосточного побережья России

2.2 Субассоциации лесов поймы реки Амур

2.3 Временнбя динамика сообществ водорослей-макрофитов

Глава 3. Биоинформационная система «Биоразнообразие»

3.1 Базы данных, содержащие компоненты биоразнообразия

3.2 Программы для обработки биологических данных

3.3 Информационно-справочная система по биоценометрии с комментариями

Заключение

Список литературы

ПРИЛОЖЕНИЯ

Приложение А. Математические основания теории мер близости

А.1 Аксиоматический подход к введению мер. Теория S-функций

А.1.1 Дивергенция и конвергенция

А.1.2 Метрические относительные симметричные субаддитивные функции

А.1.3 Семейство относительных мер конвергенций

А.1.4 S-функции многих переменных

А.1.5 Дивергенция и конвергенция многих переменных

А.2 Интерпретации мер конвергенции и дивергенции

А.2.1 Интерпретации направленных мер конвергенции и дивергенци

А.2.1.1 Меры включения и невключения двух множеств

А.2.1.2 Меры включения и невключения двух дескриптивных множеств (наборов)

А.2.1.3 Меры односторонней совместимости и несовместимости событий

А.2.1.4 Меры односторонней зависимости и независимости случайных величин

А.2.2 Интерпретации симметричных мер конвергенции и дивергенции

А.2.2.1 Меры сходства и различия двух множеств

А.2.2.2 Мера сходства и различия двух дескриптивных множеств

А.2.2.3 Мера совместимости и несовместимости двух событий

А.2.2.4 Меры взаимной зависимости и взаимной независимости двух случайных величин

Приложение Б. Примеры сравнительного анализа

Приложение В. Биоинформационная система «Биоразнообразие»

Введение

Актуальность темы. Начиная с XX века (особенно его второй половины), в рамках многих научных направлений, таких как сравнительная флористика, геоботаника, экология и многих других можно отметить устойчивую тенденцию активного внедрения математических методов сравнительного анализа количественных показателей (Oosting, 1953; Greig-Smith, 1957; 1964; 1983; Savage, 1960; Sokal, Sneath, 1963; Kershaw, 1964; Lambert, Dale, 1964; Williams, Dale, 1965; Грейг-Смит, 1967; Roux, Roux, 1967; Peters, 1968; Александрова, 1969; Василевич, 1969; Cancella da Fonseca, 1969; Cheetham, Hazе1, 1969; Pielou, 1969; 1975; 1977; Сёмкин, 1973 а, б; 1975; 1977; 1987 а, б; Терентьев, 1975; Goodall, 1973; Sneath, Sokal, 1973; Шмидт, 1980; Юрцев, Сёмкин, 1980; Песенко, 1982; Legendre, Legendre, 1983; Kershaw, Looney, 1985; Digby, Kempton, 1987; Magurran, 1988; 2004; Миркин, Розенберг, Наумова, 1989; Мэгарран, 1992; Уланова, 1995; Юрцев и др., 1999; Малышев, 1987; 1999; Chao et al., 2000; Koleff, Gaston, Lennon, 2003; Шитиков, Розенберг, Зинченко, 2005; Diserud, Шdegaard, 2007 и др.), компьютерных методов обработки биологической информации, создания тематических биоинформационных систем и баз данных по компонентам биоразнообразия (Сёмкин, 1994; Сёмкин и др., 1995; Сёмкин, Варченко, Орешко, 1995; Сёмкин и др., 1997; Компьютерные…, 1995; 1997; Пяк, Зверев, 1997; Зверев, 1998; Марина, Марин, 1998; Юрцев, 1998; Малышев, 2002; Крестов, 2005 и др.).

Первые попытки формализации таксономического состава сообществ (флор, фаун и др.) множествами и определение с их помощью отношений (общности, сходства, различия, включения, невключения), отдельных фракций видов (общие виды двух флор (фаун), дифференциальных видов одной флоры (фауны) относительно другой, дифференциальных видов двух флор (фаун) и т.д.) были осуществлены ещё в 70-х годах прошлого века (Тамарин, Шмидт, 1975; Сёмкин, 1977; 1983 а, б; Юрцев, Сёмкин, 1980; Юрцев, 1982; 1987; Юрцев, Камелин, 1987 а, б; 1991). Эта проблема имеет большое значение для разработки количественных показателей необходимых для сравнительного анализа таксономических (главным образом видовых) списков, а также даёт возможность строгого обоснования биологических наук в целом за счёт строгой формализации связей системы. Любая система состоит из множества элементов, объединённых соответствующими связями, которые в совокупности дают структуру системы. В экологии и других науках в настоящее время отсутствуют адекватные методики исследования структуры биологических систем, которые бы учитывали особенности естественного континуума, требования теории измерений, включали бы полный цикл исследования (от постановки цели исследования до интерпретации результатов) и др. Многие количественные и качественные показатели и методы используются специалистами вне общих методик и методологии. В данной диссертационной работе нами приведены методология и методика сравнительного анализа биологических данных, учитывающие вышеперечисленные и многие другие проблемы математизации биологических наук.

Под растительным покровом нами понимается «совокупность особей зеленых автотрофных растений, населяющих сушу и акваторию нашей планеты» (Галанин, 1991). Внимание акцентировано, главным образом, на компонентах видового разнообразия растительных сообществ (флор, фитоценозов и др.). Отметим, что рассмотренные математические методы универсальны и могут успешно использоваться для сравнения и других биологических объектов (геномов, особей, экосистем, таксонов), т.к. основаны на теории измерений и формализации мер близости в биологии.

Современный уровень развития информационных технологий позволяет реализовать практически любой алгоритм, представленный с помощью математических методов. Сотрудничество биологии и математических методов в своё время породило биометрию, биоматематику, биоценометрию и другие аналогичные направления (Трасс, 1971 : 208), а на современном этапе - биоинформатику. У этого научного направления довольно широкая область применения, включающая математическое и компьютерное моделирование живых систем, включая экосистемы, и эволюционных процессов в живой природе, распознавание и синтез изображений в биологических и медицинских исследованиях; развитие бионических подходов; создание информационных систем и баз биологических данных; интеллектуальные системы анализа и прогнозирования свойств биологических объектов и др.

Цель исследования. Цель данного исследования - развитие общего подхода в исследованиях структурной организации растительного покрова с использованием биоинформационных технологий.

Задачи исследования:

1. Оптимизировать методику схемно-целевого подхода к сравнению компонентов растительного покрова и адаптировать её для программной реализации посредством создания биоинформационной системы «Биоразнообразие»;

2. На основе рассматриваемой методики получить новые результаты ботанического районирования дальневосточных альгофлор, выделения оригинальных флор, оценки антропогенного воздействия на флору, количественно подтвердить характер распределения субассоциаций вдоль градиента увлажненности почв, провести анализ временнуй структуры таксоцена.

Защищаемые положения:

1. Решена проблема выбора показателя для сравнения различных биологических спектров (нормированных дескриптивных наборов), разновеликих и равновеликих по числу признаков биологических объектов (ненормированных дескриптивных наборов);

2. Схемно-целевой подход позволяет обеспечить более точные интерпретации при исследовании структуры сообщества или отдельных таксоценов.

Научная новизна. Предложена современная методика сравнительного анализа видового состава компонентов растительного покрова в рамках схемно-целевого подхода: от постановки цели до интерпретации. На основе аксиоматического подхода и формализации отношений между объектами в виде аналитических интерпретаций осуществлена ревизия существующих мер близости, которые используются в биологических и смежных науках, описаны основные классы мер, которые позволяют упорядочить большинство известных мер близости и на этой основе решена проблема выбора меры близости для нормированных, разновеликих и равновеликих дескриптивных множеств. Алгоритм метода реализован в виде компьютерной программы.

На основе схемно-целевого подхода пересмотрены результаты альгофлористического районирования и выявлены центры видового разнообразия водорослей-макрофитов ДВ РФ, приведен метод непрямой ординации на основе n-арных мер для определения однородности условий увлажнения для серии описаний, рассчитана теоретико-графовая модель внутригодовой динамики таксоцена водорослей-макрофитов.

Практическая значимость работы. Результаты исследования могут быть применены в мероприятиях по сохранению биологического разнообразия растительных сообществ, для количественной оценки данных биологического мониторинга, оценки изменения видовой структуры сообщества при антропогенном воздействии, при геоботаническом районировании, для непрямой ординации описаний, для математико-картографического моделирования.

Рассматриваемые в работе методы были частично включены в учебные курсы «Экологический мониторинг», «Геоинформационные системы», «Статистическая обработка экологических данных», «Экосистемный анализ» для студентов специальностей «Экология» и «Природопользование».

Апробация работы. Основные положения и результаты работы обсуждались: на сессии ТИГ ДВО РАН (г. Владивосток, 2005 г.), на II-ом Молодежном конкурсе инновационных проектов по Дальневосточному федеральному округу (г. Владивосток, 2007 г.), на III экологическом форуме «Природа без границ» (г. Владивосток, 2008 г.), на научной конференции «Природопользование и охрана окружающей среды» (г. Пекин, 2008 г.), на Комаровских чтениях (г. Владивосток, 2008 г.).

Публикации. По теме диссертации опубликовано 14 печатных работ, в том числе 4 в изданиях из списка ВАК.

Личный вклад. Оптимизирована методика сравнительного анализа видового состава компонентов растительного покрова. Решена проблема выбора меры близости для нормированных, разновеликих и равновеликих дескриптивных множеств.

При личном участии автора создана биоинформационная система «Биоразнообразие», которая реализуется на конкретном биологическом материале. Автором лично создана программа для сравнительного анализа биологических данных «BioComparison». Все расчёты и графическое представление в работе произведены лично автором.

Структура и объём работы. Диссертация состоит из введения, 3 глав, заключения, библиографического списка источников (включает 581 источник, 174 на иностранных языках) и приложения. Работа изложена на 219 стр., содержит 161 стр. основного текста, 58 стр. приложений.

Объекты, материалы и методы исследования. Наше внимание акцентировано, главным образом, на компонентах видового разнообразия растительных сообществ (флор, фитоценозов). Взят материал по видовому составу ДВ альгофлор (Клочкова, 1997) и прирусловых лесов р. Амур (Ахтямов, 2001), сезонному распределению водорослей-макрофитов (Макиенко, 1975; Гусарова, 1988; Кафанов, Жуков, 1993).

Рассмотрены математические методы сравнительного анализа на основе общего аксиоматического подхода и теоретико-графовых методов, а также вопросы реализации данных методов с помощью информационных технологий.

Благодарности. Автор благодарит за всестороннюю поддержку и чуткое руководство своего учителя - Б.И. Сёмкина. Автор выражает благодарность И.С. Гусаровой, А.П. Орешко, Л.И. Варченко за консультативную помощь в сложных вопросах, а также д.б.н., профессору Н.Г. Клочковой за предоставленный материал для математической обработки.

Глава 1. Схема анализа данных: основные методы

1.1 Историко-методологические аспекты сравнительного анализа в экологии

С начала XX века в биологические науки активно проникают количественные математические методы (Александрова, 1969; Применение…, 1972; Трасс, 1976). В рамках настоящего исследования обратим внимание, главным образом, на внедрение количественных методов в тех научных направлениях, которые связаны с исследованием закономерностей в структуре растительных сообществ.

Несмотря на то, что исследование структуры биологических объектов - одна из центральных проблем многих биологических наук, таких как экология, геоботаника, фитоценология и др., о создании общей содержательной концепции самого биологического исследования до сих пор идут споры. Когда дело касается количественных оценок, привлечение математических приемов неизбежно, особенно если исследователь работает в некой новой междисциплинарной области, особенно в случае изучения структуры таких сложных объектов природы, как сообщества.

П. Грейг-Смит в своей известнейшей работе «Количественная экология растений» (Грейг-Смит, 1967 : 13) писал: «Переход от качественного к количественному подходу характерен для развития любой отрасли науки. Когда достигается определённая степень понимания явлений в общих чертах, внимание исследователей естественно сосредотачивается на более тонких деталях структуры или поведения, наблюдаемые различия которых менее значительны и могут быть оценены лишь с помощью измерения. Не удивительно, что количественный подход развился раньше в большинстве отраслей наук о неживой природе, чем в биологической науке. По-видимому, одно из наиболее значительных различий между физикой и химией, с одной стороны, и биологией, с другой, состоит в том, что в первых обычно можно временно изолировать одну переменную величину для изучения, в то время как в биологии это редко бывает осуществимо».

Знаковой для количественной биологии, стала работа П. Жаккара (Jaccard, 1901). Этим швейцарским исследователем был предложен коэффициент флористической общности (coefficient de communaute; Gemlinschaftskoefficient), который и по настоящее время не потерял своей актуальности. В своём историческом исследовании, Х.Х. Трасс (75 лет спустя!) отметит: «Не без оснований Жаккара считают одним из первых представителей количественно-статистического направления в фитоценологии» (Трасс, 1976 : 155-156).

В дальнейшем, было опубликовано огромное количество теоретических разработок и работ, касающихся применения количественных методов в конкретных предметных областях. Они возникали независимо друг от друга в различных научных центрах. Особенно преуспели британские математики - Р.Э. Фишер, К. Пирсон и В. Уэлдон, которых считают основателями биометрии (Лакин, 1990). В США работал палеонтолог Дж.Г. Симпсон, который среди прочего предложил широко известный коэффициент (Simpson, 1947). В Европе математические методы для исследования растительности разрабатывал и активно использовал, помимо вышеупомянутого П. Жаккара (Jaccard, 1901), легендарный французский ботаник Ж. Браун-Бланке (Braun-Blanquet, 1928). Больших успехов добились восточно-европейские ботаники - Ж. Кульчинский, К. Флорек с сотрудниками и др. (Florek et al., 1951).

В нашей стране можно отметить работы А.А. Любищева (например, Любищев, 1923) с использованием коэффициента вариации и его критики, во многих отношениях интересную книгу по исследованию изменчивости Ю.А. Филипченко (Филипченко, 1929), публикации И.И. Шмальгаузена (Шмальгаузен, 1935). В некоторых работах отечественных ботаников изредка применялись коэффициенты общности, например в работах В.В. Алёхина, А.Е. Жадовского, В.Н. Сукачёва, В.Н. Беклемишева и др. (Жадовский, 1925; Беклемишев, 1931. Сукачёв, 1931; Алёхин, 1938). Но, как правило, отечественные исследователи использовали в основном описательную одномерную статистику. Это было связано с тем, что применение математических методов осуждалось и даже преследовалось благодаря деятельности Т.Д. Лысенко и его последователей (см., например, материалы электронного журнала «Биометрика»: http://www.biometrica.tomsk.ru/).

В то же время, за рубежом в 50-е годы активно развиваются математические методы (особенно методы многомерного статистического анализа), выходят первые обзоры по мерам близости (Oosting, 1953; Greig-Smith, 1957) и новым методам классификации растительности (Florek et al., 1951; Bray, Curtis, 1957). В отечественной биологической науке данный период отмечен публикациями А.А. Любищева (единственного члена Международного биометрического общества), да ещё, пожалуй, работами Р.Л. Берга в области стабилизирующего отбора, а также работами П.В. Терентьева о методе корреляционных плеяд (причём последние вышли уже в конце 50-х, когда влияние Т.Д. Лысенко значительно ослабло). Также отметим научную дискуссию математика А.Н. Колмогорова со сподвижниками Т.Д. Лысенко - Н.И. Ермолаевой и Э. Кольманом.

В 60-70 годы в направлении количественной биологии можно отметить явный научный бум. Были опубликованы крупные зарубежные и отечественные обзоры по количественным методам в исследованиях растительности (Greig-Smith, 1964; Kershaw, 1964; Lambert, Dale, 1964; Roux, Roux, 1967; Грейг-Смит, 1967; Александрова, 1969; Василевич, 1969; Cancella da Fonseca, 1969; Pielou, 1969; 1975; 1977; Goodall, 1973; Hill, 1973), зоологии (Savage, 1960; Peters, 1968), таксономии (Sokal, Sneath, 1963; Williams, Dale, 1965), палеонтологии (Cheetham, Hazе1, 1969), а также некоторое количество работ посвящённых отдельным аспектам теории, введению и применению мер сходства и различия (Сёмкин, 1972 а, б; 1973 а, б; 1975).

Также хотелось бы также отметить ряд более поздних обзорных работ по количественным методам в биологических науках (Песенко, 1982; Greig-Smith, 1983; Legendre, Legendre, 1983; Kershaw, Looney, 1985; Digby, Kempton, 1987; Magurran, 1988; 2004; Миркин, Розенберг, Наумова, 1989; Мэгарран, 1992; Уланова, 1995; Chao et al., 2000; Koleff, Gaston, Lennon, 2003; Diserud, Шdegaard, 2007). Как будет показано далее, ни в одной современной работе по количественным методам нет адекватной математической основы. По этой причине особенно значимо наличие обобщающей теории, позволяющей адекватно использовать количественные методы в биологии, т.е. такие методы которые позволяют исследовать количественные биологические данные.

Благодаря совместным усилиям учёных различных научных направлений (математиков, экологов, систематиков, геоботаников, фитоценологов, зоологов и др.) в области применения количественных математических методов для биологических исследований постепенно оформилось несколько альтернативных научных направлений. В настоящее время можно отметить несколько основных подходов:

· дедуктивный системно-целевой подход А.П. Левича (Левич, 1980);

· индуктивно-дедуктивный подход Ж. Браун-Бланке (Braun-Blanquet, 1928; Александрова, 1969; Миркин, Наумова, Соломещ, 2002; Миркин, 2004);

· индуктивно-плюралистический подход Ю.А. Песенко (Песенко, 1982; Песенко, Сёмкин, 1989);

· индуктивный схемно-целевой подход Б.И. Сёмкина (Сёмкин, 1981; 1983 а; 1987а; Сёмкин, Орешко, Горшков, 2009 а).

Дедуктивные подходы отталкиваются от некой теоретической модели, которая проверяется на эмпирическом материале (это классическая статистическая методика). Индуктивные же подходы начинаются со сбора материала и уже в процессе изучения структуры определяются эмпирические закономерности.

В настоящее время в геоботанике и других науках о растительности наиболее распространён метод Браун-Бланке. Он основан на экспертном выделении более или менее единообразных комплексов растений по признаку «верности видов», т.е. степени тяготения вида к определённому синтаксону (Миркин, Наумова, 2009). Данный подход критикуется некоторыми видными экологами за субъективность, неопределённость критериев и правил классификации (Гиляров, 2005), но, несмотря на это, в настоящее время он является доминирующим. Следует отметить, что степень формализованности данного подхода крайне мала, что мешает строгому обоснованию метода, а выделение сообществ с помощью метода Браун-Бланке во многом зависит от опыта и научной интуиции исследователя.

Схемно-целевой подход возник в попытке ликвидировать разрыв между схемами сбора данных и схемами последующей математической обработки (Сёмкин, Усольцева, 1982; Сёмкин, 1983 а; 1987 а; Сёмкин, Орешко, Горшков, 2009 а). В приведённых работах была рассмотрена методология индуктивного анализа структур биоценотических систем. Предложены две схемы анализа: детерминистская и стохастическая. Приведём детерминистскую схему:

1. Постановка цели исследования.

2. Сбор данных:

· Выбор элементарного описания;

· Выбор серии описаний;

· Представление данных в виде (первичной) матрицы объект-признак.

3. Анализ данных:

· Попарное сравнение описаний и получение матрицы конвергенций (матрица абсолютных мер сходства или матрица пересечений);

· Выбор мер включения и сходства;

· Получение соответствующей несимметричной матрицы сходства (матрица включения);

· Получение соответствующей несимметричной матрицы сходства (матрица включения);

· Выбор алгоритмов упорядочивания данных;

· Определение бинарных отношений и представление их в виде графов (дендрита, дендрограммы, ориентированных графов и т.д.).

4. Интерпретация данных.

Вероятностная схема анализа статистических отношений в общих чертах аналогична детерминистской схеме анализа отношений включения и сходства:

1. Постановка цели исследования.

2. Сбор данных:

· Выбор схемы опыта;

· Выбор полной совокупности попарно несовместимых событий;

· Определение частот элементарных событий в результате эксперимента (наблюдения);

· Представление данных в виде выборочной конечной схемы

3. Анализ данных:

· Попарное сравнение описаний и получение матрицы конвергенций;

· Выбор статистических мер (совместимости, зависимости и др.);

· Расчёт статистических мер;

· Статистическая оценка выборочных мер;

· Получение матриц мер совместимости, зависимости и др.;

· Выбор алгоритмов систематизации

· Определение бинарных отношений.

4. Интерпретация данных.

Есть некоторые различия между этими схемами. Процедура сбора данных при анализе статистических отношений состоит в проведении статистического эксперимента и в получении выборочных конечных схем. При этом используются хорошо разработанные в теории вероятностей и математической статистике подходы к постановке подобных задач.

В дальнейшем была осуществлена попытка развития схемно-целевого подхода в статье Ю.А. Песенко и Б.И. Сёмкина (Песенко, Сёмкин, 1989). В этой работе, в частности, отмечены преимущества индуктивного подхода: «Индуктивный подход (в отличие от дедуктивного) не связан с какими-либо требующими проверки априорными предположениями о характере изучаемых явлений (и с построением соответствующей математической модели - объясняющей или прогнозирующей), цель индуктивного подхода - дать их адекватное описание» (Песенко, Сёмкин, 1989 : 134). В данной работе был сформулирован индуктивно-плюралистический подход, который активно развивается и поддерживается некоторыми современными исследователями, например, Г.С. Розенбергом (Шитиков, Розенберг, Зинченко, 2005) и который заключается в использовании максимального числа методов и показателей в исследовании, которые должны давать одинаковый результат.

Цель схемно-целевого подхода, как и многих других - максимально полно охарактеризовать биологические объекты и получить их математическую модель. В настоящее время существует несколько научных дисциплин в рамках которых разрабатываются количественные математические методы для исследования биологических систем: биометрия (Плохинский, 1978; http://www.biometrica.tomsk.ru/), математическая популяционная генетика (Свирежев, Пасеков, 1982), количественная таксономия (Sokal, Sneath, 1963; Sneath, Sokal, 1973), биоценометрия (Фрей, 1969; Сёмкин, 1983; Количественные…, 2005) и др. Некоторые учёные обеспокоены таким «разнообразием»: «Биологам совместно с математиками следует выполнить значительную работу по устранению неоправданного разнообразия применяемых методов и выделению наиболее пригодных для рассматриваемых целей» (Винберг, 1981).

К сожалению, многие из вышеупомянутых дисциплин не получили на данный момент широкого признания, несмотря на активных популяризаторов этих направлений (например, Шитиков, Розенберг, Зинченко, 2005; Леонов, http://www.biometrica.tomsk.ru). В одних направлениях практически отсутствуют пути реализации математических алгоритмов посредством информационно-компьютерных технологий, а в других проблема иная - отсутствует адекватный математический аппарат.

Мы, не опровергая значимости исследования структуры биологического разнообразия, предлагаем качественно новый подход к исследованию - на основе схемно-целевого подхода Б.И. Сёмкина. На настоящий момент существует непротиворечивый математический аппарат (Сёмкин, 1987 б; Сёмкин, Горшков, 2008; Сёмкин, Горшков, 2009 а) и первые шаги его программной реализации (Сёмкин, Орешко, Горшков, 2007; 2009 а; Горшков, 2008; 2010). В общем можно отметить, что суть схемно-целевого подхода (в сравнении с конкурирующими подходами) заключается в использовании строгой (минималистской) схемы исследования, начиная с выбора цели исследования и заканчивая интерпретацией данных.

Рассмотрим схему исследования подробно. Очевидным является то, что любое исследование должно начинаться с постановки цели исследования. Практическая деятельность показывает, что лучше всего цель формулируется теми исследователями, которые имеют достаточно большой опыт работы с конкретными объектами, исследование которых проводится. Однако здесь мы постоянно сталкиваемся с субъективным фактором исследователей.

Аналогичные вышеупомянутым представления отмечены и у других исследователей (Crovello, 1970; Dale, 1970; Orloci, 1978). Предполагается, что прежде чем приступить к сбору и обработке данных необходимо обсудить ряд предварительных этапов научных исследований, включающих следующее (Orloci, 1978):

1. Формулировку проблемы.

2. Выбор математической модели.

3. Определение существенных переменных.

4. Выбор плана взятия проб и метода анализа данных.

Только после обсуждения этих этапов может быть начат сбор данных и их анализ, за которыми следуют содержательные интерпретации. Единственный способ решить данную проблему состоит в чётком понимании цели, свойств объекта и границ используемых методов, кроме того, необходимо регулярно возвращаться к более ранним этапам исследования для их корректировки.

В настоящей диссертационной работе мы будем придерживаться схемно-целевого подхода в его интерпретации Б.И. Сёмкиным. В то же время мы не поддерживаем идею Ю.А. Песенко об использовании плюралистического подхода (Песенко, 1982; Песенко, Сёмкин, 1989), т.к. считаем, что плюрализм методов может привести к эклектичному использованию математических методов. В рамках схемно-целевого подхода Б.И. Сёмкина отбираются только те методы, которые соответствуют поставленной цели, т.е. этапы последовательно зависимы, следовательно, решение, принимаемое на каждом этапе, ограничивает свободу выбора алгоритмов на последующих этапах.

Наиболее трудным остается вопрос выбора соответствующих условий проведения эксперимента. Например, при анализе совместной встречаемости особей двух видов растений (животных) необходимо выбрать элементарный контур (обычно берут квадрат или прямоугольник), который «случайно бросается» на обследуемый участок.

При анализе зависимости объектов растительности от условий среды также возникает проблема ранжирования факторов среды на ряд категорий. После получения выборочных конечных схем производятся выбор и расчет статистических мер, а также и оценка ошибок выборочности. Но и в этой области было разработано достаточно большое число методов (например, Грейг-Смит, 1967) и мы не будем заострять на этом внимание.

1.2 Выбор элементарного описания

Очевидно, что от выбора цели зависит выбор совокупности объектов исследования. Исходя из цели исследования, последовательно определяем характерные пространственные и временные масштабы признаков объекта, определяем элементарные единицы исследования и далее производим сбор данных (измерение признаков).

В науках о растительности сформировалось в настоящее время два взгляда на природу объекта исследования: 1) идея дискретности единиц растительности и 2) идея континуальности (непрерывности) растительности. В настоящее время явно доминирует точка зрения континуалистов, хотя многие аспекты остаются в дискуссионной области (Кафанов, 2005 б; 2006; 2009; Миркин, 2005; Миркин, Наумова, 2009). В настоящей работе мы также будем придерживаться континуального подхода, т.к. считаем, что растительный покров (сообщества и флоры) представляет собой природный континуум, а процедура выделения дискретных единиц есть искусственная процедура выделения участков различными способами, т.к. для естественных объектов характерна нетранзитивность отношений (Сёмкин, Клочкова, Гусарова, Горшков, 2010а). В настоящее время выделяют два варианта континуума: абсолютный (экоклины) и относительный (экотоны) (Whittaker, 1967; Margalef, 1994 цит. по Миркин, Наумова, Соломещ, 2002). Мы склоняемся ко второму варианту.

Рассмотрим современные подходы к выбору элементарных описаний с учётом описанных представлений о континуальности растительности. Выбор элементарных описаний осуществляется на основе принципа «воспроизводимости» (общие представления об этом принципе отмечены у Ч. Элтона (Элтон, 1934), Л.Г.  Раменского (Раменский, 1952), К. Вилли (Вилли, 1966), Б.И. Сёмкина (Сёмкин, 1983 а) и др.), а также принципа «разделимости» описаний (Сёмкин, 1983 а). Суть вышеуказанных принципов состоит в следующем: «Первый принцип предполагает воспроизводимость описаний другими исследователями. Для этого следует чётко определить наименьшее количество признаков и их категорий, по которым производится описание объектов. Эти признаки и их категории должны быть доступны для восприятия многими исследователями. Затем выбирается «элементарное описание», исходя из второго принципа - разделимости. По этому принципу, элементарные описания одного и того же объекта должны быть сходными, а описания существенно различных объектов - различными» (Сёмкин, 1983 а : 8).

Проблема выбора элементарного описания неоднократно рассматривалась в работах ведущих специалистов в области исследования растительности (De Candolle, 1855; Толмачёв, 1931; 1974; 1986; Грейг-Смит, 1967; Василевич, 1969; Юрцев, 1975; 1987; Шмидт, 1980; Юрцев, Сёмкин, 1980; Малышев, 1987; 2001). Основное внимание было обращено на обсуждение вопросов формы и размеров элементарного описания. Первым на эти аспекты обратил внимание ещё А. Декандоль, основатель сравнительной флористики, который придавал понятию равноценности флор топографический оттенок, указывая на то, что «было бы абсурдно сравнивать, с точки зрения общего числа видов, области, которые не являлись бы заметно одинаковыми по своей площади» (De Candolle, 1855).

В 1941 году А.И. Толмачевым (Шмидт, 1980; Юрцев, 1982) было показано, что приблизительное равенство сравниваемых территорий является важным, но не единственным условием сопоставимости флор. Если эти территории велики, то в их различных частях местные условия среды по-разному влияют на богатство и состав флоры. При сокращении площади пестрота условий среды уменьшается и подлежащая изучению территория выглядит более однородной, т.е. происходит насыщение. Поэтому А.И. Толмачев сформулировал второе условие сопоставимости флор - ограниченность занимаемых ими территорий. Так, А. Кайё (Cailleux, 1953) предложил сравнивать флористическое богатство территорий площадью 10000 кв. км, а Т. Моно (Monod, 1955) увеличил в аридных условиях эту площадь до 100000 кв. км. При этом Р. Бешел (Бешел, 1969), Л.И. Малышев (Малышев, 1969) и Б.А. Юрцев (Юрцев, 1975) при изучении арктических и высокогорных флор сокращают размер учетной площади до 100 кв. км. По-видимому, здесь наблюдается активное влияние субъективного фактора исследователей, так называемая «экология экологов» (Миркин, Наумова, Соломещ, 2002) или же аналогично - «биогеография биогеографов» (Кафанов, 2005 а).

Третье условие, указанное А.И. Толмачевым, требует высокой степени изученности сравниваемых флор. Надо заметить, что чем меньше по размеру флора, тем легче выполняется это условие. Б.А. Юрцев предложил термин «флористическое зондирование территории» для выявления флор территории, а также термин «проба флоры», отражающий наибольшую полноту изученности флоры (Юрцев, 1987; Миркин, Наумова, Соломещ, 2002). Указанные принципы сопоставления флор могут быть частично нарушены при определении односторонних связей между флорами или их частями (Юрцев, 1968). Б.А. Юрцев отчётливо показал, что кроме двухсторонних, симметричных отношений сходства в сравнительной флористике можно использовать и односторонние отношения включения, которые можно оценивать с помощью коэффициентов специфичности и неспецифичности одной флоры относительно другой (Юрцев, 1968 : 94-95; Сёмкин, 2007). В дальнейшем, мы более подробно рассмотрим подобные отношения и покажем, что при континуальном подходе односторонние связи наилучшим образом отражают связи рассматриваемых объектов.

Здесь также следует упомянуть о центральном понятии наук о растительности - о конкретной флоре (КФ). Концепция конкретной или элементарной флоры была разработана А.И. Толмачёвым (Толмачёв, 1974; 1986). По настоящее время данная концепция не потеряла своей актуальности, а её постулаты широко используются при определении элементарного описания. Метод конкретных флор (как и близкий к нему подход Бешела (1969)) основаны на некоторой идеализации биогеографической реальности, но практика показывает, что это не существенно мешает использованию данной концепции. Идеализация состоит в некотором отступлении от концепции растительного континуума, принятой в современной науке о растительности: «сложность классификации растительности объясняется тем, что в отличие от растений растительные сообщества - это условности, объединённые в многомерный континуум» (Миркин, Наумова, Соломещ, 2002 : 146).

Несколько позднее Б.А. Юрцевым в дополнение концепции конкретной флоры было разработано понятие парциальной флоры (Юрцев, 1975; 1982; 1983; Сёмкин, Юрцев, 1980; Кафанов, Кудряшов, 2005). Парциальная флора понимается как часть элементарной флоры (Юрцев, 1982) и данная концепция, по сути, является развитием концепции А.И. Толмачёва о КФ (экотопологическая флористика (Юрцев, 1991)).

Наиболее удачной для определения размеров элементарного участка (по нашему мнению) является методика Н.В. Кобелевой (Кобелева, 1984; Ильина, Кобелева, 1989), которая позволяет определить форму и размер конкретной флоры (на основе биогеографических данных) расчётным путём с помощью теории близости. Существуют и альтернативные подходы. Наиболее популярен фрактальный подход. Он ещё не сформировался, но уже есть попытки определения фрактальных закономерностей для инвентаризационного разнообразия, причём с учётом отношений типа виды-площадь (Гелашвили, Иудин, Розенберг, Якимов, 2007): «Можно сказать, что фрактальный объект статистически единообразен в широком диапазоне масштабов. В идеальном случае (математический фрактал) такое самоподобие приводит к тому, что фрактальный объект оказывается инвариантным относительно масштабных изменений пространства (растяжений и сжатий)». В общем, следует отметить, что задача выбора элементарного описания в настоящее время не формализована.

1.3 Составление серии описаний

После выбора элементарного описания производится сбор данных, исходя из инструкций чётко определённой схемы. Совокупность видов любого сообщества формально можно представить конечным множеством, булевым вектором (набором) или точкой многомерного пространства Хэмминга (см. например, Сёмкин, Куликова, 1981). Общие подходы к биологическим измерениям определяются принципами теории измерений (Суппес, Зиннес, 1967; Пфанцагль, 1976; Котов, 1985). Важнейшим критерием адекватности дальнейших расчётов является однородность шкал (числовых систем), в которых проводятся измерения. Измерением свойства материальных объектов называют приписывание различным проявлениям этого свойства определённых действительных чисел с целью его познания (Котов, 1985), но для того, чтобы приписать объекту определённое значение, необходимо хорошо понимать, что будет измеряться и какими математическими свойствами оно будет обладать. Помимо классических натуральных чисел применяются их частичные аналоги. Всё это разнообразие даёт нам значения, измеренные в основных шкалах: абсолютной, относительной, интервальной, порядковой, номинальной (шкалы расположены в порядке убывания «силы» шкалы). Тип шкалы определяет спектр допустимых преобразований, а отсюда определяется перечень допустимых для применения математических методов.

Следует помнить об ошибках при сборе данных. Например, при флористических исследованиях ошибка в сборе данных составляет 5-7% (Kershaw, 1974: цит. по Беликович, 2001). Стоит также обратить внимание на подготовку материалов для публикации. Для этих целей используется алгоритм компактной записи списков (см. например, Козлов, 1983; Куликова, 1983).

Первичные флористические данные для обработки обычно представляются в форме прямоугольной таблицы размером nЧm, где n - количество объектов (например, флор), a m - количество признаков (например, видов) в списке (species-by-site matrix). Такая таблица будет называться матрицей флористических данных (матрица объект-признак, матрица наблюдений). В частном случае учитывается только присутствие/отсутствие (presence/absence) конкретных видов. В некоторых литературных источниках (Миркин, Розенберг, Наумова, 1989) данная матрица обозначена как «первичная матрица» (primary matrix) или в определённых условиях как «сводный список». Те же авторы (Миркин, Розенберг, Наумова, 1989) указывают на приоритет введения термина «первичная матрица» в фитоценологию за известным исследователем Р.П. Макинтошем. Обратим внимание на то, что в систематике подобная матрица, по-видимому, была впервые введена Р. Сокалом и П. Снитом (Sokal, Sneath, 1963). В ряде работ под сводным списком также понимается региональная флора, т.е. таксономический список территории, как правило, отражающий список растений административного района (края, области, республики или даже всей страны). Именно такие данные в виде первичной матрицы (обычно с полным видовым названием) представлены в современных базах биологических данных.

В общем, форма представления чисел в матрице данных даёт нам первичную информацию об объекте и дальнейших возможностях использования математических методов. Так, например, булевы наборы дают нам информацию только о присутствии/отсутствии вида во флоре, тогда как дескриптивные множества (Сёмкин, 1973 а) дают некоторое представление об обилии видов. Некоторые авторы считают, что измерения для булевых наборов производятся в номинальных шкалах (Котов, 1985; Гайдышев, 2001; Шитиков, Розенберг, Зинченко, 2005), но это неверно, измерения присутствия/отсутствия вида в описании соответствуют абсолютной шкале, в чём можно убедиться просуммировав значения по столбцу и получив тем самым число видов в описании соответствующему данному столбцу.

Таблица 1

Матрица флористических данных

Нумерация видов

Нумерация флор

1

2

. . .

j

. . .

n

1

11

12

. . .

1j

. . .

1n

2

21

22

. . .

2j

. . .

2n

. . .

. . .

. . .

. . .

. . .

. . .

. . .

i

i1

i2

. . .

ij

. . .

in

. . .

. . .

. . .

. . .

. . .

. . .

. . .

m

m1

m2

. . .

mj

. . .

mn

Мы также можем сравнивать биологические спектры (например, спектры жизненных форм Раункиера, таксономические спектры и др. нормированные дескриптивные множества) и другие разновидности данных, например, такие как случайные события или случайные величины. Внушительный перечень признаков, представляемых в форме дескриптивного набора, которые можно использовать для сравнительного анализа флор, представлен в работе Б.И. Сёмкина (2008).

В современной науке применяется несколько алгоритмов обработки первичной матрицы. Анализ матрицы nm путём сравнения объектов, исходя из признаков, (наиболее распространённый в биологических науках) называется Q-типом анализа, а в случае сравнения признаков, на основе объектов - R-типом анализа. Существуют попытки использования гибридных типов анализа (например, RQ-анализ), но данная методология ещё должным образом не разработана. Один из весьма интересных вариантов классификации типов анализа представлен в работе Т.Э.-А. Фрея (Фрей, 1972).

1.4 Меры разнообразия и близости, используемые в сравнительном анализе компонентов растительного покрова

Прежде чем перейти к блоку анализа данных в рамках схемно-целевого подхода, необходимо чётко представлять себе суть используемых аналитических методов. Методика сравнительного анализа объектов позволяет определять отношения «целого-части», которые могут быть равноправными (определяются симметричные отношения конвергенции или дивергенции), неравноправные (определяются отношения направленной конвергенции или направленной дивергенции) и различные комбинации отношений, требующие определения симметричных и несимметричных отношений конвергенции или дивергенции. Математическое обоснование всем перечисленным отношениям дано в Приложении А.

Отношения, как правило, представляются в виде матриц различного типа, а визуализируются с помощью графов, а также посредством диаграмм Эйлера-Венна. Выбор оптимальной меры, оценивающей близость объектов, представляет одну из наиболее важных проблем в систематике, биогеографии и экологии (Sokal, Sneath, 1963; Бейли, 1970; Sneath, Sokal, 1973; Orloci, 1978). Однако, несмотря на большое количество работ, посвященных рассмотрению и упорядочиванию индексов близости (Sokal, Sneath, 1963; Roux, Roux, 1967; Василевич, 1969; Cheetham, Hazе1, 1969; Чернов, 1971; Сёмкин, 1972; 1973 а, б; 1979; 1987 а; Goodall, 1973; Ванчуров, 1975; Orloci, 1975; 1978; Розенберг, 1977; Снетков, Вавилин, 1977; Хеллоуэл, 1977; Миркин, Розенберг, 1978, 1979, 1983; Шмидт, 1980; Юрцев, Сёмкин, 1980; Песенко, 1982; Максимов, 1984; Федоров, Смирнов, 1986; Гайдышев, 2001 и др.) проблема создания общей теории мер близости остается открытой.

Кроме того, постоянно создаются новые меры для определения отношений сходства (различия). По этому поводу весьма иронично высказывается Э. Мэгарран: «При измерении разнообразия всегда кажется, что одного термина будет недостаточно, а нужно ещё полдюжины» (Мэгарран, 1992 : 41). Следовательно, общая теория мер близости должна выполнять, кроме прочего, «санитарную» функцию, т.е. не допускать создания дублирующих и ошибочных индексов, которые не привносят в общую теорию ничего нового или наносят вред.

Приведём обзор мер, используемых в биологических и географических науках для аналитических интерпретаций на основе аксиоматического подхода, математическое обоснование которым дано в Приложении А. При рассмотрении соответствующих интерпретаций мы будем придерживаться следующих обозначений - если в исследовании использовалась формула близости хотя бы в одной из четырех интерпретаций (при n ? 2), то мы рассматриваем соответствующие формулы для всех остальных интерпретаций. Например, формула Кульчинского была известна для трех интерпретаций - множественной, дескриптивной и вероятностной, следовательно, мы можем привести соответствующее аналитическое выражение и для информационной интерпретации.

1.4.1 Унарные индексы

При изучении растительных сообществ и флор широко используются меры изменчивости, как отдельных признаков, так и частот распределения случайных величин (Филипченко, 1929; Василевич, 1960; 1969; 1971; 1972; 1983; Работнов, 1961; Работнов, Саурина, 1971; Ипатов, 1962; Росс, Власова, 1966; Грейг-Смит, 1967; Гиляров, 1969; Журавлева, Горшкова, 1971; Алексеенко, 1976; Миркин, Розенберг, 1978, 1983; Миркин, Розенберг, Наумова, 1989; Шмидт, Малышев, 1983; Зайцев, 1984; Злобин, 1984). Наиболее полный обзор по применению индексов изменчивости в биологических исследованиях приведен в следующих работах (Яблоков, 1966; Айвазян, 1968; Мамаев, 1972; Левич, 1980; Песенко, 1982).

Унарные коэффициенты весьма многочисленны и разнообразны. Большинство мер можно упорядочить в два коэквивалентных (взаимодополняющих) класса (Сёмкин, 1987 б, Песенко, Сёмкин, 1989): меры однородности (также известные как меры концентрации) и меры разнообразия. Рассмотрим наиболее известные меры.

1.4.1.1 Коэффициент вариации

При оценке изменчивости некоторых количественных показателей видов растений и животных широко используется коэффициент вариации (Йогансен, 1933; 1935; Шмальгаузен, 1935; Алпатов, 1956; Берг, 1956; 1958; Рогинский, 1959; Урбах, 1963; 1964; Шмидт, 1964; Яблоков, 1966; 1968; Артемьев, 1969; Егоров, 1969; Смирнов, 1971; Дмитриев, 1972; Мамаев, 1972; Дюльдин, 1973; Котенко, 1980; Snedecor, 1989; Уланова, 1995). Несмотря на критику отдельных свойств коэффициента вариации некоторыми исследователями (Duncker, 1908; Любищев, 1923; Philiptschenko, 1923 цит. по: Филипченко, 1929; Haldane, 1955 цит. по: Яблоков 1966; Ефимов, 1976) он остаётся одной из часто используемых мер изменчивости.

Некоторые проблемы интерпретации закономерностей изменчивости признаков, установленные с помощью коэффициента остались нерешёнными. Так по-разному решается вопрос о зависимости коэффициента вариации от среднего значения. Одни исследователи (Василевич, 1960; 1969; Ипатов, 1962) на различных объектах (ассоциации верховых болот и широколиственного леса) установили, что численное значение коэффициента вариации для проективного покрытия доминантных видов имеет меньшее знание, чем для малообильных видов. Эта закономерность упомянутыми авторами считается естественной. Однако некоторые зоологи (Котенко, 1980), исследовавшие зависимость коэффициента вариации от абсолютных значений признака установили, что он не зависит от абсолютной величины признаков, а встречающаяся тенденция увеличения коэффициента вариации с уменьшением абсолютной величины признаков может быть объяснена наличием падения точности его измерения, а при исключении влияния степени точности промеров он отражает лишь величину разнообразия признака. Существует мнение (Песенко, 1982), что показатели статистического разнообразия, такие как среднеквадратическое отклонение и коэффициент вариации не могут являться мерами видового разнообразия. Отмеченная проблема, видимо, обусловлена неудовлетворительными знаниями авторов о математических свойствах коэффициента вариации (Сёмкин, Горшков, 2009 б).

Приведём ряд аналитических выражений коэффициента вариации и дадим его геометрическую интерпретацию (Сёмкин, Горшков, 2009 б). Коэффициент вариации, предложенный К. Пирсоном (Pearson 1896 цит. по Филипченко, 1929) был записан в следующем виде:

,

где ; , , . По-видимому, этот безразмерный коэффициент изменчивости был получен как показатель среднего квадратического отклонения для нормированного вариационного ряда , . Известно, что коэффициент вариации может быть записан в следующем виде (Крамер, 1975 : 392):

,

где , тогда . Эту же формулу получили М.М. Юзбашев и Т.М. Агапова (Юзбашев, Агапова, 1988) подставив в формулу коэффициента вариации значения долей.

Рассмотрим геометрическую интерпретацию коэффициента вариации. Представим выборку долей как точку в n-мерном евклидовом пространстве. Тогда легко установить следующее соотношение графически (см. рис. 1): , где - угол в начале координат и заключённый между лучами, проходящими через точки и . Следовательно, коэффициент вариации измеряет близость распределения долей к эталону (абсолютно однородному распределению долей), причём близость оценивается через .

Рис. 1 Геометрическая интерпретация коэффициента вариации (при n = 2).

Исходя из геометрической интерпретации коэффициента вариации, легко установить следующие его свойства: 1) значения коэффициента могут быть больше 1; 2) он зависит от числа измерений (эталон изменяется в зависимости от n); 3) значения его не зависят от среднего арифметического.


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.