Сравнительный анализ компонентов растительного покрова

Историко-методологические аспекты сравнительного анализа в экологии. Меры разнообразия и близости, используемые в сравнительном анализе компонентов растительного покрова: флоры водорослей-макрофитов; субассоциации лесов р. Амур. Биоинформационная система.

Рубрика Экология и охрана природы
Вид диссертация
Язык русский
Дата добавления 17.01.2016
Размер файла 3,2 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Для определения DS-спектров взяты диагональные элементы матриц пересечения видовых списков водорослей соответствующих отделов. Сходство спектров флор двух районов будем определять с помощью меры процентного сходства. В альгофлористических исследованиях на основе DS-спектров рассчитывались различные отношения между компонентами спектра. Наиболее часто используются отношения между числом видов отделов Rhodophyta и Phaeophyta (R/P или p3/p2), а также между числом видов Chlorophyta и Phaeophyta (C/P или p1/p2), которые являются показателями широтной принадлежности флор (Feldman, 1937; Клочкова, 1996; Клочкова, Березовская, 2001). Иногда используется (для оценки экологического состояния водоёмов) флористический коэффициент, равный сумме двух приведённых отношений (Cheney, 1977; Калугина-Гутник, 1989; Селиванова, 2004):

.

Можно использовать также индексы концентрации, зависящие только от одной доли, максимальной или минимальной (Berger, Parker, 1970; May, 1975; Песенко, Сёмкин, 1989; Сёмкин, 1987 а; Magurran, 1988; 2004) - соответственно или . В нашем случае, почти у всех DS-спектров , т.е. определяется как доля числа видов красных водорослей. Этот индекс не зависит от числа высших таксонов (здесь отделов) и, как отмечает Мэй (May, 1975), является лучшей мерой видового разнообразия. Следует также отметить, что индексы R/P, C/P, (C+R)/P определяются как отношения «часть к части» для спектра, а индекс R/(C+R+P) есть отношение «части к целому» и потому является более предпочтительным для определения отношений величин (Сёмкин, Горшков, Варченко, 2008; Semkin, Gorshkov, Varchenko 2009).

На основе DS-спектров флор сублиторали 40 участков побережья ДВР рассчитана матрица мер процентного сходства. DS-спектры всех рассматриваемых 40 участков сходны на высоком уровне, несмотря на разновеликость. Мера процентного сходства является оптимальной мерой для нормированных дескриптивных множеств (здесь DS-спектров). Матрица мер процентного сходства показывает, что DS-спектры всех рассматриваемых 40 участков сходны на высоком уровне. Например, DS-спектр 40 участка (зал. Петра Великого) сходен на уровне 99% со спектрами участков 39, 35, 28, 20, 15, причём эти участки разновелики по числу видов: 269, 189, 164, 189, 150 и 117 соответственно. Есть заметные отклонения: спектры арктических флор (1-3 участки) сильно отличаются от остальных дальневосточных флор (для всех спектров значения сходства ниже в сравнении с другими спектрами), высокое сходство (0,92-0,95) наблюдается только с 26 участком (северо-восточный берег о-ва Сахалин, Амурский лиман), возможно, по причине опресняющего действия р. Амур. Следует отметить, что два DS-спектра имеющих высокое сходство всегда равны или близки по индексам разнообразия, но обратно, вообще говоря, неверно, т.е. близкие или равные значения индексов разнообразия могут определяться для весьма различных DS-спектров. В связи с этим, при сравнении DS-спектров для резко изменяющегося флористического состава прибрежных сообществ при естественных или антропогенных катастрофических воздействиях нельзя использовать индексы разнообразия (Сёмкин, Клочкова, Гусарова, Горшков, 2010 в). Рассмотрим индексы разнообразия

и .

Индекс концентрации л+? принимает максимальные значения в случае, когда индекс разнообразия имеет минимальное значение и наоборот. Отсюда следует, что все DS-спектры имеют сходные значения индексов разнообразия и индексов концентрации (за редкими исключениями). Например, наибольшие значения индекса разнообразия имеют DS-спектры участков 2 (0,93), 26 (0,88), 17 (0,87), а наиболее выровненными по отделам являются участки 10 (0,72), 29 (0,73), 14 (0,76), что слабо коррелирует с представлениями о центрах видового разнообразия данного региона. Эти же DS-спектры выделяются и по индексам концентрации и между ними определяется наибольшее сходство.

Для проверки интерпретируемости вышеописанных мер рассмотрим изменения систематической структуры альгофлоры при антропогенном воздействии на примере Авачинской губы на основе DS-спектров. Для этих целей возьмём 9 спектров, характеризующих три части Авачинской губы: вся губа, горло и внутренняя часть в различные годы (1970 (1-3 спектры), 1991 (4-6 спектры), 1999 (7-9 спектры) гг.) по данным Н.Г. Клочковой и В.А. Березовской (2001) и два DS-спектра флор в качестве контрольных эталонных районов: Авачинский залив до мыса Безымянного на юге (10 спектр) и о-в Парамушир с прилежащими островами (11 спектр) из вышерассмотренных данных (табл. 7 Приложения Б). Ранее имела место попытка оценить экологическое состояние Авачинской губы с помощью коэффициентов (C+R)/P (Селиванова, 2004), но она не привела к успеху. Однако оценка той же системы с помощью отношений C/P и R/P позволила установить существенные изменения состояния участков Авачинской губы в период с 1970 по 1999 гг. (Клочкова, Березовская, 2001).

Повторно проведём обработку данных Н.Г. Клочковой и В.А. Березовской (2001), используя меру разнообразия и меру процентного сходства. Рассмотрим полученные результаты. Индексы разнообразия R(p) для отдельных районов будем обозначать как R(x), где x или y - номер района (аналогично и для меры процентного сходства Jx,y). Индексы разнообразия DS-спектров имеют наибольшее численное значение во внутренней части Авачинской губы во все рассматриваемые годы, а также в горле и во всей губе в 1999 г. Численные значения мер разнообразия колеблются от 0,85 до 0,89 (R(3) = 0,855; R(6) = 0,848; R(9) = 0,864; R(7) = 0,886; R(8) = 0,869). Для остальных DS-спектров индекс разнообразия изменяется в пределах от 0,75 до 0,81, т.е. имеет значения близкие к эталонным DS-спектрам (табл. 3). Отсюда следует, что наибольшей антропогенной нагрузке подвергались участки внутренней части губы в разные годы, а в 1999 г. вся губа и горло. Из расчётов также следует, что в 1970 г. DS-спектры всей губы (1) были сходны с контрольными эталонными зонами (10, 11) более чем на 98% (J1,10 = 98,2%; J1,11 = 98,3%), горло более чем на 95% (J2,10 = 95,5%; J2,11 = 95,1%). Внутренняя часть губы уже значительно отличалась от эталонов (J3,10 = 93,9%; J3,11 = 94,3%). Это подтверждается и исследованиями Н.Г. Клочковой и В.А. Березовской (2001), которые утверждают, что уже в 1970 г. начался процесс полисапробизации. К 1991 г. сходство для всей губы и горла по-прежнему высокое (J4,10 = 98,0%; J4,11 = 98,3%; J5,10 = 98,0%; J5,11 = 97,6%). Для внутренней части губы отмечается небольшой скачок в сторону увеличения сходства (J6,10 = 94,6%; J6,11 = 95,0%). К 1999 г. происходит существенное изменение структуры DS-спектров во внутренней части Авачинской губы (J9,10 = 72,5%; J9,11 = 72,8%), в горле (J8,10 = 92,5%; J8,11 = 92,9%) и в целом в губе (J7,10 = 90,3%; J7,11 = 90,6%). Разнообразие DS-спектров внутренней части Авачинской губы в разные годы почти не менялось. Меры сходства были попарно различны, кроме меры сходства (около 99%) между DS-спектрами внутренней части губы в 1970 и 1991 гг. (J3,6 = 98,8%; J3,9 = 75,6%; J6,9 = 76,1%). Наименьшее сходство всех DS-спектров наблюдается со спектром внутренней части губы в 1999 г. (J1,9 = 72,5%; J2,9 = 68,6%; J3,9 = 75,6%; J4,9 = 72,7%; J5,9 = 70,7%; J6,9 = 76,1%; J7,9 = 82,2%; J8,9 = 78,9%; J10,9 = 72,5%; J11,9 = 72,8%) и, следовательно, эта часть губы в большей степени была нарушена антропогенными воздействиями. С 1970 по 1991 гг. существенных изменений в систематической структуре Авачинской губы не обнаружено (J1,4 = 99,8%; J2,5 = 97,8%; J3,6 = 98,8%). Значительные изменения отмечаются в период с 1991 по 1999 гг. (J4,7 =90,5 %; J5,8 = 90,5%; J6,9 = 76,2%).

В общем, можно сказать, что методика сравнения флоры Авачинской губы с контрольными участками по мерам процентного сходства, рассчитанных на основе DS-спектров лучше интерпретируема для выделения этапов антропогенной деструкции макрофитобентоса Авачинской губы и её частей. Предложенные нами математические методы могут заменить ранее используемые методы Фельдмана (Feldman, 1937) и Чини (Cheney, 1977).

2.2 Субассоциации лесов поймы реки Амур

В своей работе М.Х. Ахтямов (2001) исследует структуру приречных лесов поймы р. Амур. Автором были рассмотрены особенности классификации растительности приречных лесов поймы р. Амур, с помощью традиционного метода Браун-Бланке выделяются синтаксоны прирусловых лесов (всего установлено - 1 класс, 4 порядка, 10 ассоциаций и 46 субассоциаций).

Цель данного раздела - с помощью метода непрямой ординации на основе использования n-арных показателей сходства подтвердить достоверность априорно формулируемых гипотезы о выравненности описаний вдоль градиента увлажненности.

В таблицах, характеризующих субассоциации сообществ, обычно приводятся такие данные, как число описаний сообществ (n), число видов в каждом описании (S) и общее число видов в субассоциации (T), на основе которых можно рассчитать меры сходства и различия n описаний. М.Х. Ахтямов для характеристики субассоциаций по градиенту увлажненности каждой ассоциации предлагает определить индекс биотической дисперсии Коха (Kn-1) и меру разнообразия Уиттекера (Iw), используя для их расчёта параметры n, S и T. Первый индекс интерпретируется автором как мера однородности условий при формировании видового состава насаждений, а второй индекс используется для «количественной оценки степени дифференцированности ценофлоры числом полных смен видов в экологическом диапазоне субассоциаций» (Ахтямов, 2001 : 52). При этом следует отметить, что у автора наблюдается некоторое непонимание математического смысла этих мер. Так, например, имеет место неверная интерпретация значений этих индексов: «из-за большей выравненности условий увлажнения и характеристик состава аллювиальных наносов в местообитаниях показатели сходства видового состава (IBD) в рассматриваемых сообществах выше, а значения IW - ниже» (Ахтямов, 2001 : 64). На самом деле индекс Коха является мерой сходства, а индекс Уиттекера мерой различия серии описаний, отсюда и различия в их значениях.

В качестве примера корректного расчёта мер сходства и различия серии описаний возьмём данные по ассоциации Salicetum udensis. Сообщества данной ассоциации находятся в прирусловой части поймы и подвергаются весьма длительному затоплению, что создает преимущества для развития влаголюбивых видов на супесчано-суглинистых аллювиальных отложениях (Ахтямов, 2001). Приведём расчёты в таблице 8 Приложения Б. Интерпретация полученных значений мер вызвала затруднения у М.Х. Ахтямова: «причины более высоких значений Iw насаждений на этих стадиях в S.u. swidietosum пока трудно интерпретировать» (Ахтямов, 2001 : 74). Как можно видеть в таблице 8 Приложения Б на участках A4 и A5 происходит явный скачок значений, который невозможно объяснить с исключительно биологических позиций, так как данные субассоциации являются рефренами, т.е. формируются в сходных условиях и отличаются только признаку доминирования различных видов ив. Очевидно, что в ряду не должно быть значительных колебаний значений соответствующих мер. С нашей точки зрения, использовать указанные меры для определения сходства или различия серии описаний нежелательно. Мера разнообразия Уиттекера так сложно интерпретируется, потому что значения этой «меры» не нормированы (), т.е. в формуле пропущен сомножитель (n-1) в знаменателе. Сложности возникают и с индексом Коха, который можно использовать только в случае сравнения одинаковых по числу описаний серий (n), следовательно индекс зависит от n и при различных n производится расчёт по разным мерам K0, …, Kn, значения которых определяются в разных шкалах.

Этих проблем можно избежать, используя численные значения только одной меры сходства , т.к. мера K1 эквивалентна K0, а меры различия F0 и F1 коэквивалентны мерам сходства K0, и K1 соответственно (см. таблицу). Сходство описаний согласно мере сходства K0 возрастает от субассоциаций S.u. typicum (A1) к субассоциации S.u. spiraetosum salicifoliae (A3), затем в субассоциациях S.u. swidietosum (A4) и S.u. caricetosum appendiculatae (A5) стабилизируется и возрастает к ассоциации S.u. naumburgietosum thyrsiflorae (A6).

В итоге получена хорошо интерпретируемая мера для целей непрямой ординации, т.е. можно отметить отсутствие перепадов на участках A4 и A5, что согласуется с априорными предположениями М.Х Ахтямова (2001).

2.3 Временнбя динамика сообществ водорослей-макрофитов

Одним из важнейших направлений в биологии является изучение динамики экосистем. Нахождение регулярной структуры во временнум масштабе весьма редкое явление в силу большого числа факторов необходимых для её возникновения. Фенологические наблюдения ведутся в двух направлениях: наблюдения за неживой природой по инструментальным метеорологическим данным (различают наступление климатических сезонов), по изменениям физико-химических факторов водоёма (определяются гидрологические сезоны) и др.; наблюдения за живой природой: биоиндикационные исследования (дает нам информацию о биологических сезонах). Обширные данные экологического мониторинга позволяют спрогнозировать наступление соответствующих периодов (общая фенология) или же отметить изменение временнуй структуры сообществ (сравнительная фенология), что может быть использовано в различных областях человеческой деятельности: экономике, экологии, заповедном деле.

В данном разделе мы остановимся на биофенологических аспектах исследования временнуй динамики сообществ и покажем возможности теоретико-графовых методов для исследования временнуй динамики сообществ, а также оценим возможности по выделению биологических сезонов на основе данных только по видовому составу таксоцена водорослей-макрофитов с определёнными периодами вегетации (такие данные также известны как фенологические спектры (Шенников, 1964)), что видимо ранее не производилось по причине, главным образом, описательного характера фенологических наблюдений. Явление сезонности подразумевает наличие определенной закономерности, связи некоторых периодов по определенным критериям, причём периоды воспринимаются человеком дискретно (дни, месяцы, сезоны и т.п.), но, по своей сути, являются континуальными. Цель - исследование фенологической структуры таксоценов водорослей-макрофитов на предмет выявления регулярной временнуй структуры, а также нахождение соответствующего аналитического описания и графического представления обнаруженных зависимостей.

В данном примере нас интересует возможность применения алгоритмов построения оптимального графа к флористическим данным, причём объектами будут списки видов соответствующих временных интервалов (в данном случае - месяцев). Рассмотрим задачу построения оптимального графа для данных по временной динамике экосистем. Для построения интересующего нас графа (кратчайшего пути) требуется в матрице расстояний найти для каждого объекта (например, по строке) наименьшее значение различия (исключая диагональный элемент). Определённые таким образом объекты (столбец и строка) на графе соединяем дугой. Объекты не должны образовывать цикла до тех пор, пока не будут пройдены все вершины графа (получаем разновидность неориентированного графа). В качестве источника данных о близости объектов нами будут использоваться матрицы различия (расстояния), т.к. мы рассматриваем графы, для построения которых традиционно используются расстояния. В частности, здесь будем использовать меру различия (расстояние) Юрцева, которое является наиболее приемлемым для определения подобных отношений (Сёмкин, 2007):

,

где и - число видов в списке A и в списке B соответственно; - общее число видов для списка A и для списка B.

Для расчётов взяты литературные данные по вегетации в течение года водорослей-макрофитов залива Восток (Японское море), проведённые И.С. Гусаровой (1988) и В.Ф. Макиенко (1975) и бухты Витязь проведённые А.И. Кафановым и В.Е. Жуковым (1993).Залив Восток и бухта Витязь очень хорошо изучены (Коженкова, 2008) и (Суханов, Жуков, 2010) соответственно, что позволяет успешно использовать их для моделирования.

В работе И.С. Гусаровой (Гусарова, 1988) были приведены данные по периодам вегетации видов водорослей-макрофитов: всего 111 вегетирующих видов, из них 13 зелёных, 33 бурых и 65 красных. Для оценки отношений мы взяли таблицу, в которой представлены периоды вегетации водорослей. Отдельно отметим виды вегетирующие круглый год (константные виды). На основании первичной матрицы для периода с января (I) по декабрь (XII) нами была рассчитана матрица пересечений (табл. 9 сверху Приложения Б). Данные матрицы указывают на значительную равновеликость рядом расположенных диагональных элементов, что позволяет применять для них методы, определяющие отношения сходства (различия).

Последовательно (согласно детерминистской схеме (Сёмкин, Орешко, Горшков, 2009 а, б; 2010)) рассчитываем матрицу включения и симметричную матрицу различия (расстояний) мер Юрцева (табл. 9 снизу Приложения Б). Используя данные матрицы мер различия Юрцева построим граф по алгоритму получения кратчайшего пути (рис. 7 Приложения Б). В результате нами был получен оптимальный (гамильтонов) цикл. В теории графов получение гамильтонова цикла является архисложной задачей (эта задача известна также как задача коммивояжёра, т.е. задача построения цикла с учётом весовых значений). В литературе имеется опыт решения таких задач методом ветвей и границ (например, Рейнгольд, Нивергельт, Део, 1980). В нашем случае «природа сама решила» её, т.е. нам удалось выявить цикл связных объектов (месяцев) формальными (математическими) методами. Отметим некоторые сложности, которые возникли при построении данного оптимального графа. Объект XI тяготеет к месяцу III в большей степени (28.6%), чем к соседнему XII (31.3%), но III месяц уже включен в граф между II (16.9%) и III (7.8%), т.е. значения расстояния меньше. Следовательно, получаем последовательную связность компонентов годового цикла. Оценим влияние константных видов на общую временную структуру экосистем залива. Для этого мы удалим из первичных данных константные виды. Рассчитаем матрицу пересечений (табл. 10 сверху Приложения Б), матрицу расстояний Юрцева (табл. 10 снизу Приложения Б) и построим граф по алгоритму кратчайшего пути (рис. 8 Приложения Б). Отметим, что матрица пересечений для полного списка и матрица пересечений без константных видов связаны простой зависимостью:

,

где - матрица пересечений для полного списка; - матрица пересечений без константных видов; k - число константных видов; q - число списков. Или, говоря проще, для того чтобы нам из матрицы пересечений без константных видов вновь получить матрицу пересечений с полным списком видов надо к каждому элементу первой матрицы прибавить число равное количеству удалённых из первичной матрицы константных видов. Анализ оптимального графа (рис. 8 Приложения Б) показывает, что константные виды размывают представление о близости объектов, уменьшая значение метрического расстояния. Полученный граф изоморфен предыдущему.

В работе В.Ф. Макиенко (1978) исследования проводились в течение периодов: июнь-декабрь 1971, апрель-ноябрь 1972, февраль-март и май-август 1973 годов. В первичной таблице представлены: зеленые (10 видов), бурые (19) и красные (37) водоросли-макрофиты. Всего 66 видов. Произведём аналогичные расчёты для полного списка (табл. 11 Приложения Б) и граф (рис. 9 Приложения Б). Удаление константных видов (21 вид) даёт характерную картину изоморфной структуры с явным гамильтоновым циклом. Как и в предыдущем случае меняется лишь абсолютное значение расстояния, при сохранении масштаба близости.

Анализ графов по заливу Восток позволяет достаточно явно выделить весенне-летний (III-VII), осенний (VIII-XI) и зимний (XII-II) периоды (по данным И.С. Гусаровой); весенне-летний (III-VI), летне-осенний (VII-X) и зимний (XI-XII) периоды (по данным В.Ф. Макиенко). Распределение объектов близко, но есть расхождения. Возможно, они обусловлены выпадением января (I) в данных В.Ф. Макиенко, а также тем, что в работе Гусаровой И.С. приведён дополненный видами список (были добавлены виды, найденные в заливе Восток за период с 1975 по 1988 гг.).

По водорослям-макрофитам бухты Витязь (Японское море) взяты исследования А.И. Кафанова и В.Е. Жукова (1993) за период с июня 1979 г. по август 1980 г. Был обнаружен 101 вид водорослей (по данным (Суханов, Жуков, 2010) видовый состав близок к насыщенному - 103±3): 15 зеленых, 35 бурых и 51 красных. Авторами была подробно изучена фенологическая структура таксоцена макрофитов бухты на основе теоретико-графовых методов: построены дендрограммы, ориентированный граф включения. В результате: 1) были выделены четыре периода: зимний, весенний, летний и осенний; 2) выявлено несовпадение биологических и гидрологических сезонов. Мы, по аналогии с предыдущими примерами рассчитали матрицу пересечения (табл. 12 сверху Приложения Б) и матрицу расстояний Юрцева (табл. 12 снизу Приложения Б). Значения диагонали матрицы пересечений равновелики, не считая некоторых разрывов вследствие выпадения месяцев III и XI. На основе матрицы различия построим граф (рис. 10 Приложения Б).

Рассмотрим спорные ситуации. Объект XII на 26.8% тяготеет к I и II объектам. Включение II месяца в XII больше (93.8%) чем включение I месяца в XII (90.9%). Кроме того, в спорных моментах более сильным считается включение в меньший по числу видов список. Здесь это снова II месяц. Если убрать константные виды (26 видов), то замкнуть цикл не представляется возможным (табл. 13 Приложения Б) и мы можем получить лишь оптимальный путь (рис. 11 Приложения Б).

Объект VIII тяготеет к VI на уровне 37.2%, также как и V к VI, но в V месяце меньше видов. Объект X ближе к VII, VI, V (но они тяготеют больше к соседним месяцам). Наиболее проблемным является XII месяц: он тяготеет к IX месяцу, хотя ближе к соседям, но его близость к IV месяцу (на уровне 62.5%) разрушает цикл, потому что IV месяц тяготеет ко II только на 79.2%. Даже если отбросить эту проблему, то ситуация осложняется еще и тем, что XII тяготеет одинаково к I и к II месяцу, как и в случае полного списка.

Очевидно, что разрыв цикла связан с недостатком данных по видовому составу III и XI месяцев. Причём, более явно это влияние проявляется без размывания уровня близости константными видами.

Глава 3. Биоинформационная система «Биоразнообразие»

В данной главе мы непосредственно обратимся к такому научному направлению как биоинформатика. В основе биоинформатики лежит понятие «биологической информации», которая обладает рядом весьма специфических свойств. Основной объект нашего интереса это компоненты биологического разнообразия, а в частности компоненты растительного покрова (виды растений, растительные сообщества, спектры, биоморфы и т.д.). «Биологическое разнообразие не есть только простое множество объектов разного типа, но это внутреннее свойство системы, которое раскрывается нами с помощью разных на нее взглядов, создания разных моделей фитоценоза. И позволяет это делать объективно существующее разнообразие качеств, свойств, сторон растительных организмов и наши различные представления о наиболее функционально значимых из них» (Ганнибал, 2007).

Понятие «биологическое разнообразие» за весьма короткий отрезок времени получило большое количество толкований. В биологическом смысле рассматриваются представления о генетическом, видовом и ценотическом и надценотическом разнообразии жизни. Однако в дальнейшем, сначала деятели охраны природы, а затем и ученые стали говорить об экосистемном и ландшафтном разнообразии как объектах сохранения, а, соответственно, выделения в природе и изучения (см. например, Юрцев, 1991; Бочарников, 1998; География…, 2002; Сохранение…, 2002; Шитиков, Розенберг, Зинченко, 2005). В 1992 году на Конференции ООН по устойчивому развитию была принята «Конвенция о биологическом разнообразии», к которой присоединилось большинство стран на планете (в том числе Россия), а, следовательно, сложнейшая и многообразнейшая проблема биоразнообразия приобрела еще и политическое звучание (География…, 2002). Большинство исследователей сходятся во мнении, что словосочетание «биологическое разнообразие» впервые применил Г. Бэйтс в 1892 г. в работе «Натуралист на Амазонке» (рус. перевод: Бейтс, 1958), когда описывал свои впечатления от встречи около 700 разных видов бабочек за время часовой экскурсии (см. например, Лебедева, Дроздов, Криволуцкий, 1999; Протасов, 2002; Шитиков, Розенберг, Зинченко, 2005). Однако основные научные концепции биоразнообразия были сформулированы лишь в середине ХХ века, что напрямую связано с развитием количественных методов в биологии. Особенно отметим работы Р. Уиттекера (Whittaker, 1970; 1972), в которых была предложена организация уровней экосистемного разнообразия и исследованы зависимости биоразнообразия от факторов окружающей среды. В дальнейшем идеи Р. Уиттекера были развиты и в настоящее время схематически совокупность уровней биоразнообразия F(R) можно представить в следующем виде (География…, 2002):

.

Всё это типологическое многообразие сводится к двум типам разнообразия - инвентаризационному, т.е. разнообразию внутри системы и дифференцирующему, т.е. разнообразию между системами. Инвентаризационное разнообразие обычно оценивается с помощью унарных индексов, а дифференцирующее с помощью n-арных (чаще бинарных) мер. Здесь нижний ряд греческих букв обозначает инвентаризационное разнообразие. Например, для растительного покрова: (омега) - разнообразие планетарной флоры; (хи) - разнообразие флористического царства; (ипсилон) - разнообразие флористической области; (сигма) - разнообразие флористической провинции; (пи) - разнообразие флористического округа; (кси) - разнообразие флористического района; (мю) - разнообразие конкретной флоры. Верхний ряд букв соответствует дифференцирующему разнообразию. Для растительного покрова соответственно: (пси) - разнообразие между флористическими царствами в пределах флоры планеты; (фи) - разнообразие между флористическими областями в пределах царства; (тау) - разнообразие между флористическими провинциями в приделах флористической области; (ро) - разнообразие между флористическими округами в пределах флористической провинции; (омикрон) - разнообразие между флорами районов в пределах флористического округа; (ню) - разнообразие между конкретными флорами в пределах флористического района.

Исследование различных аспектов биоразнообразия является одним из магистральных направлений концепции устойчивого развития (Loreau et al., 2001). Устойчивое развитие определяют как управляемый процесс коэволюционного развития природы и общества. Как деятельность, устойчивое развитие нуждается в поддержке мощных информационных баз данных по экологическим, социально-демографическим, производственно-экономическим факторам и тенденциям их развития. На основе этих данных строятся модели экономического благополучия и проводятся научные исследования. Здесь мы сталкиваемся с рядом проблем. Во-первых, объемы первичной информации для устойчивого развития территорий, даже локального уровня, очень велики (Крестов, 2001; 2005; 2006; Сёмкин, Гарбузова, Майоров, Горшков, 2009). В связи с этим проявляется проблема накопления, целенаправленного структурирования и обработки колоссального объема информации (Горшков, 2008). Во-вторых, существует проблема получения качественно новой информации на основе первичной (здесь следует отметить, что на данный момент накопилось большое количество тематической информации в различных форматах) (Остроумова, 2000; Батурина, Чернобаева, 2007). Анализ информации невозможен без адекватного математического аппарата и на его разработку в различных областях тратится «львиная доля» ресурсов. В-третьих, необходима единая концептуальная схема, объединяющая этапы сбора, обработки, анализа данных и прогноза.

В настоящее время существует несколько попыток реализации информационных систем с экологическим наполнением. Как правило, подразумевается создание некоторой ЭИС (экологическая информационная система) (Основы геоинформатики…, 2004; Шитиков, Розенберг, Зинченко, 2005).

Для решения этих проблем нами предлагается использовать биоинформационную систему «Биоразнообразие», основные идеи которой представлены нами в ряде работ (Горшков, 2008; Сёмкин, Орешко, Горшков, 2005 а, б) и на Интернет-ресурсе, посвящённом сравнительному анализу в биологии (www.biocomparison.ucoz.ru). Биоинформационная система (БИС) «Биоразнообразие» используется для целей сравнительного анализа флор, фаун, сообществ и других биологических объектов. БИС содержит математическое обеспечение для анализа компонентов биоразнообразия на уровне видов, ценозов и сообществ. Структура БИС «Биоразнообразие» нами определена как совокупность трёх основных подсистем.

1. Базы данных, содержащие компоненты биоразнообразия;

2. Программы для обработки компонентов биоразнообразия;

3. Информационно-справочная система по биоценометрии.

3.1 Базы данных, содержащие компоненты биоразнообразия

Экологи и биологи в процессе научно-практической деятельности собирают большое количество фактического материала, характеризующего различные аспекты жизнедеятельности животного и растительного мира. В настоящее время большая часть этого оригинального материала находится в виде бумажных архивов и не представляет собой организованной информационной среды, которая является необходимой основой для современных научных исследований.

Первичные данные, переведённые в электронный вид (нами для расчётов используется формат Excel), являются информационной основой БИС «Биоразнообразие». С использованием баз данных по компонентам биоразнообразия и специализированных компьютерных программ появилась возможность сравнивать фитохории рангов провинций и областей, при этом обрабатывать видовые списки размером в несколько тысяч (Крестов, 2001; 2005; 2006; Малышев, 2002). Базы данных содержат информацию по различным компонентам биоразнообразия (списки видов животных и растений, таксономические спектры, экологические спектры, географические спектры и др.). Кроме того, базы данных могут содержать обобщённую информацию в виде матриц пересечений, включения, сходства и др. Зачастую исследователи не выдают своих первичных данных, накопленных с большим трудом до тех пор пока сами не получат из них всю возможную информацию. Но здесь возникает проблема воспроизводимости результатов, т.е. такие исследователи публикуют данные о закономерностях, полученных из «чёрного ящика», в который никто кроме них самих не может заглянуть и оценить адекватность выявленных закономерностей а, следовательно, теряется сам смысл таких публикаций и выводы автора приходится принимать на веру. Возможно, компромиссным вариантом будет публикация матриц пересечения, которые позволяют производить обработку данных, но не требуют представления первичных данных в открытой печати.

Для обработки открытых первичных данных необходимо создать биоинформационную систему, содержащую первичные данные (в виде электронных таблиц) и всю необходимую информацию для проверки предложенных в статье методов обработки данных. При налаживании быстрых информационных коммуникаций (Шокин, Федотов, 1998; Мещеряков, Хомоненко, 2001) можно произвести расчёты по первичным данным и установить достоверность выводов (воспроизводимость в широком смысле слова). Современные информационные технологии в настоящее время позволяют приступить к широкомасштабному переводу накопленной информации в электронную форму и созданию принципиально новых видов информационных ресурсов, какими, например, являются биологические базы данных, электронные коллекции и т.п. (Шокин, Федотов, 1998).

Но из-за сложности формализации выбора описания возникают принципиальные затруднения: «на пути к эффективной компьютеризации процесса обработки геоботанических материалов» (Боряков, Воротников, Борякова, 2005). В первую очередь необходимо определиться с целью использования данных. Если их функция сугубо информирующая (сводные списки) и не подразумевает обработки, то тогда автор будущей базы данных выбирает максимально простой текстовый формат, в дальнейшем его можно будет массово представить с помощью Интернет-технологий (более сложным вопросом будет представление этих данных с помощью полноценной базы данных). Если исследователь желает обрабатывать эти данные, то здесь необходимо обратиться к редакторам электронных таблиц. Обзор существующих программных средств данной специализации показывает, что существуют коммерческие продукты Lotus 1-2-3, Quattro Pro и Excel (явный доминирующий продукт рынка) и некоммерческие редакторы, представляющие компоненты офисных пакетов «с открытым кодом» Open Office и Star Office. Отметим, что некоторые современные пакеты математических и статистических программ имеют табличную структуру (почти без возможности применения формул) и, зачастую, совместимы с MS Excel. Кроме того, в MS Excel предусмотрена возможность достаточно мощной обработки данных, которые усиливаются возможностями встроенного языка программирования VBA, что по достоинству оценили и биологи (Новаковский, 2006).

На данный момент уже накоплено некоторое количество данных в информационных системах различных уровней, связанных с экологическими исследованиями (Бочарников, 1998; Bisby, 2000; Edwards, Lane, Nielsen, 2000; Федотенков, 2005). Отметим основные и наиболее крупные информационные системы, содержащие информацию о компонентах биоразнообразия:

1. Информационная система GRID (Global Resource Information Database, Глобальная база данных о ресурсах). Создана UNEP. В задачи GRID входит организация, анализ и хранение данных об окружающей среде, полученных из различных источников. В системе используется информация, собираемая в результате деятельности ГСМОС (системы глобального мониторинга) при осуществлении различных программ UNEP, находящаяся в распоряжении международных и национальных, правительственных и научных организаций. Конечной целью сбора и анализа данных является получение информации, которая может использоваться для принятия решений. Данные в GRID хранятся электронном виде в формате геоинформационной системы ArcInfo.

2. Информационная система ИНФОТЕРРА. Также создана UNEP для содействия международному обмену экологической информацией.

3. Программа по исследованию биоразнообразия Diversitas (Dirzo, Loreau, 2005).

4. Информационная система BioDat. Пример известной российской информационной системы экологической направленности (http://www.biodat.ru).

Несмотря на впечатляющие вычислительные возможности, огромные финансовые и человеческие ресурсы, брошенные на решение этих задач (Redfearn, 1999), в настоящее время не существует адекватной концептуальной схемы создания базы данных компонентов биологического разнообразия, которая бы использовалась повсеместно (Горшков, 2008).

3.2 Программы для обработки биологических данных

Биологи и прикладные математики имеют достаточно большой опыт использования пакетов статистических и математических программ в обработке своих данных (Новаковский, 2006). Более последовательным является рассмотрение используемых в настоящее время программных продуктов и публикаций, которые подтверждают использование этих программ. Очевидно, что пользователи склонны использовать те методы и критерии, которые представлены в популярных статистических и математических пакетах (Пузаченко, 2004; Шитиков, Розенберг, Зинченко, 2005).

Рассмотрим основные программные продукты, применяемые в области обработки экологических данных. Весьма условно можно разделить их на математические и статистические пакеты. Несколько в стороне находятся средства визуального представления зависимостей, т.к. многие крупные пакеты включают в себя, кроме прочего, возможности графического представления данных. Большая часть математических программ обеспечивает вычисления в области линейной алгебры и интегрально-дифференциального исчисления, численных методов и математического моделирования. Можно выделить из коммерческих Mathematica, Maple, Mathcad, Matlab (есть свободные аналоги - Scilab и Octave); из некоммерческих - Axiom, Maxima, Sage. Основные проблемы таких программ для биологов в сложности интерфейса (как правило, работа с такими программами напоминает программирование) и в ориентированности на теоретические конструкции математики (перечислены выше), адаптировать которые пользователю-биологу под свои задачи предлагается самостоятельно. Пакеты статистических программ значительно проще для конечного пользователя, т.к. зачастую обладают интуитивным интерфейсом. Это пожалуй, самый популярный статистический пакет Statistica. Пакет содержит весьма солидный перечень аналитических процедур и активно используется многими исследователями (Шитиков, Розенберг, Зинченко, 2005). Модуль «Кластерный анализ» предлагает весьма ограниченный перечень мер близости, представленный только мерами различия, построить какие-либо графы кроме дендрограммы не представляется возможным. Пакет SPSS (http://www.spss.com) является одной из старейших систем статистического анализа данных и основном конкурентом пакета Statistica. Намного реже используются: SAS, S-plus, NCSS, Statgraphics. К свободным продуктам относится язык программирования для статистической обработки R и его оболочки.

Отметим специализированные программы для построения графов. К наиболее удачным относятся коммерческие Ilog, GoView, Lassalle AddFlow, LEDA (есть бесплатная редакция (http://www.algorithmic-solutions.com/leda/ledak/index.htm)). Из бесплатных можно отметить Boost Graph Library (http://www.boost.org/). Для визуализации графов можно использовать Graphviz (http://graphviz.org/) (по мнению экспертов, она хорошо работает для орграфов) или LION Graph Visualizer (http://lion.disi.unitn.it/intelligent-optimization/visualizer.html). Особо отметим программу «Графоанализатор» (http://grafoanalizator.unick-soft.ru) - это русскоязычная программа, с весьма простым пользовательским интерфейсом.

Также рассмотрим специальные программы для биологических расчётов. В той связи интересна обзорная работа А.Б. Новаковского (Новаковский, 2006), в которой рассматриваются современные программы для обработки геоботанических и экологических данных. Множество ссылок дано на сайте В.П. Леонова (http://www.biometrica.tomsk.ru/list/other.htm), программы учитывающие специфику сравнительного анализа в биологии (http://www.exetersoftware.com), огромное количество программ для филогенетических расчётов можно найти на Интернет-портале Вашингтонского университета (http://evolution.genetics.washington.edu), тайваньскими специалистами создана программа Spade (http://chao.stat.nthu.edu.tw). Подобных «малых» программ, созданных для частных целей, довольно много, но широкое распространение получили лишь немногие. Многие исследователи отмечают, что для биолога весь этот огромный перечень сложнейших методов недостаточен. Редко в каком-нибудь пакете можно найти расчёт меры Жаккара или меры Сёренсена (например, Graphs, NTSYS, BIODIV, PAST и др.). Но при использовании классов мер смысл приведения огромного количества мер теряется.

По причине того, что математический аппарат, предложенный нами для оценки компонентов биоразнообразия ещё не получил должного распространения, ни в одном из рассмотренных программных продуктов не может быть соответствующих процедур. Для решения этой проблемы нами предлагается программа «BioComparison» (замена ранее объявленной в наших публикациях, но не законченной программы «Биоценометрия»), которая предназначена для сравнительного анализа биологических данных (Горшков, 2010). Алгоритмы программы основаны на изложенном в данной работе математическом аппарате и реализованы с помощью языка VBA (Visual Basic for Applications) в среде MS Excel 2003.

Возможности программы позволяют произвести сравнительный анализ биологических объектов, имеется возможность графической визуализации (программа и инструкция к ней выложена на сайте www.biocomparison.ucoz.ru). Программа «BioComparison» имеет ряд блоков (рис. 1 Приложения В):

1. Блок «Матрицы». Состоит из трёх вкладок:

· Вкладка «Бинарные» (рис. 2 Приложения В). Позволяет рассчитать матрицы пересечений, включения, сходства, различия, причём расчёт может начинаться с матриц наблюдения, пересечений, включения, сходства, различия. Предусмотрено задание индексов ф и з.

· Вкладка «Многоместные» (рис. 3 Приложения В). Позволяет рассчитать первичные компоненты n-арных мер (S, T, n) по матрице наблюдений; возможен расчёт индекса Коха, K0 и F0.

· Вкладка «Унарные» (рис. 4 Приложения В). Позволяет рассчитывать матрицу долей из матрицы значений. Возможен расчёт мер семейства Реньи, семейства Хилла и семейства Колмогорова; абсолютной и относительной мер разнообразия R(p), индекса концентрации Бергера-Паркера, коэффициента вариации и его нормированной формы, меры диссонанса Розенберга.

2. Блок «Несимметричные графы» (рис. 5 Приложения В). Позволяет (при заданном пороге) построить ориентированный граф (на отдельном листе) или рассчитать таблицу индексов преобладания на основе матрицы включения.

Программа «BioComparison» будет развиваться, и дополняться в дальнейшем, реализуя новейшие разработки в области теории близости. Все расчёты в данной диссертационной работе были произведены полуавтоматическим способом: в среде MS Excel 2003 рассчитывались матрицы, с помощью графических редакторов создавались графы. Все примеры, приведённые в разделе 4, были вторично использованы для всестороннего тестирования программы «BioComparison».

3.3 Информационно-справочная система по биоценометрии с комментариями

Ранее было показано, что во многих работах по сравнительной флористике, количественной экологии и других научных направлениях используются различные показатели близости для обработки данных и методы определения отношений в виде графов, дендрограмм и др. Обзоры по использованию методов сравнительного анализа в биологии имеют методологические или методические ошибки (Песенко, 1982; Legendre, Legendre, 1983; Kershaw, Looney, 1985; Digby, Kempton, 1987; Мэгарран, 1992; Уланова, 1995; Magurran, 2004; Шитиков, Розенберг, Зинченко, 2005). Для консультационных целей и целей обучения нами предлагается информационно-справочная система с комментариями.

Информационно-справочная система по биоценометрии как часть БИС «Биоразнообразие» реализована на основе базы библиографических данных Тихоокеанского института географии (на основе MS Access 2003), созданной А.П. Орешко (рис. 6-8 Приложения В). Предложенная нами информационно-справочная система имеет и ряд особенностей (Сёмкин, Орешко, Горшков, 2005 а, б). В частности это наличие рефератов с комментариями по предметной области (рис. 8 Приложения В). В комментариях к источникам отмечены следующие компоненты: 1) Особенности данного источника и его вклад в общую теорию мер близости; 2) Ошибки (если таковые имеются) и их корректировка; 3) Представление формул в современных теоретико-множественных обозначениях. Пользователь имеет возможность сортировать список источников в системе по автору, названию, году издания и ключевым словам (рис. 7 Приложения В). Окна для выбора критерия сортировки позволяют производить иерархическую сортировку в различном порядке (рис. 6 Приложения В). При этом можно задавать выполнение всех фильтров сразу, либо любого из фильтров. По каждому фильтру можно строить логическую структуру с использованием операторов «И» и/или «ИЛИ». Для любого фильтра можно задавать любую его часть. Это удобно в случае, если пользователь не знает точного написания поискового значения. В конце списка источников имеется две гиперссылки: «реферат» и «доп. реферат». Щелчок левой клавишей мыши на первой ссылке приведет к открытию реферата в отдельном окне, одном и том же для разных изданий. Щелчок на второй гиперссылке приведет к открытию реферата в новом дополнительном окне. Это дает возможность сравнивать рефераты между собой. Планируется регулярное дополнение базы данных новыми источниками, сопровождаемых комментариями, а также интеграция базы с Интернет. В настоящее время информационную функцию на себя частично взял сайт Горшкова М.В. на платформе Ucoz (www.biocomparison.ucoz.ru).

Информационно-справочную систему по биоценометрии с комментариями целесообразно использовать для обучения студентов и аспирантов в области биоценометрии, а также для консультационной помощи специалистам различных научных направлений, связанных с биоценометрией, биоинформатикой и математической биологией.

Заключение

В настоящей диссертационной работе, на основе схемно-целевого подхода нами решены некоторые методологические и методические задачи математической биологии:

1. Представлена схема сравнительного анализа биологических объектов, с аксиоматическими основаниями использования мер близости (сходства, совместимости, взаимозависимости, включения и двойственных им мер), определены основные классы мер близости и на их основе предложена для использования только одна (оптимальная) мера для каждого класса мер, а как следствие и для каждого класса формализованных биологических объектов. С учётом приведённых методологических принципов создана биоинформационная система «Биоразнообразие», в частности автором посредством языка VBA в среде MS Excel адаптированы и реализованы основные математические алгоритмы в виде программы BioComparison.

2. Уточнены границы некоторых районов дальневосточного побережья РФ по видовому составу водорослей-макрофитов, отражена роль зелёных, бурых и красных водорослей в создании общей видовой структуры (структура построенных графов показывает непрерывный переход флор районов Северо-западной Пацифики в пределах бореальной зоны), как наиболее оригинальные флоры выделены центры видового разнообразия. Показана лучшая интерпретируемость мер сходства в сравнении с мерами разнообразия и концентрации для определения систематической структуры сообществ.

3. Для определения однородности условий на основе градиента увлажненности совокупности связанных субассоциаций прирусловых лесов р. Амур приведена методика непрямой ординации на основе n-арных мер.

4. Рассчитана теоретико-графовая модель временнуй структуры таксоцена водорослей-макрофитов, на основе которой показано, что виды, вегетирующие в течение года, сильно размывают представление о сходстве объектов, и их удаление из общего списка не меняет общую структуру графа. Выявлено, что биологические сезоны только по видовым спискам с помощью анализа оптимального пути для годового цикла и дендрограммы невозможно выделить однозначно в силу континуальной природы исследуемых объектов

Мы убеждены, что все рассмотренные методы будут широко применяться в биологии для оценки сходства, разнообразия видов, ценозов, особей, генов, надценотических структур и др. Об этом косвенно говорят факты использования вышеупомянутых мер и их модификаций (зачастую необоснованных) в гидробиологии, биохимии, сравнительной геномике, молекулярной биологии, биометрии, биогеографии, а также в других биологических и географических науках.


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.