Сравнительный анализ компонентов растительного покрова

Историко-методологические аспекты сравнительного анализа в экологии. Меры разнообразия и близости, используемые в сравнительном анализе компонентов растительного покрова: флоры водорослей-макрофитов; субассоциации лесов р. Амур. Биоинформационная система.

Рубрика Экология и охрана природы
Вид диссертация
Язык русский
Дата добавления 17.01.2016
Размер файла 3,2 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

. . .

. . .

. . .

i

mi1

mi2

. . .

mij

. . .

min

. . .

. . .

. . .

. . .

. . .

. . .

. . .

n

mn1

mn2

. . .

mnj

. . .

mnn

Этот тип матрицы является основным «документом» исследования (после самых списков видов), т.к. матрица пересечений содержит информацию о числе видов в каждом списке и число видов общих для каждой пары сравниваемых списков. Достоинство данной матрицы состоит в том, что по данным этой матрицы можно рассчитать другие типы матриц (матрицы включения, сходства, транзитивного замыкания и др.), т.е. реализовать принцип воспроизводимости в узком смысле (Сёмкин, 1983). Элементы матрицы пересечений определяются по формуле:

,

где mij - элемент, находящийся в i-ой строке и j-ом столбце; ; ; ; , (i, j = 1, …, n; k = 1, …, r).

Матрица симметрична относительно главной диагонали, т.е. . В связи с этим свойством для дальнейших расчётов используют только часть элементов, расположенных по диагонали и под диагональю (общее количество этих элементов равно ). Наддиагональные элементы можно не приводить, т.к. их легко восстановить в силу симметрии матрицы.

Несмотря на достаточно компактную форму матриц пересечения (количество столбцов и строк равно количеству сравниваемых объектов), размеры таблиц иногда бывают достаточно велики. Для частных случаев подобные способы компактной записи матриц ранее приводились в литературе (см. например (Андреев, Козлов, 1983)). Рассмотрим здесь общий способ компактной записи приводимых матриц пересечений (без потери информации). Разобьём квадратную матрицу пересечений на две прямоугольные матрицы. При чётном n первая прямоугольная матрица имеет размер , а вторая . Возьмём первую из них, имеющую большую размерность и рассмотрим показатель, характеризующий полноту заполнения этой матрицы элементами:

.

1) Пусть n и k чётные числа. Тогда при k = 0 и k = 2 имеем и соответственно. В первом случае невозможно включить всю необходимую информацию из матрицы пересечений в прямоугольную матрицу, а во втором останутся незаполненными ещё ячеек.

2) Пусть n и k нечётные числа. Тогда при k = 1 и k = 3 имеем и соответственно. В первом случае квадратная матрица включает всю необходимую информацию из матрицы пересечений (пустых мест нет), а во втором останутся незаполненными ещё n ячеек.

Для иллюстрации метода приведём примеры прямоугольных таблиц:

> ,

> .

В случае нормирования меры пересечения к 1, получаем меру процентного сходства (одна из мер сходства). Это означает, что матрицу мер пересечения можно также использовать и как матрицу мер сходства (только если мы имеем дело с долями - на диагонали 100 % (Ковалевская и др., 1970)).

1.4.7 Матрица относительных несимметричных мер конвергенции

Для ненормированных данных матрица пересечений легко преобразуется в матрицу мер включения (табл. 3). Для этого необходимо элементы каждой строки матрицы пересечения разделить на соответствующий этой строке диагональный элемент. Например, элементы i-ой строки mi1, mi2,…, mij,…, mir делятся на диагональный элемент mii и получается следующая строка:

.

В результате получаем матрицу включения (табл. 3).

Таблица 3

Матрица включения

1

2

. . .

j

. . .

n

1

m11 / m11

m12 / m11

. . .

m1j / m11

. . .

. . .

m1n / m11

2

m21 / m22

m22 / m22

. . .

m2j / m22

. . .

m2n / m22

. . .

. . .

. . .

. . .

. . .

. . .

. . .

i

mi1 / mii

mi2 / mii

. . .

mij / mii

. . .

min / mii

. . .

. . .

. . .

. . .

. . .

. . .

. . .

n

mn1 / mnn

mn2 / mnn

. . .

mij / mnn

. . .

mnn / mnn

Стрелка () указывает направление включения одной флоры в другую. Например, первая строка матрицы означает степень включения флоры №1 в остальные флоры под №2, ..., n. Элементы матрицы включения, находящиеся симметрично относительно главной диагонали не равны друг другу, т.е. матрица включения несимметрична относительно диагонали, а на самой диагонали значения равны 1 (или 100%).

Матрица включения является весьма полезным источником информации об отношениях «целого-части» и адекватно показывает «роль» каждого объекта в общей системе (Сёмкин, Орешко, Горшков, 2009 б). Из этой матрицы мы можем получить ориентированные графы включения-сходства (рассмотрим ниже).

При рассмотрении большого количества списков видов и наличии многих односторонних и двухсторонних связей между этими списками, графы включения-сходства теряют геометрическую наглядность. В подобных случаях целесообразно использовать индексы преобладания полустепеней захода дуг графа над полустепенями исхода дуг для вершины графа. Этот индекс рассчитывается по соответствующей формуле (Сёмкин, Куликова, 1981):

,

где d (A) - индекс «преобладания» вершины A графа; d+ (A) - число дуг, входящих в вершину A графа; d- (A) - число дуг, исходящих из вершины A графа; n - число вершин графа. Полученные данные удобно представить в виде таблицы. Этот метод позволяет достаточно чётко выделять наиболее «оригинальные» и наиболее «банальные» флоры. Рассмотренный метод уже применяется в экологических исследованиях (Кафанов, 1994; Сёмкин и др., 2007; Сёмкин, Селедец, Майоров, Горшков, 2009; Сёмкин, Гарбузова, Майоров, Горшков, 2009; Сёмкин, Клочкова, Гусарова, Горшков, 2010 а, б).

Следует особо отметить, что меры включения более информативны, чем меры сходства, т.к. последние, по сути, представляют собой усреднённые показатели и, следовательно, теряют часть информации об объектах, а меры включения адекватно оценивают более распространённые в природе нетранзитивные отношения. Например, один список может включаться на 100% в другой список, а другой список в свою очередь включаться только на 10%. При этом коэффициент сходства не сможет адекватно отразить эти отношения, т.к., например, 10 общих видов значительны для одного списка в 10 видов, но не столь значимы для большого списка в (к примеру) 100 видов. Мера сходства Сёренсена в данном случае будет равна около 20%.

Можно даже построить аналог дендрограммы, используя меры включения (тогда сходство будет определяться по наименьшему из включений). Но с точки зрения идеологии схемно-целевого подхода приведённые манипуляции не имеют смысла, т.к. там, где мы для разновеликих множеств используем только меры включения, не имеет смысла строить дендрограмму, которая отражает симметричные отношения сходства.

1.4.8 Матрица относительных симметричных мер конвергенции

Существует два способа получения матрицы сходства (Сёмкин, Орешко, Горшков, 2010). Классический способ - это получение матрицы сходства напрямую путём расчёта конкретной меры сходства для каждой пары объектов.

Второй способ (Сёмкин, 2007) заключается в симметризации матрицы включения (см. Приложение А). Данный способ позволяет обеспечить требуемую преемственность между мерами включения и мерой сходства по классу ф. Например, мере сходства Сёренсена (K0,-1 (A,B)) соответствуют меры включения K0,-1 (A;B) и K0,-1 (B;A), а мере сходства Жаккара (K1,-1 (A,B)) соответствуют меры включения K1,-1 (A;B) и K1,-1 (B;A).

Последовательно преобразуя матрицу включения (табл. 3), получаем типичную матрицу сходства (табл. 4).

Таблица 4

Матрица сходства

№ флоры

1

2

. . .

j

. . .

n

1

1

K12

. . .

K1j

. . .

K1n

2

K21

1

. . .

K2j

. . .

K2n

. . .

. . .

. . .

. . .

. . .

. . .

. . .

i

Ki1

Ki2

. . .

Kij

. . .

Kin

. . .

. . .

. . .

. . .

. . .

. . .

. . .

n

Kn1

Kn2

. . .

Knj

. . .

1

Следует отметить, что данный приём удобен именно при схемно-целевом подходе (Сёмкин, 2009). Матрица сходства является информационной основой для получения закономерностей сходства списков. На данном этапе можно использовать и матрицу различия (расстояний), которая будет двойственной матрице сходства (подробнее в работе: Сёмкин, Орешко, Горшков, 2010 и в Приложении A).

1.4.9 Алгоритмы упорядочивания данных

Исследователями отношений близости разработано весьма солидное количество методов упорядочивания данных. Самыми распространёнными являются методы теории графов (Оре, 1969, 2002; Харари, 2003, Робертс, 1986) и кластерного анализа (Дюран, Оделл, 1977; Мандель, 1978; Айвазян и др., 1989). Обзор методов упорядочивания данных можно посмотреть в следующих работах (Орлов, 2009; Бериков, Лбов, 2008).

Практически все алгоритмы упорядочивания данных исходят из того, что некое множество объектов характеризуется определённой степенью связности. Здесь сразу же появляются первые «подводные камни». Между объектами может просто не оказаться никакой связи, но математический аппарат нечувствителен к таким «мелочам» и в любом случае выдаёт классификационное разбиение.

На эту проблему неоднократно указывали исследователи методов кластерного анализа и теоретико-графовых методов (Дюран, Оделл, 1977; Сокал, 1980; Соломон, 1980; Кафанов, Борисовец, Волвенко, 2004; Кафанов, 2005 а). А.И. Кафанов с соавторами в одной из своих последних работ по кластерному анализу (Кафанов, Борисовец, Волвенко, 2004), после довольно резкой и подробной критики методов, отметили: «Таким образом, исследователь, выбирая тот или иной метод обработки эмпирических данных, предварительно должен для себя решить, должна ли получаемая им схема в принципе быть иерархической». Эта мысль чётко коррелирует с основной идеей схемно-целевого подхода и заставляет исследователя чётко сформулировать цель до применения математических методов.

Кроме того, следует заметить, что почти все алгоритмы упорядочивания данных имеют графическую форму представления, что позволяет получить такие преимущества как выразительность, доходчивость, лаконичность, универсальность и обозримость. «Достоверно и то, что теория графов служит математической моделью для всякой системы, содержащей бинарное отношение» (Харари, 2003).

Рассмотрим основные методы упорядочивания данных, применяемых в биологических науках и формы их графического представления. В настоящей диссертационной работе нами не рассматривались методы ординации, т.к. они преследуют другие цели (Goodall, 1954; Александрова, 1969; Kershaw, Looney, 1985; Миркин, Наумова, Соломещ, 2002).

1.4.9.1 Кластерный анализ

Впервые термин «кластерный анализ» (cluster (англ.) - гроздь, сгусток, пучок) был предложен математиком К. Трионом (по Мандель, 1978). Метод широко используется в геоботанике, экологии и численной таксономии и др. (Goodall, 1970; 1973; Jardine, Sibson, 1971; Austin, 1972; Sneath, Sokal, 1973; Дюран, Оделл, 1977; Pielou, 1977; Джефферс, 1981; Сёмкин, 1987 в). Можно выделить основные подходы, используемые в кластерном анализе (по: Бериков, Лбов, 2008):

1. Вероятностный подход. Предполагается, что каждый рассматриваемый объект относится к одному из k классов (в терминологии Орлова (2004) это методы сортировки, распознавания образов, обучения с учителем и т.п.). К алгоритмам этого подхода относится: метод k-средних, метод FOREL.

2. Подходы на основе систем искусственного интеллекта. Кластер представляется в виде нечёткого множества (алгоритм нечётких C-средних), в виде нейрона искусственной нейронной сети (самоорганизующиеся сети Кохонена), в виде условных хромосом (генетические алгоритмы) и др.

3. Логический подход. Построение дендрограммы осуществляется с помощью дерева решений.

4. Теоретико-графовый подход. К алгоритмам этого подхода относится: алгоритм кратчайшего незамкнутого пути, алгоритм ближайшего соседа и др.

5. Иерархический подход. Предполагается наличие вложенных групп (кластеров различного порядка). Алгоритмы в свою очередь подразделяются на агломеративные (объединительные) и дивизивные (разделяющие). По количеству признаков иногда выделяют монотетические и политетические методы классификации. Последние были хорошо рассмотрены в обзорной работе Ю.А. Песенко (Песенко, 1982).

В данной диссертационной работе будем использовать иерархические агломеративные методы. Результаты группировки указанными методами представляется в форме дендрограммы, которая является графом без циклов, напоминающим дерево. Дендрограмма позволяет изобразить взаимные связи между объектами из заданного множества. Для создания дендрограммы требуется матрица сходства (или различия), которая определяет уровень сходства между парами объектов. Далее необходимо выбрать метод построения дендрограммы, который определяет способ пересчёта матрицы сходства (различия) после объединения очередных двух объектов в кластер.

В работах по кластерному анализу описан довольно внушительный ряд способов построения дендрограмм. Рассмотрим основные:

1. Метод одиночной связи (single linkage). Также известен, как «метод ближайшего соседа».

2. Метод полной связи (complete linkage). Также известен, как «метод дальнего соседа».

3. Метод средней связи (pair-group method using arithmetic averages).

3.1. Невзвешенный (unweighted).

3.2. Взвешенный (weighted).

4. Центроидный метод (pair-group method using the centroid average).

4.1. Невзвешенный.

4.2. Взвешенный (медианый).

5. Метод Уорда (Ward`s method).

Для первых трёх методов существует общая формула, предложенная А.Н. Колмогоровым (по Айвазян и др., 1989):

, ,

где i, j - группа из двух объектов (кластеров) i и j; k - объект (кластер), с которым ищется сходство указанной группы; ni - число элементов в i кластере; nj - число элементов в j кластере. Как видим, формула схожа с формулой осреднения мер включения из Приложения А.

Центроидный метод использует для пересчёта матрицы расстояний (Sneath and Sokal, 1973). В качестве расстояния между двумя кластерами в этом методе берется расстояние между их центрами тяжести. Для этих методов также есть общая формула Ланса-Уильямса (Lance, Willams, 1967).

В методе Уорда в качестве расстояния между кластерами берется прирост суммы квадратов расстояний объектов до центров кластеров, получаемый в результате их объединения (Ward, 1963). В отличие от других методов кластерного анализа для оценки расстояний между кластерами, здесь используются методы дисперсионного анализа. На каждом шаге алгоритма объединяются такие два кластера, которые приводят к минимальному увеличению целевой функции, т.е. внутригрупповой суммы квадратов. Этот метод направлен на объединение близко расположенных кластеров. В 1987 году Б.И. Сёмкиным (Сёмкин, 1987 в) было проведено исследование ряда методов построения дендрограмм. Наиболее оптимальным был признан метод средней взвешенной связи. Хотя, следует отметить, что явные связи между мерами близости и методами построения дендрограмм ещё только предстоит выявить.

Отдельно следует сказать о моменте, которому не уделяется почти никакого внимания. Речь идёт о выборе значения близости для двух объектов, объединяющихся в кластер. Традиционно производится поиск максимального элемента по матрице сходства (или минимального для матрицы расстояний) и на объекты, на пересечении которых стоит искомое значение, объединяются в кластер. Однако, иногда возникают ситуации когда в матрице содержится несколько значений, которые удовлетворяют данному условию. Возникает неопределённость математического алгоритма. Как правило, в компьютерных программах задаётся определённое правило (например, поиск вести слева направо, сверху вниз), но в литературе особого указания на сей счёт не дано. В общем, такая ситуация означает, что необходимо приводить все случаи дендрограмм, которые возникают в подобных точках бифуркации.

1.4.9.2 Диаграмма Чекановского

Метод «диагонализации» матрицы различия и графическое изображение кластеров вдоль главной диагонали матрицы различия (диаграмма Чекановского) впервые предложен И. Чекановским в 1909 году (Czekanowski, 1909). В то время, в математике был известен метод приведения матриц к блочно-диагональному виду для «чётких отношений» (отношений эквивалентности), а И. Чекановский впервые распространил этот метод на «нечёткие» отношения «сходства и различия» (см. Сёмкин, 1987 б, в; 1988). Метод Чекановского получил распространение в геоботанике и флористике для выделения однородных групп (Ruћiиka, 1953, 1958; Fager, 1957; Roux, Roux, 1967; Александрова, 1969; Василевич, 1969; Шмидт, 1980). В своём обзоре П. Грейг-Смит (Greig-Smith, 1967) приводит диаграмму Чекановского для диаграмм сходства, но ссылается на работу 1962 года П. Снита и Р. Сокала.

Приведём описание методики: «Сущность этого метода заключается в том, что всю амплитуду полученных величин сходства разбивают на ряд классов, а затем в матрице величин сходства заменяют эти величины штриховкой, различной для каждого класса, причём обычно для более высоких классов сходства применяют более тёмную штриховку. Затем, меняя порядок описаний в таблице, добиваются того, чтобы более сходные описания оказались рядом» (Василевич, 1969 : 159).

Приведём гипотетический пример получения вышеуказанной диаграммы. Основой метода является построение матрицы транзитивного замыкания (Tamura et al., 1971). Для построения матрицы транзитивного замыкания возьмём простую матрицу сходства (рис. 2 а) и умножим её саму на себя:

,

где K(i, j) - элемент, стоящий на пересечении i-ой строки и j-го столбца в новой (второй) матрице, полученной после первой итерации; q - общее количество строк (столбцов) матрицы сходства. Данную процедуру необходимо продолжать пока матрица не станет самоподобной: , где n - число итераций. Для этого сначала сравниваем элементы первой строки с первым столбцом, определяя минимальное значение. В нашем случае самоподобной стала матрица А2 (рис. 2 б), т.е. при последующих итерациях она даёт саму себя. Далее мы преобразовываем матрицу таким образом, чтобы близкие числовые значения находились рядом (рис. 2 в). Если каждому числовому значению присвоить какой-либо цвет или оттенок цвета (как в нашем случае), то мы получим классическую диаграмму Чекановского (рис. 2 г). Традиционно более тёмный цвет соответствует большему сходству, а более светлый меньшему.

Рис. 2. Схема расчёта и построения диаграммы Чекановского. Обозначения: а-б - расчётные матрицы транзитивного замыкания; в - преобразованная матрица транзитивного замыкания; г - диаграмма Чекановского.

Стоит отметить, что приоритет использования этого метода И. Чекановским оспаривается (Макаревич, 1971). В.Н. Макаревич считает, что метод построения диаграммы Чекановского по своей сути является модификацией метода дифференциального анализа, разработанного К. Пирсоном.

1.4.9.3 Неориентированные графы

Широко применяются в геоботанике и флористике. Их часто называют корреляционными плеядами (Терентьев, 1959, 1960; Выханду, 1964; Василевич, 1969; Миркин, Розенберг, 1979; Шмидт, 1980). Частным случаем является метод, известный как метод построения оптимальных деревьев (дендритов), который был предложен Г. Штейнгаузом (1981), впоследствии метод был развит математиками вроцлавской таксономической школы (Florek et al., 1951; Василевич, 1969; Шмидт, 1980). Имеется достаточно большое количество исследований, в которых был использован данный метод (Matuszkiliewicz, Polakowska, 1955; Faliсsky, 1960; Kowal, 1965).

Обычно дендрит строят, используя метод одиночной связи (Сёмкин, 1979), но известно (Сёмкин, 1987 в), что эквивалентную структуру можно получить и при использовании матрицы транзитивного замыкания, т.к. оба метода основаны на учёте единственной, наиболее сильной из связей между сравниваемыми объектами.

Изредка неориентированные графы применяются для методов оптимизации (Сёмкин, 1978 б; Выханду, 1964). В частности Л.К. Выханду (1964) занимался вопросами использования в биологии метода построения максимального корреляционного пути.

1.4.9.4 Ориентированные графы

Ориентированные графы (орграфы) были впервые использованы Б.И. Сёмкиным и Т.А. Комаровой в фитоценологии при изучении сукцессий растительности (Сёмкин, Комарова, 1971). В последующем эти методы нашли широкое применение в биогеографии и экологии (Юрцев, Сёмкин, 1980; Сёмкин, Куликова, 1981), т.к. удачно применяются для визуализации несимметричных отношений.

Например, на основе матрицы включения, возможно построение графа включения при условии предварительного выбора порога (например,   50%). Просматривая строки матрицы включения, отмечаем все значения, которые превышают пороговую величину. Вершину графа с номером строки соединяем с вершиной графа номера столбца, на пересечении которого и стоит отмеченное число, а стрелка указывает направление включения. Граф включения показывает связь флористических участков (по сходству видов). Рассмотрим гипотетический пример. Возьмём некую условную матрицу включения (табл. 5).

Таблица 5

Матрица включения для гипотетического примера

>

1

2

3

4

5

1

100

44

35

48

17

2

46

100

32

32

18

3

38

34

100

43

29

4

50

32

41

100

27

5

31

31

46

46

100

Рис. 3. Гипотетический пример ориентированного графа включения-сходства для пяти объектов при разных порогах.

Согласно вышеприведённому алгоритму построим граф включения-сходства (при порогах д ? 50% и д ? 40%). Если между вершинами графа включения наблюдаются стрелки, направленные в двух направлениях, то списки, характеризующие эти вершины, будут сходны при заданном пороге (рис. 3). В нашем случае при пороге д ? 40% (рис. 3), списки под номерами 1, 3 и 5 включаются в список 4 по видовому составу. При необходимости можно построить граф невключения, обратный приведённому графу включения.

В заключение раздела 3.4 хотелось бы остановиться на некоторых проблемах упорядочения данных. Выделяют две основные проблемы: проблема качества разбиения и проблема устойчивости разбиения. Для решения проблемы устойчивости предлагают плюралистический подход (если разбиение повторяется при использовании разных методов (Шитиков, Розенберг, Зинченко, 2005)), бутстреп-метод, предложенный Б. Эфроном в 1977  г., метод «складного ножа» и «скользящего контроля» (Количественные методы…, 1984). Несколько способов предлагает В.Л. Леонов (Леонов, URL): «исходную выборку случайным образом разделить на две примерно равные части, провести кластеризацию обеих частей и затем сравнить полученные результаты. Более трудоемкий путь предполагает последовательное исключение вначале первого объекта и кластеризацию оставшихся (N - 1) объектов. Далее последовательно проводя эту процедуру с исключением 2, 3 и т.д. объектов анализируется структура всех N полученных кластеров. Другой алгоритм проверки устойчивости предполагает многократное размножение, дублирование исходной выборки из N объектов, затем объединение всех дублированных выборок в одну большую выборку (псевдогенеральную совокупность) и случайное извлечение из нее новой выборки из N объектов. После этого проводится кластеризация этой выборки, далее извлекается новая случайная выборка и вновь проводится кластеризация и т.д. Очевидно, что это также достаточно трудоемкий путь».

Проблеме оценки качества разбиения также уделяют немало внимания. Специалисты предлагают множество критериев оптимальности разбиения (Ward, 1963; Мандель, 1988 и др.), но зачастую рекомендуют диверсифицировать исследования с помощью других методов. В естествознании, кроме того, проблема обостряется вследствие континуальности многих естественных объектов, а, следовательно, дискретного перехода быть не может и структуру системы можно определить, только комбинируя методы. В общем, качество кластеризации обычно определяется через некоторый функционал, т.е. требуется при выборе кластеров найти оптимум (минимум внутрикластерных расстояний и максимум внекластерных расстояний) функции (Загоруйко, 1999) или через сравнение с реальными данными (если это возможно). Первый случай рассматривается в рамках таких направлений как функциональный анализ, распознавание образов, робастная статистика и др. Второй случай обычно применяется при апробации новой методики классификации.

В биологии, как правило, определяется свойствами исследуемого объекта. Например, объект континуальной природы по определению не может дать адекватного разбиения.

1.4.10 Интерпретация результатов

Исходя из системного понимания территории и взаимосвязей внутри объекта, исследователь может адекватно интерпретировать полученные результаты. Из-за высокой сложности исследуемых объектов к процессу исследования, как правило, подключаются специалисты разных направлений - биогеографы, геоботаники, экологи, математики, программисты и др.

Рассмотренный индуктивный схемно-целевой подход позволяет разрешить основные концептуальные, методологические и методические проблемы, а также проблемы интерпретации полученных результатов, которые с неизбежностью возникают при использовании математических методов.

В этом разделе стоит особо рассмотреть обобщённую функцию «связующего звена» между вычислительными мощностями и прикладной областью - аналитика. В нашем понимании, аналитик это специалист по формальным методам решения задачи, т.е. прикладной математик, знакомый с предметной областью пользователя. Последнее свойство аналитика очень важно, иначе он бы просто не понимал бы конечного пользователя. Задачу пользователя, сформулированную на естественном языке, аналитик представляет в математической форме и разрабатывает алгоритм ее решения.

Составленную формализованную задачу и алгоритм ее решения он передает программисту, который составляет программу решения этой задачи на компьютере в виде текста на одном из компьютерных языков, вводит ее в компьютер и отлаживает. Компьютерная техника решает задачу. Программист расшифровывает результат, передает аналитику, и тот переводит решение на язык конечного пользователя. По сути, аналитик является промежуточным звеном между конечным пользователем (экологом, геоботаником, флористом и др.) и специалистом в области информационных технологий (программистом).

Можно, разумеется, передать функции аналитика конечному пользователю, чтобы он сам формализовал и программировал свою задачу, работая непосредственно на компьютере, но очевидно, что этот путь требует серьёзного и зачастую длительного обучения конечного пользователя. В процессе обучения он должен научиться формализировать задачу, которую собирается решить на ПК, т.е. выполнить функцию прикладного математика в своей области и прикладного программиста, чтобы составить нужную программу. Именно так зачастую приходится поступать сейчас конечному пользователю, если он хочет решить свою задачу с помощью информационно-компьютерных технологий (ИКТ).

На первых этапах специалисту приходится тратить слишком много дополнительного времени на формализацию своей задачи и программирование, не говоря уже об отладке программы, на другие неизбежные программистские заботы. Некоторые специалисты (Миркин, Наумова, Соломещ, 2002) считают, что компьютер по большей части вредит специалисту: «компьютер не может мыслить геоботанически (Вальтер, 1982)» и там же: «студент или аспирант, который начал осваивать эколого-флористическую классификацию с компьютерной обработки, никогда не станет натуралистом, т.к. будет отравлен «компьютерным опиумом» в понимании Р. Маргалефа (1992)».

Многие разработчики математических методов в прикладных областях ратуют за активное внедрение своих разработок и массовое обучение специалистов. Разумеется, грамотное использование любых методов всегда приветствуется, но одна из фундаментальных задач науки - оптимизация. По-видимому, самым приоритетным направлением, на данном этапе, является подготовка системных аналитиков и прикладных математиков, а также развитие систем искусственного интеллекта (см. например, Шитиков, Розенберг, Зинченко, 2005).

Другое способ решения проблемы это «искусственный интеллект», цель которого в формализации задачи технической системой с последующим решением и представлением результата в виде, доступном пониманию пользователя (т.е. реализация оптимального интерфейса). Несмотря на то, что создание таких интеллектуальных компьютеров, работающих в определенной предметной области, дело чрезвычайно сложное, на это придётся пойти, чтобы не готовить из каждого специалиста профессионального программиста или программирующего пользователя.

В заключение раздела отметим, что даже самые мощные инструменты анализа не заменят специалиста, который способен грамотно поставить задачу и выбрать чёткую схему исследования, т.е. любому специалисту на современном этапе стоит выбрать «золотую середину» при использовании вычислительных методов и технологий, а также всегда руководствоваться чёткой схемой исследования.

Глава 2. Сравнительный анализ компонентов растительного покрова

В настоящей главе мы решим ряд биологических задач с помощью методов на основе схемно-целевого подхода. Большая часть первичных данных взята из опубликованных работ по альгологии, флористике, геоботанике, экологии и др.

2.1 Флоры водорослей-макрофитов дальневосточного побережья России

В данном разделе рассмотрена совокупность флор водорослей-макрофитов российского Дальнего Востока. Нашей целью явилось разделение естественного альгофлористического континуума на дискретные единицы (районирование), с последующим анализом пространственной структуры с формальных позиций.

Материал взят из работ по сравнительной альгологии побережья Дальнего Востока России (Гусарова, 1975; Гусарова, Сёмкин, 1982; 1986; Клочкова, 1997 и др.). Огромная протяжённость и сильная расчлёнённость береговой линии дальневосточных морей, их значительная меридиональная вытянутость, влияние Азиатского материка, широкая связь с Тихим океаном, холодные и тёплые течения, различные типы приливов, а также амплитуда приливно-отливных колебаний создают предпосылки для развития здесь богатой и разнообразной альгофлоры макрофитов, состоящей из арктических, бореальных и субтропических элементов.

С формальной точки зрения, сложность сравнительного изучения таких конкретных альгофлор макрофитов побережий обусловлена тем, что первичные флористические выделы существенно разновелики по числу видов, что не позволяет при их сравнении адекватно определять сходство (Сёмкин, 2007). В этих случаях необходимо использовать методы оценки несимметричных флористических связей, основанные на мерах включения. При выделении сообществ литорали на основе флористико-фаунистических признаков (Погребов, Горянина, 1988) было установлено, что «выделяемые сообщества представляют собой более или менее однородные части непрерывно изменяющейся биоты». Границы между ними нечёткие (группировки переходят друг в друга, не образуя хорошо разграниченных зон, а число сообществ зависит от избранного масштаба расчленения континуума). К аналогичным результатам пришли А.И. Кафанов и В.Е. Жуков (1993), изучавшие прибрежные сообщества водорослей-макрофитов залива Посьет, которые установили, что «растительный покров литорали и верхней сублиторали выраженно континуален и составлен определённым числом вертикальных поясообразующих флористических группировок». Ситуацию «флористического континуума» (Юрцев, 1987) для флор водорослей-макрофитов, вообще говоря, ещё не рассматривали. Дело в том, что для таких исследований необходимы не только достаточно полные списки видов участков побережий, но и расположение этих участков в виде географических рядов соответствующих направлениям флористического обмена, причём целесообразно обеспечение «примыкания» участков в рассматриваемых рядах. К районированию побережья Дальнего Востока России обращались неоднократно. Использовались методы «зонально-географического и альгофлористического фитогеографического анализа» (Клочкова, 1997), причём, как отмечает Н.Г. Клочкова до её работы «дальневосточная флора водорослей-макрофитов никогда не анализировалась как единый комплекс». В полной мере для исследования флористического континуума подходят данные Н.Г. Клочковой (1997). Автором было выделено, для дальневосточных морей России (по гидрологическим, климатическим (границы участков хорошо совпадают с положением средне августовских изотерм), геоморфологическим, а также по палеогеологическим признакам), 40 участков сублиторали, примыкающих друг к другу в географическом ряду (рис. 1 Приложения Б), составлены списки видов водорослей-макрофитов (общий список включает 551 вид) и предварительно участки были объединены в четыре крупных района.

Нами была произведена математическая обработка общего видового списка водорослей-макрофитов: рассчитана матрица пересечений (табл. 1 Приложения Б), матрица мер включения (табл. 2 Приложения Б) и таблица индексов преобладания (табл. 6 Приложения Б).

Проанализируем полученные результаты. Матрица пересечений приводится в компактной форме в виде прямоугольной таблицы 40Ч21 (табл. 1 Приложения Б). При рассмотрении значений главной диагонали матрицы пересечений можно увидеть, что число видов на участках меняется от 32 видов (мыс Наварина-мыс Олюторский) до 269 видов (залив Петра Великого). Отметим, что полнота видовых списков существенно возросла в сравнении со списками, составленными И.С. Гусаровой (Сёмкин, Гусарова, 1986). Так, например, для о-ва Симушир список увеличился на 47 видов, для о-ва Парамушир на 37 видов, для о-ва Кунашир на 44 вида, для Командорских о-вов на 81 вид. На Командорских островах по данным Н.Г. Клочковой (1997) составляет 209 видов водорослей-макрофитов.

На основе матрицы включения построено ориентированное оптимальное дерево (дендрит) односвязывающим методом (Сёмкин, Клочкова, Гусарова, Горшков, 2010 а). Структура графа наглядно показывает непрерывный переход флор разных районов Северо-западной Пацифики в пределах бореальной области (рис. 2 Приложения Б), причём односторонние связи весьма существенны (80-90%). По схеме схеме зонально-географического членения К.Л. Виноградовой (цит. по: Клочкова, 1997) бореальная зона в Тихом океане делится на две подзоны: высокобореальную и низкобореальную. Высокобореальная зона выделяется от Берингова пролива до мыса Терпения (о-в Сахалин), нижняя граница низкобореальной зоны выделяется значительно южнее зал. Петра Великого (по территории о-ва Хонсю).

Проведенное сравнение по общему списку видов полученных нами районов и ранее выделенных Н.Г. Клочковой (1997) показывает достаточно большую сходимость этих двух схем, но имеются некоторые различия. В нашем случае в районе I появляется 11 участок (мыс Лопатка-мыс Утхолокский). Этот участок является обеднённым дериватом флоры юго-восточной Камчатки и видимо отделяется от II района за счёт увеличения приливной зоны, нарастающего похолодания в северо-западной части Камчатки (12 участок).

Во II-ом районе других изменений, кроме отмеченного, нет. Условия обитания в данном районе формируются течениями, песчаными грунтами, воздействием Амурского лимана.

Район III был нами разбит на два подрайона: III A (Курильские острова) и III B (Восточный Сахалин), причём первый тяготеет к I району и включается через 10 участок (Командорские острова) на 81% (данный участок является источником американской флоры с видами преимущественно островного генезиса). По данным Гусаровой И.С. (Гусарова, Сёмкин, 1986) также выделялся район, аналогичный III A, но с некоторыми расхождениями. Четвёртый район изменений не претерпел.

Для выделения наиболее «оригинальных» и «банальных» по видовому составу альгофлор по матрице мер включения можно построить ориентированный граф, но графическое изображение не является наглядным из за большого числа дуг графа, поэтому мы отразим структуру графа с помощью индексов преобладания (Сёмкин, Куликова, 1981; Кафанов,1994; Сёмкин и др., 2009 б) в табл. 6 Приложения Б. Из таблицы видно, что самой «банальной» альгофлорой является 3 участок (м. Наварина - м. Олюторский), а самой «оригинальной» - 40 участок (залив Петра Великого). Наиболее оригинальные флоры по районам (в скобках приведены значения индексов преобладания): I - участки 10 (0,51) и 8 (0,38); II - 17 участок (0,33); III A - участки 25 (0,44), 22 (0,38), 23 (0,36); III B - участки 28 (0,41); IV - участки 40 (0,76), 30 (0,54), 38 (0,49), 39 (0,49), 31 (0,44), 37 (0,41). Наиболее банальные флоры по районам (в скобках приведены значения индексов преобладания): I - участки 3 (-1), 1 (-0,87), 5 (-0,49), 4 (-0,46), 2 и 11 (-0,41), 6 (-0,33), 7 и 9 (-0,23); II - участки 18 (-0,82), 13 (-0,62), 14 (-0,54), 12 (-0,51), 15 (-0,33), 16 (-0,13); III A - участки 21 (-0,03); III B - участки 26 (-0,56); IV - участки 32 (-0,05). Наиболее оригинальные флоры совпадают с основными центрами видообразования водорослей-макрофитов (Клочкова, 1997), кроме IV района, хотя очевидно, например, высокое видовое разнообразие флоры 40 участка (зал. Петра Великого).

Макрофитобентос рассматриваемого района формируется представителями зелёных (Chlorophyta), бурых (Phaeophyta) и красных (Rhodophyta) водорослей, которые достаточно сильно различаются уровнем организации, жизненными циклами, реакциями на условия среды и другими характеристиками. Известно, что соотношение численности зелёных, бурых и красных водорослей зависит от широты, и в альгофлорах разных районов Мирового океана оно достаточно устойчиво (Feldman, 1937; Druehl, 1981, Segawa, 1962). В умеренных и относительно холодных водах по числу видов доминируют багрянки (46%, в тёплых водах повышается до 58%), зелёные водоросли являются самыми малочисленными (12-13%, в тёплых до 24%), бурые водоросли занимают промежуточное положение (40-43%, в тёплых падает до 18%) (Жизнь растений…, 1977 : 361; Перестенко, 1982). В дальневосточных морях России (Клочкова, 1997) наибольшим числом видов представлен отдел Rhodophyta - 319 видов (57,9%), за ним следует отдел Phaeophyta - 159 видов (28,9%) и наименьшим по числу видов является отдел Chloropyta - 73 вида (13,2%), т.е., в общем, подтверждается характер распределения видов по отделам при значительном усилении Rhodophyta.

Исходя из существенных количественных соотношений водорослей-макрофитов в рассматриваемых отделах и их различных флористических ролей, целесообразно провести сравнительный анализ по видовым спискам для каждого отдела (Сёмкин, Клочкова, Гусарова, Горшков, 2010 б). Привёдем матрицы пересечения (табл. 3-5 Приложения Б) и оптимальные деревья (рис. 3-5 Приложения Б). Для зелёных водорослей (табл. 3 Приложения Б) наибольшее число видов (50 и 42) определено в 40 участке (залив Петра Великого) и на 17 участке (Шантарские о-ва) соответственно. Наименьшее число видов представлено на участке 3 (мыс Наварина - мыс Олюторский) - всего 5 видов, т.е. на порядок меньше чем на 40 участке. По таблице 4 (Приложение Б) можно увидеть, что наибольшее число бурых водорослей (78) определялось на 40 участке (залив Петра Великого), второе место по числу видов занимает 30 участок (мыс Крильон - мыс Перепутье) - 64 вида. Наименьшее число видов обнаружено на участке 3 (13 видов). Максимально насыщена красными водорослями (табл. 5 Приложения Б) флора залива Петра Великого (141 вид), Командорских островов (128 видов) и участок 30 на юге Сахалина между мысами Крильон и Перепутье (118 видов). Минимум устойчиво определяется на участке 3 (14 видов).

Рассмотрим связи флор отделов Chlorophyta, Phaeophyta и Rhodophyta между районами по оптимальным ориентированным деревьям. Как можно видеть из рис. 3 (Приложение Б) оптимальное ориентированное дерево для зелёных водорослей имеет достаточно простую структуру: в центрах находятся флоры Авачинского залива (участок 8), Шантарских островов (17) и Приморья (38, 40). В эти флоры включаются флоры остальных участков и формируются 4 флористических района. Район I включает флоры западного побережья Берингова моря, восточной Камчатки, Командорских островов и юга западной Камчатки (участки 1-11). В район II объединились флоры западного побережья Камчатки, материкового побережья Охотского моря, севера Сахалина (участки 12-18, 26). Самый маленький район (III) включает всего 3 участка (19-21) и объединяет флоры северных Курильских островов (Парамушир, Симушир, Уруп). Район IV самый насыщенный по числу участков (17) и по видовому составу флоры и объединяет флоры всего Приморья с заливом Петра Великого, материковое побережье Татарского пролива, островов Большой (Итуруп, Кунашир) и Малой Курильских гряд, острова Монерон и юга Сахалина. Флоры западной Камчатки (участок 12) и острова Уруп (21) являются связующим звеном между условно дискретными флористическими объединениями районов. Внутри районов наблюдаются односторонние сильные (на уровне 100%), за редким исключением, связи, особенно характерные для северных флор (I-III). В IV районе связи также односторонние, но уровни несколько ослаблены (79-100%). Флоры зелёных водорослей северо-западной Пацифики слабо дифференцированы и явно отличаются от структурирования флор по общему списку видов (рис. 2 Приложения Б).

На рис. 4 Приложения Б приведено дерево для бурых водорослей. Выделяется пять крупных дискретных единиц. Флоры северо-восточной части российского сектора Тихого океана до Курильских островов и западной Камчатки до мыса Баджедомова на севере объединились в I район (участки 1-12). Во II район включились флоры материкового побережья Охотского моря, Шантарских островов и небольшого участка северо-западного Сахалина (13-18). Флоры всех Курильских островов объединились в район IIIA (участки 19-25). Следующее объединение (IIIB) включает флоры восточного, южного и юго-западного Сахалина, а также острова Монерон (участки 26-31). В IV район объединились флоры всего Приморья, материкового и северо-восточного побережий Татарского пролива (участки 32-40). Внутри районов наблюдаются связи разных уровней (79-92%), максимальные связи (96-100%) встречаются редко. Связь между районами (I-IV) осуществляются через флоры участка между мысом Ламанон и мысом Китоуси (33), северо-восточного Сахалина и Амурского лимана (26), флору участка между мысом Александра и мысом Лазарева (18), острова Парамушир (19) и северо-западной Камчатки (12). В целом, флора более дифференцирована по сравнению с флорой зелёных водорослей и районы объединяют преимущественно участки, расположенные в географической последовательности. При сравнении дендритов, построенных для конкретных флор по общему составу видов и по видам бурых водорослей, наблюдаются некоторые расхождения в объединении участков по полному списку видов. Так в дендрите для бурых водорослей флора 12 участка (между бухтой Квачина и мысом Баджедомова) проявляет свойства переходного района с равными значениями сходства 82% и к I району (11 участок) и к II району (17 участок). Это связано с промежуточным температурным оптимумом для Phaeophyta между условиями относительно тёплого 11 участка и более сурового по гидрологическому режиму и мутности воды 13 участка. Флоры острова Монерон (29) и юго-западного Сахалина (30-31) объединились с флорой района IIIB, но данный факт проинтерпретировать не удалось.

Флора красных водорослей формируется в 5 крупных дискретных районов (рис. 5 Приложения Б), границы которых почти полностью совпадают с границами районов, объединённых по общему списку видов. Исключением является только флора самого южного участка западного Сахалина между мысом Крильон и посёлком Перепутье, который включается во флору IV района по общему составу флоры, то в район IIIB по красным водорослям. Причиной может являться температурная аномалия, известная как «холодноводное пятно Макарова», которая мешает развитию тепловодных видов (преимущественно красных водорослей). Связь между районами осуществляется через флоры участков 3 (между мысами Наварина и Олюторским), 18 (между мысом Александра и Лазарева), 20 (остров Симушир) и 32 (между мысом Слепиковского и Штернберга).

Индексы преобладания для водорослей трёх отделов позволяют выявить наиболее оригинальные и банальные флоры отдельных участков (табл. 6 Приложения Б). Анализ индексов преобладания по отделам показывает, что многие флоры северных участков (1-7, 9, 11-15, 18, 26) относятся к банальным по видовым спискам всех трёх отделов. Это может быть связано с выраженным арктическим влиянием (1-3 участки), недостаточной изученностью (3, 9, 13 участки), опресняющим влиянием Амурского лимана (18 и 26 участки) и другими причинами. Флоры Авачинского залива (8) и Шантарских островов (17) оригинальны по всем трём отделами (0,05-0,38). Командорские острова (10) высокооригинальны по красным водорослям (0,62), что объясняется связью с американской флорой (Селиванова, 2004), но слабее по зелёным (0,38). Остальные участки, расположенные к югу, имеют флору оригинальную на разном уровне (от 0,03 до 0,67) по видам всех отделов. На некоторых участках отмечена банальность флоры по бурым водорослям (остров Парамушир), по зелёным (остров Уруп), по зелёным и красным (участок между мысом Слепиковского и Штернберга). Самой оригинальной по бурым и зелёным является флора залива Петра Великого (40 участок).

Поскольку абсолютная численность видов разных флор весьма различна и отражает разный уровень их богатства, а косвенно - протяжённость пространства занимаемого каждой флорой, представляется более целесообразным оперировать не с абсолютными значениями, а с показателями соотношений между отдельными группами, выраженными в процентах (или долях) от общей численности соответствующих флор (Толмачёв, 1974). Исходя из этого, систематическая структура флоры дополнительно определена на основе DS-спектров (относительные таксономические спектры типа «отдел-вид»: D - divisio (отдел), S - species (вид)) посредством расчёта меры процентного сходства и унарных мер (разнообразия, концентрации). DS-спектры характеризуют систематическую структуру крупных хорологических единиц рангов флористической области и выше. В связи с этим, для флор водорослей-макрофитов дальневосточного побережья морей России DS-спектры должны быть близки друг другу, а отклонения, возможно, могут быть вызваны антропогенными воздействиями, недостаточной изученностью флоры, слабой представленностью набора экотопов данного района или переходным характером участка, тем самым, нарушая дискретность крупных хорологических единиц (Сёмкин, Клочкова, Гусарова, Горшков, 2010 в).


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.