Разработка экспертной системы распознавания хроматограмм для классификации образцов

Жидкостная хроматография как метод разделения веществ в растворе. Вопросы, на которые отвечает хроматография. Многоканальное фотометрическое детектирование в хроматографии. Задача сравнения хроматограмм, особенности обработки аналитических данных.

Рубрика Химия
Вид реферат
Язык русский
Дата добавления 24.01.2012
Размер файла 692,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Министерство образования и науки Российской федерации Федеральное агентство по образованию Новосибирский государственный университет Механико-математический факультет

Реферат

Разработка экспертной системы распознавания хроматограмм для классификации образцов

Научный руководитель

Барам Евгений Григорьевич

Рябичев Денис Александрович,

ООО "ЭрминСофт"

Новосибирск 2008

Вступление

Прогресс в области информационных технологий, наблюдаемый за последние 20 лет, вызвал прогресс во многих областях науки, в частности, в аналитической химии, особенно в тех ее разделах, которые связаны с обработкой большого объема экспериментальных данных. Одним из таких разделов является жидкостная хроматография - метод разделения веществ в растворе, который впервые ввел в практику М.С. Цвет в 1903 году [1]. Суть метода, показанная на рис.1, заключается в следующем: в верхнюю часть хроматографической колонки, представляющей из себя трубку, наполненную мелкодисперсным адсорбентом, помещают небольшую порцию раствора анализируемого образца и промывают колонку подходящим растворителем. Важно чтобы молекулы компонентов образца в данном растворителе быстро адсорбировались и десорбировались с поверхности сорбента. В этом случае молекулы каждого типа будут передвигаться по колонке в виде узких концентрационных зон, причем скорость движения этих зон различна. Она зависит от химического строения вещества.

Рис.1. Хроматограф М.С. Цвета [1].

А - схема хроматографа. Б - хроматограмма М.С. Цвета.

Рис.2. Хроматографический пик.

Зависимость величины концентрации вещества вдоль зоны в идеальном случае описывается уравнением Гаусса. Хроматографический пик изображен на рис.2. Если измерять концентрацию молекул в растворе на выходе колонки, то мы получим кривую, которая называется хроматограммой (рис.4, рис.5 и 6 из Приложения). Таким образом, хроматограмма является функцией зависимости концентрации вещества в растворе от объема, пропущенного через колонку растворителя или от времени. Каждому веществу на хроматограмме соответствует свой пик. Начало координат соответствует моменту ввода пробы (образца) в колонку. Абсцисса вершины пика вещества называется объемом удерживания вещества (VR), величина которого определяется химическим строением этого вещества, составом растворителя (подвижной фазы или элюента) и свойствами адсорбента (неподвижной фазы). Когда говорят о времени удерживания (TR), то имеют в виду, что , где F - скорость потока растворителя через колонку.

Если мы начали с того, что определили хроматографию как метод разделения веществ, то в современной терминологии этот метод включает в себя и последующее измерение концентрации веществ в образце. Другими словами, хроматография отвечает на вопросы:

1. Сколько различных веществ в образце?

2. Есть ли в образце вещества x1,., xn из известного нам списка?

3. Какова концентрация веществ x1,., xn в исходном образце?

Для ответа на вопросы 2 и 3 мы должны в стандартных условиях хроматографировать образцы стандартных (эталонных) растворов веществ x1,., xn, регистрируя их объемы удерживания и площади пиков, причем для каждого измеряемого параметра определяется погрешности измерения. Вся эта процедура называется калибровкой хроматографа. Если калибровочные параметры стабильны во времени, то их сохраняют в виде баз данных. Анализ пробы проводят строго в тех же условиях. Полученные данные обрабатывают, учитывая дрейф сигнала детектора, уровень его шумов, неполное разделение пиков и т.п., а затем сравнивают экспериментальные данные со стандартными, взятыми из базы данных. Разработка экспертной системы для такого анализа будет являться нашей задачей.

Перед тем, как перейти к рассмотрению поставленной задачи, необходимо сказать несколько слов об объеме обрабатываемой информации, который зависит от способа детектирования одно - или многоканального. Принцип многоканального детектирования применительно к спектрофотометрическому детектору показан на рис.3. Он заключается в том, что измерение концентрации вещества в вытекающем из колонки растворе осуществляется с помощью многоканального фотометра, причем для каждого канала сигнал детектора (Аi) связан с концентрацией вещества (С) как Аi=aiC, что следует из спектра вещества (рис.3-I). Если все сигналы по всем каналам детектора, соответствующие одному моменту времени, нормировать, например, по отношению к максимальному (А0), то величины Ri=Ai/A0 будут независимыми от концентрации для всех участков пика вещества (рис.3-II). Это дает основание считать значения Ri наряду со значением времени (объема) удерживания уникальными характеристиками вещества и использовать их для соотнесения пиков на хроматограмме к определенным веществам, т.е. идентифицировать хроматографические пики по информации из базы данных.

Рис 3. Многоканальное фотометрическое детектирование в хроматографии.

На рис.3-II сплошные линии сигналы детектора (Ai),

пунктирные линии нормированные сигналы (Ri).

Объем информации, получаемой при многоканальном детектировании, будет зависеть от числа каналов и от метрологических характеристик детектора. Например, если используется только два канала, то при величине погрешности Ri=0,1 мы сможем распознать только 101 веществ, для трёх каналов - 102,. а для восьми - 107. Если учесть, что хроматографические колонки позволяют разделять до 100 веществ в одной пробе, то совокупная емкость базы (Z) данных, включающая в себя значения "VR, R17", составит Z=100107=109 уникальных идентификационных параметров.

Применительно к хроматографу "Милихром А-02" (ЗАО Институт хроматографии "ЭкоНова", г. Новосибирск) c восьмиканальным фотометрическим детектором, который обеспечивает погрешность измерения Ri=0,05, Z=1001,281091011.

Так как каждая восьмиканальная хроматограмма представляет собой 8 наборов из 5000 точек, принимающих до 10000 различных значений (линейный динамический диапазон), то конечная задача сводится к обработке всего массива данных с последующим сравнением результатов с более чем со ста миллиардами записей в базе данных.

Задача сравнения хроматограмм

Для того чтобы объективно сравнить две хроматограммы необходимо учитывать следующее. Во-первых, спектрофотометрический детектор хроматографа как любой измерительный прибор вносит некоторую погрешность в получаемые данные (шум, дрейф, нелинейность и пр.). Во-вторых, получаемые восьмиточечные спектры веществ могут значимо зависеть в некоторых случаях от состава растворителя, в котором производится запись спектров, а этот состав в определенных пределах может изменяться. В-третьих, если в анализируемом образце содержатся примеси мешающих веществ, которые не отделяются колонкой от целевых соединений, то на спектры целевых веществ будут накладываться спектры мешающих соединений. В этих условиях достоверная идентификация пиков на хроматограмме требует привлечения специальных алгоритмов, один из которых мы рассмотрим далее.

Для автоматического сравнения пригодны различные статистические подходы. Наилучшие результаты можно получить, используя метод наименьших квадратов, при этом сравнение двух хроматограмм дает коэффициент совпадения, определяемый следующим образом:

,

где x и y - измеренные значения сигналов детектора (оптические поглощения) в первом и втором спектрах на соответствующих длинах волн, а n - количество данных.

В случае коэффициента, равного 0, алгоритм показывает полное несовпадение, а коэффициент, равный 1, говорит о полной идентичности хроматограмм. Обычно значение коэффициента совпадения выше 0,990 показывает, что хроматограммы подобны. Значения от 0,900 до 0,990 показывают, что исследуемые хроматограммы подобны, но результат следует интерпретировать с осторожностью. Все значения ниже 0,900 подразумевают, что мы имеем дело с двумя различными хроматограммами.

Коэффициент совпадения зависит от ряда параметров, которые можно разделить на математические и системные. Последние определяются пробой, устройством хроматографа и методом разделения. Они включают в себя специфику веществ, уровни спектральных шумов, спектры мешающих веществ, а также чувствительностью спектров к составу растворителя. Математические параметры включают в себя производные спектры, алгоритм сглаживания, линейность и точность настройки монохроматора детектора, порог поглощения. Влияние этих параметров можно учесть с помощью программного обеспечения - существует много публикаций, посвященных данным проблемам. В общем виде количественная оценка учета этих влияний затруднительна и зависит от многих причин. Рассмотрим некоторые из них подробнее.

Достоверность любого результата будет стремиться к нулю, если уровень спектральных шумов будет иметь тот же порядок, что и максимальное поглощение на выбранных длинах волн. В работе [2] показано, что коэффициент совпадения снижался с 1 до 0,985 при повышении уровня шумов с 0% до 5%. Относительный уровень шумов менее 2% не оказывал существенного влияния на результаты сравнения.

Уровень шумов на хроматограмме можно понизить путем их сглаживания (фильтрация), однако влияние фильтра на коэффициент совпадения зависит от его вида: например, применение семиразрядного фильтра Савицкого-Голея [11] дает небольшое улучшение коэффициента совпадения. Его влияние будет возрастать при расширении полосы фильтрации, но при применении фильтра со слишком широкой полосой теряется тонкая структура хроматограммы, поэтому такие фильтры следует применять только для хроматограмм, не имеющих тонкой структуры. Также, при необходимости быстрой обработки данных, может применяться фильтр Калмана, позволяющий проводить сглаживание сигнала в реальном времени. Общая идея фильтра Калмана состоит в том, что модель уточняется по ходу развития процесса. Как только становятся доступны новые данные, модель дополняется и улучшается. Несмотря на то, что с появлением мощных и быстрых вычислительных систем нужда в использовании этого фильтра практически исчезла, встречаются отдельные работы, где он может оказаться полезным [6].

Обработка аналитических данных с помощью различных преобразований играет важную роль в химическом анализе. Так, применение преобразования Фурье, за последние 20 лет, по сути, произвело революцию в спектроскопии. Замена аналоговых технологий на цифровые позволяет регистрировать сигналы не в виде привычных спектров, а в виде временных рядов, для восстановления информации из которых требуются математические преобразования. Одной из целей применения преобразования Фурье является увеличение соотношения сигнал/шум при одновременном ускорении процесса обработки данных примерно в 100 раз [6] по сравнению с классическими методами. Кроме Фурье-спектроскопии существует большое количество методов, улучшающих качество данных, часто называемые Фурье-деконволюцией (разверткой, разделением сигналов), которые включают в себя различные манипуляции с данными, зависящими от времени. Собственно само преобразование Фурье применяется лишь на заключительном этапе [12].

Другим мощным современным методом обработки сигналов является вейвлет-анализ [10], являющийся естественным развитием и продолжением преобразования Фурье. Основным недостатком преобразования Фурье является то, что его базисные функции непрерывно зависят от времени, и поэтому его сложно применять для представления данных, зависящих от времени. В вейвлет-анализе применяются базовые функции с ограниченным диапазоном аргумента, которые сдвигаются вдоль оси сигнала и получаемые в результате сверки спектры дают частотно временное представление с разным разрешением, зависящим от ширины диапазона.

В случае проб сложного состава (объекты окружающей среды, пробы биологического происхождения и т.п.) всегда существует риск того, что мешающие соединения будут оказывать существенное влияние на результаты сравнения. В описанных в литературе случаях оценивается, что при уровне примесей менее 10% коэффициент совпадения остается выше 0,990. Для уменьшения влияния мешающего вещества его фон в пробе может быть устранен на вершине пика вычитанием хроматограмм на фронте или на базовой линии текущего пика перед запуском алгоритма сравнения [8].

Центральный вопрос любого хроматографического анализа - содержит ли пик один или больше компонентов (вопрос гомогенности пика). При выполнении анализа перекрывание пиков примесей и исследуемого соединения может сильно исказить результаты. В литературе предлагаются несколько методов алгоритмов по проверке гомогенности (чистоты) пика. Все они включают в себя вычисление отношения сигналов по разным каналам (например, поглощения при двух или более длинах волн), нормализацию сигналов, относящихся к разным частям пика, подавление спектров одного или нескольких компонентов, трехмерное представление данных на графике, развернутое представление спектров как функции времени, и т.д. Ответ на вопрос о наилучшем методе в значительной мере определяется тем, известны ли хроматограммы и спектры компонентов пробы и возможных примесей. Все существующие на данный момент методы дают соответствующие результаты только в том случае, когда все спектры соединений анализируемой пробы и примесей заметно различимы. Другим фактором, влияющим "правильность" анализа, являются различия времен удерживания веществ (качество разделения пиков). Очевидно, что чем оно лучше, тем выше достоверность идентификации и ниже порог детектирования примесей. Это справедливо для всех методов.

хроматограмма хроматография жидкостная образец

Одним из наиболее популярных методов является нормализация и сравнение спектров различных частей пика. Для выполнения рутинных анализов существуют специальные программы, которые автоматически нормализуют, накладывают и выдают спектры для каждого детектируемого пика.

Алгоритм, основанный на относительном двухволновом поглощении, использует тот факте, что для чистых веществ поглощение A на длине волны прямо пропорционально поглощению на другой длине волне :

,

где M - коэффициент, характеризующий чистое вещество на выбранной длине волны [2]. Об этом мы уже говорили ранее, объясняя принцип многоканального детектирования (см. рис.3). Важно, что отношение спектральных поглощений M для чистых веществ является постоянной величиной. Любая примесь, выходящая одновременно с основным пиком, вызовет отклонение от горизонтальной линии относительного поглощения (рис.4). Аналогично работают методы, основанные на вычислении относительного мультиволнового поглощения и на отношении площадей пиков на различных длинах волн. Применение этих методов существенно повышает достоверность аналитических результатов [8].

Рис.4. Фрагмент смоделированной на компьютере хроматограммы раствора 3-х пептидов с детектированием при четырех длинах волн (210, 220, 240 и 280 нм). Справа показан гомогенный (чистый) пик 1 с постоянными значениями спектральных отношений вдоль всего пика. Слева - два гетерогенных (неразделенных) пика 2 и 3. Хорошо видно изменение спектральных отношений при переходе от одного вещества к другому. Алгоритм программы моделирования хроматограмм пептидов опубликован в работе [13], а сама программа Chrom_P распространяется бесплатно [14].

Имея возможность находить коэффициент совпадения для двух представленных веществ, мы можем создать особую базу данных, состоящую из хроматограмм эталонных образцов веществ и, выполняя поиск по этой базе, находить вещества, идентичные исследуемому. Однако для современных исследований информации о простой идентичности спектров уже недостаточно. Для решения сложных поисковых задач, при анализе образцов, содержащих сотни веществ, часто требуется отвечать на вопросы:

· чем отличаются составы анализируемых образцов?

· в чем сходство составов анализируемых образцов?

Пример таких сложных хроматограмм приведен на рис.5 и 6. Они представляют собой результаты анализа двух образцов водных экстрактов коры осины, измельченной в скоростных мельницах при разных режимах. Исследования должны выявить особенности процесса глубоко измельчения и его влияние механо-химических превращений на изменение химического состава получаемого продукта.

Чтобы ответить на эти вопросы необходимо разработать алгоритмы, позволяющие из большого количества стандартных хроматограмм "сконструировать" усредненную "эталонную хроматограмму", а затем, сравнивая с ней хроматограммы интересующих образцов сказать, какие "лишние" пики присутствуют в пробе и отсутствуют в эталоне или наоборот. Учитывая наличие погрешности измерений, наличие химических и физических шумов, отсутствие должной информации о химическом строении веществ, входящих в состав образца, а также большой объем хроматографических и спектральных данных задача разработки таких алгоритмов представляется далеко не тривиальной.

Заключение

Метод количественного сравнения и анализа сложных хроматограмм сможет найти применение во многих областях прикладных наук. Одной из наиболее ценных его возможностей является способность выполнения количественного анализа образца крови больного и сравнение ее хроматограммы с хроматограммой здорового человека. Выявив наличие или отсутствие тех или иных веществ можно попытаться выделить их из раствора в чистом виде, установить их химическое строение, составить список соединений, характерных для конкретной болезни и отталкиваясь от этих данных проводить дальнейшее лечение [7]. На данный момент подобные анализы проводятся для диагностики лишь малого числа болезней.

Некоторые работы, связанные с выделением наиболее характерных для эталонного образца пиков (получения chromatographic fingerprint - хроматографический "отпечаток пальца") проводятся в лаборатории FABI Брюссельского свободного университета [3, 4], однако там метод применяется только для выделения действующих веществ из лекарственных растений. Подобные работы проводят и в Центральном южном университете Китая, но усилия этих ученых направлены, в первую очередь, на разработку единой методики подготовки проб растительных экстрактов и очистку их от примесей [5].

Мы полагаем, что планируемый к разработке метод, позволит проводить ускоренную диагностику заболеваний по образцу крови, проводить стандартизацию и проверку подлинности веществ сложного состава, выполнять анализы биологических жидкостей на содержание лекарственных и токсических веществ, контролировать содержание пестицидов в питьевой воде и многое другое.

Список литературы

1. Цвет М.С. О новой категории адсорбционных явлений и о применении их к биохимическому анализу / Труды Варшавского общества естествоиспытателей, 1903, Том XIV, Отделение биологии, Протокол №6, с.1-20.

2. Хубер Л. Применение диодно-матричного детектирования в ВЭЖХ / М. Мир, 1993 г.

3. Heyden Y. V. Extracting Information from Chromatographic Herbal Fingerprints / LCGC Europe, September 2008, pp.438-443.

4. Boque, R. Maroto A., Heyden Y. V. Assessment of Accuracy in Chromatographic Analysis / LCGC Europe, May 2008, pp.17-21.

5. Chau F., Mok D. K. Fingerprinting Analysis of Raw Herb: Application of Chemometrics Techniques for Finding out Chemical Fingerprint of Chinese Herb / Analytical Sciences, 2001, Vol.17, pp. a419-a422.

6. Померанцев А.Л., Родионова О.Е. Хемометрика в аналитической химии / Электронный ресурс, http://www.chemometrics.ru, свободный доступ.

7. Zeng Z-D., Liang Y-Z., Xu C-J.comparing chemical fingerprints of herbal medicines using modified window target-testing factor analysis / Anal. Bioanal. Chem., 2005, Vol.381, pp.913-924.

8. Baroni M., Benedetti P., Fraternale S. The CARSO procedure in process optimization / J. Chemom., 2003, Vol.17, p.9.

9. Hansen P. W. Pre-processing method minimizing the need for reference analyses / J. Chemom., 2001, Vol.15, p.123.

10. Чуи К. Введение в вэйвлеты / М. Мир, 2001.

11. Savitzky A., Golay M. J. E. Smoothing and differentiation of data by simplified least squares procedures / An. Chem., 1964.

12. Померанцев А.Л. Методы нелинейного регрессионного анализа для моделирования кинетики химических и физических процессов / Дис. д-ра физ. - мат. наук,, Москва, ИХФ РАН, 2003.

13. Азарова И.Н., Барам Г.И., Гольдберг Е.Л. Предсказание объемов удерживания и УФ-спектров пептидов в обращенно-фазовой ВЭЖХ / Биоорганическая химия, 2006, т.32, №1, с.56-63.

14. Программа Chrom_P: http://www.econova.ru/applications/production/files/production_soft_6. zip

Приложение

Рис. 5. Хроматограмма водного экстракта коры осины (образец 1).

Рис. 6. Хроматограмма водного экстракта коры осины (образец 2).

Размещено на Allbest.ru


Подобные документы

  • Жидкостно-адсорбционная хроматография на колонке. Высокоэффективная жидкостная хроматография. Ионообменная жидкостная хроматография. Тонкослойная хроматография. Хроматография на бумаге. Гельпроникающая (молекулярно-ситовая хроматография).

    реферат [746,2 K], добавлен 28.09.2004

  • Возникновение и развитие хроматографии. Классификация хроматографических методов. Хроматография на твердой неподвижной фазе: газовая, жидкостная (жидкостно-адсорбционная). Хроматография на жидкой неподвижной фазе: газо-жидкостная и гель-хроматография.

    реферат [28,1 K], добавлен 01.05.2009

  • Определение понятия "хроматограмма" как функции зависимости концентрации вещества в растворе от объема, пропущенного через колонку растворителя или от времени. Методы фильтрации шумов и моделирования пиков. Запись хроматограммы и алгоритм ее подготовки.

    дипломная работа [1,5 M], добавлен 19.01.2012

  • Хроматографическая система - метод разделения и анализа смесей веществ. Механизм разделения веществ по двум признакам. Сорбционные и гельфильтрационные (гельпроникающие) методы. Адсорбционная, распределительная, осадочная и ситовая хроматография.

    реферат [207,8 K], добавлен 24.01.2009

  • Специфика метода жидкостно-жидкостной хроматографии - физико-химического метода разделения и анализа смесей газов, паров, жидкостей или растворенных веществ сорбционными методами в динамических условиях. Распределительная хроматография на бумаге.

    курсовая работа [601,2 K], добавлен 13.03.2011

  • Сущность высокоэффективной жидкостной хроматографии (ВЭЖХ) как метода анализа и разделения сложных примесей. Сорбенты, координационно-насыщенные хелаты; закономерности влияния строения лиганда на поведение хелатов в условиях обращенофазной хроматографии.

    реферат [109,8 K], добавлен 11.10.2011

  • Явления, происходящие при хроматографии. Два подхода к объяснению - теория теоретических тарелок и кинетическая теория. Газовая, жидкостная, бумажная хроматография. Ионообменный метод. Случаи применения ионообменной хроматографии. Гельхроматографирование.

    реферат [69,4 K], добавлен 24.01.2009

  • Физико-химический метод разделения компонентов сложных смесей газов, паров, жидкостей и растворенных веществ, основанный на использовании сорбционных процессов в динамических условиях. Хроматографический метод. Виды хроматографии. Параметры хроматограммы.

    реферат [21,6 K], добавлен 15.02.2009

  • Знакомство с классификацией адсорбентов по их геометрической структуре. Газоадсорбционная хроматография как метод разделения и анализа смесей газо- или парообразных веществ, основанный на их различной адсорбции твердыми адсорбентами, анализ преимуществ.

    презентация [999,8 K], добавлен 18.05.2016

  • Осуществление разделения методом адсорбционной хроматографии в результате взаимодействия вещества с адсорбентами. Нормально-фазная распределительная хроматография с привитыми фазами. Обращенно-фазная распределительная хроматография с привитыми фазами.

    реферат [109,8 K], добавлен 07.01.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.