Сибирский государственный медицинский университет, г. Томск
Кафедра медицинской и биологической кибернетики
Эта работа опубликована в сборнике статей по материалам Международной 69-й научной итоговой студенческой конференции, посвященной 200-летию со дня рождения Н.И. Пирогова (г.Томск, 11-13 мая, 2010 год); под реакцией академика РАМН В.В. Новицкого, член. корр. РАМН Л.М. Огородовой
Посмотреть титульный лист сборника
Скачать сборник целиком (1,4 мб)
Актуальность: задача интегрального оценивания состояний биологических систем и моделирования статистических свойств интегрального критерия связана как с обработкой большого объема данных, так и с проведением требовательных к аппаратуре вычислений, в связи с этим возникает проблема оптимизации вычислений.
Цель: повышение производительности расчетов с использованием технологии распределенных вычислений.
Биологической основой применения лазерного оптико-акустического газоанализа в задачах диагностики респираторных заболеваний человека является изменение состава выдыхаемой смеси, обусловленное как жизнедеятельностью патогенной микрофлоры, так и органическим поражением дыхательного аппарата.
Принцип работы газоанализатора состоит в следующем. Лазерное излучение проходит ячейку с анализируемым газом (проба, взятая от исследуемого человека). Если длина волны излучения совпадает с одной из линий поглощения исследуемого газа, то в результате абсорбции в объеме ячейки появляются возбужденные молекулы, газ нагревается, и в замкнутом объеме ячейки возникает повышенное давление, которое регистрируется микрофоном и преобразуется в электрический сигнал [406].
Исследуемая проба характеризуется вектором величин абсорбции на наиболее чувствительном к излучению диапазоне длины волны лазера или матрицей величин абсорбции, если имеется более одного максимума чувствительности. Каждое состояние – нозологическая форма или отсутствие патологии – может быть представлено облаком в некотором пространстве признаков. Если облака разделимы, задача диагностики сводится к вычислению меры близости исследуемого объекта к одному из известных состояний в этом пространстве – т.н. интегральному оцениванию состояния объекта. Кроме того, необходимо оценить погрешность вычисленного интегрального критерия состояния; это реализуется методами статистического моделирования [2].
Проведение расчетов предъявляет к аппаратуре жесткие требования, и на средней мощности ПК процедура обработки небольшого блока данных (менее 20 объектов для 2-х состояний) может занимать до нескольких минут. Другая задача, параллельно решаемая с описанной выше – выявление частот излучения лазера, на которых абсорбция дает максимальный вклад в интегральную оценку состояния, что в дальнейшем позволит оптимизировать задачу классифицирования объектов. При большом объеме входных данных и длительности расчетов остро встает проблема ускорения вычислений.
Есть несколько способов повышения производительности расчетов. Один из вариантов – равномерно разделить всю совокупность данных между несколькими компьютерами, объединенными в кластер, не изменяя структуры самой программы вычислений, что дает прирост в скорости в k раз для системы из k+1 компьютера (один – т.н. «головной», который рассылает входные данные и собирает вместе выходные).
Другой способ увеличить производительность расчетов – изменить саму программу вычислений таким образом, чтобы уменьшить время исполнения некоторого критического к скорости блока программы, распараллелив его выполнение на нескольких компьютерах (Рис. 1. Схема программы без распараллеливания (слева) и с распараллеливанием (справа) на N узлах (компьютерах) Начиная с некоторой доли распараллеливаемых подзадач в программе (по нашим расчетам – если время ее исполнения не меньше 50% от общего времени работы программы) такой подход более эффективен, чем простое распределение данных между тем же количеством узлов, при этом необходимо учесть накладные расчеты, связанные со скоростью передачи данных по сети.
Максимальная скорость расчетов – аппаратно-зависимая характеристика, определяемая оптимальным соотношением между различными способами распараллеливания данных.
Первый метод был реализован нами на кластере ТГУ СКИФ Cyberia с использованием IDE Freepascal версии 2.2.4. Нами разрабатывается программа вычислений с распараллеливанием критического (к скорости вычислений) фрагмента программы с использованием аппаратных средств кафедры медицинской и биологической кибернетики СибГМУ. Интерфейс реализован при помощи специализированной библиотеки передачи данных MPI / MPICH, разработанной для языков программирования C/C++ и Фортран 77/90.
Работа выполнена при частичной финансовой поддержке РФФИ (грант № 09-02-99038 р_офи), ФЦП г/к №02.740.11.0083, АВЦП Министерства Образования и Науки РФ (грант №2.1.1/3436).
Список литературы:
1. Современная аппаратура лазерного газоанализа для медицинских приложений/ Кабанов А.М., Кистенев Ю.В., Никифорова О.Ю., Пономарев Ю.Н. – Томск: Изд-во ИОА СО РАМН, 2008. – 97 с.
2. Нелинейный анализ медико-биологических данных: монография / С.И. Карась, Ю.В. Кистенев, О.Ю. Никифорова, Я.С. Пеккер, В.А. Фокин, А.В. Шаповалов. – Томск: Изд-во Томского политехнического университета, 2006. – 126 с.
|