*Томский государственный архитектурно-строительный университет, **Сибирский государственный медицинский университет Эта работа опубликована в сборнике научных трудов «Актуальные проблемы биологии, медицины и экологии» (2004 год, выпуск 1), под редакцией проф., д.м.н. Ильинских Н.Н. Посмотреть титульный лист сборника Введение Использование возможностей компьютерной технологии для характеристики патоморфологических изменений в органах и тканях организма человека весьма заманчивая идея. Существующие системы позволяют автоматизировать оценку отдельных морфометрических показателей исследуемого микропрепарата, но не могут предоставить общее суждение об анализируемом объекте, в виде полного медицинского заключения. В значительной степени это связано с тем обстоятельством, что неизвестно, как морфометрические показатели, автоматически регистрируемые системой, соотносятся с общепринятой характеристикой патологических изменений органов тканей и пр. В частности, для микроскопической характеристики дисрегнераторных изменений слизистой оболочки желудка используются такие морфологические оценки как кишечная метаплазия (полная и неполная), гиперплазия покровно-ямочного эпителия (фовеолярная гиперплазия), мукоцилиарная гиперплазия желез, гиперплазия регенераторная и дисрегенераторная, дисплазия, фиброз. В свою очередь, каждое, указанное выше изменение, представляет собой совокупность определенных признаков. Так, для полной кишечной метаплазии слизистой оболочки желудка характерно присутствие всех клеточных элементов, свойственные кишечному эпителию: каемчатые, безкаемчатые и бокаловидные энтероциты, а также клетки с апикальной зернистостью (клетки Paneth) и эндокринные. Бокаловидные клетки, как правило, не лежат сплошным слоем а, как и в тонкой кишке, перемежаются каемчатыми абсорбтивными энтероцитами, не секретирующими слизь. Глубокие отделы ямок идентичны кишечным криптам. Они выстланы бескаемчатым базофильным эпителием, содержат клетки Paneth и свойственные тонкой кишке энтероциты. При неполной кишечной метаплазии слизистой оболочки желудка присутствуют клеточные элементы, свойственные кишечному эпителию: каемчатые, безкаемчатые и бокаловидные энтероциты, эндокринные, кроме клеток с апикальной эозинофильной зернистостью (Paneth). В эпителии выражен полиморфизм ядер, значительно увеличено ядерно-цитоплазматическое отношение. Валики при этом приобретают форму напоминающую ворсинки, а ямки – крипты. Гиперплазию покровно-ямочного эпителия СОЖ оценивают по значительно, иногда резко удлиненным желудочные ямкам, высоким, ветвистым валикам, выстланными высоким светлым покровно-ямочным эпителием, содержащим большое количество мукоидного секрета. Мукоцилиарная гиперплазию желез характеризуют следующими признаками: железы выстланы мономорфным, однослойным, высоким, светлым, призматическим эпителием с признаками секреции. Мелкие округло-овальные нормохромные ядра с ровным или слегка извилистым контуром занимают в клетках эксцентричное положение. Расположены они обычно в один ряд, цитоплазма светлая, с четкими контурами, содержит значительное количество мукоидного секрета. При дисрегенераторной гиперплазии желудочные ямки имеют различную конфигурацию: они расширены или штопорообразно извиты, тесно прилегают друг к другу. Эпителий образовывает ложные выросты и отличается умеренным клеточным и ядерным полиморфизмом. Гиперхромные ядра располагаются на разных уровнях и образуют двух-, изредка трехрядные структуры. Клетки темные, базофильные без признаков секреции. Наблюдается большое количество митозов, часть из них – патологические. Подобные изменения отмечаются и в отдельных группах желез. При оценке степени дисплазии слизистой оболочки желудка руководствуются критериями, предложенными экспертным комитетом Всемирной организации здравоохранения по предраковым изменениям желудка, который дисплазию слизистой оболочки желудка определил как состояние, включающее следующие три типа изменений: 1-й – клеточная атипия, 2-й – нарушение дифференцировки и 3-й – дезорганизация архитектуры слизистой оболочки. Клеточная атипия отличается клеточным полиморфизмом и гиперхромией ядер, их псевдомногослойностью, увеличением ядерно-цитоплазматического отношения, иногда повышением базофилии цитоплазмы, потерей клеточной и ядерной полярности, а также нарушениями дифференцировки клеток, проявляющееся уменьшением, изменением или исчезновением секреции желудочного эпителия (главным образом покровно-ямочного). Как следует из приведенных примеров описательной картины патологических изменений слизистой оболочки желудка, визуальная оценка весьма сложна и не исключает влияние фактора субъективизма. Компьютерная морфометрия оперирует иными критериями, например такими: ядерно-цитоплазматическое соотношение в клетках фундальных и пилорических желез, площадь железистой ткани в 1 мм2 слизистой оболочки желудка (СОЖ), площадь межжелезистой ткани в 1 мм2 СОЖ, общая площадь эпителиоцитов желез в 1 мм2 СОЖ, отношение площади фундальных и пилорических желез к межжелезистой ткани СОЖ, площадь эпителиоцитов желез в 1 мм2 СОЖ, средняя площадь эпителиоцитов в 1 железе, соотношение площади эпителиоцитов к площади железы, количество бокаловидных клеток в железе, клеток Paneth и другими. Этот перечень может быть многократно расширен за счет применения различных способов окраски препаратов путем применения методов гистохимии, иммуногистохимии и пр. Следовательно, компьютерная морфометрия предполагает, казалось бы, иные критерии оценки состояния слизистой оболочки, использует номинальную шкалу измерений и существенно отличается от тех признаков, которыми руководствуется врач-морфолог. Но если глубже вдуматься в технологию качественной оценки показателей используемых врачом и сопоставить её с морфометрической оценкой слизистой оболочки, проводимой системой, то они во многом тождественны. В конечном итоге, врач, визуально анализирующий состояние слизистой оболочки, подсознательно или осознанно значительную часть показателей оценивает количественно. Но это априорное суждение требует доказательств – неизвестно как в действительности соотносятся между собой морфометрические показатели, полученные системой, и общепринятые критерии оценки состояния слизистой оболочки желудка. В данной статье приводятся полученные на основе методов статистического анализа результаты сопоставления данных компьютерной морфологии с визуальной поликлинической оценкой препаратов, проведенной врачами-морфологами; идея решения задач, связанных по экспертному заключению; основы построения интеллектуальной системы тестового распознавания морфологических изменений слизистой оболочки желудка. 1. Сопоставление данных компьютерной морфометрии с визуальной полуколичественной оценкой препаратов, проведенных врачом-морфологом, на основе методов статистического анализа. Мы попытались методами статистического анализа сопоставить данные компьютерной морфометрии с визуальной полуколичественной оценкой препаратов, проведенной двумя врачами-морфологами. В конечном итоге необходимо было выяснить: соответствуют ли параметры морфометрии каким-либо общепринятым критериям, характеризующим изменения слизистой оболочки желудка. С этой целью были исследованы корреляции каждого морфометрического показателя, полученного с помощью компьютерной морфометрии, с полуколичественной оценкой врачом-экспертом изменений слизистой желудка у больных язвенной болезнью желудка. Нами были получены обнадеживающие результаты – некоторые используемые критерии отражали дисрегенераторные характеристики слизистой оболочки желудка. Так оказалось, что гиперплазия с высокой достоверностью прямо коррелирует с площадью желез, площадью железистых эпителиоцитов, соотношением этих показателей. Соответственно, связаны отрицательной корреляцией с площадью межжелезистой ткани. Корреляцию гиперплазии с площадью железистой ткани можно объяснить изначальными гиперпластическими изменениями шеечных отделов желез с последующей трансмиграцией эпителиоцитов в двух противоположных направлениях – в сторону поверхностного эпителия и в сторону самих желез. Фиброз с высокой степенью достоверности соотносился с таким показателем как отношение площади железистых эпителиоцитов к площади железы. Проведено сравнение величины ядерно-цитоплазматического соотношения клеток фундальных и пилорических желез при различных патоморфологических процессах у больных. Выборка данных производилась с исключением случаев сочетания конкретного патоморфологического процесса с другими дисрегенераторными изменениями слизистой оболочки желудка. Оказалось, что для всех видов анализируемых дисрегенераторных процессов этот показатель существенно отличается от его величины у здоровых лиц. Полученные нами данные совпадают с классическим описанием процессов дисрегенерации в слизистой оболочке желудка – наибольшие изменения ядерно-цитоплазматического соотношения характерны для дисплазии, гиперплазии и меньше – для кишечной метаплазии в слизистой оболочке желудка. Это исследование в целом показало малую пригодность методов статистического анализа для подобного рода оценок, что дало основание предложить новую технологию решения задач, связанных по экспертному заключению [1], на основе интеллектуального анализа информации.
2. Решение задач, связанных по экспертному заключению Предполагаемая нами новая технология решения задач, связанных по экспертному заключению, основана на сопоставлении данных, полученных в результате компьютерной морфометрии слизистой оболочки с заключениями нескольких экспертов морфологов, путем выявления закономерностей, присущих измеряемым параметрам (одинаково влияющих на заключение; зависимых; измеряемых обязательно, то есть без которых невозможно дать заключение, существенно влияющих на заключение; неинформативных; константных, то есть принимающих одно и то же значение при различных заключениях), что весьма важно при проведении научных исследований, и построение решающих правил для оценки компьютерной морфометрии слизистой оболочки желудка. Одним из фундаментальных средств анализа информации являются логические тесты [2]. В отличие от известных методов, развиваемые в лаборатории интеллектуальных систем Томского архитектурно-строительного университета (ЛИС ТГАСУ) методы тестового распознавания образов ориентированы на матричную модель представления данных и знаний [3-7], а также на применение безусловных (минимальных и/или безызбыточных) и смешанных (представляющих собой оптимальное сочетание безусловных и условных составляющих) логических тестов, по сути являющихся диагностическими в данном исследовании. Отметим, что используемая матричная модель допускает наличие произвольного числа классификационных (целевых) признаков трех типов (зависимых, независимых и задающих последовательности действий). Интеллектуальный анализ информации при данном подходе осуществляется на этапе выявления закономерностей в данных и знаниях, представленных в матричной форме, и в процессе принятия решений относительно предъявляемых для анализа объектов. Закономерности выявляются одновременно с построением диагностических тестов. При этом используются глубокие оптимизирующие логико-комбинаторные и/или генетические преобразования в пространстве признаков. Принятие решений основано на сочетании логико-комбинаторного и логико-вероятностного подходов к тестовому распознаванию образов с привлечением графических и когнитивных средств визуализации информационных структур, выявленных закономерностей в данных и знаниях, результатов принятия решения относительно анализируемого объекта и обоснования принятого решений. 3. Математические основы построения интеллектуальной системы тестового распознавания морфологических изменений слизистой оболочки желудка. В упомянутых выше целях предлагается применение тестовой распознающей системы, основанной на матричном представлении данных и знаний [3]. В качестве исходной для интеллектуального анализа информации о проблемной области используется обучающая выборка, состоящая из множества описаний объектов (как реальных, так и синтезированных на основе знаний экспертов), для каждого из которых известно соответствующее итоговое решение. Для представления обучающей выборки используется матричная модель, включающая матрицы описаний (Q), различений (R) и переходов (P). Строки матрицы Q сопоставляются объектам из обучающей выборки, столбцы - характеристическим целочисленным признакам z1,z2,…,zm, описывающим в совокупности каждый объект. Элемент матрицы описаний qij задает значение j-го признака для i-го объекта. В случае, если у какого-либо объекта в матрице Q значение признака отмечено символом "-", то значение этого признака несущественно и считается, что он может принимать любые значения из множества значений признака. Строки целочисленной матрицы R сопоставляются одноименным строкам матрицы Q, столбцы - классификационным признакам, определяющим различные механизмы разбиения объектов на классы эквивалентности (механизмы классификации). Элемент матрицы R задает принадлежность данного объекта одному из выделенных классов при соответствующем механизме классификации. Для указания факта принадлежности объекта классу используется номер этого класса. Множество неповторяющихся строк матрицы R сопоставлено множеству выделенных образов. Элементами образа являются объекты, представленные строками матрицы Q, сопоставленными одинаковым строкам матрицы R. Если имеется единственный механизм классификации, матрица R вырождается в столбец, что соответствует традиционному представлению знаний в задачах распознавания образов. В отличие от применения одной матрицы различения диагностического типа, построенной на основе диагностического заключения одного эксперта, в данной работе предлагается использовать коллектив из n экспертов-гистологов (от 2-х до 4-х) и строить n матриц различения. Поскольку морфологические заключения (дисплазия, метаплазия, гиперплазия, атрофия) носят балльный характер, то предлагается довольно простая процедура итогового принятия решения на основе коллектива экспертов. В качестве характеристических признаков выступают показатели компьютерной морфометрии слизистой оболочки желудка: площадь желез и межжелезистой ткани на единицу площади слизистой оболочки желудка, соотношение этих показателей, площадь эпителиоцитов в одной железе, отношение площади эпителиоцитов к общей площади железы, отношение количества бокаловидных клеток к площади эпителиоцитов, ядерно-цитоплазматическое соотношение в эпителиоцитах желез, площадь ядра, его форма, интенсивность окрашивания ядра и цитоплазмы эпителиоцитов в различных цветовых спектрах, интенсивность инфильтрации слизистой оболочки желудка лейкоцитами и др. Строки матрицы Q сопоставляются биопсийным препаратам. При построении матрицы Q количественные характеристические признаки приводятся к k-значным. Выявление закономерностей в данных и знаниях осуществляется на основе их анализа с применением ряда разработанных логико-комбинаторных и генетических алгоритмов. В применяемом подходе под закономерностями понимаются подмножества характеристических признаков с определенными, легко интерпретируемыми свойствами, влияющими на различимость объектов из разных образов, устойчиво наблюдаемыми для объектов из обучающей выборки и проявляющимися на других объектах той же природы, а также весовые коэффициенты характеристических признаков, отражающие их индивидуальный вклад в различимость объектов из разных образов [8]. Искомыми подмножествами являются константные, устойчивые, неинформативные, альтернативные, зависимые, обязательные, псевдообязательные и несущественные признаки, а также минимальные и (или) безызбыточные различающие подмножества признаков. Каждое минимальное (безызбыточное) подмножество признаков является минимальным (безызбыточным) безусловным диагностическим тестом (МБДТ) (ББДТ) и задает необходимые и достаточные условия попарной различимости всех объектов обучающей выборки, принадлежащих разным образам, если их построение осуществляются только на основе анализа всевозможных пар объектов из разных образов. Тест будет минимальным, если его длина равна ]log 2 n[, где n – число образов, а ]log 2 n[ – наименьшее сверху целое к log 2 n. Константные признаки принимают одно и тоже значение для всех объектов из обучающей выборки. Устойчивые признаки не являются константными, но являются константными внутри образа. Неинформативные признаки не различают ни одной пары объектов из разных образов. Альтернативные признаки различают одни и те же пары объектов из разных образов. Зависимость признаков понимается в смысле включения подмножеств различаемых ими пар объектов из разных образов. Обязательные признаки являются необходимыми и достаточными для различения некоторых пар объектов, входят в каждый диагностический тест и образуют ядро всех диагностических тестов, поскольку исключение любого признака из ядра нарушает свойство каждого из тестов быть тестом. Несущественные признаки не входят ни в один диагностический тест. Псевдообязательные признаки не являются обязательными, но входят в каждый диагностический тест из множества тестов, используемых на этапе распознавания изучаемых (анализируемых) объектов. Принятие решений относительно предъявляемых для анализа объектов, не вошедших в обучающую выборку, базируется в применяемом подходе на сочетании логико-комбинаторного и логико-вероятностного подходов к тестовому распознаванию образов. Решающие правила строятся на основе МБДТ, ББДТ или деревьев СДТ. При построении решающих правил учитываются также все другие выявленные закономерности. Описание анализируемого объекта задается в виде подмножества значений тех характеристических признаков, которые были использованы при построении решающих правил на основе МБДТ (ББДТ), и в виде последовательности запрашиваемых значений признаков, включенных в соответствующее дерево СДТ, причем признаки, включенные в безусловную составляющую СДТ, запрашиваются первыми и одновременно. При логико-комбинаторном подходе анализируется описание объекта с учетом априорно задаваемого допустимого процента погрешности принятия решения. Решение о принадлежности объекта тому или иному образу по каждому безусловному тесту принимается на основе вычисляемых коэффициентов условной степени близости объекта к каждому образу, а при использовании деревьев СДТ – на основе голосов (с учетом веса теста), отданных за каждый из образов. Заметим, что более эффективно использовать процедуру построения дерева СТД по безусловному тесту непосредственно по предъявлению описания объекта, поскольку строится не все дерево, а только та его часть, которая необходима для принятия решения. При логико-вероятностном подходе анализируется описание объекта с учетом априорно задаваемых вероятностей значений признаков. Строго говоря, используемый термин "вероятность значения признака" означает степень уверенности эксперта в том, что данное значение признака может иметь место. Решение о принадлежности объекта тому или иному образу по каждому диагностическому тесту принимается на основе вычисляемых вероятностей принадлежности объектов к каждому образу. Итоговое решение относительно исследуемого объекта принимается на основе процедуры голосования на множестве тестов и подходов. Заключение На основе инструментального средства ИМСЛОГ [9], ориентированого на семейство операционных систем Windows, предлагается построить прикладную интеллектуальную систему тестового распознавания морфологических изменений слизистой оболочки желудка. Процесс создания системы включает четыре этапа [9] и позволяет в зависимости от решаемых задач конструировать интеллектуальные распознающие системы различной конфигурации. Построенные системы являются открытыми в плане оперативного наращивания их функциональных возможностей по интеллектуальному анализу информации и поддержке принятия решений с применением новых подходов, алгоритмов и когнитивных средств. Таким образом, интеллектуальная система тестового распознавания морфологических изменений слизистой оболочки желудка, основанная на сочетании логико-комбинаторного и логико-вероятностного подходов к распознаванию образов, позволит автоматизировать и существенно повысить эффективность анализа состояния слизистой оболочки желудка, минимизировать влияние субъективных факторов, использовать номинальную шкалу измерений. Работа поддержана грантами РФФИ (проекты № 01-01-00772 и № 01-01-01050).
1. Yankovskaya A.E., Chernogoryuk G.E., Muratova E.A. Intelligent Test Recognizing Biomedical System// The 6th German-Russian Workshop "Pattern Recognition and Image Understanding" OGRW-6-2003, Workshop proceedings. – Novosibirsk, Russian Federation, 2003. – pp. 248-251. 2. Журавлев Ю.И. Об алгебраических методах в задачах распознавания и классификации// Распознавание, классификация, прогноз. Математические методы и их применение. Вып. 1. – М.: Наука, 1989. – С. 9-16. 3. Янковская А.Е. Алгоритмы спуска при решении некоторых задач синтеза дискретных устройств и их приложения// Теория дискретных управляющих устройств. – М.: Наука, 1982. – С. 206-214. 4. Янковская А.Е. Эффективные алгоритмы спуска и их приложения// Вестник Томского государственного университета. Серия "Математика. Кибернетика. Информатика". Приложение: Доклады II Сибирской научной школы-семинара с междунар. участием "Проблемы компьютерной безопасности и криптографии". – 2003. – № 6. – С. 210-215. 5. Янковская А.Е., Приходько А.Н., Кошелев В.П. Динамическая экспертная система принятия организационных решений при ликвидации последствий катастроф// Военно-медицинский журнал. – 1992. – № 10. – С. 16-18. 6. Янковская А.Е. Представление знаний и алгоритмическое обеспечение для медицины экстремальных ситуаций// Вестник Всесоюзного Общества информатики и вычислительной техники. – 1991. – № 1. – С. 89-97. 7. Янковская А.Е. Технология прогнозирования последствий техногенных и природных катастроф и влияния их на окружающую среду на базе неполностью определенных знаний: от концепции к реализации// Современные методы математического моделирования природных и техногенных катастроф: Труды Междунар. семинара. – Красноярск, 1997. – С. 187-193. 8. Янковская А.Е. Логические тесты и средства когнитивной графики в интеллектуальной системе// Новые информационный технологии в исследовании дискретных структур. Доклады 3-ей Всерос. конф. с междунар. участием – Томск: Изд-во СО РАН, 2000. – С. 163-168. 9. Yankovskaya A.E., Gedike A.I., Ametov R.V., Bleikher A.M. IMSLOG-2002 Software Tool for Supporting Information Technologies of Test Pattern Recognition//Pattern Recognition and Image Analysis. – 2003. – Vol. 13. – No. 4. – pp. 650-657.
|