ПРИМЕНЕНИЕ ГЕНЕТИЧЕСКОГО АЛГОРИТМА ДЛЯ ДИФФЕРЕНЦИАЛЬНОЙ ДИАГНОСТИКИ ПОДТИПОВ ТРАНЗИТОРНЫХ ИШЕМИЧЕСКИХ АТАК
Медицинский Журнал, 2008, № 4
ПРИМЕНЕНИЕ ГЕНЕТИЧЕСКОГО АЛГОРИТМА ДЛЯ ДИФФЕРЕНЦИАЛЬНОЙ ДИАГНОСТИКИ ПОДТИПОВ
ТРАНЗИТОРНЫХ ИШЕМИЧЕСКИХ АТАК
Н.А. Новоселова, Е.Н. Апанель, Б.В. Дривотинов, А.С. Мастыкин
Объединенный Институт Проблем Информатики НАН Беларуси , Минск, Беларусь
Республиканский научно-практический центр неврологии и нейрохирургии, Минск, Беларусь
Белорусский государственный медицинский университет, Минск
N.A. Novoselova, E.N. Apanel, B.V. Drivotinov, A.S. Mastykin
GENETIC ALGORITHM FOR THE ISCHEMIC TRANSIENT ATTACKS SUBTYPES DIFFERENTIAL DIAGNOSTICS
Цель настоящего исследования – проанализировать возможности генетического алгоритма (ГА) для распознавания подтипов транзиторных ишемических атак, и сопоставить полученные результаты с результатами дифференциальной диагностики этих подтипов по адаптивному нейросетевому классификатору (АНК).
Это исследование проведено как продолжение намерения максимально оптимизировать и сделать более точными классификационные решения по распознаванию подтипов транзиторных ишемических атак (ТИА) с учетом гетерогенности кардиоцереброваскулярной патологии [1, 2, 4, 5, 8, 9, 13, 14]. При этом предполагается интерактивное общение «врач-классификатор» в поиске предпочтительного решения по принятым во внимание критериям (точность, простота выполнения алгоритма решения, доступность информации по принятым в рассмотрение признакам-предикторам и т.д.) [13, 14].
ГА и АНК – это алгоритмы, «подсмотренные» у живых организмов в распознавании образов (объектов) в процессе их жизнедеятельности и заимствованные от их природы. В самих живых организмах такие алгоритмы функционируют в «диком» режиме, таком, каким их создала Природа в процессе эволюции, но помещенные человеком в рамки формальной логики они становятся доступными как искусственный инструмент для практической работы в обществе и в научных исследованиях [3, 21, 25, 27, 30, 31].
Согласованность и адаптационная эффективность совместной работы функциональных систем живого организма привлекали и заставляли задуматься над возможностью формализации этой работы с целью большей результативности в решения прикладных практических задач в самых различных областях знаний и социальной деятельности. Вместе с этим ясно, что такое свойство живых организмов возникло не сразу и не вдруг, а есть результат длительного многовекового эволюционного развития с постепенным усложнением решения распознавательных и прогностических задач в процессе борьбы за выживание. Это результат естественного отбора в длительном и драматичном континууме проб и ошибок все усложняющегося процесса приспособления к меняющимся и усложняющимся условиям жизни.
1. Общие предпосылки к постановке дифференциально-диагностической задачи
Применительно к решению конкретной прикладной медицинской задачи распознавания (дифференциальной диагностики) подтипов ТИА использование адаптивных нейросетевых и генетических алгоритмов призвано значительно уменьшить нагрузку на интеллект врача во все обостряющемся конфликте между необходимостью больше знать и максимально быстро оперировать этими знаниями [7, 13, 14, 25, 31].
В этом исследовании проведен анализ работы ГА на имеющихся клинических наблюдениях, приведенных в обучающей выборке [7-9, 11-14]. Формально-логически здесь преследуется цель решения дифференциально-диагностической задачи по двум оптимизируемым и конкурирующим критериям:
· минимизация ошибки классификации (большая точность);
· минимальное количество отобранных признаков-предикторов;
С точки зрения общепринятого представления, чем больше принято в рассмотрение признаков-критериев, тем реальнее ожидать большей точности, и наоборот. И здесь надо найти компромиссное решение, удовлетворительное по обоим критериям.
Разработанный ГА используется для диагностики ТИА и протестирован на обучающей выборке, включающей 101 наблюдение клинически выверенных случаев пациентов с атеротромботическим этиопатогенезом эпизодов ТИА (СубТИА1) – 22 наблюдения, кардиоэмболическим (СубТИА2) – 23 наблюдения, гипертензиным (СубТИА3) – 22 наблюдения. Контрольная группа НОРМА включает 34 наблюдения. Каждое наблюдение характеризуется по 41 клиническому и персональному признаку-предиктору [22, 23]*. При формировании обучающей выборки особое внимание уделялось пациентам с возможностью у них экстрацеребрального нарушения кровообращения в бассейне a. auditiva interna. Такие случаи в исследование не включались.
2. Общие представления о генетическом алгоритме
Впервые описание ГА было сделано Л.Фогелем, А. Оуенсом и М. Уолшем, в их концепции эволюции логических автоматов [21]. Однако достаточно четко и максимально приближенно к решению прикладных задач в науке и обществе эта биологическая концепция эволюции и адаптации логических автоматов была сформулирована Дж. Холландом [27], который считается «отцом генетического алгоритма». Отличительной особенностью ГА является их эволюционирующий консерватизм - они моделируют преимущественно только то, что являются существенным для устойчивой работы.
Само описание ГА строится на формализованной трактовке терминов, заимствованных из генетики. В общих чертах, в этих терминах, функциональной единицей является формальная хромосома, бинарный вектор, в котором выделяются отдельные участки – формальные гены, которые в определенных его позициях, формальных аллелях, могут изменять свои значения, подвергаться мутации, под влиянием различных воздействующих внешних факторов, табл. 1.
ГА позволяет решать прикладные задачи путем кодирования ее решения в формальной хромосоме. Степень отклонения нового решения задачи классификации от цели оптимизации, определяемая в ГА значением меры его приспособленности позволяет влиять на дальнейший ход отбора решений в новую популяцию ГА. Например, такой мерой (характеристикой, категорией) приспособленности может быть отношение стоимость/качество проведения лабораторного исследования. Причем решения с низкой степенью приспособленности представлены в новой популяции в меньшей степени [13].
В такой интерпретации нетрудно заметить виртуальное (мнимое зеркальное), экстраполированное в область математической абстракции, отражение реального процесса жизнедеятельности живого организма в стремлении сохранить своей неповторимой облик и свою самобытность, тем самым сохранить себя от внешних мутагенных воздействий.
Этим обеспечивается устойчивость работы классификационной экспертной системы (ЭС), построенной с использованием ГА, и защита ее от информационного замусоривания во взаимосвязи входных признаков-предикторов с распознавательным решением на выходе “мусор на входе – мусор на выходе” (“garbage in, garbage out”, GIGO). Следует заметить, что статистические классифицирующие системы не защищены от влияния эффекта GIGO.
В контексте описания ГА следует кратко сказать несколько слов о так называемом генетическом детерминизме, который в среде биологов и психологов вызывает жаркие и затяжные дискуссии и в которые, в нашем случае, углубляться не стоит. В нашем представлении формально-логическая интерпретация генетических процессов может служить для обоснования способности классифицирующего логического автомата к консервативному изначальному стремлению к «исходной истине».
Таблица 1. Основные термины и понятия генетического алгоритма
№№ пп |
Термин в трактовке генетического алгоритма |
Пояснение
|
1 |
Цель оптимизации |
состоит в том, чтобы найти единственное лучшее возможное решение задачи по одному или нескольким критериям. |
2. |
Хромосома
|
Оптимизиру |
3. 4. 5. 6. 7. |
Ген (несколько бит) Локус (местоположение) Аллель Особь Популяция |
Часть классификационного решения. Позиция гена в хромосоме. Возможное значение гена по нескольким битам. Одно из возможных решений задачи оптимизации. Случайный набор возможных решений задачи оптимизации. |
8.
9.
10. |
Репродукция (отбор хромосом)
Скрещивание (кроссинговер)
Мутация |
Процесс, в котором хромосомы (оптимизируемые классификационные решения) копируются в промежуточную популяцию по значениям целевой функции. Скрещивание хромосом; обмен отрезками хромосом «родителей» Произвольная модификация хромосомы; фоновая операция, производящая случайное изменение в различных хромосомах; иногда с участием инверсии. |
11. |
Целевая (фитнес) функция, то же что и оценочная функция и мера приспособленности |
Оценка близости каждой особи (возможного решения задачи) к оптимальному решению задачи; функция оценки или функция цели в задачах оптимизации. |
12. 13. |
Генотип Фенотип |
Закодированное решение Раскодированное решение |
В нашем случае ГА является технологической основой дифференциально-диагностической ЭС и работает с совокупностью-популяцией "особей" – классификационных решений, где каждое рассматриваемое решение оценивается мерой приспособленности, определяемой с учетом двух критериев, перечисленных в разделе 1 (с использованием обучающей выборки по подтипам ТИА и классу НОРМА).
Формально-логически использование нескольких критериев при оценке значения меры приспособленности позволяет получить несколько недоминируемых решений, тем самым, предоставляя врачу возможность отбора, наиболее соответствующего с его точки зрения, классификатора с учетом принятых в рассмотрение критериев. В нашем исследовании функциональной единицей ГА является строка формальной хромосомы - бинарного вектора, где каждый из n бит (формальная аллель) соответствует значению отдельного признака-предиктора, рис. 1, которые формируют классификатор согласно принципу ближайших соседей (nearest-neighbor matching) [13, 29]**.
Рисунок 1 – n-мерный бинарный вектор, определяющий особь популяции генетического алгоритма для отбора признаков
3. Формально-логическая постановка дифференциально-диагностической задачи
При решении дифференциально-диагностической или какой-либо другой распознавательной задачи практически всегда по умолчанию преследуется цель получить оптимальные много- или поликритериальные решения по нескольким предпочтительным критериям. Это – желаемое. В действительности же большинство распознавательно-диагностических методов как традиционных клинико-лабораторных, так и разработанных на базе компьютерных технологий выдают решение по какому-то одному критерию, более или менее учитывающему интерес и по другим критериям. Для нахождения компромиссного поликретериального решения между желаемым и действительным такого класса распознавательных дифференциально-диагностических задач используется поликритериальный эволюционный ГА [13, 26, 30].
Поликритериальные решения распространены, в частности, в экономике и маркетинге в рамках концепции локального лидерства на базе Парето-оптимальности – оптимального решения по нескольким критериям, где Парето-оптимальность продукта представляется тремя конкурентными критериями (характеристиками) – цена, качество, конкурентоспособная рыночная привлекательность. В медицинской практике такой аналогичный подход может осуществляться по критериям гендерной принадлежности пациентов, возрастных групп, по критерию цена-качество диагностики, исхода терапевтического или оперативного лечения на каком-то этапе выздоровления и реабилитации, доступности параклинических исследований и множество других.
В данном исследовании формулируется более скромная бикритериальная дифференциально-диагностическая задача оптимизации по двум противоречивым критериям: (а) подготовка с помощью ГА набора признаков-предикторов для получения последующей классификации с минимальной ошибкой и (б) чтобы сам состав этого набора был бы минимальным по количеству и минимально затратным по средствам и по времени.
Основная идея классификационного решения в рамках поликритериальной концепции Парето-оптимальности заключается в определении понятия недоминируемости для отдельных решений оптимизационной задачи. Решение х1 доминирует другое решение х2, если одновременно выполняются два условия:
1. Решение х1 не хуже решения х2 по любому из рассматриваемых критериев.
2. Решение х1 строго лучше решения х2 по крайней мере по одному из критериев.
Если не существует ни одного решения, удовлетворяющего этим условиям, то х2 является недоминируемым или Парето-оптимальным решением поликритериальной задачи.
В нашем исследовании задача дифференциально-диагностического распознавания подтипов ТИА представляется в виде задачи бикритериальной оптимизации и решается с использованием эволюционного подхода, что позволяет построить набор недоминируемых решений-классификаторов с различными соотношениями между отдельными критериями оптимизации.
В качестве первого оптимизируемого критерия выступает точность классификации объектов данных методом ближайших соседей, в качестве второго критерия определяется количество используемых признаков с соответствующими весовыми коэффициентами. В ходе работы ГА происходит поиск решений оптимизационной задачи, которая предполагает одновременную максимизацию значения первого критерия и минимизацию значения второго критерия. Для этого применяется специальная кодировка решений оптимизационной задачи в особи ГА и специальные операции отбора и рекомбинации [12, 13, 26].
В результате работы ГА из 41 признака в качестве наиболее эффективных (позволяющих сформировать классификатор с достаточно высокой приемлемой точностью диагностики подтипов ТИА) признаков-предикторов определены 8 признаков: зрительные расстройства (OPDISODS), снижение памяти (MEMORYLO), возраст начала тобакокурения (SMOKAGE), снижение трудоспособности (LABEFFEC), бессонница (INSOMNIA), боли области сердца (HEARTACH), характер головных болей (HEADACHE) изменения на ЭКГ (ECG).
Формальная схема работы предложенного ГА для построения классификатора приведена на рис. 2.
Рис. 2. Структура работы ГА для построения классификатора с одновременным отбором признаков-предикторов
4. Результаты решения дифференциально-диагностической задачи определения подтипов ТИА по ГА
Полученные в процессе работы ГА недоминируемые решения – Парето-оптимальный фронт классификаторов – бикритериальной оптимизационной задачи диагностики подтипов ТИА представлены на рис. 3. Недоминируемые классификаторы построены на различных подмножествах признаков с различными весовыми коэффициентами, соответствующими каждому из признаков. Согласно этому рисунку точность классификации растет с увеличением количества используемых признаков, однако в случае применения построенных классификаторов на отдельном тестовом наборе данных, не используемом для их построения, такое соотношение может не выполняться. Поэтому при отборе окончательного решения необходимо принимать во внимание результаты классификации тестовой выборки клинических наблюдений.
Весовые коэффициенты подмножества признаков недоминируемого классификатора (рис. 3), обеспечивающего минимальную ошибку классификации 19,8% (точность решения – 80,2%), представлены в табл. 2.
Таблица 2. Признаки-предикторы и их весовые коэффициенты
Признак |
OPDISODS |
MEMORYLO |
SMOKAGE |
LABEFFEC |
Весовой коэффициент |
9.3
|
8.3
|
5.8
|
5.4
|
Признак |
INSOMNIA |
HEARTACH |
HEADACHE |
ECG |
Весовой коэффициент |
4.8
|
4.6
|
4.6
|
1.8
|
Рис. 3. Недоминируемые классификаторы: горизонтальная ось определяет количество принятых в рассмотрение признаков-предикторов, вертикальная – ошибку классификации (распознавания) подтипов ТИА.
Сопоставление точности распознания (дифференциальной диагностики) подтипов ТИА и класса НОРМА по технологиям АНК [14] и ГА приведено в таблице 3.
Таблица 3. Сопоставление точности распознания по технологиям АНК и ГА
Тип классификтора |
Точность классификации (%) |
АНК |
77,2 |
Классификатор с использованием ГА |
80.2 |
5. Агрегирование нескольких классификаторов
Использование эволюционного подхода к решению задачи диагностики подтипов ТИА позволяет построить несколько недоминируемых классификаторов и выбор окончательного решения, варианта классификатора, может быть осуществлен врачом-экспертом согласно его знаниям об объекте исследования и имеющему опыту в конкретной предметной области. В последнее время в исследованиях большое внимание уделяется созданию ансамблей классификаторов, которые при обеспечении независимости отдельных членов ансамбля, позволяют повысить точность классификации и улучшить его обобщающие свойства [14, 28]. В идеале классификационные ошибки каждого из классификаторов ансамбля не должны коррелировать, что можно представить как аналог «консилиума» нескольких виртуальных клиницистов-экспертов, знания которых по признакам распознавания и классификации различны – один более компетентен по одному набору признаков-предикторов, другой – по другому [14].
Такое функциональное разнообразие («пластичность») ансамбля-«консилиума» обеспечивается в исследованиях путем варьирования наборов признаков, используемых для построения отдельных классификаторов [14, 29].
6. Обсуждение результатов, перспективы дальнейшей работы и заключение
Методы искусственного интеллекта, в том числе и генетический алгоритм, получают все большее распространение в различных областях научных исследований и социальной жизни. В практической работе они конкретизуются правилами, теоремами, постулатами и вычислительными методами формальной логики.
Общая вычислительная методология при работе с ГА представлена так называемым «мягким вычислением" (soft computing), L.A. Zadeh [34]. Это понятие объединяет такие направления исследований как вероятностные рассуждения, нечеткая логика, нейронные сети, эволюционные вычисления и алгоритмы, которые в различных комбинациях дополняют друг друга в ансамблях для решения классификационных задач (в медицине как «консилиум виртуальных экспертов») или в составе гибридных интеллектуальных систем различного назначения. «Мягкие вычисления» осуществляются там, где приходится иметь дело с понятием «неопределенность». Говоря о медико-биологической направленности нечеткой логики и «мягких вычислений», Л. Заде писал, что «наиболее вероятная область применения этой теории – медицинская диагностика, и в меньшей степени описание биологических систем» [33]. Иногда используется понятие «природные вычисления» [34].
Считается перспективным применение методов искусственного интеллекта в спортивной практике для выбора наилучшего подхода к физической тренировки спортсменов [24].
Не будет большой смелостью сказать, что вся работа по распознаванию нозологий начальных проявлений острой цереброваскулярной и экстракраниальной недостаточности кровообращения с их поразительной способностью маскироваться друг под друга пронизана нечеткостью, неточностью и сомнениями [5, 15, 16]. Не менее сложно разграничение «где конец нормы и начало патологии», и по какому из множества векторов гипоксии-ишемии последует дальнейшее развитие? [18-20].
Формально-логически даже в окончательной формулировке клинического диагноза присутствует элемент неполноты и недосказанности. В этом смысле клинический диагноз есть кантианская «вещь в себе», созвучная с теоремой Геделя о неполноте логик высказывания.
Этой констатацией можно было бы и ограничиться, если бы этим сказанным не затрагивалась очень болезненная, и до сих пор не решенная проблема точности и корректности формулировок клинического диагноза. Все еще присутствует неудовлетворенность, и даже раздраженность известных неврологов потому, что «проблеме клинической классификации нозологических форм уделяется недостаточно внимания». Не удовлетворяет и такое капитальное руководство как МКБ-10. «(МКБ-10) – это перечень статистических категорий для анализа и изучения заболеваемости, а не клинических диагностических терминов» [10]. Врач-ординатор по устоявшимся формулировкам принятой клинической классификации стремиться использовать клинический диагноз как ориентир (вектор) для достижения наиболее эффективного «таргетного» этиотропного лечения, а заведующий отделением или медицинский статистик клинические диагнозы подгоняет под коды и рубрики МКБ-10 для статистической приглядности [10]. Здесь профессиональный интерес руководителя учреждения и практикующего врача-клинициста находятся в явном противоречии. Профессиональный клинический интерес практического врача в этом смысле нередко просто административно игнорируется.
Такая же неудовлетворенность нерешенностью проблемы корректности и практической целесообразности клинического диагноза звучит и у белорусских неврологов [6]. В комментарии к рубрике G45 (ТИА) по подрубрике G45.3 (преходящая слепота, amaurosis fugax), авторы акцентируют внимание на этиологическую гетерогенность этого скоротечного заболевания [6]. Диагнозы эмболии сосудов сетчатки и нарушения кровотока в задней мозговой артерии при G45.3 и этиологически и топодиагностически различны. Такая ситуация, в свою очередь, предполагает также различные целенаправленные лечебно-профилактические тактики по предотвращению будущих эпизодов этой нозологии. Фактически, в этом случае имеет место не симптом, не признак и даже не синдром, в точном смысле этого понятия, но клинический феномен.
И такое взаимное маскирование друг друга нарушений локального кровообращения с большим трудом раскрывается в условиях специализированного клинического стационара с высококвалифицированным персоналом и оснащенного современным высокотехнологичным оборудованием. А как быть пациенту, оказавшемуся наедине с собой в обычных бытовых условиях, далеких от научно-практических возможностей? Кризис состояния и дискомфорт развивается, как правило, под утро в момент просыпания. Головокружение настолько выражено, что не в силах подняться и связаться по телефону со станцией скорой помощи. Если есть рядом родственники, то, как правило, начинаются дебаты и выяснения, что случилось? И только после достигается консенсус – уточнение «что делать». Не вызывает сомнения, что в такой ситуации пациенту, уже в той или иной степени знакомого с такими эпизодами, нужен минимум знаний по алгоритму выхода из болезненного состояния. Причем, разумеется, недифференцированно от локализации очага, интрацеребрально или экстракраниально подвергающемуся пока еще обратимому и поправимому нарушению кровообращения.
Более того, при более обширном подходе к проблеме выясняется, что имеют место и этнические этиопатогенетические особенности возникновения эпизодов ишемического поражения мозга. Так, в обширном исследовании, проведенном сотрудниками Департамента неврологии, экологии и неотложной медицины университета Циннцинати (штат Огайо, США) выявлено своеобразие протекания острого ишемического нарушения мозгового кровообращения у чернокожего населения: «Инсульт невыясненной этиологии – наиболее часто встречающийся подтип ишемического нарушения среди чернокожих. Кардиоэмболический инсульт и ишемические нарушения в бассейнах мелких мозговых сосудов – наиболее выраженная и четко обозначенная причина первичного ишемического инсульта у этой категории населения» [32].
Возвращаясь к рубрике G45 МКБ-10, видно, что там отсутствует упоминание о подтипах ТИА, и как следствие – отсутствует вектор-ориентир, указывающий траекторию прогнозного диагностического направления для адресного индивидуализированного этиотропного лечебно-профилактического вмешательства. В каждом клиническом случае лечебную тактику и стратегию врачу приходится только домысливать исходя из своих знаний и опыта, отложив в сторону это капитальное руководство до следующего момента составления очередного отчета, когда нюансы формулировок диагнозов и статистические расчеты утратят всякую актуальность, как для пациента, так и для лечащего врача.
Сложившаяся ситуация в диагностике кардиоцереброваскулярной патологии вызывает неудовлетворенность многих авторитетных неврологов и практических врачей, что побуждает искать новые способы решения проблемы формулировки клинических диагнозов [4-11, 15, 16, 22, 23]. В этом поиске отчетливо просматривается все возрастающая роль методов формально-логической классификации и разработки классификаторов на их основе [5, 7-9, 11, 14, 17].
Как нам представляется, такое положение вещей в неврологической диагностике обусловлено недостаточной продуманностью технологии диагностического процесса, построенного исключительно на авторитетных, а нередко и авторитарных, предпочтениях и приоритетах традиционных логико-клинических постулатов. Такая организация в прошлом и до настоящих дней, в общем-то, удовлетворяет запросы практической невропатологии, но сейчас, по мере накопления новых знаний и высокотехнологичных инструментальных методов исследований, существующее положение в формулировании клинических неврологических диагнозов становится неудовлетворительной. Это не чья-то вина, а скорее, беда, но беда поправимая. По нашему твердому убеждению, положение может быть исправлено внедрением формально-логических методов на базе теории распознания образов, теории нечетких множеств, нечеткой логики («мягкие», «природные» вычисления). Такое рассуждение может показаться парадоксальным и шокирующим. И это в какой-то степени, возможно, оправдано. Однако, дело в том, что эта диагностическая некорректность сегодняшнего дня обусловлена конфликтом между инертностью традиционного профессионального искреннего стремления к достижению идеальной (стопроцентной) точности и правилами, теоремами и постулатами формальной логики, которым, хотим ли мы этого или нет, подчинены и формулировки клинических диагнозов. Кратко эта конфликтная ситуация вполне укладывается в одной фразе: «получить идеальную, стопроцентно четкую точность формулировки клинического диагноза невозможно, но методами нечетких («мягких», «природных») формально-логических вычислений можно добиться приемлемой для практической работы достаточно четкой и точной формулировки на базе формально-логической классификации и соответствующих классификаторов». Такое понимание не претендует на оригинальность и мало отличается от общепринятого устоявшегося традиционного клинического представления. Новое в этом – привлечение информационных компьютерных технологий в конкретизацию и упорядочение формулировок клинического диагноза с учетом этиопатогенетических особенностей гетерогенности внутри традиционно признанных и используемых в практической работе формулировок нозологий.
Практически, в этом контексте самым важным и, по-прежнему, уязвимым моментом в постановке диагноза ТИА вообще, и подтипа ТИА в частности, является анализ анамнестических сведений и имеющихся лабораторно-клинических данных для предварительного решения с последующими рекомендациями и назначением лечебно-профилактических мероприятий. Вот здесь в самом начале диагностического процесса и есть отправной пункт для возможности проявить себя формально-логическим классификационным решениям непосредственно в практической работе. В традиционной же клинической форме этот важный момент практически не формализуем, и врачу самостоятельно в рамках своих знаний и опыта приходится самому решать и находить ответ на вопрос: попадает ли обследуемый пациент в поле зрения угрозоопасности возникновения у него эпизода ТИА? Ответ на этот вопрос сразу же предполагает учет двух критериев – точность, с которой будет гарантирован ответ и достоверность и достаточность сведений (анамнеза, данных осмотра и лабораторно-клинических исследований) для ответа на него. Формально-логически использование ГА позволяет получить несколько классификаторов, являющихся оптимальными по двум критериям и соответственно несколько решений (ответов) задачи диагностики, которые дают имеющуюся информационную картину заболевания, но окончательное (доминирующее) клиническое решение выносит сам врач по своим профессиональным предпочтениям и опыту, исходя из которых строиться дальнейшая лечебно-профилактическая стратегия – образуется своего рода «симбиоз-консилиум» врача и формально-логического классификатора.
Такой подход может быть актуальным при проведении целевой диспансеризации, когда необходимо решить вопрос «заслуживает» ли пациент быть включенным в группу риска возникновения у него эпизода ТИА, и если да, то по какой наиболее вероятной траектории (атеротромботической, кардиогенной или гипертензивной) сможет развиваться патологический процесс. Следствие ответа на этот вопрос – назначение индивидуализированных «таргетных» превентивных лечебно-профилактических мероприятий для каждого из обследуемых пациентов [1, 2, 7, 14, 20].
В заключение, конкретно по дифференциальной диагностике подтипов ТИА, следует отметить, что работа создаваемой для практического применения классификационной (дифференциально-диагностической) системы осуществляется в два этапа.
1) Первый этап – по генетическому алгоритму, с учетом предстоящего решения дифференциально-диагностической бикритериальной задачи, ориентирован на информационную предподготовку по двум противоречивым критериям:
а) обеспечение достижения минимальной ошибки (максимально возможной точности) предстоящей классификации,
б) выделение минимального набора доступных, преимущественно малозатратных, не требующих длительного времени на их получение, анамнестических информативных признаков-предикторов из их общего числа в обучающей выборке, предварительно составленной по традиционному клинико-логическому разделению на классы (три класса подтипов ТИА – атеросклеротический, кардиогенный, гипертензивный и контрольный класс НОРМА).
2) Второй этап – по выбранному конкретному классификатору (например, по технологии АНК) непосредственное проведение индивидуализированной классификации (дифференциальной диагностики по подтипам ТИА и классу НОРМА) вновь прибывших для обследования пациентов с последующим отбором из их числа группы риска по подтипам ТИА для проведения целенаправленных («таргетных») лечебно-профилактических мероприятий.
Литература
- Апанель, Е. Н., Мастыкин А.С. Способ назначения лечебно-профилактических мероприятий по предотвращению транзиторных ишемических атак: пат. РБ № 8997.
- Апанель, Е. Н. Комплексный подход к этиотропным лечебно-профилактическим мероприятиям по предотвращению эпизодов транзиторных ишемических атак // Медицинский журнал. 2008. № 2. С. 117–120.
- Букатова, И.Л. Эволюционное моделирование и его приложения М., 1979. 231 с.
- Верещагин, Н.В. Гетерогенность инсульта: взгляд с позиций клинициста //
Ж. невропатологии и психиатрии (Приложение: Инсульт ). 2003. №9. С. 8-9.
- Виленский, Б. С. Прогнозирование исходов инсульта не правомерно // Неврологический журнал. 2008. № 1. С. 52–53.
- Гиткина, Э.С., Пономарева Е.Н., Евстигнеев В.В., Шалькевич В.Б. Адаптация клинической классификации сосудистых поражений мозга к международной статистической классификации болезней Х пересмотра//Медицинские новости. 2000. № 6. С. 3-10.
- Дривотинов, Б. В., Мастыкин, А. С., Красько, О. В., Апанель, Е. Н. Применение разведочных методов анализа данных в дифференциальной диагностике подтипов транзиторных ишемических атак // Военная медицина. 2006. № 1. С. 51–54.
- Дривотинов, Б.В., Мастыкин А.С., Апанель Е.Н., Новоселова Н.А. Использование нечеткой нейросетевой модели для дифференциальной диагностики подтипов транзиторных ишемических атак // Медицинский журнал. 2007. № 2. С. 102-105.
- Дривотинов, Б.В., Апанель Е.Н., Новоселова Н.А., Мастыкин А.С., Федулов А.С. Адаптивная нейро-нечеткая модель для дифференциальной диагностики подтипов транзиторных ишемических атак//Военная медицина. 2007. № 4. С. 101-106.
- Иерусалимский, А.П. К проблеме формулирования клинического диагноза в неврологии// Ж. невропатол. и психиатр. 2008. № 5. С. 105-106.
- Мастыкин, А.С., Апанель Е.Н., Дривотинов Б.В., Антонов И.П. Факторный анализ признаков, симптомов и факторов риска транзиторной ишемической атаки// ВЕСЦI НАН Беларусi (Сер. мед. навук) 2005, №3. С. 32-36.
- Новоселова, Н. А. Алгоритмы построения гибридного нечеткого классификатора для анализа медицинских данных. Дисс. канд. технических наук. Минск, 2008.
- Новоселова, Н. А., Мастыкин А.С., Том И.Э. Эволюционный подход к выделению информативных признаков в задачах анализа медицинских данных// Искусственный интеллект. 2008. № 3. С. 105-112.
- Новоселова, Н. А., Апанель, Е. Н., Дривотинов, Б. В., Мастыкин, А. С. «Консилиум» адаптивных нейросетевых классификаторов для дифференциальной диагностики подтипов транзиторных ишемических атак// Медицинский журнал. 2008. № 3. С. 116-121.
- Парфенов, В. А., Абдулина, О. В., Замерград, М. В. Периферическая вестибулопатия под маской инсульта // Неврологический журнал. 2007. № 6. С. 21–25.
- Пономарева, Е. Н., Пономарев, В. В. Неврологические маски антифосфолипидного синдрома // Неврологический журнал. 2007. № 4. С. 14–17.
- Реброва, О.Ю., Максимова М.Ю., Пирадов М.А. Нейросетевой алгоритм диагностики патогенетических подтипов ишемического инсульта //Ж. неврологии и психиатрии им. С.С. Корсакова. Инсульт (Приложение), 2004, вып. 12, С. 23-28.
- Сидоренко, Г. И. Пути применения кибернетики для решения вопросов диагностики и терапии // Кибернетика в медицине. Научная конференция 14 марта 1968 г., Минск, 1968. С. 35-38.
- Сидоренко, Г. И. Творчество и медицина: поиск неочевидных решений. Минск, 2002.
- Сидоренко, Г. И. Перспективные направления кардиологической профилактики// Медицинские новости. 2007. № 9. С. 41-43.
- Фогель, Л., Оуэнс А., Уолш М. Искусственный интеллект и эволюционное моделирование. М.: Мир, 1969. 230 с.
- Шалькевич, В.Б., Мастыкин А.С., Апанель Е.Н. Диагностика транзиторных ишемических атак// Медицинские новости. 2001. № 12. С. 39-45.
- Шалькевич, В.Б., Апанель Е.Н. Мастыкин А.С. Проявления симптоматики транзиторных ишемических атак у больных мерцательной аритмией// Медицинские новости 2002. № 7. С. 66-68.
- Шестаков М.П. Искусственный интеллект в спортивной науке XXI века //Теория и практика физической культуры// 2000, № 7, С. 8-13.
- Brown, M., Bossley, K.M., Mills, D.J., Harris, C.J. High dimensional neurofuzzy systems: overcoming the curse of dimensionality/ Fuzzy Systems, 1995. International Joint Conference of the Fourth IEEE International Conference on Fuzzy Systems and The Second International Fuzzy Engineering Symposium. Proceedings of 1995 IEEE International Conference. Yokohama, Japan. 1995.Vol. 4. Р. 2139–2146.
- Deb, K. Multi-Objective Optimization using Evolutionary Algorithms/K. Deb //John Wiley & Sons, England.- 2001
- Holland, J.H. Adaptation in Natural and Artificial Systems// Ann Arbor, MI: The University of Michigan Press. 2nd edn. (1992) Boston, MA: MIT Press. 1975.
- Kittler, J., Hatef, M., Duin, R. P. W., Matas, J.: On Combining Classifiers, IEEE Trans. on Pattern Analysis and Machine Intelligence 20 (1998) 226-239.
- Optiz, D.W. Feature selection for ensembles. In Proc. of 16th International Conference on Artificial Intelligence, p. 379–384, 1999.
- Rechenberg, I. Evolutionsstrategie – Optimierung technischer Systeme nach Prinzipien der biologischen Evolution. – Stuttgart-Bad CannStatt: Frommann-Halzboog. 1973.
- Siedlecki,W. A note on genetic algorithm for large scale features selection/ W. Siedlecki, J. Sklandsky// Pattern Recognition Letters. 1989. Vol. 10. № 5. P. 335-347.
- Woo D, Gebel J, Miller R, Kothari R, Brott T, Khoury J, Salisbury S, Shukla R, Pancioli A, Jauch E, Broderick J. Incidence rates of first-ever ischemic stroke subtypes among blacks: a population-based study. Stroke. 1999. Vol. 30. P. 2517-2522.
- Zadeh, L.A. Biological application of the theory of fuzzy sets and systems / L. Zadeh // Proceedings of the International Symposium on Biocybernetics of the Central Nervous System. Boston: Little, Brown & Co., 1969. P. 199-212.
- Zadeh, L.A. Fuzzy logic, neural network and soft computing//Communications of the ACM. 1994.Vol. 37. № 3. P. 77-84.
____________
* Использованы данные из предыдущих совместных работ с профессором В.Б. Шалькевичем.
** В медицинских исследованиях известен как метод поиска клинического прецедента.