УДК 616.366-003.7

ДИАГНОСТИЧЕСКАЯ ЗНАЧИМОСТЬ ВХОДНЫХ

ПАРАМЕТРОВ НЕЙРОСЕТИ В ПРИЛОЖЕНИИ К

ЖЕЛЧНОКАМЕННЫМ ЗАБОЛЕВАНИЯМ

А. В. АНИКИН*, Т. И. СУББОТИНА** , В. В. ЧАПКИН*, А. А. ЯШИН*

1. Введение

Использование нейросетей в медицине (список областей медицины, в которых начали применяться нейронные технологии, чрезвычайно обширен и продолжает расти), как правило, связано с системами для диагностики и дифференциальной диагностики заболеваний. Однако обученная нейросеть не только умеет распознавать примеры, но и хранит достаточно важную информацию. Поэтому одним из серьезных направлений применения нейронных сетей является интерпретация медицинских данных. В последние годы идет бурное развитие новых средств диагностики и лечения. При этом наблюдается "вторая волна" изучения и использования древних, старинных методов, и, наоборот, применение последних технических новшеств [1]. Нередко и те, и другие методы при использовании предоставляют врачу массу самых разнообразных данных. При этом встает проблема их грамотной и корректной интерпретации. Поиск глубинных закономерностей между получаемыми данными и патологическими процессами начинает отставать от разработки все новых и новых методов, поэтому применение для этой цели нейросетей может оказаться чрезвычайно выгодным.

2. Значимость входных параметров нейросети и методы их сокращения

Врач, ставящий диагноз больному, всегда старается анализировать весь комплекс сведений о пациенте - жалобы, анамнез болезни и жизни, данные клинического осмотра и лабораторных анализов. При этом одна часть параметров имеет принципиальное значение для принятия решения, другая же не столь важна и даже может просто игнорироваться. Действительно, часто для диагностики и прогноза больному проводят сложные и дорогостоящие методы исследования, порой небезвредные для здоровья. Однако во многих случаях представляется возможным получить ответ и без них. Нейросеть, принимающая решение на основе опыта, поступает сходным образом. Поэтому исследователю очень важно знать, какие из параметров важны для сети, а какие - не очень. Следует сказать, что абсолютно незначимых параметров практически не бывает, и каждый входной сигнал в большей или меньшей степени влияет на принятие решения.

2.1. Методы сокращения множества параметров

Сокращение множества параметров и входных сигналов нейросети может преследовать несколько целей:

С точки зрения пользователя особенно важны две последние цели: сокращение объема данных уменьшает затраты на самый трудоемкий процесс - сбор данных; возможность явной вербальной интерпретации - новое свойство нейросетей, в результате которого появляется возможность приведения структуры нейронной сети к понятному и допускающему осмысленный пересказ виду.

Наиболее популярными способами сокращения описания являются два пути [2]: "снизу вверх" - постепенное удаление параметров от наименее значимых к более значимым и "сверху вниз" - выделение наиболее значимых параметров и постепенное дополнение их менее значимыми, пока нейросеть не будет обучаться с достаточной точностью.

Последовательность действий при сокращении параметров методом "снизу вверх" имеет следующий вид:

  1. обучается нейросеть до необходимой точности;
  2. проводится анализ значимости входных параметров обученной нейросети;
  3. определяются наименее значимые параметры;
  4. они устраняются путем изменения обучающей выборки;
  5. далее обучается новая нейросеть и т.д. - эти пункты повторяются до тех пор, пока задача не решится с удовлетворительной точностью.

Если сокращенная система не может решить задачу с требуемой точностью (т.е. упрощение было слишком радикальным), то можно поступить двумя способами. Первый состоит в том, что система возвращается на один цикл назад и проводится менее радикальное сокращение, например отсекается вдвое меньше параметров. Второй способ более тонкий. Необходимо обучить нейросеть до максимально возможной точности, используя в качестве входных параметров только отсеченные параметры, после чего выявляются и возвращаются в систему наиболее значимые из них.

2.2. Методика расчета значимости входных параметров

Пусть имеется набор n-мерных векторов входных данных (фактов) (i = 1, 2, ..., p) с координатами (j = 1, 2, ..., n) и m-мерных векторов выходных данных (i = 1, 2, ..., p) с координатами (k = 1, 2, ..., m), причем каждый выход является некоторой функцией от , т.е. . Требуется выделить наименее значимые параметры .

Подавая на один из входов смещение , получаем выходное смещенное значение , например при подаче смещения на 1 вход выход будет являться функцией , при подаче смещения на 2 вход выход будет являться функцией и т.д. При этом вычисляется по формуле:

,

где - коэффициент смещения, чаще всего .

Проведем расчет следующих характеристик нейросети.

Абсолютная минимальная чувствительность входа относительно выхода говорит о минимальном объеме изменений (положительных или отрицательных), которые вход когда-либо оказывал на выход для всех фактов. Большое число означает, что вход всегда имеет важное влияние. Небольшое число означает, что в некоторых случаях вход имеет небольшое влияние. Вычисляется по формуле:

,

где p - количество фактов.

Абсолютная максимальная чувствительность входа относительно выхода показывает максимальное количество изменений (положительных или отрицательных), которые вход оказывает на выход для всех фактов. Большое число означает, что вход в некоторых случаях имеет большое влияние; небольшое число означает, что вход не имеет достаточного воздействия. Вычисляется по формуле:

.

Средняя чувствительность входа относительно выхода сообщает средний объем изменений выхода , который вход имеет во всех фактах. Она показывает в общем, является ли воздействие входа положительным или отрицательным и приблизительно как велико общее воздействие. Вычисляется по формуле:

.

Среднее значение абсолютной чувствительности входа относительно выхода оценивает средний объем изменений (положительных или отрицательных), которые вход имеет во всех фактах и определяет, насколько сильно воздействие входа во всех фактах, не сообщая является ли воздействие положительным или отрицательным, вычисляется по формуле:

.

Средняя абсолютная чувствительность входа относительно всех выходов сообщает средний объем изменений по всем выходам, который вход имеет во всех фактах. Она говорит приблизительно как велико среднее воздействие входного нейрона на все выходы и вычисляется по формуле:

.

Средняя абсолютная чувствительность является наиболее важной характеристикой значимости входных параметров нейросети и является основной при принятии решения об усечении входных параметров.

3. Определение наиболее важных параметров в приложении к желчнокаменной болезни

При решении задач медицинской диагностики часто бывает необходимо оценить информативность параметров, на основании которых ставится диагноз. Для решения этой проблемы относительно диагностики заболеваний печени и желчнокаменной болезни используем нейронные сети, которые с помощью вышеописанной методики проводят анализ значимости и сокращение параметров.

Исходными данными являлась база данных, в которой находилась информация о 299 обследованных пациентах, страдающих различными поражениями печени и желчнокаменной болезнью. Данные о каждом пациенте представляют собой многомерный вектор , характеризующийся 86 параметрами (данные клинического осмотра и лабораторных анализов).

Проводились исследования по созданию системы, которая могла бы с высокой точностью определять тип и локализацию камней при желчнокаменной болезни. Для этого созданы две нейросети: одна распознает тип камней (холестериновые, пигментные, смешанные), а другая определяет их локализацию (в желчном пузыре, в холедохе, во внутрипеченочных протоках) и характер (множественные или единичные).

Каждая нейросеть создавалась с использованием метода сокращения параметров "снизу вверх".

3.1. Нейросеть для распознавания типа камней

Изначально нейросеть обучалась распознавать тип камней, используя 80 входных параметров, но в итоге после отсечения малоинформативных итоговая нейросеть обучилась выполнять эту же задачу на 16 входных параметрах. Однако при сокращении входных параметров увеличивалось время обучения нейросети (количество тактов). При сокращении количества входов примерно в четыре раза (до 22 входов) точность обучения ухудшилась незначительно , однако при дальнейшем сокращении параметров до 16 допуск увеличился до 0,2396. Но такое увеличение допуска не повлияло на точность распознавания, т.к. выходные переменные принимают значения либо ноль, либо единица, т.е., используя округление с таким допуском, все 100% фактов распознаются.

На рис. 1 и 2 представлены диаграммы средних чувствительностей для созданной нейросети и средней абсолютной чувствительности для всех выходов.

Из рис. 1 и 2 следует, что наиболее информативным комплексом признаков, соответствующему определенному типу камней (холестериновые, пигментные, смешанные) являются показатели нарушения билирубинового обмена (признак 72), морфологические изменения в ткани печени (признак 52, 58, 40), особенности структурообразования желчи (признак 85), способность ткани печени к регенерации (признак 80).

Как было ранее сказано, исследование информативности помогает перейти к логическим выводам, появляется возможность приведения структуры нейронной сети к понятному и допускающему осмысленный пересказ виду. Например, в нашем случае с желчнокаменной болезнью анализ показал, что 72-ой признак очень важен, и действительно после дополнительного статистического исследования выборки были получены следующие результаты (см. табл.).

Таблица

Содержание непрямого билирубина в желчи

Вся выборка
Холестери-новые камни
Пигмент-ные камни
Смешан-ные камни
Минимальное значение
2,5
4,5
5
2,5
Максимальное значение
200
20,5
200
35,5
Среднее значение
14,56
10,27
19,90
15,61

Рис. 1. Средние чувствительности

Рис. 2. Средняя абсолютная чувствительность для всех выходов

Из таблицы можно сделать вывод, что при наличии пигментных камней наблюдается повышенное содержание непрямого билирубина в желчи по отношению ко всей выборке, а также к смешанным (в 1,3 раза) и особенно холестериновым камням (в 2 раза). Эту же информацию несет и проведенный ранее анализ информативности. Если посмотреть на диаграмму для 72-го признака, представленную на рис. 1, то можно заметить, что для холестериновых камней чувствительность 72-го входа - отрицательная, а для пигментных и смешанных - положительная, и это говорит о том, что у больных с пигментными и смешанными камнями выявлено повышенное содержание непрямого билирубина. И действительно, если обратиться к литературе [3]: "если количество экстретируемого непрямого билирубина превышает возможность его растворения в данном объеме желчи, то часть его будет выпадать в осадок, что ведет к появлению пигментных камней". Таким образом, путем исследования выборки с помощью нейросетевых технологий мы получили достаточно внятный аналитический вывод, совпадающий с описанием желчнокаменной болезни [3].

Также в ходе работы выявлено, что для пациентов с пигментными и смешанными камнями характерно наличие значительных изменений (поражений) печени, сопровождающихся нарушениями ее функций (см. рис.1). Для пациентов, страдающих алкогольным поражением печени (признак 5) характерно отсутствие пигментных камней, но характерны холестериновые (77,78% пациентов) и смешанные (22,22% пациентов). Содержание ДНК (признак 80) также является важным признаком, характеризующим особенности функционального состояния печени (в случаях с пигментными и смешанными камнями содержание ДНК в 1,5 раза ниже, чем в случаях с холестериновыми камнями) (см. рис.2).

3.2. Нейросеть для диагностики локализации камней

Нейросеть обучилась определять локализацию камней, используя 32 входных параметра. При дальнейшем сокращении параметров нейросеть стала обучаться неудовлетворительно.

Для определения локализации камней наиболее информативными оказались следующие признаки: содержание прямого и непрямого биллирубина в желчи, площадь некроза и тип некроза, токсикоз беременных, жировые дистрофии, внеклеточные холестазы. Причем такие параметры, как постоянные боли и наличие синдрома портальной гипертензии явно менее информативны, чем остальные.

4. Заключение

В результате выполненной работы изучены вопросы, связанные со значимостью входных параметров в приложении к желчнокаменной болезни. Рассмотрены методы сокращения параметров, предложена методика расчета прогностически значимых медицинских параметров, проведен соответствующий анализ относительно вида и локализации камней. Изучена и доказана эффективность метода исследования информативности входных параметров с помощью нейронных сетей.

Поиск глубинных закономерностей между получаемыми данными и патологическими процессами весьма важен для исследователей в области медицины и биологии, и применение для этой цели нейросетевых технологий оказывается чрезвычайно выгодным.

Литература
  1. Горбань А.Н., Дунин-Барковский В.Л.и др. Нейроинформатика.- Новосибирск: Наука, 1997.- 433 с.
  2. Горбань А.Н., Россиев Д.А. Нейронные сети на персональном компьютере.- Новосибирск: Наука, 1996.- 276 с.
  3. Дедерер Ю.М., Крылова Н.П., Устинов Г.Г. Желчнокаменная болезнь.- М.: Медицина, 1983.- 173 с.

DIAGNOSTIC SIGNIFICANCE OF INPUT PARAMETERS OF NEURONETWORKS IN THE APPLICATION TO HEPATOLITHIASIS DEASEASES

A. V. ANIKIN, T. I. SUBBOTINA, V. V. CHAPKIN, A. A. YASHIN

Summary

One of the most important trends of using neuronetworks is an interpretation of medical data. Search for deep regularities between got data and pathological processes begins to lag behind the development of new methods, so using neuronetworks to this purpuse can be exceedingly advantageous. In the article questions are discussed which are connected with the significance of input parameters being applying to hepatolithiasis diseases. Methods of shortenning parameters, are considered, strategy of calculation of significant medical parameters is suggested, respective analysis for the type and stone localizations is conducted efficiency of method of study significant input parameters by means of neuronetworks is studed and proved.

Аникин Александр Викторович, в 1997 году окончил Тульский государственный университет по специальности "Биотехнические и медицинские аппараты и системы". Работает в НИИ новых медицинских технологий; младший научный сотрудник лаборатории биоинформатики и моделирования процессов жизнедеятельности. В круг научных интересов входит моделирование процессов жизнедеятельности человека, компьютерные технологии, нейронные сети.

Чапкин Вячеслав Вячеславович, в 1997 году окончил Тульский государственный университет по специальности "Биотехнические и медицинские аппараты и системы". Работает в НИИ новых медицинских технологий; младший научный сотрудник лаборатории биоинформатики и моделирования процессов жизнедеятельности. В круг научных интересов входит моделирование процессов жизнедеятельности человека компьютерные технологии, нейронные сети.