ИСПОЛЬЗОВАНИЕ НЕЙРОННЫХ СЕТЕЙ ДЛЯ ВЫДЕЛЕНИЯ ИНФОРМАТИВНЫХ ПРИЗНАКОВ В ДИФФЕРЕНЦИАЛЬНОЙ ДИАГНОСТИКЕ СЕРДЕЧНО-СОСУДИСТЫХ ЗАБОЛЕВАНИЙ

 

А.И. АБАКУМОВ*, Т.П. НОВГОРОДЦЕВА**, Л.В. СОРОКИНА***

 

Многочисленными медико-биологическими исследованиями доказана информативная и диагностическая значимость показателей жирных кислот (ЖК) липидов крови при сердечно-сосудистых заболеваниях (ССЗ) [1-7]. В указанных работах вопросы ассоциированности ССЗ с модификацией состава ЖК в основном рассматриваются с точки зрения частоты выявления и распространенности их нарушений в изучаемой популяции. В отечественной и зарубежной литературе отсутствуют работы, в которых используется сложный математический аппарат для подтверждения роли ЖК в развитии заболеваний, установленной медико-биологическими исследованиями. Дополнительные диагностические возможности показателей ЖК открывает специальная математическая обработка, позволяющая установить взаимосвязь их отдельных представителей со степенью патологических проявлений ССЗ. Широкое распространение в медицине и биологии приобретают нейросетевые технологии, идеальным полем применения которых являются задачи классификации, позволяющие определить принадлежность объекта к одному из нескольких возможных классов. При этом для принятия решений могут использоваться самые разнообразные клинические, функциональные данные и лабораторные тесты. Подобные классификации способствуют созданию систем для диагностики и дифференциальной диагностики заболеваний. Цель настоящей работы - использование нейронных сетей при классификации ССЗ по показателям ЖК липидов эритроцитов крови для определения их информативности в дифференциальной диагностике.

База данных проектировалась и анализировалась в НИИ медицинской климатологии и восстановительного лечения СО РАМН (НИИ МКВЛ) и включала итоги клинического и биохимического обследования 128 человек. Обследуемые - жители юга Приморья старше 17 лет, русской национальности, обоего пола, проживающие в данной климатической зоне более 10 лет. Обследуемые на основании клинических симптомов были разбиты на 5 групп по степени патологических изменений: группа здоровых, составившая 26 человек, без факторов риска и клинических симптомов кардиальной патологии (КП); группа условно здоровых (15 чел.) с отягощенной наследственностью по КП, но без клинических симптомов заболевания; группа лиц с функциональными расстройствами в виде нейроциркуляторной дистонии (НЦД) (30 человек); группа больных с артериальной гипертонией (АГ) I, II, III ст. тяжести - 17 человек; группа больных ишемической болезнью сердца (ИБС) - 40 человек со стенокардией 1-2 функционального класса, а также перенесшие инфаркт миокарда.

Нейронные сети представляют собой нелинейные системы. Искусственная нейронная сеть (ИНС) - это набор нейронов, соединенных между собой. Как правило, передаточные функции всех нейронов в сети фиксированы, а веса являются параметрами сети и могут изменяться. Некоторые входы нейронов помечены как внешние входы сети, а ряд выходов - как внешние выходы сети. Подавая любые числа на входы сети, получаем какой-то набор чисел на выходах. Т.о., работа нейросети состоит в преобразовании входного вектора в выходной вектор, причем это преобразование задается весами сети [9]. Каждый нейрон характеризуется своим текущим состоянием по аналогии с нервными клетками головного мозга, которые могут быть возбуждены или заторможены. Он обладает группой синапсов - однонаправленных входных связей, соединенных с выходами др. нейронов, а также имеет аксон - выходную связь данного нейрона, с которой сигнал (возбуждения или торможения) поступает на синапсы следующих нейронов. Процесс функционирования ИНС, т.е. сущность действий, которые она способна выполнять, зависит от величин синаптических связей, поэтому, задавшись определенной структурой нейронной сети, надо найти оптимальные значения всех переменных весовых коэффициентов. Этот этап называется обучением ИНС. Нейронные сети отлично зарекомендовали себя при построении прогнозов, диагностике, принятии решений, в предсказаниях и при решении др. задач классификации, для которых важным является распознавание образов, а точные в числовом выражении ответы не требуются. Для изучения возможностей применения нейронных сетей в определении информативности показателей ЖК было обучено 3 нейронных сети различной архитектуры. Использовался пакет NeuroShell 2 фирмы Ward Systems Group, Inc [9].

Первая - нейронная сеть, построенная на архитектуре многослойного персептрона с прямыми связями между нейронами и алгоритма обратного распространения ошибки (стандартная сеть). Параметры сети, обеспечившие ее обучение, следующие: количество скрытых слоев равно 1, уровень точности выхода нейронов сети 0.01, скорость обучения - 0.1, начальный вес - 0.3, передаточная функция - логистическая, имеющая вид [9]:

 


где`` x - означает среднее по всем значениям этой переменной в файле данных, а d тандартное отклонение этих значений.

Число нейронов во входном слое - 39, в выходном - 5, число скрытых нейронов для 3-слойной сети (31) вычислялось по следующей формуле [9]:

 


где Nhn - количество скрытых нейронов, Ni - число признаков, по которым строится сеть, No - число выходов в сети, Ne - количество примеров. Результаты работы сети - в табл. 1.

 

Таблица 1

Результаты работы стандартной сети

 

 

Группы

I

II

III

IV

V

R2:

0,9772

0,5303

0,7520

0,8058

0,8937

Средняя квадратичная ошибка:

0,004

0,046

0,051

0,032

0,016

Средняя абсолютная ошибка:

0,033

0,091

0,103

0,064

0,060

Мин. абсолютная ошибка:

0

0

0

0

0

Макс. абсолютная ошибка:

0,260

1,000

1,000

1,000

0,728

Коэффициент корреляции r:

0,9908

0,7311

0,8690

0,8981

0,9495

Доля с ошибкой менее 5%:

18,644

0

11,017

10,169

10,169

Доля с ошибкой от 5% до 10%:

0

1,695

11,017

5,085

3,390

Доля с ошибкой от 10% до 20%:

1,695

3,390

2,542

1,695

3,390

Доля с ошибкой от 20% до 30%:

0,847

2,542

0,847

0,847

0

Доля с ошибкой свыше 30%:

0

3,390

3,390

3,390

0,847

 

Как видно из табл. 1, наиболее правильно классифицированы обследуемые из 1-й и 5-й группы (коэффициент корреляции 0,99 и 0,95 соответственно, т.е. ни один человек не был распознан как субъект из другой группы).

Вторая сеть - нейронная сеть с общей регрессией (НСОР), известная своей способностью к быстрому обучению на рыхлых наборах данных. При тестировании обнаружено, что НСОР на многих типах задач (но не на всех) ведут себя лучше, чем сети с обратным распространением ошибки [9]. Сети НСОР были изобретены д-ром Дональдом Шпехтом [8]. НСОР представляет собой 3-слойную сеть (рис. 1), в которой должно быть по одному скрытому нейрону для каждого тренировочного примера. В данной сети отсутствуют такие параметры тренировки, как скорость обучения и момент, характерные для сетей с обратным распространением ошибки, но имеется параметр сглаживания, использующийся после того, как сеть натренирована. Этот параметр означает менее точное приближение данных поверхностью при высоких значениях. Здесь он равен 0,3. Число нейронов во входном слое (блок 1) равно числу входов в задаче (39), а число нейронов в выходном слое (блок 3) соответствует числу выходов - 5. Число нейронов в скрытом слое устанавливается автоматически и равно числу примеров в тренировочном наборе.

Результаты работы сети представлены в табл. 2: коэффициенты корреляции практически во всех группах равны 0,99, за исключением 2-й группы, где коэффициент 0,95 свидетельствует о том, что сеть данной архитектуры наиболее точно классифицировала субъектов по группам.

 

 


Рис. 1. Архитектура сети НСОР

 

Третья - сеть Ворда, представляющая собой сеть с обратным распространением ошибки, в которую добавлен третий блок в скрытый слой. Все блоки в скрытом слое имеют разные передаточные функции, что дает три способа рассмотрения данных. Схематично архитектура такой сети представлена на рис. 2.

Параметры сети, обеспечившие ее обучение, следующие: количество скрытых слоев равно 3, уровень точности выхода нейронов сети - 0.01, скорость обучения - 0.1, начальный вес - 0.3, момент - 0.1, передаточные функции: блок 1 - логистическая (формула 1), блок 2 - Гауссова функция, имеющая вид [9]:

 


Блок 3 - функция гиперболического тангенса:


Блок 4 - комплектарная Гауссова, имеющая вид:


 

Число нейронов в блоке 1 (входном) равно числу признаков - 39, в выходном (блок 5) - 5, в остальных блоках - 33, по 11 в каждом блоке. Число скрытых нейронов рассчитывали по той же формуле, что и в стандартной сети (табл. 3). Как и в сетях, построенных на основе многослойного персептрона, наиболее правильно классифицированы лица из 1-й и 5-й группы (коэффициент корреляции 0,94 и 0,97 соответственно), но значительно лучшие результаты получены для группы риска (коэффициент корреляции 0,72, а в стандартных сетях - 0,53).

Таблица 2

Результаты работы сети НСОР

 

 

Группы

I

II

III

IV

V

R2:

0,9734

0,9450

0,9928

0,9955

0,9966

Средняя квадратичная ошибка:

0

0

0

0

0

Средняя абсолютная ошибка

0

0

0

0

0

Мин. абсолютная ошибка:

0

0

0

0

0

Макс. абсолютная ошибка:

0,008

0,006

0,008

0,008

0,006

Коэффициент корреляции r:

0,9864

0,9721

0,9963

0,9977

0,9982

Доля с ошибкой менее 5%:

21,186

11,017

28,814

21,186

17,797

Доля с ошибкой от 5% до 10%:

0

0

0

0

0

Доля с ошибкой от 10% до 20%:

0

0

0

0

0

Доля с ошибкой от 20% до 30%:

0

0

0

0

0

Доля с ошибкой свыше 30%:

0

0

0

0

0

 

Таблица 3

Результаты работы сети Ворда

 

 

Группы

I

II

III

IV

V

R2:

0,9448

0,7174

0,8077

0,8470

0,9683

Средняя квадратичная ошибка:

0,009

0,029

0,040

0,026

0,005

Средняя абсолютная ошибка:

0,026

0,059

0,072

0,047

0,024

Мин. абсолютная ошибка:

0

0

0

0

0

Макс. абсолютная ошибка:

0,788

0,951

1,000

0,921

0,484

Коэффициент корреляции r:

0,9720

0,8470

0,8987

0,9203

0,9840

Доля с ошибкой менее 5%:

17,797

6,780

22,881

16,102

16,949

Доля с ошибкой от 5% до 10%:

1,695

1,695

0,847

0,847

0

Доля с ошибкой от 10% до 20%:

0

0

0,847

0

0

Доля с ошибкой от 20% до 30%:

0,847

0

0,847

0

0

Доля с ошибкой свыше 30%:

0,847

2,542

3,390

4,237

0,847

 

Таблица 4

 

Показатели важности работы сетей различной архитектуры

 

N
переменной

Переменная

Весовой
коэффициент

(стандарт. сеть)

Весовой
коэффициент

(НСОР)

Весовой
коэффициент

(сети Ворда)

1

пол

0,14

3,00

0,03996

2

возраст

0,21

2,31

0,04309

3

N14_00

0,14

0,01

0,02983

4

N14_1

0,11

0,31

0,02235

5

A15_0

0,10

2,62

0,02216

6

N15_0

0,10

0,00

0,02713

7

N15_1

0,14

0,00

0,02417

8

I16_0

0,09

1,47

0,01569

9

N16_0

0,15

0,75

0,02726

10

N16_1W9

0,09

0,55

0,02240

11

I17_0

0,09

2,75

0,02327

12

A17_0

0,07

1,36

0,01419

13

N17_0

0,06

3,00

0,01069

14

N17_1

0,12

0,00

0,02358

15

I18_0

0,13

0,00

0,01558

16

N18_0

0,16

0,01

0,02604

17

N18_1W9

0,15

0,01

0,02528

18

N18_1W7

0,14

2,24

0,02359

19

N18_1W5

0,18

1,87

0,03378

20

N18_2W6

0,12

0,01

0,02854

21

N18_3W6

0,15

2,10

0,02707

22

N18_3W3

0,10

0,94

0,02320

23

N18_4W3

0,11

2,62

0,02181

24

N20_0

0,15

2,91

0,02497

25

N20_1

0,14

0,01

0,02862

26

N20_2W6

0,11

1,56

0,02626

27

N20_3W6

0,14

3,00

0,02308

28

N20_4W6

0,12

0,74

0,02244

29

N20_3W3

0,11

0,04

0,01957

30

N20_5W3

0,14

0,75

0,03177

31

N22_4W6

0,14

2,90

0,02004

32

N22_5W6

0,10

2,07

0,02516

33

N22_4W6

0,12

2,97

0,03537

34

N22_6W3

0,10

2,24

0,02020

35

Бс 1

0,13

1,15

0,03247

36

Бс 2

0,16

2,67

0,02774

37

Бс 3

0,10

1,47

0,01851

38

Бс 4

0,14

2,27

0,02466

39

Арт. давление

0,26

1,37

0,04847

 

В итоге работы сетей для каждой входной переменной были вычислены показатели важности, являющиеся грубой мерой значимости этой переменной для выхода сети по отношению к др. входным переменным той же сети.

Чем больше показатель, тем больше вклад данной переменной в результат работы сети. В сетях НСОР с генетическим поиском вычисляется не показатель важности, а индивидуальный параметр сглаживания, который можно рассматривать как показатель чувствительности для каждого входа. Чем выше значение параметра сглаживания, тем большее влияние оказывает соответствуюещий вход на ответ сети.


Рис. 2. Архитектура сети Ворда

 

Результаты значимости признаков для сетей различной архитектуры представлены в табл. 4: каждая сеть выделила свои информативные признаки среди показателей ЖК, которые действуют в рамках конкретной сети. Каждая сеть произвела классификацию индивидуумов с высокой точностью по степени тяжести ССЗ. Наиболее информативно классификация объектов произведена сетью с общей регрессией.

Подводя итог проведенному исследованию, можно заключить следующее. Использование математического аппарата подтверждает высокую диагностическую значимость показателей ЖК при ССЗ, доказанную методами медико-биологических исследований. Применение нейросетевых методов в медико-биологических исследованиях позволяет с высокой эффективностью классифицировать признаки, что может быть использовано для дифференциальной диагностики ССЗ.

Применение сетей различной архитектуры в диагностике независимо от выделенных информативных параметров каждой сети приводит к общему результату. Общими для нейронных сетей наиболее информативными для дифференциальной диагностики являются параметры пола, показатели ЖК изо- и антеизостроения, ряд представителей С20 полиеновых ЖК в эритроцитах.

 

Литература

 

1. Galli E. et al. // British J. of Dermatology.- 1994.- Vol. 130, N 6.- P. 752-756.

2. Ma J. et al. // Am. J. Clin. Nutr.- 1995.- Vol. 62, N 3.- P. 564-571.

3. Ohrvall M. et al. // Eur. J. Nutr.- 1996.- Vol. 50, N 6.- P. 381-385.

4. Sarkkinen E.S. et al. // Am. J. Clin. Nutr.- 1994.- Vol. 59, N 2.- P. 364-370.

5. Simon J.A. et al. // Am. J. Epidemiol.- 1996.- Vol. 144, N 4.- P. 325-334.

6. Simon J.A. et al. // Stroke.- 1995.- Vol. 26, N 5.- P. 778-782.

7. Simon J.A. et al. // Am. J. Epidemiol.- 1995b.- Vol. 142, N 5.- Р. 469-476.

8. Specht, D. Probabilistic Neural Networks for Classification, Mapping, or Associative Memory. Proceedings of the IEEE International Conference on Neural Networks.- 1988.- N 1, Р. 525-532.

9. Электронный учебник по NeuroShell 2

 

 

Application of Neuronic Networks for Selection of

Informative Indications in Differential Diagnostics of Cardiovascular Diseases

 

A.I. Abacumov, T.P. Novogorodtseva, L.V. Sorokina

 

Summary

 

Comparative analysis of neuronic network of different structure has been conducted for the selection of informative indications in differential diagnostics of cardiovascular diseases (CVD). Every network chose its informative indications in indices of fatty acids, which act within the limits of the particular network. At the same time, every network made a classification of individuals with a high accuracy by the degree of severity of CDV. The most informative classification of subjects was carried out with network of general regression.

Key words: cardiovascular diseases, network

 

Сорокина Людмила Викторовна, окончила Дальневосточный госуниверситет. Доцент кафедры информатики и информационных таможенных технологий Владивостокского филиала Российской таможенной академии и соискатель при НИИ медицинской климатологии и восстановительного лечения - Владивостокского филиала Дальневосточного НЦ физиологии и патологии дыхания СО РАМН.

 

Новгородцева Татьяна Павловна, доктор биологических наук, зав. лабораторией биомедицинских исследований НИИ медицинской климатологии и восстановительного лечения СО РАМН.

 

Абакумов Александр Иванович, доктор физико-математических наук, зав. лабораторией моделирования экологических процессов Института прикладной математики ДВО РАН.

 

 

 

 

 



*Институт прикладной математики ДВО РАН;

**НИИ медицинской климатологии и восстановительного лечения СО РАМН

***Владивостокский филиал Российской таможенной академии