Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Методы согласованного отбора признаков для классификации полутоновых диагностических изображений Гайдель Андрей Викторович

Методы согласованного отбора признаков для классификации полутоновых диагностических изображений
<
Методы согласованного отбора признаков для классификации полутоновых диагностических изображений Методы согласованного отбора признаков для классификации полутоновых диагностических изображений Методы согласованного отбора признаков для классификации полутоновых диагностических изображений Методы согласованного отбора признаков для классификации полутоновых диагностических изображений Методы согласованного отбора признаков для классификации полутоновых диагностических изображений Методы согласованного отбора признаков для классификации полутоновых диагностических изображений Методы согласованного отбора признаков для классификации полутоновых диагностических изображений Методы согласованного отбора признаков для классификации полутоновых диагностических изображений Методы согласованного отбора признаков для классификации полутоновых диагностических изображений Методы согласованного отбора признаков для классификации полутоновых диагностических изображений Методы согласованного отбора признаков для классификации полутоновых диагностических изображений Методы согласованного отбора признаков для классификации полутоновых диагностических изображений Методы согласованного отбора признаков для классификации полутоновых диагностических изображений Методы согласованного отбора признаков для классификации полутоновых диагностических изображений Методы согласованного отбора признаков для классификации полутоновых диагностических изображений
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Гайдель Андрей Викторович. Методы согласованного отбора признаков для классификации полутоновых диагностических изображений: диссертация ... кандидата Технических наук: 05.13.17 / Гайдель Андрей Викторович;[Место защиты: «Самарский государственный аэрокосмический университет имени академика С.П. Королева (национальный исследовательский университет)»].- Самара, 2015.- 156 с.

Содержание к диссертации

Введение

ГЛАВА 1. Задача автоматического формирования признаков 18

1.1. Постановка задачи распознавания образов 18

1.2. Критерии качества системы распознавания 21

1.3. Постановка и подходы к решению задачи построения признаков 35

1.4. Задачи анализа биомедицинских изображений 39

1.5. Текстурные признаки на изображениях 42

1.6. Оптимизация направления для текстурных признаков 53

1.7. Экспериментальное исследование оптимизации направления для текстурных признаков 58

1.8. Выводы 66

ГЛАВА 2. Разработка методов построения полиномиальных признаков 68

2.1. Полиномиальные признаки 68

2.2. Ограничения на полиномиальные признаки 70

2.3. Критерии качества полиномиальных признаков 77

2.4. Экспериментальное исследование качества квадратичных признаков 84

2.5. Устойчивость алгоритмов распознавания при автоматическом построении признаков 91

2.6. Выводы 99

ГЛАВА 3. Модификации и приложения методов построения признаков 101

3.1. Эффективный алгоритм вычисления признаков, основанных на длинах серий 101

3.2. Метод случайного поиска для глобальной оптимизации сложных функций одной переменной 105

3.3. Гибридный метод глобальной оптимизации сложных функций 112

3.4. Выделение области интереса на биомедицинских изображениях 116

3.5. Программное средство для обработки и анализа биомедицинских изображений 128

3.6. Выводы 134

Заключение 136

Список сокращений и условных обозначений 138

Список литературы

Введение к работе

Актуальность темы. В настоящее время в отечественной медицинской практике для радиологической диагностики системных заболеваний не везде распространено дорогостоящее оборудование, а для анализа распространённых радиологических изображений привлекаются высококвалифицированные медицинские работники. Это приводит к запоздалой постановке диагноза некоторых заболеваний, что осложняет дальнейшее лечение, в то время как существуют методы предупреждения развития этих заболеваний в случае постановки диагноза на ранних стадиях. Средства автоматизации диагностики могли бы ускорить, удешевить и объективизировать процедуру обследования пациентов.

Множество общих способов обработки и анализа биомедицинских изображений, включая текстурный анализ и способы автоматической диагностики, можно найти в [Rangayyan, 2005]. Используемые диагностические признаки включают мо-ментные статистические характеристики, матрицы вхождений Харалика, впервые описанные [Haralick, 1973], а также спектрально-корреляционные характеристики, фрактальные признаки и т. д. Обширный спектр самых разных методов анализа биомедицинских изображений с подробным описанием подходов к решению конкретных практических задач также можно найти в [Ильясова, 2012]. Там же приводится интересная модель описания изображения, называемая «полем направлений», которая учитывает локальные направления изменения яркости на изображении.

Существует ряд работ, посвящённых отбору признаков для эффективного распознавания биомедицинских изображений. Гибридный алгоритм отбора признаков, сочетающий несколько разнородных этапов, рассматривается в [Peng, 2010]. В работе [Tsai, 2013] для отбора признаков с одновременной классификацией используется генетический алгоритм с целевой функцией, основанной на байесовской сети. Тестирование полученного алгоритма на стандартных наборах эталонных данных показало вероятность правильной классификации вплоть до 0,99, что, тем не менее, превосходит классификацию на полном наборе признаков лишь в вычислительной сложности, но не в достоверности распознавания.

Во всех описанных работах новые признаки строятся на основе уже имеющихся примитивных признаков путём применения различных операторов, как правило, случайным образом. Однако в случае обработки сложных объектов распознавания, таких как крупные изображения, примитивные признаки могут отсутствовать, так как затруднительно считать отдельными примитивными признаками миллионы отсчётов изображения. Поэтому необходимо разработать специфические для изображений методы построения признаков по обучающей выборке, не опирающиеся на уже имеющиеся признаки.

Таких работ не слишком много, но имеется цикл статей по построению эффективных линейных локальных признаков изображений под авторством В. В. Мясникова. В [Мясников, 2007] разработанные алгоритмы вычисления свёртки используются для построения линейных локальных признаков изображений и других сигналов. Устойчивость предложенных алгоритмов исследуется двумя способами в работе [Мясников, 2009]. В [Мясников, 2010] авторы сравнивают эффективность численных методов оптимизации для решения задачи построения линейных локальных признаков эффективных не только с точки зрения вычислительной сложности, но так же и с точки зрения критерия качества прикладной задачи. Рассматриваются три чис-

ленных метода оптимизации: псевдоградиентный алгоритм, генетический алгоритм и алгоритм имитации отжига.

Тем не менее, существует ряд недостаточно проработанных задач. Во-первых, чаще всего отбор признаков осуществляется из большого конечного числа операторов, в то время как отбор признаков из бесконечных параметрических семейств исследован недостаточно. Во-вторых, имеется мало исследований способов согласования квадратичных и других нелинейных признаков с текстурными свойствами изображений из обучающей выборки. В-третьих, не описаны общие адаптивные подходы к выделению области интереса на полутоновых диагностических изображениях, учитывающих одновременно как текстурные, так и геометрические характеристики.

Из приведенного обзора научных работ и сформулированных нерешенных задач следуют цель и задачи диссертации.

Цель диссертационной работы. Разработка и исследование математических методов автоматического отбора информационных признаков, согласованных с текстурными свойствами полутоновых диагностических изображений.

Задачи диссертационной работы.

  1. Разработать математический метод согласования направленных текстурных признаков с текстурными свойствами изображений по критерию качества признакового пространства и исследовать его эффективность для прикладных задач распознавания полутоновых диагностических изображений..

  2. Разработать полиномиальные информационные признаки и методы их согласования с текстурными свойствами полутоновых диагностических изображений. Исследовать эффективность распознавания с помощью таких признаков.

  3. Исследовать вычислительную устойчивость оператора вычисления квадратичных признаков. Исследовать влияние шума на изображениях на вероятность их верного распознавания при использовании направленных текстурных признаков и при использовании квадратичных признаков.

  4. Исследовать эффективность различных критериев качества признакового пространства для различных прикладных задач согласованной классификации полутоновых диагностических изображений. Определить наиболее эффективные алгоритмы оптимизации параметров информационных признаков.

  5. Разработать метод автоматического выделения области интереса на полутоновых диагностических изображениях, использующий сведения о текстурных характеристиках областей интереса изображений из обучающей выборки.

Научная новизна. В диссертационной работе впервые получены следующие результаты.

  1. Предложен математический метод согласования направленных текстурных признаков с текстурными свойствами полутоновых изображений, заключающийся в оптимизации угла поворота изображения по критерию качества признакового пространства.

  2. Разработан математический метод согласования квадратичных полиномиальных признаков, основанный на автоматической настройке коэффициентов при одночленах, обеспечивающих оптимум критерия качества признакового пространства.

  3. Исследована устойчивость оператора вычисления квадратичных признаков для ограниченных сигналов. Показано, что оптимальные квадратичные признаки являются более устойчивыми к шумам на изображениях, чем оптимальные направленные признаки.

  1. Для каждой прикладной задачи медицинской диагностики определены алгоритмы оптимизации и критерии качества признакового пространства, наилучшие по критерию достоверности распознавания.

  2. Предложен метод автоматического выделения области интереса на диагностических изображениях, основанный на последовательном наращивании области и отличающийся способностью одновременно учитывать её текстурные, топологические и геометрические характеристики.

Практическая значимость. Разработанные математические методы и программные средства возможно использовать в клинической практике для автоматизации диагностики остеопороза и остеопении по рентгеновским изображениям костной ткани, различных нефрологических заболеваний по ультразвуковым изображениям почек, а также хронической обструктивной болезни лёгких по изображениям компьютерной томографии.

Достоверность полученных результатов. Достоверность полученных результатов подтверждается корректностью математических выкладок и использованием квалифицированных экспертных оценок для проведения вычислительных экспериментов. Для всех оценок вероятностей ошибочного распознавания приведены соответствующие доверительные интервалы с уровнем значимости 0,05.

Основные положения, выносимые на защиту.

  1. Математический метод согласования направления вычисления направленных признаков с текстурными свойствами полутоновых изображений, основанный на оптимизации угла поворота по критерию качества признакового пространства, обеспечивает снижение вероятности ошибочного распознавания.

  2. Квадратичные полиномиальные признаки, согласующиеся с текстурными свойствами полутоновых изображений, обеспечивают дополнительное снижение вероятности ошибочного распознавания по сравнению с использованием согласованных направленных признаков.

  3. Оператор вычисления квадратичных признаков является вычислительно устойчивым для ограниченных сигналов. Достоверность распознавания диагностических изображений менее подвержена воздействию шумов при использовании квадратичных признаков, чем при использовании направленных признаков.

  4. Алгоритм имитации отжига является наиболее эффективным алгоритмом оптимизации для согласования направленных признаков, а метод случайного поиска является наиболее эффективным для согласования квадратичных признаков. Наиболее эффективные критерии качества признакового пространства в среднем по всем задачам основаны на разделимости признакового пространства.

  5. Метод автоматического выделения области интереса, согласующийся с текстурными, геометрическими и топологическими характеристиками областей интереса для заданной обучающей выборки полутоновых диагностических изображений, позволяет кроме дополнительной автоматизации процесса диагностики дополнительно снизить оценку вероятности неверного распознавания.

Публикации. Основные результаты диссертации опубликованы в 6 статьях в изданиях, рекомендованных ВАК РФ, а также в материалах 2 международных научных конференций.

Апробация работы. Результаты работы докладывались на 2 международных конференциях:

1. The 11th International Conference on Pattern Recognition and Image Analysis: New Information Technologies. Samara, Russia, September 23-28, 2013.

2. XII Королёвские чтения: Международная молодёжная научная конференция. Самара, 1-3 октября 2013 года.

Объем и структура диссертации. Диссертация состоит из введения, трех глав, заключения, списка сокращений и условных обозначений, списка цитируемой литературы (101 наименование) и двух приложений. Работа изложена на 156 страницах, содержит 15 рисунков и 18 таблиц.

Постановка и подходы к решению задачи построения признаков

Тем не менее, часто имеется набор эталонных изображений, класс которых оценен людьми-экспертами или другим способом, так что проектируемые системы распознавания в обозначенной выше классификации имеют второй тип, поэтому в данной работе акцент сделан именно на такие системы.

Кроме того, если имеется L(L-1) операторов распознавания Ф [со), принимающих решение об отнесении объекта распознавания сое ft только к одному из классов Qi, либо flj, то существуют различные способы построения и общего оператора распознавания Ф(& ). Например, можно относить объект к тому классу, к которому его отнесли наибольшее количество операторов распознавания Фij [со) [37, 38, 39]. При таком подходе, однако, возникают определённые сложности в виде областей отказа, в которых решение не может быть принято, а так же в случае, когда операторы Фij (& ) отличаются друг от друга по качеству распознавания, но все эти проблемы в том или ином виде решаются в указанных работах. Таким образом, в большинстве случаев без существенной потери общности можно рассматривать задачу распознавания с двумя классами.

Поскольку пространство П чаще всего не является метрическим (например, в случае, если П - это множество цифровых изображений), но при этом его объекты всё же обладают некоторыми различимыми свойствами, общими для объектов из одного класса, оператор распознавания Ф(& ) строят как суперпозицию двух операторов: ф{со) = C(х{со)), (1.1) где Ч (со):П Е измеряет информационные признаки объекта и переводит объект распознавания сое ft в его вектор признаков xєЕ. При этом S - это метрическое векторное пространство, в котором расстояние между векторами уже имеет отношение к классам прообразов этих векторов в пространстве ft. Оно называется признаковым пространством.

Классы ll имеют свои образы Нl в пространстве S, но система множеств {Зl} в общем случае уже не является разбиением множества Е, потому что отдельные пары таких множеств могут иметь непустые пересечения. Предполагается, что разработчик системы распознавания строит оператор Ч (ю) таким образом, чтобы разброс образов объектов со из каждого отдельного класса был в целом меньше, чем разброс образов объектов со, взятых не зависимо от их класса [40]. Оператор C(x):Е А называется классификатором и переводит вектор признаков в класс его прообраза. Он уже в меньшей степени зависит от проблемной области, а опирается на наличие и характер априорной информации о распределении векторов x в классах Еl . Часто построение операторов Ч и C проводится независимо.

В случае если для проверки качества системы распознавания Ф(& ) используется лишь конечная контрольная выборка U, в которую входят объекты распознавания сое ft с известными классами, то можно без каких либо дополнительных предположений определить критерий качества системы распознавания, как долю правильно распознанных объектов: J(ф) = U{а)єUФ(а)) = Ф(а))}. (1.2) Здесь и далее в работе для конечных множеств оператор » возвращает количество элементов в множестве.

Пусть теперь имеется вероятностное пространство (ft,Ba,P), где ft -уже определённое множество объектов распознавания, Вп - сигма-алгебра подмножеств ft, а P - вероятностная мера. Элементарными событиями в этом пространстве являются предъявления объектов со є П системе распознавания. Тогда критерием качества системы распознавания можно считать вероятность верного распознавания объекта системой: j(&) = P({coen0 (co) = &{co)}). (1.3)

В статистической теории распознавания образов этот критерий считается одним из наиболее адекватных. Прочие критерии стараются связать с этим [40]. Несложно заметить, что если для оценивания имеется лишь система распознавания Ф(& ) и контрольная выборка U, то в предположении о том, что все объекты соеП могли оказаться в выборке U равновероятно, эффективной оценкой критерия (1.3) служит (1.2). Аналогичным образом можно построить чуть более гибкие критерии. Пусть имеется платёжная матрица CERLXL, элементы которой обозначают некоторую стоимость того или иного события при классификации. Так элемент C(i,j) условно означает прибыль в ситуации, когда объект со є П был отнесён к классу lj, то есть когда Ф(са) = Пг лФ(са) = Пг Отрицательная прибыль означает штраф. Здесь и далее в работе для обозначения элементов матриц и векторов будет использоваться нотация Голуба [41] вместо нижних индексов. Обозначим Ру(ф) вероятность, что случайный объект со є П. будет отнесён системой Ф(со) к классу П:

Оптимизация направления для текстурных признаков

Поскольку матрица А на практике всегда невырожденная, такая задача имеет единственное решение. Для решения можно воспользоваться, например, LU-разложением матрицы А, как это реализовано в LAPACK [81]. Задача о построении группы признаков (2.11), эффективной по критерию (2.17), не имеет смысла, поскольку признаки тем эффективнее, чем ближе вектор параметров в к оптимальному вектору параметров в, полученному в результате решения задачи (2.18), однако слишком близкие векторы параметров порождают сильно коррелированные признаки, которые не несут никакой новой информации об изображении.

Что касается остальных критериев, использующихся в предыдущем разделе, аналитически получить для них процедуру оптимизации не представляется возможным, так что единственным выходом видится использование итерационных численных методов. Особенно интересен критерий (1.2) как наиболее связанный с вероятностью ошибочной классификации, а также родственный ему критерий (1.9). Для полноты картины также предлагается использовать те же общие процедуры оптимизации для критерия (1.24). Однако теперь речь идёт о выборе вектора 0e0c[-1;+1f а не одного числа, так что нужно переопределить некоторые параметры алгоритмов оптимизации для этого случая. Здесь имеется в виду \(2d + 1)2 2 размерность признакового пространства. Нужно также отметить, что для этих алгоритмов имеет смысл выбирать параметры только с ограничениями, поскольку они не работают для задачи безусловной оптимизации.

Для генетического алгоритма следует определить операторы скрещивания и мутации. В предыдущей главе уже описаны подходы к построению операторов скрещивания с(б 1,6 2) для скалярных величин (#1,02), а это значит, что можно определить оператор скрещивания для векторов покомпонентно: V1,2/ \ V 1 V /, 2 V. //)к=1,2,...,к. Оператор мутации также можно определить похожим образом. Для этого нужно определить непрерывное многомерное вероятностное распределение на [-1;+1] , такое что его плотность вероятности тем больше, чем ближе точка к заданной точке в, мутация которой осуществляется. Для алгоритма имитации отжига требуется определить оператор выбора очередной точки, в качестве которого, как и прежде, можно использовать оператор мутации из генетического алгоритма.

Для экспериментального исследования эффективности предложенного подхода к построению признаков были проведены серии экспериментов, подобные тем, что проводились для исследования автоматической настройки угла поворота в предыдущей главе. Использовались те же 4 набора изображений: изображения риса из Kylberg Texture Dataset [69], а также рентгеновские изображения шейки бедра, ультразвуковые изображения почек и изображения компьютерной томографии лёгких. Схема экспериментов также аналогична схеме, изображённой на рисунке 1.8, только вместо настройки угла поворота производилась настройка коэффициентов в (Am, An) квадратичных признаков (2.11).

Эта настройка в каждой серии экспериментов представляла собой решение оптимизационной задачи с различными критериями качества системы распознавания в качестве целевой функции и с различными алгоритмами оптимизации. Таким образом, одна серия экспериментов характеризовалась тремя параметрами: набор изображений, критерий качества и алгоритм оптимизации. Для каждой серии экспериментов по контрольной выборке оценивалась вероятность ошибочного распознавания, а также в процессе отбора признаков определялось оптимальное количество признаков.

В качестве критериев качества, как и ранее, оценка вероятности правильной классификации J (1.2), расстояние Бхатачария //(1/2) (1.9), три критерия дискриминантного анализа: J1 (1.20), J2 (1.21) и J4 (1.23), а также критерий, основанный на отношении расстояния между распределениями к разбросу их значений JSNR (1.24). Кроме этого использовались два новых критерия: критерий, основанный на разности рассеяний Jdiff (2.13), и основанный на аппроксимации по методу наименьших квадратов критерий Jа

В качестве итерационных процедур глобальной оптимизации, как и ранее, использовались метод случайного поиска, генетический алгоритм и алгоритм имитации отжига.

Ранее было показано, что существует единственный набор параметров в (Am, An), порождающий квадратичный признак (2.11), оптимальный по критерию J (2.17), причём для вычисления этого набора параметров не нужно применять итерационную процедуру оптимизации. Поэтому для оптимизации этого критерия использовался исключительно метод наименьших квадратов, приводящий к решению СЛАУ. Чтобы провести сравнение критерия J с другими, были проведены отдельные серии экспериментов по получению единственного оптимального признака для других сочетаний критериев и процедур оптимизации. В случае единственного признака критерии J1, J2 и J4 ведут себя абсолютно одинаково, поэтому в экспериментах использовался только критерий J1.

Между тем отбор группы из нескольких квадратичных признаков может повысить количество извлекаемой информации о классе изображения и повысить качество распознавания. Для определённости во всех сериях экспериментов строилась группа из 13 квадратичных признаков (2.11). В этом случае для оптимизации критериев J1 и J2 использовалась описанная ранее процедура дисперсионного анализа, основанная на методе главных компонент. Эти критерии ведут себя одинаково, так что на практике использовался только критерий J1.

Экспериментальное исследование качества квадратичных признаков

Для экспериментального исследования эффективности предложенного метода была проведена серия экспериментов по схеме, изображённой на рисунке 1.8. Поскольку описанная простейшая реализация метода, приведённая выше, предполагает возможность оптимизации только функций одного аргумента, имеет смысл применять её только для оптимизации угла поворота, описанной в первой главе.

В таблице 3.1 представлены результаты оптимизации различных критериев качества признакового пространства для различных наборов изображений. В каждом эксперименте по обучающей выборке вычислялось значение критерия J для выбранной группы признаков, а также по контрольной выборке минимальная оценка вероятности ошибочного распознавания є и наименьшее количество признаков К, которого достаточно для достижения этой оценки. Видно, что для всех задач описанный метод обеспечивает те же результаты, что и лучшие из методов, использованных в первой главе. Наилучшим критерием качества, оптимизация которого обеспечивает наименьшую ошибку распознавания во всех задачах, является расстояние Бхатачария. В целом для задач оптимизации сложной функции одного вещественного аргумента можно рекомендовать использовать именно этот подход.

Если задуматься об общих принципах работы большинства итерационных алгоритмов глобальной оптимизации, можно заметить, что все они занимаются вычислением значений целевой функции в некоторых точках, а затем просто выбирают точку, для которой вычисленное значение целевой функции было оптимально. Существенные отличия между ними заключаются лишь в способе, которым они выбирают точки для вычисления значений целевой функции. Алгоритм случайного поиска выбирает точку, как реализацию случайного вектора с заданным распределением, возможно основанном на ранее вычисленных значениях функции. Генетический алгоритм некоторым образом скрещивает пару ранее обработанных точек, для которых значения целевой функции были достаточно велики. А алгоритм имитации отжига отличается от обычного случайного поиска тем, что иногда выбирает следующую точку близко к не самой лучшей из ранее обработанных точек.

В силу отсутствия какой-либо полезной информации о поведении целевой функции, построение в любом смысле оптимального алгоритма оптимизации представляет существенные трудности. Каждый из имеющихся итерационных алгоритмов обладает своими преимуществами и недостатками. Так алгоритмы случайного поиска лишены проблем с зацикливанием на локальном максимуме, но зато мало используют информацию о предыдущих вычисленных значениях функции. Генетический алгоритм и алгоритм имитации отжига значительно более осмысленно осуществляют выбор точки, что повышает точность метода оптимизации, но могут остановиться в локальном максимуме, хотя у них и имеются средства для выхода из него в виде процедуры мутации у генетического алгоритма и перехода к менее оптимальной точке с высокой температурой у алгоритма имитации отжига.

Общая схема итерационного алгоритма глобальной оптимизации целевой функции J (в) в ограничениях в є с заданным количеством итераций

Варьируя способ выбора следующей точки, можно получать различные итерационные алгоритмы глобальной оптимизации. Например, если всегда равновероятно выбирать случайную точку из множества 0, или же выбирать точку, каким-либо образом распределённую на множестве 0, например, в окрестности самой лучшей из ранее выбранных точек, то получится алгоритм случайного поиска. Если случайно выбрать пару из Npop лучших вычисленных точек, а затем с помощью некоторого оператора скрещивания получить из них следующую точку, то получится генетический алгоритм. Если же получить следующую точку с помощью алгоритма случайного поиска, но даже если она не является лучшей, всё равно считать её таковой с вероятностью (1.39), то получится алгоритм имитации отжига. К похожей схеме можно привести и многие другие распространённые алгоритмы оптимизации, в том числе и детерминированные.

Гибридный метод глобальной оптимизации сложных функций

В комплект с современным радиологическим регистрирующим оборудованием входит программное обеспечение для обработки и анализа получаемых изображений. Оно позволяет выполнять простейшие операции преобразования, такие как контрастирование изображения, а в некоторых случаях и автоматически предлагает заключение в виде диагноза. К сожалению, зачастую оно не позволяет производить более сложные преобразования, вычислять текстурные признаки и производить их анализ, не допускает доработки и дополнения пользовательскими программными модулями. Например, программное обеспечение, поставляющееся вместе с рентгеновским костным денситометром Norland Excell-XR-46, позволяет автоматически диагностировать остеопороз и остеопению по оценке средней минеральной плотности костной ткани, но при этом не учитывает её микроархитектонику [67 ]. Также стоит отметить, что в российских клиниках такого рода аппараты пока ещё слабо распространены. В этой связи в ходе выполнения диссертации было разработано новое программное средство, предназначенное как для исследования эффективности предложенных методов, так и для возможного использования в клинической практике.

Разработанное программное средство отвечает следующим требованиям. 1. Возможность файлового ввода и вывода изображений распространённых форматов, включая BMP, JPEG, PNG, TIFF. 2. Реализация настраиваемых преобразований изображения, таких как контрастирование, эквализация, сглаживание, зашумление и т. д., с возможностью выбора параметров преобразования. 3. Наличие инструментария для выделения области интереса на изображении с последующей обработкой только выделенной области. 4. Возможность вычисления выбранного множества признаков на выделенной области интереса открытого изображения. 5. Реализация работы с обучающей выборкой: сохранение значений признаков текущего изображения в обучающую выборку, редактирование уже имеющихся в выборке векторов признаков, удаление лишних векторов признаков из выборки. 130 6. Возможность автоматической классификации вычисленного вектора признаков по обучающей выборке выбранным алгоритмом классификации, а также возможность ручного проставления требуемого класса для сохранения в обучающую выборку. 7. Реализация пакетной обработки заданного набора изображений: автоматическое обучение, классификация, настройка признаков, отбор признаков, составление отчёта. 8. Персистентность областей интереса для изображений, обучающей выборки, параметров преобразований, характеристик изображений. Персистентность в данном случае означает автоматическое сохранение требуемых значений между запусками программы. 9. Организация графического интерфейса пользователя, позволяющего осуществлять интерактивное взаимодействие со всеми возможностями программного средства. Обеспечение интуитивной понятности интерфейса, его визуального соответствия графическим интерфейсам подобных программных средств. 10. Обеспечение приемлемой производительности, подходящей для работы в клинической практике: для построения оптимальных признаков и обучения системы распознавания допускается время работы в 1-2 часа, но время обработки одного вновь поступившего изображения из контрольной выборки не должно превышать 1 минуты. 11. Возможность расширения имеющегося программного средства дополнительными модулями, а также расширения имеющихся модулей новыми признаками, классификаторами, преобразованиями, возможностями обработки и анализа данных.

Программное средство написано на высокоуровневом языке программирования Python 2.7. Такой выбор языка программирования связан с его ориентацией на кроссплатформенность, высокую производительность, читабельность исходного кода, минималистичный синтаксис, широкие возможности стандартной библиотеки [97], а также наличие открытых математических библиотек. В частности для работы с матрицами и для решения задач линейной алгебры использовалась библиотека NumPy 1.8, для выполнения высокоуровневых математических операций, таких как преобразование Фурье или вычисление значений специальных функций, – библиотека SciPy 0.14, а для графического представления данных – библиотека Matplotlib 1.3. Такая связка библиотек обеспечивает большую часть функциональности коммерческих математических пакетов с дополнительным преимуществом в виде полноценного языка программирования Python [98].

Графический интерфейс пользователя программного средства для обработки и анализа биомедицинских изображений Графический интерфейс пользователя выполнен с использованием фреймворка PyQt 4, предоставляющего привязку к инструментам библиотеки Qt [99]. Этот фреймворк также обеспечивает файловый ввод и вывод изображений. Элементы графического интерфейса декларативно описываются в XML-файле, который вычитывается в процессе работы программы, что позволяет легко добавлять, удалять и изменять элементы интерфейса, а также обеспечивает высокую расширяемость приложения, поскольку добавление