Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Количественная оценка влияния структуры на токсичность, липофильность и растворимость в воде экологически опасных органических соединений Тиньков Олег Викторович

Количественная оценка влияния структуры на токсичность, липофильность и растворимость в воде экологически опасных органических соединений
<
Количественная оценка влияния структуры на токсичность, липофильность и растворимость в воде экологически опасных органических соединений Количественная оценка влияния структуры на токсичность, липофильность и растворимость в воде экологически опасных органических соединений Количественная оценка влияния структуры на токсичность, липофильность и растворимость в воде экологически опасных органических соединений Количественная оценка влияния структуры на токсичность, липофильность и растворимость в воде экологически опасных органических соединений Количественная оценка влияния структуры на токсичность, липофильность и растворимость в воде экологически опасных органических соединений Количественная оценка влияния структуры на токсичность, липофильность и растворимость в воде экологически опасных органических соединений Количественная оценка влияния структуры на токсичность, липофильность и растворимость в воде экологически опасных органических соединений Количественная оценка влияния структуры на токсичность, липофильность и растворимость в воде экологически опасных органических соединений Количественная оценка влияния структуры на токсичность, липофильность и растворимость в воде экологически опасных органических соединений Количественная оценка влияния структуры на токсичность, липофильность и растворимость в воде экологически опасных органических соединений Количественная оценка влияния структуры на токсичность, липофильность и растворимость в воде экологически опасных органических соединений Количественная оценка влияния структуры на токсичность, липофильность и растворимость в воде экологически опасных органических соединений Количественная оценка влияния структуры на токсичность, липофильность и растворимость в воде экологически опасных органических соединений Количественная оценка влияния структуры на токсичность, липофильность и растворимость в воде экологически опасных органических соединений Количественная оценка влияния структуры на токсичность, липофильность и растворимость в воде экологически опасных органических соединений
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Тиньков Олег Викторович. Количественная оценка влияния структуры на токсичность, липофильность и растворимость в воде экологически опасных органических соединений: диссертация ... кандидата Химических наук: 02.00.03 / Тиньков Олег Викторович;[Место защиты: ФГБУН Институт физиологически активных веществ Российской академии наук], 2017

Содержание к диссертации

Введение

ГЛАВА 1. Современные подходы к решению задач qsar/qspr анализа токсичности, липофильности и растворимости в воде органических соединений (обзор литературы) 9

1.1. Анализ источников информации по токсичности и физико-химическим свойствам. Объекты QSAR исследований острой токсичности. 12

1.2.Кластеризация соединений при QSAR изучении токсичности. 16

1.3. Описание и представление структуры органических соединений при QSAR/QSPR анализе токсичности и физико-химических свойств . 16

1.3.1. Топологические дескрипторы. 17

1.3.2. Фрагментарные дескрипторы 19

1.3.3. Квантово-химические дескрипторы 20

1.3.4. Физико-химические дескрипторы 21

1.3.5. Дескрипторы молекулярных полей 22

1.4.Статистические методы моделирования токсичности 24

1.4.1. Регрессионный анализ. 24

1.4.2. Статистические методы классификации органических соединений по величине их токсичности

1.5. Валидация QSAR моделей токсичности 27

1.6. QSAR модели острой токсичности 28

1.7. Экспертные системы, позволяющие прогнозировать различные виды токсичности.

1.7.1. «PASS». 31

1.7.2. «ACD/Percepta» 31

1.7.3.«OCHEM». 33

1.7.4. «Программный комплекс оценки и прогнозирования экологической опасности органических веществ» 34

ГЛАВА 2. Материалы и методы исследования 38

2.1. Симплексное представление молекулярной структуры. Программа «Lattice & Simplex Modelling». 38

2.2. Математические методы построения и интерпретации QSAR/QSPR моделей .

2.2.1. Метод частичных наименьших квадратов. Программа «Methods of Data Analysis» 41

2.2.2. Метод случайного леса. Программа «CF». 47

2.2.3. Методы опорных векторов и градиентного бустинга. Программа «SiRMS-SPCI». 49

2.3. Валидация полученных QSAR/ QSPR моделей 50

ГЛАВА 3. QSAR/QSPR анализ связи «структура-токсичность», «структура липофильность», «структура-растворимость в воде» органических соединений 53

3.1. Сбор и анализ экспериментальной информации по острой, репродуктивной токсичности, растворимости в воде и липофильности 53

3.2. QSAR анализ острой токсичности.

3.2.1. Глобальные модели острой токсичности. 55

3.2.2. Локальные модели острой токсичности

3.3. Исследование репродуктивной токсичности 81

3.4. Создание набора структурных фильтров при оценке токсичности органических соединений. 89

3.5.QSPR анализ липофильности и растворимости в воде органических соединений 90

ГЛАВА 4. Экспертная система прогнозирования токсичности, растворимости в воде, липофильности органических соединений «ToxExpert» 96

4.1. Интерфейс программного комплекса 96

4.2. Система управления базами данных «Toxic v.1.1.5.b»

4.2.1. Интерфейс СУБД «Toxic v.1.1.5.b» 97

4.2.2. Управление информацией в СУБД «Toxic v.1.1.5.b» 100

4.3. Программный комплекс «HIT QSAR Expert system» 101

Выводы 103

Список использованных источников

Описание и представление структуры органических соединений при QSAR/QSPR анализе токсичности и физико-химических свойств

Данные дескрипторы являются результатами квантово-химических расчетов и представляют собой набор индексов, так или иначе характеризующих зарядовое распределение молекулы и ее энергию. Квантово-химические индексы нашли широкое применение в проблеме QSAR. Известно множество корреляционных функций, которые связывают острую токсичность с параметрами электронной структуры молекулы [105-107].

Квантово-химические дескрипторы могут быть также использованы при исследовании механизмов токсического действия органических веществ. Подход, учитывающий биотрансформацию и использование методов вычислительной химии, был успешно использован при получении QSAR уравнений в разнообразных структурных рядах. Подробный обзор зарубежных работ приведен в [108, 109].

В качестве примера можно привести исследование структура - острая и хроническая токсичность в ряду замещенных бензолов [110]. Согласно существующей оксеноидной модели [111], важнейшей реакцией, инициирующей биоактивацию ароматических соединений, выступает присоединение кислорода с образованием ареноксидного интермедиата:

Гипотеза исследования заключалась в том, если рассчиать энергетических параметр (Emin –разница полных энергий промежуточного ареноксидного интермедиата и исходной молекулы замещенного бензола), то можно прогнозировать токсичность данных соединений. В ходе работы исследователи получили достоверную зависимость активности от данного параметра и выявлено, что чем он меньше, т.е. чем устойчивее интермедиат и, следовательно, чем легче он образуется, тем опаснее вещество. Полученная модель была также успешно применена для соединений с более сложными заместителями [112].

Другим примером совместного использования особенностей биотрансформации и методов QSAR на основе квантово-химических дескрипторов является изучение канцерогенной и мутагенной активности (биоактивация через восстановление нитрогруппы под действием нитроредуктаз) алифатических углеводородов [113].

QSAR исследованиях острой токсичности. Традиционно в качестве дескрипторов выступают липофильность (lg P), молекулярный вес (MW), молярная рефракция (MR), дескрипторы, описывающие водородную связь [115], молекулярные объёмы и площади поверхностей.

На сегодняшний день существует достаточно большое количество программ, позволяющих рассчитывать физико-химические свойства веществ. Среди данных программ можно выделить следующие: «HyperChem» [116], «ACDLabs» [117], «EPI Suite» [118- 120], «AlogPS 3.0» [121].

Большинство из данных программ используют различные аддитивные схемы расчета указанных физических свойств и разнообразные методы математической статистики и машинного обучения, например, «AlogPS» – метод нейронных сетей. В одной из пионерских QSAR работ в ходе анализа токсичности спиртов [122] было получено уравнение, связывающее летальную дозу (LD100) для кошек с lg P: lg =1.06lgP+ 1.37 LD 100 В работе [123] отмечается связь водородной связи и токсичности при исследовании 50000 соединений. При исследовании токсичности фенолов [124] также отмечается значительная роль дескрипторов, описывающих водородную связь, в частности число Н-доноров в молекуле. В другой работе [125] при анализе токсичности замещенных фенолов использовались такие дескрипторы как поляризуемость, основность водородной связи и молекулярный объем.

Одним из наиболее известных методов, использующих дескрипторы молекулярных полей, является CoMFA [126]. Метод CoMFA основывается на том наблюдении, что взаимодействие биологически активных веществ с мишенью определяется, в первую очередь, межмолекулярными эффектами, которые в основе своей нековалентны и в значительной степени зависят от пространственных особенностей, формы молекул. Целью CoMFA является изучение корреляций между трехмерными характеристиками молекул (3D молекулярные дескрипторы) и их биологической активностью. К трехмерным молекулярным дескрипторам относятся стерические, электростатические и другие пространственные параметры.

Особенностью CoMFA является то, что дескрипторы, описывающие молекулу, вычисляются не в виде отдельных величин, а в виде трехмерной карты, описывающей заданное свойство в пространстве. Таким образом, дескриптор соответствующий данному свойству, представляет собой молекулярное поле, охватывающее молекулу. Для вычисления такого поля предполагается, что молекула находится в трехмерной пространственной решетке.

Заданное свойство вычисляется в узлах этой пространственной решетки как результат действия на данную точку пространства (узел) со стороны структурных составляющих молекулы. Например, чтобы определить электростатический потенциал, описывающий пространственное распределение кулоновских сил вблизи молекулы, во все узлы решетки необходимо последовательно поместить пробный заряд. Суммарное действие на этот заряд со стороны всех атомов молекулы и определяет значение электростатического потенциала в узле. Стандартным пробным элементом CoMFA является углеродный атом в sр3-гибридном состоянии с эффективным радиусом 1.53 oA и зарядом +1. При вычислениях геометрии и зарядовых распределений, как правило, используются полуэмпирические методы квантовой химии (AMI, PM3, MNDO).

Математические методы построения и интерпретации QSAR/QSPR моделей

В качестве статистического метода для построения зависимостей структура-свойство при большом количестве дескрипторов используется метод частичных наименьших квадратов (PLS) [203] с перекрестным (скользящим) контролем. Этот линейный регрессионный метод особенно предпочтителен для анализа больших и сильно коррелированных массивов дескрипторов xi. Он основан на переходе от них к небольшому числу ортогональных переменных, т.н. скрытых переменных (LV-latent variables) или (PLS-факторов), которые являются линейными комбинациями исходных независимых переменных: LV1= b1,1x1 +b1,2 x2 +… b1,nxn LV2= b2,1x1 +b2,2 x2 +… b2,nxn (2.1) LVA= bA,1x1 +bA,2 x2 +… bA,nxn где, хi – независимые переменные, bk,j – коэффициенты линейной комбинации. Затем в рамках PLS-метода строится линейное уравнение, отражающее связь между зависимой переменной (y) и скрытыми переменными LV: y=c1 LV1+c2 LV2+…cn LVn (2.2) где ci –регрессионные коэффициенты. Использование PLS метода дает также возможность получить количественные характеристики влияния на активность каждого дескриптора. Например, величина относительного вклада дескриптора в активность для выбранной скрытой переменной LV определяется как: ba,k range(xk ) к , (2.3) range(y) где bk- коэффициент при дескрипторе хk, range(хk) - диапазон изменения хk, а range(y) - диапазон изменения активности в обучающей выборке. Вклад каждого k-го дескриптора VIPk по всем скрытым переменным LV можно вычислить как: A VIPk = (VINka )2 , (2.4) a=1 где (VINka )2 представляет собой произведение весов ba2,k для данной компоненты на процент объясненной дисперсии a для этой компоненты: (VINka)2 = ba2,k A a (2.5) i i=1 Значения VIP нормируются так, что (VIP)k2 = n k2 = n , где n-количество переменных k=1 (дескрипторов). Дескрипторы, для которых VIP 1 являются наиболее существенными для объяснения свойства Y. Несмотря на очевидные преимущества PLS метода, все же есть некоторые проблемы, связанные с применением данного метода. В частности, PLS-метод может давать хорошие результаты только, если связь между структурой и свойством - линейная. Когда связь существенно нелинейная, и эта нелинейность не может быть удалена преобразованиями переменных, необходимо использовать нелинейное моделирование. Хотя нелинейный вариант моделирования PLS-метода и разработан [204], тип нелинейной зависимости в нем представляется довольно искусственно и не может быть принят для общего использования.

Для поиска оптимального набора структурных параметров в PLS модели используют: 1) автоматический выбор переменных (АВП). Стратегия АВП используется для получения высокоадекватных моделей путем исключения "шума". Суть АВП состоит в пошаговом исключении переменных с наименьшими нормированными регрессионными коэффициентами из PLS модели, пока количество переменных не будет равно 1. Из списка полученных моделей выбирается та, которая обладает наилучшим набором статистических характеристик (R2, Q2, R2test). Стратегия АВП может быть использована как для всего набора структурных параметров, так и для наборов, полученных в результате использования других методов отбора дескрипторов (например, в результате исключения взаимнокоррелирующих параметров или после использования процедуры тренд-вектора, генетического алгоритма); 2) исключение взаимно-коррелирующих и постоянных параметров. Исключение взаимно-коррелирующих дескрипторов не является обязательной процедурой в PLS, так как множество дескрипторов, используемых в PLS, понижается до количества некоррелирующих между собой латентных переменных. Однако, эта процедура часто помогает получить более адекватные модели и понижает количество используемых переменных в несколько раз. В ходе этой процедуры оставляется один дескриптор из каждой пары, имеющей коэффициент парной корреляции r, удовлетворяющий условию r 0.8-0.9. Использование этой процедуры позволяет исключить «шум» от избыточного числа дескрипторов. 3) метод тренд-вектора [205]. Процедура тренд-вектора (T-вектора) позволяет не конкретизировать вид соответствующей зависимости "структура активность" и использовать неограниченное число структурных параметров. Метод Т-вектора основан на принципиальной идее теории распознавания образов – разбиение m объектов на два класса относительно среднего значения изучаемого свойства (A ). Величины (Ai -A) принимают для одного класса положительные значения, а для другого – отрицательные. Поиск моделей методом T-вектора осуществляется методами полного или частичного перебора после отсева взаимных корреляций. Дескрипторы, включенные в лучшие модели T-вектора (несколько десятков моделей приблизительно одинакового качества), являются хорошим поднабором для последующего использования в PLS. 4) генетический алгоритм (ГА) [206] Данный метод имитирует такие свойства живой природы, как естественный отбор, приспособляемость, наследственность и т. д. Подход предполагает представлять весь набор структурных параметров как битовый массив («хромосому»), где 1 - параметр участвует в модели, 0 - не участвует. Используя эвристически организованные операции «воспроизводства», «скрещивания» и «мутации», из случайной стартовой «популяции» генерируются новые «хромосомы» - модели. Оценивая качество полученных моделей с помощью целевой функции (ЦФ), осуществляется «отбор». В качестве ЦФ использовался коэффициент детерминации - рассчитываемый в условиях скользящего контроля и без него.

Одним из достоинств алгоритма является гибкость, — настраивая небольшой набор параметров алгоритма, можно сместить баланс между временем поиска и качеством решения в ту или иную сторону. В качестве начальной популяции предлагается использовать модель, полученную после использования процедуры АВП. Общие принципы построения PLS моделей представлены на рисунке 2.5. Наиболее успешный путь построения адекватных моделей показан с помощью сплошных линий. После генерации структурных дескрипторов проводится процедура исключения взимно-коррелирующих параметров, после чего дополнительный отбор дескрипторов осуществляют методом тренд-вектора. Далее при помощи процедуры АВП и ГА формируется список PLS моделей, из которого выбирается одна или несколько моделей с наиболее высокими статистическими характеристиками.

Исследование репродуктивной токсичности

Выборка по острой токсичности для сложных эфиров при пероральном введении крысам исследовалась отдельно от предыдущей выборки (органические кислоты и их производные) в соответствии с распространенной классификацией токсикантов, предложенной в справочнике «Вредные вещества в промышленности» [20], а также в связи с тем, что данный класс соединений достаточно представителен (71 соединение) для построения индивидуальных локальных моделей.

В ходе QSAR анализа сложных эфиров при пероральном способе введения крысам был получен ряд адекватных моделей, статистические параметры которых приведены в таблице 3.8. Модель 6 (консенсусная) 0,88 - 0,69 0,27 - 0,46 Помимо этого, был проведен сравнительный QSAR анализ острой токсичности сложных эфиров при пероральном введении крысам с использованием экспертной ситемы «ACD/Percepta». Для сравнительного анализа было выбрано 10 наиболее токсичных соединений из изучаемой выборки с условием того, что соответствующий вид токсичности для данных веществ прогнозируется «ACD/Percepta» со средним и высоким индексом надежности, т.е. RI0.5. Результаты анализа представлены в таблице 3.9. Таблица 3.9. Сравнительный QSAR анализ сложных эфиров lg LD50, ммоль/кг CAS экспериментальные значения прогнозируемые значенияконсенсусной моделью врамках СПМС прогнозируемые значения ACD/Percepta 52918-63-5 -4,73 -4,11 -3,40 39515-41-8 -4,29 -3,58 -3,20 79538-32-2 -4,28 -4,01 -3,93 485-31-4 -3,28 -2,85 -3,13 79-22-1 -3,20 -2,28 -1,98 1851-77-0 -3,07 -3,23 -2,83 1928-43-4 -3,05 -2,54 -2,89 23031-36-9 -2,81 -2,46 -2,44 2971-38-2 -2,75 -3,07 -2,63 68359-37-5 -2,68 -3,39 -2,99 SEP 0,58 0,74

Для рассмотренных 10 наиболее токсичных соединений из изучаемой выборки, модели, построенные в рамках СПМС с применением метода PLS прогнозируют LD50 с меньшей стандартной ошибкой прогнозирования, чем «ACD/Percepta», что свидетельствует о более точном прогнозе при использовании СПМС, хотя для некоторых соединений данная программа прогнозирует LD50 с большей точностью, чем СПМС.

На основании полученной консенсусной модели проведен анализ относительных влияний физико-химических характеристик сложных эфиров на их острую токсичность, результаты которого представлены на рисунке 3.7.

Относительное влияние физико-химических характеристик сложных эфиров на значения их среднесмертельных доз при пероральном введении для крыс. В ходе проведенного анализа выявлена доминирующая роль электростатических факторов. Также высока роль липофильности. Таблица 3.10. Вклады структурных фрагментов в острую токсичность сложных эфиров при пероральном введении крысам. Символ « » в приведенных структурах фрагментов соответствует месту связи данного фрагмента с любой частью молекулы.

Для фрагментов кислот и спиртов, входящих в состав исследуемых сложных эфиров, на основании консенсусной модели были определены их вклады в величину острой токсичности (таблица 3.10).

Согласно полученным результатам, можно сделать вывод, что значительный вклад в повышение токсичности сложных эфиров оказывают производные акриловой кислоты. Высокая токсичность эфиров акриловый кислоты подтверждается данными [223, 224]. Необходимо отметить, что согласно полученным данным хлорпроизводные акриловой кислоты более токсичны, чем ее другие производные. Замещение хлора на метильный фрагмент у эфиров акриловой кислоты приводит к значительному снижению токсичности.

Высокая острая токсичность соединений, содержащих фрагменты 2,4-дихлорфеноксиуксусной кислоты, связана с нарушением окислительно-восстановительных процессов в ферментативных системах эритроцитов, с инициированием свободно радикальных реакций в тканях, которые могут приводить, в том числе, к некрозу клеток [225, 226].

На основании полученных результатов синтетические пиретроиды, сложные эфиры, содержащие фрагменты -циано-3-феноксибензилового спирта и остатки 2, 2-диметил циклопропенуксусной кислоты, проявляют высокую острую токсичность, что согласуется с данными [227 - 229], согласно которым соединения, содержащие данные фрагменты, относятся к инсектицидо-акарицидным препаратам с достаточно выраженным нейротоксическим эффектом посредством взаимодействия с ГАМК-рецепторами.

Соединения, содержащие остатки динитрофенола, тетрафтор-4-метилбензилового спирта, согласно полученным результатам также проявляют высокую токсичностью, что может быть объяснено тем, что они выступают в качестве разобщителей тканевого дыхания [40].

На основании проведенного анализа можно отметить общую закономерность в проявлении острой токсичности для сложных эфиров: ненасыщенные углеводородные фрагменты кислот и спиртов более токсичны по сравнению с насыщенными фрагментами. Введение галогенов в ненасыщенные фрагменты способствует повышению токсичности.

В ходе QSAR анализа углеводородов и их галогенпроизводных (115 соединений) при пероральном способе введения крысам был получен ряд адекватных моделей, статистические параметры которых приведены в таблице 3.11.

Так же был проведен сравнительный QSAR анализ острой токсичности углеводородов и их галогенпроизводных при пероральном введении крысам с использованием эксперной системы «ACD/Percepta». Для сравнительного анализа было выбрано 10 наиболее токсичных соединений из изучаемой выборки с условием того, что соответствующий вид токсичности для данных веществ прогнозируется «ACD/Percepta» со средним и высоким индексом надежности, т.е. RI0.5. Результаты анализа представлены в таблице 3.12.

Для рассмотренных 10 наиболее токсичных соединений из изучаемой выборки, модели, построенные в рамках симплексного представления молекулярной структуры с применением метода PLS, в большинстве случаев более точно позволяют прогнозировать значения LD50, чем модели, построенные экспертной системой «ACD/Percepta», о чем свидетельствует более низкое значение стандартной ошибки прогнозирования при использовании 2D симплексных дескрипторов.

Управление информацией в СУБД «Toxic v.1.1.5.b»

Экспертная система «ToxExpert» предназначена для внеэкспериментального скрининга опасности органических соединений. Экспертная система представляет собой программный комплекс, состоящий из двух модулей: - системы управления базами данных «Toxic v.1.1.5.b»; - программного комплекса «HIT QSAR Expert system». Внешний вид главного окна экспертной системы «ToxExpert» приведен на рисунке 4.1. Запуск системы управления базами данных «Toxic v.1.1.5.b» осуществляется через кнопку «Поиск соединения в базе данных», комплекса программ «HIT QSAR Expert system» - через кнопку «Прогнозирование токсичности и физико-химических свойств». Для работы некоторых элементов в указанных модулях необходима установка ряда дополнительных программ (если не установлены ранее), которые можно найти по соответствующей ссылке в главном окне программы. Более подробное описание методов, алгоритмов работы и пользовательского интерфейса можно найти по ссылкам «Помощь» и «Публикации». Рассмотрим подробнее систему управления базами данных «Toxic v.1.1.5.b» и программный комплекс «HIT QSAR Expert system».

Окно 1 «База данных»- задаются название базы данных и пути к ней и к каталогу с литературой (электронные варианты источников информации). Окно 2 «Выборка»- задаются классы и подклассы органических соединений, величины токсичности (LD50, LС50 и т.д. – 12 величин), вид животного (мыши, крысы, кошки, собаки, кролики и т.д- всего 9 видов организмов) и способ введения исследуемых веществ (перорально, ингаляционно, накожно, внутривенно, гаваж и т.д – 9 способов). Помимо острой токсичности, значения которой выражаются в величинах LD50, LС50, LDL0 (единицы размерности -мг/кг), в СУБД «Toxic v.1.1.5.b» присутствуют значения минимальной дозы (Lowest Effect Level, LEL), вызывающей различные репродуктивные токсические эффекты у крыс и кроликов: -изменения аппендикулярного скелета плода; -изменение аксиального скелета плода; -изменения веса плода за короткий период беременности; - гибель зародыша на стадии преимплантации, постимплантации; -выкидыш плода. Минимальные дозы (LEL) имеют размерность «мг/кг/день». Окно 3 «Молекулы» - для каждой молекулы изучаемой выборки представляется следующая информация (рисунок 4.3.): ее CAS номер, название по UIPAC, молекулярная масса, липофильность, растворимость в воде при 25 оС. Приводимые значения липофильности и растворимости в воде дифференцируются на экспериментальные и теоретически рассчитанные. В правом верхнем углу окна отмечено количество молекул, входящих в данную выборку. Также в этом окне можно осуществлять поиск молекул по CAS номеру, по названию.

Внешний вид полей окна «Молекулы» СУБД «Toxic v.1.1.5.b». Окно 4 «Токсичность»– представлена таблица по токсичности, в которой можно редактировать данные. После выделения в окне 2 типа введения и вида животных, в данном окне эти данные будут отмечены темным фоном. Окно 5 «Литература» - приводятся ссылки на статьи, справочные пособии, интернет-серверы, где находится информация по токсичности и физическим свойствам исследуемых молекул. Статьи, справочные материалы отсканированы и хранятся в форматах .pdf, . djvu. WEB- страницы находятся в формате .htm. Пользователь СУБД «Toxic v.1.1.5.b» в случае необходимости может перейти по ссылке на статьи, справочные материалы, интернет-серверы. Окно 6 «Изображение» – приводится изображения молекул (формат .bmp). Существует возможность копирования изображений молекул в буфер обмена Windows.

Окно 7 «Структура молекулы»– в базе хранятся структуры в самых распространенных форматах ( .hin, .ml2, .mol, .skc, .smi, .smiles). Для пользователя представлена удобная возможность добавления форматов хранимых структур. При нахождении в этом окне и выборе одного из представленных форматов, с учетом того, что соответствующий химический редактор установлен в операционной системе, у пользователя появляется возможность открыть выбранную молекулу в химическом редакторе (рисунок 4.4). Таким образом, существует удобная возможность просмотра и коррекции химических структур непосредственно в базе данных.

Возможность просмотра и редактирования химической структуры при помощи внешних программ из полей окна «Структуры молекулы» СУБД «Toxic v.1.1.5.b». Окно 8 «Альтернативные названия» – широко используемые названия, обозначения веществ. Окно 9 «Примечание» – информация о применении или каких-либо особых свойствах данного соединения. Следует отметить, что в каждом из окон представлена возможность коррекции информации при помощи опций, соответствующих конкретной задаче. Это позволяет вносить изменения любому пользователю, управляя информацией в соответствии со своими потребностями.

Для формирования выборки с заданным видом токсичности соединений для определенного вида животных и определенного пути введения этих соединений, необходимо отметить все эти параметры в окне 2, а потом в окне 7 выбрать формат химических структур и отметить в меню «Экспорт файлов структур выборки». В результате будут созданы три файла с расширениями .txt, в которых будет представлен весь список молекул в виде таблицы из двух столбцов: первый столбец – CAS номер молекулы, второй – соответствующее значение конкретного свойства (токсичность, липофильность, растворимость в воде). В ходе экспорта при формировании файла .txt происходит пересчет свойства (токсичность, растворимость в воде) из единицы измерения данного свойства, например для токсичности - мг/кг, в другую единицу измерения, представляющую собой десятичный логарифм отношения ((свойство 0,001)/молярная масса). Это вызвано необходимость, возникающей при дальнейшем построении QSAR/QSPR моделей. Помимо трех файлов .txt, содержащих информацию по свойствам молекул, в выбранную папку экспортируются файлы структур этих соединений в заданном формате.

Пример базы данных СУБД «Toxic v.1.1.5.b» в ходе формирования выборки при следующих условиях: все классы химических соединений, вид токсичности- LD50, вид организма – мыши, способ введения – перорально, приведен на рисунке 4.5. Вид СУБД «Toxic v.1.1.5.b» при формировании выборок Разработанная СУБД «Toxic v.1.1.5.b» позволила в некоторой степени интегрировать имеющиеся данные зарубежных и отечественных исследователей по токсичности химических соединений. Внедренный в базу данных алгоритм позволяет хранить информацию по токсичности, липофильности и растворимости в воде в наглядной форме, дающей возможность оперативно управлять информацией. Одним из видов управления информацией является возможность формирования выборки соединений для дальнейшего анализа методами QSAR/QSPR.

Программный комплекс «HIT QSAR Expert system» написан в среде визуального программирования Borland DELPHI 7.0 и предназначен для эксплуатации на персональных компьютерах под управлением операционной системы MS Windows XP/Vista/7. Программный комплекс «HIT QSAR Expert system» разработан в Физико-химическом институте им. А.В. Богатского НАН Украины в отделе молекулярной структуры (г. Одесса).

Программный комплекс «HIT QSAR Expert system» (рисунок 4.6) на основании описанных в разделе 3 QSAR/QSPR моделей с использованием СПМС и метода RF позволяет для органических веществ провести прогноз острой токсичности, липофильности и растворимости в воде при 25 оС. Прогноз осуществляется с учетом областей применимости указанных моделей.