Содержание к диссертации
Введение
1. Обзор литературы 16
1.1 Рак молочной железы 16
1.1.1 Общая характеристика и классификации 16
1.1.2 Белки клеточного цикла и апоптоза как мишени для терапии рака молочной железы 17
1.1.3 Моделирование регуляторных сетей для поиска потенциальных мишеней терапии РМЖ 21
1.2 Поиск противоопухолевых соединений на основе компьютерного скрининга 24
1.2.1 (Q)SAR модели 26
1.2.2 Примеры использования (Q)SAR моделей для поиска противоопухолевых соединений для терапии РМЖ 28
1.2.3 Применение данных о цитотоксичности химических соединений в отношении клеточных линий для поиска соединений с противоопухолевой активностью 31
1.2.4 Анализ взаимосвязей «структура-цитотоксичность» лекарственно-подобных соединений 35
2. Материалы и методы 39
2.1 Моделирование клеточного цикла 39
2.1.1 Анализ данных по регуляции клеточного цикла и создание сети регуляции клеточного цикла и апоптоза при РМЖ и в нормальных клетках 40
2.1.2 Сбор экспериментальных данных по дифференциальной экспрессии генов при РМЖ и в нормальных клетках 43
2.1.3 Дихотомическое моделирование регуляторных сетей и поиск перспективных фармакологических мишеней 46
2.2 Предсказание цитотоксичности лекарственно-подобных соединений и их взаимодействия с мишенями 47
2.2.1 Сбор экспериментальных данных по цитотоксичности лекарственно-подобных соединений в отношении клеточных линий человека 49
2.2.2 Анализ взаимодействия лекарственно-подобных соединений с ключевыми белками систем регуляции клеточного цикла 54
2.3 Применение моделей GUSAR для прогнозирования острой токсичности для крыс и растворимости соединений в воде 55
2.4 Библиотеки коммерчески доступных образцов химических соединений
2.5 Экспериментальная валидация 57
2.6 Оценка новизны наиболее перспективных соединений 58
3. Результаты и обсуждение 59
3.1 Разработка подхода к компьютерному поиску веществ, обладающих избирательной цитотоксичностью по отношению к клеточным линиям рака молочной железы 59
3.1.1 Построение моделей регуляции клеточного цикла и апоптоза при РМЖ 61
3.1.2 Идентификация перспективных фармакологических мишеней для клеточных линий РМЖ 63
3.2 Валидация разработанного подхода in silico 64
3.2.1 Поиск перспективных фармакологических мишеней в моделях клеточных линий РМЖ человека 64
3.2.2 Результаты компьютерной оценки цитотоксичности химических соединений 68
3.2.3 Результаты компьютерной оценки действия химических соединений на ключевые белки регуляции клеточного цикла 72
3.2.4 Виртуальный скрининг баз данных по доступным образцам коммерчески доступных соединений 72
3.2.5 Отбор на основе прогноза веществ, цитотоксичных к клеткам РМЖ лигандов и действующих на выявленные белки-мишени 76
3.3 Экспериментальная валидация результатов компьютерного скрининга 83
4. Заключение 91
5. Выводы 93
6. Список литературы 95
- Белки клеточного цикла и апоптоза как мишени для терапии рака молочной железы
- Сбор экспериментальных данных по дифференциальной экспрессии генов при РМЖ и в нормальных клетках
- Идентификация перспективных фармакологических мишеней для клеточных линий РМЖ
- Виртуальный скрининг баз данных по доступным образцам коммерчески доступных соединений
Введение к работе
Актуальность проблемы. Онкологические заболевания являются одной из основных причин смертности в мире (Siegel et al., 2016). Для терапии опухолей, резистентных к существующим противоопухолевым препаратам, необходимо создание новых лекарств. Поиск эффективной терапии усложняется гистологическим, морфологическим и генетическим разнообразием злокачественных новообразований. Несмотря на достигнутый прогресс в разработке препаратов для лечения онкологических заболеваний, тройной негативный рак молочной железы (РМЖ) невосприимчив к существующим лекарствам (Griffiths and Olin, 2012; Marm and Schneeweiss, 2015). При тройном негативном раке РМЖ не экспрессируются гены рецепторов к эстрогену (ER) и прогестерону (РgR), а также ген белка HER-2/neu, являющиеся традиционными мишенями для таргетной терапии других типов рака молочной железы (Duffy et al., 2012; Guestini et al., 2015). Необходим поиск новых мишеней и фармакологически активных веществ, действующих на клеточные линии тройного негативного РМЖ, но оказывающих минимальное воздействие на нормальные (неопухолевые) клетки.
Для анализа причин возникновения и развития мультифакториальных патологий на
молекулярно-генетическом уровне в настоящее время применяют моделирование
внутриклеточных процессов in silico, что позволяет улучшить понимание патогенеза опухолевых заболеваний и найти новые биомаркеры и фармакологические мишени (Vera-Licona et al., 2013; Menden et al., 2013; Timpe et al., 2015). С этой целью используют методы системной биомедицины, позволяющие рассматривать механизмы возникновения сложных заболеваний на уровне генов, белков и взаимодействий между ними, что дает возможность анализировать геномные, транскриптомные, протеомные и метаболомные данные в комплексе (Iorio et al., 2013).
Новые высокопроизводительные методы постгеномной биомедицины обеспечивают получение обширной и разнообразной информации, которая используется для идентификации перспективных мишеней для терапии злокачественных новообразований. Поиск действующих на эти мишени фармакологических веществ на основе экспериментального скрининга десятков миллионов природных и синтетических химических соединений является трудоемким и дорогостоящим процессом (Narang and Desai, 2009; Adams, 2012; Burger and Fiebig, 2014). Использование методов виртуального скрининга и компьютерного конструирования лекарственных соединений позволяет снизить временные и финансовые издержки на стадии поиска и оптимизации прототипов новых лекарств (Narang and Desai, 2009; Burger and Fiebig, 2014; Adams, 2012). Для этого широко применяются как методы, основанные на структуре макромолекулы-мишени (Target-Based Drug Design), так и методы, основанные на структуре
лиганда (Ligand-Based Drug Design). В последние годы, наряду с анализом мишень-лигандных взаимодействий, предпринимаются попытки исследования взаимосвязей между структурой и активностью веществ в отношении опухолевых клеточных линий (Qamar et al., 2011; Li and Huang, 2012; Kong and Yamori, 2012; Speck-Planche et al., 2012; Romero Durn et al., 2014).
Несмотря на достигнутые успехи в разработке и практическом применении методов биоинформатики для установления перспективных фармакологических мишеней, поиска и конструирования действующих на эти мишени лигандов и оценки их взаимодействия с опухолевыми клеточными линиями, существующие методы обладают рядом недостатков. В большинстве подходов, используемых для идентификации перспективных фармакологических мишеней, рассматривают сравнительно небольшие фрагменты путей внутриклеточной регуляции, во многих случаях – без учета тканевой специфичности, что вносит существенную погрешность в получаемые оценки (Gonzlez-Prez et al., 2013; Siatkowski et al., 2015). При прогнозе цитотоксичности рассматривают только опухолевые клеточные линии без учета воздействия на неопухолевые клетки, что не позволяет обеспечить требуемую специфичность действия фармакологических веществ. В ходе анализа взаимосвязей «структура-активность» игнорируется факт отсутствия тех или иных молекулярных мишеней в конкретных типах тканей, обусловленных особенностями регуляции клеточных процессов (Qamar et al., 2011; Li and Huang, 2012; Kong et Yamori, 2012; Speck-Planche et al., 2012; Romero Durn et al., 2014). Преодоление указанных недостатков позволит проводить анализ in silico комплекса характеристик, обеспечивающих более высокую безопасность и эффективность прототипов новых противоопухолевых лекарств, на ранних стадиях разработки.
Целью диссертационной работы являлась разработка подхода, интегрирующего компьютерные методы выявления перспективных фармакологических мишеней, виртуального скрининга взаимодействующих с этими мишенями лекарственно-подобных соединений, прогноза цитотоксического действия отобранных соединений на опухолевые и неопухолевые клеточные линии человека, оценки их растворимости и острой токсичности для крыс, и апробация разработанного нами подхода на примере поиска веществ, обладающих избирательной цитотоксичностью по отношению к клеточным линиям рака молочной железы.
Для достижения цели были поставлены следующие задачи:
-
Формирование обучающей выборки, содержащей информацию о цитотоксическом действии фармакологических веществ на опухолевые и неопухолевые клеточные линии; создание программы PASS CLC Pred, её обучение и валидация.
-
Построение дихотомических моделей регуляции клеточного цикла для клеточных линий на основе данных об основных процессах клеточной регуляции с использованием информации о дифференциальной экспрессии генов в качестве начальных состояний; поиск
перспективных фармакологических мишеней для четырех клеточных линий рака молочной железы.
-
На основе последовательного скрининга in silico отбор из библиотек коммерчески доступных образцов лекарственно-подобных соединений, взаимодействующих с выявленными мишенями, обладающих избирательной цитотоксичностью по отношению к опухолевым клеточным линиям РМЖ, и удовлетворительными характеристиками по растворимости в воде и острой токсичности для крыс.
-
Экспериментальное тестирование действия отобранных соединений на клеточные линии РМЖ и неопухолевые клеточные линии с целью валидации разработанного нами подхода.
Научная новизна. Нами впервые разработан и применен на практике
комбинированный метод отбора прототипов новых противоопухолевых лекарств,
учитывающий, наряду с оценками взаимодействия с фармакологическими мишенями, токсичности и растворимости, также прогноз воздействия веществ на опухолевые и неопухолевые клеточные линии. Выявлены новые лекарственно-подобные соединения, обладающие цитотоксичностью в отношении клеточных линий рака молочной железы (MDA-MB-231 и MCF7), включая тройной негативный РМЖ, с минимальным воздействием на неопухолевые клетки.
Теоретическая и практическая значимость. Разработанный подход позволяет
выявлять соединения, цитотоксичные в отношении различных типов опухолевых клеточных
линий, но оказывающих существенно более слабое влияние на неопухолевые клетки, что
создает предпосылки для рационального поиска и конструирования новых более безопасных и
эффективных лекарственных веществ для терапии злокачественных новообразований.
Компьютерное прогнозирование профилей цитотоксичности и взаимодействия с
молекулярными мишенями может быть также использовано для целенаправленного отбора соединений с требуемыми профилями биологической активности в рамках фенотипического скрининга.
Работа выполнена при финансовой поддержке ФЦП «Разработка экспериментально-вычислительной системы для прогнозирования динамики и выявления ключевых факторов патогенеза опухолевых заболеваний и использования их для диагностики и лечения» (государственный контракт № 14.512.11.0093), гранта РНФ-DST №16-45-02012 «Подход к репозиционированию лекарств для социально-значимых и редких заболеваний, основанный на знаниях» и Программы фундаментальных исследований государственных академий наук на 2013-2020 годы.
Методология и методы исследования. Нами предложен и реализован подход к компьютерному поиску лекарственно-подобных веществ с избирательным цитотоксическим действием на клеточные линии человека на основе многоступенчатого скрининга in silico, интегрирующего оценки взаимодействия исследуемых веществ с более чем 650 фармакологическими мишенями, воздействия на опухолевые и неопухолевые клетки, острой токсичности для крыс при четырех способах введения, и растворимости в воде. Идентификация молекулярных мишеней, взаимодействие с которыми может привести к остановке деления либо апоптозу клеточных линий РМЖ человека, была проведена с применением метода дихотомического моделирования поведения регуляторных сетей. Использованы компьютерные программы Net2Target (Свидетельство о государственной регистрации программы для ЭВМ №2014660877), PASS Targets (Свидетельство о государственной регистрации программы для ЭВМ №2016610846), GUSAR (Свидетельство о государственной регистрации программы для ЭВМ №2006613591), и разработанная нами программа PASS CLC Pred (Свидетельство о государственной регистрации программы для ЭВМ №2016610382). Экспериментальное изучение воздействия отобранных лекарственно-подобных веществ на клеточные линии рака молочной железы (MDA-MB-231, MCF7) и неопухолевые клетки (фибробласты) было проведено нами с использованием стандартного MTT-теста.
Основные положения, выносимые на защиту
1. Сформированная нами на основе данных из БД ChEMBL обучающая выборка,
которая содержит информацию о действии фармакологических веществ на опухолевые и
неопухолевые клеточные линии, достаточно представительна для построения зависимостей
«структура-цитотоксичность» и получения прогноза.
2. Дихотомические модели регуляции клеточного цикла для клеточных линий,
построенные на основе данных о дифференциальной экспрессии генов, участвующих в
основных процессах клеточной регуляции, позволяют осуществлять поиск перспективных
фармакологических мишеней для четырех клеточных линий рака молочной железы.
3. Анализ белков-мишеней и отбор соединений, взаимодействующих с ключевыми
белками внутриклеточной регуляции, обеспечивает выявление новых лекарственно-подобных
соединений, селективно ингибирующих опухолевые клетки.
4. Предложенный нами подход, основанный на многоступенчатом скрининге in silico,
может эффективно применяться для поиска новых соединений с противоопухолевым действием.
Степень достоверности и апробация результатов. Научные положения и практические рекомендации, сформулированные автором в диссертации, основаны на изучении достаточного объёма материала и применения современных методов анализа данных. Экспериментальные данные, полученные в работе при непосредственном участии автора, подтверждают результаты
компьютерного прогноза. Выводы аргументированы и вытекают из проведенных автором исследований. Основные положения диссертации опубликованы в рецензируемых журналах, были доложены и обсуждены на российских и международных симпозиумах и конференциях, включая: VII Международную (ХVI Всероссийскую) Пироговскую научную медицинскую конференцию студентов и молодых ученых, Москва, Россия, 2012; Российские национальные конгрессы «Человек и лекарство», Москва, Россия, 2012, 2014, 2015, 2016; 10th International Conference on Chemical Structures, Noordwijkerhout, Netherlands, 2014; 20th EuroQSAR Symposium, St.-Petersburg, Russia, 2014; 8th International Symposium on Computational Methods in Toxicology and Pharmacology Integrating Internet Resources (CMTPI), Chios Island, Greece, 2015.
Публикации. По материалам диссертации опубликовано 10 научных работ в российских и международных научных изданиях, в том числе 3 статьи в рецензируемых научных журналах, входящих в список ВАК, и 7 публикаций в сборниках научных конференций, получено свидетельство ФИПС о государственной регистрации программы для ЭВМ № 2016610382 PASS CLC Pred.
Личный вклад автора. Автор непосредственно участвовал в постановке и реализации задач, решаемых в рамках диссертационной работы. Результаты, изложенные в диссертации, получены лично автором. Диссертант участвовал в подготовке всех публикаций по теме диссертации и создании компьютерной программы PASS CLC Pred. Диссертант является первым автором в одной из публикаций и в свидетельстве на регистрацию компьютерной программы. Экспериментальное тестирование действия отобранных веществ на фибробласты человека было проведено автором лично под руководством к.м.н. И.В. Вахрушева. Изучение и обобщение литературных данных, а также анализ полученных в работе теоретических результатов и экспериментальных данных выполнены автором лично.
Объём и структура диссертации. Диссертация изложена на 223 машинописных страницах и содержит 8 рисунков и 14 таблиц. Диссертационная работа включает в себя список сокращений, словарь терминов, введение, обзор литературы, описание материалов и методов исследований, описание и обсуждение результатов, заключение, выводы, список литературы, список иллюстративного материала, 5 приложений.
Белки клеточного цикла и апоптоза как мишени для терапии рака молочной железы
В норме клеточный цикл включает в себя клеточное деление, состояние покоя и апоптоз (Morgan, 2006; Rhind and Russell, 2012). Последовательными фазами клеточного деления являются: митоз — М-фаза, деление клеточного ядра; Gl-фаза — период перед синтезом ДНК; S-фаза — период репликации ДНК; G2-фаза — период между синтезом ДНК и митозом. Клетки на определенных стадиях дифференцировки могут приостанавливать свое деление, сохраняя жизнеспособность. Такое состояние клеток получило название фазы покоя (G0-фаза), клетки в этой фазе содержат ингибиторы пролиферации, препятствующие репликации ДНК и наступлению S-фазы. Апоптоз — генетически запрограммированная гибель клеток, нарушения которой играют критическую роль при возникновении и прогрессии РМЖ. Злокачественные опухоли характеризуются неконтролируемым клеточным делением и высоким риском распространения клеток по всему организму. Опухолевые клетки обладают способностью поддерживать высокий уровень пролиферативной активности, избегать действия ингибиторов клеточного роста и активаторов апоптоза, что позволяет опухоли активно расти и метастазировать в организме человека (Hanahan and Weinberg, 2000, 2011).
Сложная сеть сигнальных каскадов отвечает за прогрессию клеточного цикла и деление клетки (Rhind and Russell, 2012; Berridge, 2014). Основными белками клеточного цикла считают циклины и циклин-зависимые киназы CDK (Cyclin-Dependent Kinase), их различные комбинации регулируют пролиферацию. Кроме того, значительное влияние оказывают ингибиторы CDK (семейства Cip/Kip (CDK interacting protein/Kinase inhibitory protein), p16), семейство белков INK4a/ARF (Inhibitor of Kinase 4/Alternative Reading Frame), а также отрицательные pегулятоpы клеточного цикла белки Rb, p107, p130, семейство транскрипционного фактора и митотические компоненты, такие как Plks киназы (Polo-like kinases), чекпойнт-киназы (checkpoint kinases), регуляторые фосфатазы и другие.
Внеклеточные факторы роста начинают действовать в начале G1-фазы, обеспечивая клетке вход в клеточный цикл и запуская дальнейшие события. В ответ на эти сигналы начинается синтез Cyclin D, который связывается с CDK4 и формирует активный комплекс. Комплекс Cyclin D с CDK4 гиперфосфорилирует чувствительный белок Rb, который активирует транскрипционный фактор E2F, который запускает синтез Cyclin E, Cyclin A, ДНК полимеразы и др. Cyclin E связывается с CDK2, формируя Cyclin E:CDK2 комплекс, который инициирует переход из G1 в S-фазу. Комплекс Cyclin А:CDK2 регулирует переход из S в G2-фазу, а Cyclin А:CDK1 – из G2 в М-фазу. Митоз запускается комплексом Сyclin B:CDK1 и киназой Plks, деактивация этого комплекса приводит к выходу клетки из митоза. Белки семейства Cip/Kip (p21, p27, p57) удерживают переход клетки в S-фазу, если фиксируются повреждения в ДНК (антионкоген p53 активирует p21, ингибитор роста TGF активирует p27). Белок семейства INK4a/ARF p16INK4a связывает CDK4 и происходит арест клеточного цикла в G1-фазе, а p14ARF – препятствует деградации p53.
В случае накопления ошибок в ДНК и остановки клеточного цила может быть принято решение о запуске процесса апоптоза, программируемой клеточной смерти. Активация апоптоза может происходить через активацию рецепторов клеточной гибели TNFR, Tumor Necrosis Factor Receptors – CD95 (Fas, APO-1), TNFR1 (p55, CD120a), DR3; активацию проапоптотических митохондриальных белков Bcl-2— Bax и Bak, которые активируют прокаспазы 2, 3, 9 и фактор индуцирующий апоптоз AIF (Apoptosis Inducing Factor); выход из лизосом активного катепсина B (под действием каспазы-8); активацию инициаторных каспаз 2, 8, 9, 10, 12 и последующую активацию ими эффекторных каспаз 3, 6, 7. Существуют и альтернативные пути передачи сигнала от рецепторов клеточной гибели через активацию фактора транскрипции NF-kB в ядре и JNK (Jun-N концевая киназа) митоген-активируемого киназного каскада, которые препятствуют индукции апоптоза через ингибирование каспазы 8.
Транскриптомные исследования показали, что каждый подтип РМЖ отличается молекулярным профилем от другого (Perou et al., 2000; Beca and Polyak, 2016). В рандомизированном исследовании профилей генной экспрессии 764 пациентов с тройным негативным РМЖ авторы продемонстрировали, что 269 из 371 генов, ассоциированных с киназной активностью, пролиферацией, внутриклеточной репарацией ДНК, торможением апоптоза и регуляцией транскрипции экспрессировались на разном уровне при тройном негативном и гормон-позитивном РМЖ (Sparano et al., 2009). При тройном негативном РМЖ не экспрессируются рецепторы гормонов эстрогена ER и прогестерона PgR и нет повышенния экспрессии HER2. Кроме того, при тройном негативном РМЖ часто экспрессируются базальные цитокератины (цитокератин 5, 14, 17) и EGFR (HER1), цитокины. По сравнению с остальными типами чаще экспрессируются миоэпителиальные маркеры, такие как кавеолины (Cav1, 2), c-kit, P-кадерин, виментин, но редко экспрессируются эпителиальные маркеры, например, Е-кадерин. Также активны гены Ki67 и TOP2A, ассоциированные с пролиферацией, высок уровень циклина Е и низок – циклина D1, ген р53 является абберантным, и экспрессируется его гомолог p63. По сравнению с другими типами нет повышения уровня р16, Rb1, кристаллинов. Отличительными особенностями карцином является метастазирование, наличие мутаций в PI3K сигнальном пути, повышающее нестабильность генома, увеличенный уровень экспрессии стволовых клеток и эпителиомезенхимальных маркеров (Carey et al., 2010).
Существующие терапевтические воздействия связаны с либо ДНК-повреждающими соединениями, которые проявляют выраженные побочные эффекты, или таргетными препаратами, которые еще не разрешены к медицинскому применению и находятся на стадии клинических испытаний. Возможные подходы включают в себя ингибирование PARP1 (Farmer et al., 2005), EGFR (HER1) (Gluz et al., 2008), киназы клеточного цикла (Lapenna et Giordano, 2009), HSP90 (heat-shock protein 90) через ингибирование Ras/Raf/MAPK сигнального пути и G2/M фазу клеточного цикла, ингибирование SRC или AXL киназы (Bilici et al., 2012), ICAM-1 (Intercellular Adhesion Molecule-1) (Guo et al., 2014), инсулиноподобного фактора роста IGFBP-3 (Marzec et al., 2015), MAP киназы ERK5 (Ortiz-Ruiz et al., 2014), STAT3 (Banerjee and Resat, 2016), PIN1 (peptidyl-prolyl cis/trans isomerase) (Rustighi et al., 2016). Другими потенциальными мишенями принято считать белки сигнальных путей Notch, Wnt/-catenin, mTOR, TGF- и Hedgehog (Jamdade et al., 2015). Повышенный уровень секреции VEGF-A активирует FAK и PI3K/AKT сигнальные пути, что усиливает инвазивные способности опухоли, поэтому ингибирование ангиогенеза через VEGFR тоже рассматривается как потенциальная терапия (Choi et al., 2016; Smit et al., 2016). Еще одни авторы предлагают использовать эстроген-связывающий рецептор альфа ERR как возможную мишень для ингибирования, что приведет к подавлению пролиферации, уменьшению G2/M фазы и индукции апоптоза (Wu et al., 2016).
Сбор экспериментальных данных по дифференциальной экспрессии генов при РМЖ и в нормальных клетках
Компьютерная программа PASS, Prediction of Activity Spectra for Substances (Филимонов и др., 2014), позволяет строить зависимости «структура-активность». Современная версия PASS прогнозирует 7000 биологических активностей для органических соединений со средней точностью прогноза 95%, на основе анализа взаимосвязей «структура-активность» обучающей выборки, содержащей около 1 млн биологически активных веществ. Продемонстрирована статистическая устойчивость метода, несмотря на неполноту обучающей выборки (Poroikov et al., 2000). Применение PASS к виртуальному скринингу больших химических баз данных значительно увеличивает долю «активных» соединений в отобранной подвыборке (Poroikov et al., 2003). Стандартная версия PASS (Филимонов и др., 2014) позволяет предсказывать возможный токсический эффект соединений при их взаимодействии с молекулярными мишенями, но не прогнозирует действие лекарственно-подобных соединений на конкретные клеточные линии. Созданная нами в рамках данной работы версия программы PASS CLC Pred (Konova et al., 2015; Свидетельство о государственной регистрации программы для ЭВМ № 2016610382 – см. «Приложение 1») для предсказания цитотоксичности соединений в отношении опухолевых и неопухолевых клеточных линий основана на анализе специализированной обучающей выборки, содержащей экспериментальную информацию о действии 76804 веществ на 684 клеточные линии человека из базы данных ChEMBLdb16 (Bento et al., 2014), включая 24 клеточные линии РМЖ и 31 неопухолевую клеточную линию (см. раздел 3.2.2).
Данные о взаимосвязях “структура-активность” (“структура цитотоксичность”) хранятся в базе знаний SARBase программы PASS CLC Pred. SARBase включает словарь видов биологической активности, словарь MNA (Multilevel Neighbourhoods of Atoms) дескрипторов (Filimonov et al., 1999), описание структур соединений, данные о взаимосвязях “структура -цитотоксичность”. Все соединения обучающей выборки представлены в виде набора MNA дескрипторов и списка видов биологической активности, проявляемых данным соединением. MNA дескрипторы генерируются на основе матрицы смежности и матрицы типов атомов. В матрице смежности учитывается наличие всех связей между атомами в молекуле, включая атомы водорода, однако без учета порядка связи (топологическое описание).
Для изучаемого соединения, в соответствии с набором его дескрипторов, вычисляются вероятности принадлежности к классу веществ, проявляющих или не проявляющих определенный вид биологической активности. Результаты предсказания сохраняются в файле формата SDF, содержащем информацию о структуре химического соединения и прогнозируемых для него видов цитотоксичности по отношению к различным клеточным линиям человека с оценками вероятности проявления активности: Pa – соединение активно (цитотоксично); Pi – неактивно (нецитотоксично). Результат предсказания следует интерпретировать следующим образом: Если в прогнозе цитотоксичность к определенной клеточной линии была предсказана с вероятностью Pa 0,7, то, скорее всего, данное соединение проявит цитотоксичность в эксперименте, однако шанс, что это вещество является аналогом известного цитостатика, оказывается также значительным.
Если 0,5 Pa 0,7, то существует большая вероятность, что данное соединение проявит цитотоксичность в эксперименте, но она будет меньшей, чем в первом случае, и это вещество менее похоже на известные соединения-цитостатики.
Если Pa 0,5, то вероятность, что данное вещество проявит цитотоксичность в эксперименте - еще меньше, но если ее наличие экспериментально подтвердится, то такое вещество может оказаться принципиально новой структурой, принадлежащей к химическому классу, где данная активность ранее не выявлена.
Для оценки качества прогноза PASS используется инвариантный критерий точности прогноза (IAP), рассчитываемый по методу скользящего контроля с исключением по одному (Filimonov and Poroikov, 2008). Критерий IAP дает выборочную оценку вероятности того, что случайным образом выбранная из генеральной совокупности пара из положительного и отрицательного примеров будет классифицирована правильно, т.е. положительному примеру будет дано предпочтение перед отрицательным.
Идентификация перспективных фармакологических мишеней для клеточных линий РМЖ
Среди протестированных соединений, проявивших активность по отношению к клеточным линиям РМЖ, были как менее активные в отношении фибробластов, так и три соединения, проявивших значительно большую токсичность по отношению к фибробластам, для которых прогноз отсутствия цитотоксичности по отношению к неопухолевым клеточным линиям не подтвердился.
Для соединения №1 (7-бромо-1-(3-бромо-фенил)-5-фенил [1,2,4]триазоло[4,3-а]хинолин), молекулярная масса 479,177, было предсказано взаимодействие с мишенью MKK6, активность с вероятностью Ра 0,3 в отношении неопухолевых клеточных линий и Ра 0,3 в отношении опухолевых клеточных линий, 4-5 классы токсичности и средняя растворимость (6,96). По результатам экспериментов соединение оказалось более активным в отношении фибробластов (5,1), чем клеток РМЖ (12,5; 14,0).
Соединение №2 (2-азулен-2-ил-3-циано-бут-2- энединитрил), молекулярная масса 229,2431, мишень MKK6, Ра 0,3 – неопухолевые клетки, Ра 0,5 – опухолевые, 4 класс острой токсичности, хорошая растворимость (4,88). По результатам экспериментов соединение оказалось более активным в отношении фибробластов (15,0), чем клеток РМЖ (22,5; 40,0).
Соединение №3 (пиридин-3-ил-ди-пи-толил-амин), молекулярная масса 274,37, мишень MKK3, Ра 0,3 – неопухолевые клетки, Ра 0,5 – опухолевые, 4 класс острой токсичности, хорошая растворимость (4,71). По результатам экспериментов соединение оказалось немного более активным в отношении клеток РМЖ (22,5; 18), чем фибробластов (24,3).
Соединение №4, Х-1, молекулярная масса 271,32, мишень MKK3, Ра 0,3 – неопухолевые клетки, Ра 0,5 – опухолевые, 4 класс острой токсичности, хорошая растворимость (4,71). По результатам экспериментов соединение оказалось значительно более активным в отношении клеток MCF7 (0,8), чем MDA-MB231 ( 50) и фибробластов (62).
Соединение №5 (2-(4-бромо-фенил) 6-метил-4,5-дигидро-3а,5а-диаза-as-индасин), молекулярная масса 327,2265, мишень MKK6, Ра 0,3 – неопухолевые клетки, Ра 0,3 – опухолевые, 3,4,5 классы острой токсичности, средняя растворимость (4,71). По результатам экспериментов соединение оказалось более активным в отношении фибробластов (5,1), чем клеток РМЖ (17; 50).
Соединение №6 (2-циано-3-(3-нитро-фенил)-N-(3-трифлуорометил-фенил)-акриламид), молекулярная масса 361,2828, мишень MKK3, Ра 0,3 – неопухолевые клетки, Ра 0,3 – опухолевые, 4,5 классы острой токсичности, средняя растворимость (5,57). По результатам экспериментов соединение оказалось столь же активным в отношении клеток фибробластов (18,9), как и клеток РМЖ (18,5; 50). Соединение №7 (7-метил-1,5-дифенил-9bH-циклопента[а]нафтален), молекулярная масса 400,281, мишень MKK6, Ра 0,3 – неопухолевые клетки, Ра 0,3 – опухолевые, 3,4,5 классы острой токсичности, средняя растворимость (6,58). По результатам экспериментов соединение оказалось более активным в отношении клеток РМЖ (19; 20), чем фибробластов (39,2).
Соединение №8, Х-2, молекулярная масса 275,36, мишень MKK3, Ра 0,3 – неопухолевые клетки, Ра 0,5 – опухолевые, 3,4,5 классы острой токсичности, хорошая растворимость (4,56). По результатам экспериментов соединение оказалось более активным в отношении клеток клеток MDA-MB231 (22), чем MCF7 ( 50) и клеткам фибробластов ( 50). Соединение не является цитотоксичным по отношению к фибробластам человека.
Соединения № 4, №7 и №8 соответствуют условиям отбора и являются более цитотоксичными в отношении опухолевых клеточных линий, чем неопухолевых клеток. Соединения № 3 и №6 являются незначительно более цитотоксичными в отношении опухолевых клеточных линий, чем неопухолевых. Соединения №1, №2 и №5 более цитотоксичны в отношении фибробластов, чем клеточных линий РМЖ.
Наибольший интерес для дальнейшего изучения представляют соединение №4, обладающее высокой избирательной цитотоксичностью в отношении клеточной линии карциномы МЖ MCF7, и соединение №8, обладающее избирательной цитотоксичностью в отношении клеточной линии тройного негативного РМЖ MDA-MB231. Соединение №8 обладает не столь высокой активностью, как соединение №4, но интересно в связи с тем, что оно не является токсичным для фибробластов.
С целью оценки новизны наиболее перспективных соединений № 4 и № 8 мы провели поиск структурно-сходных молекул по базе данных Thomson Reuters Integrity, содержащей наиболее полную на текущий момент информацию об изучаемых фармакологических веществах (см. раздел 2.6 главы «Материалы и методы»). Поиск проводили при пороговом значении коэффициента Танимото TC 80%. Вводя в поисковую форму (Рисунок 3.3) структурную формулу изучаемого соединения и нажав кнопку “Start”, пользователь получает на дисплее информацию о найденных структурно-сходных молекулах и известных для них видах биологической активности.
Виртуальный скрининг баз данных по доступным образцам коммерчески доступных соединений
Для соединения №1 (7-бромо-1-(3-бромо-фенил)-5-фенил [1,2,4]триазоло[4,3-а]хинолин), молекулярная масса 479,177, было предсказано взаимодействие с мишенью MKK6, активность с вероятностью Ра 0,3 в отношении неопухолевых клеточных линий и Ра 0,3 в отношении опухолевых клеточных линий, 4-5 классы токсичности и средняя растворимость (6,96). По результатам экспериментов соединение оказалось более активным в отношении фибробластов (5,1), чем клеток РМЖ (12,5; 14,0).
Соединение №2 (2-азулен-2-ил-3-циано-бут-2- энединитрил), молекулярная масса 229,2431, мишень MKK6, Ра 0,3 – неопухолевые клетки, Ра 0,5 – опухолевые, 4 класс острой токсичности, хорошая растворимость (4,88). По результатам экспериментов соединение оказалось более активным в отношении фибробластов (15,0), чем клеток РМЖ (22,5; 40,0).
Соединение №3 (пиридин-3-ил-ди-пи-толил-амин), молекулярная масса 274,37, мишень MKK3, Ра 0,3 – неопухолевые клетки, Ра 0,5 – опухолевые, 4 класс острой токсичности, хорошая растворимость (4,71). По результатам экспериментов соединение оказалось немного более активным в отношении клеток РМЖ (22,5; 18), чем фибробластов (24,3).
Соединение №4, Х-1, молекулярная масса 271,32, мишень MKK3, Ра 0,3 – неопухолевые клетки, Ра 0,5 – опухолевые, 4 класс острой токсичности, хорошая растворимость (4,71). По результатам экспериментов соединение оказалось значительно более активным в отношении клеток MCF7 (0,8), чем MDA-MB231 ( 50) и фибробластов (62).
Соединение №5 (2-(4-бромо-фенил) 6-метил-4,5-дигидро-3а,5а-диаза-as-индасин), молекулярная масса 327,2265, мишень MKK6, Ра 0,3 – неопухолевые клетки, Ра 0,3 – опухолевые, 3,4,5 классы острой токсичности, средняя растворимость (4,71). По результатам экспериментов соединение оказалось более активным в отношении фибробластов (5,1), чем клеток РМЖ (17; 50).
Соединение №6 (2-циано-3-(3-нитро-фенил)-N-(3-трифлуорометил-фенил)-акриламид), молекулярная масса 361,2828, мишень MKK3, Ра 0,3 – неопухолевые клетки, Ра 0,3 – опухолевые, 4,5 классы острой токсичности, средняя растворимость (5,57). По результатам экспериментов соединение оказалось столь же активным в отношении клеток фибробластов (18,9), как и клеток РМЖ (18,5; 50).
Соединение №7 (7-метил-1,5-дифенил-9bH-циклопента[а]нафтален),
молекулярная масса 400,281, мишень MKK6, Ра 0,3 – неопухолевые клетки, Ра 0,3 – опухолевые, 3,4,5 классы острой токсичности, средняя растворимость (6,58). По результатам экспериментов соединение оказалось более активным в отношении клеток РМЖ (19; 20), чем фибробластов (39,2).
Соединение №8, Х-2, молекулярная масса 275,36, мишень MKK3, Ра 0,3 – неопухолевые клетки, Ра 0,5 – опухолевые, 3,4,5 классы острой токсичности, хорошая растворимость (4,56). По результатам экспериментов соединение оказалось более активным в отношении клеток клеток MDA-MB231 (22), чем MCF7 ( 50) и клеткам фибробластов ( 50). Соединение не является цитотоксичным по отношению к фибробластам человека.
Соединения № 4, №7 и №8 соответствуют условиям отбора и являются более цитотоксичными в отношении опухолевых клеточных линий, чем неопухолевых клеток. Соединения № 3 и №6 являются незначительно более цитотоксичными в отношении опухолевых клеточных линий, чем неопухолевых. Соединения №1, №2 и №5 более цитотоксичны в отношении фибробластов, чем клеточных линий РМЖ.
Наибольший интерес для дальнейшего изучения представляют соединение №4, обладающее высокой избирательной цитотоксичностью в отношении клеточной линии карциномы МЖ MCF7, и соединение №8, обладающее избирательной цитотоксичностью в отношении клеточной линии тройного негативного РМЖ MDA-MB231. Соединение №8 обладает не столь высокой активностью, как соединение №4, но интересно в связи с тем, что оно не является токсичным для фибробластов.
С целью оценки новизны наиболее перспективных соединений № 4 и № 8 мы провели поиск структурно-сходных молекул по базе данных Thomson Reuters Integrity, содержащей наиболее полную на текущий момент информацию об изучаемых фармакологических веществах (см. раздел 2.6 главы «Материалы и методы»). Поиск проводили при пороговом значении коэффициента Танимото TC 80%. Вводя в поисковую форму (Рисунок 3.3) структурную формулу изучаемого соединения и нажав кнопку “Start”, пользователь получает на дисплее информацию о найденных структурно-сходных молекулах и известных для них видах биологической активности.