Введение к работе
Актуальность " мы. В , .істсщее время в оргаг"'ческой химии «'"теэировг' о более 13 миллионов химических веществ, набор сведений ,о ко *рих весьма обширен. Активное использование в научных исследованиях этой «иромной информации невозможно без привлечения средств вычислительной те.шики. Комрьют ,/Ные технологии я мат- чатическое моделирование позволяют отказаться от традиционного метода поиска химиче ,;их веществ с заданными свойствами г "тем экспериментов, которые являются чрезвычайно сложными, длительными и дорогостоящ' ш. Так, разработка единственного лекарственного препарата \ ^ебует в среднем от 8 до 20 лет, а заграти составляют до 100 и 'лляонов дол аров. Согласно статистике, удачным оказывается приблизительно одно из 10 тысяч испитани. воз: ^жных овых лекарственных препаратов. В свг~и с этим многие фирмы -вязьіваЮі успех в разработке новых препаратов с. внсд гнием в химіїчі хі исследования компьютерного и математического моделирования, резко сокращающего сроки создания физиологически активных веществ, іутем отсеивания заведомо неактивных т вь"-охотоксич-иых соечипений. По оценке ''International Resource Development Fnc" особенно быстро растёт объём финапсирова ия работ по созданию компьютерных си' "ем для моделирования рачліг ых свойств х. шческпх і ществ — от 66 миллионов долларов в 1983 году до 8,5 миллиардов долларов в 1993 і ту. При созді...ли таких систс возникают сложны выходящие за рамкі) информационного поиска задачи, ре 'ение которых требует разработки специальных етодов я моделей, оригинальных алгоритмов и соответствующего программного обеспечения. Подобные системы будут обладать к тому же рядом преимуществ, обус тленных »"чцной информационной поддержкой в мпде баз фактографических данных, наличие которых позволит решать и такз'.е важные в научном и практическом отношении проблемы, как уста-ионле. іе эмпирических за; но.-ерностей для моделирования связи между строением вещества и ег< физико-химическими и биологическим'' свойствами. Хотелось бы отметить, что поиск новых высокоактивных и безопасных для человека я окруж г-цей среды химических препаратов с заранее заданными свойства' ті является важнейшей' фундаментальной проблемой мировой науки, так как создание таких ь^ществ есть одно из ос. >в!шх условий роста технологический моши современного общества.
Таким образом, проблемы создания информационно-математической инфраструктуры системы научных химических иг- тедов; ий вместе с комплексом проблемно-ориентированных баз данных, по п^ппоте адекватных нуждам пользователей, являете в настоящее время ключевг " для іштег іфнкащш научных исследований. Изложенное выше определяет актуальность, научную п it гктическую значимость проведенных иссле-ований в одной из наиболее важных областей химической информатики — разработке компьютерных средств и математических методов для ..юделировани* связи между строением вещества и его свойствами.
Изложенные в диссертации Результаты получены в ходе выполнени. ие едо ваний по планам фундаментальных иаучно-иселрл. ате-.гких'работ, пр юдимых и >амках единого заказ- наряда по распоряжению Госкомвуза РФ, по н»"чио-тсхвичеі ой
рограмме іелякзааия прі-^ритегноі-о направления развития химической н'уки и т хнолот'йй' при' FKHT СССР и АН СССР "Создание базовых информационно-поисковых сисТе\г йо- структурам и свойствам зешеств е материалов для прогноза свойств к выбора оптккзЯьн-'.. путеї» синтеза химических соединений", ч государ--.тіонесті аг; ш< гехнкческсйпрограмме р ^<хаи "Новые принципы и методы получения химических еществ'и материалов", а также по хозяйственным договорам.
Цел: paSofbt. '^"ґь'диссертационной работы заключается з разработке ффек-тивкых метсдоз'мзтематЕческсгч.- 2 ксміі..ютерЕс. моделі .ювания связи структура химически: соединений— молекулярные свойстве.— биологическая активность" на основе стратегий форм .юваяие базы данных и знаний ьз имеющихся примеров, а . таь. . г і создании компьютерных технологий поддержки профессиональных химики-структурнс-би Тс -.ічєскгх баз дагчьк и знаний Для достижения указанной цели по поиску зф'фектйаЖЬгх препаратов с зада: ;ыми свойствами потребовался углубленный анализ к теоретически*; исследования первичных экспериментальных данных р^пользсвакием' ййфЬрма!1*0Р'о-компьютерных технологий и методов математического моделиро" ча'йя,
Соъектс. насїо'ЛпІеґо' Кспедования я іяется химикс-биологическая и струк-турчая ихіФормаци^ о химических с. ..здикекиях и их свойствах.
Предметом дсследов'айий являются компьютерные системы многоцелевого назначения, математически методы и модели, использованные для решения проблемы установления связи между сроен.ем вещества и его свойствами.
Предложенные дассертайток математические м< чгли, структуры баз данных и алгоритмы фукккЕоянрОоа'н'я'х' информационно — моделирующих систем был. реализованы им на kSasLiy! ttdtp мыирования Си с C+-f в ^.реяе MS DOS.
Научная ноймэяй p&Stlti заключается в комплексном подходе к конструированию бг лог ческй аі:Ті.ііііьіх соединен: т, который сочетает использование средств вычислительной тєхіі.ікй а&хома'ґРїЗйррваї'. илх. информационно-поисковых систем с фактографическими базам»! даавдх, иойых мат латических методов расчёта физика химических с.»пйоТв молекул е моделей для установления зависимостей между стрjease.M вещества й его csokctssaSW: в создании оригинальных подходов математн- описания мШі. іесяих ссгданенк,. кз их структурных формул; которые позволяют производить анализ Соединений; арика'лежаимх к различным структурным классам
Практическая значимость. К моменту написания диссертационной работы ее результаты внедрены в научную и производственную практику Всесоюзного научно-исследовательского И' -титута химических средств защиты растений (Москва), института мате^ .ал^едения (Калининград Московской области), Всесоюзного научно-исследовательского технологического института гербицидов и регуляторов роста растений (Уфг^ и в научно-инженерные цен.р "Системы и технологии'' гта химическом обЩ'-~тве им. Д.И. Менд іеева (Москва). Внедрение і гуль '.гтов исследован;, л осу ествлено. преимущественно, через выполнение :оздоговорных рэ'гст v. договоров па передачу иаучно-ч „хнических достижений. Система компьютерного пр. ггозирс-лакия биологических свойств, используемая Всесс.лшым на. що-исследовательским
' 4
институтом чмических средств защиты рас^нгй для скрининга химических соединений, покачала высокую экономичес ю эффективность в пределах 12С — 360 Тысяч рублей (в ценах 1990 года) на одлу тысячу предъявлегчых для анализ* и планируемых к синтезу имичес їх впществ. Реальный '(. ,<ект был достигнут за с"ет отбраковки заведомо неэффективных с.^уктур и сокращением пустых синтезов и биологических испытаний.
Апробация работы. Основяые положені . и резуль. аты работы док: дывались ч обсуждалйо на семинарах и конференциях, в том чьеле: па IV Всесоюзном симпозиуме по машинны; методам обнаружения закономерностей (Новосибирск, 1983), на VII и VIII Всесоюзных конференциях "Использование вычислительных машин в ..имических исследованиях и спектроскопии молекул" (Рига, 1986 и Новосибирск, 1989), на VIII Всесоюзной конференцій "Планирование и автоматизация эксперимента в научных исследованиях" (Ленинград, »986), на 1 и II Всесо- зны: конфер щиях "Математические методы и ЭВМ в аналитической химии" (Москва, 1986 и 1991), на рабочем совещании "Молекулярные графи в -ш чческнх исследованиях" (Одесса, 1987), на Региональной научно-технической конференции "Синтез и прик лени< пестицидов и кормовых f бавок в сельскохозяйственном производстве" і Волгоград, 19S8), на III Всесоюзной конференции "Методы и средства обработки сложной графической информации" (Гор .тій, I9SS), на IV Всесоюзной конфереяциг "Системы баз данных и знаний" (Калинин, W), на Меж, .іспубликавской конференции "Сиі. .ез, фармакология в клинические асі ;<ты новых пси: гропных и с< іечно-сосудистмх веществ"' (Волгоград, 1989), на II Всесоюзной конференции "Моделирование систем информатики" (Новосибирск, id90), на Международной конференции "Автоматизі ровашше биилиотечно информационные системы" (Новосибирск, 1993), на II Всероссийской конференции "Математические проблс-'ы экологии" (Новосибирск, 1994), на Международной конференции "Нопме информационные технологии в университетском образовании" (Новосибирск, J 995). на Ш и IV научных семинарах с междуна-ролн. ,1 участием "Автом ;и? рованные бнблиотечяо — информационные системы (Новосибирск 1989 и 1991), на научно-техническом се-чшарес международным участием "Экспертные и обучающие системы" (Саратов, 1995), на II Междун одной конференции "Непрерывно-логические методы и модели в науке, технике и экономике" (Пенза, 1995), на VI Сибирском научном семинаре-с международь..ш участием "Информ; і.ия в фундаментальных, гуманитарных и прикладных научных исследованиях" (Новосибирск, 1996).
Н». защиту выносятся:
1. Комплексный подход к ранению про^чемы поиска химических веществ с. за
данными свойствами, который сочетает использование средств вычислитель
ной техии..и, автоматизированных информационно-поисковых и прогнозирую
щих систем, математических методов и моделей для установ е. ня заэисих
стей между строением вещества и его физико-химическими и биологическими
свойствами.
2. Оригинальная компьютерная система для проведі ія научных иссл.дований по
моделированию связи „іежду строением вещества и его свойствами с исг^лмо-вг.''чем фактографических банков данных, а также информационные технологии, связанные с разработкой профс-сиоиалт-чых банков данных для хчмпко-биологических исследог .і. ли.
3. Математичеі ие модели для предсказания физико-химических и токсикологи-чег их параметров органических соединений и их эффективность по cpav їєнию с зарубежными пакетами.
Луб якацаи. По т>'че диссертации оиубликов&ко 36 іаучньї}. рг.бот.
' <"?тиуктура к объём ра .оты. Диссертация состоят из ьведеяи? шест., гла ,
заключения, сз'искч литературы из іе_іиаимекован;їя и двух поил жекик. Общий
об зм ,иссертавдш составляет ^Ц*/г страниц, зхяючая г-J __иллюстрации.