Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Корреляционные модели для расчета физико-химических свойств и биологической активности органических соединений Цыганкова Ирина Глебовна

Корреляционные модели для расчета физико-химических свойств и биологической активности органических соединений
<
Корреляционные модели для расчета физико-химических свойств и биологической активности органических соединений Корреляционные модели для расчета физико-химических свойств и биологической активности органических соединений Корреляционные модели для расчета физико-химических свойств и биологической активности органических соединений Корреляционные модели для расчета физико-химических свойств и биологической активности органических соединений Корреляционные модели для расчета физико-химических свойств и биологической активности органических соединений Корреляционные модели для расчета физико-химических свойств и биологической активности органических соединений Корреляционные модели для расчета физико-химических свойств и биологической активности органических соединений Корреляционные модели для расчета физико-химических свойств и биологической активности органических соединений Корреляционные модели для расчета физико-химических свойств и биологической активности органических соединений Корреляционные модели для расчета физико-химических свойств и биологической активности органических соединений Корреляционные модели для расчета физико-химических свойств и биологической активности органических соединений Корреляционные модели для расчета физико-химических свойств и биологической активности органических соединений
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Цыганкова Ирина Глебовна. Корреляционные модели для расчета физико-химических свойств и биологической активности органических соединений : диссертация ... доктора физико-математических наук : 03.00.02 / Цыганкова Ирина Глебовна; [Место защиты: Ин-т теорет. и эксперим. биофизики РАН].- Пущино, 2007.- 217 с.: ил. РГБ ОД, 71 07-1/371

Содержание к диссертации

Введение

2. Развитие и современное состояние корреляционных подходов в изучении связи физико-химических свойств и биологической активности с молекулярной структурой органических соединений . 9

2.1. Теоретическое обоснование корреляционных подходов. 11

2.1.1. Энергия системы в простых квантовых подходах. 11

2.1.2. Линейные соотношения для свободной энергии в молекулярных процессах . 13

2.1.3. Термодинамические свойства. 14

2.1.4. Вид корреляционного соотношения. 15

2.2. Численное представление молекулярной

структуры 16

2.2.1. Топологические индексы. 17

2.2.2. Трехмерные дескрипторы молекулярной структуры. 20

2.2.3. Фрагментные и подструктурные дескрипторы молекулярной структуры. 21

2.2.4. Дескрипторы, описывающие структуру молекулы через другие свойства. Роль межмолекулярных взаимодействий. 23

3. Методы построения корреляционных моделей для оценок физико-химических свойств и биологической активности . 25

3.1. Фрагментное представление структуры молекул. 25

3.1.1. Разбиение молекулы на фрагменты. 25

3.1.2. Использование "реакции образования" для построения корреляционного соотношения. 29

3.1.3. Взаимодействие фрагментов. 33

3.1.4. Особенности корреляционного соотношения структура-свойство для гибких молекул. 34

3.2. Математические аспекты построения корреляционных моделей. 37

3.2.1. Использование ортогональных дескрипторов молекулярной структуры. 38

3.2.2. Отбор дескрипторов для корреляционных моделей. 39

3.2.3. Описательная и предсказательная сила моделей. 45

4. Расчет физико-химических свойств органических соединений разных классов . 49

4.1. Потенциальные функции и "прямые" методы расчета молекулярных свойств. 49

4.1.1. Расчет энергетических характеристик отдельных молекул и их комплексов в вакууме и водном окружении. 49

4.1.2. Использование метода RISM для расчета термодинамических характеристик гидратации

молекул насыщенных углеводородов. 55

4.2. Оценки физико-химических свойств органических соединений в корреляционных подходах . 59

4.2.1. Нормальные углеводороды. 59

4.2.2. Разветвленные насыщенные углеводороды. Роль многофрагментных вкладов. 64

4.2.3. Циклические, ненасыщенные и ароматические углеводороды и алифатические соединения, содержащие гетероатомы. 75

4.2.4. Насыщенные углеводороды, спирты и амины с разветвленными углеводородными радикалами. Альтернативное фрагментное представление молекулярной структуры. 82

4.2.5. Перфторуглероды. 92

4.3. Корреляционное соотношение структура-свойство для оценок log Р органических соединений разных классов. 103

4.3.1. Насыщенные углеводороды. 104

4.3.2. Гибкие молекулы углеводородов. 104

4.3.3. Циклические, ненасыщенные и ароматические углеводороды и алифатические соединения, содержащие гетероатомы. 112

4.3.4. Соединения с несколькими полярными группами. 119

4.3.5. Пептиды. 126

5. Оценки биологической активности в корреляционных подходах . 141

5.1. Модели взаимодействия рецептор - лиганд. 141

5.1.1. Комплексы "гость - хозяин" с участием а-циклодекстрина. 141

5.1.2. Корреляция структура - активность для некоторых ингибиторов нейраминидазы вируса гриппа . 153

5.2. Корреляционное соотношение для оценок лекарственного действия. 169

5.2.1. Расчет длительности действия барбитуратов. 169

5.2.2. Оценки периода полувыведения перфторуглеродов. 184

6. Заключение и выводы. 193

7. Литература.

Введение к работе

Актуальность.

Актуальность исследования обусловлена тем, что в настоящее время синтезируются многие тысячи новых веществ, физико-химические свойства или биологическая активность которых требуют изучения Для этого необходимы количественные оценки характеристик вновь синтезируемых соединений, которые трудно или невозможно определить экспериментально

Корреляционные подходы дают возможность направлять поиск новых веществ с заданными свойствами, в том чисте с желаемым лекарственным действием, и сокращать стоимость, временные затраты и необходимые испытания на животных

Новизна.

Разрабатываемый подход основывается на фрагментом представлении молекулы Новизна предложенных моделей заключается в том, что выбор фрагментов разного типа и разной величины обусловлен внутри- и межмолекупярными взаимодействиями, существенными для рассматриваемого процесса, а не связан

жестко с атамами или группами атомов Степень детализации фрагментного представления молекулярной структуры определяется конкретной задачей Впервые взаимодействия между фрагментами включены в корреляционное соотношение в явном виде или в форме вклада, который как параметр определяется по молекулам тренировочного набора, или в форме функции от расстояния между фрагментами Это позволяет уменьшать число параметров корреляционного соотношения и решать задачи в условиях ограниченного набора экспериментальных данных Предложенный подход отличается общностью и гибкостью, и применим к разнообразным физико-химическим свойствам или биологической активности

Практическая значимость

Корреляционные подходы могут служить для предсказания физико-химических свойств іпи биологической активности вновь синтезируемых соединений и направлять поиск новых соединений с более предпочтительными характеристиками Предложенные корреляционные модели могут оказаться полезными для формирования критериев поиска в базах данных, например, при конструировании новых лекарственных соединений

Разрабатываемые модели могут применяться в качестве простых и быстрых способов оценки биологической и экологической безопасности

Апробация работы

Результаты исследований были доложены на российских и международных конференциях, институтских и межлабораторных семинарах

  1. ХШ Семинар по межмолекулярному взаимодействию и конформациям молекул, г Тверь 1997г

  2. XIV Семинар по межмолекулярному взаимодействию и конформациям мотекул, г Плес, Ивановской обл 25-29 июня 2001г

3 10-ая международная конференция «Математика Компьютер Образование», г
Пушино 20-25 января 2003г

  1. XII Симпозиум по межмолекулярному взаимодействию и конформациям молекул г Пущино 14-18 июня 2004г

  2. 4-я Всероссийская конференция "Молекулярное моделирование", г Москва 12 -15 апреля 2005 г.

6 Международная конференция «Биологические мишени для действия лекарственных препаратов нового поколения» Центр высоких технологий «Химрар», г Химки, Московская обл 28-30 марта 2006г

Работа выполнена в рамках плана НИР Института По теме диссертации опубликовано 27 статей в отечественных и зарубежных изданиях

Структура работы.

Линейные соотношения для свободной энергии в молекулярных процессах

Метод линейных соотношений для свободной энергии первоначально возник в органической химии при изучении констант скорости и констант равновесия в реакционных сериях [9]. Этот метод основан на предположении, что всякий раз, когда функциональная группа присоединена к одному и тому же центру в молекуле, к полной реакционной способности молекулы будет добавлена или вычтена из неё фиксированная величина. Наиболее распространенным соотношением линейности свободных энергий можно считать уравнение Гаммета. Изначально оно было постулировано эмпирически и в дальнейшем получило теоретическое обоснование. В этом уравнении: \ogk = ра +Const. Здесь А:-константа скорости или равновесия какой-либо органической реакции; а -константа заместителя, определяемая, как : crx=\ogKx-\ogKH. Здесь Кн- константа ионизации бензойной кислоты, Кх - константа ионизации её мета- или пара-производного. Уравнение Гаммета было распространено и на алифатические реакции путем введения стерических констант заместителей (констант Тафта). Подобные подходы, с использованием соответствующих констант заместителей, разрабатывались и для рассмотрения корреляций биологической активности со структурой соединения [10]. Дополнительно вводились полярные и другие константы заместителей. Наборы констант заместителей (так называемые шкалы) совершенствовались и усложнялись, однако вопрос переносимости этих параметров от одного класса соединений к другим так и остался неразрешенным до конца [11,12]. Для преодоления этой трудности при практическом применении шкал параметров заместителей вводились дополнительные поправки, учитывающие молекулярное окружение заместителя в конкретном соединении. Аддитивные модели, получающиеся в результате применения принципа линейности свободных энергий к корреляции структура - биоактивность, хорошо зарекомендовали себя в исследовании многих видов биологической активности, токсичности и лекарственного действия [13]. В аддитивных моделях возможно использовать методы множественной линейной регрессии и дать наглядную интерпретацию результатов. В некоторых случаях наблюдаются, однако, заметные отклонения от аддитивности. Ещё в ранней работе [10] отмечалось, что в полизамещенных тетрациклинах бактериостатическая активность плохо описывается аддитивной моделью. Но в работе [14] подчеркивается важность корректного определения заместителей. Например, группа N02, участвующая во внутримолекулярной водородной связи, должна считаться отличной от одиночной группы ЫОг, которая не взаимодействует с другими группами. Таким образом, расширяя число типов заместителей, в некоторых случаях удается добиться достаточно точных оценок и при помощи аддитивных моделей.

При рассмотрении термодинамических свойств, где необходимо учитывать взаимодействие большого числа молекул, закономерности имеют статистическую природу. До настоящего момента нет точного теоретического описания поведения многоатомных молекул в реальных системах в конденсированном состоянии. Уравнения состояния получены для относительно простых систем, в которых допускаются только очень упрощенные межмолекулярные взаимодействия [15-17]. Поэтому такие свойства как плотность, теплоемкость, давление паров, температура кипения в подобных модельных представлениях оцениваются с неудовлетворительной точностью.

Таким образом, приходится констатировать, что теоретический расчет свойств органических соединений на основе их молекулярной структуры в настоящий момент невозможен. В то же время установление корреляций структура - свойство позволяет получать достаточно точные количественные оценки свойств молекулярных систем в менее строгих условиях.

Функциональная форма зависимости характеристики свойства Р молекулярной системы от количественных параметров структуры Cjt С2, ...С„, как говорилось выше, вообще говоря, не определяется из теоретических соображений. На основании линейного соотношения для свободной энергии, наблюдаемого во многих физических процессах, можно использовать простейшую в математическом смысле линейную зависимость: Р = kiCl.

Здесь kj- параметры корреляционного соотношения, которые определяются по известным значениям свойства для соединений из, так называемого, тренировочного набора. Эта простейшая корреляция давно и весьма успешно применялась для разных типов свойств. Линейная форма выражения для свойства позволяет применять регрессионные методы определения параметров корреляционного уравнения и установления границ его применимости. Экспериментально обнаруженные отклонения от аддитивной зависимости от параметров молекулярной структуры послужили причиной исследования других форм корреляционного соотношения. В различных системах были проверены и нелинейные функциональные зависимости [18-20]. В настоящее время развитие математики и компьютеризация предложили новые возможности в построении корреляционных соотношений. Такой метод, как искусственные нейронные сети, позволяет моделировать существенно нелинейную зависимость характеристики свойства от характеристик структуры молекулярной системы и дает оценки свойств разнообразных соединений с точностью близкой к точности экспериментально измеренных значений. Например, для температуры кипения систематического набора изомеров насыщенных углеводородов с числом атомов углерода от 1 до 10 получены оценки температуры кипения со среднеквадратичным отклонением от экспериментальных значений всего 1.6 К [21]. Однако необходимо подчеркнуть, что использование сложных математических выражений для зависимости свойства (активности) от молекулярной структуры может сильно затруднить интерпретацию полученных результатов. Поэтому, в отсутствие универсальных рецептов выбора функциональной зависимости, линейная форма корреляционного соотношения остается самой популярной в корреляционных подходах.

Использование "реакции образования" для построения корреляционного соотношения.

Многие свойства проявляют неаддитивность, т.е. зависят от числа фрагментов определённого типа в молекулярной структуре нелинейно. Это хорошо заметно на наборах линейных соединений. Удлинение цепочки линейных углеводородов на группу СН2 вызывает увеличение, например, температуры кипения на величину AT Сн2, которая зависит от длины уже имеющейся цепочки: ЛТсн2 - ТкипССгНб)- ТКИП(СН4) - 72.8 К, а ЛТсН2= Ткип(С2оН42) - Ткип(Сі9Н4о) = 13.9 К.

Можно предположить, что на вклад в свойство определенного фрагмента оказывают влияние все остальные фрагменты, составляющие молекулу, другими словами, фрагменты взаимодействуют. Таким образом, двуфрагментные вклады Д у, Sl4, Si5... соотношений (3.1.1) и (3.1.2) можно считать вкладами взаимодействия фрагментов, разделенных разным числом связей, т.е. расположенных на разных расстояниях. Несмотря на то, что допущение о взаимодействии фрагментов делается формально, оно оказывается полезным при построении корреляционных моделей, что подтверждается примерами, рассмотренными в главе 4. Предположение о том, что фрагменты взаимодействуют, позволяет: 1) описать неаддитивность свойства при помощи линейного по параметрам корреляционного соотношения; 2) предложить функциональную зависимость взаимодействия фрагментов от расстояния между ними и уменьшить число параметров корреляционного соотношения. Необходимо подчеркнуть, что взаимодействие фрагментов эффективным образом отражает реальные внутри - и межмолекулярные взаимодействия, но оно не является физическим взаимодействием в общепринятом смысле. Например, нельзя говорить о возникновении каких-либо сил между фрагментами.

Фрагменты, соответствующие атомам, которые разделены в структуре молекулы тремя и более связями, могут быть по-разному расположены друг относительно друга из-за возможности внутреннего вращения. Например, молекула бутана может находиться в транс и гош конформациях. Следовательно, параметр S может принимать разные значения в зависимости от диэдрального угла ф (дранс =5(180), S m = 5(60) ). Это можно учесть в корреляционном соотношении (соотношение (3.1.1) введением соответствующих параметров. Аналогично, вместо стране, транс вклада 615 следует рассматривать целый набор вкладов \ь , с транс,гош гош,гош \5 ,15 . Учитывая введенные параметры, можно записать корреляционное соотношение для линейных углеводородов в виде: n , / і\ п , / -,\ мтРанс стране 1/чгош ггош , Р = па+(n-l)fl+(п-2)у+Щ„л 1...4 + Щ...4 і..л + транс,транс ?транс,транс , транс,гош странс,гош , П\...5 \...5 + "1...5 h..5 + (3.1.3) Р, „транс 1Лгош л л Здесь П\...4 или 1...4 -число вкладов 1-4, равное числу транс или . „ „ „транс,транс „транс,гош гош конфигурации в молекулярной цепочке, #15 W15 гош,гош л _ Щ 5 - число вкладов 1...5, равное числу соответствующих конфигураций из пяти атомов в молекуле. Для пар фрагментов, разделенных расстоянием большим, чем 4 связи, число параметров будет ещё возрастать. Для определения значений такого большого количества параметров корреляционного соотношения в подавляющем большинстве случаев не хватает экспериментальных значений свойства. Усложняющим обстоятельством является то, что реальные системы являются смесью разных конформеров. Следовательно, для того, чтобы определить число о транс о гош всех вкладов ои , о]4 и т.д., необходимо знать распределение по конформациям соединений тренировочного набора. В таблице 3.1.3 приведены данные о конформационных состояниях некоторых молекул углеводородов в газовой фазе и число вкладов S"paHC и 8ош в выражение, определяющее свойство Из таблицы 3.1.3 следует, что отношение числа вкладов б173"0 к числу вкладов 8Г0Ш будет 1.5- 2.0 во всех случаях. Очевидно, что если принять в качестве эффективного параметра комбинацию 0.б8пранс + 0Л ош =дц, то число таких вкладов для бутана, пентана, гексана и гептана будут близки к 1, 2, 3 и 4, соответственно, что согласуется с соотношением 3.1.1. Только потому, что заселенности конформеров ggg... малы и их присутствием можно пренебречь, "в среднем" число вкладов (Гранс и 8ти меняется линейно с числом атомов С в молекуле нормального углеводорода. Это позволяет использовать соотношение (3.1.1) с усредненными по конформациям параметрами 8\4, Sis, и т.д.

Оценки физико-химических свойств органических соединений в корреляционных подходах

Отсеивание переменных корреляционного соотношения - важный момент построения корреляционной модели. Независимо от того, строится ли корреляционное соотношение эмпирическим путем на произвольном наборе дескрипторов, или же на наборе дескрипторов, предварительно отобранных, исходя из каких-либо предположений и обстоятельств, обязательно присутствует стремление уменьшить число предикторов. Это может быть необходимо по нескольким причинам: 1) задача не доопределена, т.е. число предикторов больше, чем число экспериментальных значений; 2) уменьшая число дескрипторов, можно попытаться выделить дескрипторы наиболее важные для проявления свойства и по структурному смыслу оставленных дескрипторов строить гипотезы относительно проявления свойства или механизма активности; 3) корреляционная модель с небольшим набором дескрипторов может быть использована для поиска в базе данных, когда необходимо исследовать очень большое число соединений.

При выборе фрагментного представления структуры молекул на основе анализа межмолекулярных взаимодействий число типов вкладов и, следовательно, число параметров модели может быть ограничено из чисто физических соображений. Так, выбирая укрупненные фрагменты или вводя экспоненциальную зависимость от топологического расстояния для парных вкладов, мы получали простые модели (-10 параметров) для оценок физико-химических свойств и биологической активности. В случаях, когда такие модели не давали удовлетворительной точности или не было правдоподобных предположений для отбора наиболее важных вкладов, то для тренировочного набора соединений насчитывались все возможные фрагментные дескрипторы. Далее математическими методами находились выборки из общего числа или наборы дескрипторов, дающие наилучшие корреляционные модели.

В случае, если переменные ортогональны, можно уменьшить их число, исключая дескрипторы, наименее скоррелированные со значениями свойства. При этом не возникает ситуация, когда несколько менее скоррелированных со свойством дескрипторов вместе дают более точную корреляцию, чем один лучше скоррелированный со свойством дескриптор. Детально такой пример разобран в работе М. Рандича [78]. Отбор неортогональных дескрипторов - задача, более трудная в математическом смысле из-за их взаимозависимости. Надежно получить наилучшее корреляционное уравнение можно, если применять метод всех регрессий, но это - весьма долгий путь. Например, чтобы выбрать из имеющихся 296 CODESSA дескрипторов наилучшую регрессию с 5 параметрами, необходимо перебрать и оценить 108 моделей и затратить 4 дня(!) процессорного времени на компьютере SUN Enterprise 3000 [24]. Процедура пошагового отбора существенно более быстрая, но она не дает наилучшей комбинации дескрипторов, поскольку при таком отборе не исследуется все пространство дескрипторов. Авторы [24] предлагают оптимальную комбинацию метода всех регрессий и пошаговой регрессии, которая позволила получить регрессионную модель с 7 параметрами, отобранных из множества 296 дескрипторов, при разумных затратах компьютерного времени. Метод всех регрессий был применен на первом этапе отбора для получения моделей с числом переменных от 1 до 4. Лучшие из полученных 4 модели были использованы на втором этапе отбора, где пошаговым способом, в котором присоединялось и исключалось сразу по несколько переменных, были получены 16 моделей с 25-35 переменными. Все выбранные в последних моделях дескрипторы составили уменьшенный набор переменных, к которому было реально применить метод всех регрессий для поиска моделей с достаточно большим числом предикторов. Так была выбрана наилучшая комбинация из 7 дескрипторов. Авторы [24] отмечают, что полученная регрессионная модель превосходит по статистическим характеристикам модели, разработанные с помощью нейронных сетей. Имеется также свидетельство того, что корреляционная модель для связывания различных соединений с эстрогенным рецептором [79], полученная пошаговой регрессией, превосходит по предсказывающей способности модели, полученные методом проекции на латентные структуры (ПЛС).

В литературе описано еще несколько подходов для выбора наборов дескрипторов, дающих наилучшие модели [30-33, 80,81]. В наших исследованиях мы разработали алгоритм поиска оптимального набора дескрипторов, состоящий из нескольких последовательных применений пошаговой регрессии. Процедура пошаговой регрессии может стартовать с небольшого набора переменных, и на каждом шаге переменные будут добавляться для улучшения статистических параметров модели. Для больших наборов данных, как правило, определяющими были характеристики точности модели (коэффициент корреляции и стандартное отклонение оценок от экспериментальных значений). В случаях с небольшим набором данных (обычных для биоактивности) ограничивающим было число дескрипторов, которое могла включать модель. Направление поиска и получающиеся в результате процедуры пошаговой регрессии лучшие модели зависят от исходного набора дескрипторов. Для того чтобы исследовать как можно полнее пространство дескрипторов, мы предложили начинать пошаговую регрессию от моделей с одной переменной, которой был поочередно каждый дескриптор из исходного набора переменных, и от моделей, включающих все дескрипторы кроме одного, которым также был поочередно каждый дескриптор. Из полученных таким образом корреляционных моделей выбирались около 10 лучших, с разным числом переменных. Было заметно, что полученные модели группируются вокруг нескольких точек в пространстве дескрипторов. Затем полученные модели "возмущались", добавлением или исключением 1-3 дескрипторов, выбранных случайным образом, и процедура пошаговой регрессии включалась вновь

Корреляция структура - активность для некоторых ингибиторов нейраминидазы вируса гриппа

Современная теория жидкостей хорошо описывает некоторые закономерности структуры жидкого состояния вещества, но расчет термодинамических свойств, таких как теплота испарения, давление насыщающих паров, температура кипения, критические параметры для разнообразных соединений, исходя из строгой теории, как указывалось выше, невозможен, поскольку до настоящего времени нет теоретического описания многоатомных соединений в конденсированном состоянии. Различные феноменологические подходы для расчета физико - химических свойств развивались давно и интенсивно, однако получаемые при их помощи оценки, как правило, недостаточно точны [118-121].

Корреляционные соотношения, принимающие во внимание особенности межмолекулярных взаимодействий, но не требующие точных аналитических выражений для описания этих взаимодействий, представляют собой компромиссный подход в расчетах физико - химических свойств. Для оценок разных свойств разнообразных соединений построено много корреляционных моделей структура - свойство на основании описания структур при помощи топологических индексов, квантовохимических характеристик, фрагментных дескрипторов и других молекулярных дескрипторов с использованием различных математических методов и подходов (см. например [21, 54, 71,120,122-143]). Температуру кипения, для которой накоплены экспериментально измеренные значения для широкого круга соединений, можно назвать проверочным полигоном для отработки различных корреляционных подходов. Продемонстрируем возможности развиваемого фрагментного подхода в расчете физико - химических свойств насыщенных углеводородов, с тем, чтобы далее распространить его на другие классы соединений. Насыщенные углеводороды - соединения полезные для отработки методов построения корреляции структура-свойство, поскольку в первом приближении можно считать, что они состоят из одинаковых атомов углерода. Использование таких соединений для построения корреляционных моделей позволяет наглядно представить роль чисто структурных факторов, таких как размер молекулы, ее форма, наличие разветвлений в молекулярных скелетах, присутствие циклических групп.

Анализируя экспериментальные значения температуры кипения насыщенных углеводородов, содержащих до 10 атомов С (рисунок 4.2.1), можно заметить, что 1) наращивание линейной цепочки атомов приводит к нелинейному росту температуры кипения; 2) разветвленные изомеры углеводородов имеют температуру кипения ниже, чем соединения с линейной структурой с тем же числом атомов углерода; 3) соединения с циклическими группами кипят при температурах выше, чем алифатические соединения с тем же числом атомов углерода. Эти основные закономерности должны быть отражены в корреляционном соотношении, для того, чтобы оно давало достаточно точные оценки температуры кипения. Будем использовать такое фрагментное представление молекулярной структуры, в котором фрагментом считается атом углерода и присоединенные к нему водороды. Молекуле углеводорода СпН2П+2 может быть сопоставлен молекулярный граф Сп, в котором вершины (группы СНт, т=0,1,2,3) соединяются друг с другом ребрами (связями СС). С помощью соотношения (3.1.1) можно записать конкретные выражения для расчета свойства Р для представителей ряда линейных углеводородов. Они приведены в таблице 4.2.1.

Примечания: а) АР означает приращение значения свойства при удлинении углеводородной цепочки на одну СНг-группу; б) ААР - изменение приращения свойства при каждом удлинении.

Из таблицы 4.2.1 следует, что при удлинении углеводородной цепочки на одну СНг-группу, в корреляционное уравнение добавляется один дополнительный параметр. Количество параметров корреляционного соотношения можно существенно уменьшить, если предположить, что парные вклады отражают взаимодействие фрагментов и зависят от расстояния между ними, и попытаться найти аналитическое выражение для описания этого взаимодействия. Расстояние между фрагментами в таком случае можно трактовать в геометрическом или топологическом смысле. Для геометрических расстояний (измеряемых, например, в А) существенно знание или предпочтительной конформации, или, если соединение существует в виде смеси конформеров, распределения по конформациям. Более упрощенно можно рассматривать расстояния в топологическом смысле и измерять их числом связей, разделяющих фрагменты в молекулярном скелете. Например, хорошее совпадение расчетных оценок и экспериментальных значений получается при использовании в соотношении (3.1.1) экспоненциальной функции для расчета парных 5 вкладов. Выражение для свойства нормальных углеводородов с использованием экспоненциальной функции для дальних взаимодействий имеет вид [144, 145]: Р = па+ (п-1)Р + (п-2)у+ Y,K expHr2(r,.7. -3)) (4.2.1)

Здесь а, р, у, к\, к2 являются параметрами корреляционного уравнения, которые определяются по известным экспериментальными данным; r(j -топологическое расстояние между фрагментами, равное числу ребер на кратчайшем пути от вершины і до вершины/ на молекулярном графе. Суммирование проводится по всем возможным парам фрагментов. При таком выборе функции взаимодействия соответствующие "дальние" вклады равняются 8i4=kb 515=к,ехр(-к2)) 5іб=к1ехр(-2к2) и т.д.

Соотношение (4.2.1), выведенное для фрагментного представления молекулярной структуры, может быть использовано для расчета разных свойств. Полученные в таком приближении оценки некоторых свойств нормальных углеводородов [146] приведены в таблице 4.2.2. Из данных таблицы 4.2.2 следует, что корреляционное соотношение (4.2.1) передает различные свойства линейных алканов с хорошей точностью. Таблица 4.2.2.

Примечания: а) в расчете теплоёмкости и энтропии образования значения коэффициентов к\ и кг оказались статистически незначимыми. Таким образом, для расчета температуры кипения, теплоёмкости, энтропии образования и других (см. раздел 4.2.2.) физико -химических свойств нормальных углеводородов пригодно простое корреляционное соотношение (4.2.1), учитывающее только однофрагментные вклады и усредненные по конформациям молекул парные вклады взаимодействий фрагментов. В этом соотношении для явного описания парных вкладов используется экспоненциальная зависимость от топологического расстояния между молекулами.

Похожие диссертации на Корреляционные модели для расчета физико-химических свойств и биологической активности органических соединений