Содержание к диссертации
Введение
1. О мере приближения числа 7Г алгебраическими числами 13
1. Вспомогательные леммы 13
2. Доказательство теоремы 1 19
2. Линейные формы от логарифмов алгебраических чисел 25
1. Лемма о нулях 27
2. Многочлены Гильберта 29
3. Многочлены Гильберта и количество точек решетки 32
4. Логарифмические высоты 35
5. Лемма Зигеля и дискриминант алгебраического поля 36
6. Неравенство Лиувилля 37
7. Вспомогательные многочлены 39
8. Индуктивное предположение 42
9. Построение вспомогательных функций 44
10. Приближающие функции 54
11. Алгебраическая оценка снизу 58
12. Оценка производных 62
13. Конечные произведения Бляшке 67
14. Индуктивный процесс экстраполяции 69
15. Последний шаг: Использование леммы о нулях 78
Список литературы 82
- Доказательство теоремы 1
- Неравенство Лиувилля
- Алгебраическая оценка снизу
- Последний шаг: Использование леммы о нулях
Введение к работе
Результаты настоящей диссертации относятся к теории трансцендентных чисел. Первая глава посвящена оценке меры приближения числа 7г алгебраическими числами и, как следствие, оценке меры трансцендентности числа тт. Напомним, что мерой приближения некоторого числа в Є С алгебраическими числами называется функция <&{0,L,d) = min|0 — |, где L = L() - длина числа С (сумма модулей коэффициентов основного многочлена для ) и d = degC - степень числа (степень основного многочлена для ), а min берется по всем алгебраическим числа , () < L, deg^) < d. Чаще всего найти точно функцию Ф(в, L, d) сложно, поэтому часто говорят об оценке меры приближения, т.е. об оценке функции Ф(0, L, d). Во всей работе константы, для которых имеется способ вычисления, мы будем называть эффективными, а константы, про которые мы знаем только их существование, но не можем найти, будем называть не эффективными. Также во всей работе под log а, а Є R+ понимается натуральный логарифм числа а, если же а $ R+> то log а - некоторая фиксированная ветвь натурального логарифма.
Число 7г - один из классических объектов в исследованиях оценок мер приближения алгебраическими числами. Первыми работами по этой теме были работы Я.Попкена [34] 1929 года и К.Малера [22],[23] 1953 года. В частности Попкен доказал, что
Для любого С Є A, L(0 < L, deg^) < d выполнено неравенство
\n-(\>e-log2L\
здесь L > L\, L\ - абсолютная постоянная, ас — c(d) > 0 - некоторая явно не указанная эффективная постоянная, зависящая только от d.
Далее исторически следуют работы Н.И.Фельдмана [47],[48], в которых он, применяя в этом вопросе один из методов А.О.Гельфонда, дал лучшую на тот момент оценку меры приближения числа 7г алгебраическими числами:
Существует такая эффективная абсолютная постоянная С, что для любого Є A, deg < d, () < L, L > 3, выполняется неравенство
1^. _ /-1 > e-Cd(logL+dlogd)(l+logd)
Точное значение константы С в этой теореме не вычислялось, однако указывалось, что ее нетрудно вычислить. Эту же самую теорему через 17 лет
в работе [15] передоказал Л.Цайсув. В дальнейшем Н.И.Фельдманом была опубликована работа [52], в которой доказывалось, что константу С в теореме можно взять равной 389, однако при условии достаточно большого L. В работе М.Вальтшмидта и Ю.В.Нестеренко [42] доказана некоторая общая теорема и указано, что частным случаем ее является оценка теоремы 2 с константой равной 1,25 106, эта константа хотя и больше чем 389, однако она получена без каких либо ограничений на параметры L и d. Основным результатом главы 1 диссертации является следующий результат:
ТЕОРЕМА.Пусть С,— алгебраическое число, а действительные числа d и L удовлетворяют неравенствам d > degC, L > L(Q, L > 3. Тогда если d достаточно велико, то выполняется неравенство
|тг - С| > ехр(-21,4708 d(\ogL + dlogd) (1 + logtf)).
Для доказательства этой теоремы применяется техника интерполяционных определителей, предложенная М.Лораном в работах [20] и [21].
Вторая глава диссертации посвящена оценке линейных форм от логарифмов алгебраических чисел. Первые результаты в этой области были получены в связи с решением седьмой проблемы Гильберта А.О.Гельфондом [43] и Т.Шнейдером [35] в 1934 году. Как известно, седьмая проблема Гильберта заключается в доказательстве утверждения, что число а^ (при алгебраическом а ф 0; 1 и алгебраическом иррациональном /?) - трансцендентно. Этот же факт можно сформулировать иначе: доказать, что если отношение log «i/log о^ фиксированных ветвей логарифмов алгебраических чисел <*ъ а2 Ф 0 иррационально, то оно трансцендентно. Гельфонд усилил эту теорему и в работе [44] получил оценку снизу для величины |logai/loga2 — СІ в зависимости от характеристик С Є А, т.е. доказал оценку меры приближения log ai/log «2 алгебраическими числами. Для седьмой проблемы Гильберта возможно дать и третью эквивалентную формулировку: доказать, что если линейная форма Ь\ log ol\ Л- &2 log «2 от фиксированных ветвей логарифмов алгебраических чисел с*і,а2 Ф 0 не равна нулю при любых рациональных ЬъЬ2, |&і| + |&2І > 0, то она не равна нулю при любых алгебраических 61,62 также не равных нулю одновременно. А.О.Гельфонд в 1939 году показал, что методами, сходными с теми, которыми было получено решение седьмой проблемы Гильберта, можно в некоторой степени усилить последнюю формулировку. А именно: доказать, что если равенство Ь\ log а\ + hi log «2 = 0 невозможно при рациональных не равных нулю одновременно 6j, то выра-
жение |&ilogai + 62 log аг I > оценивается снизу эффективной, зависящей от характеристик чисел Ь{ и а», величиной (здесь как и ранее 61,62 - алгебраические, а аь«2 - ненулевые алгебраические числа). Следующая теорема доказанная Н.И.Фельдманом (см. [51]) улучшает полученную ранее оценку А. О. Гельфонда.
Пусть а, /З Є A, a log a, log (3 - фиксированные значения логарифмов, bilogo; + 62log/? Ф 0 при любых не равных нулю одновременно рациональных 6i,&2- Тогда существует такая эффективная постоянная к = /c(a,/3,loga,log/3) > 0, что для любых С, Т] Є А, || + \г}\ > О, deg < щ, degyj < П2, L(Q < Li, L(tj) < L2, degQ(C,7/) = n выполняется неравенство
|C log a + n log p\ > exp (-КП4 Hogn + ^^- + ^^ J (1 + logn)"3 J .
Здесь, как и ранее, L(C) и L(rj) - длины и -ц.
В 1949 году А.О.Гельфонд в работе [45] указал, как можно использовать подобного рода оценки для полного решения или ограничения области поиска решений широкого класса диофантовых уравнений и применил свои оценки в работах [45],[18] к решению диофантовых уравнений особого вида. Применение подобных оценок к другим вопросам см. [54],[36],[46]. Однако, как показал Гельфонд, для значительного расширения области применения оценок линейных форм необходимо получить эффективные оценки снизу модуля линейной формы от произвольного числа логарифмов алгебраических чисел, т.е. выражений вида:
|bi log ai + ... + &„ log an|, (1)
Отметим, что выражение (1) можно оценить используя обобщение одного неравенства (см. лемма 7, глава 2), доказанного Лиувиллем еще в 1844 году. Однако эта оценка, обычно называемая "тривиальной", слаба и не применима к исследованию диофантовых уравнений. Сам А.О.Гельфонд дал нетривиальную оценку (1), однако эта оценка была не эффективна, т.е. метод доказательства не позволял вычислить константу, присутствующую в этой оценке и, тем самым, оценку невозможно было применять для конкретных вычислений.
Задача о нетривиальной и эффективной оценке выражения (1), оставалась долгое время не решенной. В 1966 году А.Бейкер, развивая идеи Гельфонда, в работах [1] решил поставленную Гельфондом задачу. Одним из основных его результатов является следующая теорема:
Пусть К - алгебраическое поле степени d, а\,...,ап Є К, при этом logai,... ,logan - произвольные, однако фиксированные значения логариф-
мов. Тогда существует С — С(а\, ...,an,logai, ...,logan,n,d, к) > 0 - эффективная постоянная, такая что для любых &i,..., bn Є Ъ, с условием
|6ilogQ!i + ... + b„logan| ^0,
выполняется неравенство
l^logd + ... + &n log с*„| > е-с^в)\
где к> n -f 1 и В = max(|6i|,..., |6П|).
В дальнейшем А.Бейкер опубликовал целую серию работ по усилению и применению полученной оценки выражения (1) к разным вопросам в теории чисел (см. [2],[3],[4]). В частности, им была получена теорема о границе для решений уравнения Туэ, то есть результат, утверждающий, что все целые решения X, Y уравнения
/(я,) = М,
где f(x,y) - неприводимая бинарная форма степени п > 3, удовлетворяют неравенству:
|Х| + |У| < 7e(Iogil/)A.
Здесь Л - любое постоянное число, большее, чем п -Ы, а 7 = т(/> ^) - эффективная постоянная.
После результатов Бейкера было опубликовано большое количество работ (некоторые из них описаны ниже), улучшавших полученные результаты и применявших оценки (1) к различным задачам теории чисел. За свои работы в 1970 А.Бейкер был удостоен премии Филдса международного союза математиков.
Отметим работу Н.И.Фельдмана [50], который существенно улучшил оценки Бейкера и доказал несколько замечательных результатов. В частности, он получил эффективное степенное усиление теоремы Лиувилля о приближении алгебраических чисел рациональными числами. Одна из основных теорем работы [50] дает оценку:
IMogax + ... + b„logan| > е~СІО&в,
где В = max(|6i|,..., |6n|).
В теореме Н.И.Фельдмана величина logB в показателе присутствует в первой степени, что как раз и дало возможность доказать эффективное усиление теоремы Лиувилля. Впоследствии было опубликовано много работ по
этой тематике с различными техническими нововведениями. Здесь стоит отметить работы М.Вальтшмидта, А. ван дер Поортен, А.Локстона, X. Старка, Н.И.Фельдмана и многих других авторов.
Отметим, что доказанные в разных работах оценки линейных форм от логарифмов нашли широкое применение в различных областях теории чисел. Как уже упоминалось, А.Бейкером была дана граница для решений уравнений Туэ. Р.Тайдеман в работе [37] получил эффективную границу сверху для целых решений (x,y,p,q) уравнения Каталана:
хр - yq = 1, х > 1, у > 1, р > 1, q > 1, (2)
имеющего двухсотлетнюю историю. В дальнейшем линейные формы от логарифмов алгебраических чисел позволили Михайлеску (см. [29]) полностью доказать гипотезу Каталана, о том, что уравнение (2) имеет единственное решение: x = q = S, у=р = 2.
Оценки линейных форм от логарифмов применялись также в задачах, связанных с проблемой о существовании десятого одноклассного мнимого квадратичного поля. Оценка линейной формы от трех логарифмов была использована А.Бейкером и Х.Старком (см. [5],[6],[7]) для вычисления эффективной границы для дискриминантов всех мнимых квадратичных полей с двумя классами идеалов. В многочисленных работах Китеса, Коатеса, Котова, ван дер Поортена, Спринджука, Старка, Стюарта, Тайдемана, Шинцеля, Шорея получены оценки снизу наибольших простых делителей значений в целых точках многочленов от одного и двух переменных. Указанные приложения составляют малую часть всех вышедших на эту тему работ.
Общая схема рассуждений при доказательстве оценок линейных форм от логарифмов алгебраических чисел была предложена еще Гельфондом. Потом она была доработана Бейкером. Суть ее состоит в том, что строится одна или несколько вспомогательных функций вида
fi w = Е Е Е *(Аь -. а„)*Х1Ж «J-*.
Ao=OAi=0 Ап=0
где p»(Ai,..., An) - некоторые алгебраические числа. Эти pi(Xi,..., Ап) выбираются так, чтобы функции обращались в ноль в целых точках 0 < s < S с некоторой кратностью. Далее, предполагая что модуль выражения (1) достаточно мал, эти функции экстраполируются. Так принято называть некоторую арифметико-аналитическую процедуру, позволяющую расширить известное нам множество нулей этих функций. Экстраполяция проводится поэтапно. На
каждом шаге мы к тому же переходим к функциям, содержащим меньшее количество чисел «і,..., ап. На последнем шаге возникает многочлен от одной переменной г, имеющий много нулей. Используя последнее, удается доказать что он тождественно равен нулю, и получить противоречие доказывающее оценку снизу для модуля (1).
Большинство соображений, за счет которых удавалось улучшить оценку Бейкера, либо видоизменяли вспомогательные функции, либо предлагали новые приемы при экстраполяции (см. главу 2 параграф 14). На завершающем шаге доказательства этих теорем всегда получался многочлен от одной переменной, имеющий нулей больше, чем его степень. Однако для получения такого многочлена приходилось экстраполировать исходные функции на слишком широкую область. В связи с большим числом шагов экстраполяции возникают огромные константы, осложняющие применение получающихся оценок ко многим вопросам. Чтобы избежать большого числа шагов экстраполяции, необходим результат об ограниченности количества нулей в зависимости от степеней многочлена уже от нескольких переменных. Доказать ограниченность числа нулей многочлена от нескольких переменных в зависимости от его степеней в общем случае невозможно, однако, если нули обладают некоторой групповой структурой, то такую оценку можно получить. Одна из первых работ по этой теме опубликована Д.Массером [24] в 1981 году (основывалась на еще более ранней работе Ю.В.Нестеренко [30]). Оценки количества и кратностей нулей (как их впоследствии стали называть) многочленов от нескольких переменных были опубликованы Д.Массером и Д.Броунвеллом [12],[13], а также Д.Массером и Г.Вюстхольцем [25]. В 1986 году подытожил эти исследования П.Филиппон, см. [32]. Доказательства этих теорем использовали методы алгебраической геометрии.
Утверждения о количестве нулей возникли в связи с задачами трансцендентности и алгебраической независимости чисел. Первым, кто смог применить их именно в оценках линейных форм, был Г.Вюстхольц (см. [41]). Оценка линейной формы, данная в его работе, имела вид:
|L(log(«i), ...,log(o!n))| > exp (-c(rc,d) li(L)li(ai) ... h'(an)j ,
где c(n, d) - некоторая эффективная постоянная зависящая только от п и d, h'(a) = max(h(a),' |а', ^) - модифицированная высота Вейля, a h'(L) модифицированная высота линейной формы L.
Отметим, что использование высот h'(L) и h'(a) (основные свойства см. глава 2 параграф 4) появилось в этом вопросе еще до работы Г.Вюстхольца
и являлось просто удобным инструментом, немного упрощавшим выкладки в доказательстве основных теорем. Величина h (L) практически совпадает с logjB, a h (cti) близки к logL(aj). Точные формулировки см. например [40].
Константа c(n,d) не была подсчитана вовсе, таким образом результат Г.Вюстхольца был неприменим для конкретных вычислений; однако автором было указано, что использование леммы о нулях делает значение константы намного меньше, чем в предыдущих теоремах. Следует отметить также на тот период работу М.Вальтшмидта и П.Филиппона [31], которые, основываясь на упоминавшейся работе П.Филиппона [32], также смогли применить оценки кратностей нулей многочленов в теории линейных форм от логарифмов алгебраических чисел. Их результат, также как и теорема Вюстхольца, не давал значение константы. Отметим что работа Вальдшмидта и Филиппона отличалась от работы Вюстхольца несколько иным построением вспомогательных функций. Первой работой с точно подсчитанной оценкой, в доказательстве которой использовалась лемма о нулях, стала работа А.Бейкера и Г.Вюстхольца [8], где доказана теорема:
Пусть К. ~ алгебраическое поле конечной степени d, а\, ...,ап Є К, logai, ...,logan - произвольные, но фиксированные значения логарифмов. Тогда для любой линейной формы с целыми коэффициентами: L(xi,...,xn) = Ь\Х\ + ... + Ьпхп, Ьі Є Ъ, при условии L(log(ai), ---,1с^(а:п)) ф 0 выполняется неравенство
|(log(ai), ...,log(an))| > exp (-7
причем:
7 = 9 - 323(64)"n2n+1.
Здесь, как и ранее, h (а) - модифицированная высота Вейля, a h (L) модифицированная высота линейной формы L.
Следует отметить также работу Ю.В.Нестеенко и М.Вальтшмидта [42] об оценке линейной формы от двух логарифмов алгебраических чисел. В этой работе применялась техника интерполяционных определителей для построения вспомогательной функции (см. главу 1 диссертации), а также теорема об оценке количества и кратности нулей многочленов от двух переменных, доказанная Ю.В.Нестеренко элементарными методами. Это позволило получить малые константы при оценке линейной формы.
Отметим работы Е.М.Матвеева [27],[28] который элегантным приемом избавился от множителя п2п в теореме Бейкера и Вюстхольца, а также придумал ряд технических усовершенствований для доказательства своей теоремы, наилучшей на сегодняшний день:
Для любой линейной формы с целыми коэффициентами: L — bixi +... + bnxn, Ьі Є Ъ, при условии L(log(o!i), ...,log(c*n)) ф О выполняется неравенство
|L(lQg(ai), ...,log(an))| > exp (-7 (T+2\og(eB)A1 ... An\og(ed)),
причем:
В = maxd&il,..., |&n|), 7 = min (V*+2, ± Qen Y 30n+3n3'5) ,
A (u( \ 1І08^1 0'16A л
Ai — max І л(«і),—-—, —7- I , t = 1,...,n.
Здесь, как и ранее, h(a) - абсолютная логарифмическая высота Вейля алгебраического числа a, d = degQ(«i,..., ап).
Е.М.Матвеев также указал, что в теореме можно вместо В взять более
точное выражение В' — max I 1, max Щ—* I.
Во всех без исключения работах по линейным формам от логарифмов алгебраических чисел, использующих различные варианты лемм о нулях, делается технически сложный и громоздкий переход от многочленов Гильберта некоторых алгебраических групп (см. главу 2, параграфы 1 и 2), присутствующих в формулировках лемм о нулях, к оцениваемым величинам и обратно. Причем этот переход делается при каждом шаге экстраполяции (см. главу 2, параграф 14) и тем самым ухудшается основная оценка, а также и без того громоздкое доказательство еще более усложняется. Основная идея, на которой базируется глава 2 настоящей диссертации, это сохранить многочлен Гильберта во всех вычислениях, связанных с методом Бейкера, оставив его даже в формулировке основной теоремы (см. теорему 1 главы 2). Такая возможность появляется благодаря тождеству для многочленов Гильберта некоторых алгебраических групп (или связанных с ними целочисленных решеток в Шп доказанному в главе 2 (см. лемма 1 и лемма 3). Следующие ниже теоремы - основные результаты главы 2. Не уменьшая общности, мы будем предполагать в дальнейшем: \bn\h (ап) = max (ai).
ТЕОРЕМА. Пусть дана линейная форма Ь(х\, ...,#„) = b\X\ -f ... + bnxn с целыми коэффициентами Ьі ф О, b = (Ьі, ...,ЬП). Тогда для произвольной решетки А С Zn, dim Л = г, такой что b 6 Л и произвольных
не равных нулю сильно независимых чисел аі,...,ап Є А, при условии L(log(ai), ...,log(ojn)) = L ф 0 выполняется следующая оценка:
> -1(n,d)\ogB-H(A±]ti{a1),...,ti(an)),
7(n, d) = (5,3)"rax(n + l)(n + 8)2(n + 5)(7,86)r4n^^/.
Здесь if (Л-1; /і («і),..., /i (<*ra)) - значение многочлена Гильберта ортогональной решетки А1- в точке (h (c*i),..., h (схп)), число >с равно 1 если все числа log(ai), ..., log(an) - действительные и 2 если среди них есть комплексные,
В = тах( max (^Ц + ^ТгЦ^3)-
Определение многочлена Гильберта см. параграф 1 главы 2. Определение сильной независимости чисел смотри введение главы 2. Взяв в этой теореме Л = Zn получаем как частный случай этой теоремы следующий результат:
ТЕОРЕМА. Для произвольных ненулевых алгебраических чисел ct\, ...,ап> удовлетворяющих условию сильной независимости, и любой линейную формы с целыми ненулевыми коэффициентами: L(x\, ...,хп) = Ь\Х\ + ... + Ьпхп, при условии L — L(log(ai), ...,log(otn)) ф О выполняется неравенство:
log |Ь| > -y{n,d)\ogB-fi(cti)---1i(an)),
7(n,6) = е- (5,3) V^1 (га + l)(n + 8)2(n + 5)(31,5)ncT+2log(3rad).
Здесь к и В определены так лее, как и в предыдущей теореме.
В качестве параметра В в теоремах можно, уже без предположения \bn\h'(an) — max (аг), взять менее точное, однако более симметричное
выражение: В = max ( max ( ,\г ч + „',/' > ) , З І.
\idh (<*j) * (о*)/' у
Как легко видеть, предложенный подход дает новый вид оценки, включающий в себя многочлен Гильберта некоторой решетки Л с единственным огра-ничением Ь Л. Кроме этого, последняя теорема дает существенное улучшение оценки для маленьких га, что особенно часто используется в приложениях.
Кроме улучшения констант в этих теоремах получено качественное улучшение зависимости от величины коэффициентов линейной формы (параметр В). Важность именно такого вида параметра В продемонстрировал в недавней работе Билу [10].
Технический подход к доказательству теорем новый и основан на индукции по величине многочлена Гильберта решетки Л. При этом используется
новая конструкция вспомогательной функции и измененная шответетвуж»-щим образом процедура экстраполяции нулей. На заключительном этапе доказательства используются оценки Филиппона для количества нудей полинома на алгебраических группах.
Отметим, в заключение, что нумерация теорем, лемм и формул в каждой главе начинается заново, при этом в каждой главе ссылок на результаты другой главы нет.
Автор выражает глубокую признательность научному руководителю чл.-корр. РАН7 проф. Ю.В.Нестеренко за постановку задачи и постоянное внимание к работе.
Доказательство теоремы 1
Результаты настоящей диссертации относятся к теории трансцендентных чисел. Первая глава посвящена оценке меры приближения числа 7г алгебраическими числами и, как следствие, оценке меры трансцендентности числа тт. Напомним, что мерой приближения некоторого числа в Є С алгебраическими числами называется функция &{0,L,d) = min0 — , где L = L() - длина числа С (сумма модулей коэффициентов основного многочлена для ) и d = degC - степень числа (степень основного многочлена для ), а min берется по всем алгебраическим числа , () L, deg ) d. Чаще всего найти точно функцию Ф(в, L, d) сложно, поэтому часто говорят об оценке меры приближения, т.е. об оценке функции Ф(0, L, d). Во всей работе константы, для которых имеется способ вычисления, мы будем называть эффективными, а константы, про которые мы знаем только их существование, но не можем найти, будем называть не эффективными. Также во всей работе под log а, а Є R+ понимается натуральный логарифм числа а, если же а $ R+ то log а - некоторая фиксированная ветвь натурального логарифма. Число 7г - один из классических объектов в исследованиях оценок мер приближения алгебраическими числами. Первыми работами по этой теме были работы Я.Попкена [34] 1929 года и К.Малера [22],[23] 1953 года. В частности Попкен доказал, что Для любого С Є A, L(0 L, deg ) d выполнено неравенство здесь L L\, L\ - абсолютная постоянная, ас — c(d) 0 - некоторая явно не указанная эффективная постоянная, зависящая только от d. Далее исторически следуют работы Н.И.Фельдмана [47],[48], в которых он, применяя в этом вопросе один из методов А.О.Гельфонда, дал лучшую на тот момент оценку меры приближения числа 7г алгебраическими числами: Существует такая эффективная абсолютная постоянная С, что для любого Є A, deg d, () L, L 3, выполняется неравенство Точное значение константы С в этой теореме не вычислялось, однако указывалось, что ее нетрудно вычислить. Эту же самую теорему через 17 лет 3 в работе [15] передоказал Л.Цайсув.
В дальнейшем Н.И.Фельдманом была опубликована работа [52], в которой доказывалось, что константу С в теореме можно взять равной 389, однако при условии достаточно большого L. В работе М.Вальтшмидта и Ю.В.Нестеренко [42] доказана некоторая общая теорема и указано, что частным случаем ее является оценка теоремы 2 с константой равной 1,25 106, эта константа хотя и больше чем 389, однако она получена без каких либо ограничений на параметры L и d. Основным результатом главы 1 диссертации является следующий результат: ТЕОРЕМА.Пусть С,— алгебраическое число, а действительные числа d и L удовлетворяют неравенствам d degC, L L(Q, L 3. Тогда если d достаточно велико, то выполняется неравенство Для доказательства этой теоремы применяется техника интерполяционных определителей, предложенная М.Лораном в работах [20] и [21]. Вторая глава диссертации посвящена оценке линейных форм от логарифмов алгебраических чисел. Первые результаты в этой области были получены в связи с решением седьмой проблемы Гильберта А.О.Гельфондом [43] и Т.Шнейдером [35] в 1934 году. Как известно, седьмая проблема Гильберта заключается в доказательстве утверждения, что число а (при алгебраическом а ф 0; 1 и алгебраическом иррациональном /?) - трансцендентно. Этот же факт можно сформулировать иначе: доказать, что если отношение log «i/log о фиксированных ветвей логарифмов алгебраических чисел ъ а2 Ф 0 иррационально, то оно трансцендентно. Гельфонд усилил эту теорему и в работе [44] получил оценку снизу для величины logai/loga2 — СІ в зависимости от характеристик С Є А, т.е. доказал оценку меры приближения log ai/log «2 алгебраическими числами. Для седьмой проблемы Гильберта возможно дать и третью эквивалентную формулировку: доказать, что если линейная форма Ь\ log OL\ Л- &2 log «2 от фиксированных ветвей логарифмов алгебраических чисел с і,а2 Ф 0 не равна нулю при любых рациональных ЬъЬ2, &і + &2І 0, то она не равна нулю при любых алгебраических 61,62 также не равных нулю одновременно. А.О.Гельфонд в 1939 году показал, что методами, сходными с теми, которыми было получено решение седьмой проблемы Гильберта, можно в некоторой степени усилить последнюю формулировку. А именно: доказать, что если равенство Ь\ log а\ + hi log «2 = 0 невозможно при рациональных не равных нулю одновременно 6j, то выражение &ilogai + 62 log аг I оценивается снизу эффективной, зависящей от характеристик чисел Ь{ и а», величиной (здесь как и ранее 61,62 - алгебраические, а аь«2 - ненулевые алгебраические числа). Следующая теорема доказанная Н.И.Фельдманом (см. [51]) улучшает полученную ранее оценку А. О. Гельфонда.
Неравенство Лиувилля
В 1949 году А.О.Гельфонд в работе [45] указал, как можно использовать подобного рода оценки для полного решения или ограничения области поиска решений широкого класса диофантовых уравнений и применил свои оценки в работах [45],[18] к решению диофантовых уравнений особого вида. Применение подобных оценок к другим вопросам см. [54],[36],[46]. Однако, как показал Гельфонд, для значительного расширения области применения оценок линейных форм необходимо получить эффективные оценки снизу модуля линейной формы от произвольного числа логарифмов алгебраических чисел, т.е. выражений вида: Отметим, что выражение (1) можно оценить используя обобщение одного неравенства (см. лемма 7, глава 2), доказанного Лиувиллем еще в 1844 году. Однако эта оценка, обычно называемая "тривиальной", слаба и не применима к исследованию диофантовых уравнений. Сам А.О.Гельфонд дал нетривиальную оценку (1), однако эта оценка была не эффективна, т.е. метод доказательства не позволял вычислить константу, присутствующую в этой оценке и, тем самым, оценку невозможно было применять для конкретных вычислений. Задача о нетривиальной и эффективной оценке выражения (1), оставалась долгое время не решенной. В 1966 году А.Бейкер, развивая идеи Гельфонда, в работах [1] решил поставленную Гельфондом задачу. Одним из основных его результатов является следующая теорема: Пусть К - алгебраическое поле степени d, а\,...,ап Є К, при этом logai,... ,logan - произвольные, однако фиксированные значения логариф- мов. Тогда существует С — С(а\, ...,an,logai, ...,logan,n,d, к) 0 - эффективная постоянная, такая что для любых &i,..., bn Є Ъ, с условием выполняется неравенство где к n -f 1 и В = max(6i,..., 6П). В дальнейшем А.Бейкер опубликовал целую серию работ по усилению и применению полученной оценки выражения (1) к разным вопросам в теории чисел (см. [2],[3],[4]). В частности, им была получена теорема о границе для решений уравнения Туэ, то есть результат, утверждающий, что все целые решения X, Y уравнения где f(x,y) - неприводимая бинарная форма степени п 3, удовлетворяют неравенству: Здесь Л - любое постоянное число, большее, чем п -Ы, а 7 = т(/ ) - эффективная постоянная. После результатов Бейкера было опубликовано большое количество работ (некоторые из них описаны ниже), улучшавших полученные результаты и применявших оценки (1) к различным задачам теории чисел. За свои работы в 1970 А.Бейкер был удостоен премии Филдса международного союза математиков.
Отметим работу Н.И.Фельдмана [50], который существенно улучшил оценки Бейкера и доказал несколько замечательных результатов. В частности, он получил эффективное степенное усиление теоремы Лиувилля о приближении алгебраических чисел рациональными числами. Одна из основных теорем работы [50] дает оценку: где В = max(6i,..., 6n). В теореме Н.И.Фельдмана величина logB в показателе присутствует в первой степени, что как раз и дало возможность доказать эффективное усиление теоремы Лиувилля. Впоследствии было опубликовано много работ по этой тематике с различными техническими нововведениями. Здесь стоит отметить работы М.Вальтшмидта, А. ван дер Поортен, А.Локстона, X. Старка, Н.И.Фельдмана и многих других авторов. Отметим, что доказанные в разных работах оценки линейных форм от логарифмов нашли широкое применение в различных областях теории чисел. Как уже упоминалось, А.Бейкером была дана граница для решений уравнений Туэ. Р.Тайдеман в работе [37] получил эффективную границу сверху для целых решений (x,y,p,q) уравнения Каталана: имеющего двухсотлетнюю историю. В дальнейшем линейные формы от логарифмов алгебраических чисел позволили Михайлеску (см. [29]) полностью доказать гипотезу Каталана, о том, что уравнение (2) имеет единственное решение: x = q = S, у=р = 2. Оценки линейных форм от логарифмов применялись также в задачах, связанных с проблемой о существовании десятого одноклассного мнимого квадратичного поля. Оценка линейной формы от трех логарифмов была использована А.Бейкером и Х.Старком (см. [5],[6],[7]) для вычисления эффективной границы для дискриминантов всех мнимых квадратичных полей с двумя классами идеалов. В многочисленных работах Китеса, Коатеса, Котова, ван дер Поортена, Спринджука, Старка, Стюарта, Тайдемана, Шинцеля, Шорея получены оценки снизу наибольших простых делителей значений в целых точках многочленов от одного и двух переменных. Указанные приложения составляют малую часть всех вышедших на эту тему работ. Общая схема рассуждений при доказательстве оценок линейных форм от логарифмов алгебраических чисел была предложена еще Гельфондом.
Потом она была доработана Бейкером. Суть ее состоит в том, что строится одна или несколько вспомогательных функций вида где p»(Ai,..., An) - некоторые алгебраические числа. Эти pi(Xi,..., Ап) выбираются так, чтобы функции обращались в ноль в целых точках 0 s S с некоторой кратностью. Далее, предполагая что модуль выражения (1) достаточно мал, эти функции экстраполируются. Так принято называть некоторую арифметико-аналитическую процедуру, позволяющую расширить известное нам множество нулей этих функций. Экстраполяция проводится поэтапно. На каждом шаге мы к тому же переходим к функциям, содержащим меньшее количество чисел «і,..., ап. На последнем шаге возникает многочлен от одной переменной г, имеющий много нулей. Используя последнее, удается доказать что он тождественно равен нулю, и получить противоречие доказывающее оценку снизу для модуля (1). Большинство соображений, за счет которых удавалось улучшить оценку Бейкера, либо видоизменяли вспомогательные функции, либо предлагали новые приемы при экстраполяции (см. главу 2 параграф 14). На завершающем шаге доказательства этих теорем всегда получался многочлен от одной переменной, имеющий нулей больше, чем его степень. Однако для получения такого многочлена приходилось экстраполировать исходные функции на слишком широкую область. В связи с большим числом шагов экстраполяции возникают огромные константы, осложняющие применение получающихся оценок ко многим вопросам. Чтобы избежать большого числа шагов экстраполяции, необходим результат об ограниченности количества нулей в зависимости от степеней многочлена уже от нескольких переменных. Доказать ограниченность числа нулей многочлена от нескольких переменных в зависимости от его степеней в общем случае невозможно, однако, если нули обладают некоторой групповой структурой, то такую оценку можно получить. Одна из первых работ по этой теме опубликована Д.Массером [24] в 1981 году (основывалась на еще более ранней работе Ю.В.Нестеренко [30]). Оценки количества и кратностей нулей (как их впоследствии стали называть) многочленов от нескольких переменных были опубликованы Д.Массером и Д.Броунвеллом [12],[13], а также Д.Массером и Г.Вюстхольцем [25]. В 1986 году подытожил эти исследования П.Филиппон, см. [32]. Доказательства этих теорем использовали методы алгебраической геометрии.
Алгебраическая оценка снизу
Отметим, что использование высот h (L) и h (a) (основные свойства см. глава 2 параграф 4) появилось в этом вопросе еще до работы Г.Вюстхольца и являлось просто удобным инструментом, немного упрощавшим выкладки в доказательстве основных теорем. Величина h (L) практически совпадает с logjB, a h (cti) близки к logL(aj). Точные формулировки см. например [40]. Константа c(n,d) не была подсчитана вовсе, таким образом результат Г.Вюстхольца был неприменим для конкретных вычислений; однако автором было указано, что использование леммы о нулях делает значение константы намного меньше, чем в предыдущих теоремах. Следует отметить также на тот период работу М.Вальтшмидта и П.Филиппона [31], которые, основываясь на упоминавшейся работе П.Филиппона [32], также смогли применить оценки кратностей нулей многочленов в теории линейных форм от логарифмов алгебраических чисел. Их результат, также как и теорема Вюстхольца, не давал значение константы. Отметим что работа Вальдшмидта и Филиппона отличалась от работы Вюстхольца несколько иным построением вспомогательных функций. Первой работой с точно подсчитанной оценкой, в доказательстве которой использовалась лемма о нулях, стала работа А.Бейкера и Г.Вюстхольца [8], где доказана теорема: Пусть К. алгебраическое поле конечной степени d, а\, ...,ап Є К, logai, ...,logan - произвольные, но фиксированные значения логарифмов. Тогда для любой линейной формы с целыми коэффициентами: L(xi,...,xn) = Ь\Х\ + ... + Ьпхп, Ьі Є Ъ, при условии L(log(ai), ---,1с (а:п)) ф 0 выполняется неравенство причем: Здесь, как и ранее, h (а) - модифицированная высота Вейля, a h (L) модифицированная высота линейной формы L. Следует отметить также работу Ю.В.Нестеенко и М.Вальтшмидта [42] об оценке линейной формы от двух логарифмов алгебраических чисел. В этой работе применялась техника интерполяционных определителей для построения вспомогательной функции (см. главу 1 диссертации), а также теорема об оценке количества и кратности нулей многочленов от двух переменных, доказанная Ю.В.Нестеренко элементарными методами. Это позволило получить малые константы при оценке линейной формы.
Отметим работы Е.М.Матвеева [27],[28] который элегантным приемом избавился от множителя п2п в теореме Бейкера и Вюстхольца, а также придумал ряд технических усовершенствований для доказательства своей теоремы, наилучшей на сегодняшний день: Для любой линейной формы с целыми коэффициентами: L — bixi +... + bnxn, ЬІ Є Ъ, при условии L(log(o!i), ...,log(c n)) ф О выполняется неравенство причем: Здесь, как и ранее, h(a) - абсолютная логарифмическая высота Вейля алгебраического числа a, d Е.М.Матвеев также указал, что в теореме можно вместо В взять более точное выражение В — max I 1, max Щ— I. Во всех без исключения работах по линейным формам от логарифмов алгебраических чисел, использующих различные варианты лемм о нулях, делается технически сложный и громоздкий переход от многочленов Гильберта некоторых алгебраических групп (см. главу 2, параграфы 1 и 2), присутствующих в формулировках лемм о нулях, к оцениваемым величинам и обратно. Причем этот переход делается при каждом шаге экстраполяции (см. главу 2, параграф 14) и тем самым ухудшается основная оценка, а также и без того громоздкое доказательство еще более усложняется. Основная идея, на которой базируется глава 2 настоящей диссертации, это сохранить многочлен Гильберта во всех вычислениях, связанных с методом Бейкера, оставив его даже в формулировке основной теоремы (см. теорему 1 главы 2). Такая возможность появляется благодаря тождеству для многочленов Гильберта некоторых алгебраических групп (или связанных с ними целочисленных решеток в Шп доказанному в главе 2 (см. лемма 1 и лемма 3). Следующие ниже теоремы - основные результаты главы 2. Не уменьшая общности, мы будем предполагать в дальнейшем: \bn\h (ап) = max \bi\h (ai). ТЕОРЕМА. Пусть дана линейная форма Ь(х\, ...,#„) = b\X\ -f ... + bnxn с целыми коэффициентами ЬІ ф О, b = (Ьі, ...,ЬП). Тогда для произвольной решетки А С Zn, dim Л = г, такой что b 6 Л и произвольных не равных нулю сильно независимых чисел аі,...,ап Є А, при условии L(log(ai), ...,log(ojn)) = L ф 0 выполняется следующая оценка: Здесь if (Л-1; /і («і),..., /i ( ra)) - значение многочлена Гильберта ортогональной решетки А1- в точке (h (c i),..., h (схп)), число с равно 1 если все числа log(ai), ..., log(an) - действительные и 2 если среди них есть комплексные, Определение многочлена Гильберта см. параграф 1 главы 2.
Определение сильной независимости чисел смотри введение главы 2. Взяв в этой теореме Л = Zn получаем как частный случай этой теоремы следующий результат: ТЕОРЕМА. ДЛЯ произвольных ненулевых алгебраических чисел ct\, ...,ап удовлетворяющих условию сильной независимости, и любой линейную формы с целыми ненулевыми коэффициентами: L(x\, ...,хп) = Ь\Х\ + ... + Ьпхп, при условии L — L(log(ai), ...,log(otn)) ф О выполняется неравенство: Здесь к и В определены так лее, как и в предыдущей теореме. В качестве параметра В в теоремах можно, уже без предположения \bn\h (an) — max \bi\h (аг), взять менее точное, однако более симметричное выражение: В = max ( max ( ,\г ч + „ ,/ ) , З І. Как легко видеть, предложенный подход дает новый вид оценки, включающий в себя многочлен Гильберта некоторой решетки Л с единственным огра-ничением Ь Л. Кроме этого, последняя теорема дает существенное улучшение оценки для маленьких га, что особенно часто используется в приложениях. Кроме улучшения констант в этих теоремах получено качественное улучшение зависимости от величины коэффициентов линейной формы (параметр В). Важность именно такого вида параметра В продемонстрировал в недавней работе Билу [10]. Технический подход к доказательству теорем новый и основан на индукции по величине многочлена Гильберта решетки Л. При этом используется новая конструкция вспомогательной функции и измененная шответетвуж»-щим образом процедура экстраполяции нулей. На заключительном этапе доказательства используются оценки Филиппона для количества нудей полинома на алгебраических группах. Отметим, в заключение, что нумерация теорем, лемм и формул в каждой главе начинается заново, при этом в каждой главе ссылок на результаты другой главы нет. Автор выражает глубокую признательность научному руководителю чл.-корр. РАН7 проф. Ю.В.Нестеренко за постановку задачи и постоянное внимание к работе.
Последний шаг: Использование леммы о нулях
Следующие понятия и соглашения необходимы нам на протяжении всей главы: Пусть Л С Zn - решетка ранга г (0 г п) и V - подпространство в Шп размерности г, порождаемое решеткой Л. Ортогональная решетка Лх определяется равенством Лх = VL[\Xn. Определение ортогональной решетки зависит лишь от подпространства V. Для Л С Zn определен ее многочлен Гильберта Я (Л; Х\,..., Хп) - это однородный многочлен от п переменных с целыми неотрицательными коэффициентами. Степень его по этим переменным равна п — г. Подробно это понятие обсуждается в параграфах 1 и 2. Для тривиальной решетки Л = 0 многочлен Гильберта имеет вид: Наше определение многочлена Гильберта отличается от определения, введенного в работе [31] отсутствием множителя (п—г)\. Пусть а\, а «п Є А, где А - множество всех алгебраических чисел, и пусть поле К = Q(ai,..., ап) имеет степень d. Пусть также log«i,..., log ап - фиксированные значения логарифмов. Для алгебраического числа а его модифицированная логарифмическая высота К {а) определена равенством ti(a) = max [h(a), а , jU, где h(a) -абсолютная логарифмическая высота Вейля, свойства которой напоминаются в параграфе 4. Для простоты изложения основная теорема будет доказана в предположении сильной независимости чисел c i,...,a:n; это означает, что степень поля Q(y/oii,..., у/оїп) над полем Q(ai,...,aft) равна 2", т.е. своему наибольшему возможному значению. Такое ограничение на числа ai,...,an вполне естественно, так как в большинстве приложений сильная независимость выполняется, а в общем случае это ограничение можно снять, используя прием, указанный Е.М.Матвеевым в работе [28]. Не уменьшая общности, мы будем предполагать в дальнейшем, что \bn\h (ап) = max \bi\h (аА. Далее следует 1 г п основной результат настоящей главы. ТЕОРЕМА 1. Пусть дана линейная форма L(x\,..., хп) b\Xi + ... + bnxn с целыми коэффициентами bi ф О, b — (Ьі,...,Ь„). Тогда для произвольной решетки Л С Zn, dim Л = г, такой что b Є Л и произвольных сильно независимых не равных нулю чисел аі,...,ап Є А, при условии что L = 2/(log(ai),...,log(an)) Ф 0, выполняется следующая оценка: Здесь Н(А±; h («і),..., h (cxn)) - значение многочлена Гильберта ортогональной решетки Л1 в точке (ti(ai),...,ti(an)). Величина U — "Хьі , число к равно 1, если все числа log(a:i), ...,log(an) - действительные, и 2, если среди них есть комплексные.
Параметр В определен равенством: В = тах[ max Г тЧ+ Ц),3}. В случае, когда Л = Zn, а следовательно Л1 = 0 и г = я, как уже упоминалось выше, значение многочлена Гильберта решетки в точке h (OJI), ..., h (ап) определяется равенством ЯСЛ-1; Л (аі),..., h\on)) = Л (аі) - h (an). Вследствие этого замечания прямым следствием ТЕОРЕМЫ 1 является: ТЕОРЕМА 2. Для произвольных ненулевых алгебраических чисел ai,...,an, удовлетворяющих условию сильной независимости, и любой линейной формы с целыми ненулевыми коэффициентами: L(x\,..., хп) = &i#i + ... + bnxn, при условии L L(log(ai), ...,log(o;n)) ф 0 выполняется неравенство: Здесь х и В определены так же, как и в теореме 1. В качестве параметра В в Теоремах 1 и 2 можно, уже без предположения \bn\h (ап) = max \bi\h (аг), взять менее точное, однако более симметричное выражение: В = max (max (j + ) , 3 J. Глава 2 организована следующим образом: после формулировки основной теоремы идет параграф первый, в котором обсуждается упоминавшаяся во введении лемма о нулях. Далее во втором параграфе доказывается несколько свойств многочленов Гильберта, тесно связанных с леммой о нулях. Параграф третий содержит результат, касающийся оценки числа точек решетки в некотором параллелепипеде; этот результат необходим при построении вспомогательных функций. В следующем параграфе напоминаются определение и некоторые свойства логарифмической высоты Вейля и связанные с ней факты. Параграф пятый содержит лемму Зигеля об оценке решений систем линейных уравнений и формулировку одной оценки дискриминанта алгебраического поля. В шестом параграфе приводится без доказательства известное неравенство Лиувилля в терминах логарифмических высот. В седьмом параграфе обсуждаются свойства полиномов Фельдмана и близкие к ним вопросы. И, наконец, в восьмом параграфе формулируется индуктивное предположение и объясняется ход доказательства Теоремы 1. Этим параграфом завершается подготовительная часть работы и со следующего параграфа начинается изложение непосредственно самого доказательства, которое в основном следует методу Бейкера [1]. Автор выражает глубокую признательность проф.Ю.В.Нестеренко за внимание и помощь в работе, без которых она, по видимому, могла не состояться. А также д.ф.м.н. Е.М.Матвееву за целый ряд полезных замечаний. В последнее время было опубликовано много работ об оценке количества и кратности нулей многочленов на алгебраических группах. Здесь следует назвать имена Д.Массера, а также Д.Броунвелла и Г.Вюстхольца. Мы будем пользоваться результатом П.Филиппона, доказавшего в 1986 году (см. [32]) общий результат, касающийся такого рода оценок. Некоторый частный случай этой общей теоремы указан в работе [31]. Так как именно этот частный случай мы будем использовать, то после введения необходимых определений сформулируем его в виде леммы (лемма 2).
Обсудим подробно понятие многочлена Гильберта произвольной решетки Леї". Пусть решетка Л размерности г порождается векторами: Как уже отмечалось во Введении, основная идея главы 2 - использовать многочлен Гильберта во всех оценках, связанных с методом Бейкера, освободившись от искусственного перехода от многочленов Гильберта к их оценкам и обратно. Следующая лемма - одно из замечательных свойств многочленов Гильберта - во многом помогает осуществить эту идею. ЛЕММА 3. Пусть Л С Z" примитивная решетка размерности г, Л = Vf]Xn, где V некоторое подпространство в Жп. Ортогональная решетка размерности п — г определена равенством А1- = Vа f)%n, здесь Vх ортогональное дополнение к подпространству V. Рассмотрим произвольные действительные числа D и hi ф О, 1 г п, а также числа ,- = J2-. Тогда справедливо равенство: ДОКАЗАТЕЛЬСТВО. Пусть в = (0i, ...,0Г) - возрастающее упорядоченное подмножество множества {1,2, ...,п}. Обозначим через Л# = Ави...гвГ определитель матрицы размера г х г, являющейся подматрицей матрицы координат А (см. (1.1)), причем из последней матрицы взяты столбцы с номерами $1, ..,вг. Многочлен Гильберта этой решетки мы определили равенством: Многочлен Гильберта ортогональной решетки: Здесь суммирование ведется по всем в = (01} ...,0П_Г) - возрастающим упорядоченным подмножествам множества {1, ...,п}, а Лі определяются аналогично Л#, но уже относительно базиса решетки Лх и набора в . Из этих двух представлений многочленов Гильберта видно, что для доказательства утверждения леммы 2 достаточно установить равенство Лі = Л , где наборы в и в дополняют друг друга до набора {1,2, ...,п}. В самом деле, если это равенство установлено, тогда с учетом равенства Д- = j выполнено: Докажем теперь равенство Л = \Ав\. В условиях леммы Л = V О Zn, dim У = г. Выберем в V любые г линейно независимых векторов (подойдут к примеру и Aj); пусть это: Пусть в — (#i,..., Вт) - возрастающее упорядоченное подмножество множества {1,2, ...,п}. Набор чисел рви...,вг по всем возможным 0 называется Грассмановыми координатами подпространства V. Из этого определения видно, что Грассмано-вы координаты зависят от выбора базиса в пространстве V. В книге Ходжа и Пидо [53] в параграфе 7 подробно описаны основные свойства этих координат. Нам понадобятся следующие из них: 1) При замене базиса пространства V все Грассмановы координаты умно жаются на одну и ту же константу. Эта константа равна определителю мат рицы перехода от одного базиса в V к другому. Для формулировки второго, наиболее важного для нас утверждения понадобится понятие дуальных Грассмановых координат. Определим числа рРи-,0п_г равенством: