Содержание к диссертации
Введение
ГЛАВА I. Квазикристаллические симметрии и их модели
1.1. Квазикристаллические симметрии. Структура и свойства 8
1.2 Модели квазикристаллов. Квазикристаллический паркет Пенроуза 13
1.3. Группы подобия в синтезе квазикристаллических паркетов. Логические операционные модули 20
1.4. Бигексагональная мозаики Дюно-Каца. Перколяция вероятностных перечисляющих полиномов, информодинамических функционалов и фрактальных характеристик 26
ГЛАВА II. Информодинамическии метод структурного анализа мозаик, паркетов
2.1. Грамматическое представление паркетов и мозаик. Иерархия алфавитов. ЦПМ - статистика в унарном приближении 35
2.2. Статистики ЦПМ в квазикристаллических симметриях 42
2.3. Древес но-графовое отображение квазикристаллических мозаик. Математические свойства координационных ДК 49
2.4. Декомпозиции древесных графов. Классическая теория перечисления графов. Свойство симплициальности ...55
2.5. Перколяция вероятностных перечисляющих полиномов, информодинамических функционалов на ДК 59
ГЛАВА III. Обобщённые перечисляющие структуры при симплициальных декомпозициях древесных графов
3.1. Перколяция ветвистости и внутриуровневой связности дерева Кейли для мозаики Пенроуза 62
3.2. Два метода протодекомпозиции при бислоговом рассмотрении ДКП ..65
3.3. Марковская декомпозиция ДКП. Стохастический перечисляющий тензор. Вероятностный вектор. Марковская перколяция вероятностных, энтропийных функционалов 70
3.4. Кронекерова декомпозиция ДКП. Кронекеров перечисляющий вектор. Перколяция вероятностных, энтропийных функционалов в совместной логике рассмотрения 77
ГЛАВА IV. Теоретико-информационный анализ ДКП
4.1. Сопоставление результатов теоретико-информационного анализа перколяции в марковском и кронекеровом представлении на ДКП 83
4.2. Теоретико-информационный анализ слов русского языка 87
4.3. Стримерное представление ДК. Стримеры как слова 92
4.4. Фрактальность ДК для мозаики Пенроуза в стримерном представлении 97
Заключение : 103
Литература
- Модели квазикристаллов. Квазикристаллический паркет Пенроуза
- Статистики ЦПМ в квазикристаллических симметриях
- Два метода протодекомпозиции при бислоговом рассмотрении ДКП
- Теоретико-информационный анализ слов русского языка
Введение к работе
/oof/ Общая характеристика диссертации
Актуальность темы В классической кристаллографии существует теорема, которая показывает, что наложение трансляций Бравэ на группу S03 режектирует бесконечномерный вектор характеров до пятимерного. В результате этого в кристаллографии допускаются поворотные оси только 2, 3, 4, 6 порядков Открытие в 1984 году сплавов с наличием оси симметрии 5-го порядка привело к возникновению большого массива работ теоретического плана по моделированию квазикристаллических паркетов, мозаик. В ряде наших работ развивается метод изучения квазикристаллических симметрии на базе теоретико — информационного, лингвистического подхода. Как требуется в теории информации и теории эффективного кодирования, язык задаётся иерархией алфавитов - буквенный, слоговый, стоварный, фразеологический и т.д., на которых задаются вероятностные меры Со времён Ципфа было установлено универсальное статистическое свойство цивилизованных языков на различных уровнях агрегации Доказано, что все реальные языки подчиняются закону Ципфа - Парето - Мандельброта (ЦПМ). Это обобщённое гиперболическое распределение, фактически ранговая статистика алфавитов различных уровней. Надо подчеркнуть, что с точки зрения классической математической статистики ЦПМ - распределения являются весьма не типичными. Как правило, для них не существуют моменты, нельзя говорить о модах, среднем значении, дисперсии и тд. Кроме этого, ЦПМ - статистики имеют затянутые хвосты Как стало ясно в последнее время, это эффект дальнодействия, имеющий фрактальное содержание.
В ряде наших работ был разработан и применен к исследованию квазикристаллических симметрии метод, базирующийся на древесно-графовом отображении соответствующих паркетов и определении на полученных графах как энтропийных, дивергентных функционалов, гак и характера их перколяции Однако применение к древесным графам для квазикристаллических симметрии классической методики кустовой декомпозиции несёт определённый ограничивающий момент. 11а исходных паргета* имеют место несколько типов
РОС НАЦИОНАЛ*»!
ЩЬДИОТСКА |
элементов и два типа контактов между ними, в общем случае имеет место алфавит [mqxnp]. Классическая кустовая декомпозиция не учитывает этот момент. Кроме того, сами исходные паркеты можно рассматривать как системы вершинных координации. Данный момент также не был рассмотрен в предыдущих исследованиях.
Не рассматривался также вопрос - можно ли описать с количественной стороны семантический аспект квазикристаллического упорядочения? Несколько другая форма: будет ли зависеть количество информации на квазикристаллических «фразах» от степени агрегации символов? Для реальных языков эти аспекты хорошо исследованы как экспериментально, так и теоретически. Если удастся прямым способом доказать, что квазикристаллические мозаики являются языковой системой, причём с существенно нечёткими чертами, то мы впервые сможем получить неодномерную языковую структуру нетьюринговской логики.
Нетипичность поставленных задач по кристаллографии
квазикристаллических структур потребует существенных обобщений в теории древесных графов, и в теории перечисления графов при распространении её на полислоговые приближения. При разработке поставленной проблемы придётся существенно использовать теоретико-информационные методы при моделировании квазикристаллических структур.
Целью диссертационной работы является теоретическое исследование основного представителя минимальных квазикристаллических симметрии, пентасимметричной мозаики Пенроуза, на основе данных вычислительного эксперимента как по статистическому анализу структуры самого покрытия, так и по определению характеристик древесно-графовой модели данного покрытия
Для достижения этой цели были поставлены следующие задачи:
1. Найти статистики распределения вершинных координации как самой мозаики Пенроуза, так и ближайших представителей минимального класса квазикристаллических симметрии
1/« і і ' 4 4
г*» %к S, -
-
Провести декомпозицию древесно-графового отображения данной мозаики на минимальные элементы, позволяющие учесть структуру имеющего место алфавита [2qx2p] (унарная протодекомпозиция)
-
Провести декомпозицию вышеуказанного древесного графа с учетом минимально объединения элементов унарной декомпозиции (бислоговая протодекомпозиция).
-
Разработать метод, позволяющий обобщить классическую теорию графов для учета бислоговых приближений.
-
Получить энтропийные функционалы длі случая бислоговой протодекомпозиции и рассмотреть динамику их иерколяции по уровням древесного графа.
-
Определить фрактальные характеристики древесного графа при унарной протодекомпозиции.
Научная новизна работы состоит в следующем:
-
Проведена декомпозиция паркетов минимальных квазикристаллических симметрии (4-го, 5-го, 6-го порядков) как систем вершинных координации Показано, что каждому из них соответствует свой диапазон координации к своя статистика распределения. Наиболее нетривиальное распределение, отвечающее за дальнодействие относится к классу безгранично-делимых распределений (ЦПМ-статистика). Оно наблюдается для пентасимметричной мозаики Пенроуза.
-
Получены данные о ветвистости и пересекаемости на координационном дереве Кейли для мозаики Пенроуза (ДКП). Показано, что данные характеристики имеют определенный асимптотический инвариант в среднем, тонкая структура перколяции отличается квазипериодическими флуктуациями вокруг данных инвариантов.
-
Разработана методика бислоговой протодекомпозиции древесных графов на примере ДКП Обобщена теория перечисления графов для учёта бислоговых приближений. Показано, что при данной декомпозиции
возможны два типа перечисляющих структур, построенные соответственно в условной и совместной логиках.
-
В условной логике бислоговой протодекомпозиции построена марковская перечисляющая структура, состоящая из стохастической матрицы и вероятностного вектора состояния. На данной структуре введён энтропийный функционал. Показано, что его перколяция по уровням ДКП является периодической вокруг асимптотического инварианта, равного 0.618..., что совпадает с «золотым отношением», лежащим в основе мозаики Пенроуза. Распределение элементов вектора состояния подчиняется ЦПМ - статистике с показателем у -1, что соответствует аналогичному показателю реальных языков.
-
В совместной логике бислоговой протодекомпозиции построена кронекерова перечисляющая структура, представляющая собой шестнадцатимерный вектор Показано, что распределение элементов данного вектора подчиняется ЦПМ - статистике с показателем у~ 1 Перколяция энтропийного функционала является периодической вокруг среднего энтропийного инварианта.
-
В рамках теоретико-информационного подхода проведён сравнительный семантический анализ слов русского языка и стримсрных конструкций ДКП Показано, что распределения символов внутри смыслосодержащих слов подчиняется ЦПМ распределению с у~1, а внутри бессмысленных -линейно. Для стримеров ДКП установлено уменьшений энтропии, а следовательно повышение семантического потенциала при бислоговой агрегации, что аналогично явлению, имеющему место в реальных языках.
7. Проведён расчет фрактальной размерности стримеров ДКП. Оценка
стримерной фрактальной размерности данных структур составляет- 1 3
Эти результаты выносятся на защиту в данной диссертации.
Практическая ценность работы. Полученные результаты могут быть полезны при теоретическом описании квазикристаллических симметрии, для построения своеобразной обобщенной кристаллографии Кроме того, іингвистические аспекты полученных результатов могут быть использованы при создании неодномерных языковых систем с нертьюринговской логикой.
Апробация работы Основные результаты были представлены на Всероссийских конференциях студетов-физиков, аспирантов и молодых учёных ВНКСФ-8,11 (2002, 2005, Екагеринбург), ВНКСФ-9 (2003, Красноярск), ВНКСФ-10 (2004, Москва), Всероссийских семинарах «Моделирование неравновесных систем» в 2002, 2003. 2004 годах (Красноярск), Всероссийских «Нейроинформатика и её приложения» в 2003, 2004 годах (Красноярск), Региональных конференциях студентов, аспирантов и молодых учёных (Владивосток, 2001-2005).
П^бтикации По результатам диссертации опубликовано 21 работа
Структура и объем работы. Диссертация состоит из введения, четырёх глав, заключения, списка литературы и приложения Общий объём работы составляет 131 страницу, включая 69 рисунков, 5 таблиц и список литературы из 113 наименований.
Модели квазикристаллов. Квазикристаллический паркет Пенроуза
Наблюдения в электронный микроскоп выявили довольно интересную морфологию этого сплава: внутри алюминиевой матрицы присутствуют ветвистые образования размером в несколько микрон, которые не периодичны, но имеют дальний порядок [95,98,99].
Новая фаза оказалась метастабильной. При комнатной температуре икосаэдрическая структура сплава сохраняется сколько угодно долго, но при 350С в течение нескольких часов переходит в обычную кристаллическую структуру А16Мп. При 400С переход происходит в течение нескольких минут. Как показали исследования, переход икосаэдрической фазы в кристаллическую является фазовым переходом первого рода [14,57,58,99].
Позднее были найдены другие металлические сплавы, имеющие оси симметрии седьмого, восьмого, десятого, двенадцатого и т.д. порядков, запрещенные для кристаллов. В связи с этим расширилось и понятие квази кристаллов: в настоящее время под квази кристаллами принято понимать твердые металлические сплавы с дальним порядком, дифракционные пики которых расположены с некристаллографической симметрией[1,2,5,8,14].
Важную проблему физики квазикристаллов представляет их атомная структура. Их структуру можно понять с помощью математической теории замощения [52,59], Замощение - это покрытие всей плоскости или заполнение всего пространства неперекрывающимися фигурами.
Кристаллы обладают дальним порядком двух типов, ориентационным и трансляционным. Структура элементарной ячейки большинства кристаллов основана на таких простых геометрических телах, как куб, тетраэдр и октаэдр. Структура квазикристаллов, таких как сплав алюминия с марганцем, основана на другом геометрическом теле - икосаэдре. Икосаэдр имеет симметрию пятого порядка: в каждой его вершине соединены пять граней. Геометрия икосаэдра [41,90] занимает важное место во многих областях математического анализа, таких, как проблема решения уравнений пятой степени, теория групп [47,69,83], теория хаоса [8,31,37,43]. Икосаэдры невозможно упаковать так, чтобы они плотно, без зазоров, заполняли все евклидово пространство, поэтому они не могут служить элементарными ячейками кристаллов. Шехтман и Блех [2,5,48] показали, что набором элементарных икосаэдров, не заполняющих весь объем, можно воспроизвести дифракционную картину, аналогичную экспериментальной.
С момента открытия квазикристаллического состояния важной проблемой является вопрос о его термодинамической устойчивости [8]: при каких скоростях охлаждения из расплава будет образовываться квазикристаллическая фаза, будет ли она более устойчивой, то есть иметь меньшую энергию по сравнению с кристаллическим аналогом при данных условиях температуры, составе, давлении, сколь долго она существует и не перейдет ли при изменении внешних условий в кристаллическую фазу. Первые открытые квази кристаллические икосаэдрические сплавы алюминия с марганцем можно было получить лишь путем быстрого охлаждения с определенной скоростью из жидкого состояния (при более высокой скорости охлаждения получались аморфные фазы), либо другими столь же экзотическими методами [5,14].
Дальнейшие исследования показали, что квазикристаллические фазы могут быть термодинамически устойчивы. Процесс закаливания (спиннингования), используемый первоначально, давал очень мелкие зерна, которые при нагревании необратимо превращались в обычные кристаллы. Однако, некоторые материалы, открытые в последние 8 - 10 лет, сохраняют квазикристаллическую структуру при нагревании вплоть до точки плавления. Удалось изготовить образцы гораздо большего размера, выращивая квазикристалл, как обычный кристалл [14]. Таким способом были созданы сплавы размером зерен до 10мм [14,99].
Были обнаружены сплавы Al6CuLi3 и Al65Cu2oFe13, которые образуют квазикристаллы даже в режиме медленного охлаждения. Эти квазикристаллы оказались стабильными.
Теоретически относительную стабильность квазикристаллического состояния можно изучать с помощью квантовомеханических расчетов энергии квазикристалла [14], в которых детали межатомного взаимодействия восстанавливаются из фундаментальных физических представлений, задавая электронное строение атомов, составляющих сплав, то есть их номер в периодической системе элементов. Реализация таких "первопринципных" расчетов сложна, обычно пользуются упрощенными схемами, в которых металл рассматривается как совокупность атомов, каждый из которых погружен в некую эффективную однородную среду, отражающую его непосредственное окружение.
В рамках такого подхода можно рассчитать энергетику достаточно большого кластера. Подобные расчеты были выполнены для кристаллических и квазикристаллических фаз системы А1-Мп. В качестве модели квазикристалла был использован декорированный икосаэдр, состоящий из 54 атомов (икосаэдр Маккея) [2]. Оказалось, что различными комбинациями икосаэдров Маккея можно добиться существенного снижения полной энергии такого модельного квазикристалла по сравнению с кристаллической фазой сплава того же состава. В принципе можно предсказывать возможность появления квазикристаллических фаз в различных металлических сплавах. Для полноты анализа термодинамической устойчивости квази кристаллической фазы необходим еще учет конфигурационного беспорядка, который может существенно изменить энергетическое состояние объекта. Для регулярных и случайных квази кристаллов этот вклад различен: в первом случае он просто равен нулю.
Статистики ЦПМ в квазикристаллических симметриях
Теперь опять обратимся к мозаике Пенроуза. Координатное представление можно дополнить вероятностным рассмотрением на втором уровне алфавита. Наряду с объектами (пара «золотых» ромбов) будем учитывать вид контакта, координации между ними. Существуют контакты двух типов - точечный и рёберный. Фактически, мы имеем дело с квартетным алфавитом [2qx2p] - 2 типа ромбов (q) и 2 типа контактов (р). В работе [96,102] была проведена статистическая идентификация начального и асимптотического распределения элементов данного алфавита. Данное распределение оказалось гиперболическим, соответствующим статистике Ципфа - Парето - Мандельброта: f(r)-Ciry (где г - ранг элемента, р — его вероятностный вес в квартетном алфавите) с показателем
Данное распределение является гиперболическим и относится к классу безгранично-делимых [23,24,80,81]. В общем случае данное распределение имеет вид f(r)=C/(r0+r)r} го г&тах- Путём записывания в двойных логарифмических осях можно добиться выпрямления зависимости: In f(r)-lnC - }Іп(г0+г), или in f(r) + yin(r0+r)= InC-const. Это значит, что сумма логарифмов координат любой точки (рис.2.1.7) на гиперболической кривой остаётся постоянной, т.е. подчиняется закону сохранения или принципу инвариантности. Справедливо и обратное - если существует логарифмический перевод в аддитивный инвариант, то статистика является гиперболической. Так как функция f(r) есть распределение вероятности, то In f(r) является энтропийной характеристикой, энтропией возможностей [102], у1п(г0+г) в свою очередь есть энтропия затрат [102]. То есть ЦПМ отражает закон сохранения Рис.2.2.1. Линеаризованная гиперболическая статистика возможностей и затрат [102].
С физической точки зрения зависимостям такого типа подчиняются кулоновские и гравитационные силы, которые являются дальнодействующими, но не из-за вида подынтегральной функции, а из-за размерности пространства, в котором идёт интегрирование (R3).
В общем случае, если рассмотреть ранжированную по какому-то параметру статистику событий, подчиняющуюся ЦМП, то данный интеграл может быть как сходящимся, так и расходящимся, в зависимости от у (рис.2.1.8):
Распределения дальнодействующего типа также являются статистическим образом катастрофического поведения различных систем. В данном случае они называются «распределениями с тяжелыми хвостами». Рассматриваются ранговые распределения происшествий, хвост данных распределения отвечает за вероятность гигантских, из ряда вон выходящих событий [8,50,82]. В системах, описываемых нормальными и экспоненциальными распределениями плотность вероятности спадает достаточно быстро, т.е. такие события не берутся в расчет. Но реально они возможны, большинство систем описывается как раз степенными распределениями. Кроме того, линейный вид степенной зависимости в двойных логарифмических осях свидетельствует о масштабной инвариантности описываемых ей систем [8,50,57,58].
В работе «Синергетика и прогноз бедствий и катастроф» [50] приведена ранжировка более 2000 техногенных катастроф по числу погибших, которая подчиняется степенной зависимости с показателем у 13 и более 1000 стихийных бедствий по числу раненых, попавшая под аналогичную статистику с у -0.57, а так же ранжировка стран по доле ВИЧ-инфицированного населения (у—0.17) и семейств компьютерных вирусов по доле поражённых ими компьютеров (у 0.36) [50]. Опасность явления, подчиняющегося степенному закону определяется его показателем, чем меньше этот показатель, тем выше опасность. На основании этого критерия проводится разграничение на «аварии» (у 1) и катастрофы (v l) [50]. Влияние даже самых крупных аварий на суммарный ущерб от них ничтожно, тогда как в случае катастроф суммарный ущерб ряда событий соизмерим с крупнейшим из них [50].
Следует ещё отметить некоторые особенности ансамблей, подчиняющихся ЦПМ — распределениям. Таким распределениям свойственно наличие трёх областей. В случае алфавитов это будут область часто встречающихся слов с малым рангом, область маловероятных слов с
Как известно в теории информации и кодирования [73,76] гиперболические статистики возникают в результате конкуренции. Задаче конкуренции можно придать форму некоторого вариационного компромиссного принципа в терминах теории принятия решений. Пусть ресурс R(x)5=0 задаётся своим количественным распределением v(x), или вероятностным распределением р(х) или ранговым распределением г(х). Согласно теории принятия решений задаются затраты в логарифмической форме: E(v( х);х) = fin x-v( x)dx = jinx- dF( x)dx - (Inx) где F(x) - интегральная вероятностная мера, {lnx} - средний логарифм потерь, затрат. Возможности сложной системы можно задать энтропийным функционалом в шенноновской форме:
Два метода протодекомпозиции при бислоговом рассмотрении ДКП
Следует отметить такой момент. Если подходить строго к типу ДКП, то это скорее квазидетерминированные ДК, в которых ветвистость является случайной величиной в некоторых пределах. Так, в частности, согласно 2.1 вершинные координации лежат в пределах 3 ks7. Пока не будем переходить к рассмотрению ВПП, а возьмём только среднюю (эмпирическую) ветвистость на уровнях ДКП. Из рис.3.1.1. заметно, что перколяционная асимптотика ДКП по этому показателю уступает тетраэдрическому дереву Бете [9,30], ёмкость ДКП по ветвистости в среднем меньше. Казалось бы, исходя из топологии надо переходить к триадному дереву бете, или даже «дробному», но обеспечить меньшую ёмкость ДК можно используя квазислучайную ветвистость. Таким образом, та или иная стохастика в древесной топологии может обеспечить «дробные» показатели, фрактальные характеристики [51,79,82] не обязательно прямым способом. Нет смысла вводить понятие «длинны» связей, отличных от единичной. Мы по-прежнему остаёмся в рамках ДК с унимодулярными связями.
В 2.3 отмечалось, что для кустов на каждом уровне иерархии ДК характерна значительная межкустовая пересекаемость. Наличие такой внутриуровневой пересекаемости порождает новый тип топологической связанности на ДК, который не свойственен классическим деревьям Бете. Сильная связность таких ДК обобщает классические графы типа леса [9] до марковских джунглей [49,97]. Понятие связности ДКП основано на степени пересекаемости кустов на каждой иерархии. Нетрудно заметить, что на графах типа Бете или леса, степень пересекаемости, а следовательно и связность, нулевая. Оценка пересекаемости на каждом уровне определяется как отношение числа вершин мультипликации к общему числу вершин на данном уровне. Причем на таком уровне приближения не берется в рассмотрение кратность мультипликации (степень вырожденности) и из каких кустов предыдущего уровня приходят ветви на исследуемый уровень. Тем самым, на каждую вершину любого нижнего уровня, достаточно далекого, может замыкаться сравнительно богатый пучок стримеров.
Причем, вследствие пересекаемости эти пучки стримеров не образуют стал гебру. Каждый пучок стримеров можно характеризовать своим диаметром - числом стримеров между начальной и одной из конечных вершин. В этом плане ДКП наделены весьма высокой топологической связностью. В теории информации и кодирования [19,76,78] определённым аналогом топологической является свойство избыточности.
Как упоминалось в 2.1, мозаика Пенроуза по структуре построения имеет первичные языковые черты, а именно трёхуровневый дуальный алфавит и возможность формирования на фразеологическом уровне (из десятиугольников). Распределение вершинных координации на МП так же несёт некоторые языковые черты в статистическом плане (рис.2.1.3.6). С этой точки зрения имеет смысл проверить координационные ДК, отображающие мозаику Пенроуза на наличие определённых языковых черт, в частности, установить степень внутриуровневой пересекаемости, избыточности [73],
Для каждого уровня иерархии ДКП был рассчитан коэффициент пересекаемости и построена его перколяционная зависимость (рис.3.1.1) Внутриуровневая пересекаемость оказалась весьма высокой (-74.5% при размахе 12.3%). Особо следует подчеркнуть высокую степень мультипликации, что как раз обеспечивает сильную связность ДКП по уровням, избыточность (в лингвистическом эквиваленте). Эта мультипликация даёт возможность говорить о существовании скорлуп Мандельброта. Другими словами, текст может формироваться во фронтальном и стримерном представлениях.
Рассмотренное в этом параграфе свойство межкустовой связности крайне важно. Во-первых, на графах типа Бете вообще нет смысла обсуждать связность в какой - либо форме. Во-вторых, связность как топологическое понятие базируется на алгебраическом понятии пересекаемости кустов. В-третьих, именно связность ДКП обеспечивает достаточно мощный по диаметру пучок стримеров. Конечно, пучки стримеров в общем случае пересекаются, но можно ввести простые правила кодирования кустов [78], в которых сильно перепутанный ансамбль стримеров «развяжется» в а-алгебру кодонов [16,88,91]. Данное обстоятельство ценно само по себе, поскольку а пучки кодонов это прямое указание на языковую структуру ДКП в стримерно-кодоновом представлении с точки зрения теории информации и кодирования [76,78]. Методически важно иметь ввиду, что межкустовая пересекаемость - связность образуется на входящих ветвях, тогда как исходящие ветви образуют строго аддитивный ансамбль. Именно внутриуровневая межкустовая пересекаемость -» связность ДКП позволяет выделить стримерно-кодоновый алфавит (словарный уровень), но главное, каждый пучок кодонов допускает нечёткую многозначность, столь характерную для цивилизованных языков.
Теоретико-информационный анализ слов русского языка
При статистическо-информационном анализе языковых систем обычно рассматривают два аспекта. Ещё в 1949 году Ципфом был открыт универсальный закон распределения слов в цивилизованных языках вне зависимости от предметной специализации, который относится к классу гиперболических статистик. Мы называем его (с учётом фамилий других учёных, открывших аналогичные зависимости в различных естественных системах) ЦПМ - распределением [102].
В наших исследованиях мы неоднократно идентифицировали ЦПМ -статистики на ДКП на унарном и бис логовом алфавитах. Проведение работ по идентификации полислоговых приближений предполагает огромный объём вычислительных процедур. Как мы неоднократно подчёркивали, уже бислоговое приближение вносит качественный скачок в исследование «языковости» ДКП. Это минимальный уровень, на котором можно провести типичное теоретико-информационное исследование с точки зрения языковой модели. Если для идентификации ЦПМ достаточно ранговых статистик на разных уровнях алфавита, то теоретико-информационное исследование предполагает иной аспект. Со времён Шеннона количество информации определяется энтропией слова, фразы. В статистическом подходе подразумевается иерархия алфавитов которые используются при составлении слов, фраз, предложений. Второй аспект теоретико-информационного исследования состоит в доказательстве факта уменьшения энтропии сообщения при увеличении степени агрегации букв в слоге, слове, фразе. Уменьшение происходит из-за возникновения межбуквенных корреляций, а всякая связь понижает энтропию [19,73,76,78]. Эти корреляции и выражают семантику языка. Если этот универсальный факт для всех языковых систем можно считать установленным, имеет смысл проверить его наличие для множества стримеров ДКП.
В данной главе мы как раз и будем, если это возможно, пытаться установить факт понижения стримерной энтропии при переходе от унарного к бинарному, бислоговому алфавиту. Параллельно будем для стримеров в бислоговом приближении проводить разложение на элементы унарного алфавита, что должно энтропию увеличить. Если вычислительный эксперимент подтвердит наши предположения, то это будет указывать на применимость языковой модели к ДКП.
Есть один момент, который мало затронут в статистической лингвистике. Один из главных моментов - ввести меры описания, характеризующие степень семантичности слов языка. В данном параграфе делается ударение как раз на этот вопрос. Производится подход к оценке рангового распределения символов в составе слов русского языка. С точки зрения теории информации и кодирования [16,73,76,78], языковую систему необходимо задать в частотном или ранговом представлениях. Затем на введенных таким образом статистиках строятся энтропийные, дивергентные, информодинамические функционалы, которые и привлекаются для оценки, в частности, семантического потенциала языковых систем. Основной аспект поставленной нами задачи - различить ранговую статистику смысловых фраз и бессмысленных сочетаний букв. Но это всего лишь один из аспектов семантического анализа. Как известно, смысл, структурированность в словах языка проявляются в межбуквенных корреляциях. Хорошо известны работы по статистике цивилизованных языков, где показан эффект понижения энтропии слов при учёте полислоговых комбинаций [107-109]. Обратимся к семантическому анализу некоторых слов русского языка. Для математического моделирования было взято десять смыслосодержащих слов русского языка, обладающих разным объёмом (шум, хаос, время, симметрия, упорядоченность, организация, кристаллография, информодинамика, математика, квазикристалл).
В качестве тестового бессмысленного слова набор букв «Ымджьрзипалюбму», так называемое «Ы-слово». Объём слов (число букв) на этом ансамбле колеблется от 3 до 15.
Основная характеристика для каждого слова - ранговое распределение по длине rx(lj), где lj - координата буквы соответствующего слова, х -конкретное слово (xslO), 3 Is sl5. Построение рангового распределения по длине слова базировалось на естественной ранговой статистике русского языка. Для всех слов были получены ранговые распределения, четыре из которых представлены на рис.4.2.1. (приложение) и рис.4.2.2.