Содержание к диссертации
Введение
Глава I. Логические проблемы в области разработки языка, близкого к естественному, для человеко-машинного.диалога 15
1.1. Широта применения логических средств 15
1.2. Анализ выражений естественного языка 18
1.3. Формализованное представление текста 28
Глава 2. Построение формализованного.языка.для представления текста 33
2.1. Границы и тонкости формализации текста 33
2.2. Определение логических средств 41
2.3. Описание прикладного языка 50
Глава 3. Построение графовой модели.текста семантическая сеть . 67
3.1. Семантическая сеть как формальная семантика 67
3.2. Интерпретация прикладного языка 74
3.3. Графовое представление текста 83
Глава 4. Формализация.диалоговых.средств.в.прикладном языке 90
4.1. Анализ и классификация вопросов 90
4.2. Предпосылки вопросов 105
4.3. Виды и формы ответов 111
Глава 5. Возможные применения разработанных средств 117
5.1. Описание логических категорий терминов-констант 117
5.2. Определение категорий ответов 125
5.3. Анализ формализованных вопросов 130
Заключение 137
Литература 147
Приложение
- Анализ выражений естественного языка
- Определение логических средств
- Интерпретация прикладного языка
- Предпосылки вопросов
Введение к работе
Научно-технический прогресс обусловил широкое внедрение электронных вычислительных машин в планирование, управление и организацию различных областей человеческой деятельности. Расширение возможностей решения на ЭЕМ все более сложных и разнообразных задач выдвинуло на первый план проблему доступа к работе на вычислительной машине пользователей, не являющихся специалистами в области программирования. Решение этой проблемы связано с разработкой специальных форм представления вводимой информации (запроса, задачи) и форм получения ответа, т.е. с разработкой специального языка общения с ЭВМ. Рассчитанный на широкого пользователя язык должен быть, по возможности, приближен к естественному. В то же время он должен однозначно интерпретироваться при переходе к "внутреннему", машинному языку, т.е. "внешний" язык общения должен иметь модель, позволяющую применить автоматические методы обработки вводимой информации. Следует отметить также факт обратного влияния этой ситуации на внедрение автоматизированных систем. То, что при коммуникации с ЭВМ не потребуется специального обучения программированию, - "одно это способно резко увеличить число пользователей,многие из которых не без оснований считают необходимость учить язык программирования серьезным препятствием на пути к вовлечению ЭВМ в свою работу" [_3.14; с.300]. Рост числа таких пользователей привел к возникновению ситуации, когда автоматизированная система может быть "оснащена" одновременно двумя различными средствами (языками) , выполняющими различные функции. Одно из этих средств используется разработчиками системы для введения массива информации при создании базы данных и для ее корректировки.
Примером могут служить реляционные базы данных, созданные специально для тех случаев, когда предполагается ввод больших массивов информации [_4.4д. Другое из этих средств направлено на обеспечение комфорта пользователей системы, поскольку "... Дальнейший прогресс в области автоматизации интеллектуальной деятельности будет в значительной мере определяться эффективностью реализаций информационных систем широкого профиля, то есть систем, обладающих способностью анализировать поступающий вопрос, определять предметную область, к которой он относится и формулировать релевантный ответ, быть может, в явном виде не содержащийся в памяти системы. Системы, обладающие перечисленными свойствами, получили название вопросно-ответных систем" I 3.20; с.З]. В центре внимания данного диссертационного исследования находятся логические средства и уровни формализации текста (вопроса), данного во внешнем языке общения пользователя с ЭВМ, используемые при переходе к внутреннему, машинному представлению соответствующей предметной области.
Можно выделить два подхода к решению вопроса о формах диалога с ЭШ без обращения к языку программирования. Первый, более ранний подход состоит во введении формализованных документов,резко ограничивающих набор допустимых терминов естественного языка и исключающих анализ структуры предложений. В ряде случаев заранее предусмотренные тексты заменяются наборами кодов или шифров,предлагаемых, например, в виде рубрикатора. Даются перечни снабженных порядковыми номерами вопросов, на которые система может дать ответ. При подготовке базовой информации для предусмотренных в системе вопросов вводятся перечни возможных ответов. При работе с ЭВМ пользователь ограничен выбором из предложенного ему списка.
Возможность применения другого подхода обусловлена развитием вычислительной техники и программного обеспечения. В частности,это относится к используемым в вопросно-ответных системах программам, анализирующим ("понимающим") естественный язык и к развитию такого способа представления данных, как семантические сети. Таким образом, все больший интерес вызывает то направление развития средств человеко-машинного диалога, которое ставит вопрос о приближении этих средств к естественному языку.
Актуальность темы данной диссертационной работы определяется тем, что используемые в указанной области логические средства явно недостаточны для решения имеющихся здесь серьезных логических проблем. В основе программ, "понимающих" естественный язык, лежит построение модели текста, структура которой определяется способом явного представления семантических связей между отдельными терминами, входящими в состав данного текста. При выборе формализованного языка для описания свойств модели такого рода создатели имеющихся программ используют традиционный способ описания логической структуры предложения в виде формулы языка исчисления предикатов. При этом лингвистические средства анализа текста используются независимо от логических средств его формализации, на которую направлен анализ. В результате по справедливому замечанию крупного специалиста в области человеко-машинного общения Э.В. Попова, при разработке систем с естественным языком (СЕЯ) дело осложняется тем, что разработчики СЕЯ не замечают большинство тонкостей естественного языка, и это приводит к упрощенчеству, за которое приходится дорого расплачиваться при эксплуатации системы. Кроме того, - "... лингвисты описывают ЕЯ не в том ракурсе, который необходим разработчику СЕЯ" [з.24; с.181J.
К этому следует добавить, что без внимания остаются также тонкости логической формализации связного текста, границы использования имеющихся средств и потенциальные возможности их развития специально для решения задач данной области. Следствием этого явилось введение жестких ограничений на словарный состав и форму допустимых в тексте выражений. Ограниченный таким образом язык общения человека с ЭВМ оказывается весьма далеким от естественного.
Отмеченные трудности делают актуальным поиск более эффективных средств логической формализации текста в языке-посреднике,представляющем собой промежуточный уровень между языком общения и машинной моделью текста. От этой формализации непосредственно зависит мощность ограничений, налагаемых на язык общения, возможности применения формальных методов для обработки введенной информации, а также однозначность перехода к модели и полнота представления информации, содержащейся во вводимом тексте.
Следует отметить, что вопросно-ответные системы создаются не только в целях комфорта, как "пристройка" к ИПС. Разработка языка общения существенно влияет на организацию базы данных и развитие средств поиска информации, расширяя число допустимых в диалоге типов терминов и выражений. Наконец, анализ и развитие средств перехода от текста к машинному представлению информации представляет особый интерес, поскольку "... едва ли возможно говорить о машинном мышлении, не говоря, в первую очередь, о мышлении человеческом" [4.42; C.3J. Данную область исследований можно рассматривать, как чрезвычайно интересную динамическую модель фрагмента естественного языка и отраженных в нем процессов мышления. В частности, на этой модели представлены связи логической структуры языка общения со структурой и содержанием базы данных (то есть знаний, памяти сие-
темы),а также с процессами поиска, представляющими собой машинное мышление. Таким образом, наряду с чисто практическими задачами данная тема представляет несомненный теоретический интерес с логико-философской точки зрения. В центре внимания - естественный язык, но рассматриваемый не чисто синтаксически, а с точки зрения выделения содержащейся в тексте информации и возможно более полного ее представления в виде, доступном для машинной обработки. Как отмечает Д. А.Поспелов, большой интерес специалистов в области искусственного интеллекта к естественному языку как средству описания действительности и средству общения с ЭВМ определяется основными задачами этой области, являются: "синтаксический анализ текстов на естественном языке, переход от языковых представлений к языку описания знаний, понимание вопросов, формирование ответов, интересущих человека, извлечение знаний из текстов на естественном языке" [4.17; C.8J. Таким образом, несомненный интерес представляет развитие средств формализации текста и анализ естественных диалоговых средств,что является одним из необходимых условий приближения языка общения к естественному.Логические исследования в данном направлении предполагают решение следующих задач:
- Рассмотрение используемых логических методов и средств, как существующих в рамках предмета логики, так и возникших в данной прикладной области. В связи с этим проводится уточнение задач этой области, требующих применения дополнительных логических средств, а также разграничение логических и лингвистических средств анализа текста.
-Рассмотрение трех уровней представлений текста в вопроено-\ ответной системе, и описание формализованного языка, являющегося посредником между внешним языком общения.и внутренней (семантической) моделью текста с учетом требований, определяемых этой мо-
делью. Как отмечал Ф.Бэкон, - "Логика изучает процессы понимания и рассуждения..." [J3.3; С.29ІІ. Указанные три уровня представляют собой три последовательных логических этапа в процессе "машинного понимания" текста. В связи с этим ставится задача логического описания средств, используемых на третьем этапе, т.е. модели типа семантической сети, удовлетворяющей условию однозначности перехода от языка-посредника к внутреннему представлению.
- Развитие формализованных диалоговых средств на базе применения полученных результатов для анализа вопросов в естественном языке, в частности, для построения подробной классификации вопросов на основании их логической структуры. Наконец, необходимо более широко рассмотреть возможные применения разработанных средств, а также перспективы дальнейших логических исследований в данной области.
Научная новизна диссертации определена включением в круг логических исследований новых проблем, а также характером полученных результатов, состоящих в следующем:
Определены и проанализированы задачи логико-семантических исследований в области разработки средств формализации текста в вопросно-ответных системах. В связи с этим рассмотрены новые аспекты применения логических средств и перспективные направления прикладных логических исследований.
На основании проведенного анализа прикладной области выявлены и описаны используемые в ней логические средства. Так, представление текста в виде семантической сети рассмотрено и описано как формальная семантика первопорядкового языка. В этом описании предлагается новое решение вопроса о выборе типов связей между вершинами графа.
Уточнение указанных средств позволило разработать для представления текста формализованный язык, в котором предлагается изменение структуры атомарной формулы, состоящее во введении в ее состав отношения принадлежности, как единственной предикатной константы. Показано, что такая структура формулы удобна для обеспечения однозначного перехода к семантической сети, а также для формализации вопросов.
Развита подробная классификация вопросов на основании выделения их логической структуры и формализованного представления в разработанном языке. В результате формализации уточнены понятия предпосылки вопроса и области поиска ответа, а также рассмотрены способы сведения вопросов всех типов к стандартному виду.
Практическая ценность диссертации состоит, прежде всего, в направленности исследований на развитие логических средств, используемых в конкретной прикладной области. Изменение структуры атомарной формулы позволило расширить возможности формализованного представления текста и обеспечило однозначный переход от этого представления к графовой модели. В качестве этой модели рассмотрена семантическая сеть, широко используемая в системах автоматического анализа текста. Уточнены логические свойства этого вида представления и показана достаточность введения только трех типов чисто функциональных связей между вершинами графа. Такая структура является универсальной, так как применима к текстам из различных областей знаний, не требуя введения дополнительных типов связей между вершинами. Особое внимание уделено представлению сложных суждений и содержательных связей между суждениями.
Использование разработанных средств формализации позволило построить подробную классификацию вопросов, ориентированную на раз-
- II -
витие возможностей их автоматического анализа и поиска ответа. Детализация структуры позволила выделить различные типы формализованных вопросов по месту, занимаемому в атомарной формуле, переменной, связанной вопросным оператором. Рассмотрены средства представления предпосылок формализованных вопросов и определения области поиска ответа. Предложены методы сведения вопросов различных типов к стандартному виду, удобному с точки зрения последующего возможного применения методов автоматического доказательства теорем для поиска ответа.
В сущности, именно логический анализ фрагментов естественного языка должен давать результаты, весьма ценные для развития средств общения с ЭВМ. Как отмечает Э.В. Попов, - "... описание естественного языка (пока никем не выполненное), называемое "семантическим" описанием, ориентировано на то, каким образом осуществляется анализ (=понимание) и синтез (формирование) текстов носителями языка" [3.24; c.I8l].
Разработка логических средств формализации текста для вопросно-ответных систем представляет несомненный философский интерес в двух аспектах. С одной стороны, важен анализ того фрагмента естественного языка, который непосредственно связан с теорией информации, точнее, с процессами языкового обмена информацией и поиска информации. С другой стороны, интерес вызывает способ представления знаний системы, который можно рассматривать с различных точек зрения: как модель области знаний, как интерпретацию для логического языка, как модель фрагмента действительности и, наконец, как модель фрагмента естественного языка. Таким образом, результаты анализа используемых в данной области средств представления информации дают богатый материал для самых разных теоретических исследо-
ваний, - логико-философских, психологических, лингвистических.
Наконец, проанализированный материал и полученные результаты могут быть использованы в общем курсе логики для иллюстрации широты ее приложений, а также в спецкурсах по интеррогативной логике и логической семантике, дополняя их прикладной проблематикой.
Методологической основой исследования служит тезис диалектического материализма о неразрывном единстве языка и мышления, о языке как непосредственной действительности мысли[К .Маркс, Ф.Энгельс, соч., изд. 2-е, т.З, с.448]. Логика, как наука о законах и формах мышления, отраженных в языке, находит в данной области широкое применение, предоставляя средства выявления смысловой (понятийной) структуры текста и давая методологию выбора оптимальных ограничений на используемый фрагмент естественного языка. Развитие языка общения с ЭЕМ в направлении приближения этого языка к естественному несомненно предполагает самое широкое применение методов логики. При этом недостаточно ограничиться использованием готовых формализованных исчислений. Для решения задач, стоящих в данной прикладной области, требуется привлечение методов содержательного логического анализа понятий, суждений и умозаключений как форм представления информации в естественном языке. Такой анализ является необходимым условием разработки эффективных средств представления информации в формализованном языке, пригодном для автоматической обработки. В данном случае логическая формализация есть метод перехода от естественно-языкового представления к машинному, и основной задачей этого перехода является возможно более полное сохранение информации.
Принятая в данном диссертационном исследовании методология учитывает гносеологическую сущность формализации, состоящую, в
- ІЗ -
частности в том, что "естественный язык -универсальная основа искусственных" Гз.10; C.43J. В соответствии с этим построению формализованного представления предшествует анализ выражений естественного языка. Результаты этого анализа определяют направление разработки средств формализации. В свою очередь, такое введение формализованного представления позволяет углубить анализ некоторых фрагментов естественного языка, например, диалоговых средств.
Наряду с логическими в вопросно-ответных системах используются лингвистические методы структурирования текста, которие необходимы для первоначального синтаксического анализа предложений, но недостаточны для выявления их содержания. Учитывая приведенное выше замечание Э.В. Попова, представляется целесообразным четко разграничить лингвистические и логические задачи анализа текста. В связи с этим предлагается рассматривать их, как задачи различных, дополняющих друг друга этапов перехода от текста к его формализованному представлению. Выделенные таким образом логические аспекты этого перехода, которые ранее специально не рассматривалось, являются объектом анализа в данной работе.
Круг проблем, связанных с логическими исследованиями в этой области, определяется наличием трех уровней представления информации в вопросно-ответной системе. Этими уровнями являются внешний язык общения, использующий ограниченный фрагмент естественного языка; язык-посредник, дающий "вербально-логическую" форму представления предложений в виде формул прикладного языка и, наконец, внутренний язык, описывающий структуру данных, т.е. введенные в систему знания. При разработке языка-посредника очевидна необходимость учета как человеческой, так и машинной логики представления информации. Поэтому объектом исследования в предлагаемой работе
являются как способы представления текста, используемые в вопросно-ответных системах, так и сам текст. Лингвистические методы и средства перехода от предложения к формализованному выражению представляют собой отдельную область исследований, которой посвящено много работ. Поэтому лингвистические задачи специально рассматриваться не будут, равно как и вопросы программного обеспечения. В данной работе рассматриваются текст, данный в языке общения, его формализация в языке-посреднике и его модель, являющаяся аналогом структуры данных. Для их анализа будут привлечены логические методы анализа форм мышления, методы формализации, а также средства ин-террогативной логики и логической семантики.
Анализ выражений естественного языка
На базе результатов логического анализа выражений естественного языка решаются такие проблемы как: выбор способа формализации текста; уточнение структуры допустимых в тексте выражений и определение необходимых ограничений на текст; классификация диалоговых средств; и, наконец, построение модели, отражающей структуру данных и одновременно являющейся интерпретацией для формализованного языка-посредника. Здесь следует упомянуть важное для развития прикладных логических исследований замечание В.М. Брябрина и Д.П. Поспелова: кроме семантических моделей, необходимо еще создать комплекс псевдофизических логик, строящих временные, каузальные, родо-видовые и тому подобные структуры, необходимые "... для поиска нужных смысловых конструкций, которые в явном виде в тексте не присутствуют..." [2.1; с.ю]. Наряду с этим необходим лингвистический анализ, перед которым стоят следующие задачи: - Структурирование исходного текста (выделение взаимосвязанных терминов на основании анализа грамматических признаков). - Построение для каждого (если это необходимо) предложения перифразы, отражающей структуру принятого способа формализации. При этом устраняются свойственные естественному языку сокращения путем введения повторений, в частности, при замене местоимений. - Определение и явное указание временных форм. - Выявление ключевых терминов, для которых заданы семантические отношения. Задачи логического и лингвистического анализа текста в действующей вопросно-ответной системе должны дополнять друг друга, как различные этапы перехода от текста к его формализованному представлению. Лингвистическая перифраза может служить объектом логического анализа, в результате которого строится формализованное выражение в языке-посреднике. Однако, до сих пор основное внимание уделялось развитию лингвистических средств, что, в частности, отмечает У.Л. Чейф: "Без знания о семантической структуре мы ничего не знаем о процессах, в результате которых возника ют (грамматически) правильные высказывания, так как эти процессы представляют собой процессы семантического формирования.
Таким образом, лингвистика в настоящее время оказалась в затруднительном положении, потому что из всего того, что она узнала о различных сферах языка, она меньше всего узнала о семантике" (_3.35; с.90], В последние годы лингвисты стали широко употреблять термин "лингвистическая семантика", подразумевая не интерпретацию значения или смысла предложения, а, скорее, семантику грамматических конструкций. Лингвист Е.В. Падучева, указывая на несовпадение задач семантического анализа в логике и лингвистике, пишет, что связь линвистического проекта семантического анализа естественного языка с языками логики не очень глубокая из логики синтаксические категории и некоторые равносильности [3.23; с.70_. Основной, обеспечивающей возможность перехода от лингвистической перифразы к логической формализации является определенная общность в классификации выражений естественного языка. Как отмечает Э.В. Попов, - "В значительной степени грамматическая классификация предложений отражает семантическую информацию" [з.24; с.185_]. Речь идет о том, что и грамматика и логика выделяют утвердительные и отрицательнее выражения (предложения, суждения), а повествовательным, вопросительным и побудительным предложениям соответствуют суждения, вопросы и императивы. Число, время и вид также должны быть отражены в- логической формализации текста, например, путем введения специальных констант. Можно сказать, что синтаксические (грамматические) признаки указывают на наличие семантических связей. Но для полного определения характера этих связей и для их явного представления нужны логические средства. Анализ выражений естественного языка включает анализ терминов и анализ предложений. Формализация требует, прежде всего, упорядочения используемой терминологии, т.е. исключения синонимии и неоднозначности. Здесь следует отметить, что на практике при создании вопросно-ответных систем используется лишь проблемно ориентированный фрагмент естественного языка, который "... сохраняя синтаксис и выразительные возможности естественного языка, обладает значительно более строгой и бедной по допустимым истолкованиям семантикой" [_2.I; c.6J. На практике выступает еще одно различие между логическим и лингвистическим анализом. Выбор средств лингвистического анализа (грамматического разбора) не зависит от содержания конкретной области знаний, на которую ориентирована данная вопросная система. В то же время в число задач логического анализа входит содержательный анализ конкретной области знаний, определяющий набор необходимых логических средств. Ориентированность на построение графовой модели требует связности терминов. Это выражается в том, что в тезаурусе не должно быть семантически независимых терминов, интерлретируемых как вершины графа. Каждая вершина должна быть связана с какой-либо другой вершиной (вершинами).
Очевидно, что сильное сужение области знаний облегчает и упрощает задачи логического анализа, поскольку в этом случае семантические классы слов можно "... выводить с помощью формальной процедуры, учитывающей совместную встречаемость слов в тексте, т.е. предварительная обработка текста может быть, по крайней мере, частично автоматизирована" [_4.24; C.I07-I08J. Особо рассматривается служебная терминология, т.е. слова-связки (союзы), слова-кванторы ("все", "много"), дополнительно введенные термины, указывающие время и т.п. С помощью служебных терминов выделяются самостоятельные фрагменты
Определение логических средств
Формализованный язык, выполняющий посредника между текстом и его машинной моделью, должен включать как элементы естественного языка, так и элементы, отражающие структуру этой модели. Элементы естественного языка вводятся как нелогические константы. Отношение, заданное на модели и определяющее ее структуру, вводится как предикатная константа. Определение 2. Формальный язык первого порядка с отношением принадлежности состоит из следующих элементов: 2.1. Константы: 2.1.1. Индивидные константы: ао? ah аА-)»;?_а) .? где І = 0,4,2;... . 2.1.2. Функциональные константы ( ҐІ- местные): f "f f где П= 4, 2р... . . -Примечание: Нижний индекс опускается, поскольку нет необходимости различать функциональные константы с одинаковой местностью. 2.1.3. Единственная двухместная предикатная константа - Є. отношение принадлежности. 2.2. Индивидные переменные - Хо 7 0С±} ЭСд, ,..; ССС . где L = 0,i,2,... 2.3. Логические символы: пропозициональные связки - 7, & / V, V} , — отрщание, конъюнкция, нестрогая и строгая дизъюнкция, импликация, эквивалентность; V 3 - кванторы общности и существования (см. опр. I). 2.4. Вспомогательные (технические) символы (см. опр. I). Дополнение к определению 2. При интерпретации, в определениях, а также в некоторых комментариях к формулам будут использоваться следующие метаязыковые символы: =, , - отношения на индексах; ь=? - равенство по определению; зс - графическое равенство; — О (J С- - операции дополнения, произведения, суммы и . отношение подмножества, которые могут рассмат риваться на множествах или на графах, интерпретируемых, как множество вершин с множеством связей между ними; 0 - пустое множество или пустое пересечение графов; - квантор общности или существования; Р{ - индивидная константа или перменная. Терм определяется обычным способом (см.например, I 3.29; C.I2J. Определение 3 (индуктивное). Терм. 3.1. Всякая индивидная константа есть терм. 3.2. Всякая свободная переменная есть терм. 3.3. Если j" есть Kl- местная функциональная константа и ц, t , ..., ta - термы, где h. 1, то j (М;..7ГЛ) - также есть терм. 3.4. Термами являются те и только те выражения, которые указаны в пунктах 3.1-3.3. Определение 4. Атомарная формула. Атомарной называется формула вида: R-o -J ( 4уу$п\ где tlv-d. , тогда выражение вида І&. -f (ki,,. $.„) есть отрицание атомарной формулы. . Примечание: Перечеркивание знака отношения принадлежности вводится, как более наглядная запись, заменяющая знак отрицания перед атомарной формулой. Рассматривая соотношение внутреннего (машинного) и внешнего (естественного) представления информации можно особо отметить роль наличия в языке-посреднике сокращенных формул. Возможность записи, сокращенной за счет переменных, отражает ту особенность естественного языка, которая состоит в тенденции представлять информацию в свернутом виде, особенно, в случае неполноты этой информации. Такой свернутый вид выражения по структуре ближе к лингвистической перифразе. Переход от сппф к ппф, состоящий в явном указании переменных, связанных квантором существования, необходим для последующей автоматической обработки выражения, предполагающей, в частности, подстановку на место переменных. Выражение естественного языка, соответствующее развернутой ппф, неудобочитаемо, а для человека, не знающего логической роли переменных, и вовсе непонятно. Таким образом, сппф может быть полезной при переходе от лингвистической перифразировки предложения к его формализованному представлению. Для иллюстрации вышесказанного рассмотрим простой пример: " ОС о есть свойство отношения между OLi и #,".
Этому выражению соответствует сппф В приведенном примере функциональная константа 4 находится в области действия только одной функциональной константы - j , но возможны и более сложные случаи. Количество функциональных констант, в области действия которых может оказаться терм, в принципе, не ограничено. В более сложном случае "развертывание" сппф осуществляется в несколько шагов, причем на каждом шаге выявляется по одной переменной. Определение 8. Глубина терма. Глубина терма, со ставляющего правую часть сппф, определяется количеством функцио нальных констант, в область действия которых (под знак которых) попадают входящие в состав этого терма индивидные константы или переменные. . С этой точки зрения индивидные константы и переменные можно считать термами с нулевой глубиной. Тогда отличие элементарной ппф от сокращенной определяется следующим образом. Глубина терма, составляющего правую часть эппф, может быть равно только единице, в то время как глубина терма, составляющего правую часть сппф, должна быть не менее двух. 10.I. Терм, содержащий функциональную константу, не может стоять слева от знака отношения принадлежности, т.е. в левую часть атомарной формулы возможна подстановка только индивидных констант. Ю.2. Если подстановка должна быть произведена в правую часть атомарной формулы, содержащей функцию от Ю. аргументов, т.е. то термы t t t , подставляемые на место переменных, должны иметь одинаковую глубину и одинаковое число аргументов, если глубина не равна нулю. Второе ограничение представляет интерес с точки зрения установления категорий терминов-понятий. Возьмем для сравнения следующее. определение: "Два пропозициональных функтора относятся к одной и той же семантической категории тогда и только тогда, когда они являются функторами от одинакового числа аргументов и когда их соответствующие аргументы относятся к одной и той же семантической категории" I 3.46; с.262]. В рассматриваемом прикладном языке аргументами могут быть, прежде всего, индивидные константы, т.е. термины-понятия естественного языка. Кроме того, в сокращенных ппф это могут быть термы различной глубины. Пусть Ос і а% - термины-понятия, обозначающие некоторые объекты. Тогда выражение S fal) можно отнести к категории "признак объекта", a -f (OL QLIL)- К категории "отношение между объектами". В свою очередь можно рассмотреть категории "признак отношения", "степень признака" и "отношение между признаками", которым соответствуют следующие выражения: Определение II. Логические категории терминов-констант определяются их вхождением в формализованное выражение, представляющее собой правильно построенную формулу прикладного языка. При таком подходе по месту вхождения переменной можно определить категорию терминов-констант, которые могут быть подставлены на ее место.
С точки зрения формализации текста в вопросно-ответной системе рассмотрение взаимосвязи логических категорий с грамматическими представляет несомненный интерес для анализа, исходного текста, в том числе вопроса, а также для поиска и выдачи ответа. Эти проблемы будут подробнее рассмотрены в главе 5. С ограничениями, налагаемыми на подстановку, связаны также свойства единственной предикатной константы - отношения принадлежности. Определение 12. (Аксиоматическое). Свойства отношения принадлежности. 12.0. Нетранзитивность. 12.1. Антирефлексивность: Свойства внутренней графовой модели (описанной ниже в главе 3) требуют введения еще двух аксиом. Аксиома 12.3 указывает на то,, что всякий терм может выступать, как значение функции, или от одного аргумента, или от п.-ки аргументов, но не то и другое вместе: где С ф 0; Л і. Аксиома 12.4 описывает способ введения дополнительной связи, выделяющей на модели все термины-вершины, входящие в состав отдельного суждения: где П І. Указанные свойства отношения принадлежности станут более очевидными при рассмотрении примеров частных (константных) случаев аксиом, которые будут приведены в следующем разделе.
Интерпретация прикладного языка
Каждая ппф логического языка-посредника должна однозначно переводиться в некоторый подграф, удовлетворяющий требованиям, заданным на модели. При этом функциональные константы указывают на типы связей между вершинами, отмеченными индивидными константами, т.е. терминами естественного языка. Данная модель предполагает задание некоторого графового языка, элементами "алфавита", которого служат вершины и соединяющие их дуги, имеющие определенное направление (т.е. ориентированные). Именно характером используемых дуг определяются различия многочисленных вариантов семантических сетей [2.2; 2.II; 3.30; 4.23; 4.31; 4.45J. Число различных типов дуг также сильно колеблется и, как правило, является довольно большим, поскольку таким способом вводятся различные отношения, - лингвистические (глубинные падежи), содержательные (причинные, временные), теоретико-множественные (часть-целое) и другие. Выбор их обуславливается содержанием представляемых текстов. Но, как отмечает Дж.Вейценбаум, - "Задача модели совершенно определенно заключается не в том, чтобы воспроизводить действительность во всей ее сложности, она, скорее, состоит в том, чтобы четко, часто формально, отобразить все являющееся существенным для понимания какого-то аспекта ее структуры или поведения. Слово "существенно"... подразумевает прежде всего учет цели" [з.5; c.20lj. В данном случае существенным является введение единообразного и "равноправного" (т.е. на одном уровне) представления для всех терминов-понятий естественного языка.21.2.Элементарный ппф, с квантором общности, соответствует некоторое конечное множество (класс) подграфов, представляющих все случаи подстановки в исходную формулу.21.3. Элементарный ппф, с квантором существования, соответствует подграф, содержащий неотмеченную вершину.
В связи с наличием трех типов дуг, соответствующих трем функциональным константам, возможны три типа подграфов. Они даны на рис.1 (см.приложение). В данных на рисунке примерах I.I и 1.2 представлены элементарные ппф, образованные функциями )э и t , а также соответствующие им элементарные подграфы. Структура формулы, образованной функцией S , характеризуется тем, что в эту формулу обязательно входит как минимум еще одна функциональная константа, что происходит в силу определения этой функции (см.опр. 13.2.3). Таким образом, функция не образует атомарных формул. Простейшими случаями образования формул с помощью этой функции будут идентификаторы элементарных ппф, т.е. выражения, содержащие кроме вторую функциональную константу (или р или % ). Соответствующие этим двум возможным вариантам примеры даны на рис. I.3-I.4. В этих случаях подграфы уже не являются элементарными. Учитывая вышесказанное, можно дать определение элементарного подграфа в терминах графовой семантики:21.4. Поскольку дуга, связывающая две произвольные вершины, имеет направление, будем эти вершины называть, соответственно, исходящей - ту, из которой выходит стрелка, и входящей - ту, в которую эта стрелка упирается. На основании этого элементарным будет считаться подграф, содержащий не более одной исходящей вершины.
Как уже отмечалось, функция $ играет особую роль в образовании сложных формализованных выражений. С помощью этой функции строится идентификатор формулы, представляющей некоторое суждение. На графовом уровне этому соответствует введение вершины,отмеченной фиктивной переменной, что показано на рис. I.3-I.4. Отношения между графовыми моделями формализованных суждений пред ставляются как отношения между вершинами, отмеченными соответствующими фиктивными переменными. Отношения между такими вершинами, как логические, так и содержательные, используются для выделения на модели некоторого фрагмента. Рассмотрим специфику графовой интерпретации логических связок, которые, в отличие от содержательных отношений, в некоторых случаях не имеют явных аналогов.
Здесь крайне важно подчеркнуть специфику отрицания, которая обязательно должна быть учтена в процессе лингвистического анализа на начальном этапе обработки текста. На существенную неточность лингвистических средств указывает Е.В. Падучева. Она отмечает,что лингвистическое описание предполагает смысловую связь отрицания со словом, т.е. происходит смешение смысла и синтаксиса. Но отрицание относится к высказыванию, и, следовательно, его следует рассматривать как оператор. Поэтому "... Естественным методом внутриязыкового анализа семантического предложения с отрицательными частицами является элиминирование всех отрицательных частиц... путем замены их на лексему НЕВЕРНО ЧТО..." [з.23; с.143-144]. К этому следует добавить, что формализовав сложное выражение такого рода в виде сложной ппф, стоящей под знаком отрицания, мы можем с по мощью логических преобразований опустить это отрицание до элементарных подформул, которым будут соответствовать элементарные подграфы.
Существенное отличие данной модели от обычной логической семантики заключается в том, что "для представления в сети конъюнкции не требуется никаких дополнительных средств, так как по правилам построения сети все ее вершины и дуги по умолчанию связаны знаком конъюнкции" [3.24; C.I68J. Это несколько напоминает случаи перечисления в предложениях естественного языка, когда многократно повторение союза "и" заменяется запятыми.
В свою очередь дизъюнкция и импликация в данной области интерпретируются как средства указания направления поиска. Дизъюнкция дает перечисление возможных вариантов, а импликация показывает переход от одного подграфа к другому. Эквивалентность связывает различные варианты логического описания одного и того же подграфа. Наконец, кванторы, интерпретируемые как конечные конъюнкция и дизъюнкция, ограничивают область поиска. Если представляемая область знаний такова, что логические константы входят в ее состав, как термины этой области, то их можно представить, например, следующим образом. 22.3. Для/Wb , А В, Л В при явном введении логической связки выделяется подграф, соответствующий одной из следующих формул: 1. Если этот квантор относится к фиктивной переменной, которая появляется при использовании функции S , то на графовой модели этому соответствует введение дополнительной вершины, отмеченной фиктивной переменной. 2. Если квантор используется по отношению к обычной переменной, и Лд , .. JifL — все случаи подстановки в формулу Зое Л , то этой формуле соответствует один или несколько элементов класса подграфов: 3. Квантор существования может относиться к переменной,представляющей неизвестное в формализованном вопросе. Этот случай будет подробно рассмотрен в разделе 4.2 (см. опр. 35). Т.Виноград указывает, что семантические сети используются для выражения того, что можно назвать "знанием вообще". Он отмечает специфику семантических сетей, состоящую в том, что ".. они не предназначены подобно символической логике выражать сложные формулы и связки. Скорее они естественным способом выражают простые отношения... Для удачного использования сетей нам следует комбинировать их естественность и простоту для простых случаев с более широкими и мощными средствами других представлений, в том числе, эквивалентных представлений с переменными и кванторами" (4.44; с.472-47з]. Введение вершин, отмеченных терминами-союзами, а не логическими связками, подчеркивает содержательный характер всех отношений, в том числе и тех, которые имеют логические аналоги, и могут быть выделены на уровне логического языка в виде логических констант. Подчеркивание содержательного характера этих связей обусловлено тем, что в данном случае речь идет о прикладном языке, формализующем текст. Определение 23. Непосредственная связь вершин графа» 23.1. Две вершины, отмеченные терминами CL±, &, связаны непосредственно, если и только если истинна формула л такая, что л есть эппф и оба указанных термина входят в состав А ,но в разные ее части (т.е. в левую и правую от знака отношения при надлежности). Например, в формуле вида сс0є 1 (ОІ4.? -, # «-) в соответствующем подграфе вершины 8-і, .,.»,&-п. не связаны между собой непосредственно, но каждая из них имеет непосредственную связь с вершиной &0 (см. рис. 1.2). 23.2. Если имеется формула, образованная функцией /S : Зое где Сс - фиктивная переменная, S(A) индентификатор формулы А , и Ot - подграф, соответствующий формуле А , то вершина, отмеченная фиктивной переменной имеет непосредственную связь со всеми вершинами подграфа Ot . (См. рис. I.3-I.4). Пользуясь введенным понятием можно определить структурные особенности модели, следующие из аксиом для отношения принадлежности, данных в определении 12. Определен и е 24. Графические следствия из аксиом для отношения принадлежности, определяющие модель 7П. как семантическую сеть: 24.1. Две произвольные вершины из Щ или не имеют непосредственной связи вообще, или имеют единственную непосредственную связь. 24.2. Единственная непосредственная связь между двумя вершинами может быть направлена только в одну сторону, и ее направление определено. 24.3. На множестве вершин модели п задано отношение строгого порядка, не являющееся при этом отношением древесного порядка в силу нетранзитивности. Прежде, чем перейти к содержательным примерам, подчеркнем
Предпосылки вопросов
Начиная с К.Айдукевича [3.38J, который ввел это понятие, предпосылку вопроса принято определять как утверждение, истинность которого является необходимым и достаточным условием того, что вопрос имеет истинный ответ. Такое определение представляется недостаточно точным, поскольку истинность предпосылки может быть неизвестна, если вопрос "опережает" развитие данной системы знаний. Именно такой случай должен быть обязательно предусмотрен в вопросно-ответной системе, знания которой, во-первых, строго ограничены, а, во-вторых, могут и должны восполняться и корректироваться в процессе диалога. С этой точки зрения понятие предпосылки вопроса представляет особый интерес как утверждение, содержание которого непосредственно связано с контекстом диалога, а значение - с полнотой знаний системы. М.Новаковская указывает, что для описания семантики диалога обязательно должна фиксироваться не только явно представленная речевая последовательность, но и все предпосылки [4.37J. Учитывая специфику формализованных вопросов введем следующее определение: Определение 35. Предпосылка вопроса, или базис, есть утверждение, представляющее в явной форме содержащееся в вопросе исходное знание, на неопределенность или неполноту которого указывает оператор. Истинность этого утверждения определяется также, как и случае прочих утверждений. Предпосылка не тождественна вопросу не только потому, что является утверждением и может быть оценена с точки зрения истинности. Ее отличия от вопроса состоят также в иной .структуре и функциях в процессе поиска ответа. Р.Иягарден указывает, что "... ситуация, обусловившая предпосылку, никогда не является условием, удовлетворяющим ответу.
И если бы так было, то не было бы повода задавать вопрос" [3.43; с.ЗЗэ]. Это высказывание подчеркивает неправомерность отождествления вопросов с их предпосылками (о чем говорилось в начале предыдущего раздела). Следует особо подчеркнуть различия в таких характеристиках вопроса, как правильность построения и корректность. Первая из них есть синтаксическая (структурная) характеристика самого формализованного вопроса, вторая - семантическая характеристика его предпосылки. Рассмотрим подробнее понятие корректности вопроса. Определение 36. Корректность вопроса. 36.1. Вопрос называется корректным, или правильно поставленным, если его предпосылка истинна. 36.2. Вопрос называется некорректным, если его предпосылка является ложной. 36.3. Корректность не определена, если информация, содержащаяся в предпосылке, выходит за пределы имеющихся знаний, и в этом случае вопрос можно назвать допустимым (аналогично третьему значению истинности, данному в определении 19). Как отмечают Андерсон и Бауэр, вопросы с ложными предпосылками представляют собой одну из проблем, возникающих при формулировании ответов 3.40; с.4I3-4I4J. Они указывают, что в таком случае человек отвечает "глупо", а ЭВМ выдает ответ "не знаю". В связи с различием, введенным в определении 36 (пункты 2 и 3), представляется необходимым также отличать ответы на некорректный и допустимый вопросы. В первом случае в ответе следует указать на обнаруженную ложность предпосылки, во втором, случае должен быть, выдан ответ типа "не знаю". Разные типы вопросов имеют различающиеся по структуре предпосылки. Поскольку сложные вопросы сводятся к простым, здесь и далее будут рассматриваться только простые вопросы. Напомним, что выделению на модели подграфа в языке РЯБ соответствует введение идентификатора. В случае формализованных вопросов I типа предпосылкой является предположение о наличии некоторой ситуации (подграфа), выделению которой на модели соответствует введение инден-тификатора ппф, истинность которой подвергается сомнению. Формализованная предпосылка вопроса - "Верно ли, что Иванов написал книгу?" будет иметь вид: 3oz{ х е я С написал, т (Иванов, книга))). В случае вопроса, содержащего дополнительную информацию, связанную с логическим ударением, эта информация включается в предпосылку, также путем присоединения с помощью строгой дизъюнкции. В этом случае предпосылка имеет вид дизъюнктивного объедине ния двух формул, каждая из которых связана квантором существования. Рассмотрим более сложный пример: "Верно ли, что продолжает идти дождь?" (?) (продолжает е jb ( 3 (идет, jb (дождь)))). В этом случае формализованная предпосылка будет иметь вид: 2ос (осСр (продолжает, Ь ( S (идет, Ь (дождь)))). В связи с данным примером следует отметить, что сам термин "продолжать" несомненно относится к группе терминов, связанных с понятиями о времени, и может служить ключевым в подобных ситуациях. Введение временных характеристик и определение термина "продолжать" с помощью некоторой прикладной аксиомы, позволило бы автоматически дополнить данную предпосылку еще одним утверждением: "Дождь шел".
В естественном языке постоянно встречается такое дополнительное утверждение, которое выделяется только на основании некоторых знаний, но не на основании явно присутствующих элементов. В вопросно-ответной системе роль дополнительных знаний, позволяющих выявлять информацию такого рода, играют прикладные аксиомы. Рассмотрим предпосылки формализованных вопросов П типа. Предпосылкой вопроса - "Кто построил дом?" ( а ) (построил е t (ее , дом)) будет следующее выражение: Зое (построил г (ос , дом)). Такая предпосылка означает предположение, что "существует некто, построивший дом". В данном случае (в отличие от I типа) переменная, связанная квантором существования, не является фиктивной. Предпосылка истинна, если истинна ппф, получаемая в результате подстановки на место этой переменной. Таким образом, определение истинно