Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Автоматизированный анализ текста на основе вероятностно-статистической модели и его применение в региональном законотворчестве Мячина Елена Владимировна

Автоматизированный анализ текста на основе вероятностно-статистической модели и его применение в региональном законотворчестве
<
Автоматизированный анализ текста на основе вероятностно-статистической модели и его применение в региональном законотворчестве Автоматизированный анализ текста на основе вероятностно-статистической модели и его применение в региональном законотворчестве Автоматизированный анализ текста на основе вероятностно-статистической модели и его применение в региональном законотворчестве Автоматизированный анализ текста на основе вероятностно-статистической модели и его применение в региональном законотворчестве Автоматизированный анализ текста на основе вероятностно-статистической модели и его применение в региональном законотворчестве
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Мячина Елена Владимировна. Автоматизированный анализ текста на основе вероятностно-статистической модели и его применение в региональном законотворчестве : диссертация ... кандидата технических наук : 05.25.05.- Москва, 2002.- 188 с.: ил. РГБ ОД, 61 03-5/1512-8

Содержание к диссертации

Введение

Глава 1. Проблемы и задачи регионального законотворчества 10

1.1. Проблема качества регионального закона 10

1.1.1. Конституционность и законность 12

1.1.2. Концепция и содержание 13

1.1.3. Форма регионального закона 16

1.2. Механизмы повышения качества регионального закона 17

1.2.1. Правовая экспертиза проекта 18

1.2.2. Лингвистическая обработка проекта 20

1.2.3. Использование информационных технологий 21

1.3. Постановка задачи анализа текста регионального законопроекта с использованием автоматизированной системы 25

1.3.1. Функции и организационно-технические проблемы анализа регионального законопроекта 25

1.3.2. Механизм автоматизированной поддержки анализа регионального законопроекта 30

1.3.3. Задачи автоматизированного анализа регионального законопроекта ...32

Выводы 33

Глава 2. Вероятностно-статистическая модель тематического анализа текста и ее применение в региональном законотворчестве 36

2.1. Исследование моделей порождения и восприятия текста 36

2.1.1. Социально-психологический анализ текста 37

2.1.2. Алгоритмические способы реализации социально-психологического анализа текстов 39

2.1.3. Психолингвистический подход к анализу текстов 45

2.1.4. Алгоритмические способы реализации психолингвистического анализа 47

2.2. Вероятностно-статистическая модель тематического анализа текста 55

2.2.1. Формальное описание модели 56

2.2.2. Параметры модели 60

2.2.3. Методика предметного анализа и классификации законопроекта... 62

2.2.4. Методика построения логико-фактологической структуры нормативного документа на основе вероятностно-статистической модели 65

2.2.5. Процедура формирования массива правовых актов по содержательному критерию 69

Выводы 76

Глава 3. Лингвистический анализ текста регионального законопроекта 79

3.1. Особенности текста регионального закона 79

3.1.1. Функциональное назначение 79

3.1.2. Стандартизация оформления и структуры 83

3.1.3. Стандартизация лексики и языковые требования

к оформлению реквизитов 84

3.2. Редактирование текста регионального законопроекта 88

3.2.1. Логико-смысловой анализ текста 89

3.2.2. Проверка фактического материала и стилистическая правка 91

Выводы 94

Глава 4. Реализация вероятностно-статистической модели тематического анализа текста 96

4.1. Автоматизированная система поддержки законотворческой деятельности Тульской области 96

4.1.1. Назначение, функции и структура 96

4.1.2. Режимы работы 105

4.1.3. Программно-техническое обеспечение 107

4.1.4. Нормативно-правовое обеспечение функционирования 109

4.2. Классификация законопроекта 113

4.2.1. Краткое изложение методики классификации с использованием автоматизированной системы 113

4.2.2. Результаты автоматизированной классификации текстов 114

4.3. Формирование массива правовых актов по содержательному критерию 115

4.3.1. Основные положения методики выполнения экспертизы 115

4.3.2. Примеры использования сформированного массива при экспертизе регионального законодательства 117

4.4. Перспективные направления развития системы 120

4.4.1. Автоматизация функций лингвистической экспертизы 120

4.4.2. Определение направлений региональной законотворческой деятельности на основе анализа документов федерального уровня 122

Выводы 123

Заключение 126

Список использованной литературы

Механизмы повышения качества регионального закона

В соответствии с Конституцией РФ в нашей стране существует как федеральное законодательство, так и законодательство субъектов федерации, включающее законы и иные нормативные правовые акты [1]. Ведущая роль в региональном законодательстве принадлежит законам. Они обладают второй по значимости после Конституции или Устава субъекта федерации юридической силой. В соответствии с региональными законами, на их основе принимаются другие нормативные правовые акты субъектов федерации. В связи с тем, что региональное законодательство стало возможным после принятия действующей Конституции РФ и существует лишь несколько лет, актуальной является проблема обеспечения его надлежащего качества.

Проблему качества регионального законодательства правомерно ставить и решать, прежде всего, как проблему качества региональных законов. Под качеством принято понимать совокупность свойств, признаков, особенностей, отличающих предмет или явление от других, придающих ему определенность [2]. Признаки качества регионального законодательства могут быть сформулированы в виде требований.

В постановке и решении проблемы качества региональных законов возможны два подхода. Один из них исходит из того, что разрабатываемые и принимаемые законы по своим качественным характеристикам должны быть такими же, как принятые и действующие. Подобная практика рассмотрения действующих региональных законов как образцов законов существует в федеративных государствах, где законотворчество субъектов имеет большую историю, богатый опыт, прочные традиции. Например, в штате Миссисипи юристы законопроектных органов используют в своей работе Руководство по подготовке законопроектов. Оно представляет собой методические указания на 180 страницах, детально излагающие порядок составления текста будущего закона на конкретных примерах разработки законопроектов, уже ставших законами. Такие руководства есть и в парламентах некоторых других штатов США. Но для нашей страны такой подход к обеспечению качества неприемлем, поскольку еще не сложилось региональное законодательство достаточного качества. Региональные законы не всегда соответствуют Конституции РФ и федеральным законам. Содержание законов субъектов РФ также не всегда дает ясное представление о целях их принятия. Зачастую региональные законы повторяют то, о чем уже сказано в федеральных законах, в Конституции или Уставе субъекта федерации. Механизмы реализации их положений не устанавливаются с должной конкретностью и определенностью. При этом многие законы перегружены описательными суждениями, декларациями. Следовательно, требуется не сохранение в региональном законотворчестве качественных характеристик уже существующих законов, а значительное совершенствование их качества. При этом важно определить признаки надлежащего качества, сформулировать соответствующие требования к законопроектам и законам.

Эти признаки и требования группируются в зависимости от того, к каким аспектам качества регионального закона они относятся. Таких аспектов можно выделить три: конституционность и законность как предметное и содержательное соответствие регионального закона другим источникам федерального и регионального законодательства; адекватность концепции регионального закона той роли в общественной жизни, которую он как источник права должен выполнять, и основанное на концепции содержание закона, юридические средства, обеспечивающие достижение целей его принятия; форма изложения содержания закона, обеспечивающая его точность и ясность, удобство в использовании закона как юридического документа.

Самым радикальным средством обеспечения качества региональных законов может быть четкое, конкретное, ясное определение всей совокупности требований по каждому из обозначенных аспектов. Эти требования целесообразно зафиксировать в законодательстве о нормативных правовых актах, устанавливающем своего рода стандарты каждой их разновидности.

Конституционность и законность регионального закона означают необходимость соответствия регионального закона Конституции РФ и федеральным законам, Конституции или Уставу субъекта РФ и тем региональным законам, из содержания которых следует необходимость соответствия им других законов и иных нормативных правовых актов данного субъекта федерации. Конституционность и законность регионального закона имеют два аспекта: предметный и содержательный. Закон должен соответствовать обозначенным выше нормативным правовым актам как с точки зрения правотворческих полномочий субъекта федерации и, следовательно, предмета регулирования, так и с точки зрения содержания установленной данным законом юридической регламентации.

Так, согласно Конституции РФ, региональный закон не может регулировать общественные отношения, являющиеся предметами ведения Российской Федерации, поскольку по этим вопросам издаются федеральные конституционные законы и федеральные законы прямого действия. Региональные законы принимаются по предметам совместного ведения Российской Федерации и ее субъектов, а также по вопросам, находящимся вне пределов федерального и совместного ведения (предметы ведения субъектов федерации). Региональные законы по предметам совместного ведения принимаются в соответствии с изданными по предметам совместного ведения федеральными законами.

Содержание регионального закона по предмету совместного ведения основывается на правовых принципах, общих началах законодательства и не может противоречить содержанию соответствующего федерального закона. Региональный закон не должен ограничивать предусмотренные федеральным законодательством права физических и юридических лиц, но может расширить перечень таких прав, установить дополнительные по сравнению с федеральным законодательством гарантии. Содержание регионального закона не должно противоречить содержанию Конституции или Устава соответствующего субъекта РФ.

Алгоритмические способы реализации социально-психологического анализа текстов

Суть предложенного метода состоит в том, что в качестве модели предложения используется левосторонняя грамматика и соответствующий ей стековый анализатор. Такой анализатор действует одновременно в двух направлениях: «сверху вниз», пытаясь «достроить» текущую предполагаемую лексическую структуру, и «снизу вверх», подбирая интерпретацию для текущего анализируемого терма. На каждом шаге работы такого анализатора возможно выполнение одного из трех действий: удаление из стека сформированной «верхней» лексической структуры и присоединение текущего терма к «верхней» в стеке, либо добавление в стек новой лексической структуры. Если при анализе формальных языков на каждом шаге анализа выбор действия всегда однозначен, то для естественного языка это далеко не так. Поэтому в модели PLCG каждому из трех действий ставятся в соответствие вероятности, зависящие от состояния стека.

Результаты сравнительных испытаний, приведенные в [46], свидетельствуют о том, что PLCG-анализатор обеспечивает на 4-5% более высокую точность анализа по сравнению с другими известными разработками, основанными на традиционной модели PCFG. Необходимо отметить, что левосторонние грамматики и стековые анализаторы для формальных языков давно известны и широко используются в теории синтаксического анализа и компиляции [47]. 2.1.4.2. Метод генетических алгоритмов

Концепция оригинального морфологического и синтаксического анализатора предложена в работах [48, 49, 50]. Идея предложенного метода состоит в том, чтобы на этапе разработки анализатора не закладывать в него лингвистических знаний за исключением простейших, а дать возможность приобрести (сформировать) их самостоятельно во время работы. При этом анализатор самостоятельно изменяет свой набор правил в зависимости от результата разбора очередного фрагмента.

Приближенно эту идею можно представить так. Перед выполнением очередного шага анализа имеются правила: А - BCD; А - EF; М -+NP. Пусть при анализе некоторого фрагмента первое и второе правила оказались применимыми, а третье правило - нет. В этом случает анализатор может сгенерировать новое правило, в правой части которого будут комбинироваться термы из правой части всех подошедших правил, а левая часть останется неизменной. Например, может быть создано правило А — ECD. Новое правило называется «потомком», а старые, термы из которых участвовали в формировании нового правила, - его предками. Комбинирование термов происходит случайным образом, и даже, возможно, с добавлением некоторых случайных термов, не входивших в правила-предки. Такой механизм порождения правил автор назвал «генетическим». После добавления нового правила весь набор правил снова применяется к фрагменту текста, затем по некоторому критерию отбираются правила с наилучшей применимостью, от них порождаются правила-потомки и итерация повторяется. Время от времени выполняется контроль качества анализа, достигаемого очередным поколением правил-«генов». Важной частью метода является численный критерий, используемый для оценки «применимости» правил и качества анализа.

Исследования, описанные в [49], проводились вплоть до 50-го поколения правил. При этом отмечался достаточно стабильный рост качества анализа, однако, форма представленных графиков зависимости качества от номера поколения позволяет предположить замедление темпов роста для поколений старше 50-го. Описанный метод заслуживает серьезного внимания, но к практическому применению он пока не готов, о чем косвенным образом свидетельствуют приведенные в [48, 49] сравнительные показатели качества работы генетического анализатора. 2.1.4.3. Метод распознавания образов

Еще одна концепция вероятностного анализатора представлена в работе Д. Магермана «Естественно-языковой анализ как задача статистического распознавания образов» [51]. В этой работе рассматриваются вопросы, связанные с «обучением» и использованием статистического распознавателя, использующего алгоритм максимального правдоподобия для построения дерева решений. Под обучением в данном случае понимается формирование списка ключевых проверок и весовых коэффициентов для каждого из узлов дерева. Обучение программы-

анализатора проводится автоматически путем анализа банка синтаксических структур (treebank). Банк синтаксических структур (БСС) может быть получен в результате синтаксического разбора достаточно большого количества текстового материала по данной предметной области. За рубежом активно используется несколько общедоступных БСС, в частности, Lancaster Treebank (информация по компьютерной тематике), Perm Treebank (финансовая и деловая информация) и др.

Алгоритм создания банка синтаксических структур для русского языка на основе обучения вероятностного анализатора, использующего метод дерева решений предложен в работах отечественных специалистов [52, 53]. Разработчики интерпретируют его суть как классическую задачу распознавания образов с той лишь разницей, что под образом понимается набор морфологических параметров терма или синтаксическая структура предложения, а эталонные образы вместе с параметрами, необходимыми для их идентификации хранятся в банке синтаксических структур.

Описание задачи синтаксического анализа, использующего метод дерева решений сводится к построению синтаксической структуры Г, которая бы являлась наиболее вероятной для анализируемой структуры S. Вероятность структуры Т определяется как сумма вероятностей структур Td, изоморфных Т и построенных всеми возможными путями d:

Функциональное назначение

Согласно психолингвистической модели, предложенной во второй главе, при анализе текста в сознании субъекта правовой деятельности происходит опознание и удержание в памяти значимых семантических компонентов, которые затем синтезируются в некоторые тематические образы, имеющие смысловые связи (п.2.2.1). Если в процессе синтеза при первоначальном чтении документа возникает остановка, то это означает потерю смысловой связи и наличие логико-смысловой ошибки, которую необходимо исправить. Затрудненное восприятие текста не может служить основанием для того, чтобы признать все предложения текста стилистически правильными. Специалистами отмечены типичные ошибки, нарушающие логику текста и мешающие пониманию его смысла [83, 87, 88].

Если автор текста придает лексической конструкции особый смысл и добивается сосредоточения внимания на ней адресата, то он использует логическое ударение. Под логическим ударением в тексте законопроекта будем понимать слово или словосочетание, выделяемое при прочтении для усиления его смысловой нагрузки в предложении. В письменной речи оно, обычно «падает» на последнее слово (например, «решение было принято единогласно» и «единогласно было принято решение»). Существует несколько приемов выделить семантически значимое в тексте. Например, выделить важное в смысловом отношении слово или словосочетание с помощью введения специальных слов-усилителей: частицы «именно», «лишь», союз «и», наречий «чрезвычайно», «абсолютно» или использовать противопоставление, выраженное с помощью конструкций с соотносительными элементами, «не только ..., но и ...», «как ..., так и ...» и др.

Названные приемы допустимы к использованию в дефинитивной статье закона, а для содержательной части текста, соответствующей требованию сжатости и лаконичности (п.3.1.1), наиболее приемлем перенос слова в ударную позицию («на основе Закона РФ «Об образовании» осуществляется правовое регулирование системы начального профессионального образования» — «правовое регули 90 рование системы начального профессионального образования осуществляется на

основе Закона РФ «Об образовании»).

Еще одна из распространенных ошибок, значительно влияющих на формирование глобального тематического образа текста - ошибочная смысловая связь в предложении или в темообразующем контексте. В этом случае необходимо найти ошибочную смысловую связь, установить правильную и сблизить элементы правильной смысловой связи или необходимо заменить слова, образующие ошибочную смысловую связь.

Существенным недостатком текста, отрицательно сказывающимся на результате восприятия, является пропуск логического звена или структурно необходимого элемента, что возникает, как правило, при употреблении неполных предложений. Например, пропуск пояснительных слов, относящихся к причастию («имеющиеся недостатки» — «имеющиеся в работе недостатки»), пропуск второстепенных членов предложения, пропуск слов в устойчивых словосочетаниях («... сообщил, как претворяются решения совета» —» «... сообщил, как претворяются в жизнь решения совета», пропуск средств связи придаточной части сложноподчиненного предложения с главным («... указание, чтобы ...» — «... указание о том, чтобы ...»).

Однако полнота законодательной речи не должна приводить к избыточности используемого правового языка. Текст должен быть одновременно полным и самодостаточным.

Смысловые отношения в тексте нарушаются, если нарушена логика изложения материала. Логическая связь между суждениями выражается специальными средствами: союзами, союзными словами и оборотами, специальными предложениями [19]. На установление логических отношений, смысловое деление фразы оказывают влияние и знаки препинания [92]: - запятая в ряду однородных членов должна указывать на логическую однородность перечисляемых понятий, их смысловую однотипность; - двоеточие подразумевает либо объяснительные, либо причинные отношения между частями; - тире указывает на отношения следствия; - скобки указывают на то, что помещенная в них информация носит вторичный, дополнительный характер по отношению к главной; - кавычки - знак «чужеродности» заключенных в них слов, словосочетаний и фраз в основном тексте.

В приложениях 2, 3 представлены сформированные по результатам анализа текстов законопроектов краткий словарь-справочник управлений и языковые средства организации связного текста [93].

Таким образом, логико-смысловой анализ текста на этапе лингвистической экспертизы законопроекта устанавливает логические отношения между основными смысловыми компонентами текста посредством исключения логических и смысловых ошибок, определения значения и правильности употребления языковых средств организации связанного текста и «смысловых» знаков препинания.

Проверка фактологических сведений является составной частью лингвистической экспертизы. Она предназначена для установления достоверности фактического материала, включенного как в текст законопроекта, так и в сопроводительные документы. Выполнение ее требует уточнения по справочникам и документам правовой, цифровой, географической информации, названий и обозначений, фамилий и инициалов ответственных лиц. При этом важны навыки использования современных информационных технологий, повышающих эффективность законотворческой деятельности [94].

Для осуществления языковой и стилистической правки необходимо владеть двумя техническими приемами. Первый заключается в сопоставлении каждой исправленной фразы с первоначальным вариантом с точки зрения появления или утраты смысловых оттенков или значений. Второй прием - обязательное сопоставление каждой исправленной фразы с предшествующей и последующей с целью установления композиционной целостности текста. Лингвистический анализ документов, используемых в органах государственной власти [71, 87] показывает, что существуют наиболее типичные ошибки законодательной речи, возникающие из-за особенностей официально-делового стиля (приложение 4): - лексические - неправильное использование слов и терминов; неуместное употребление иностранных слов; наличие слов, несущих избыточную информацию; неразличение слов-паронимов (близких по звучанию, но различающихся значением); ошибки в употреблении слов-синонимов; неправомерное употребление архаизмов и неологизмов; морфологические - неправильное употребление формы имени существительного, ошибки при употреблении полной и краткой форм имен прилагательных, ошибки при употреблении количественных имен числительных; ошибки, связанные с формами образования глагола; неправильное употребление предлогов; синтаксические - неправильное использование устойчивых словосочетаний; неправильное употребление падежа и предлога после управляющих слов; неправильное согласование слов в роде, числе и падеже; неправильный порядок слов в предложении.

С учетом названных в третьей главе типичных логических, стилистических, грамматических ошибок и приемов их исправления предложим схему лингвистического анализа законопроекта (рис. 13), в которой представлены: структурные компоненты текста - темообразующие контексты, предложения, лексические структуры и т.д.; составляющие анализа - логико-смысловой, фактологический, стилистический и грамматический, процедуры - установление, проверка и т.д. и информация о том, на что данная процедура направлена. Разработанная схема лежит в основе методики выполнения лингвистической экспертизы.

Лингвистический анализ текста и устранение перечисленных ошибок способствуют грамотному оформлению материала, улучшению стиля законопроекта, адекватному восприятия его содержания и, в конечном счете, определяют лингвистический аспект качества регионального закона.

Краткое изложение методики классификации с использованием автоматизированной системы

Система функционирует на персональных компьютерах IBM PC с процессорами не ниже 486DX2-66, оперативной памятью не менее 32 Мбайт и жесткими дисками не менее 1 Гбайта, объединенных локальной вычислительной сетью, под управлением операционной системы Windows, версии, не ниже Win 95. Хранилище данных организовано в виде SQL базы данных, размещенной на сервере управления делопроизводства. Подключение к полнотекстовым базам правовых актов департамента информатизации осуществляется через драйверы ODBC.

Нормативно-правовое обеспечение функционирования системы состоит из федеральных и региональных документов. Оно дополнено проектом постановления администрации области «Об информационных ресурсах Тульской области, содержащих правовую информацию» и изменениям и дополнениям к инструкции по делопроизводству в части, касающейся подготовки и регистрации законопроекта.

Методическое обеспечение системы включает инструкцию по формированию и ведению электронной базы правовых актов, указания по подготовке и оформлению текстов законопроектов с использованием средств вычислительной техники; по процедуре классификации правовых документов; по выполнению экспертизы правового документа с использованием автоматизированной системы; по работе с электронной базой правовых актов.

В работе сформулированы основные положения методик классификации законопроекта и использования автоматически сгенерированного массива правовых актов при выполнении экспертизы на примере отдельных документов.

Результаты автоматической классификации региональных законов почти в половине случаев (56%) совпадают с результатами ручной классификации, в трети случаев (32% ) они дополняют или уточняют исходные сведения об отраслях законодательства и в 12 процентах изменяют исходный результат. Объемы автоматически сформированных документационных массивов, используемых при выполнении экспертизы, уменьшены до значений, не превышающих 2 процента от общего объема имеющейся правовой базы данных.

Разработанная автоматизированная система допускает возможность свого развития. Одно из направлений - включение процедуры вычисления лингвистических характеристик текста, что требует дополнительного исследования стилистических особенностей текстов правовых документов.

Основные положения предложенной в настоящей работе модели тематического анализа могут быть использованы для расширения области применения информационных технологий, в частности, для планирования законотворческой деятельности.

В диссертационной работе определены механизмы повышения качества регионального закона, названы объемы электронных информационных фондов, обеспечивающих подготовку и экспертизу правового документа, и перечислены существующие проблемы их использования: недостаточное нормативно-методическое и организационное обеспечение процесса экспертизы, высокая трудоемкость классификации правовых актов, субъективный характер формирования поискового запроса и не вполне адекватное отрасли права представление результата поиска. Предложенный механизм автоматизированной поддержки предполагает автоматическое выполнение анализа текста с целью его дальнейшей классификации, а также формирование массива правовых актов по содержательному критерию.

В работе подробно освещены существующие научные и алгоритмические методы автоматизированного анализа текстов и на основе существующей в современной психолингвистике модели образного восприятия текстов предложена вероятностно-статистическая модель анализа законопроекта. Для решения проблем использования информационных технологий в практике законотворчества разработаны методики предметного и содержательного анализов текста, использующие основные положения модели - предметность образа правового регулирования, возникающего в сознании человека, изучающего документ, и представление психолингвистики о деятельностной сущности документа.

Процедуре формирования массива правовых актов по содержательному критерию в диссертационной работе также ставится в соответствие процесс отображения в сознании реального мира, который стоит за текстом и изменяется в процессе прочтения. В работе определена структура документационного правового пространства - объекты и отношения между ними и обоснован выбор критерия релевантности документов по отношению к информационному запросу.

Для решения вопросов лингвистической экспертизы законопроекта, а также его адекватного восприятия автоматизированной системой определены требования к оформлению, структуре, лексике и реквизитам текста, послужившие осно вой создания электронного шаблона, и предложена схема лингвистического анализа.

Практической реализацией разработанных научных положений является автоматизированная система поддержки законотворческой деятельности, основные характеристики которой изложены в последней главе. Представленные результаты тестирования подтверждают правильность разработанных методов.

Таким образом, в результате проведенного диссертационного исследования получены следующие научные и практические результаты:

1. выполнен анализ проблем информационного обеспечения регионального законотворчества и предложен механизм автоматизированной поддержки законотворческой деятельности;

2. на основе психолингвистической модели восприятия текстов и информативно-целевого подхода к анализу текстов предложена и обоснована вероятностно-статистическая модель тематического анализа текста правового документа;

3. используя положения предложенной модели, разработана методика предметного анализа для использования его в задачах автоматической классификации законопроектов и методика содержательного анализа для формирования поискового запроса в информационно-справочной системе;

4. предложена и обоснована процедура формирования массива правовых документов, содержательно ориентированная относительно анализируемого текста;

5. выполнен анализ требований к оформлению текста законопроекта, структуре, лексике и реквизитам и предложена схема лингвистического анализа;

6. разработан макет автоматизированной системы поддержки законотворческой деятельности и методика ее использования.

В процессе решения основных задач диссертационного исследования были также разработаны проекты постановлений об информационных ресурсах, содержащих правовую информацию и о подготовке и регистрации законопроектов, сопроводительных материалов и законов области, а также ряд методических материалов. Методика применения автоматизированной системы пояснена конкретными примерами анализа существующего законодательства.

На основании проведенной работы можно сделать вывод о полном решении поставленных в диссертационном исследовании задач. Основные научные и прак 128 тические результаты могут быть использованы для дальнейшего развития автоматизированной правовой информационной системы.

Следует отметить, что полученное в результате исследования модельное представление образного восприятия правового текста может быть использовано для анализа текстов любого содержания в автоматизированных информационных системах различной целевой направленности.

Похожие диссертации на Автоматизированный анализ текста на основе вероятностно-статистической модели и его применение в региональном законотворчестве