Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Интеллектуализация информационного обеспечения САПР РЭУ на основе мировых сетей Уланов Александр Сергеевич

Интеллектуализация информационного обеспечения САПР РЭУ на основе мировых сетей
<
Интеллектуализация информационного обеспечения САПР РЭУ на основе мировых сетей Интеллектуализация информационного обеспечения САПР РЭУ на основе мировых сетей Интеллектуализация информационного обеспечения САПР РЭУ на основе мировых сетей Интеллектуализация информационного обеспечения САПР РЭУ на основе мировых сетей Интеллектуализация информационного обеспечения САПР РЭУ на основе мировых сетей Интеллектуализация информационного обеспечения САПР РЭУ на основе мировых сетей Интеллектуализация информационного обеспечения САПР РЭУ на основе мировых сетей Интеллектуализация информационного обеспечения САПР РЭУ на основе мировых сетей Интеллектуализация информационного обеспечения САПР РЭУ на основе мировых сетей
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Уланов Александр Сергеевич. Интеллектуализация информационного обеспечения САПР РЭУ на основе мировых сетей : Дис. ... канд. техн. наук : 05.13.12 : Москва, 2005 156 c. РГБ ОД, 61:05-5/1570

Содержание к диссертации

Введение

Глава 1. Исследование вопросов состояния и развития систем информационного обеспечения автоматизированного проектирования изделий персональной электроники 9

1.1 Аналитический обзор средств автоматизированного проектирования РЭС 9

1.2 Постановка, обоснование и анализ задачи исследования 16

Выводы из главы 35

Глава 2. Разработка подхода к формированию знаний и модели процесса информационного обеспечения САПР РЭУ 37

2.1 Синтез принципа извлечения знаний из информационной среды Интернет 37

2.2 Концептуальная модель АСИППП 42

Выводы из главы 50

Глава 3. Разработка метода интеллектуализации информационного обеспечения САПР и требований к организации АСИППП 51

3.1 Оптимизационная модель выбора метода поиска информации 51

3.2 Оптимизационная модель выбора поискового средства 54

3.3 Построение онтологии системы АСИППП 74

3.4 Организация формирования запроса 98

3.5 Организация анализа документов 101

Выводы из главы 122

Глава 4. Экспериментальное исследование вопросов эффективности применения АСИППП 123

4.1 Анализ порядка расчета вероятностных показателей методов поиска 123

4.2 Экспериментально-статистическая оценка эффективности применения АСИППП 127

Выводы из главы 135

Заключение 136

Библиографический список использованной литературы 138

Приложение 148

Введение к работе

Актуальность выбранной темы.

Wy Одной из задач, возникающей при проектировании РЭС, является задача

информационного обеспечения процесса проектирования. Особо важной эта задача является на начальных стадиях проектирования, в том числе при разработке технического задания, когда ведется сбор и накопление знаний о проектной ситуации, условиях, в которых будет эксплуатироваться объект, его аналогах. На дальнейших этапах проектирования необходимы сведения об элементной, ко нет-

руктивнои и технологической базе, о моделях и методах расчета различных узлов

разрабатываемого изделия. Дополнительные трудности в эту ситуацию вносит непрерывное устаревание полученных знаний в результате внедрения в практическое использование достижений научно-технической и информационной революции, происходящих в настоящее время и приведших к увеличению темпов накопления новых знаний. Становится трудно найти информацию не по причине ее отсутствия или ограниченного доступа к ней, а по причине ее избыточности. По-

' этому получение, отбор и приспособление информации к требованиям дня ста-

новится столь же важным, как и ее создание.

Однако в настоящее время не существует не только средств автоматизированного решения задачи информационного обеспечения, входящих в состав систем автоматизированного проектирования (САПР), но и просто формализованно-

" го метода извлечения информации (знаний) из источников, расположенных вне

среды проектирования.

~

5 Таким образом, актуальность темы исследования продиктована

необходимостью создания средств автоматизированного получения информации

при решении задач проектирования.

Цель и задачи исследования. Цель диссертации — разработать принцип автоматизированного информационного обеспечения САПР с использованием мировых сетей и метод формирования знаний, применение которых позволило бы снизить затраты на проектирование при улучшении качества проектирования.

Задачи исследования. Исходя из указанной цели исследования, его основными задачами являются:

1. Проанализировать известные средства информационного обеспечения
процесса проектирования, выявить, в какой степени они обеспечивают решение
существующих задач проектирования, решение каких задач не обеспечивается
или обеспечивается недостаточно эффективно и как можно повысить эффектив
ность работы САПР за счет улучшения информационного обеспечения проекти
рования.

2. Разработать метод интеллектуализации информационного обеспечения
процесса проектирования РЭС.

3.Предложить модель процесса информационного обеспечения САПР РЭС,

4. На основе предложенной модели создать прототип автоматизированной системы поддержки процесса проектирования (АСИППП).

Методы исследования. При выполнении работы использованы методы дедукции, индукции, системного анализа, метод комплексного подхода, методы

теории оптимизации, теории принятия решения, теории анализа, теории автоматизированного проектирования, имитационного моделирования, методы булевой логики.

Научная новизна работы:

1. Принцип автоматизированного извлечения знаний из сети Интернет, ос
нованный на применении онтологии проектирования при построении информа
ционного запроса, отличающийся возможностью применения для информацион
ного обеспечения САПР и экспертных систем (ЭС) и позволяющий повысить
эффективность процесса проектирования.
щл 2. Метод автоматизированного извлечения знаний из информационной сре-

ды на базе модели АСИГШП, отличающийся использованием знаний о семантике процесса проектирования в организации баз знаний (БЗ) САПР и ЭС,

3. Модель АСИГШП, основанная на разработанном принципе, отличаю
щаяся высокой релевантностью выходной информации и позволяющая вести ав
томатизированный информационный поиск в условиях низкой структурирован
ности и высокой зашумленности информационной среды.
*" 4. Метод построения онтологии, отличающийся адаптивностью к предмет-

ной области «проектирование РЭС» и позволяющий использовать его при построении АСИГШП.

Практическая ценность работы заключена в разработке программно-
методического комплекса (ПМК), построенного на основе предложенных в рабо-
те модели и методов и используемого для улучшения учебного и реального про-

цессов проектирования.

7
Структура и объем работы. Работа состоит из введения, четырех глав, за
ключения, списка литературы из 108 наименований и двух приложений. В со
став работы входит 15 таблиц, 21 рисунок и 159 страниц текста.
W Основные положения диссертации опубликованы в следующих работах:

  1. Уланов А.С. Поиск знаний в Интернет: Вестник Воронежского государственного университета. Научно-технический журнал/ВГУ - В., 2003 г. (Сер. «Проблемы качества подготовки специалистов», №6.3)

  2. Сахаров Ю.С. Уланов А.С. Исследование некоторых подходов к построению САПР изделий персональной электроники: Межвуз, Сб. Науч. ТрУВГУ -

Ш\ В., 2003г.

  1. Уланов А.С. Обзор систем информационного поиска в среде Интернет: Межвуз. Сб. Науч. Тр./ВГУ- В., 2004г.

  2. Уланов А.С. Экспериментальное исследование вопросов применения системы формирования знаний: Межвуз. Сб. Науч. ТрУВГУ - В., 2004г.

  3. Уланов А.С. Требования к организации и способы построения системы информационного обеспечения автоматизированного процесса проектирования:

'*" Межвуз. Сб. Науч. ТрУВГУ - В., 2004г.

В первой главе приведен аналитический обзор известных САПР, подходов и методов их построения, выбрано направление достижения поставленной цели диссертации. Произведен анализ существующих методов получения информации из Интернет, сформулированы основные требования и критерии оценки средств информационного поиска, выполнен анализ существующих в настоящее время систем информационного поиска.

Во второй главе предлагается концептуальная модель и подходы к построению АСИППП.

В третьей главе исследуется вопрос оптимизации выбора метода и средства поиска информации и разработки метода формирования знаний.

В четвертой главе приводится анализ эффективности предложенной модели АСИППП с ее апробированием на конкретной задаче.

В заключении формулируются результаты диссертационного исследования.

В приложениях приведены возможный состав банка страниц АСИППП и выдержки из программы «Электронные библиотеки России».

Постановка, обоснование и анализ задачи исследования

Поскольку знание о проектировании = {Q, Е, } состоит из знаний об объекте проектирования {О,}, методах проектирования {Е} и средствах проектирования {4у}, то при решении задач проектирования РЭС постоянно возникает необходимость в следующей информации:

1. Сведения об аналогах проектируемого устройства (технические характери стики, использованные конструктивные и схемотехнические решения). 2. Сведения о среде, в которой предстоит работать проектируемому объекту (климатические условия, техническая система, в состав которой будет входить объект, порядок взаимодействия "человек-машина"). 3. Сведения об элементной базе, в особенности об ее обновлениях. 4. Сведения о методиках расчета конструкции, испытательных методиках и оборудовании, о технологических возможностях производства и т.д. 5. Сведения о различных программных продуктах.

Традиционно задача информационного обеспечения процесса проектирования решалась либо путем консультаций со специалистами и экспертами, либо путем поиска ответов в печатной литературе (справочники, периодические издания, учебники, научные публикации). В последние 5-7 лет к данным источ-никам добавился еще один - Интернет. Вскоре он стал полноправным конку рентой традиционных библиотек и в будущем, вероятно, полностью вытеснит их (или, по крайней мере, библиотеки переведут свои фонды в электронный вид - пример Библиотека Конгресса США).

В настоящее время нет сомнений как в том, что Интернет является de facto всемирным хранилищем информации практически по всем аспектам жизни человечества, так и в том, что эффективный доступ к этой информации в связи с экспоненциальным ростом объема Интернет-ресурсов становится все более сложным и трудоемким (см. рис.3 и 4). И не столько с технической точки зрения, сколько с точки зрения поиска и анализа информации.

Поиск знаний в Интернете имеет ряд интересных особенностей, которые убеждают в необходимости и возможности частичной автоматизации решения данной задачи проектирования: 1. Поисковые машины Интернет позволяют вести поиск не только по заголовкам страниц, но и по их содержимому, что было невозможно при работе с библиотечными каталогами - в них поиск ведется только по названию или по автору. Оценить же содержание книги можно, лишь получив ее на руки и прочитав, 2. Возможность поиска информации прямо с рабочего места инженера путем выхода в сеть через компьютер. Это является сильным аргументом в пользу начала работ по автоматизации информационного поиска, т.к. до этого было бы затруднительно "отправлять" компьютер в библиотеку и заставлять его листать книги. 3. Сверхоперативное отображение новой информации в Интернет и такое же, почти мгновенное ее получение.

В настоящее время в мире идет бурный процесс стихийного накопления знаний, сведений и других разновидностей информации, главным образом на капливающейся в Интернете, Информация, содержащаяся в данной сети, практически не систематизирована и не стандартизирована. Вероятнее всего в ближайшее время эта ситуация не изменится. С другой стороны эффективное проектирование невозможно без использования всех последних достижений в исследуемой области. Однако, в такой ситуации проектировщик часто не подоз ревает о существовании интересующих его сведений или не может их найти за приемлемое время и вынужден открывать их повторно, что увеличивает затраты на проектирование.

В тоже время, составление запросов для поисковых машин является специфической задачей, требующей от инженера-разработчика специальных навыков, в т.ч. по лингвистике, которыми он в большинстве случаев не обладает. Такая ситуация приводит к тому, что проектировщик отказывается от Интернет как от источника информации, потому что не верит в возможность обнаружения необходимых сведений или не может их обнаружить. Более того, представляется, что ряд эффективных поисковых стратегий просто не может быть реализован людьми. Отсюда необходимость в разработке указанной системы очевидна. Поскольку, как уже было сказано, пользователь часто может не знать о существовании необходимой ему информации или не ощущать потребность в ней, то такая система должна быть активна, т.е. уметь принимать реше ниє о необходимости поиска и вести его без запроса со стороны пользователя.

Так как информация в Интернете содержится на разных языках и в разных кодировках система должна уметь вести поиск несмотря на указанные трудности.

Концептуальная модель АСИППП

Рассмотрим составляющие части модели. Банк данных о полезных страницах содержит адреса тех страниц, на которых, как полагает система, в силу тех или иных причин велика вероятность обнаружить искомые сведения. Такие страницы будут анализировать системой напрямую. Основанием для занесения в банк такой страницы может быть факт частого обращения к ней в предыдущих актах поиска или страница может быть занесена туда вследствие того опи сания, что поставлено ей в соответствие в «желтых страницах». Перечень таких страниц дан в Приложении 1.

Подсистема инициации поиска. Введена для реализации требования об активности АСИППТТ, т.е. наблюдая за процессом проектирования, система будет сама принимать решение о необходимости поиска информации. Фактом, инициирующим такой поиск, может являться либо непосредственное отсутствие необходимых знаний в БЗ ЭС, либо их неактуальность в результате того, что имеющиеся знания устарели (всем знаниям необходимо присвоить признак, который бы указывал на то, как давно обновлялись эти знания).

Подсистема формирования запроса при инициировании с использованием онтологии будет составлять и отправлять запрос на указанные внутри нее поисковые серверы, а также получать от них результаты поиска. Запрос будет состоять из понятий и связывающих их логических операторов И, ИЛИ, НЕТ. Основой для запроса будет служить фрейм, в котором будут указаны начальные посылки (известные данные) и результаты, которые нужно получить в процессе проектирования. Если в тексте найдены посылки и результат, то имеет смысл вести в нем поиск искомых знаний. Поиск должен вестись как в содержимом страницы, так и в ее названии.

Подсистема анализа текста. Те станицы, которые выдадут поисковые системы в ответ на запрос, будут скачены подсистемой поиска и переданы на анализ в данный блок. Там с использованием методов понимания естественного языка, должен будет произведен поиск искомых знаний, в результате которого они либо будут выделены, либо будет установлен факт их отсутствия. Особо анализу должны подвергаться отдельные элементы текста: заголовки, таблицы, списки, текст, выделенный жирным шрифтом, курсивом или подчеркнутый. Такой анализ не выполняется поисковыми системами и должен быть выполнен здесь. В контексте проблемы, тексты, которые придется рассматривать системе, имеют ограничения как по своей тематике, так и по стилистике (повествовательные предложения, отсутствие ярко выраженной эмоциональной составляющей, «задней мысли» т.д.), отсутствие смежных каналов получения знаний (видео- или аудио -). Если быть более точным, то такая информация встречается не очень часто, если не считать графическое представление, и, как правило, находит свое отражение в тексте. Поэтому при проектировании данной системы не ставиться цель научиться обрабатывать такую информацию, так как это является отдельной очень ресурсоемкой задачей. Нетекстовая информация будет обрабатываться только по ее отражению в тексте, остальное будет предоставлено пользователю (в случае, если система сочтет, что она может содержать искомые сведения).

Также специфика задачи ограничивает количество уровней понимания, которые должна реализовывать система [52]: 1. Прямое понимание текста. 2. Наложение текста на логический, временной, пространственный и казуальный контекст. 3. Наложение текста на знания системы о среде.

Сам процесс понимания текста состоит из следующих этапов: 1. Синтаксический - грамматический разбор предложений 2. Семантический - соотнесение текста с представлением системы о данной области. 3. Прагматический — соотнесение предложений друг с другом и с контекстом.

Возможен случай, когда в тексте искомые сведения не содержатся, но существует возможность получения их из данных, содержащихся на страничке. Однако такие задачи представляют собой отдельную сложную проблему вывода знаний, и данной системой решаться не будут.

Подсистема структуризации знаний будет интегрировать вновь полученные сведения в БЗ ЭС.

АСИППП существует и функционирует в некоторой среде информационного обеспечения. Структура среды приведена на рис.10. Рассмотрим составляющие этой среды.

Оптимизационная модель выбора поискового средства

Поскольку ранее был сделан вывод о том, что непосредственный поиск в Интернет будет выполняться с использованием общедоступных поисковых средств, необходимо провести сравнительный анализ и выбрать те, с которыми будет работать проектируемая АСИППП. Существуют следующие средства поиска ресурсов Интернет, можно разделить на несколько категорий. К ним относятся (см. рис.8): 1) поисковые системы и надстройки над ними; 2) страницы с поиском по нескольким системам; 3) каталоги (как с возможностью поиска, так и без таковой); 4) тематические поисковые системы и каталоги; 5) коллекции ссылок; 6) поиск в группах новостей; 7) поиск на FTP-серверах. Все сведения по поисковым системам представлены в таблице 3 и 4. Данные приведены по состоянию на 2003-й год. [5, 24,45, 51] В графе 3 приведено количество серверов, на которых система ведет поиск информации. В графе 4 указан объем информации, хранимой на этих серверах, которая изучена поисковой системой и имеет соответствующее отражение в ее базе данных. Алгоритмы индексирования информации различны у различных систем. В графе 5 отражено, допускает ли система указывать в запросе дополнительную информацию, например максимальное расстояние между искомыми словами в тексте, В графе 6 показана возможность системы искать все возможные формы введенного слова, т.е. искать введенное слово во всех падежах, числах и т.п. В графах 7 и 8 показано, может ли вестись поиск в данных элементах текста. В графе 9 указано, с какими кодировками русского текста работает система. В графе 10 отражена возможность системы находить документы, схожие с каким-либо документом из числа ранее найденных. В графе 11 отражена возможность поиска слов в уже найденных документах. Графа 12 отражает возможность задания символов и вместо отдельных букв и слов запроса для расширения пространства поиска. В графе 13 показана допустимость ввода запроса из нескольких слов, связанных между собой логическими операторами. В таблице 4 под мертвыми линками понимаются исчезнувшие ссылки, которые хранит поисковая система. В последнем столбце указана та часть документа, которую просматривает система при индексировании страницы. В целях получения сведений о возможности извлечения знаний из фон дов библиотек по сети Интернет, был произведен обзор услуг, предоставляе- мых на электронных страничках этих организаций. Для проведения экспери- мента по поиску, в качестве запроса для поисковых машин библиотек вводилось словосочетание «анализ надежности».

Коротко опишем результаты. Российская государственная библиотека (ранее Библиотека имени В.И. Ленина). Электронный адрес: http://www.rsl.ru. В запросной форме позволяет использовать логические операторы И, ИЛИ, НЕ, производить поиск по автору, заголовку, теме, в тексте, задавать ограничения по году издания. Поиск основан на информационной системе Aleph от разработчиков поисковой системы Ex-libris. На запрос было выдано 33 издания в области техники и информатики и 10 изданий в области социологии и банковского дела. Однако в электронной форме этих изданий не нашлось (часть фонда библиотеки продублирована в электронной библиотеке, находящейся на вышеуказанной страничке). Страничка также снабжена электронным каталогом. Государственная публичная научно-техническая библиотека (ГПНТБ). Также имеется электронный каталог и механизм поиска. По запросу были получены краткие обзоры (резюме) конференций, в тексте которых встречалось соответствующее словосочетание. Электронный адрес: http://www.gpntb.ru Открытая электронная библиотека OREL. Электронный адрес: http://orel.rsl.ru. Производит поиск в отечественных базах данных, а таюке в иностранных базах данных (электронные версии журналов и газет) по запросу. Библиотека Конгресса США (The Library of Congress). Электронный адрес: http://www/l oc/gov. Почти весь фонд библиотеки имеет электронные копии, однако, услуги электронной библиотеки платные и необходима предварительная регистрация пользователя, Бесплатно можно пользоваться только электронным каталогом. Из проведенного обзора становится понятно, что в настоящее время лишь незначительная часть фонда российских библиотек представлена в электронном виде, что делает невозможным или мало эффективным поиск знаний на их сайтах. Тем не менее, опыт США и стран Западной Европы, а также начало выполнения программы «Электронные библиотеки России» (см. Приложе- ниє 2) позволяют утверждать, что в ближайшем будущем ситуация в этой области значительно изменится. Стоит отметить, что в настоящее время можно вести автоматизированный поиск литературы, при котором по каталогам и поисковым системам автоматически находится ссылка на нужное издание, а человек ведет поиск знаний уже непосредственно в указанном источнике.

Экспериментально-статистическая оценка эффективности применения АСИППП

С целью получения статистической выборки по рассматриваемым показателям была проведена серия экспериментов. На основании этой серии с использованием аппарата математической статистики также сделан вывод об эффективности применения АСИППП. Правомерность выводов, полученных на основе анализа малой серии экспериментов, подтверждается практикой конструирования нейронных сетей, которые вполне удается обучать на небольшом количестве примеров. Прежде чем привести свои выводы, опишем подробно один из экспериментов. В ходе решения задачи выбора оптимальной конфигурации ПЭВМ для локальной сети химической лаборатории стало необходимо получить сведения о том, какими основными характеристиками описывается видеокарта персонального компьютера. Было принято решение осуществить поиск этой информации следующими путями: консультацией со специалистом, библиотечным поиском, непосредственным запросом на поисковый сервер и поиском в Интернет с использованием методов и алгоритмов, изложенных в данной работе. В начале интересующий вопрос был задан специалисту. Им были названы следующие основные характеристики: 1. Разрядность шины; 2. Тип шины (PCI/AGP); 3. Объем собственной памяти; 4. Наличие и производительность процессора; 5.

Тип сопрягаемого монитора (например EGA); 6. Стоимость; 7. Надежность (и как субъективный показатель этой характеристики — фирма-производитель); 8. Габариты; 9. Разрешение. Для того, чтобы договориться со специалистом о встрече, понадобилось 10 минут, для проезда к месту встречи затрачено 50 минут (отметим, что специалист согласился встретиться сразу, и поэтому не пришлось ожидать время назначенной встречи), для введения специалиста в суть дела и получения ответа то него - 10 минут. Итого, с учетом обратной дороги, было затрачено 120 минут. Ввиду личного знакомства автора со специалистом консультация была проведена бесплатно, но, исходя из заработной платы консультанта, 20 минут его рабочего времени стоят 1, 7$. Стоимость проезда составила 38 рублей. Затем была выполнена имитация поиска в Интернет так, как его осуществила бы АСИППП. На разработку запроса в ручную в том виде, в каком его должна была бы сформировать АСИППП, было затрачено 20 минут. Основой запроса было: «характеристика» И «видеокарта». К понятию «характеристика» через логическое ИЛИ были присоединены понятия: параметры, описание, свойства, модель; через логическое НЕ понятия: служебная, логарифм и ]g (т.к. понятие «характеристика» помимо прочего имеет значение «целая часть деся тичного логарифма»). К понятию модель через логическое НЕ присоединено понятие «модельный». К понятию «видеокарта» через логическое ИЛИ присоединены понятия: видеоадаптер, видеоплата и видеоконтроллер. Для поиска использовалась система Яндекс.

Похожие диссертации на Интеллектуализация информационного обеспечения САПР РЭУ на основе мировых сетей