Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Математические модели и метод обработки информации для эффективного управления недвижимостью мегаполиса Егоров Алексей Геннадьевич

Математические модели и метод обработки информации для эффективного управления недвижимостью мегаполиса
<
Математические модели и метод обработки информации для эффективного управления недвижимостью мегаполиса Математические модели и метод обработки информации для эффективного управления недвижимостью мегаполиса Математические модели и метод обработки информации для эффективного управления недвижимостью мегаполиса Математические модели и метод обработки информации для эффективного управления недвижимостью мегаполиса Математические модели и метод обработки информации для эффективного управления недвижимостью мегаполиса Математические модели и метод обработки информации для эффективного управления недвижимостью мегаполиса Математические модели и метод обработки информации для эффективного управления недвижимостью мегаполиса Математические модели и метод обработки информации для эффективного управления недвижимостью мегаполиса Математические модели и метод обработки информации для эффективного управления недвижимостью мегаполиса
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Егоров Алексей Геннадьевич. Математические модели и метод обработки информации для эффективного управления недвижимостью мегаполиса : Дис. ... канд. техн. наук : 05.13.10 СПб., 2005 137 с. РГБ ОД, 61:05-5/3201

Содержание к диссертации

Введение

Исследование проблемы обеспечения достоверности и точности информации в базах данных, содержащих сведения о недвижимости 12

Развитие информационной инфраструктуры рынка недвижимости.

Формирование требований к информации автоматизированных систем в сфере недвижимости

Модель искажения информации в базе данных, содержащей сведения о недвижимости

Современные технологии формирования, накопления и доступа к информации в реляционных базах данных

Концептуальная модель обеспечения защиты информации баз данных, содержащих сведения о недвижимости 44

Теоретико-познавательные модели оценки и анализа статистических данных об ошибках в записи информации о недвижимости

Обоснование и выбор методов исследования процессов ввода данных об ошибках в записи информации о недвижимости Планирование эксперимента и оценка качества базы данных с использованием метода проверки статистических гипотез

Оценка закона распределения показателей, характеризующих концентрацию ошибок информации в базе данных

Группировка ошибок, возникающих при записи информации в базу данных

Исследование однородности выборок методом однофакторного дисперсионного анализа

Модель оценки факторов влияния на процесс возникновения ошибок в базе данных методом многофакторного дисперсионного анализа

Система анализа информации и разработки рекомендаций по исправлению ошибок в базе данных

3.1. Ситуационное моделирование процесса принятия решения об исправлении ошибок в базе данных, содержащей сведения о Q? недвижимости.

3.2. Модель верификации записей в базе данных и формирования типовых ситуаций

96

3.3. Информационная модель распознавания ошибок в записях базы данных, содержащей сведения о недвижимости

3.4. Методика разработки рекомендаций по исправлению ошибок в базе данных109

3.5. Методика проведения тестовых проверок по исправлению ошибок в базах данных, содержащих сведения о недвижимости 120

Заключение 127

Список литературы

Введение к работе

Ведение электронного реестра прав на недвижимое имущество является весьма актуальной проблемой. Если значения данных сомнительны, то извлекаемая из базы информация будет либо полностью бесполезна, либо значительно обесценена. В то же время существуют достаточно жесткие требования к качеству информации, накапливаемой в базах данных. Так, например, в Федеральном Законе №122 - ФЗ от 21.07.1997 содержится требование ведения Единого государственного реестра прав на недвижимое имущество и сделок с ним, в том числе и на магнитных носителях.

Для их выполнения прилагаются значительные усилия в сфере создания специальных технологий безопасности, которые относятся к классу наукоемких технологий. Защита информационных систем -непростая задача, и в особенности это относится к защите информации в базе данных.

Это связано также и с тем, что в таком крупном городе, как Санкт-Петербург, ежедневно может регистрироваться до 2 тысяч сделок с недвижимостью. Каждый юридически оформленный акт сделки содержит большое количество данных, характеризующих качество недвижимости, ее географическое расположение на территории города, сведения о покупателях-продавцах, цену реализации товара и ряд других сведений.

В управлении недвижимостью значительную роль играет информационный обмен. Естественно, что при исследовании систем управления особое внимание стали уделять достоверности и точности информации. Первоначально основными способами повышения информационной надежности являлись избыточность кода и избыточность канала связи. Избыточность кода позволяет обнаруживать и исправлять ошибки при передаче информации техническими устройствами, способствуя тем самым повышению надежности технических средств управления.

Достоверность и точность информации в базе данных сводится не столько к синтаксической надежности приема-передачи данных, сколько к семантической и прагматической идентификации информации для ее практического использования. Введение информационной смысловой избыточности требует детального изучения предметной области и построения математических моделей на соответствующем уровне их детализации. Однако решение этой проблемы позволяет разрешить достаточно часто встречающееся противоречие: отсутствие информации при ее наличии и даже избытке.

Несмотря на очевидную актуальность задача анализа данных и комплексной оценки ситуации на рынке недвижимости на основе полной и достоверной информации не получила должного решения.

В имеющейся литературе по рыночной экономике недостаточно уделено внимания вопросам автоматизированной обработки экономической информации, применению математических методов, моделей и алгоритмов для анализа информации в органах управления

В общем случае создаваемые аппаратные и программные комплексы обеспечения информационной безопасности участвуют в решении трех основных задач: обеспечение конфиденциальности информации; обеспечение целостности информации; поддержание высокой готовности (доступности) информации.

Европейские критерии оценки безопасности информационных технологий (Information Technology Security Evaluation Criteria, ITSEC) рассматривают целостность как составляющую часть информационной безопасности в виде защиты от несанкционированного изменения информации. Соответствующие этим направлениям новые технологии защиты информации уже начали активно внедряться. Для их обозначения

используют вполне символические термины data cleansing (очистка), scrubbing (промывка), house-holding (уход за домом).

Однако системный анализ проблемы обеспечения точности и достоверности сведений в базах данных требует исследования электронных записей по показателям, связанным со смысловым аспектом вводимой информации.

Частные вопросы оценки влияния качества информации в виде идей и констатации наличия искажений и противоречивости сведений рассматриваются, например, в [6,21,27,37,41,70,80], однако в них не исследуются методы и модели обработки информации при выработке решений по эффективному управлению объектами недвижимости. Предложенные методы и модели автоматизированного решения задач в интересах защиты базы данных от непреднамеренных помех практически ограничиваются использованием развитых стандартных средств систем управления базами данных.

Таким образом, проблема обеспечения точности и достоверности информации в процессе управления недвижимостью представляет собой сложную научно-производственную проблему государственного масштаба, одной из составных частей которой является проблема создания системы организационно-технических мероприятий защиты информации от непреднамеренного искажения. Актуальность этой темы определила цель диссертационного исследования.

Целью данной диссертации является разработка методического аппарата защиты данных от непреднамеренных помех различного происхождения для принятия решения по управлению объектами городской недвижимости на основе точной и достоверной информации.

В соответствии с этой целью объектом исследования является система автоматизированного управления недвижимостью, а предметом исследования является процесс поступления информации в базу данных, математические модели и методы выявления искажений об объектах городской недвижимости и разработки рекомендаций по их исправлению. Достижение поставленной в диссертации цели предопределило постановку и решение следующих основных задач исследований:

1. Анализ содержания процессов, определяющих потоки поступления информации в базу данных, существующих особенностей решения задач планирования и управления городской недвижимостью в условиях неопределенности.

2. Разработка теоретико-познавательных моделей, обеспечивающих решение задач анализа искажений информации в базе данных.

3. Разработка системы моделей и алгоритмов выявления искажений в базе данных и разработки рекомендаций по их исправлению.

Решение этих задач в процессе диссертационных исследований позволило разработать и обосновать ряд положений, которые выносятся на защиту. К ним относятся следующие положения:

1) Теоретико-познавательные модели исследования технологических процессов ввода информации о недвижимости и формирования искажений в базе данных.

2) Метод выявления искажений в базе данных и разработки рекомендаций по их исправлению при управлении объектами городской недвижимости.

Научная новизна полученных результатов:

1. Определен и обоснован базовый состав моделей защиты информации от непреднамеренных помех различного происхождения. В отличие от существующих моделей, предлагаемые модели обеспечивают учет результатов обследования состояния и выявленных тенденций изменения наиболее существенных факторов. С этой целью в работе разработаны следующие модели:

Модель оценки однородности выборок методом однофакторного дисперсионного анализа.

Модель оценки значимости факторов, определяющих формирование искажений в базе данных, методом многофакторного дисперсионного анализа.

Модель оценки закона распределения показателей, характеризующих концентрацию ошибок информации в базе данных.

Модель группирования ошибок, возникающих при записи информации в базу данных.

2. Разработан метод выявления искажений в базе данных и разработки рекомендаций по их исправлению при управлении объектами городской недвижимости.

В отличие от существующих методов выявления ошибок в записях текстов базы данных предлагаемый метод основан на использовании принципов ситуационного управления процессом, условий реализации предлагаемых решений с учетом различных вариантов организации управления недвижимостью при действиях возможных возмущений.

Практическая значимость результатов исследований состоит в следующем:

1. На основе проведенного концептуального описания процессов, связанных с вводом и накоплением информации в базах данных, оценки влияния внешних и внутренних условий на формирование потока ошибочной информации, семантического анализа ошибочных сведений, выявленных в реальных базах данных, содержащих сведения о недвижимости:

обоснованы состав, структура и основные взаимосвязи системы моделей, предназначенных для исследования технологических процессов ввода информации о недвижимости и формирования искажений в базе данных.

предложен метод обработки информации для выявления искажений в базе данных и разработки рекомендаций по их исправлению при управлении объектами городской недвижимости.

2. Разработанные модели позволяют обеспечить решение практических задач экономической оценки объектов недвижимости в условиях изменения рыночных ситуаций на основе точной и достоверной информации в базе данных.

3. Практическая значимость полученных в диссертации результатов определяется возможностью их использования органами управления городов Российской Федерации при организации управления объектами недвижимости и экономическом регулировании рыночных процессов. Математические модели и алгоритмы задач оформлены в виде пакета прикладных программ в операционной среде «Windows».

Основное содержание и результаты исследований опубликованы в печати.

Полученные научные результаты непосредственно связаны с научно-практической деятельностью автора в процессе выполнения им соответствующих заданий НИР кафедры. В процессе выполнения диссертационных исследований использовалась оперативная

статистическая информация, накапливаемая в учреждениях администрации Санкт-Петербурга.

Диссертационная работа включает введение, 3 главы, заключение, список литературы. Объем диссертации 137 страниц, из них список литературы на 8 листах, 37 рисунков и таблиц.

Апробация материалов диссертации проводилась в виде докладов на городских конференциях, на научно-технических семинарах. Материалы диссертации опубликованы в 5 научных публикациях. Результаты диссертации реализованы при проведении обследования городской среды в интересах развития недвижимости Санкт-Петербурга.

Первая глава диссертации посвящена исследовнию проблемы обеспечения достоверности и точности информации в базах данных, содержащих сведения о недвижимости. Исследуется развитие информационной инфраструктуры рынка недвижимости, определяются требования к информации автоматизированных систем в сфере недвижимости. В рамках данной главы определяются основные источники искажения (разрушения) информации в базах данных, рассматриваются современные технологии обеспечения целостности информации в реляционных базах данных. Результатом проведенных исследований является разработка концептуальной модели обеспечения защиты информации в баз данных, содержащих сведения о недвижимости.

Во второй главе диссертации формулируются теоретические аспекты, связанные с созданием теоретико-познавательных моделей оценки и анализа статистических данных об ошибках в записи информации о недвижимости.

Разрабатываются модели, являющиеся элементами предлагаемой системы информационного и математического обеспечения. Главными задачами этих моделей является поиск функциональных и логических закономерностей в накопленной информации, выявление аномалий и оценка прогнозируемого развития некоторых процессов ("извлечение зерен знаний из гор данных").

Полученные результаты представляют собой исходный материал для построения системы анализа информации и исправления ошибок в базах данных, содержащих сведения о недвижимости.

В третьей главе диссертации рассматриваются математические модели и метод выявления ошибок и разработки рекомендаций по их исправлению.

Предлагается решение задачи классификации ошибок в базах данных, содержащих сведения о недвижимости. Это позволило выявить признаки, характеризующие однотипные группы ошибок (классы и подклассы), для того чтобы по известным значениям этих характеристик можно было отнести исследуемую запись к тому или иному типу. Ключевым моментом выполнения этой задачи является анализ множества классифицированных записей.

Предложен метод решения задачи исправления ошибок в записи адресов объектов недвижимости, который основан на выявлении ассоциаций.

Построение системы защиты информации в базах данных, содержащих сведения о недвижимости, предложено проводить с учетом накопленного потенциала в создании баз данных в различных учреждениях города.

Формирование требований к информации автоматизированных систем в сфере недвижимости

Информация - весьма специфический продукт и должна иметь хозяина. Рост стоимости информации о недвижимости происходит быстрее, чем растут цены на саму недвижимость. Вместе с тем, информация имеет ценность, если она поступила вовремя, является достоверной и оформлена в соответствии с требованиями существующего законодательства. За это несет ответственность тот источник, который эту информацию создает.

В странах с развитой рыночной экономикой достаточно серьезную прибыль получают от продажи на рынке недвижимости информации о недвижимости.

В связи с этим все, что касается информации базы данных, требует особого внимания. Поэтому на первое место в системе приоритетов западных специалистов все чаще выходит ее содержание.

"Мы должны быть уверены в том, что производим и потребляем информацию высокого качества" — этот принцип положен в основу формирования хранилища данных объемом 1,5 Гб National Association of Securities Dealers (Национальная ассоциация маклеров ценных бумаг, Роквилль, шт. Мэриленд).

Выявление ошибок в записях информации позволяет вносить поправки и сертифицировать таблицы базы данных.

По опубликованным данным можно судить об эффективности новых технологий защиты информации: фирме Prism Solutions после использования программ очистки таблиц, содержащих 20 млн. записей, удалось сократить процент ошибок с 1% до 0,01%.

Характерным примером в этой области является поставка на информационный рынок сведений об "истории" совершения сделок с квартирами жилищного фонда Санкт-Петербурга. Соответствующий анализ этих данных позволит уменьшить риск в совершении сделки с недвижимостью.

Всесторонняя информированность потенциальных участников совершения сделки является ключевым фактором, определяющим развитие жилищного рынка.

Таким образом, развитие автоматизированной системы осуществляется не только путем наращивания количества элементов и взаимосвязей структуры, но и повышением ее интеллектуального уровня. Действие первого из указанных направлений развития обеспечивает поступление в систему все более разнородных сведений с подключением каждого нового источника информации.

Это вызывает лавинообразный процесс составления всевозможных комбинаций из полученных сведений и ее дальнейшей обработки. Тезаурус системы расширяется не только за счет притока новой информации, а главным образом благодаря разработке специального математического обеспечения, способного эту информацию обрабатывать и предлагать оптимальные рекомендации по управлению рыночными процессами.

При формировании структуры базы данных исходным является следующее базовое положение: от объекта недвижимости к субъекту, регистрируемым правам и сделкам, совершаемым субъектом по отношению к конкретному объекту недвижимости. Поэтому основным связующим элементом формируемой структуры базы данных является объект недвижимости. Идентификация объекта управления позволяет определить основные цели и содержание деятельности управляющего, выявить специфику управления тем или иным объектом.

Использование в составе программного обеспечения специального модуля адресно-картографической системы в качестве картографического приложения к различным информационным системам, позволит связать любую базу данных, где имеется информация об адресе, с цифровой картой города, и в дальнейшем на карте отображать любую выбранную из базы данных информацию.

Во всем множестве таких адресных элементов выделяются три группы качественно различных объектов: 1. Земельные участки; 2. Здания (строения); 3. Помещения (квартиры).

Из совокупности элементов помещений (квартир) на основе адреса образуются микроструктуры, определяющие описание здания (строения).

Технические характеристики помещений (квартир) и технические характеристики здания в целом являются различными как по перечню, так и по уровню их обобщения.

Правовые отношения также могут определяться различными формами собственности: здание в целом относится к муниципальной собственности при наличии некоторого количества частных квартир в этом строении.

Совокупность земельных участков и зданий образуют более обобщенные структуры: кварталы, районы, город. Перечень и содержание правовых отношений и технических характеристик объектов недвижимости на этом уровне описания также является отличным от рассмотренных выше.

Каждый объект недвижимости (земельный участок, здание, строение) соотносится с двумя основными перечнями характеристик:

1. Правовые отношения субъектов и объектов недвижимости, включая обременения (запрещения) на регистрацию права собственности.

2. Технические характеристики объектов недвижимости, включая рыночную стоимость предоставляемых ими услуг. Логическая структура сбора, обработки и хранения информации в соответствии с юридическими требованиями ведения Единого государственного реестра прав показана на рис.1.2.

В базе данных должна храниться также неструктурированная информация (текстовые документы), сопутствующая ведению Единого государственного реестра прав (например, тексты-комментарии регистраторов при экспертизе документов).

Теоретико-познавательные модели оценки и анализа статистических данных об ошибках в записи информации о недвижимости

В результате складывающейся ситуации при проведении поиска по ключевым словам программой из базы данных выбираются все записи, в которых встречаются запрашиваемая аббревиатура символов. При таком поиске действует правило: чем более широко распространены в русском языке запрашиваемые морфемы слов, тем более значительный список составляется информационно-поисковой системой. Если задать для информационно-поисковой системы ключевое слово "Нева", то с учетом ошибок ввода выбираемый из базы данных список юридических лиц становится весьма значительным.

Решение таких проблем заключается в использовании семантики, как в языке запросов, так и в базе данных, к которой адресуется запрос.

Для решения проблем обеспечения информационной устойчивости базы данных большое значение имеют накапливаемые знания о структуре ошибок ввода информации. Реализация на основе этого знания простого исключения символов № . — + " из ключевых слов программными средствами при выполнении операции сравнения данных позволила повысить эффективность поиска сведений о регистрации прав на недвижимость в условиях появления ошибок при клавиатурном вводе информации. Кроме того, была выявлена целесообразность дополнительного структурирования базы данных: сведения, содержащие названия юридических лиц, и сведения об их организационно-правовой форме необходимо записывать в разные информационные поля.

Одним из принципиальных вопросов явилось решение проблемы обеспечения информационной устойчивости сведений о субъектах права собственности.

В соответствии с действующей практикой в полном объеме паспортные данные субъектов права вводятся в базу данных с июля 1998 года.

Ранее в базу данных информационной системы также вводились сведения о заявителе; но если от имени собственника документы подавались доверенным лицом, то вводились, как правило, его паспортные данные. В этих же случаях на практике отмечались исключения: при подаче заявления доверенным лицом заявитель оказывался еще и собственником. Такая же ситуация возникала в учреждении юстиции при оформлении документов на приватизацию коммунальной квартиры, когда заявителем являлся один из ее жильцов. Если в дальнейшем происходило расселение коммунальной квартиры через риэлтерскую фирму, то паспортные данные владельцев квартир также не заносились в базу данных.

Как известно, в случае неполноты информации в стандарте языка SQL выделяется одно специальное null-значение, которое считается автоматически входящим в любой встроенный тип данных и любой определенный пользователем домен. Семантика предметной области позволяет определить null-значение как запись "нет паспортных данных". Если при вычислении арифметического выражения хотя бы одно, из используемых значений есть null, то и значение всего f арифметического выражения есть null. Если в операциях сравнения a op b (op = - , , , = , = ) значение левого или правого операнда (или и того, и другого) есть null-значение, то истинностным значением операции сравнения является unknown. Тем самым, в SQL используется не двузначная, а трехзначная логика. Таблицы истинности основных логических операций расширяются следующим образом: true AND unknown = unknown false OR unknown = false NOT(unknown) = unknown

При этом если логическое выражение представляет собой условие выборки строки из таблицы, то будут выбираться только те строки, для которых значение условия выборки вычисляется в true.

Ситуация с идентификацией субъектов права собственности могла стать катастрофической при массовой смене паспортов жителями РФ. Решить проблему позволила запись в базу данных сведений о старом и новом паспорте и установление между ними семантического соответствия.

Однако в основе обеспечения информационной устойчивости базы данных, содержащей сведения о регистрации прав на недвижимое имущество, лежит адресная система, которая является основой интеграции разнородных данных в сфере недвижимости.

Все иные характеристики правового статуса, ценности объекта и целый ряд других характеристик могут быть неразрывно связаны между собой, если будет сформирован и корректно определен объект недвижимости.

Во всех случаях в конечном итоге местоположение прочно связанного с землей недвижимого имущества определяется его адресом на территории города, а целостность записей в базе данных - точной адресной привязкой всех сведений при выполнении всех действий по вводу, хранению, отображению и обработке информации.

Оценка закона распределения показателей, характеризующих концентрацию ошибок информации в базе данных

Исходя из анализа основных тенденций развития рынка недвижимости, особенностей создания и практического применения автоматизированных систем, можно сделать вывод о том, что в настоящее время весьма актуальной становится проблема разработки концепции защиты информации баз данных, содержащих сведения о недвижимости. Сформированная система взглядов и основных принципов должна быть положена в основу решения проблемы поддержания на заданном уровне всего комплекса требований к достоверности и точности сведений о недвижимости.

Что касается информации базы данных, то на первое место в системе приоритетов западных специалистов все чаще выходит ее содержание.

"Мы должны быть уверены в том, что производим и потребляем информацию высокого качества" - этот принцип положен в основу формирования хранилища данных объемом 1,5 Гб National Association of Securities Dealers (Национальная ассоциация маклеров ценных бумаг, Роквилль, шт. Мэриленд).

Сложившаяся в настоящее время в теории и практике методология обеспечения полноты и достоверности информации в базах данных развивалась отдельно в каждой области использования автоматизированных систем. Отсутствие общеметодологических принципов и концепций использования общих закономерностей дополнялось многолетним опытом решения задач в условиях неопределенности (неполной и неточной информации). В то же время, как показывает практика, при управлении недвижимостью объективно существует потребность эффективной переработки, как правило, ограниченного объема противоречивой информации, учета факторов стохастичности и неопределенности.

Анализ показывает [24, 25], что в качестве основополагающей методологии проведения исследований следует выбрать методологию системного анализа и современной теории сложных систем, принятия решений в условиях неопределенности.

При решении задач сбора и обработки информации о недвижимости неопределенность проявляется:

1) как неопределенность, порождаемая недостаточной полнотой, а также искажениями информации, возникающими как из-за санкционированных, так и несанкционированных действий пользователей;

2) как неопределенность, возникающая из-за наличия сложности и неоднозначности в описании объектов недвижимости, формирования специфических правил, регламентирующих нормы поведения на рынке недвижимости.

Таким образом, концепция предусматривает существование двух относительно самостоятельных и, следовательно, имеющих отличие направлений обеспечения точности и достоверности информации.

Первое направление требует построения вероятностных математических моделей, которые адекватно отражают механизм формирования ошибочной информации в базе данных. Второе направление связано с формированием и оперативной корректировкой системы логических правил, соответствующих нормативным документам, которые определяют "правила игры" на рынке недвижимости.

Вместе с тем, и в том и другом случае основное содержание работы по обеспечению защиты информации в базах данных заключается в разработке комплекса организационно-технических мероприятий, повышении уровня автоматизации процесса ввода данных об объектах недвижимости и в оперативном поддержании целостности сведений о недвижимости на заданном уровне защищенности.

Комплексное рассмотрение проблемы позволяет определить, что повышение уровня защищенности сведений в базе данных обеспечивается:

1) созданием в экранирующем шлюзе прикладного уровня программного комплекса для проверки подлинности информации об объектах недвижимости (защита от ввода ошибочных данных);

2) созданием программ-тестов периодического анализа информации для выявления ошибочных записей и разработке рекомендаций по ее корректуре (выявление и исправление ошибок).

3) Созданием программ, позволяющих найти информацию об объекте недвижимости при наличии различных элементов неоднозначного описания его адреса (выделение квазиошибок в записи информации и их расшифровка).

Последнее из перечисленных направлений повышение уровня защищенности сведений в базе данных непосредственно связано с обеспечением достоверности проверок (отсутствие ошибок в системе проверки). Выполнение этого требования осуществляется в процессе актуализации знаний в справочной системе базы данных.

В общем случае схема организации контроля ввода информации, периодического тестирования базы данных, выделение ошибок и квазиошибок в записи информации, содержащейся в базе данных, а также разработки рекомендаций по исправления ошибок в адресах объектов недвижимости приведена на рисунке 1.7.

Основными показателями эффективности системы "пользователь -АРМ - база данных", которые зависят от деятельности оператора, являются показатели безошибочности (правильности ввода информации) и своевременности выполнения поставленных задач. В основе этих показателей лежит понятие ошибки, которая возникает при нарушении предписанного оператору алгоритма деятельности.

Модель верификации записей в базе данных и формирования типовых ситуаций

Выберем типологический вид группировки, в котором в качестве группировочного признака будем использовать перечень ошибок, возникающих при записи информации в базу данных. Полный перечень таких ошибок определяется экспертами при проведении обследования выборок.

Объектом статистического наблюдения являются записи информации, содержащие сведения: 1) об адресах объектов недвижимого имущества; 2) о юридических лицах, регистрирующих право на недвижимое имущество и сделок с ним.

Границы интервалов определяются количеством ошибок в выборке из 100 записей адресов объектов недвижимого имущества и 100 записей юридических лиц в базе данных автоматизированной системы регистрации прав на недвижимость. В общем итоге группировка включает в себя 10 выборок, половина из которых содержит записи юридических лиц и вторая половина - соответственно записи адресов объектов недвижимости. Группировка оформляется в таблице 2.4.

Полученные результаты свидетельствуют о том, что при клавиатурной записи неформализованного текста об организационно-правовой форме и названия юридического лица ошибок возникает значительно больше (как по количеству, так и по перечню), чем при полуформализованной записи адреса объекта недвижимости. Формализованная запись названия улиц практически исключает возможность появления орфографических ошибок (ошибки появляются только при буквенном обозначении литер и корпусов).

Значительное количество ошибок клавиатурного ввода, связанное с записью аббревиатуры вместо полного наименования юридического лица, вероятно, определяется недостаточной информированностью пользователей АРМ о юридических требованиях соответствия электронных записей тексту бумажного документа.

Сформируем гистограмму, как один из вариантов столбчатой диаграммы, отображающий зависимость частоты попадания ошибок различного типа в определенный интервал их значений. Как следует из таблицы 2.3, около 80% ошибок в базе данных представляют собой примерно 20% вариантов наиболее типичных искажений информации.

Полученные результаты соответствуют универсальному правилу Парето "20 — 80", при котором ранжируются отдельные области по их значимости и устанавливается "жизненно важное меньшинство" по сравнению с "незначительным большинством". Правило Парето применимо во множестве ситуаций и, прежде всего, - в решении проблем качества.

Плотность вероятностей для случайной величины, распределенной по Парето, имеет вид Ре = (рх?х-{р+1),х х0 0, 0,х х0,р 0

Как следует из этой формулы, случайная величина, распределенная по Парето, принимает значения только в области х = Х& х Хо, х0 0. Стандартное распределение Парето имеет следующую функцию плотности (для положительного параметра с ): f (х) = с/хс+1 1 х, о 0 где с - параметр распределения.

Анализ Парето иллюстрируется диаграммой Парето (рис.2.2 и рис.2.3), на которой по оси абсцисс отложены виды информационных ошибок в порядке убывания вызванных ими проблем в качестве информации, а по оси ординат — в количественном выражении сами проблемы. Столбчатой диаграммой показана динамика появления ошибок различного типа в численном выражении, а виде непрерывной кривой — в накопленном (кумулятивном) процентном выражении.

Похожие диссертации на Математические модели и метод обработки информации для эффективного управления недвижимостью мегаполиса