Содержание к диссертации
Введение
Глава 1. Анализ современных методов обработки статистической информации 11
1.1. Развитие информатизации в системе государственной статистики 11
1.2. Характеристика регистровой формы хранения и обработки данных 18
1.3. Состав и классификация задач, решаемых с использованием регистров 33
Выводы по главе 42
Глава 2. Методология построения регистров объектов статистических наблюдений 44
2.1. Основные этапы построения регистра 44
2.2. Классификаторы и экономические показатели, включаемые в регистр 50
2.3. Моделирование оптимальной организационной структуры регистра 68
Выводы по главе 90
Глава 3. Организация функционирования регистров в современных экономических условиях 92
3.1. Построение базы данных регистра 92
3.2. Оценка использования ресурсов регистра 108
3.3. Технология обработки статистической информации с использованием регистров 117
3.4. Основные направления совершенствования регистров 130
Выводы по главе 140
Заключение 142
Библиографический список 147
Приложения 154
- Характеристика регистровой формы хранения и обработки данных
- Состав и классификация задач, решаемых с использованием регистров
- Моделирование оптимальной организационной структуры регистра
- Технология обработки статистической информации с использованием регистров
Введение к работе
Современные условия развития экономики и производства требуют повышения уровня организации управления. Государственная статистика обеспечивает органы управления статистической информацией и является одним из основных источников формирования информационных ресурсов страны. Органы государственной статистики призваны решать задачи, обеспечивающие изучение массовых явлений и их взаимосвязей, а также давать научно обоснованную оценку функционирования и развития экономики. Поэтому, качественное, оперативное и надежное информационное обеспечение процессов управления экономикой, различными социальными сферами невозможно без научно организованной государственной статистики.
Одним из основных функциональных звеньев экономической информационной системы для органов управления экономикой является статистическая информационная система. Статистическая информационная система является необходимым элементом информационной системы современного государства, обеспечивая правительство, министерства, организации и общественность официальными данными об экономической, демографической, социальной и экологической ситуации.
Органы государственной статистики собирают и обрабатывают статистическую информацию от сотен тысяч промышленных предприятий, организаций, строек, сельскохозяйственных предприятий, десятков тысяч культурных, бытовых и других учреждений независимо от форм собственности. При обработке статистической отчетности осуществляется несколько сотен миллиардов вычислительных операций в год [15]. В связи с этим возникает настоятельная необходимость в изыскании наиболее рациональных форм хранения и обработки информационных ресурсов статистики.
В условиях современного реформирования государственной статистики
проводится ряд мероприятий, направленных на подготовку и создание современных методов наблюдения, сбора, хранения и обработки статистической информации (внедрение единых унифицированных форм статистической отчетности, использование в практике статистического учета классификаторов технико-экономической информации и др.). Безусловно, одним из основных условий этих мероприятий является ориентация на интегрированную систему обработки данных [8].
Задача повышения эффективности формирования информационных статистических ресурсов требует перехода к более совершенным, рациональным методам организации обработки и хранения информации, позволяющим обеспечить использование всех возможностей современной вычислительной техники.
Одним из способов решения этой проблемы является внедрение так называемой «регистровой» формы хранения и обработки данных. Регистр предполагает хранение качественных и справочных признаков по каждой единице статистического наблюдения. Особенностью регистровой формы является то, что она обеспечивает системную организацию и комплексную обработку исходных данных независимо от конкретных форм статистической отчетности. В качестве объектов наблюдения могут выступать предприятия и организации, отрасли производства, объекты землепользования т.д.
Эффект от организации наблюдений на основе регистров заключается в сокращении сроков обработки статистической информации и объема вводимых данных. Кроме того, в регистр заложена потенциальная возможность более полного удовлетворения информационных потребностей пользователей без увеличения форм отчетности.
Следует отметить, что в начале 70-х гг. в системе государственной статистики были предприняты попытки внедрения регистровой формы хранения и обработки данных. Так, были разработаны первые регистры в прибалтийских республиках бывшего СССР [19], однако в дальнейшем в связи
5 политическими преобразованиями в стране и реорганизации государственной статистики работы по проектированию регистров были приостановлены.
На современном этапе развития экономики в условиях реформирования деятельности органов государственной статистики организация и функционирование регистров приобретает особую значимость. Использование регистровой формы в практике статистического учета является предпосылкой создания интегрированной статистической информационной системы (СИС), где регистры выступают в качестве объектов интеграции и формирования информационных ресурсов. Стремительное развитие современных информационных технологий, с одной стороны, и необходимость поиска новых подходов к организации и использованию статистической информации в гетерогенной экономической среде переходного периода, с другой, выдвигают качественно новые требования к построению регистров и их совокупностей.
В связи с этим возникает необходимость широкого исследования вопросов формирования информационных ресурсов статистики с использованием регистров объектов статистических наблюдений в современных экономических условиях, а разработка научно-методологических основ построения и функционирования регистров является одним из перспективных и актуальных направлений совершенствования СИС.
Цель и задачи исследования. Основной целью диссертации является исследование вопросов формирования информационных ресурсов статистики в современных условиях с использованием регистровой формы хранения и обработки данных. Для достижения поставленной цели в работе обоснованы и решены следующие научные и практические задачи:
проведен анализ существующих методов обработки статистической информации в системе государственной статистики и обоснована необходимость использования регистровой формы хранения и обработки данных;
определены функции и намечены направления создания системы регистров объектов статистических наблюдений (РОСН), проведен анализ статистических задач, решаемых на базе регистров;
разработана методология построения РОСН, содержащая алгоритмы и модели выбора оптимальной организационной структуры регистра, распределения вычислительных работ и массивов информации по всем уровням СИС;
предложен метод рациональной организации информационной базы регистров;
сформулированы принципы и требования, закладываемые в информационное, программное, технологическое и техническое обеспечение регистра на стадиях проектирования;
разработан математический инструментарий, позволяющий моделировать и оценивать эффективность использования ресурсов регистра, определять загруженность его компонентов и решать задачи ценообразования;
применены разработанные методологические решения и основные положения при построении регистра предприятий;
выявлены направления совершенствования и перспективы развития РОСН.
Объект исследования. В качестве объекта исследования определен процесс формирования информационных ресурсов государственной статистики всех уровней СИС.
Предмет исследования. Предметом исследования является разработка методологических основ построения регистров объектов статистических наблюдений как средства формирования информационных ресурсов статистики.
Теоретические и методологические основы исследования. Работа базируется на положениях Государственной программы перехода учета и статистики Российской Федерации на международную методологию,
7 отвечающую потребностям развития рыночной экономики, на положениях Федеральной целевой программы реформирования статистики в 1997-2000 годах, а также на методологических рекомендациях по вопросам развития региональной статистики.
В работе использовались труды ученых и специалистов в области управления экономическими информационными системами, теории обработки экономической информации и экономико-математического моделирования. В качестве инструментария использовались методы системного анализа, экономико-математического моделирования, математической статистики, современного проектирования и программирования.
Научная новизна исследования. Научная новизна диссертационной работы заключается в развитии концепции формирования информационных ресурсов статистики с использованием разработанных методов и универсальных принципов построения РОСН. В данной диссертации сделана попытка создания типовой модели РОСН, а также разработаны конкретные рекомендации по использованию регистровой формы хранения и обработки данных в практике статистического учета.
Научную новизну составляют следующие положения и результаты исследования:
обоснование направлений модификации теоретической концепции формирования информационных ресурсов статистики с использованием регистровой формы организации хранения и обработки данных на современном этапе развития;
разработанная методология построения РОСН, базирующаяся на системном подходе, методах математической статистики и экономико-математического моделирования, содержащая алгоритмы распределения вычислительных работ и массивов информации по всем уровням СИС;
предложенные методики и построенные на их основе модели выбора
8 оптимальной организационной структуры регистра и оценки загруженности и использования его ресурсов; разработанная технология обработки статистической информации на основе регистровой формы, реализующая задачи формирования информационно-справочной базы регистра, организации системы ведения регистра, актуализации информации, решения комплексов экономико-статистических задач и обработки запросов.
Практическая значимость и апробация исследования. Проведенное в работе исследование направлено на решение актуальной задачи интеграции и рациональной организации информационных ресурсов государственной статистики на современном этапе развития.
Основные положения, выводы и рекомендации исследования, а также разработанные технологии функционирования РОСН, информационное обеспечение и организационная структура, получившие воплощение в технической и программной реализации, позволяют повысить эффективность работы органов государственной статистики и, кроме того, могут быть использованы в практической деятельности организаций, специализирующихся на проектировании больших информационных систем.
Положения диссертации апробированы в Государственном комитете Российской Федерации по статистике (Госкомстате) и используются в практической работе различных территориальных уровней системы органов государственной статистики. На настоящий момент разработан регистр предприятий, находящийся на стадии опытной эксплуатации в районном управлении СИС Центрального района РФ.
В диссертации предложена рациональная технология формирования информационных ресурсов, что подтверждается на практике и позволяет сделать вывод: создание регистров позволит сосредоточить необходимую систематизированную информацию в органах государственной статистики по единой методологии, сократить потоки данных и обеспечить эффективную
9 технологию их обработки.
Публикации. По теме исследования опубликовано 6 работ общим объемом 1.75 печатных листа.
Структура работы. Диссертация состоит из введения, трех глав (с выводами по каждой главе), заключения, библиографического списка и приложений.
В первой главе проводится анализ существующих методов обработки информации в системе государственной статистики, дается ретроспективная оценка развития СИС и обосновывается необходимость использования более совершенных форм хранения и обработки информационных ресурсов статистики. Рассматриваются такие вопросы, как назначение и функции регистров, раскрываются возможности и преимущества их использования по сравнению с традиционными технологиями. Таким образом, обосновывается необходимость совершенствования технологии автоматизированной обработки и хранения данных в системе государственной статистики путем внедрения РОСН в практику. В заключение первой главы сформулированы основные задачи построения РОСН.
Вторая глава диссертации посвящена разработке методологии построения РОСН в современных экономических условиях. Следует особо подчеркнуть, что рациональность методологии построения регистров в значительной степени определяет эффективность их работы. От оптимальности решений и принципов, закладываемых в методологию построения регистров, зависит правильность организации технологического процесса обработки данных, и как следствие, уменьшение затрат на обработку и хранение информационных массивов регистра. Поэтому, вопросам методологии построения регистров в диссертации уделяется особая значимость.
Во второй главе проанализирована вся последовательность работ, определяющая этапы проектирования РОСН: исследование вопросов классификации статистических задач и кодирования технико-экономической
10 информации; определение показателей, включаемых в регистр; выбор оптимальной организационной структуры РОСН.
Одной из важнейших задач являлся выбор оптимальной организационной структуры регистра, поэтому в рамках второй главы построены модели и алгоритмы, позволяющие определить оптимальную архитектуру РОСН в заданных условиях, и как следствие, эффективную организацию распределенной обработки данных. Разработанный математический инструментарий использован на практике при построении регистра предприятий (РП).
Третья глава диссертации посвящена реализации методологии построения РОСН и оценке использования технологических ресурсов регистра с обоснованием экономической эффективности от внедрения (на примере РП). В данной главе разработана структура информационных массивов РОСН, сформулированы основные принципы программного обеспечения и технологического процесса в режимах актуализации базы данных регистра и решения статистических задач. В главе анализируются вопросы разработки, ведения регистров, исследуются методы организации и поиска данных, даются основные направления работ по дальнейшему совершенствованию регистров.
Для успешного управления использованием технологических ресурсов регистра и эффективного их использования в третьей главе были разработаны модели оценки использования ресурсов.
В заключении диссертации излагаются основные выводы и рекомендации, полученные в исследовании и при выполнении конкретных разработок, связанных с проектированием и внедрением РОСН в практику статистического учета.
Характеристика регистровой формы хранения и обработки данных
Трудность в разработке интегрированной системы обработки статистической информации сводится к правильному решению взаимосвязи «статистическая задача - отчетность - показатель». Как уже было замечено в п. 1.1, при создании КЭОИ данная задача решалась путем жесткой увязки конкретных форм отчетности с соответствующим программным обеспечением. Однако имеется и другой подход к решению этой проблемы, сущность которого сводится к созданию и использованию автоматизированного банка данных (АБД).
Термин «банк данных» появился еще на заре развития автоматизированных систем управления (АСУ). Традиционно под термином «банк данных» понимается автоматизированная система, представляющая совокупность информационных программных, технических средств и персонала, обеспечивающих хранение, накопление, обновление, поиск и выдачу данных [см. в частности 9, с. 140].
В данной диссертации под информационно-статистическим автоматизированным банком данных будем понимать автоматизированную систему накопления, хранения и поиска статистических данных, основанную на применении современных информационных технологий, обеспечивающих гибкое и быстрое обращение к данным, необходимым для решения задач в рамках СИС.
Разработка АБД является целесообразной ввиду того, что АБД дает возможность обеспечить интегрированную обработку статистической информации, а одним из основных ее принципов является многостороннее использование одной и той же входной информации. В связи с этим особое значение приобретают экономические показатели, закладываемые в основу автоматизированной обработки.
До сих пор процесс обработки экономической информации в рамках информационной системы представляется в виде следующей схемы. Из массива входных данных получают перечень выходных данных по заданному алгоритму. Причем сложная интегрированная информационная система отличается от простой лишь сложностью алгоритма. Такой подход обусловливает то, что при создании большинства экономических информационных систем основная роль отводится разработке алгоритмов и программ обработки данных, а все остальные вопросы считаются чисто техническими и вспомогательными. При этом недооценка проблем организации хранения информации создает серьезные трудности при реализации построения и повышении эффективности информационных систем.
Одним из основных принципов построения АБД становится принцип структуризации информации. В соответствии с ним информация в банке данных хранится не только в виде документов или отдельных записей, а объединяется в элементы (сегменты) посредством логических связей сложной структуры. Таким образом, мы приходим к понятию абстрактной структуры данных, которая в данной диссертации будет определяться как совокупность правил и ограничений, отражающих связи между отдельными частями данных. Способы объединения данных в однородные совокупности, рассматриваемые как структурные единицы, определяют форму хранения информации.
В настоящее время в АБД государственной статистики используются несколько форм хранения данных. Наиболее распространенные из них: документальная и регистровая формы. Документальная форма хранения предусматривает хранение копий документов (статистических отчетов). Это наиболее простая форма, однако, она применяется при решении задач, использующих данные одного документа.
Одной из организационных форм хранения информации в АБД для различных сфер экономики является регистровая форма. Регистр представляет собой автоматизированную картотеку однородной совокупности единиц статистического наблюдения определенного типа с набором качественных, количественных и справочных признаков по каждой наблюдаемой единице.
Регистром называется форма хранения данных, при которой массив информации образуется из записей, каждая из которых содержит набор индивидуальных показателей единицы наблюдения, причем порядок следования показателей одинаков для всех записей одного регистра.
Регистр как форма удобен для хранения информации устойчивых совокупностей объектов, имеющих продолжительный срок жизни и набор общих свойств, которые являются относительно постоянными величинами.
Регистр позволяет сократить отчетные формы как основного источника статистических данных при обработке информации и дает возможность использовать в будущем ограниченное число стандартных бланков, содержащих набор экономических показателей каждого объекта.
Назначение регистров состоит в интегрированном формировании и использовании системы показателей, позволяющих решать комплекс взаимосвязанных экономико-статистических задач, отражающих финансовую и хозяйственную деятельность объектов наблюдения в динамике, а также обеспечивать информационно-справочное обслуживание запросов различного рода потребителей.
Наряду с этим регистр необходим для ликвидации недостатков функциональных подсистем, которые характеризуются: во-первых, однородностью сбора информации и ее обработки, основывающихся на однотипных статистических формах, не учитывающих ряда требований и, во-вторых, недостаточным уровнем использования собранного статистического материала.
В регистре предполагается хранить технико-экономические показатели по каждому объекту наблюдения, но независимо от их принадлежности к конкретной форме статистической отчетности. Структура регистровой записи отображена в таблице 1.1.
Состав и классификация задач, решаемых с использованием регистров
Создание и функционирование РОСН предполагает организацию подсистемы информационного обеспечения. Под информационным обеспечением в данном контексте будем понимать совокупность сведений о состоянии управляемых объектов, выраженных в экономических показателях и других информационных совокупностях, обрабатываемых по определенной организационной схеме и удовлетворяющих требованиям регистра.
При построении регистров возникает необходимость в классификации статистических задач. Это обусловлено тем, что для каждого типа задач определяются условия и форма образования однородной статистической совокупности в качественном и количественном отношениях, что является исходной предпосылкой для обоснованного применения методов математической статистики. Для осуществления этой цели необходимо основные задачи статистики в максимальной степени детализировать по их функциональному назначению.
Под классом задач будем понимать совокупность задач, обладающих общей структурой входной, выходной информации и алгоритмом их решения. Классификация включает типовые статистические задачи, характерные для практики статистического анализа.
Введем формальное определение задачи. Каждую задачу статистики независимо от класса представим в следующем виде: y=f(x), где х - исходная информация, у - выходная информация, f- алгоритм решения задачи.
Под х подразумевается некоторая совокупность исходной информации, необходимой для решения определенной задачи. Под у в каждой задаче понимается одна или несколько статистических таблиц произвольного вида. Имеется совокупность информационных задач Q={(x, у, f)}. Цель состоит в том, чтобы разбить данную совокупность на классы, то есть получить:
Задача выделения классов из совокупности решается на базе анализа информационных задач, при учете системы характерных признаков различных классов, входящих в Q.
Статистическая формализация предусматривает разделение задач на два класса: структурные и динамические. В статистике явления изучаются в пространственном и временном аспектах. Пространственный подход предполагает анализ статистической структуры, временной характеризует анализ динамики. Далее задачи классифицируются по количеству признаков, их характеру и степени взаимосвязи. Если рассматривать структурные задачи по одному признаку, имеет место одномерная структура, при изучении нескольких признаков - многомерная.
Статистика изучает определенное множество объектов (статистическую совокупность), имеющих определенный набор признаков, которые раскрывают качественную сторону конкретного объекта. Учитывая основные моменты проявления объектов посредством признаков, составим следующую логическую структуру характеристики объектов по элементам наблюдения (см. рис. 1.2).
М - определенный момент времени; Т - период времени Рис. 1.2. Логическая структура характеристики объектов по элементам наблюдения
Согласно данной схеме объект или совокупность объектов характеризуется как на данный момент времени М (в статике), так и за определенный период времени Т (в динамике). Граф распадется на две ветви. Первая характеризует состояние конкретного объекта. Это может быть просто первичная учетная единица, подвергающаяся дальнейшему статистическому наблюдению. Вторая ветвь представляет собой характеристику статистической совокупности по одному или нескольким признакам. Причем в случае независимости признаков между собой имеет место анализ структуры совокупности по одному признаку (одномерная структура) и по нескольким признакам (многомерная структура). В том случае, если признаки зависимы между собой, имеет место анализ взаимосвязи признаков в рамках статистической совокупности. Кроме того, может иметь место сочетание этих задач, то есть задач структуры и взаимосвязи.
Если рассматривать статистическую совокупность во времени (за период Т), в случае независимости признаков имеет место задача изучения параллельных динамических рядов. Причем, поскольку рассматриваются признаки всей статистической совокупности объектов, необходимо на каждый момент времени определять объемные показатели, например суммарную величину показателя по всей совокупности объектов или средние величины, выступающие в форме обобщенной характеристики показателя по всей совокупности объектов. Если признаки между собой взаимосвязаны, то такого рода динамические ряды используются в анализе корреляции динамических рядов. В том случае, когда в динамике рассматривается взаимосвязь признаков статистической совокупности, зафиксированная на каждый момент времени, возникает задача по изучению динамики корреляции, то есть изменения во времени коэффициентов уравнений регрессии и коэффициентов корреляции. К этому классу задач относится корреляция характерная для экономико-статистических расчетов.
Таким образом, статистические задачи могут быть представлены следующими группами: задачи изучения структуры статистической совокупности объектов, задачи исследования динамики показателей по одному или совокупности объектов и задача анализа взаимосвязи признаков по одному или совокупности объектов. Перечисленные группы задач соответственно можно назвать, как структурные, динамические и коррелятивные.
Кроме того, в практике статистических разработок могут встречаться комбинированные задачи, состоящие из попарного сочетания основных задач. Поэтому дополнительно следует рассматривать задачи структурно-динамические и структурно-коррелятивные.
В процессе создания программного и математического обеспечения РОСН предполагается выделение из множества задач тех из них, которые обладают общей структурой исходной, выходной информации и алгоритма решения. В свою очередь структура исходной и выходной информации определяется признаками, характеризующими статистическую совокупность, составными элементами каждого признака, их наименованиями и значениями, формами их группировки и представления.
Моделирование оптимальной организационной структуры регистра
Успешное функционирование регистра в значительной степени зависит от правильной разработки его организационной структуры. Поэтому одной из важнейших задач, возникающих при создании РОСН, является выбор рациональной организационной структуры регистра. При этом необходимо определить как функцию и содержание каждой подсистемы, так и информационные потоки между ними.
Данная задача возникает при разработке любых сложных ЭИС, обеспечивающих сбор, хранение, обработку, поиск и передачу информации. Эффективность организационной структуры может оцениваться несколькими критериями - показателями, отражающими то, насколько удовлетворяются требования к регистру как технологическому комплексу. К ним относятся: время реакции на обработку запроса пользователя, количество одновременно работающих пользователей, безопасность обработки данных и др.
Сложность выбора структуры системы связана с большим числом возможных вариантов. Их количество зависит от разнообразия функций, выполняемых системой, числа компонентов системы (подсистем, блоков и т.п.), способов реализации этих компонентов и разнообразия связей между ними. Возможность выбора той или иной организации потоков информации сводится к выбору между централизованной и децентрализованной структурами. Централизованная структура предполагает, что все функции ведения выполняет единственный орган. При децентрализованной системе эти функции распределяются между соответствующими подсистемами.
Следует отметить, что в современной теории и практике вопрос централизации-децентрализации не является однозначным [44, 57]. Для сложных систем характерна децентрализованная структура, обладающая при рациональном распределении функций между подсистемами большой гибкостью и живучестью и обеспечивающая выбор стратегии управления. Однако децентрализованная система с точки зрения затрат более дорогая. Экономичной по расходу технических средств является централизованная система.
Рассмотрим указанные системы. Для этого введем некоторые обозначения. Совокупность входов информационной системы обозначим через X, где X - вектор, размерность которого равна числу входов, а координаты Xj заданы в виде наименований и оснований параметров, поступающих на входы. Так как входная информация поступает в определенные промежутки времени (отчетные периоды), ее можно выразить посредством функции Xj(t) для каждой из подсистем. Совокупность Xj(t) для всей системы обозначим через многомерную вектор-функцию X(t), координаты которой соответствуют сигналам X,(t) на отдельных входах системы. Для того чтобы задать выходную информацию, обозначим совокупность выходов как Q(t). Зависимость выходной информации от входной является законом функционирования системы, т.е. Q(t)=F[X(t)].
Организационная структура информационной системы представляет собой совокупность и взаимодействие подсистем, из которых она состоит. Такая структура задается в виде совокупности Х;, Qi5 F и ее подсистем Pj. Разбивка системы на подсистемы имеет несколько вариантов, поэтому одна и та же система может иметь различную структуру.
Под структурным описанием системы будем понимать представление системы в виде структурной схемы как совокупности некоторых блоков, у которых заданы входы и выходы, и связи между блоками и их входные и выходные функции задаются в обобщенном виде.
Представим закон функционирования системы как вектор-функцию: Q=F(X), где X - множество входов системы, Q - множество выходов, a F -функция преобразования входной информации в выходную. Общий закон управления системы, определяющий множество возможных вариантов организационной структуры, может быть представлен как: P={X,Q,F}.
Допустим, что мы имеем к ступеней разбиения функции Y на подсистемы, с частичными операторами разбиения функции преобразования, т.е. Fk_i=Fk[R( \ Обозначим множество частичных операторов R(k) как структуру закона управления, то есть: Y={R(1-),..-,R(m)}- В свою очередь, если обозначить через Fp\ j=( 1, /я), i=(l,«ra ) j-й частичный оператор і-й ступени разбиения, то закон функционирования каждой подсистемы может быть выражен: Если операторы разбиения F выполняются отдельными подсистемами системы, то множество частичных операторов определяет структуру всей системы, которая может быть записана как:
Следовательно, структура информационной системы может быть представлена как формализованный способ представления реализации общего закона управления системы.
Децентрализованную систему (Y) можно представить в виде набора независимых структур подсистем (Y): Y={Yj}={fj}. Централизованная система осуществляет обработку, исходя из информации обо всех или части множества управляемых объектов, то есть Xj czX. Поскольку локальный оператор F реализуется в одном месте, постольку структура системы Y записывается как совокупность: Y={F](1),...,Fn(1)}. Таким образом, для того чтобы определить структуру информационной системы необходимо на основе формулы (2.5) определить множества входов Х -1), множества выходов Q и функцию преобразования F для каждой подсистемы Р.
Технология обработки статистической информации с использованием регистров
Технологический процесс обработки статистической информации реализует задачи формирования информационно-справочной базы РОСН, организации системы ведения регистра, решения аналитических задач и выдачи ответов на запросы. Решение указанных задач требует создания специального программного обеспечения регистра.
Программное обеспечение регистра должно располагать системой процедур преобразования статистических данных, ориентированных на создание и функционирование регистра. Причем эти процедуры должны быть устойчивы к изменению технологии обработки статистических данных и потоку входной информации. В связи с вышеотмеченным, в основу программного обеспечения регистра положены следующие принципы: независимость программ от структуры основных массивов, предполагающую самостоятельное описание массивов, что позволяет программам работать автономно (в этом случае изменение структуры массивов отражается только на их описаниях и не влечет за собой изменение программ); модульность структуры, предусматривающая построение комплекса программ из отдельных программных модулей, каждый из которых реализует определенные функции, что обеспечивает замену и добавление отдельных программ, не нарушая общей целостности системы; модифицируемость, которая заключается в том, что любой модуль можно изменять или исправлять, оставляя при этом неизменным лишь принцип организации модулей, принятый для данной системы; принцип развития, предусматривающий постоянное совершенствование системы программного обеспечения путем замены отдельных программ более совершенными, а также реализация требований как в части возможности расширения системы за счет включения дополнительных алгоритмов обработки данных и формирования новых выходных таблиц, так и в части создания информационных массивов.
Одной из актуальных проблем функционирования информационных систем является проблема корректировки информации. В данной работе решение ее заключается в создании системы ведения или корректирующей подсистемы. Корректирующей подсистемой назовем комплекс организационных, технических и программных средств, на основе которого осуществляется оперативное изменение базы данных системы и тем самым обеспечивается достоверность содержания информации. Данная подсистема определяет свойство динамичности регистра, поскольку РОСН должен выполнять задачи в течение длительного периода времени.
Поддержание достоверности информации должно обеспечиваться не только программными внесениями корректирующей информации. Для этого необходимо разработать целые комплексы программ, таких как: подсистема формирования информационных массивов, обеспечивающая ввод и контроль большого объема технико-экономических показателей как за один, так и за несколько лет; подсистема корректировки вводимой информации, оперативно обеспечивающая необходимыми данными при подготовке корректирующей информации; подсистема актуализации информационных массивов, осуществляющая внесение изменений и дополнений в базу данных регистра.
Как уже говорилось (см. п.2.1, 3.1), в качестве инструментария для РП была выбрана СУБД DB2. Фрагменты листинга регистра предприятий, выполненного на СУБД DB2, приведены в приложении 4.
В состав серверов DB2 входят все необходимые средства: графические средства администрирования, клиентские компоненты для всех платформ, средства репликации данных DB2 Propogator, шлюз Net.Data для доступа к БД через Web, Web сервер Lotus Domino Go Webserver, сервер Java приложений WebSphere и многое другое.
С выходом версии 6.1, DB2 содержит Stored Procedure Builder -визуальный разработчик, который ускоряет и упрощает построение сохраненных процедур Java. Эти возможности также полностью интегрированы с инструментальными средствами разработки, такими как IBM VisualAge for Java и Microsoft Visual Studio.
DB2 Universal Database, кроме этого, имеет встроенные средства для облегчения переноса на свою базу приложений, разработанных на других системах управления базами данных, таких как Oracle, Microsoft, Sybase и Informix, или преодоления известных ограничений Microsoft Access. Возможности совместимости DB2 также расширены, чтобы позволить приложениям DB2 включать объекты OLE DB, такие как, например, Excel spreadsheets. Существующая DB2 поддержка для содержания XML также расширена, чтобы включить новые структурные возможности поиска в содержание XML.
DB2 Universal Database доступна на абсолютном большинстве ключевых платформ (23 платформы, включая Linux), что дает гибкость использования. Используемая среда полностью сетевая и полностью параллельная СУБД, позиционированная для кластерных серверов и/или серверов с массовым параллелизмом.