close

Вход

Забыли?

вход по аккаунту

?

bd000102830

код для вставкиСкачать
На правах рукописи
Окладников
Сергей Михайлович
МЕТОДЫ УНИФИКАЦИИ
ИНФОРМАЦИОННО-АНАЛИТИЧЕСКИХ СИСТЕМ
НА ПРИМЕРЕ СТРУКТУРЫ РОССТАТА
Специальность 05.13.01 Системный анализ, управление, обработка информации
(Технологии химико-лесного комплекса)
Автореферат
диссертации на соискание ученой степени
кандидата технических наук .
Красноярск - 2005
Работа выполнена на кафедре системотехники Г О У В П О
«Сибирский государственный технологический университет»
Научный руководитель:
доктор технических наук, профессор
Доррер Георгий Алексеевич
Официальные оппоненты:
доктор технических наук, профессор
Воробовнч Николай Петрович
кандидат технических наук
Холкин Олег Валерьевич
Ведущая организация:
Институт вычислительного
моделирования СО РАН,
г.Красноярск
Защита состоится 14 декабря 2005 года в 14 часов на заседании
диссертационного совета К.212.253.01 при Сибирском государственном
технологическом университете по адресу: 660049 г. Красноярск,
ул. Марковского 57, СибГТУ, корпус А Б В , ауд. А-102
С диссертацией можно ознакомиться в научной библиотеке Сибирского
государственного технологического университета
Отзывы на автореферат в двух экземплярах, заверенные печатью
учреждения, просим направлять по адресу: 660049, г.Красноярск,
пр.Мира 82, СибГТУ, ученому секретарю диссертационного совета К
212.253.01 Ушакову С В .
Автореферат разослан « 12 » ноября 2005 года
Ученый секретарь диссертационного совета
K.T.H., доцент
С В . Ушанов
^2?^*
23/7/
г
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
'шш
Актуальность
темы.
Большое
разнообразие
программных
средств,
предназначенных для решения однотипных задач, определило постановку множества
вопросов,
связанных
с
поиском
методов,
реализующих
построение
унифицированного программного обеспечения. Проблема унификации должна
рассматриваться с учетом специфики сферы приложения и типизации программных
средств. Первые работы в этой области заключались в поиске методов унификации
систем программирования. В 1965-1967 гг., в работах украинских ученых Глушкова
В.М., Ющенко Е . Л , было предложено решение указанной выше проблемы, путем
создания метасистем,
позволяющих по формальному заданию синтаксиса и
семантики входного языка получить транслятор с этого языка. Однако в настоящее
время автоматизация конструирования систем программирования утратила свою
актуальность. Потребность в унификации программных приложений в большей
степени актуальна для класса информационно-аналитических систем (ИАС)
различных предметных областей. Именно этот тип программного обеспечения стал
объектом исследования в данной работе. Основной характеристикой области
применения ИАС, влияющей на необходимость унификации, является динамичность.
Таким образом, потребность в универсализации ИАС полностью зависит от факторов
предметной области (социальных, экономических и др.). Если предполагаемая сфера
приложения ИАС мало подвержена изменениям, то выбор между созданием
специальной ИАС и использованием унифицированной системы будет очевиден.
Любая специфичная ИАС будет более приоритетной, чем универсальная система,
треб)тошая адаптации к необходимой предметной области. Однако время адаптации,
как правило, существенно меньше времени разработки новой ИАС. Учитывая это, на
практике часто выбор делается в пользу универсальной системы. Универсализация
информационных систем, позволяет рассматривать различные специфичные
проблемные области как одну сферу в рамках универсальной системы. При
разработке методов унификации ИАС в данном диссертационном исследовании был
выбран подход, основанный на эмпирическом развитии системы. На основе
локальных потребностей в универсализации программных средств отдельной
проблемной среды осуществлялась модификация разработанных методов с учетом
всевозможных факторов, npncjTHHX для новой рабочей предметной области. Таким
образом, методы, способные реализовать универсальную ИАС для конкретной сферы,
должны учитывать возможность переориентации системы на другую предметную
область. При этом речь идет о глобализации методов унификации ИАС, и это - одно
из требований к разрабатываемой методике.
В качестве базовой предметной области исследования выбрана государственная
статистика. И этот выбор не случайный. Статистика - одна из немногих областей
экономической деятельности, где обрабатываются большие объемы разноплановой
информации. Производственный план устанавливает сроки проведения работ
Федеральной программы статистических работ и включает около 560 задач. Задачи
производственного плана имеют различную периодичность - ежегодные,
ежеквартальные, ежемесячные, еженедельные. Существуют формы обследования
различных предприятий, которые обрабатываются единовременно. В настоящее
время органами Росстата собирается статистическая информация по более чем 200
различных типам форм, утверждаемым Росстатом. Сроки обработки данных
определяются Федеральной программой и Производственным планом и составляют,
I
БИЬЛИОТЕКА
СПе
•Э
j
в зависимости от формы от 3-4 дней, до 1-2 месяцев. Статистические данные о работе
всех отраслей экономики подвергаются обработке, как минимум, на трех уровнях:
районном, региональном и федеральном. Динамика предметной области, подразумевает
большую дифференциацию инструментальных средств, участвующих в информационном
обмене. Для обработки статистической отчетности для каждой грзтппы показателей
отдельной отрасли вышестоящим уровнем разрабатываются специфичные программные
средства. На протяжении многих лет для органов госстатистики оставался актуальным
вопрос о программном обеспечении, позволяющем автоматизировать обработку
различных статистических
показателей в едином комплексе. С
развитием
информационных технологий появились возможности для перехода от типовых решений
задач к сквозным технологическим решениям. И начало реализации этих возможностей
было положено в ходе исполнения Федеральной целевой программы по реформированию
статистики в 1997-2001 г.г. Внедрение технологических новшеств позволило
существенно уменьшить трудоемкость сбора и обработки информации. Однако, идея
перехода на безбумажную технологию, первичный сбор данных на электронных
носителях до сих пор остаются в перспективе. Отсутствие унифицированных средств для
первичной обработки статистической информации, а также отсутствие технической
возможностей у субъектов экономической деятельности, особенно на районном уровне,
не позволяют полностью реализовать прогрессивные методы сбора и обработки данньк.
В 2004 г. ввод в эксплуатацию корпоративной информационно-вычислительной системы
государственной статистики (ИВС) явился важным этапом по универсализации
технических решений. С одной стороны - реализация И В С Росстата позволяет
оптимизировать
обработку данных за счет формирования
интегрированных
статистических информационных ресурсов на всех уровнях в виде статистических баз и
регистров, а также осуществление к ним оперативного доступа, в том числе с
использованием
Интернет-технологий
Однако
структура
ИВС
предполагает
использование отдельных подсистем для определенных функций, но каждая подсистема
в отдельности, опять же, не реализует принципы универсальности. Так, частная
подзадача корпоративной системы — «ССО» (сбор статистической отчетности)
предлагает ряд альтернативных программных продуктов для первичной обработки
данных, которые ориентированы на специфичность отдельных групп показателей. Таким
образом,
отсутствие
унифицированной
системы
увеличивает
трудоемкость
сопровождения группы программных продуктов и усложняет обучение персонала.
Особенно эта проблема актуальна для районного звена, где на одного специалиста по
сбору и обработке статистических данных приходится множество различных по
структуре и содержанию форм статотчетности, вследствие чего сложно ориентироваться
в разнообразных типовых программных продуктах.
Статистический учет осуществляется в любой сфере человеческой деятельности.
Одна из целей создания универсальной ИАС - совмещение государственного учета с
корпоративным, что в будущем и предполагается федеральной программой по
реформированию статистики. В этом случае малый бизнес получит возможность
производить сбор статистической информации для собственного потребления. Это
необходимо, прежде всего, для успешного ведения бизнеса и решения социальных
вопросов в рамках корпорации. Соответственно создание общей системы, способной
решать задачи как на государственном, так и на корпоративном уровне, позволит
сократить затраты на сопровождение программного обеспечения, обучение пер-
сонала и существенно уменьшить трудоемкость обработки данных и
ннформащюнного обмена.
Государственная статистика оказывает существенную роль в исследовании
конъюнктуры сферы малого бизнеса. Специфика экономической деятельности
Красноярского региона отражает возросший интерес к автоматизации
корпоративного
статистического
учета
на
предприятиях
лесной
промышленности. За последние годы увеличился рост количества субъектов
экономической
деятельности,
занимающихся
лесозаготовительным
и
лесоперерабатывающим производством. Лесная отрасль переоснащается
технически и экономически, проводятся семинары по новым технологиям В
начале 2005 года, на одном из крупных деревообрабатывающих предприятий
края - «Канском ЛДК» установлено новое оборудование и профаммнос
обеспечение. Реорганизация статистического учета в данной организации
позволяет вводить новые программные продукты, и на данном этапе ощутима
потребность в унифицированном ПО. Разработка универсальной ИАС позволит
осуществить в ближайшей перспективе планы информационного взаимодействия
государственных
статистических
структур
с
первичными
объектами
статистического
наблюдения, причем именно лесная отрасль будет
приоритетной в решении данной задачи.
Исследования, проведенные в данной работе, заключаются в поиске
методов, позволяющих максимально унифицировать процессы сбора и
обработки информации, в области государственной статистики.
Сказанное определило актуальность работы, выбор ее целей и задач.
Таким образом, главной целью диссертационного исследования является
разработка
методики унификации
ИАС,
позволяющей
единообразно
обрабатьгеать разноструктурную информацию, и ее применение при реализации
унифицированной информационно-аналитической системы для обработки
статистических данных.
Для достижения поставленной цели в работе автором определены и
решены следующие задачи.
1. Создание функциональной модели существующей деятельности Росстата, а
также модернизированного варианта модели, с учетом применения результатов
данного диссертационного исследования. Анализ требований к разрабатываемой
ИАС, с учетом специфики области, определяемой данными моделями.
2. Разработка и реализация метода, позволяющего обрабатывать и хранить
разноструктурную информацию в едином комплексе.
3. Создание универсальных машинных лингвистических средств: построение
моделей многоязыкового транслятора и глобального интерпретатора; разработка
и реализация блока задания и управления синтаксисом; разработка и реализация
алгоритмов лексического и синтаксического анализов в многоязыковом
трансляторе, основанных на формализме помеченной сети Петри.
4. Реализация метода унифицированной обработки и представления
информации.
5. Создание модели унифицированной ИАС, на примере корпоративной
системы «Обработка статистической отчетности (ОСО)» в нотации сетей Петри
и ее программная реализация в функции автоматизированного поиска действий
рекомендуемых пользователю для решения поставленной задачи с наименьшими
временными затратами в рамках ИАС.
Предмет исследования - методы унификации базового функционального состава
информационно-аналитических систем.
Под базовым набором функций ИАС, специфицирующихся на обработке,
хранении, выборке данных, обычно подраз)^еваются соответствующие функции ввода,
выборки, контроля, экспорта-импорта информации. Таким образом, решение задачи по
унификации информационной системы в целом состоит из решения частных подзадач
по унификации каждой функции системы в отдельности.
Соответственно объектами исследования в данной работе являются'
функциональная модель деятельности Росстата;
логаческая модель унифицированной базы дап1п,1х;
лингвистическое обеспечение ИАС;
визуальные средства проектирования форм ввода данных;
универсальные средства получения выходной информации;
функция оперативной статистики;
функция
автоматизированного
поиска действий
рекомендуемых
пользователю для решения поставленной задачи с наименьшими временными затратами
в рамках ИАС и др.
Элементы научной новизны в диссертационной работе проявляются в
следующем.
1. Разработан
метод
построения
универсального
хранилища
данных,
заключающийся в логическом делении модели БД на две составляющие части:
динамическую и статическую. Динамическая часть состоит из таблиц, хранящих
обрабатываемые данные, а статическая часть содержит таблицы-справочники и
таблицу-дескриптор.
Таблица-дескриптор,
содержит
ключевую
информацию,
определяющую связь между статической и динамической областями базы данных.
2. Разработана методика построения лингвистической модели, реализующей
многоязыковой транслятор, предложен способ организации его управляющей части,
заключающийся в создании библиотеки подстановок. Каждая подстановка представляет
собой сеть Петри для определенного синтаксического правила. Выборка необходимых
подстановок из библиотеки и составление из них различных комбинаций задают
соответствующий синтаксис языка.
3. Реализована функция автоматизированного поиска действий рекомендуемых
пользователю для решения поставленной задачи с наименьшими временными затратами
в рамках ИАС с использованием аппарата сетей Петри.
Методика унификации ИАС, содержащая вышеперечисленные элементы научной
новизны, является основным материалом диссертационного исследования, выносимого
на защиту.
Теоретическая значимость исследования заключается в создании методики,
объединяющей в себе методы, позволяющие максимально унифицировать создаваемые
ИАС.
Практическая значимость исследования заключается в том, что все
рассмотренные в работе модели и методы - программно реализованы в информационноаналитической системе, способной полностью занять свободную нишу в подсистеме
«ОСО» и в е Росстата. Тем самым, появляется возможность исключить
альтернативу выбора программных средств, которая усложняет технологический
процесс обработки информации в исследуемой предметной области.
Разработанная автором универсальная НАС «Обработка статистической
отчетности» внедрена в эксплуатацию в следующих организациях:
- Территориальный орган Федеральной службы государственной статистики
по Красноярскому краю (Красноярскстат)(акт о внедрении № 12-2 от
15.03.2005 г.)
- Отдел по сбору и обработке статистической информации по г. Канску и
Капскому району (акт о впедрепии №-6/4 от 11.10.2004 г.)
- ОАО «Канский ЛДК» (акт о внедрении №-15 от 18 октября 2005 г.)
В дальнейшем иланируси.» ьнсдрсние Н А С « О С О » в Opi ани^ацимл лесной
промышленности г.Канска и во всех районных отделах статистики Красноярского
края.
Структура и объем диссертации.
Диссертация
состоит
из
введения,
четырех
глав,
заключения,
библиографического списка и пяти приложений. Работа содержиг 145 страниц
текста, 35 рисунков и 12 таблиц. Библиография содержит 107 источников.
СОДЕРЖАНИЕ Р А Б О Т Ы
В введении рассмотрены методы и технологии создания информационноаналитических систем, работающих с разнородной информацией. Приводится
обоснование актуальности темы, формулируются основные цели и задачи работы.
В первой главе работы дан обзор модели существующей информационной
системы Росстата, технологического процесса обработки статистической
информации на разных уровнях структуры Росстата, произведен анализ
функциональной модели существующей деятельности Росстата, выявивший «узкие
места» в процессе автоматизированной обработки информации. Соответственно,
реализована новая модель, оптимизирующая процесс обработки информации.
Приведена информация об объектах автоматизации, и на основании
фЗ^кциональной
модели деятельности
Росстата
локализована
область
исследования, которая определяет функции автоматизированной обработки
информации на районном уровне ИВС Росстата. Подсистема ИВС «ССО» является
центральным объектом исследования. Ее функции заключаются в обеспечении
автоматизированного сбора и обработки статистической информации. Однако
состав программного обеспечения в данной подсистеме предполагает
альтернативный выбор из имеющейся совокупности ПО. Естественно, такой
подход к решению поставленных задач в исследуемой области не приемлем.
Подсистема «ССО» распространяется на все уровни обработки статистической
информации. Соответственно, использование программных средств с различным
интерфейсом и функциональным составом усложняет процесс обработки даже
однотипной информации. Анализ предметной области показал, что подсистема
« c e o » нуждается в унифицированных средствах сбора и обработки статистической
информации, и таким средством может стать информационная система, отвечающая
ряду предъявленных в данной главе требований. Основной акцент при рассмотрении
модели и в е делается на районный уровень. Это связано с тем, что именно на уровне
районов обрабатывается большой объем первичных отчетных данных, и автоматизация
данного уровня является приоритетной задачей при создании подсистемы «ССО».
Согласование государственной системы статистического учета с корпоративной
статистикой осуществляется посредством операций экспорта-импоргга первичных
данных, или непосредственной обработкой этих данных на уровне корпорации и
дальнейшей передачей информации в необходимом формате на уровень
государственной статистики. Итогом анализа исследуемой области стали выводы о
подходе к унификации ИАС. Данный подход выражается в детализации основного
функционального состава ИАС и унификации каждой функции в отдельности. При этом
приоритетной задачей является реализация универсальной структуры базы данных, о
чем излагается во второй главе. Разработка метода унификации БД имеет существенное
значение для построения методики универсализации ИАС.
Во второй главе рассмотрена модель и описан метод, позволяющий реализовать
универсальное хранилище базы данных. Данный метод реализует полустатическую БД,
состоящую из двух частей: динамической и статической. Материал, содержащий
описание предложенного способа организации полустатической БД выносится на
защиту.
Рассмотрены традиционные архитектуры информационных систем и модели БД.
Из предлагаемых современным рынком архитектур баз данных для решения
поставленных задач в диссертации была выбрана архитектура «клиент-сервер»
Используемые для проектирования БД CASE-средства позволяют при необходимости
перепроектировать систему для любого другого сервера, при этом клиентская часть
системы потребует незначительной перекодировки, т.к. функции системы изначально
проектировались в соответствии с принципами универсальности, а это означает, что
любая функция системы может бьггь выделена в отдельное самостоятельное
приложение. Архитектура универсальной ИАС, основанная на принципах архитектуры
«клие1гг-сервер», имеет свои особенности при реализации хранилища данных (рис. 1).
Метод, в данной работе условно именуемый полустатическим, позволяет
реализовывать унифицированные базы данньрс, способные хранить разноструктурную
информацию. Модель полустатической БД представлена в виде вектора:
BD^<S,D>,
где
5'- статическая часть БД,
D-динамическая часть.
Статическая часть задается в виде вектора S='^P?,C,T,V>, верхний индекс
элементов вектора 5тсазывает на их принадлежность к соответствующей области базы
данных.
Здесь:
Я-отношения, являющиеся подмножеством результата декартова произведения
Л с D; Z) = £), X D j X... X Z)„; где каждое из множеств Д - домен отношения;
соответственно с? = (i/,,rfj,....,c?^)- кортеж отношения R;
л* - статические отношения, задаются на этапе проектирования базы
данных, структура которых не изменяется в процессе ее эксплуатации;
С - связи, определяемые между отношениями статической области БД;
7* - ограничения целостности, определяемые над статической частью
БД, с помощью триггеров, генераторов, ключей;
V - совокупность хранимых процедур, представлений над статическими
отношениями Л*.
Динамическая
часть,
соответственно
описьгаается
вектором:
D=<R',C,T(r>
Л^-динамические отношения, создаваемые системой в процессе работы
по их метаописанию, хранящегося в статической области;
С^ - связи организуемые в динамике между отношениями статической
части и динамическими отношениями: Д* -^/г;
7^ ~ триггеры, также создаваемые системой при создании
соответствующих отношений, для реализации ограничений целостности данных,
хранимых в динамических отношениях;
у" - хранимые процедуры, генераторы для обработки соответствующих
динамических отношений.
У д а л е н н ы й сервер
Локальные
компьютеры
Клиентская
часть И А С
Сервер БД (Interbase)
База данных
1:М
/'Динамическая часть\
(Данные)
Рисунок 1 - Архитетура универсальной ИАС
Каждая таблица, создаваемая в пределах динамической части БД,
представляет собой отдельный информационный показатель (объект) со своими
свойствами и методами. Свойства данного объекта задаются в интерактивном режиме
в визуальной среде создания форм ввода данных и сохраняются в таблицах
метаописания, а методы представляют
собой хранимые процедуры, с
соответствующими алгоритмами. Каждая такая таблица идентифицируется
составным именем на уровне системы. Кроме того, также динамично организуются
ограничения целостности для этих таблиц. Концептуальная модель универсальной БД
представлена на рисунке 2.
Статическая часть схемы, состоящая из справочников, обрамлена
пунктирной линией. Логика построения статической части БД ориентирована на
обработку информации, opi анизованной в табличную структуру. Модель,
представленная на рисунке 2, предполагает следующую логику организации
справочников. Любая форма для обработки данных разбивается на разделы, а каждый
раздел состоит из показателей, организующихся на пересечении строк и столбцов.
справочник ф<пьтроа
номер фитыра
код формы (FK)
на«в, филыра
справочник рагяамежа
номер фильтра (FK)
Код объекта учета (FK)
п
I
Внешний Регистр учета
спр.шапок
код формы (FK)
код отчета (FK)
код поля
1
описание шапки
справочник отчетов
код формы (FK)
. код отчета
801-Запросы
дескриптор
код уникальный
-Щ номер филыра (FK)
J период
I Код объекта учета (FK)
; Код объекта учета
справочник форм
Справочник формул контроля
код
номер формулы
номер уюерж.
ПОЛИ, название
Kpaiv. название,
период заполняемости
дата утверждения
код формы (FK)
формула
справочник шаблонов талеграмм
I код формы (FK)
номер строки
'■—т код номера позиции
справочник раадепое
кед формы (FK)
номер раздала
признак КС
I номер.пок
-• наименование раздала
системное наименование таблицы
. Прочив априбуты
справочник колонок
номер раздала (FK)
код фо|)мы (FK)
код графы
справочник строк
номер раздела (FK)
_щ код формы (FK)
^ код строки
ширина колонки
номер колонки
номер строки
справочник показатапей
номер разделе (FK)
код формы (FK)
номер показателя
назв. поля
размер
тея
незв. показаталя
I номер строки
I номер колонки
|ЗН»1ИМ0СТЪ
Да11мые _фа^мы^ 1 разделе 1
код унихельный (FK)
, Значения показателя 1
Значения показателя 2
Значения показателя NP1
Даннъ» формы 1 pa3A<w«J2_
, код уникальный (FK)
, Значения показателя 1
> Знечения показателя 2
Значения показателя NP2
'
ЗДГнТ|У9»р1ЬУыГПй'ЭД>"»'ЯУ
код уникальный (FK)
Значения показателя 1
Значения покезателя 2
Значения показателя NPn
Рис. 2 Логическая модель универсальной БД ИАС
{интврпратация строки
NFHC(VTH4eciK записей с г ф м т м я ф о р м
М^шпмество записей справочника раэдйпоа
КРшпичвстао пакаэшалвй раздала
!*« NR*NF
Каждый показатель имеет свойства, сохраняемые в таблице «справочник
показателей». Раздел формы представляет собой подтаблицу, объединяющую
данные однородной структзфы. Таблица «справочник форм» также соединена с
двумя дочерними таблицами: «справочник отчетов» и «справочник формул
контроля», вследствие чего подразумевается наличие в ИАС соответствующих
функций выборки и контроля данных. Еще одна дочерняя таблица по отношению
к справочнику форм - «справочник фильтров», гр)ттпирует формы и данные из
таблицы «справочник регламента» по произвольным признакам. В таблице
регламента хранится
информация, регламентирующая
информационную
обработку учитываемых о^ектов в ИАС. Данные об объектах обработки
формируются на основе внешних информационньк регистров.
Анализ логической модели БД позволил найти единый подход к
перенастройке статической части модели на иную предметную область.
Предположим, что динамическая часть БД является полностью универсальной и
не нуждается в перенастройке. Каждое отношение R' связывается только с
некоторым отношением статической области Pf. Связей между отношениями
динамической части БД не допускается. Среди совокупности таблиц статической
части БД Р^, следует выделить таблицу-дескриптор, являющуюся связующим
звеном между областью данных D и статической областью S. Дескриптор
содержит ключевую информацию, которая определяет связь статической части с
динамической частью БД, и такой информацией является время обработки
показателя (атрибут «период»). Понятие периода определяется условно, т.к.
дискретность процесса обработки данных может подчеркиваться любой
временной величиной (год, месяц, день, час и т.д.). Кроме данных о времени
обработки показателя, в дескриптор «пер)етекает» информация об объекте учета
для конкретного фильтра, которая также определяет первичный атрибут схемы
В третьей главе диссертационной работы представлен материал,
содержащий элементы научной новизны, выносимые на защиту.
Лингвистика
ИАС
«ОСО»
предполагает
использование
двух
трансляторов, снабженных механизмом управления синтаксисом. Первый из них глобальный многоязыковой интерпретатор используется в пределах всей системы
и предназначен для распознавания синтаксических конструкций языков,
задаваемых аппаратом контекстно-свободных (КС) - фамматик.
Механизм управления синтаксисом представляет собой матрицу,
содержащую альтернативы грамматических правил
Предварительно описав правила подстановок в виде БНФ {Бекусовские
нормальные формы) y,.:=p,i\ р,2\ . |Д,„ исключаем лев5Т0 рекурсию, т.е. все
правила приводим к виду, в котором либо P,j еХ, либо Д, eY, где X={xj,. .xj терминальный алфавит; У-{у,, ,yj- нетерминальный алфавит. Затем все
множество правил R, приводим к одному единственному правилу. Для этого с
каждым нетерминальным символом X, для которого в правых частях
Б Н Ф задаются только терминальные альтернативы, сопоставляется множест­
во этих альтернатив. Остальные альтернативы, содержащие нетерминальные
11
символы, подставляются вместо главного нетерминального символа. Главный
нетерминальный символ задается статично, остальные организуются внешней
двумерной матрицей, доступной для модификации ее содержимого.
Работа алгоритма синтаксического анализа происходит по нисходящей
схеме. В процессе анализа создается дерево разбора, которое при необходимости
может представляться для анализа в ИАС «ОСО». Обход дерева происходит в
глубину. Сначала просматриваются все левые поддеревья, а затем все правые. В
процессе разбора, если анализируемая
последовательность
символов на
определенном этапе не соответствует грамматике, происходит возврат на более
верхний уровень, и разбор производится далее. Если разобраны все комбинации
символов, но тождественной входному слову не найдено, то выдается сообщение об
ошибочной синтаксической конструкции.
Однако основная часть данной главы посвящена созданию компилятора
интерпретирующего типа, т.к. здесь новизна проявляется не только в управляющей
части транслятора, но и в алгоритме разбора входного языка. Входной язык
представляет собой совокупность булевских формул (предикатов). Каждая формула,
в процессе ее написания анализируется на корректность ее синтаксиса, а затем
переводится во внутренний формат системы А Б Ф К (автоматизированный банк
формул контроля). А Б Ф К представляет собой таблицу БД, в каждой записи которой
сохраняется откомпилированная формула контроля.
Поскольку основное назначение транслятора в ИАС «ОСО» - компиляция
входного языка контроля в формат А Б Ф К , вся работа по поиску методов трансляции
производилась на базе синтаксиса языка контроля. Были разработаны два метода
синтаксического анализа. И если первый - шаблонный метод, предполагающий
использование эталонного языка, ориентирован в большей степени на специфичность
языка контроля, то второй метод, ставший базовым в информационно-аналитической
системе, в большей степени отвечает принципам универсальности.
В данной главе работы также рассмотрена математическая модель
функции контроля, включающая в себя модели обоих трансляторов, при этом
элементы модели шаблонного метода помечены знаком (*). Модель представлена в
виде пары:
Kont =<А, М>,
А - модель А Б Ф К ,
М- интерпретационная модель.
Модель А Б Ф К содержит в себе информацию о синтаксисе языка контроля и
методах его трансляции в специализированный язык, условно называемый языком
А Б Ф К . Интерпретационная модель М позволяет получать протоколы работы функции
контроля на основании метаописания структур хранилища данных.
A'^<Gn,Gr, Q>
Gn.Cr => Lg - генератор базового языка. Реализует функцию отображе­
ния фамматической модели в базовый язык. Генератор базового языка
Gn - это функция, в результате работы которой получается совокупность всевоз-
12
всевозможных комбинаций лексем, составляющих базовый язык Lg={lg' .Ig"}, в
соответствии с заданной грамматической моделью,
Q - модель компиляции.
Gr =<PN, G, Е> - грамматическая модель,
PN- формальная модель си!ггаксиса языка, (аппарат сетей Петри),
G - грамматика языка,
Z - функция, помечающая информационные переходы терминальными
символами.
Грамматическая модель Gr представляет собой функцию, используемую
для построения синтаксиса языка, определенную формализмом сетей Петри. Эта
функция реализует отображение грамматики, заданной с помощью БНФ, на
формальную модель синтаксиса PN, 4'Q G =>PN
PN-{0,P.
T,F.Mo},
где
в ={0,1,2,...} - множество дискретных моментов времени,
P={pi,P2, ■ ,pj - непустое множество элементов сети (позиций),
T^{ti,h, -.',«/- непустое множество элементов сети (переходы),
/■-функция инцидентности: F (PxT)i^xP) -^{0,1,2 ,к, ..},
ZX=>Tпомечающая функция, ставящая в соответствие переходам t,
е Г символы Л) еХ.
Начальная разметка позиций: Мо:Р -*fO,I,2,...}
Грамматика языка представляет собой объект G(X,Y,yj,R), где
X-{xi, ... ,xij- терминальный алфавит; Y-fyj, ...yj- нетерминальный алфавит; jvy
- аксиома грамматики; R - множество правил грамматики, задающих язык в виде
БНФ.
Модель компиляции содержит информацию о выходном языке, и
реализует основные отображения трансляции:
0=<Д V, У/, ¥S >,
В - метаописание выходного языка,
%: L ^Л (лексический анализ). Во входном языке L идентифицируются
лексемы, сопоставляются с метаописанием области даиньгх и переводятся в
векторы A={v,,. .,v„}, содержащие числовые коды лексем, поступающие на вход
синтаксического анализатора;
У;.- Л => La (синтаксический, семантический анализ). Информшдия о
лексемах языка Л в процессе анализа компилируется в выходной язык А Б Ф К ,
информация о котором содержится в метаописании В;
Ч^. L :^La (компиляция ВХОДНОГО языка в выходной язык АБФК), данное
отображение используется в схеме трансляции А. Здесь входной язык
L
непосредственно переводится в язык А Б Ф К L^.
До рассмотрения алгоритмов трансляции в работе описана модель
подстановки и методика построения данной модели, в основе которой
использован метод декомпозиции. Согласно данному методу, общая модель
синтаксического анализатора представляется в виде совокупности подмоделей, ко
13
которые подобны по всем своим свойствам общей модели в силу их инвариантности.
Рассмотрены основные типы связей моделей, а также их физическая организация в ИАС.
При моделировании подстановки использован аппарат сетей Петри.
Модель подстановки рассмотрена в виде объекта, представленного на рисунке 3
Вход
Рисунок 3 Модель подстановки
Принципы построения объекта подстановки подобны принципам моделирования
бизнес-процессов (нотация IDEFO). Отличие состоит в том, что ресурсы, необходимые для
завершения подстановки Х„ подключаются на схеме к нижней грани объекта через вход
Ifp). по предварительному запросу, исходящего из этой же грани через выход 0'(t') В
качестве ресурсов подстановки X, выступают как другие подстановки библиотеки так и
сама Х„ рекурсивно вызываемая Управляющие сигналы, используемые для корректировки
работы модели, могут также быть входящими и исходящими. Маркировка входов и
выходов интерпретируется следующим образом: I'fpJ - вход, где в качестве параметра р'
указывается номер позиции подстановки Х„ в которую помещается фишка, поступающая
из другой подстановки Соответсгвешю в маркировке выхода 0'(t), параметр /обозначает
номер выходного перехода подстановки X,. Сигнал, поступающий на вход 1(р)
инициализирует модель для последующей работы. Появление сигнала на выходе Oft)
(срабатывание выходного перехода) сигнализирует о заверщении подстановки.
Сеть Петри, моделирующая грамматику языка, должна отвечать следующим
требованиям.
1. Сеть Петри, состоящая из множества моделей подстановок, должна легко
модифицироваться, для этого входы и выходы всех типов каждой модели должны быть
представлены в единственном экземпляре.
2. Ограниченность сети Петри при любой комбинации моделей подстановок. В
этом случае каждая модель подстановки должна обладать свойством ограниченности. Это
означает, что для любой достижимой в сети маркировки А/, существует такое к, что и,<=к.
14
3. Все переходы являются потенциально живыми, т.е. из начальной маркировки А/д
существует достижимая маркировка М, при которой любой переход t^flf/eT? является
разрешенным.
4. Свойство устойчивости неинформационных переходов. Неинформационный
переход является устойчивым, если никакой другой неинформационный переход не
может лишить его возможности срабатывания.
Согласно четвертому свойству, связь изображенная на рисунке 4 а, не допустима
при моделировании, т.к. срабатывание одного из двух переходов лишает возможности
сработать другой переход. Рисунок 4 б демонстрирует связь, разрешенную при
моделировании, т.к. свойство устойчивости не нарушается. В последнем случае позиция
связана с переходами с помощью дуг разных типов - обычной и ингибиторной. Переход с
входящей ингибиторной дугой срабатывает только при отсутствии фишки в исходной
позиции. Следовательно, срабатывание одного их двух переходов не оказывает влияния на
возможность срабатывания другого.
а) связь позиции с неустойчивыми
переходами
б) связь позиции с устойчивыми переходами
с использованием ингибиторных дуг
Р и с у н о к 4.
Соответственно модель подстановки (рисунок 5 б) построена неверно, т.к.
неннформационные переходы t4 и /^ неустойчивые. Тожаественная ей модель, с выполнением
условия устойчивости неинформационных
переходов изображена на рисунке S а.
а) Модель с устойчивыми
неинформационными переходами
6) Модель с неустойчивыми
неинформационными переходами
Рисунок 5.
15
Основная идея реализации управляющей части трансляторов - это задание
синтаксиса языков посредством комбинации отдельных моделей подстановок. В работе
рассмотрены несколько типов соединения подстановок, среди которых в качестве
базового можно выделить один тип - каскадный.
0(1)
1(Р)
В
Рисунок 6 - Схема каскадного соединения подстановок
При каскадном соединении работа модели начинается с подачи на вход 1(р)
подстановки С сигнала. Подстановка С подключает подстановку В в качестве ресзфса и
т.д. Последняя подстановка Л не требует внешних ресурсов для своего завершения. Такая
подстановка обычно моделирует аксиому грамматики.
Далее рассмотрены алгоритмы лексического и синтаксического анализов.
Первый шаг алгоритма трансляции - это осуществление лексического
анализа. Реализация отображения !fy. L =>Л заключается в переводе входного языка в
векторы A={v,, . ,vj, содержащие числовые коды лексем. Представив входной язык
совокупностью номеров информационных переходов L={tj, ...,tj, отображение *Fi можно
переписать в следующем виде %: X =>Л, где Х-терминальный алфавит грамматики G.
Перевод входного языка в совокупность векторов Л, осуществляется за один
проход. Информация просматривается посимвольно, и в соответствии с дескриптором
подстановки, реализуется отображение %. Каждый символ входного языка заменяется
соответствующим номером перехода. Векторы кодов терминальных символов как
результат лексического анализа организуются динамически. Число векторов равно
количеству слов входного языка.
Второй шаг алгоритма трансляции. Синтаксический анализ, описанный в
математической модели в виде отображения !/^; А => La, реализован по принципу
управляемой работы помеченной сети Петри, реализующей грамматическую модель.
Параметром управления работой модели, является результат лексического анализа, т.е.
векторы кодов терминальных символов Л. Под управлением понимается процесс
указания номера перехода, который должен сработать в данный момент. Данная схема
анализа позволяет не производить слова свободного языка Петри, которые отсутствуют в
транслируемой формуле.
Процесс синтаксического анализа начинается с подачи на вход модуля
анализируемого вектора v„. Затем каждый элемент вектора v,f[i]
обозначаю­
щий
номер
информационного перехода сети Петри, проверяется на воз16
можность его срабатывания в данный момент времени. Если такая возможность
существует, то данный переход срабатывает, после чего рассматривается
следующий элемент вектора v„[i+l]
Если рассматриваемый информационный
переход не имеет возможности сработать в конкретный момент времени,
срабатывает неинформационный переход, и снова проверяется текущий
информационный переход Если все неинформационные переходы сработали, а
информационный остался запрещенным, то вектор признается не распознанным,
и, следовательно, соответствзтощая синтаксическая конструкция входного языка
является
ошибочной.
Вектор
признается
распознанным,
если
все
соответствующие ему переходы уже сработали, и выходной переход сети
является разрешенным.
Процесс компиляции выполняется на втором проходе текста входного
языка, при котором посимвольно считываемая информация перекодируется в
выходной язык La, в соответствии с перекодировочной таблицей.
Перекодировочная таблица формируется автоматически на этапе создания форм
ввода. Атрибуты таблицы содержат концептуальные наименования лексемпоказателей и соответствующую им системную интерпретацию. Системные
имена показателей формируются автоматически по специальному правилу и
обозначают
физические
атрибуты таблиц
хранилища
данных.
Все
информационные показатели в системе в пределах одного раздела
статистической формы имеют уникальный номер, так же как и сам раздел в
пределах формы, и форма в пределах системы. Таким образом, имя показателя на
языке А Б Ф К имеет следующий вид: Х1Х2ХЗ - где 1-номер формы, 2 - номер
раздела, 3 - номер показателя. Арифметические операторы и операторы
отношений переводятся из LE Ьд один к одному, а условные разбиваются на две
логические секции: в первой части, секции «ЕСЛИ» заменяются на скобки
<IF->(> и <,->)> и сцепляются с секцией «ТО» логической операцией AND. При
подстановке такой конструкции в функцию контроля результат будет истинным,
если обе части вьфажения будут истины, однако, если первая часть выражения
ложна, то результат формулы игнорируется. Полученные формулы формата
А Б Ф К сохраняются в таблице, где каждая запись хранит одну формулу. При
проведении контроля сканируется таблица А Б Ф К , и поочередно выбираемая
формула подставляется в качестве фактического параметра в функцию контроля,
результат которой имеет логический тип. После проверки всех формул па
предмет истинности функция возвращает протокол контроля, что соответствует
работе интерпретационной модели М. При формировании протокола контроля,
все формулы контроля формата А Б Ф К переводятся и отображаются в
русскоязычной интерпретации.
Предложенный в работе метод построения лингвистических моделей и
алгоритм синтаксического анализа могут использоваться вне рассматриваемой
информационной системы, как отдельное приложение для обеспечения
трансляции множества входных языков. Управляющая часть синтаксического
анализатора не требует знания специализированных метаязыков, описывающих
синтаксис.
Всевозможный
синтаксис
языков
может
быть
описан
произвольной комбинацией моделей подстановок, которые заранее разработаны
17
и хранятся в библиотечной таблице базы данных. Соединение моделей в определенной
последовательности для задания необходимого синтаксиса - более простой процесс по
сравнению с программированием синтаксических конструкций на специализированном
метаязыке.
Четвертая глава описывает основные функции ИАС «ОСО». Здесь
представлено описание функций визуального проектирования форм, универсального
генератора отчетов, логического контроля, функции справочной службы и др. Основной
акцент делается на рассмотрение функции справочной службы, т.к. данный материал,
заключает в себе научную новизну и выносится на защиту. Построение этой функции
основано на разработанном автором методе автоматизированного поиска действий
рекомендуемых пользователю для решения поставленной задачи с наименьшими
временными затратами в рамках ИАС. Данный метод позволяет автоматизировать
создание интерактивной справочной службы. Суть метода состоит в создании
функциональной модели в нотации сетей Петри, которая динамично меняется в
зависимости от функциональной комплектации ИАС.
Рисунок 7 Сеть Петри для ИАС «ОСО»
Задача функции справочной службы - определить список рекомендуемых действий
пользователю для решения поставленной задачи с наименьшими временными затратами
в рамках ИАС. В работе рассмотрена сеть Петри, состоящая из 11 переходов и 15
позиций (рис}тюк 7).
Здесь двунаправленная стрелка обозначает для одного перехода одновременно
две дуги: исходящую и входящую. С каждым переходом сопоставляется
соответствующее
событие,
а
с
каждой
позицией
определенный
экземпляр сущности системы. Формально модель представляет собой объект с
18
заданными входными и выходными параметрами Работа модели продолжается
до тех пор, пока не будет найдена искомая комбинация фишек в позициях,
заданная заранее. Пределы поиска необходимой комбинации, можно варьировать
изменением глубины дерева разметок сети Петри.
Так, при задании начальной разметки сети Петри Мо, в которой определены
входные и выходные параметры модели, в процессе генерации формируется
свободный язык Петри. Затем анализируются векторы свободного языка сети
Петри, отвечающие условию запроса (наличию фишки в определенной позиции
сети). Локализованные векторы заполняются совокупностью соответствующих
условньгк значений фзшкций времени из соответствующей таблицы После чего,
осуществляется поиск самого «короткого» вектора, т.е. содержащего
минимальную сумму значений временных характеристик.
Иетерпретация найденного вектора, осуществляется на основании таблицы,
хранящей наименование процесса и его временную характеристику.
Найденный рекомендуемый список действий пользователя, исключает
вероятность выполнения лишних функций в системе, что приводит к экономии
рабочего времени и уменьшению трудоемкости.
Заключение
В работе
результаты.
1.
2.
3.
4.
5.
6.
автором
получены
следующие
научные
и
практические
Создана и проанализирована функциональная модель существующей
деятельности Росстата. Создан прототип функциональной модели деятельности
Росстата с учетом внедрения результатов диссертационного исследования в
процесс автоматизированной обработки информации. Произведен анализ
требований к унифицированной ИАС.
Разработана методика построения лингвистических моделей, реализующих
механизмы управления синтаксисом в многоязыковых трансляторах, разработана
модель многоязыкового транслятора, разработаны алгоритмы лексического и
синтаксического анализа.
Разработан метод полустатической организации хранилища данных. В
результате его применения была реализована унифицированная база данных,
позволяющая хранить разноструктурнзто информацию в едином комплексе.
Разработаны унифицированные методы выборки информации из БД и создания
электронных форм для ввода данных.
Разработан метод автоматизирюванного поиска действий рекомендуемых
пользователю для решения поставленной задачи с наименьшими временными
затратами в рамках ИАС.
Реализована и внедрена в организациях Росстата и предприятиях лесной
промьппленности
распределенная
информационно-аналитическая
унифицированная система «Обработка статистической отчетности в структуре
Росстата», с использованием всех вышеописанных методов.
19
Результаты работы отражены в следующих публикациях:
1
2.
3
4
5.
6.
Доррер,
ГА.
Информационно-аналитическая
система
для
обработки
статотчетности в структуре Госкомстата Р Ф / Г.А. Доррер, С М. Окладников //
Проблемы информатизации региона ПИР-2003- Материалы V I I I Всерос. науч.прак. конф.- Красноярск: ИПЦ КГТУ.2003. С. 21-25.
Окладников, С М . Построение информационно-аналиических систем по принципу
аддитивного расширения на примере распределенной ИАС «Обработка
статотчетности
в
структуре
Госкомстата
РФ»
/ СМ.
Окладников
//Информационные технотогии моделирования и управления' Межд5Т1ародный
сборник научных трудов. Вып. 15 - Воронеж: изд-во «Научная книга», 2004. С.7176.
Окладников, С М . Информационно-аналитическая система для обработки
статотчетности в структуре Госкомстата Р Ф / С М . Окладников //Современные
проблемы информатизации в технике и технологиях: сб. трудов. Вып. 9 (по итогам
IX междзт*ародной открытой научной конференции) - Ворюнеж: изд-во «Научная
книга», 2004. С. 234.
Храмов, Г.И. О комплексном обеспечении автоматизированной обработки
статистической информации / Г.И. Храмов, С М . Окладников // Журнал «Вопросы
статистики» 3/2005 г. - Москва: изд-во «Статистика России», 2005. С. 35-37.
Окладников, С М . Построение лингвистических моделей для многоязыковых
трансляторов / С М . Окладников // международный научно-технический журнал
"Информационные технологии моделирования и управления" 5/2005 - Воронеж:
изд-во «Научная книга», 2005.- С. 15-17.
Храмов, Г.И. Методы интеллектуализации принятия оптимальных решений в
прикладных задачах при построении ИАС широкого назначения / Г.И. Храмов,
С М . Окладников // Журнал «Вопросы статистики» 11/2005 г. - Москва: изд-во
«Статистика России», 2005. С 27-30.
20
г. Канск, тираж 130 экз. 2005 г.
Отпечатано в ООО «ТИРАЖ и К»
•22548
РНБ Русский фонд
2006-4
23171
Документ
Категория
Без категории
Просмотров
0
Размер файла
1 018 Кб
Теги
bd000102830
1/--страниц
Пожаловаться на содержимое документа