24 Jan 09:55 avatar

Применение информационно-аналитических технологий «Арион» в деятельности ситуационных центров


Автор: Sytech

Ситуационные центры, в отличие от традиционных систем автоматизации управления, дают возможность в процессе проведения совещаний не только наиболее полно и оперативно представлять на экранах коллективного пользования (видеостенах) информацию о ситуации, но и просчитывать и анализировать в режиме реального времени последствия управленческих решений (Данчул А. «Информационно-аналитические технологии и ситуационные центры»).

1. Информационно-аналитические Задачи Ситуационного центра
Ситуационный Центр (СЦ) предназначен для поддержки принятия стратегических решений на основе визуализации и углубленной аналитической обработки информации.

Типовыми задачами СЦ органов государственной власти и управления (ОГВиУ) являются:
  • текущий мониторинг СМИ по актуальным социально-экономическими общественно-политическим проблемам;
  • информационно-технологическое обеспечение мониторинга конфликтных, кризисных и проблемных ситуаций, что позволяет существенно сократить время доведения достоверной информации о ситуации до руководителя;
  • обеспечение информационной поддержки анализа социально-экономической и общественно-политической обстановки, обоснование стратегических планов и программ с помощью моделей;
  • информационно-технологическое обеспечение планирования, включая сбор информации о предстоящих событиях, ведение специальных баз данных, создание календарей событий и памятных дат, создание и ведение планов работ;
  • обеспечение информационного взаимодействия c ситуационными центрами других органов государственного управления, в том числе в режиме телеконференций1.
Решение прикладных проблем в практической деятельности СЦ требует особых подходов к информационно-технологическому и экспертно-аналитическому обеспечению СЦ, и в частности к используемым в них информационно-аналитическим системам.

В системах, данного класса, используемых в деятельности СЦ, как правило используется следующий набор технологий:
  • сбор и накопление информационных материалов, необходимых для обеспечения текущей работы СЦ по формированию документальной и фактографической базы данных (сбор);
  • обеспечение информационной поддержки аналитической деятельности (отбор);
  • обработка материалов по актуальным социально-экономическими общественно-политическим проблемам (анализ);
  • представление результатов обработки информации руководству в виде аналитических записок, ответов на информационные запросы, сводок и т. д. (представление отчетов).
Учитывая сложность и многоаспектность, приведенных выше задач, которые требуется решать с помощью информационно-аналитической системы, к ней предъявляется ряд обязательных требований:
  • с точки зрения решаемых задач:
    • актуальность (своевременность) представления информации;

    • требуемое соотношение полноты и точности поступающей информации;
    • обоснованность получаемых результатов анализа информации и прогнозирования развития ситуаций;
    • единообразие представления результатов руководству;
  • с технологической точки зрения:
    • открытость, то есть совместимость с современными стандартами обмена данными, а также возможность наращивания функциональности за счет использования программных модулей сторонних производителей;

    • интегрируемость, то есть система должна интегрировать в единой распределенной информационной среде задачи управления всеми аспектами деятельности ИАП;
    • масштабируемость, как ключевое требование с точки зрения экономии вложений, гарантирующее, что не придется перестраивать систему по мере роста объема обрабатываемой информации и количества одновременно работающих пользователей;
    • переносимость, или способность работать на различных аппаратных платформах, операционных системах, серверах баз данных.
2. Применение ИАС «АРИОН» в деятельности СЦ
Информационно-аналитическая система «АРИОН», относится к классу информационно-аналитических систем и предназначен для решения задач оперативного поиска, связи и анализа всей имеющейся разнородной информации по каждому представляющему оперативный интерес объекту, факту, ситуации.

Данная система разработана компанией ООО «САЙТЭК» и зарегистрирована Федеральной службой по интеллектуальной собственности, патентам и товарным знакам (номер свидетельства: 2005612561).

По своей функциональной структуре ИАС «АРИОН» ориентирована на решение базовых информационно-аналитических задач (и, в частности, задач СЦ), которые можно кратко охарактеризовать следующим образом (функциональные блоки системы):
  • сбор информации;
  • отбор информации;
  • выделение фактографической информации и идентификация объектов;
  • формирование фактографического хранилища;
  • анализ информации;
  • представление результатов обработки информации.
К основным преимуществам ИАС «АРИОН» можно отнести:
  • многообразие учитываемой разнородной структурированной и неструктурированной информации;
  • выделение информационных объектов из текстов документов реализуется в автоматическом режиме с использованием развитого лингвистического процессора;
  • осуществляется многокритериальное оценивание и агрегирование лингвистических и семантических признаков объектов;
  • развитый полнотекстовый, атрибутивный, тематический поиск и поиск с на естественном языке в едином интерфейсе с учетом синонимии;
  • поиск групп объектов и связей (ситуативный поиск), поиск цепочек связей между объектами и др. режимы;
  • специализированные возможности по настройке работы системы на всех этапах — от загрузки данных до написания сценариев запросов и манипулирования результирующими выборками;
  • современное архитектурное решение.
2.1. Сбор информации
Практика эксплуатации информационно-аналитических систем показывает, что в них необходимо обрабатывать информацию, содержащуюся в разнородных источниках, которые можно разделить на четыре основных класса:
  • неструктурированные источники информации — содержат полнотекстовые документы, структура которых заранее неизвестна;
  • слабоструктурированные источники информации — содержат полнотекстовые документы с известной структурой атрибутивной части документа (номер, дата поступления и т. п.);
  • структурированные источники информации.
К одному из данных классов можно отнести практически любой источник информации, за исключением, наверное, аудиовизуальных источников.


Рис. 1. Менеджер загрузки ИАС «АРИОН» (полный размер в новом окне).

Общий принцип сбора информации одинаков для всех классов источников, и предполагает:
  • установку исходных критериев сбора информации;
  • получение информации из источника в соответствии с критериями;
  • временное сохранение полученной информации и передача ее для дальнейшей обработки;
  • удаление временной информации после завершения обработки.
При обработке информации в сети Интернет неструктурированными источниками для системы «АРИОН» является набор html-страниц, которые возвращает поисковая машина в соответствии с некоторым запросом. Данный запрос является критерием начального отбора информации.

Слабоструктурированными источниками является фиксированный набор сайтов, на которые настроен краулер, входящий в состав системы «АРИОН» и обеспечивающий сбор информации с них в соответствии с установленными условиями. Примером работы краулера может служить получение данных с сайта ЦБ РФ (www.cbr.ru) о кредитных организациях и составе банков входящих в систему банковского страхования.

К структурированным источникам информации, как правило, относят смежные информационные системы, а также к ним можно отнести данные, предоставляемые в формате xml в соответствии с регламентами обмена информации с иными информационными системами.

2.2. Отбор информации
На этапе отбора информации выполняется формирование информационных подборок под конкретные прикладные задачи.

Для построения подборок используются стандартизованные поисковые технологии, которые присутствуют в каждой информационно-аналитической системе, а именно:
  • атрибутивный поиск по карточкам документов;
  • нечеткий поиск документов на основе терминов.

Рис. 2. Ввод условий отбора информации в ИАС «АРИОН» (полный размер в новом окне).

Сформированные информационные подборки представляются в виде:
  • дайджеста — набора сообщений СМИ по некоторой тематике за определенный промежуток времени;
  • аналитического отчета (набора документов связанного гиперссылками);
  • сводки (некоторого сводного набора материалов по проблеме);
  • реферата (краткого содержания информационной подборки).
В системе «АРИОН» наиболее важным применением задачи формирования информационных подборок является выбор материалов для выделения из них фактографической информации.

2.3. Выделение фактографической информации
Извлечение фактографической информации предполагает выполнение следующих процедур обработки текстов документов: графематический анализ, морфологический анализ, синтаксический анализ и, далее, непосредственно выполняется выделение фактографической информации.

Процесс выделения фактографической информации состоит из следующих шагов:
  • выделение словарных понятий;
  • разбор объектов предметной области;
  • создание связей между выделенными объектами.
2.3.1 Выделение словарных понятий

Для выделения из текстов словарных понятий используются заранее сформированные словари. Структура словарей представляет собой набор пар «цель — возможная расшифровка», где цель — аббревиатура либо конкретный экземпляр некоего объекта. Для словаря объектов возможно наличие нескольких источников, а для аббревиатур — наличие нескольких расшифровок.

2.3.2. Разбор объектов предметной области

В процессе разбора объектов последовательно выполняются соответствующие правила (вызываются соответствующие функции), каждая из которых на основе собственного набора правил, выделяет нужные ей лексемы и на их основе создает новый объект, записывая в него требуемые данные. Обработанные лексемы помечаются соответствующим образом для исключения вероятности повторной обработки.


Рис. 3. Объекты и связи, выделенные в ИАС «АРИРОН» (полный размер в новом окне).

2.3.3. Создание связей между выделенными объектами

Наиболее простой способ — связать все объекты, находящиеся в одном предложении по принципу принадлежности к одному событию или факту, описываемому предложением. Более сложной является процедура выделения связей между объектами на основании контекста, а также с учетом семантической структуры предложений.

2.4. Идентификация
Для выделенных на этапе первичной обработки информационных объектов выполняется процедура идентификации, позволяющая выявить сходные информационные объекты, полученные из различных источников.

При идентификации объектов выделяются два основных типа связей — связи похожести и связи совпадения. Совпадающими считаются информационные объекты, имеющие одинаковые значения для определенного набора ключевых атрибутов. Для них может быть автоматически выполнена процедура слияния, которая объединит информационные объекты из различных источников. Связи похожести, как правило, обрабатываются специалистом-аналитиком (аналитик на основе экспертных знаний определяет, являются ли информационные объекты совпадающими, и выполняет, при необходимости, их ручное слияние).


Рис. 4. Анализ совпадающих/похожих объектов (полный размер в новом окне).

Важной особенностью процедуры идентификации является возможность соотнесения объектов, вновь помещаемых в фактографическую базу, с уже имеющимися.

2.5. Формирование фактографического хранилища
После выполнения процедуры идентификации осуществляется формирование фактографического хранилища, которое имеет три уровня:
  • предметная область;
  • раздел предметной области;
  • подраздел предметной области для работы специалиста (с возможностью загрузки персональных данных).

Рис. 5. Структура фактографического хранилища.

На сегодняшний день подготовлены правила для выделения объектов и работы с предметными областями — общественно-политическая, пограничный \ таможенный контроль, антитеррористическая деятельность, правоохранительная деятельность.

Таким образом, фактографическое хранилище представляет собой набор проблемно ориентированных фактографических баз, которые могут использоваться в аналитических процедурах либо по отдельности, либо в виде некоторого набора фактографических баз.

2.6. Анализ информации
К процедурам анализа данных по моделям конкретных предметных областей, как правило, относят: контекстный анализ, ведение досье, анализ (поиск) цепочек связей, мониторинг изменения фактографической информации во времени, построение прогнозов, нахождение тенденции развития ситуаций.


Рис. 6. Анализ информации в ИАС «АРИОН» (полный размер в новом окне).

Основным назначением всех аналитических процедур является помощь специалисту-аналитику в подготовке аналитических материалов.

В системе «АРИОН» предусмотрена возможность включения в процедуру анализа собственных материалов аналитика, которые будут использоваться только им, и не будут доступны другим специалистам.

2.7. Представление результатов
Результаты обработки информации представляются пользователю системы с помощью графического пользовательского интерфейса (GUI) и в виде отчетов.

2.7.1. Графический пользовательский интерфейс

Графический пользовательский интерфейс обеспечивает удобную, интуитивно понятную навигацию, рассчитанную на пользователя, который хорошо знает свою предметную область и не является специалистом в области автоматизации.

Представление результатов обработки информации в пользовательском интерфейсе осуществляется в табличном\графическом виде.


Рис. 7. Примеры пользовательского интерфейса ИАС «АРИОН».

2.7.2. Построение отчетов

Построение отчетов осуществляется в соответствии с предусмотренными в системе отчетными формами. Отчеты могут формироваться в формате MS Word в соответствии с подключенными к системе шаблонами или виде набора связанных ссылками html-страниц.

1 Данчул А. «Информационно-аналитические технологии и ситуационные центры».

0 комментариев

Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.