7 Mar 09:21 avatar

Всевидящее око Palantir

В середине февраля калифорнийской компании Palantir Technologies пришлось приносить извинения. Один из ее сотрудников предлагал устроить саботаж сайта Wikileaks — по поручению Bank of America, который, по слухам, пострадал от размещенной на сайте информации. Президент Palantir Алекс Карп принес публичные извинения в связи со скандалом. «Даже если бы мы захотели, на то, чтобы освоить такие методы борьбы, ушел бы не один год. Это далеко за пределами нашей сферы деятельности», — говорит Карп.

Palantir создает крайне сложные инструменты для анализа и визуализации данных, которые помогают правительственным агентствам, банкам и другим организациям поддерживать информационную безопасность, вести борьбу с терроризмом и выявлять случаи мошенничества. Но от 20-с-чем-то-летних гениев, которые там работают, можно ожидать чего угодно, как показала история с Wikileaks.

Со временем шум утихнет, и Palantir сможет продолжить свою миссию по спасению мира от злодеев. Это не шутка: некоторые программисты компании ходят в футболках «Спасите Шир». (Слово «Палантир» заимствовано у Толкина: так назывались всевидящие камни из «Братства кольца».)
18 Feb 22:08 avatar

Единая Информационная Система на предприятии

Автор: Нежданов Игорь Юрьевич | Источник: предоставлено автором для it2b

Информация — это, прежде всего, система. Система ее сбора, анализа, использования (распространения) и хранения. Совершенно понятно, что без обладания информацией о тенденциях, «подводных течениях», намерениях либо склонностях к тем или иным действиям нельзя прогнозировать развитие событий. А именно прогнозирование с той или иной степенью точности позволяет выбрать оптимальную стратегию и тактику в бизнесе. Соответственно возникает вопрос как собрать и проанализировать информацию? Какую информацию собирать, а какую отбрасывать? Как организовать процесс и вообще что он из себя представляет? Для получения ожидаемого результата необходимо строить систему, непрерывно работающую, кропотливо собирающую по крупицам необходимые данные из разных источников, сводящую весь этот массив воедино и выдающую в результате краткую выжимку, позволяющую принять решения. При правильном распределении обязанностей для нормальной работы системы сбора информации на среднем предприятии необходим лишь один специалист.

В соответствии с принципами системы, каждому сотруднику фирмы вменяется в обязанность собирать информацию о конкурентах, а также обо всем, что способно хотя бы в небольшой степени повлиять на бизнес. Если компания обладает развитой структурой, составлять регулярные отчеты можно обязать отделы.
17 Feb 13:10 avatar

Компьютерный контент-анализ текстов как метод экономической разведки

Автор: Шалак Владимир (кандидат философских наук, старший научный сотрудник Института философии РАН) | Источник: www.vaal.ru

Около года назад мы опубликовалди сообщение об исследовании, посвященном банкротству компании ENRON. Сегодня публикуется полный текст статьи.

В конце 2001 года компания ENRON объявила о своем банкротстве. Оно тут же было названо крупнейшим за всю историю США. Нас не интересует вопрос, почему обанкротилась компания. Нас интересует лишь вопрос, за сколько времени до фактического банкротства можно было предсказать, что дела компании идут неудовлетворительно?

В ответах на подобные вопросы весьма заинтересовано правительство при заключении договоров с различными отечественными и зарубежными компаниями, заинтересованы сами компании при заключении договоров между собой, заинтересованы различные инвестиционные фонды при выборе, куда вложить деньги, заинтересованы обычные акционеры и биржевые спекулянты, и пр. Но вот получить такие ответы весьма непросто. ENRON не только искажала свою отчетность, но и вступила в сговор с крупнейшей аудиторской компанией Arthur Andersen.
11 Feb 13:25 avatar

Автоматизация деятельности аналитика деловой разведки

Автор: Роман В. Ромачев | Конференция: «Создание системы корпоративной безопасности. Практические подходы» | Организатор: «AH Conferences» | Дата: 15.04.05г. | Место проведения: Отель «Балчуг Кемпински Москва»

Скачать текст выступлений [pdf, 239кб.]

11 Feb 13:17 avatar

Поиск фактов в тексте естественного языка на основе сетевых описаний

Мероприятие: Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции Диалог’2004. – Москва, Наука, 2004 | Автор: Киселев С.Л., Ермаков А.Е., Плешко В.В.

Аннотация

Доклад посвящен технологии автоматического анализа текста русского языка и поиска в нем описания фактов заданного типа, в том числе извлечения требуемых фигурантов факта и сопутствующих обстоятельств. Описывается представление текста в форме сети синтактико-семантических отношений, которая инвариантна к форме описания фактов с точностью до выбранной автором структуры пропозиции. Для поиска фактов используются шаблоны в форме сетей с заданными ограничениями на атрибуты узлов и связей, которые позволяют находить, преобразовывать и интерпретировать требуемые семантические структуры в сети текста.
11 Feb 13:12 avatar

Роль программных средств в деловой разведке и безопасности бизнеса

Мероприятие: семинар «Современные программные средства для деловой разведки и безопасности бизнеса» (08.07.2004г интернет-проект «Технологии разведки для бизнеса», ИПКИР) | Автор: Митрофанов А.А.

Программные средства в деловой разведке и безопасности бизнеса стали применяться не так давно, каких-нибудь 10-15 лет назад. Попробуем пройтись по основным вехам истории. Началась история использования программных средств в 70-х годах прошлого века, когда на больших машинах начали строить базы данных и системы управления базами. Большей частью это были системы хранения и поиска файлов с нужными данными на дисковых или ленточных носителях-библиотеках. Применение подобные системы находили в государственных службах. Ими заменялись существовавшие в то время картотечные системы. Решаемая задача сводилась, в общем, к управлению документооборотом и регистрации оперативных объектов или событий. Подобные системы были разработаны для оперативных учетов КГБ и частично МВД. Использование систем в оперативной деятельности происходило при проверках объектов по учетам. С появлением в конце 80-х персональных компьютеров появилась возможность сохранения на сменных и постоянных носителях файлов информационных продуктов — сообщений или отчетов. В это же время и родилась идея автоматизированной обработки текстов оперативных отчетов с помощью экспертных и интеллектуальных систем. Естественно, программы обработки текстов строились на основе западного базового софта, поскольку отечественного еще не было. Основной идеей обработки текстов стала структуризация на основе классификаторов и таблиц. В это время были заложены основы существующих ныне структурированных баз данных таких как «Кронос», «Артефакт», известных всем специалистам безопасности бизнеса баз данных «Мармозсофт».
10 Feb 17:40 avatar

Контент - мониторинг текстовой информации

Мероприятие: Научно-практическая конференция «Проблемы обработки больших массивов неструктурированных текстовых документов» | Автор: Шалак В.И. | Источник: fep.ru

Маленькое предисловие
Более восьми лет мы занимаемся специальными исследованиями в области компьютерной психолингвистики. Они получили неофициальное название «Проект ВААЛ» и касаются вопросов:
  • компьютерного контент-анализа текстов;
  • ценки некоторых психиатрических, мотивационных и психоаналитических характеристик текстов;
  • оценка коммуникативной эффективности (суггестивности) текстов;
  • оценка их эмоциональной наполненности.
Этот краткий перечень является далеко не полным, так как работа продолжается. Ее практическими результатами являются:
  • компьютерные программы для анализа текстов;
  • специальные исследования по просьбам заказчиков;
  • инициативные исследования.

9 Feb 15:57 avatar

Проблемы автоматизации деятельности аналитика

Мероприятие: Из выступления на круглом столе «Российская аналитика: от практики к методологии» от 14.10.2003г. | Автор: Печенкин И.А. | Источник: ООО «Информбюро»

В преддверии своего выступления я хотел бы поблагодарить хозяев уважаемого заведения и всех присутствующих здесь представителей цеха аналитиков и коллег из отрасли информационных технологий за предоставленную возможность воочию ознакомиться и глубже понять проблематику современного состояния дел с информационно-аналитической деятельностью в России. Яркие выступления предыдущих докладчиков позволили мне лучше уяснить насколько серьезными являются проблемы современного аналитического сообщества и какие трудности встают перед информационным аналитиком при выполнении им своих профессиональных обязанностей.
28 Jan 09:17 avatar

Неочевидное-вероятно


Автор: Денисов Д. | Источник: Бизнес-журнал, №16. — 2005. — с. 58-61

Проблема ученых, которые уходят в бизнес, обычно заключается в том, что знание фундаментальных основ бытия плоховато конвертируется в реальную прибыль. Тем не менее у компании «Вербин и партнеры», сплошь состоящей из ученых, получается зарабатывать на матстатистике, лингвистике и даже — не правда ли, странно? — философии.

Они создали «Тренд» — информационно-аналитическую систему, совершенствованием которой и занимаются уже много лет. Если кратко, то нужна она для того, чтобы мониторить то море разливанное информации, которое плещется вокруг нас каждый день, давать оценку ситуации, и — что самое ценное — прогнозировать будущее. Пользователи этого «компьютерного оракула» ставят ему совершенно разные задачи. Коммерческую структуру может волновать вероятность «наезда» силовых ведомств, банкротство контрагента, благополучие ее отдельных подразделений. Государственные органы отслеживают межэтнические конфликты и динамику развития регионов. Среди заказчиков у «Вербин и партнеры» — Минюст, Агентство по страхованию вкладов, Газпром, РАО ЕЭС, и другие. «Тренд» — «игрушка» довольно дорогая, минимальная конфигурация вместе с годовым контрактом стоит от 20 тысяч долларов.
27 Jan 09:14 avatar

Система поддержки принятия решений

Автор: Е. Черникова | Источник: Русский университет от 20.07.2004

Тема передачи: Система поддержки принятия решений;
Гости студии: специалист по системотехнике Владимир Павлович Кравченко;
Ведущие: Е. Черникова (прямой эфир);


Елена Черникова: Здравствуйте. У микрофона Елена Черникова. Мы в прямом эфире «Народного радио». Телефон 229-08-73. Позвонив по этому телефону, вы можете принять участие в моей беседе с сегодняшним гостем. Это Владимир Павлович Кравченко. Здравствуйте, Владимир Павлович.

Владимир Кравченко: Добрый день.

Елена Черникова: Уникальный специалист — системотехник, возглавляет научно-практическую фирму «Ниткон» — «Новые информационные технологии и конверсия». Чем занимается Владимир Павлович, он сейчас вам сам расскажет. Коротко скажу, что именно поняла я в предварительной беседе с нашим гостем, которого, кстати, очень давно приглашала к нам, в прямой эфир.

Создана система поддержки принятия решений, новый информационный продукт, чрезвычайно полезный, интересный и уникальный.
25 Jan 10:09 avatar

Система T2 BANC

Источник: http://www.klubok.net

Интернет является отличным полем для сбора самой острой информации о конкурентах. Для тех, кто не привык перебирать страницы поиска, отечественные разработчики предлагают специальные решение по конкурентной разведке в Интернете.

9 июня 2003г. Компания ГиперМетод представит проект разработки системы углубленного поиска и анализа данных T2 Business Analysis Console (T2 BANC). T2 BANC предназначен для систематического формирования сведений на базе разрозненной информации ресурсов Интернета: поисковых машин, отраслевых каталогов, коммерческих баз данных, собственных сайтов компаний, новостных серверов и т.д. Система производит формирование структурированного запроса, извлечение данных, нахождение взаимосвязей, анализ и семантическую классификацию и кластеризацию сведений. Автоматический процесс работы механизма сопровождается возможностью пользовательского вмешательства.
24 Jan 10:00 avatar

Комплексный метод извлечения знаний на основе правил логического вывода


Автор: Sytech

Аннотация
В данной статье рассматривается метод извлечений знаний из текстовых документов на основе применения правил логического вывода, используемый при обработке информации из разнородных источников.

Рассматриваемый метод позволяет выделять из потока слабоструктурированной полнотекстовой информации, представленной на естественных языках, набор информационных объектов и связей между ними и формировать, таким образом, хранилище фактографической информации.

В состав данного метода входят процедуры графематического, морфологического, синтаксического и логико-семантического анализа.

Метод имеет программную реализацию и практическое применение в автоматизированных информационных системах при решении задач аналитической обработки данных.

Введение
На сегодняшний день системы обработки слабоструктурированной документальной информации являются неотъемлемым инструментом аналитических отделов многих организаций. Разработано значительное число алгоритмов обработки данных, позволяющих выявлять различные закономерности в потоках документальной информации. Несмотря на то, что общие принципы обработки информации на естественном языке, как правило, схожи для различных систем, конкретные методы, используемые в них, имеют свои специфические особенности.

В данной статье рассматривается технология обработки документальной информации, используемая в системе «АРИОН», которая позволяет в автоматическом режиме выделять в тексте документов информационные объекты, их характеристики, а также сведения о них. Специализированная методика формирования правил обработки информации, используемая в данной системе, позволяет сформировать правила для обработки текстов, представленных на разных языках (русский, английский, немецкий, французский, испанский). Для решения этой задачи потребуются лингвисты с соответствующей квалификацией и знаниями конструкций и особенностей языков, а также разработчики, которые преобразуют полученные от лингвистов знания в форму правил логического вывода.

Технология обработки информации на естественном языке
Обработка документальной информации осуществляется с использованием средств графематического, морфологического, синтаксического и логико-семантического анализа, кроме того, исходные тексты сообщений также индексируются и сохраняются в хранилище данных.


Рис. 1. Технология обработки информации на естественном языке.

Графематический анализ
На этапе графематического анализа текст разбивается на отдельные образцы специальных типов: «слово_в_кавычках», «слово», «знак_пунктуации», «блок_чисел», «блок_буквенно_цифровой» и т. д. У каждого из них выделяются следующие характеристики: позиция, длина, приоритет. Кроме того, для данных образцов выделяются характеристики Up, Lw, UpLw обозначающие регистр, в котором они написаны. В результате набор лексем с порядковым номером в тексте, без переносов.

В качестве примера, иллюстрирующего процесс обработки информации возьмем следующий текст (новостное сообщение от 24.03.2006, взятое с сайта BBC http://news.bbc.co.uk):


Результат графематического анализа данного сообщения в русском варианте изложения выглядит следующим образом:


Рис. 2. Результат графематического анализа (rus).

Для английского языка результат графематического анализа будет представлен так:


Рис. 3. Результат графематического анализа (eng).

Морфологический анализ
На этапе морфологического анализа проводится анализ всех слов текста. Для каждого слова записывается его порядковый номер в тексте, начальная форма, часть речи, форма, в которой слово встретилось в тексте, морфологические признаки.

Результатом морфологического анализа является сеть (Рис. 4), состоящая из отдельных лексем с порядковым номером в тексте, без переносов аббревиатур. Если слово имеет несколько вариантов разбора, то ему соответствуют несколько фрагментов сети с одним порядковым номером.


Рис. 4. Результат морфологического анализа, приведен не полностью (rus).


Рис. 5. Результат морфологического анализа, приведен не полностью (eng).

Синтаксический анализ
В процессе синтаксического анализ текста последовательно обрабатываются его предложения, состоящие из последовательности слов, знаков препинания, таких как: тире, кавычки, скобки, двоеточия, запятые (остальные знаки удаляются на этапе морфологического разбора); а также, специальных последовательностей символов в виде номеров, последовательностей латинских букв и т. д. Данный этап в дальнейшем используется при определении факта и окрасов связей между выделенными объектами.

Логико-семантический анализ
На основе синтаксического анализа текста полученные структуры объектов преобразуются семантическую сеть (Рис. 6), узлы которой представлены множеством часто встречавшихся термов — слов и устойчивых словосочетаний. Узлы сети ассоциативно связаны между собой с различной силой, зависящей от частоты совместной встречаемости понятий в предложениях текста. Семантическая сеть может быть использована впоследствии как модель предметной области для анализа новых неизвестных документов.


Рис. 6. Общая схема логико-семантического анализа (полный размер в новом окне).

Процедура обработки состоит из следующих этапов:
  • выделение словарных понятий;
  • разбор объектов предметной области;
  • создание связей между выделенными объектами.
Выделение словарных понятий

Для выделения из текстов словарных понятий используются заранее сформированные словари. Структура словарей представляет собой набор пар «цель — возможная расшифровка», где цель — аббревиатура либо конкретный экземпляр некоего объекта. Для словаря объектов возможно наличие нескольких источников, а для аббревиатур — наличие нескольких расшифровок.

Общая структура словарей выглядит следующим образом:
  • для словарей аббревиатур:

  • для словарей объектов:

Пример применения словаря объектов мы можем увидеть на Рис. 4- здесь Минск распознан как «город», поскольку словарь содержит следующую конструкцию:


В результате обработки текста, взятого в качестве примера, были выделены следующие словарные понятия:


Рис. 7. Результат выделения словарных понятий (rus).


Рис. 8. Результат выделения словарных понятий (eng).

Выделение объектов предметной области

При выполнении разбора объектов предметной области выделяются адреса, телефоны, имена, организации, даты и т. д. — конечный набор объектов определяется непосредственно в правилах логического вывода. В процессе разбора объектов последовательно выполняются соответствующие правила (вызываются соответствующие функции), каждая из которых на основе собственного набора правил, выделяет нужные ей лексемы и на их основе создает новый объект, записывая в него требуемые данные. Обработанные лексемы помечаются соответствующим образом для исключения вероятности повторной обработки.

Данный набор правил условно называется правилами первого уровня, общая структура которых представлена ниже:


Здесь:
  • список параметров — значения параметров, перечисленные через запятую; вместо любого из параметров может быть имя переменной (знак $, после которого идет латинское имя; либо безымянная переменная, обозначаемая символом _).
  • область действия переменной — одно правило.
  • параметр «priority» указывает на приоритет правила. Если на каком-то наборе лексем отработало сразу несколько правил и лексемы, которые они использовали, пересекаются, то во время фильтрации будет выбран объект, который был получен по правилу с наибольшим приоритетом.
При работе правила сначала происходит сверка шаблонов объектов, указанных между тэгами QUERY с имеющимися образцами. Переход к следующей части правила происходит только в случае нахождения комбинации соответствующих образцов, идущих неразрывно в указанном порядке.

Далее происходит вызов функций, указанных тэгами FUNCTION. Каждая функция возвращает булевское значение. Переход происходит только в случае результат true, при этом возможно изменение функцией значений входящих в нее переменных.

После этого происходит создание результирующих объектов, описанных тэгами CREATE, создание атрибутов, соответствующих им (с помощью операции <CREATE>АТТРИБУТ (имя_параметра, значение_параметра) <CREATE>), либо наследование атрибутов от уже существовавших объектов за счет тэга INHERIT.

Также возможно уничтожение объектов по шаблонам, указанным в тэгах DESTROY. Эта функция реализована для возможности очистки промежуточных и служебных объектов в процессе обработки информации для снижения уровня шума и уменьшения вероятности получения ложных объектов и атрибутов из-за неправильного порядка применения правил (в конце выполнения правил первого уровня все промежуточные и служебные объекты удаляются автоматически).

Пример применения правил первого уровня показывает, как осуществляется формирование объекта:
  • данное правило выделяет наборы вида «имя фамилия»;

    в рассматриваемом примере, с помощью данного правила, был выделен набор «Александр Лукашенко»;

  • данное правило на основании выделенных наборов «фамилия имя отчество» формирует объект «физическое лицо»

    в рассматриваемом примере, с помощью данного правила, был выделен объект типа ФИЗ_ЛИЦО — «Александр Лукашенко».
В результате применения правил первого уровне к тексту, который мы использовали в качестве примера, были выделены следующие объекты, в дополнении к тем, которые были выделены с помощью словарей:


Рис. 9. Результат выполнения правил первого уровня (rus).


Рис. 10. Результат выполнения правил первого уровня (eng).

Создание связей между выделенными объектами

Наиболее простой способ — связать все объекты, находящиеся в одном предложении по принципу принадлежности к одному событию или факту, описываемому предложением.

Более сложной является процедура выделения связей между объектами на основании контекста (например, если в одном предложении есть объект «физическое лицо» и «адрес», а между ними стоит глагол «проживает», будет выделена связь с окраской «место_проживания»).

Правила для выделения связей между объектами (правила второго ранга) описываются аналогично правилам первого ранга, но есть несколько важных отличий:
  • порядок составляющих правило элементов не важен, они могут идти не подряд;
  • для каждого правила задается коэффициент приоритета создаваемой связи;
  • наличие пропусков и их большое число уменьшают приоритет результата;
  • используемые каждым из образцов слова из предложения записываются в него в виде битовой маски;
  • правила применяются отдельно к каждому предложению в тексте.
Общий вид правила 2-го уровня следующий:


Пример применения правил первого уровня показывает, как осуществляется формирование связей между объектами.

Данное правило формирует связь между лицом и государственным органом:


В результате применения правил второго уровня в тексте, взятом в качестве примера, была выделена следующая связь — «государственный орган „президент“ (ид: 2964) связан с физическим лицом Александр Лукашенко (ид: 3904)»:


Рис. 11. Результат выполнения правил второго уровня.


Рис. 12. Результат выполнения правил второго уровня (eng).

Индексирование документов
Для эффективной организации поиска документов используется полнотекстовое индексирование с учетом морфологии и семантики языка (Рис. 13). На основе результатов морфологического анализа текстов, слова преобразуются в словоформы с отсечением суффиксов и окончаний, что позволяет в дальнейшем искать склонения и спряжения шаблонов.


Рис. 13. Общая схема индексирования (полный размер в новом окне).

В результате выполнения процедуры индексирования к тексту, взятому в качестве примера, был получен следующий индексный набор:


Рис. 14. Результат индексирования (rus).


Рис. 15. Результат индексирования (eng).

Данный индексный набор может использоваться в статистических процедурах поиска и анализа текстов документов, когда необходимо задавать условия не на объекты предметной области или термины, их описывающие (фактографию), а на другие термины, встречающиеся в документах (не заданные в правилах вывода), или одновременно на те и другие классы терминов.

Применение результатов обработки документальной информации в процедурах извлечения знаний
Процедура обработки информации на естественном языке, описанная выше, обычно является только первым этапом в общем процессе обработки документальной информации. В рассматриваемой нами системе, комплексным результатом первичной обработки является массив связанных фактографических данных, представленный в виде семантической сети.

Для выделенных из различных источников информационных объектов выполняется процедура идентификации, позволяющая выявить сходные информационные объекты, полученные из различных источников. При идентификации объектов выделяются два основных типа связей — связи похожести и связи совпадения, при этом, предусмотрена возможность автоматического слияния совпадающих объектов. Связи похожести, как правило, обрабатываются специалистом-аналитиком (аналитик на основе экспертных знаний определяет, являются ли информационные объекты совпадающими, и выполняет, при необходимости, их ручное слияние) перед началом выполнения процедуры извлечения знаний.

Важной особенностью процедуры идентификации является возможность соотнесения вновь помещаемых в фактографическую базу информационных объектов с уже имеющимися. Это позволяет решать задачи мониторинга стандартных ситуаций.

После того как проведена идентификация и слияние совпадающих информационных объектов сформированный массив фактографической информации готов к извлечению из него знаний.

Данная процедура предполагает применение различных режимов обработки фактографической информации:
  • поисковых режимов:
    • атрибутивного поиска;
    • нечеткого поиска;

    • полнотекстового поиска похожих документов;

  • аналитических режимов:
    • контекстного анализа;
    • ситуативного анализа;

    • поиска цепочек связей;

  • режимов моделирования:
    • имитационного моделирования;
    • прогнозирования развития ситуаций во времени.

Данные режимы обработки информации, как правило, используются при решении прикладных задач поддержки принятия решений, мониторинга ситуаций, аналитических исследований и т. п.

Источники
  1. Губин А. В., Краюшкин Д. В., Кузьмин В. В., «Выбор технологии построения системы управления знаниями» // Сборник ИПИ РАН, 2004 г.

  2. Краюшкин Д. В. «Анализ технологий предварительной обработки документальной информации» // Сборник ИПИ РАН, 2005 г.

  3. Краюшкин Д. В. «Выявление и анализ угроз безопасности предприятий и регионов при помощи системы центров мониторинга и прогнозирования» // Первый Евразийский форум информационной безопасности «ИНФОФОРУМ-Алматы», 2005 г.

  4. Краюшкин Д. В., Кащенко А. А. «Методы извлечения знаний из общедоступных источников информации» // X международная научно-практическая конференция «Комплексная защита информации», 2006 г.

  5. АРИОН «Автоматизация работы с информацией оперативного назначения» // «МЕТТЭМ программные системы», 2005 г.
24 Jan 09:57 avatar

Извлечение знаний из корпоративных источников информации


Автор: Sytech

Введение
Важной составляющей деятельности любой организации является обработка информации, поступающей в нее из различных источников. Если в небольших организациях информация, как правило, поступает в бумажном виде и обрабатывается вручную, то в средних, а тем более в крупных организациях, данные процессы в той или иной степени автоматизированы. Однако стоит отметить, что далеко не во всех организациях возможности автоматизированной обработки источников информации используются эффективно. Причина этого кроется в том, что используемые источники информации достаточно сильно различаются как по своей структуре, так и по содержащейся в них информации. Источники можно разделить на внешние и внутренние, а также на структурированные и неструктурированные.
24 Jan 09:55 avatar

Применение информационно-аналитических технологий «Арион» в деятельности ситуационных центров


Автор: Sytech

Ситуационные центры, в отличие от традиционных систем автоматизации управления, дают возможность в процессе проведения совещаний не только наиболее полно и оперативно представлять на экранах коллективного пользования (видеостенах) информацию о ситуации, но и просчитывать и анализировать в режиме реального времени последствия управленческих решений (Данчул А. «Информационно-аналитические технологии и ситуационные центры»).

1. Информационно-аналитические Задачи Ситуационного центра
Ситуационный Центр (СЦ) предназначен для поддержки принятия стратегических решений на основе визуализации и углубленной аналитической обработки информации.
24 Jan 09:54 avatar

Методы и средства аналитической обработки обращений граждан и организаций


Автор: Sytech

Распространение и внедрение информационно-аналитических средств в системы документооборота с целью обеспечения взаимодействия органов государственной власти с гражданами и организациями позволяет повысить доступность государственных услуг населению, предоставляемых в том числе с использованием сети Интернет.

Своевременное и качественное разрешение обращений граждан играет важную роль в формировании общественного мнения о работе исполнительной власти. При этом стоит отметить, что на сегодняшний день основная работа по анализу обращений и подготовке ответов проводится сотрудниками профильных отделов, обрабатывающих обращения граждан. Для комплексного анализа проблематики обращений за некоторый период времени обычно используются стандартные рубрикаторы, которые редко редактируются. Таким образом, агрегированная информация по обращениям граждан представляется в виде гистограммы, с указанием количества обращений в каждой из рубрик.
24 Jan 09:39 avatar

Пример практического применения одного из методов анализа и распознавания языковых структур в системе обработки фактографической информации


Автор: Sytech


На сегодняшний день системы обработки слабоструктурированной документальной информации являются неотъемлемым инструментом аналитических отделов как государственных, так и коммерческих организаций. В зависимости от решаемых задач, данные системы обычно разделяются на несколько классов: системы автоматической рубрикации и полнотекстового поиска, системы кластерного анализа и системы обработки фактографической информации. Несмотря на функциональные отличия систем разных классов, практически во всех них производится начальная обработка исходной документальной информации, представленной на естественном языке.
24 Jan 09:37 avatar

Матрица атакует


Авторы: Николай Зимин, Сергей Коляда | Источник: Журнал «Итоги» № 13 (563), 27.03.2007


В США началось тестирование компьютерной системы ADVISE, после запуска которой о тайне частной жизни американцам придется забыть.



Джордж Буш во время посещения агентства национальной безопасности США (январь 2006 года). АНБ — основная в США организация, занимающаяся электронной разведкой. (Фото: Evan Vucci/AP)

Вы уже запаслись сухим горючим (уротропином), ацетоном и серной кислотой? Поинтересовались, как сделать из всего этого циклотриметилентринитроамин (гексоген)? И выразили вдобавок в своем блоге неприязнь к политике Джорджа Буша? Поздравляем! Вы на карандаше у американских спецслужб. Фантастическая картина будущего без преступлений, нарисованная пять лет назад Стивеном Спилбергом в фильме «Особое мнение», как никогда, близка к реальности. Но если в кино предсказанием преступлений занимались люди, обладающие даром предвидения, то природа реальных современных систем обнаружения дурных намерений — небиологическая. На днях министерство национальной безопасности США начало тестирование компьютерной системы ADVISE, способной выяснить всю поднаготную любого гражданина или гостя Америки и даже спрогнозировать, не собирается ли он захватить, к примеру, самолет и куда-нибудь на нем врезаться.
24 Jan 09:18 avatar

Каждый директор желает знать…


Автор: Юрий Смирнов | Источник: ИП «ТОП СОФТ», Корпорация «Галактика», «Бизнес ревю» от 03.05.2006

А «Галактика BI» – подскажет
Почему белорусские компании нередко проигрывают западным фирмам конкурентные сражения? Вот одна из главных причин: директор типичного белорусского предприятия обычно не использует до 90% информации, которая ежедневно накапливается в программах финансового, производственного, оперативного и других видов учета.

В отличие от белорусских коллег, большинство западных топ-менеджеров каждый день многократно «перелопачивают» снизу доверху корпоративную базу данных, за считанные секунды извлекая из нее отчеты с анализом многолетних тенденций и едва наметившихся трендов, исследования причин роста и спада продаж, прогнозы, сценарии дальнейших действий. Что, у западного директора больше пядей во лбу или более волевой подбородок? Нет, просто в его рабочем компьютере, как правило, установлена та или иная система класса Business Intelligence.