11 Feb 13:12 avatar

Роль программных средств в деловой разведке и безопасности бизнеса

Мероприятие: семинар «Современные программные средства для деловой разведки и безопасности бизнеса» (08.07.2004г интернет-проект «Технологии разведки для бизнеса», ИПКИР) | Автор: Митрофанов А.А.

Программные средства в деловой разведке и безопасности бизнеса стали применяться не так давно, каких-нибудь 10-15 лет назад. Попробуем пройтись по основным вехам истории. Началась история использования программных средств в 70-х годах прошлого века, когда на больших машинах начали строить базы данных и системы управления базами. Большей частью это были системы хранения и поиска файлов с нужными данными на дисковых или ленточных носителях-библиотеках. Применение подобные системы находили в государственных службах. Ими заменялись существовавшие в то время картотечные системы. Решаемая задача сводилась, в общем, к управлению документооборотом и регистрации оперативных объектов или событий. Подобные системы были разработаны для оперативных учетов КГБ и частично МВД. Использование систем в оперативной деятельности происходило при проверках объектов по учетам. С появлением в конце 80-х персональных компьютеров появилась возможность сохранения на сменных и постоянных носителях файлов информационных продуктов — сообщений или отчетов. В это же время и родилась идея автоматизированной обработки текстов оперативных отчетов с помощью экспертных и интеллектуальных систем. Естественно, программы обработки текстов строились на основе западного базового софта, поскольку отечественного еще не было. Основной идеей обработки текстов стала структуризация на основе классификаторов и таблиц. В это время были заложены основы существующих ныне структурированных баз данных таких как «Кронос», «Артефакт», известных всем специалистам безопасности бизнеса баз данных «Мармозсофт». Создавались и отраслевые базы данных в соответствующих министерствах. Был разработан макет системы выявляющей связи между объектами разработки на основе классификаторов. На этой системе следует остановиться специально. Система, разработанная под руководством бывших сотрудников Института ПГУ КГБ Владимира Кравченко, Валентины Крыловой и Константина Крылова в компании НИТКОН представляла собой человеко-программный комплекс поддержки управляющих решений. Вся входящая информация проходила через оценку экспертов, сортировалась по важности, актуальности, достоверности и классифицировалась по открытым классификаторам. В результате обработки каждый элемент информационного потока — текст превращался в совокупность-набор элементов классификатора, а затем эти наборы сравнивались, по ним проводился совместный поиск и т.д. На основе созданных специально для этой системы алгоритмов, включающих обработку гипотез, осуществлялась деятельность по прогнозированию событий. Естественно, система была необычайно сложной, зависела от квалификации и добросовестности экспертов, однако, тем не менее, все-таки пережила несколько инсталляций, как в госструктурах, так и нарождавшихся в то время крупных банковских структурах.

Частных охранных, а тем более информационных компаний в стране пока еще не было. Бизнес только начинал развиваться и для информационной поддержки решений использовались базы данных государственных структур или информация от источников в государственных структурах. Одновременно в стране появляются русифицрованные пакеты программ для редактирования текстов, создания баз данных, работы с таблицами. Наиболее известной программой был пакет «Фреймворк-4», а потом «Фреймворк-5», русифицированная версия которого была установлена в Кремле у Михаила Горбачева. Эта программа явилась прототипом микрософтовского Офиса.

Появляется отечественный редактор текстов «Лексикон». Первые базы данных, причем неструктурированные в появляющихся Службах безопасности создавались именно с использованием этого редактора, имевшего опцию полнотекстового поиска. Эти базы данных содержали тексты справок, выписки из газетных материалов (сканирование и распознавание печатных текстов стало применяться несколько позже, а электронных версий СМИ в то время практически не было), прочие текстовые материалы, касающиеся объектов заинтересованности. Энтузиасты, которые вели эти базы, собирали любую информацию, которой обменивались сотрудники информационных подразделений СБ. Поиск по большим массивам требовал большого времени. Иногда на поиск в параллель запускалось несколько компьютеров на сутки и более. Но дело того стоило. Задача, стоявшая тогда перед аналитиками СБ, была задачей идентификации объекта, выявления его свойств и существенных форм активности, с большим вниманием к негативным сторонам деятельности. Информация представляла собой статический портрет объекта с основания до дня исследования. Чаще всего эта информация использовалась для выбора из двух альтернатив «Да» или «Нет», «Хороший»-«Плохой», «Сотрудничать»-«Не сотрудничать». Информацией стали торговать, ею обменивались. Наиболее развит оказался обмен информацией в активно развивающейся банковской отрасли. Именно там пошло наиболее активное развитие как офф-лайновых структурированных отраслевых баз данных, таких как «Интелбридж», «Финансинформ», он-лайновых баз данных на сервере ЧОП «Амулет». На этом сервере был реализован первый т.н. «черный список» по банковским неплатежам, который функционировал в виде электронной доски объявлений (BBS). Интернет в зоне РУ был пока экзотикой, но развивались сети типа ФИДО. Службам безопасности нужна была информация, поставщиками ее стали информационные посредники, такие как «Синс», «Лайнс», служба дайджестов «Банки и Безопасность» Вениамина Горохова при БПЛ, информационная служба «Шериф». Спрос родил предложение на специальные программы и базы данных. В начале это были СУБД в ДОС, потом в Windows. Появилась телефонная база МГТС. К серверу одного из подразделений МГТС можно было подключиться за разумную абонентскую плату и получать оттуда требующиеся данные о владельцах телефонных номеров. В то время это считалось вполне нормальным и совершенно легальным. В продаже появились «синие» ДОСовские базы данных с регистрационными данными на фирмы. Их появление было вызвано ростом мошенничеств на финансовом и товарном рынке, бизнесмены, стремясь управлять своими рисками, требовали от своих служб безопасности более точной и более оперативной информации в более сжатые сроки. Впрочем, этими же базами пользовались и правоохранительные органы, поскольку оперативность нужна и там, а учеты органов отставали и в техническом отношении и в оперативности. Развитие программ для сжатия текстов привело к развитию нового подхода к полнотекстовому поиску — использование индексирования. Практически лидером полнотекстового поиска стала программа «Клио», которая применялась в информационных структурах очень долго и успешно и кое-где применяется до сих пор. Стал быстро развиваться Рунет. Кроме YAHOO и Альтависты появились русскоязычные каталоги и поисковые машины. Для того, чтобы справиться с нарастающими объемами информации стали применять технологии интернет-поиска на собственных массивах данных. Это были, например, такие поисковики как «Яндекс» или «Серверный следопыт». Увеличилось предложение офф-лайновых текстовых баз, таких как, например, «АТФ+». Развиваются он-лайн предложения — информационный портал Интегрум-техно. Определяющим фактором стало время. Информация стала нужна практически немедленно, поскольку бизнес-процессы стали быстроизменяющимися, конкуренция росла, времени на принятие решений становилось все меньше и меньше. Для принятия решений требовалось понимание связей между субъектами рынка, прямых и косвенных, явно выраженных и скрытых.

На российский рынок вышли иностранцы, увидев, что имеется платежеспособный спрос на программы поиска и обработки информации. Они начинают предлагать дорогостоящие технологии интеллектуального анализа данных. Как кратко излагается в статье Минаева, Морозова и Хачукаева, «существо этих технологий заключается в интеллектуализации управления процессами информационного обеспечения человека. Здесь и автоматизированный поиск информационных взаимосвязей любых объектов — событий, людей, телефонных переговоров, адресов и т.п. из всех видов баз данных, существующих в мире. И визуализация сложно структурированной информации в графическом и табличном виде. И статистический и географический анализ событий. И нахождение скрытых, латентных объектов».

Наши разработчики не отставали. На базе данных Московской регистрационной палаты создается известная многим и очень удобная база данных АВПМ, использование которой помогало аналитикам находить и визуализировать связи между юридическими и физическими лицами, компаниями и учредителями, вести поиск практически по любому параметру регистрации.

К обработке информации подключаются ученые математики, применяющие при создании аналитических продуктов современнейшие результаты математической статистики, нейросетевого программирования, математики фракталов. Используются результаты научных разработок в лингвистике и психолингвистике. Так, например в ветви контент-анализа появляются экзотические программы типа интересного продукта ВААЛ, изучающего психолингвистическую тональность текстов и воздействие их на читателя. В поисковиках начинают применяться поисковые запросы на обычном языке. Появляются программы, рассчитывающие явные и неявные связи между объектами в текстах и их весовые характеристики. Полученные в результате научных разработок программы и новые методики, в свою очередь, подстегивают развитие оперативной практики аналитиков и оперативников, сотрудников активно развивающейся в России частной индустрии деловой разведки и управления безопасностью бизнеса.

Количество баз нарастает, в конце 90-х годов все яснее вырисовывается требование к созданию СУБД-оболочки, позволяющей осуществлять запросы одновременно ко многим базам данных и получать объединенные отчеты. Наиболее интересным предложением продукта такого рода оказался «Кронос».

Экономический, и в первую очередь банковский, кризис 1998 года выявил серьезную проблему с анализом информации. Решение задачи идентификации не позволило снять все бизнес риски, т.к. являлось лишь частью процесса, предшествовавшего принятию первого управляющего решения. Развитие же бизнес процесса или мониторинг объектов производился очень редко, а автоматизированных средств, аналогичных CRM на рынке безопасности еще не было. Кроме того бизнес задался вопросом можно ли прогнозировать подобные кризисы, и как проводить коррекцию бизнес операций в зависимости от изменений на рынке, вызывающих изменение подверженности риску, для минимизации убытков при кризисе. Управление рисками стало модной темой, перейдя из категории «где-то у них там» в категорию «и у нас уже». Применение понятийного аппарата и методик управления рисками потребовало от информационных аналитиков не только мониторинга информации о рынке, но и измерения — ранжирования состояний рынка и его субъектов, поскольку напрямую касалось управления и перераспределения ресурсов компаний, в первую очередь, финансовых ресурсов. Как говорит английская пословица: You can manage only what you can measure/ Можно управлять только тем, что можно измерить.

Информационный вал продолжал нарастать. Поисковые машины выдают на простые запросы многие тысячи входов. Отчеты результатов поиска комплексных СУБД представляют собой сотни страниц слабоструктурированного теста. Заказчик уже не справляется с эти валом информации, выдаваемой по его запросу, его захлестывает потоками текстов. Таким образом, спираль истории сделала свой оборот, и мы вернулись уже к проблеме обработки потоков (включающих фактор времени), а не массивов (как в начале) структурированных текстов, но на более высоком уровне. Заказчик начинает требовать обработки этих данных. Причем обработки не только технической, но уже аналитической с предложениями по возможным вариантам принятия решений. Спрос на отечественные системы, позволяющие удовлетворить требования заказчика, стал подстегивать их разработку и предложение интересных программ на рынке. Сегодня информационные аналитики с помощью этих программ не только обрабатывают тексты, готовят отчеты и другие аналитические продукты, но и проводят оценку ситуации, разрабатывают сценарии развития событий и занимаются прогнозированием. С помощью систем конкурентной разведки проводится сбор, обработка и анализ данных о конкурентах с использованием методов т.н. бенчмаркинга, сравнения. Одновременно с текстами начинают обрабатываться числовые данные, таблицы финансовых отчетов, балансов, прайс-листов, счетов-фактур. Делаются попытки распознавания графических образов. Программные комплексы бизнес-разведки и аналитической поддержки принятия решений, встраиваются в корпоративные информационные системы. Бизнес разведчики с их помощью начинают оказывать реальную поддержку принятия решений топ-менеджментом своих корпораций. Задачей сегодняшнего дня становится не только задача идентификации или проверки объекта, выявление свойств и связей объекта с другими объектами (т.е. т.н. «Прямая задача»), но и поиск объекта по его свойствам, связям и образу (т.е. «Обратная задача»).

РАЗВЕДКА КОРПОРАЦИЙ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ (ФУТУРИСТИЧЕСКИЙ ВЗГЛЯД)
Давайте попробуем помечтать или спрогнозировать дальнейшее развитие нашей отрасли. Что мы можем ожидать в ближайшее время от программных средств и компьютерных технологий в области деловой разведки и безопасности. Видится, что дальнейшая работа пойдет в сторону развития алгоритмов обработки информации. При этом аналогичной обработке будут подвергаться не только текстовые, цифровые данные и изображения, но и речевые тексты. Будут решены проблемы автоматизированного выделения из потоков данных актуальной и важной информации по определенным тематикам. Будет Решена «обратная» задача выявления в потоке информации объектов по заданным свойствам или заданным «портретам». Будет решена «банковская задача» автоматической проверки клиента или контрагента по заданным «портретам» хорошего и плохого заемщика. (Задача стала актуальной в последнее время с ростом конкуренции банков на рынке кредитования физических лиц.) Будет решена задача уменьшения неопределенности по времени и связанной с ней неопределенности по сценарию события при прогнозировании. Доработанные алгоритмы позволят обсчитывать общие риски бизнеса. Это даст возможность вести по одним и тем же алгоритмам расчеты финансовых и нефинансовых рисков, выражать подверженность рискам в одних и тех же единицах и масштабах, управлять одновременно и ресурсами и рисками. Программные комплексы дадут возможность моделировать события и рассчитывать возможные сценарии, используя идеальную моделирующую среду — язык, слово. Одного только не сможет машина — заменить человека в принятии решения.

0 комментариев

Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.