28 Jan 09:17 avatar

Неочевидное-вероятно


Автор: Денисов Д. | Источник: Бизнес-журнал, №16. — 2005. — с. 58-61

Проблема ученых, которые уходят в бизнес, обычно заключается в том, что знание фундаментальных основ бытия плоховато конвертируется в реальную прибыль. Тем не менее у компании «Вербин и партнеры», сплошь состоящей из ученых, получается зарабатывать на матстатистике, лингвистике и даже — не правда ли, странно? — философии.

Они создали «Тренд» — информационно-аналитическую систему, совершенствованием которой и занимаются уже много лет. Если кратко, то нужна она для того, чтобы мониторить то море разливанное информации, которое плещется вокруг нас каждый день, давать оценку ситуации, и — что самое ценное — прогнозировать будущее. Пользователи этого «компьютерного оракула» ставят ему совершенно разные задачи. Коммерческую структуру может волновать вероятность «наезда» силовых ведомств, банкротство контрагента, благополучие ее отдельных подразделений. Государственные органы отслеживают межэтнические конфликты и динамику развития регионов. Среди заказчиков у «Вербин и партнеры» — Минюст, Агентство по страхованию вкладов, Газпром, РАО ЕЭС, и другие. «Тренд» — «игрушка» довольно дорогая, минимальная конфигурация вместе с годовым контрактом стоит от 20 тысяч долларов.

Классическое определение ученого: человек, который удовлетворяет свое любопытство за государственный счет. «Мы научились делать это за свой собственный», — не без гордости говорит Иван НАЙМУШИН, исполнительный директор «Вербин и партнеры».

НИИ как бизнес-школа
— В бизнес мы пошли в 1995 году, прямиком из военного НИИ. Весь наш костяк — оттуда. К тому времени госсистема информационно-аналитического обеспечения развалилась. А у новых, частных собственников предприятий возникли реальные потребности в подготовке различных бизнес-справок. Вот этим-то и занялось множество команд, подобных нашей. Мы прогнозировали, что будет с курсом доллара, с мировыми ценами на что угодно. Это как раз была наша специализация — прикладные аспекты матстатистики.

Через несколько лет поняли, что дальше у нас только два пути. Первый — набирать экспертов в различных областях. Но мы были маленькие, шейка тоненькая, ножки слабенькие — денег на это не хватало. Второй — найти какое-нибудь технологическое решение, которое помогало бы небольшому числу экспертов обрабатывать все нараставший поток информации.

— Решили автоматизировать работу аналитика?

— Именно. Получилась у нас первая программа — АТФ (анализ текстовых файлов), или, как мы ее между собой называли, — «балалайка». Это был такой поисковик с элементарным набором функций, который работал с большим объемом документов, позволял находить взаимосвязи между различными объектами. Работать стало легче. А дальше нас уже сами заказчики надоумили. Один как-то сказал: «Чего это я вам все время звоню, что-то спрашиваю? Поставьте мне вашу «балалайку» и научите на ней работать! Половина вопросов сама отпадет!» Тут-то мы и призадумались…

— Можно продавать клиенту рыбу, а можно — удочку, чтобы он сам ловил...

— Примерно по такой логике. И почувствовали, что это как раз та ниша, в которой нам наиболее комфортно. Потом оказалось, что торговать технологиями, а не информацией, гораздо выгоднее по приходу денег. И тут как раз подоспел кризис 1998 года. Тогда у нас в стране собак было меньше, чем аналитиков. Спрос на наши услуги упал. Помню, мы все вместе сели и стали размышлять: джентльмены, а чего, собственно, мы хотим от этой жизни? Всех амбиций оказалось — заниматься чем-то, что доставляет внутреннее удовлетворение: «Смотри, елки-палки, и это смогли сотворить!» И решили найти универсальный инструмент информационно-аналитического обеспечения принятия решений. Поставили вопрос: существует ли универсальный метод выработки экспертных оценок? Есть что-то общее между аналитиками (помимо зарплаты), работающими в различных областях, в алгоритме их работы? Конечно, есть — это метод аналогии. Он помогает решить главную задачу аналитика: оценка ситуации и прогноз ее развития. Помните, за неделю до дефолта Ельцин выступил по телевизору и сказал, что рубль не упадет? Теперь представьте, если сегодня Путин выйдет — еще лучше в той же карельской резиденции — и скажет то же самое… Нормальная реакция гражданина нашей Родины будет: всё, жди дефолта! Конечно, это я в упрощенном виде. Но существует аналог (опыт), есть информация о ситуации сейчас, и из сравнения первого и второго аналитик формирует какие-то выводы. Это называется теорией познания. Нам предстояло составить алгоритмы, которые позволяли бы все эти сравнения проводить, чтобы компьютер, который ничего, кроме понятия «знак», не воспринимает, мог из совокупности знаков извлекать какой-то «смысл». И мы поняли: если ситуация или объект описывается какими-то текстами, то можно научить машину обсчитать распределение в них слов по частоте. Мысль очень простая: если в тексте десять раз упоминается слово «мама» и один раз «стол», то вероятность того, что текст именно про маму, — все-таки больше. Удивительно: все, что мы делаем, на словах получается как-то сложно, но конечный результат выходит очень простым. И я вообще начинаю думать — если вы видите где-то что-то очень сложное, значит, оно просто непроработано, не домыслено… В общем, научили мы машину статистически «обсчитывать» тексты, весь информационный поток из публикаций в СМИ, в Интернете и т. д.

— И что с этим богатством можно было делать?

— Теперь смотрите: ставят аналитику задачу проанализировать, возможна ли какая-нибудь серо-буро-малиновая революция в такой-то стране, и дать свой прогноз. Он садится и пишет для машины небольшое «сочинение» на одну-две странички о том, как эта революция происходит, каковы ее признаки, что ей предшествует. За основу можно взять, например, события в Грузии или Украине. Мол, создаются всякие фонды, которые проплачивают какой-нибудь социальной группе (студентам, школьникам) определенные акции. С равным успехом он может не искать аналогов, а использовать собственное разумение. Это «сочинение» мы называем «экспериментальной моделью». И далее машина начинает сравнивать пересечение словарных частот, меру схожести между экспериментальной моделью применительно к исследуемой стране и текстами из информационного потока.

Книги Великих Мужиков
— Когда у нас с помощью «Тренда» пошли первые результаты, мы возомнили о себе — герои, сейчас у нас будет всё: счастье, деньги. Поставили систему некоторым нашим пользователям: посмотрите, полезным может быть. И как-то сразу так получилось, что никто с помощью «Тренда» не пытался оценивать радостные события. Все сразу же бросились анализировать возможное «горе»: смена вождя, кризис, банкротство… И стали нас спрашивать: ну, вот, есть какая-то мера схожести, и что с того? Что из этого следует? Куда бежать-то?

— Хотели, чтобы ваша система делала выводы?

— Чтобы оценивала результат. И мы стали искать, как создать алгоритм, с помощью которого можно бы было определить тенденцию. Опять-таки все очень просто. Если проводим сравнение с некоей периодичностью — допустим, раз в неделю, то у нас получается график, который отражает изменение меры схожести. И мы уже можем сказать: «Ситуация развивается в сторону к… или в сторону от...» Так мы шагнули от просто оценки существующего положения — к прогнозированию. Ведь ничто не берется ниоткуда и не пропадает никуда, у любой ситуации есть своя логика развития…

— Пошли от практики — к философии?

— Задача только поначалу была чисто инженерной. Повернул налево, а там травы по пояс, в коровью лепешку вляпался… Повернул направо — ага, есть дорога, закономерность нащупывается. И скоро выяснилось, что нельзя получить новое качество решений без чтения книжек Великих Мужиков (теория вероятностей, компьютерная лингвистика и т. д.). Мы ведь — не более чем ползучие инженеры-прагматики, прилагающие великие мысли к текущим потребностям. Сейчас мы со своим «Трендом» проникли в интереснейшую область. Это какой-то стык математики, философии и лингвистики. И на этом стыке очень любопытные вещи открываются. Вот, например, выяснили, что статистические закономерности русского и английского языков с точки зрения развития процессов, описываемых вербально, — одинаковы. Пойдите и скажите про это лингвисту — так он вам даст по уху! А мы можем это не просто сказать, но и показать. То есть алгоритмы, которые мы используем, — они универсальны и не зависят от языка, на котором написаны тексты.

— И каков был результат ваших философских изысканий?

— Мы постепенно научили «Тренд» делать прогнозы, отчеты вроде: 1) наблюдается тенденция в сторону к… или от...; 2) тенденция на таком-то уровне вероятности, случайна или неслучайна; 3) будет усиливаться или ослабляться и в такой-то срок достигнет критической величины… То есть анализ-синтез примерно такой же, как в медицине: в моче пациента содержится то-то, вывод — в морг или, наоборот, в палату на лечение! Мы доперли вот до чего (может, и не правы): в логике формирования каких-то ответов по результатам исследования ничего, кроме метода экспертных оценок, человечество не сочинило. Допустим, мы с вами будем решать одну и ту же задачу: выживет ли бабушка нумибийского вождя, после того, как выпьет бутылку кефира? Вы напишете одну резолюцию, я — другую. Предположим, в выводах сойдемся: кефир был российским, поэтому нумибийская бабушка не выживет. Мы напишем это разными словами, используем разные аргументы. Что делает «Тренд»? Собственно, он суммирует экспертные оценки, содержащиеся в большом количестве текстов.

— А какой-нибудь пример из области бизнеса?

— Пожалуйста. Летом 2000 года в офисе ТНК случились «маски-шоу». Мы после этого взяли все публикации о ТНК за несколько недель, которые предшествовали этому событию, и на их основе создали экспериментальную модель, которую назвали «преднаезд». Стали использовать ее применительно к другим компаниям. И выяснилось, что прогноз работает прямо-таки с угнетающей точностью. Аналогичная ситуация с ЮКОСом идентифицировалась больше чем за месяц с вероятностью 90%. Сейчас, по опыту использования этого фильтра, могу сказать, что если вероятность по какой-то компании (ясное дело, речь идет о крупных коммерческих структурах, о которых часто пишут СМИ) приближается к 70%, то это уже критично. Понятно, что там, наверху, где все эти вопросы решаются, в такой момент идет какой-то торг, действуют всякие случайные факторы. Но если вероятность становится больше 70%, то могу сказать смело: это — «в морг»!

— То есть наступает момент, когда слова становятся реальностью?

— Как в Евангелии: в начале было слово. И потом: «отмотать» пленку назад при таком уровне вероятности уже, похоже, нельзя. Процесс набрал инерцию.

«Меблировка чердака»
— Итак, вы исходите из того, что публикации — это отражение объективной реальности. А ну как это лишь журналистские спекуляции?

— В языке, в текстах объективная реальность так или иначе отражается. В случае с «наездом» как все происходит? Если компания крупная, то, чтобы осуществить процесс, заранее начинается PR-подготовка. Мы анализировали эту проблему с 2000 года. Других сценариев для крупных компаний просто не было. Может, исполнителей в одной школе учили — не знаю… Существует определенная логика «наезда».

— Выходит, для небольшой компании, о которой не пишут СМИ и которая не присутствует в информационном поле, ваш «Тренд» бесполезен?

— Такая компания, например, может мониторить устойчивость банка, в котором держит счет, или ситуацию вокруг своего крупного контрагента. А потом, с чего вы взяли, что «Тренд» придуман только для того, чтобы предупреждать о «горе»? С его помощью можно решать чисто маркетинговые задачи. Для одного заказчика мы, например, полтора года прописывали фильтры, с помощью которых можно детально мониторить табачный рынок России. А это сложная задача со многими вложениями: можно в автоматическом режиме получать отчеты о том, куда движется рынок, какие новые брэнды выводятся, как меняется стратегия отдельных игроков, какую ценовую политику они выстраивают.

— То есть аналитики, вроде, и не нужны вовсе?

— На самом деле наша система — это только инструмент, к которому все равно должна прилагаться светлая голова. Вот вы, предположим, «вождь» и берете меня к себе на работу аналитиком. Вы говорите: значит так, аналитик, меня интересуют возможности кризисов по следующим объектам. И каков будет смысл моей работы? Я начну работать с информацией, чтобы выявлять какие-то статистически значимые процессы, способные повлиять на объекты. И чем больше у меня будет информации на входе, тем точнее оценки. И далее до прихода «вождя» я стану поутру выставлять ему на стол «флажки» по каждому объекту: вот тут зеленый — ничего опасного не происходит, здесь желтый — критические тенденции незначимы, а вот тут красный — сюда вам, «вождь», стоит обратить свое высокопросвещенное внимание, потому что объект движется в сторону кризиса. Теперь вообразите сложную задачу: есть крупная коммерческая структура, у нее сотни подразделений, и по каждому — десятки угроз: внеплановая проверка, отключение электроэнергии, уголовное дело против руководителя, изменения в акционерном капитале. Кучу аналитиков сажать? Наша система упрощает задачу. Сейчас мы как раз занимаемся вот чем: совершенствуем технологии, которые позволяют многообъектную и многоаналоговую ситуацию увидеть как в целом, так и по составляющим.

В нашем офисе в подмосковном Болшево работают люди, формирующие информационный поток. Это тексты, которые ежедневно собираются воедино из 800-900 источников: из прессы, включая региональную, новостных лент, публикаций в Интернете. Этот поток ежедневно рассылается по заказчикам, у которых установлена наша система. Кстати, ничто не мешает заказчикам формировать собственный поток — хоть бы и из своих служебных документов. У заказчика есть «Тренд» и есть поток. А задачи он может ставить любые, на свое усмотрение.

— Все равно: аналитик, который формулирует задачу машине, так или иначе, вносит субъективность.

— Да, у каждого — свои представления. Представьте себе: один аналитик начинает прикладывать свой метр, и у него получается, что длина этого стола 120 см, а того 140. Другой подойдет со своей линейкой и тоже измерит. У него получится 160 и 180. Но мы-то решаем задачу — не размеры столов, а длиннее ли этот стол того! Не важно, чем мерить, хоть в попугаях. Это значит, что ошибка, которую может привнести аналитик, формируя модель, носит систематический характер, а никак не случайный.

— Можно ли прогнозировать событие, если о нем не пишут?

— Я знаю, что некоторые эксперты с помощью «Тренда» делают достаточно рискованные прогнозы. Оценивают вероятность заказного убийства какого-то лица или просчитывают, кто будет назначен на тот или иной пост. С точки зрения математики, проблема понятна. Можно работать на значимой части числа. А можно — «в хвостах». Но факт, что даже те, кто работают «в хвостах», чаще попадают, чем не попадают. Любой инструмент можно использовать по-разному: и микроскопом можно гвозди забивать.

— Традиционный вопрос: конкуренты на пятки не наступают?

— Мне часто говорят: почему вы не защищаетесь патентом, что за дилетантский подход? Я обычно отвечаю: да, бизнесмены мы плохие. Но у нас через каждые полтора-два месяца выходит новая версия, с качественно новым результатом. Конкурентов и подражателей мы не боимся. Ну, придет более денежная компания. И что? В нашем деле все зависит от «меблировки чердака». Мы сами — залог уникальности нашего продукта.

Но я не стал бы говорить, что мы какие-то чересчур умные. Мне вообще сдается, что ума нет. Все дело в том, понимаешь ли ты законы природы и следуешь им или нет. В начале 1960-х построили Новосибирский академгородок. Строители пришли к академику, отвечавшему за проект: подпишите схему асфальтирования дорожек. А он говорит: не буду, через год приходите. За год народ дорожки между корпусами протоптал, и асфальт уложили как раз по ним. Столько лет с тех пор прошло — все только по асфальту ходят, протаптывать новые тропинки незачем. Умный был тот академик?

— Когда-то вы были военным математиком. Где было интереснее?

— Я почти 20 лет просчитывал траектории баллистических ракет. Там столько закономерностей и случайностей приходилось учитывать, что когда на испытаниях блок, пролетевший несколько тысяч километров, отклонялся от цели всего на сотню или даже десяток метров, у нас каждый раз было ощущение, что мы содеяли чудо. Мы-то знали, какие там скорости и динамические удары! И сейчас у нас — все та же великая наука: мать-и-матика. Только рисуем теперь траектории вероятностей. Но прежнее ощущение все равно время от времени посещает. Иной раз бреешься поутру и думаешь: вот ведь молодцы мы — какое диво сотворили! И ради этого стоит работать.

0 комментариев

Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.