16 Jun 10:18 avatar

Доктор Ватсон в ожидании Холмсов

Отечественные производители софта уже давно не радовали профессионалов конкурентной разведки, экономической безопасности, расследователей, правоохранителей, аналитиков новыми, качественными продуктами. Одной из наиболее востребованных и совершенно незаполненных ниш на российском рынке аналитического софта является ниша семантически-визуального анализа. Практически в России не существует доступных по цене ни отечественных, ни зарубежных продуктов, позволяющих проводить семантический анализ текстов на русском языке с извлечением нужных исследователю сущностей или онтологий (например, фамилия, имя, отчество, наименование юридических лиц, название городов, идентифицируемых прозвищ и кличек и т.п.), и затем визуализировать результаты этого анализа.
17 Jan 12:04 avatar

Аналитика на основе мониторинга соцмедиа: возможности и перспективы

Доклад был представлен Михаилом Шумаковым, исполнительным директором сервиса мониторинга и анализа социальных медиа «Крибрум», на конференции IBC Russia 2013.

Как происходит мониторинг социальных медиа сейчас? Как правило, он осуществляется по довольно простым метрикам: количественным (число упоминаний за период, число авторов за период) и качественным (распределение по типам площадок и источникам, характеристики авторов). С этими же метриками работают и многие другие сервисы мониторинга социальных медиа, они же используются при ручном мониторинге, в этом ничего необычного нет.
24 Mar 12:34 avatar

Фракталы и кластеры в информационном пространстве


Авторы: Д. В. Ландэ (к.т.н., заместитель директора Информационного центра «ЭЛВИСТИ»)
| Источник: Персональный сайт Дмитрия Ландэ, 2005
Мрак первозданный. Тишина. Вдруг луч,
Пробившийся над рваным краем туч,
Ваяет из небытия слепого
Вершины, склоны, пропасти, хребты,
И твердость скал творя из пустоты,
И невесомость неба голубого.

Герман Гессе. «Игра в бисер»

Немного истории
Термин фрактал (от латинского слова fractus — дробный), был предложен Б. Мандельбротом в 1975 году для обозначения нерегулярных самоподобных математических структур. Популярная сегодня фрактальная геометрия получила свое название лишь в 1977 году благодаря его книге «The Fractal Geometry of Nature». В работах ученого использованы научные результаты многих ученых, работавших в этой же области (прежде всего, Пуанкаре, Кантора, Хаусдорфа). Основное определение фрактала, данное Мандельбротом, звучало так: «Фракталом называется структура, состоящая из частей, которые в каком-то смысле подобны целому».

В самом простом случае небольшая часть фрактала содержит информацию о всем фрактале. Строгое определение самоподобных множеств было дано Дж. Хатчинсоном в 1981 году. Он назвал множество самоподобным, если оно состоит из нескольких компонент, подобных всему этому множеству, т. е. компонент получаемых афинными преобразованиями — поворотом, сжатием и отражением исходного множества.
24 Mar 12:31 avatar

Моделирование динамики новостных текстовых потоков


Авторы: Д. В. Ландэ, А. А. Снарский, С. М. Брайчевский, А. Т. Дармохвал | Источник: Персональный сайт Дмитрия Ландэ
Аннотация
В поведении текстовых информационных потоков, порождаемых в сети Интернет, наблюдаются две тенденции: постоянный рост объемов и усложнение динамической структуры. В связи с этим становится актуальной проблема моделирования динамики информационных потоков. Именно этому вопросу была посвящена данная работа.

Приводятся как теоретические выводы, так и результаты экспериментального анализа динамики информационных потоков, обрабатываемыми в рамках технологии контент-мониторинга InfoStream.
24 Mar 12:28 avatar

Модель диффузии информации


Автор: Д. В. Ландэ (д.т.н., НТУУ «КПИ») | Источник: Персональный сайт Дмитрия Ландэ

В настоящее время, когда объемы и динамика публикации информации в Интернет позволяют говорить об информационных потоках, актуальным становится изучение их динамики. Разнообразие поведения публикаций по различным тематикам и сложность взаимного влияния различных публикаций заставляют искать новые, ранее неизвестные в этой области методы. По-видимому, на данном этапе в области моделирования сложных информационных процессов успех может быть достигнут лишь путем синтеза достаточно простых алгоритмов и концепций.

Можно признать перспективными в этой области и теорию клеточных автоматов, впервые предложенную более тридцати лет тому назад Дж. фон Нейманом и развитую С. Уолфрамом в фундаментальной монографии.
17 Mar 14:17 avatar

Контент-анализ — описание метода


Автор: О.Т. Манаев | Источник: «Пси-фактор»

Контент-анализ (от англ. contens содержание) — метод качественно-количественного анализа содержания документов с целью выявления или измерения различных фактов и тенденций, отраженных в этих документах. Особенность контент-анализа состоит в том, что он изучает документы в их социальном контексте. Может использоваться как основной метод исследования (например, контент-анализ текста при исследовании политической направленности газеты), параллельный, т.е. в сочетании с другими методами (напр., в исследовании эффективности функционирования средств массовой информации), вспомогательный или контрольный (напр., при классификации ответов на открытые вопросы анкет).
17 Mar 14:01 avatar

Сетевая разведка


Автор: Павел П. ака ukr-xblp. UST. ust.team@gmail.com

«Data mining — это процесс обнаружения в сырых данных ранее неизвестных
нетривиальных практически полезных и доступных интерпретации знаний,
необходимых для принятия решений в различных сферах человеческой
деятельности.»

G. Piatetsky-Shapiro, GTE Labs

Едва начав читать данную статью, а именно прочитав только ее название, вы столкнулись уже как минимум с тремя терминами, определение которых необходимо для соответствующего понимания и применения способ и методов, изложенных ниже в вашей повседневной практике при возникновении подобных задач.

Определения терминов: «легальный метод», «промышленный шпионаж», «сетевая разведка».

Незнаю как вы, но многие материалы, в том числе и издание периодических СМИ, я привык читать с конца, с последней полосы. В данном случае и определения терминов я дам в противоположном порядке.
17 Mar 14:00 avatar

Анализ информации как средство достижения стратегических целей банка


Автор: Филипп Майзенберг (заместитель директора сектора финансовых услуг компании «Аксенчер») | Источник: Банковские технологии 01 (2005 г.)

В условиях динамично изменяющегося российского банковского рынка и обостряющейся борьбы за клиентов для банков становятся особенно важными определение четкой стратегии своего развития и достижение заданных целей.

Опыт успешных банков свидетельствует, что зрелые организации определяют для себя стратегию в виде четко сформулированных целей и основных путей их достижения, которые затем преобразуются в набор измеряемых показателей и их целевых значений, соответствующих поставленным задачам. Постоянный мониторинг изменений значений показателей и сравнение с целевыми значениями, определенными в соответствии со стратегией развития, позволяют руководителям на ранних этапах увидеть возможные проблемы и своевременно осознать необходимость принятия управленческих решений, а позже оценить эффект от принятых решений.
7 Mar 09:21 avatar

Всевидящее око Palantir

В середине февраля калифорнийской компании Palantir Technologies пришлось приносить извинения. Один из ее сотрудников предлагал устроить саботаж сайта Wikileaks — по поручению Bank of America, который, по слухам, пострадал от размещенной на сайте информации. Президент Palantir Алекс Карп принес публичные извинения в связи со скандалом. «Даже если бы мы захотели, на то, чтобы освоить такие методы борьбы, ушел бы не один год. Это далеко за пределами нашей сферы деятельности», — говорит Карп.

Palantir создает крайне сложные инструменты для анализа и визуализации данных, которые помогают правительственным агентствам, банкам и другим организациям поддерживать информационную безопасность, вести борьбу с терроризмом и выявлять случаи мошенничества. Но от 20-с-чем-то-летних гениев, которые там работают, можно ожидать чего угодно, как показала история с Wikileaks.

Со временем шум утихнет, и Palantir сможет продолжить свою миссию по спасению мира от злодеев. Это не шутка: некоторые программисты компании ходят в футболках «Спасите Шир». (Слово «Палантир» заимствовано у Толкина: так назывались всевидящие камни из «Братства кольца».)
17 Feb 13:14 avatar

Контент-анализ экономической информации

ВВЕДЕНИЕ
Через один год обозреватели и журналисты будут гадать, каким символом обозначить уходящий век. Уже предложено несколько названий: атомный век, электрический, космический, информационный. Думаю, на этот вопрос не может быть однозначного ответа, так как столетие — это не один миг, оставляющий только одно впечатление всознании человеке. Это — путь эволюции всего человечества: от удовлетворения своих потребностейв пище и крове над головой, облегчения быта и труда до удовлетворения интеллектуальных потребностей каждого человека в знаниях, самовыражении, образовании. До недавнего времени возможности такого образования были ограниченыналичием печатной литературы, близостью культурных и научных центров, скоростью чтения читателя. Но с появлением электронных средств коммуникации становится все больше способов получения информации. Достаточно иметь доступ в Internet, чтобы бесплатно получать оперативную информацию о происшествиях в мире, состояниях рынков, настроениях общественности. Также существует много платных информационных агентств: Сибирское Информационное Агентство (СИА), АК&М, Прайм-ТАСС, РосБизнесКонсалтинг; из иностранных это прежде всего REUTERS, TeleForm, DowJones Telerate, Bloomberg, CNN. Эти компании поставляют информацию в режиме «реального времени», то есть как только она становится известна репортерам агентства, вы получаете ее на ваш компьютер. Из-за большой сети бюро этих агентств поток информации в последнее время стал превышатьадаптационные возможности человека: один даже специально подготовленный сотрудник не может отследить весь поток информации на интересующую его тему, настолько он велик. В связи с этим стала насущной задача создания такого метода автоматической обработки данных, который позволил бы без ущерба для целостности информации выделять только главные компоненты сообщения, то есть формировать «доминанту» текста. Одной из практических разработок, способных выполнять такую работу с текстом, является метод контент-анализа. Создание компьютерных программ на основе контент-анализа позволит автоматически резюмировать поток новостей, отфильтровыватьосновные — главные- новости по определенному пользователем контексту, будь то информация о политике, экономике, рынке акций или валюты, новых разработках в компьютерной сфере или другое. Отсюда и берет начало название метода: как пользователь задаст значимость контекста искомых понятий, так он и будет получать результат.
17 Feb 13:10 avatar

Компьютерный контент-анализ текстов как метод экономической разведки

Автор: Шалак Владимир (кандидат философских наук, старший научный сотрудник Института философии РАН) | Источник: www.vaal.ru

Около года назад мы опубликовалди сообщение об исследовании, посвященном банкротству компании ENRON. Сегодня публикуется полный текст статьи.

В конце 2001 года компания ENRON объявила о своем банкротстве. Оно тут же было названо крупнейшим за всю историю США. Нас не интересует вопрос, почему обанкротилась компания. Нас интересует лишь вопрос, за сколько времени до фактического банкротства можно было предсказать, что дела компании идут неудовлетворительно?

В ответах на подобные вопросы весьма заинтересовано правительство при заключении договоров с различными отечественными и зарубежными компаниями, заинтересованы сами компании при заключении договоров между собой, заинтересованы различные инвестиционные фонды при выборе, куда вложить деньги, заинтересованы обычные акционеры и биржевые спекулянты, и пр. Но вот получить такие ответы весьма непросто. ENRON не только искажала свою отчетность, но и вступила в сговор с крупнейшей аудиторской компанией Arthur Andersen.
11 Feb 13:17 avatar

Поиск фактов в тексте естественного языка на основе сетевых описаний

Мероприятие: Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции Диалог’2004. – Москва, Наука, 2004 | Автор: Киселев С.Л., Ермаков А.Е., Плешко В.В.

Аннотация

Доклад посвящен технологии автоматического анализа текста русского языка и поиска в нем описания фактов заданного типа, в том числе извлечения требуемых фигурантов факта и сопутствующих обстоятельств. Описывается представление текста в форме сети синтактико-семантических отношений, которая инвариантна к форме описания фактов с точностью до выбранной автором структуры пропозиции. Для поиска фактов используются шаблоны в форме сетей с заданными ограничениями на атрибуты узлов и связей, которые позволяют находить, преобразовывать и интерпретировать требуемые семантические структуры в сети текста.
10 Feb 17:40 avatar

Контент - мониторинг текстовой информации

Мероприятие: Научно-практическая конференция «Проблемы обработки больших массивов неструктурированных текстовых документов» | Автор: Шалак В.И. | Источник: fep.ru

Маленькое предисловие
Более восьми лет мы занимаемся специальными исследованиями в области компьютерной психолингвистики. Они получили неофициальное название «Проект ВААЛ» и касаются вопросов:
  • компьютерного контент-анализа текстов;
  • ценки некоторых психиатрических, мотивационных и психоаналитических характеристик текстов;
  • оценка коммуникативной эффективности (суггестивности) текстов;
  • оценка их эмоциональной наполненности.
Этот краткий перечень является далеко не полным, так как работа продолжается. Ее практическими результатами являются:
  • компьютерные программы для анализа текстов;
  • специальные исследования по просьбам заказчиков;
  • инициативные исследования.

10 Feb 17:21 avatar

Проведение стратегического анализа в банке с использованием технологии «data mining»

Мероприятие: Семинар «Проблемы организации финансово-аналитической службы в коммерческом банке» | Автор: Сафонов М.С. (Начальник Управление развития и стратегического планирования Внешэкономбанк), Пастухов Е.С. (Начальник отдела анализа внешней среды Внешэкономбанк) | Источник: bankclub.ru

Введение
Настоящий доклад преследует три цели. Во-первых, рассказать в общих чертах о методике анализа внешней среды, как составной части методического обеспечения стратегического управления во Внешэкономбанке. Во-вторых, вынести на обсуждение тезис о том, что многое из того (имеется ввиду аналитический инструментарий), что разработано в рамках дисциплины Стратегический анализ, при его конкретной реализации сводится к единой схеме последовательного применения стандартных аналитических процедур, широко применяемых в теориях распознавания образов и принятия решений. В-третьих, продемонстрировать, как технология обработки данных «data mining» позволяет обеспечить новый, более глубокий уровень проработки классических вопросов стратегического анализа.
9 Feb 15:57 avatar

Проблемы автоматизации деятельности аналитика

Мероприятие: Из выступления на круглом столе «Российская аналитика: от практики к методологии» от 14.10.2003г. | Автор: Печенкин И.А. | Источник: ООО «Информбюро»

В преддверии своего выступления я хотел бы поблагодарить хозяев уважаемого заведения и всех присутствующих здесь представителей цеха аналитиков и коллег из отрасли информационных технологий за предоставленную возможность воочию ознакомиться и глубже понять проблематику современного состояния дел с информационно-аналитической деятельностью в России. Яркие выступления предыдущих докладчиков позволили мне лучше уяснить насколько серьезными являются проблемы современного аналитического сообщества и какие трудности встают перед информационным аналитиком при выполнении им своих профессиональных обязанностей.
9 Feb 15:53 avatar

Средства анализа источников информации как элемент управления знаниями на предприятии

Мероприятие: Из выступления на круглом столе по технологиям управления знаниями «Управление Знаниями и Информационные Технологии: порознь или вместе?» от 19 ноября 2003 в рамках выставки БИНФО 2003. | Автор: Печенкин И.А. | Источник: ООО «Информбюро»

В условиях глобализации экономик, совершенствования среды распространения информации, всё большее значение в бизнес процессах предприятий начинает приобретать технология управления знаниями (Knowledge management — KM). Существующие классические маркетинговые стратегии уже не приносят, как прежде, долгосрочных конкурентных преимуществ. Высокие скорости распространения информации, ротации кадров на рынках труда, приводят к тому, что компания, ещё вчера выделяющаяся среди других своим отличительным конкурентным преимуществом, уже сегодня становится равной среди равных. А завтра, упавшая норма прибыли на занятом сегменте рынка, заставляет её искать новые точки приложения бизнес усилий.
24 Jan 09:10 avatar

Бизнес «под лупой» интеллектуальной поисково-аналитической системы


Автор: В. Баранич | Источник: ИП «ТОП СОФТ», Корпорация «Галактика», «Белорусский рынок» № 44, 06.11.2004
Любое предприятие, проработавшее на рынке хотя бы год, обладает уникальным информационным портфелем, в котором есть все, чтобы выбрать оптимальный вариант развития, путь к успеху.

Включите свой рабочий компьютер и просмотрите архивы.

Во-первых, там наверняка содержится огромная база электронной почты. Переписка же с реальными и потенциальными клиентами отражает тенденции в конкретных нишах товаров и услуг, а также стандарты поведения покупателей не менее точно и объективно, чем дорогостоящие маркетинговые и социологические исследования. Нужен только инструмент ее анализа.
23 Jan 14:10 avatar

К гадалке не ходи: Бизнесмены пытаются узнать будущее с помощью компьютерной программы


Автор: Ринат Сагдиев | Источник: Ведомости 08.06.2006, №103 (1630)
Крупнейшие российские корпорации доверяют аналитическую работу электронному предсказателю — системе “Тренд”, созданной бывшими военными математиками. С помощью искусственного интеллекта они пытаются прогнозировать действия конкурентов, чиновников, результаты выборов или понять, что ждет фондовый рынок.

Информационно-аналитическая система “Тренд” разработана в 1998 г. бывшими военными математиками Иваном Наймушиным, Евгением Вербиным и Сергеем Кузьменко, основавшими позже компанию “Вербин и партнеры”. Она позволяет прогнозировать любые события на период до двух месяцев с вероятностью более 63%. Прогнозы строятся на сравнении текущей информации о компании, конкретном человеке или ситуации на каком-либо рынке с эталонными информационными образами, сформированными базой данных на основе 1500 открытых источников, главным образом СМИ. Среди десятков клиентов “Вербина и партнеров” – “Газпром”, РАО ЕЭС, Магнитогорский металлургический комбинат (ММК), компании “Русские машины” и “Северстальинвест”. Годовой базовый пакет “Тренда” стоит 700 000 руб. Оборот “Вербина и партнеров” не раскрывается.