Поиск в блогах

Раньше, рассказывая о блогах и о самой популярной в русскоязычном Интернете службе «онлайновых дневников» LiveJournal, мы уже говорили о том, что «Живой Журнал» — далеко не единственный сервис подобного рода. Хотя на просторах Рунета проектов, равных «ЖЖ» по размаху, действительно нет, в глобально-сетевом масштабе его с большим запасом опережает служба Blogger, которую в свое время весьма предусмотрительно приобрела Google. Впрочем, в своем интересе к блогам лидер среди поисковых служб отнюдь не уникален — это перспективное направление уже привлекло внимание таких гигантов e-commerce, как Yahoo, AOL и Microsoft.

Успешно действуют на рынке услуг для сетевых дневников и фирмы, предлагающие лишь софтовую обвязку блогов (без хостинга) — такие, как WordPress и E2; к слову, владеющей LiveJournal компании SixApart принадлежат сразу два популярных блоггерских движка, Typepad и MovableType. Интерес к сетевым дневникам растет и со стороны обычных пользователей — по расчетам сервиса Technorati, каждую секунду в Сети появляется новый блог!

Однако у столь активного роста сообщества блогов (так называемой «блогосферы») есть и свои явные недостатки. Чем быстрее растет объем накопленной в сетевых дневниках информации, тем сложнее ориентироваться в них традиционным поисковым системам — тем же Google и Yahoo. За оперативными обновлениями блогов неторопливым «поисковым роботам» просто не угнаться… А без эффективного поиска блоги начинают постепенно замыкаться друг на друге, сталкиваясь с теми же «проблемами роста», что и WWW в первые свои годы.

К счастью, в отличие от Всемирной паутины, в архитектуре большинства онлайновых дневников изначально был заложен замечательный механизм «RSS-потоков» (или «фидов») — обновляемых в реал-таймовом режиме лент, аккумулирующих в себе заголовки отдельных сообщений сайтов. Именно на этот механизм ориентируются специализированные «ищейки»: с их помощью можно осуществлять поиск и в блогах, и в обычных новостных веб-медиа, поддерживающих RSS. В нашем сегодняшнем обзоре пойдет речь о самых известных представителях этого класса поисковых систем.


Bloglines

http://www.bloglines.com/

Эта служба, принадлежащая универсальному поисковику Ask Jeeves, является одновременно и инструментом поиска по RSS-фидам, и собственно RSS-агрегатором. В выпадающем меню рядом с формой поиска можно «на лету» выбрать один из четырех вариантов действий: искать во всех проиндексированных службой блогах; только в тех блогах, на которые вы подписаны; в вебе вообще (с помощью Ask Jeeves) или просто добавить RSS-фид в список подписки.

В режиме расширенного поиска Bloglines можно задавать операторы «И», «ИЛИ» и «БЕЗ» (в формах), а также включать фильтры для сортировки результатов — по популярности или дате. Здесь же можно выставлять режим поиска, в котором слова ищутся во всех RSS-фидах, кроме тех, на которые вы подписаны.


Daypop

http://www.daypop.com/

Daypop — один из самых пионеров специализированного поиска по RSS и блогам, в 2001 и 2002 годах удостаивавшийся почетных наград журнала Search Engine Watch. Интересно, что разработка и поддержка этого ресурса ведется всего одним (!) человеком. Сервис позволяет с ходу выбирать поле поиска (новости, веблоги, заголовки RSS-фидов и т. д.), в развернутом режиме можно определять не только временные рамки, но также языковую и государственную принадлежность искомых записей (что есть только у Daypop). Изюминка сайта — архив, в котором хранятся ссылки на самые популярные новости, посты и блоги каждого дня последних четырех лет.


Feedster

http://www.feedster.com/

В числе основных особенностей этого ресурса — возможность сохранения результатов поиска в качестве отдельного RSS-фида или электронного письма. В расширенном режиме можно составлять целые архивы записей из отдельно взятых блогов — одного или нескольких; для этого достаточно ввести их URL или названия в специальную форму. Есть здесь и поиск «перекрестных ссылок» — потоков и блогов, ссылающихся на определенные сайты. Подразделение Feedster — jobs.feedster.com — предназначено для ведения поиска работы, по специализированным «вакансионным» RSS-фидам и блогам.

http://blogs.gigablast.com/

РЕКЛАМНЫЙ БЛОК

[ Хотите знать больше о частной разведке? Регистрируйтесь и общайтесь на интернет-форуме it2b-forum.ru ]

Строго говоря, Gigablast не специализируется на блогах: это — лишь одна из возможных областей его поиска, более того, находящаяся в стадии бета-версии. Вместе с тем, даже сейчас качество этой услуги находится на очень высоком уровне и ничуть не уступает конкурентам. Приятная мелочь — раскладка результатов по темам в процентном соотношении. Кроме того, из полученных в поиске ссылок можно формировать отдельный RSS-поток — с более широкими возможностями настройки, чем у того же Feedster.


PubSub

http://www.pubsub.com/

Из всех поисковых служб, рассматривающихся в этой статье, PubSub — самая необычная, по двум причинам. Отличие первое: поиск здесь не ведется напрямую. Вместо этого на основе терминов, описанных в форме поиска, создаются специальные «темы»; по мере появления новых записей на заданную тему в блогах и новостях служба автоматически извещает пользователя по электронной почте, SMS, ICQ или с помощью специального sidebar? а (доступен и для IE, и для Firefox). Отличие второе, логично следующее из первого: PubSub — сервис, работающий в режиме реального времени. Сообщения о новых записях появляются буквально через несколько секунд после публикации тех на исходных блогах.


Technorati

http://www.technorati.com/

У каждого из перечисленных выше поисковиков есть свои преимущества и недостатки, однако Technorati, похоже, удалось подобрать оптимальный баланс «плюсов» и «минусов». Простой, но в то же время очень удобный интерфейс (обратите внимание на то, как переключаются опции!), возможность поиска по ключевым словам, URL? ам или тэгам, функция watchlist… и к тому же — регулярно обновляющиеся списки самых популярных новостей, фильмов и блогов. Для русскоязычных «блого-исследователей» данная служба ценна еще одним своим свойством — нормальной поддержкой кириллицы.

Кстати, раз уж мы заговорили о русском языке, не лишним будет рассказать и об основной собственно рунетовской службе поиска по блогам — Яндекс. Блог (http://blog.yandex.ru/). Здесь, к сожалению, все не так хорошо, как могло бы быть: хотя с функциональной точки зрения этот сервис смотрится неплохо (можно делать из результатов поиска RSS-фид, использовать в строке поиска массу полезных операторов), слишком уж много постов он пропускает мимо своих фильтров.

Зато «Яндекс» предложил более интересный сервис — Яндекс. Лента (http://lenta.yandex.ru/). Сюда можно добавлять любые RSS-потоки, в том числе и ЖЖ-юзеров, коммьюнити и просто интересных сайтов. К тому же к ленте можно привесить полезные «фичи» — вроде курса валют, прогноза погоды, телепрограммы и афиши. Есть там и аналог «мемориз» — каталога избранных записей. И все же полноценную RSS-искалку эта служба заменить не может...

Справедливости ради заметим: по отношению к блогам «Яндекс» мало чем отличается от крупнейших глобальных поисковых систем. Тот же Google, к примеру, дает возможность искать по RSS — но для этого вам придется сперва создать специальную страницу, затем кликнуть по линку «Create a section», только после этого перед вами появится форма поиска для RSS-потоков. Правда, есть и другой вариант — использование недокументированных операторов filetypes:rss и filetype:xml; применяя их вместе с теми же inurl и site, можно добиться очень неплохих (хотя и не «реал-таймовых») результатов. И все-таки от компании, купившей крупнейший блоггинговый сервис почти два с половиной года назад, можно было ожидать и более серьезных шагов в данном направлении.

Поисковик Microsoft, MSN Search, и вовсе не поддерживает поиск по RSS: Microsoft пока лишь изучает тонкости этой технологии (очевидно, раздумывая над тем, как бы побольше на ней заработать самой и помешать заработать другим). Yahoo, напротив, зашла в освоении RSS дальше других: ее расширенный поиск позволяет ограничивать результаты файлами с расширениями XML, RDF и RSS, а сами потоки нормально показываются в результатах общего поиска.


***

Так или иначе, по мере того, как популярность блогов растет, будет расти и интерес к нормальным средствам поиска в них. Ведь на самом деле доля активных писателей «дневников» в общей интернет-аудитории относительно невелика. А вот читателей с каждым годом становится все больше и больше — особенно среди тех, кто сравнительно недавно нашел свой путь в Сеть. Им возможности поиска в блогах придутся очень кстати.

Автор: Игорь Довгий

Источник: «ВебМастак», 21.10.2005

Оцените статью
Технологии разведки для бизнеса