вернуться к списку статей на главную
 
 

By Andy Beal - February 04, 2004

В моей недавней статье "Будущие Технологии Поисковых Машин" "The Future of Search Engine Technology" , я рассмотрел множество достижений, которые могли бы произойти в будущем, улучшая технологию поиска. Я искренне верю, что мы являемся свидетелем начальной стадии развития технологии поисковиков, но я хотел услышать то, что говорят другие. Сегодня, мы начинаем ряд интервью с видными экспертами, просвещенными лицами и ведем переговоры с разработчиками поисковых машин, чтобы услышать их мысли и прогнозы на будущее.

Если вы были в курсе событий недавних событий и работаете в области, связанной с Интернетом, вы должны были услышать о Robert Scoble. Работая в Microsoft, он обслуживает ежедневный блог (daily blog) в свое свободное, если можно так выразиться время. Robert работает над публикациями по поводу новой операционной системы "Longhorn" Microsoft), где он излагает свое мнение о том, что происходит в Microsoft, при этом, так же, не забывая критически взглянуть на конкурентов. Scoble делает большую работу, сохраняя и разделяя собственное и официальное мнение.

Мне случайно повезло поймать его во время творческого отпуска и расспросить о будущем технологии поисковиков. Scoble настоятельно просил меня отметить, что нижеизложенное отражает лишь его личное мнение, а не Microsoft.

Роберт, расскажи мне о наиболее волнующих тебя изменениях технологии поисковиков?
[ RS ] Это зависит от того, говорите ли вы о поиске в Интернете или поиске на вашем жестком диске. Если мы ведем речь о локальном жестком диске, то поиск файлов на нем все еще ужасен и становится еще хуже.
Почему ты так считаешь?
[ RB ] Поскольку жесткие диски становятся все больше (60 GB drive у Fry's Electronics стоит сейчас $60 – мы полагаем, что через три года он уже будет $20, и вы вскоре увидите 500 GB drives за менее, чем $100). Сейчас легче создавать файлы, чем их находить.

Сегодняшние инструменты поиска как, например X1, наиболее интересны, поскольку они индексируют информацию на вашем диске и совершают довольно легко поиск email -адресов и файлов. Microsoft Research еще работает над инструментом, называемым " Stuff I've Seen " (все, что я видел). Это также весьма интересно (позволяет искать как email-адреса, так и файлы на диске). Но всего этого недостаточно. Прежде всего, они привязаны с ядром операционной системы. Так что, пока они индексируют, ваша операционная система тормозит. Их не могут подогнать для правильной работы с операционной системой и другими приложениями, которые требуют затрат времени процессора.

Плюс к этому, чтобы действительно хорошо осуществлять поисковую работу, поисковые машины требуют метаданных, а метаданные, добавленные системой, содержат следы вашей работы с файлами. Также сами системные приложения могут добавлять метаданные в саму систему. Многими способами блоги добавляют метаданные к web-сайтам. Когда блог, к примеру mine, ссылается на сайт, мы обычно добавляем чуть больше деталей об этом сайте. Допустим, мы говорим, что это «классный сайт» ("cool site"). Так вот, Google заносит эти слова в свою машину. Это метаданные. (Технически метаданные – «данные о данных»). Теперь, если вы ищете "cool site", наиболее вероятно, вы найдете сайт, на который я только что ссылался. Таким образом, вы можете увидеть, как машине Google помогают метаданные. Но мы не в состоянии применить эти уроки к тысячам файлов на вашем жестком диске. В будущем планируется это изменить .

Вы можете объяснить проблемы, возникающие при поиске на жестких дисках. Что Microsoft разрабатывает для их решения?
[ RB ] А что, если мы проделаем на вашем жестком диске то же самое, что в свою очередь делает Google? Возьмите фотографии. Когда я переписываю фотографии с моего Nikon, то они включают в себя некоторые метаданные (например, внутри файла есть дата снимка вместе с информацией о фотографии), но для большинства поисков, осуществляемых человеком, метаданные не несут пользы.

Как насчет того, если бы я захотел искать «мои свадебные фотографии» ("my wedding photos")? Ни X1, ни Windows XP's, созданные для поиска, не найдут ваших свадебных фото. Почему? - Потому что у них бесполезные названия, вроде DSC 0001. jpg и нет метаданных, говорящих о том, что именно это свадебные фотографии.

Давайте посмотрим вперед на несколько лет, к следующей версии Windows, имеющей кодовое название Longhorn . В Longhorn мы создали новую систему хранения файлов, с кодовым именем WinFS . При WinFS поиск и метаданные будут частью операционной системы. Например, только вы начинаете печатать в адресной строке " W "," E "," D " и " D ", как все, начинающееся с WEDD, будет представлено. Как, к примеру, ваши свадебные документы, всевозможные записи и фото (wedding documents, spreadsheets, and photos).

Но WinFS идет дальше, чем X1 и другие инструменты файлового поиска. Он позволяет вам (и используемым вами приложениям) добавлять метаданные в ваши файлы. Так, если вы даже не меняете названия файлов, вы просто можете кликнуть на одно из лиц в изображении и получить возможность ввести имя и описание. Например, кликнув по лицу вашего кузена Joe , впечатать "Joe Smith" и "Wedding".

Теперь, если вы когда-либо будете искать тему венчания, появится это фото. И это еще не все. Если вы импортируете группу фотографий в свадебный альбом, вы будете добавлять метаданные для использования поисковиком. Другими словами, вас ждет гораздо лучшая система поиска на вашем жестком диске.

Похоже, что Microsof предоставляет вещи для поиска в режиме offline, но могут ли они состязаться с поисковыми машинами сети Интернет?
[ RS ] В настоящее время, если говорить об Интерне, то Google тут также проделал колоссальную работу. Я пользуюсь Google десятки раз в день. Будет ли MSN выдавать более релевантные результаты, чем Google? Я не знаю. Конечно, на сегодняшний день это не так. Изменится ли это завтра? Поживем, увидим, что предпримут мозги, работающие на MSN .

Одно я вижу, что в Longhorn поиск для потребителей станет лучше. Google работает, чтобы сделать свой tool-bar возможно наилучшим. Мы тоже работаем над массой вещей. Меня очень волнует будущее поиска, неважно в каком направлении пойдут дела.

Давайте заглянем на несколько лет вперед. Какие новые технологии и продвижения поиска вы видите в ближайшие 3-5 лет?
[ RS ] Для Интернет-поиска я вижу, что инструменты анализа социального поведения, напр.Technorati, становятся гораздо более важными. Почему? - Потому что люди хотят любыми способами видеть потенциально релевантные результаты. Google далеко продвинул нас к такому будущему, поскольку на его результаты влияет количество обратных ссылок, имеющихся на сайт. Но теперь, давайте пойдем дальше, еще дальше, чем Technorati . Давайте определимся, кто поддерживает актуальность рынка в определенной области и придает ему/ей больше значения?

Я также вижу, что поисковые машины, которые ищут лишь специфическую информацию (например как Feedster) собираются занять более важное место. (Feedster ищет только RSS и Atom syndication feeds).

Но пользователи собираются требовать новых путей экспортирования поиска. Google показал это с News Alerts . Введите поисковый термин, как напр. " Microsoft " и в любое время получайте блок новостей по почте, упоминающих Microsoft. Feedster идет еще дальше. Там вы можете создать RSS подключение по поисковому термину. У меня таких несколько, направленных в мой RSS News Aggregator и, вы знаете, они неоценимы в наблюдении за тем, что говорят web-логи о вашем продукте, компании или рынке. Например, источник для одного из моих созданных терминов - " WinFS ", - я понаблюдаю, сколько людей сошлются на эту статью. И если кто-либо из вас хочет сказать что-то интересное, я даже поставлю на его статью обратную ссылку.

Предположим, что нет технологических ограничений. Какие новые свойства вы бы желали увидеть у поисковых машин?
[ RS ] Я хочу видеть значительно более совершенные инструменты для поиска фото. А также создание связи между всеми типами файлов и фото. Например, почему я не могу просто перетащить имя из моего списка контактов для ассоциации имени с лицом на фото? Не сможет ли это помочь в дальнейшем поиске? За каких-то 18 месяцев я сделал 7400 фото. Но сейчас для меня непросто найти какую либо фотографию без переименования файлов.

Как вы считаете, какое влияние окажут социальные сообщества на будущие технологии поисковых машин?
[ RS ] Мы уже наблюдаем воздействие на Feedster и Technorati. Трудно сказать, что произойдет в будущем. Что произойдет, если каждый в мире будет иметь логи и членство в Google's? Изменит ли это методы поиска? Ну, с одной стороны, наиболее вероятно, что это заставит объединиться людей в службах, связывающих воедино социальные пространства и web-логи. Например, я не могу вспомнить адрес почтового ящика моего брата, но Google найдет мне его.

С другой стороны, я буду наблюдать, как Longhorn's WinFS используется разработчиками приложений для построения новых видов социальных систем. Сегодня, если, к примеру, взглянуть на контакты, то они заперты в Outlook , либо в каком-то другом персональном информационном программном обеспечении, как ECCO . Но контакты в Outlook не могут быть использованы другими приложениями (к тому же сейчас из-за создателей вирусов Microsoft исключил эти функции).

WinFS это меняет. Как?
[ RS ] Вставляя файл “контактного” типа в саму OS, тем самым, заставляя приложения работать с их собственной методологией контактов.

Что если ВСЕ приложения, не только Outlook, могли бы использовать этот новый тип файлов? Что, если бы мы могли ассоциировать данный тип файлов с социальным программным сервисом, как Friendster, Tribe, Yahoo's personals, или Google's Orkut? Изменит ли это радикально способы поддержания ваших контактов? Сделает ли это контакты более ценными? Я полагаю, что да.

Мы уже видим такие системы, как Plaxo поддерживающие контакты, но Plaxo все же не осознает, что я ввел свои данные в Google's Orkut и Friendster . Почему я не смог бы сделать систему, которая будет сопоставлять данные во всех моих социальных приложениях, включая Outlook?

Вы не предвидите каких либо проблем со стороны WinFS?
[ RS ] Тут разработчики не доверяют намерениям Microsoft . Они также не хотят раскрывать своих собственных приложений своим конкурентам. Если вы, например, были бы разработчиком AOL , разве вы видите, как ваша система контактов открывается, скажем, с Yahoo или Google либо Microsoft? Это пугающие обстоятельства для всех нас .

Но если вся отрасль работает на общих WinFS схемах (не только для контактов, но и при других типах данных тоже), мы окажемся с некоторыми новыми, действительно великолепными способностями. Это действительно заставит разработчиков волноваться о возможностях WinFS и заставит их позабыть все сомнения и страхи, касающиеся открытия их разновидностей данных.

Предвидите ли вы наступление времени, когда результаты коммерческого поиска (продукт/услуги) будут отграничены от результатов информационного поиска (белая пресса/образовательные сайты)? И думаете ли вы, что в конце концов все коммерческие базы данных будут только платными?
[ RS ] На сегодняшний день я не вижу системы, отличающейся результатами от стиля Google. Только платные поиски не принесут наиболее релевантных результатов.

Что заставляет вас так думать?
[ RS ] Это потому, что я чаще нахожу наилучшую информацию на блогах. Владельцы блогов никогда не смогут платить за включение в поисковые базы.

Исключительно коммерческий листинг может быть приведен по сотовым телефонам, например, или PDA. Если я бы организовывал сотовый сервис, например для ресторанов в Сиэтле, я скорее всего хотел бы быть упомянут на простых сайтах для пользователей. Но, думая об этом, я не предвижу, что подобная система станет достаточно популярной, не упомянув каким-то образом каждый ресторан.

О сотовых телефонах. Что вы скажете о технологии поисковых машин, и как она повлияет на использование PDA и сотовых телефонов?
[ RS ] Не уверен, что технология поисковиков повлияет на это, но смесь речевого распознавания с поисковыми машинами может сильно ее изменить. Когда я использую свой сотовый телефон, то не хочу просматривать сайты, в которых есть много текста (я их сохраняю на потом, чтобы прочитать дома за своим компьютером). Наоборот, я хочу отыскать ближайшие кинотеатры, системы Starbucks или же найти славное местечко, где можно съесть неплохой бифштекс.

Сейчас сотовые телефоны сообщают e 911 данные (это значит, что сотовая связь приблизительно знает место вашего нахождения и поэтому может посоветовать вам только один или два Starbucks , чем все, находящиеся в Сиетле).

Если бы пользователи поисковиков немного бы сдали позиции своей анонимности и позволили проследить за своими поисковыми привычками, сможет ли это позволить поисковым машинам предоставлять более хорошие, выборочные результаты?
[ RS ] Да. Я уже предоставляю Google возможности следить за моими поисковыми фразами (я использую для этого Google Toolbar). Люди действительно не терпят, если вы не соблюдаете норм приватности, и их легко понять. Они не терпят, если вы не предоставляете им право выбора не сообщать о чем-то.

Роберт, вы определенно открыли нам глаза на будущее технологии поисковиков. Есть ли еще что-либо, что вы хотели бы добавить?
[ RS ] Как отражение, сказанного выше, я надеюсь, что эта область с достоинством оценит возможности, открывающиеся с Longhorn's WinFS. Мы либо можем сотрудничать, и обмениваться информацией друг с другом, либо бояться и придерживать данные для себя. Будет интересно все это пронаблюдать в ближайшие три года.

Разрешите всемерно поблагодарить Robert Scoble, служащего Microsoft и экстраординарного блога. Пожалуйста, посетите SearchEngineLowdown.com по мере того, как мы станем продолжать оглашать взгляды и мысли на будущее поисковой технологии.