Русские совершили революцию в интернет-поиске
Выходцы из России представили новую технологию поиска в интернете. Предполагается, что она позволить проиндексировать на миллиарды больше страниц, чем возможно сейчас.
Руководство недавно созданной компании Glenbrook Networks считает, что компании удалось разработать способ "глубокого поиска", позволяющего находить ранее недоступную информацию.
Речь идет о том, что общепринятые представления об объемах информации, находящейся в интернете, весьма далеки от реального положения вещей. В Сети сейчас выложены сотни миллиардов документов, что гораздо больше, чем от 8 до 20 млрд., проиндексированных Google и Yahoo. Однако большинство этих веб-страниц недоступно для большинства поисковых систем, так как они хранятся в базах данных, индексация которых невозможна.
Компания Glenbrook, основанная эмигрантами из России (отцом и дочерью), продемонстрировала новую поисковую технологию на примере извлечения информации о вакансиях из баз данных различных сайтов. По словам руководителей компании, большинство существующих поисковых машин на такое не способны. Кроме того, для новой технологии существует масса иных применений.
"Те, кто размещает информацию в базах данных, как правило хотят, чтобы ее могли найти другие люди", - говорит вице-президент Glenbrook Networks по продукции Юлия Комиссарчик. - Однако способ представления этой информации не позволяет ей быть обнаруженной при помощи поисковой машины. Для этого требуется участие человека".
Это особенно верно, когда речь идет о веб-страницах, хранящихся в базах данных. Обычные страницы являются статическими файлами, постоянно размещенными на своем сервере. Однако бессчетное множество страниц в действительности не существует до тех пор, пока человек не заполнит форму информационного запроса на веб-сайте. В качестве таких примеров можно назвать онлайн словари, сайты бюро путешествий, библиотечные каталоги и медицинские базы данных.
По утверждениям Юлии и ее отца Эдуарда Комиссарчика, ими разработан метод анализа веб-форм, позволяющий определить, информацией какого типа следует заполнять эти формы. С помощью этого метода «роботы» Glenbrook могут проходить все стадии заполнения достаточно сложных форм, отвечая на такие вопросы, как местонахождение желаемого места работы.
Для демонстрации новой технологии глубокого поиска в интернете компанией был создан сайт поиска вакансий Glendor.com. Он отбирает вакансии из сотен, размещаемых на сайтах компании Bay Area и крупном сайте HotJobs.com. Особенно эффектно демонстрация выглядит благодаря нанесению вакансий на карту Google Maps.
Glenbrook - далеко не единственная компания, ведущая исследования в области глубокого поиска в Сети. Так, компания Yahoo также предпринимает усилия по индексированию глубин инетрнета. Yahoo имеет партнерские отношения с Национальной общественной радиовещательной сетью, Библиотекой Конгресса, Нью-Йоркской публичной библиотекой и другими организациями, в рамках которых ведутся работы по индексированию содержимого их баз данных. Кроме того, компания Google к своей поисковой машине добавила поиск в обширной библиографической базе данных, которая раньше была доступна лишь в библиотеках.
|