Всемирно известный поисковик обновил систему индексирования страниц всемирной паутины. Caffeine работает по иному принципу, нежели его предшественник. "Как назовешь корабль, так он и поплывет" – эту пословицу хорошо знают разработчики ПО Google. Названный в честь известного алкалоида, Caffeine ускорил поиск и сделал его на 50% актуальнее.
Компания Google
представила Caffeine – систему
индексирования сайтов. По словам разработчика ПО Google Кэрри Граймса, новинка
"обеспечивает результаты поиска на 50% свежее предыдущего индекса" и обладает
"самой большой коллекцией веб-контента в истории компании".
Теперь поисковик будет индексировать с одинаково
высокой скоростью любой вид контента – комментарии, блоги или новости. Эта
скорость, отмечает Грэймз, стала выше и отвечает растущим потребностям
пользователей по всему миру.
Старая система индексации обрабатывала информацию слоями –
каждый из них обновлялся раз в 2-3 недели. Caffeine же индексирует
веб-страницы небольшими порциями, что позволяет обновлять большее количество
данных.
"Для того, чтобы обновить старый индекс, мы анализировали
всю сеть, что создавало значительную задержку между временем, когда мы находили
страницу и тем, когда она была доступна пользователю.
Читайте также:
Новостной поисковик Google теперь можно настраивать
С помощью Caffeine мы анализируем интернет небольшими
порциями и обновляем наш поисковый индекс непрерывно по всему миру. Новые
страницы или новая информация на существующей странице добавляются в индекс, как
только мы их находим".
Отметим, что Caffeine будет обладать наибольшим
объемомконтента среди всех прочих систем индексирования, ранее использовавшихся
Google.
Объем базы данных "кофеина" свыше 100 млн гигабайт (100
петабайт). Каждый день в индекс добавляется несколько сотен тысяч гигабайт новой
информации.
Факт. Первой поисковой системой была Wandex. Индекс
создавался ботом World Wide Web Wanderer, разработанным в Массачусетском
университете (1993 г.)