|
|
|
Что такое Гугл Дэнс?
Этот термин используется для описания обновлений индексной базы Гугла. В среднем, такое обновление индексной базы случается раз в месяц. Его можно заметить по изменениям в серпах и особенно, если посмотреть страницу, которая сохранилась в кэше Гугла. Однако апдейт не происходит резко. На самом деле это длится несколько дней, пока полностью не завершится обновление. За это время старые результаты пересчетов заменяются на новые. В обиходе говорят что Гугл танцует. Ну и придумали этому название «Гугл Дэнс» (на инглише правильно будет Google Dance).
Технические особенности Гугла
В целом Гугл (точнее вся его поисковая система) состоит из 10.000+ серверов, работающих на Линуксе. Гугл решит что это разумное решение с точки зрения ценовой политики и целесообразности. В качестве веб-сервера гуглоиды используют Apache-сервер. Вообще обновление индексной базы данных не производится на всех дата-центрах одновременно. Они одним за другим обновляют свои данные.
Многие думают, что в течении Гугл Дэнса гуглоиды в какой-то мере могут управлять потоком выдаваемой информации, то есть самостоятельно решать какой сервер будет отвечать на запросы – со старой или с новой индексной базой. Но с момента переиндексации это было бы нереально. И в переделах системы это не контролируется. По настоящему причина такой разной выдачи кроется в системе именования доменов – DNS.
DNS – партнер по танцам для Гугла
Помимо того индексная база Гугла, что разделена на более 10.000 серверов, также эти серверы размещены в восьми разных дата-центрах. Эти дата-центры в основном размещены в Пиндостане (т.е. США), но также и в Европе уже есть, по некоторым сведениям один есть в Цюрихе (Швейцария) – в любимом городе самого Владимира Ильича Ленина. Вообще в планах, среди которых уже часть осуществилась, по всему миру разместить свои дата-центры. А фигле – глобализация, будь она не ладной…
Соответсвенно, направляя данные ко всем своим дата-центрам, Гугл теоретически может делать запись всех запросов централизованно и затем рассылать их по всем своим ДЦ. Но реально на деле оказывается то, что каждый ДЦ имеет свой собственный айпи-адрес и способ доступа к этим айпишникам управляется системой именования имен, т.е. DNS’ом.
По существу, DNS работает так: в инете при передаче данных всегда имеют место промежуточные айпи-адреса. Информация о том, какому домену принадлежит тот или иной айпишник управляется DNS-серваком. Когда юзер вводит имя домена в адресной строке, локальный DNS-сервак по запросу выдает ему айпи-адрес, который принадлежит данному домену, чтобы дальше общаться с тем доменом, который отвечает за определенную зону айпишников. DNS-серваки могут кешировать айпи-адреса, поэтому иногда отпадает необходимость спрашивать вышестоящий сервер о разрешимости того или иного имени.
Каждый раз, когда идет контакт с DNS-сервером Гугла, сервер отсылает на запрос айпи-адрес только одного дата-центра. Поэтому, запросы Гугла всегда направляются к разным дата-центрам с различными записями DNS. С одной стороны записи DNS могут базироваться на данных с единого ДЦ. В этом случае Гугл легко производил загрузку, балансируя этим использованием DNS. С другой стороны, географическое нахождение кеширующего сервера может повлиять на частоту получения айпи-адресов отдельных дата-центров. Так расстояние для передачи данных может быть уменьшено.
В настоящий момент DNS и Гугл Дэнс связаны между собой. В течении Дэнса дата-центры не получают новые данные в одно и то же время. На самом деле, новые данные передаются от одного ДЦ к другому. Когда юзеры делают запросы в течении Дэнса, они могут получать данные от дата-центра, который имеет старый индекс и получить новый индекс всего лишь несколько минут спустя. С точки зрения юзеров, обновление индексной базы занимает всего несколько минут. А на самом деле процедура обновления индексной базы представляет собой совершенно обратное явление, поэтому СЕРПы скачут между старыми и новыми показателями.
Гугл Дэнс и домены www2 и www3
Начало «танцев» всегда можно заметить на тестовых доменах www2.google.com и www3.google.com. Они имеют устойчивые DNS записи, которые делают разрешение имени только для одного айпи-адреса. Перед началом танца один из доменов настроен на получение новых данных из уже обновленной индексной базы.
Построение новой индексной базы раз в месяц может стать причиной многих проблем. Роботы поисковика проходят миллиарды страниц и обрабатывают террабайты инфы. Поэтому тестирование новой индексной базы происходит беспрерывно. Конечно же Гугл не нуждается в тестировании своих доменов. Главным образом потому, что существуют всякие фичи, чтобы проверить новую индексную базу изнутри, и для этого не нужно много времени.
Поэтому необходимость иметь сервера www2 и www3 заключается в том, чтобы для вебмастеров существовала возможность прогнозирования их ранжирования после Дэнса. Многие вебмастера обсуждают на форумах обновления после Гугл Дэнса. Эти обсуждения могут быть предметом наблюдения для гуглоидов. Часто обычные юзеры еще не могут видеть изменений, так как записи DNS для www.google.com не указывают на айпи-адрес дата-центра, который был изменен в первую очередь, когда началось обновление. Как только группа тестеров, состоящая из участников форума, не находит каких-либо сильных отличий в новой выдаче, DNS записи изменяются таким образом, что новая индексная база становится доступной для www.google.com и начинается обновление основной базы. В это время начинается Дэнс. Однако, если обнаруживаются серьезные нарушения в течении этого обновления, то существует возможность отменить обновление основной базы. Домен www.google.com не будет получать информацию из наипнувшегося дата-центра, и юзеры не заметят этого. Поэтому индексная база не может быть восстановлена и сбор информации в сети снова не начинается.
Следовательно, результаты поиска, которые были видны на доменах www2.google.com и www3.google.com всегда будут отображаться на www.google.com чуть позже после обновления основной базы. Но иногда может наблюдаться незначительная тряска. С одной стороны, индексные базы разных дата-центров не могут быть абсолютно одинаковыми. Это можно легко проверить, посмотрев результаты поиска одного и того же запроса на разных дата-центрах. С другой стороны, в это время идет пересчет пэйджранка, великий G (будь он неладен и черт бы его побрал) запускает механизм пересчета пиара для сайтов, и можно также наблюдать эти изменения во время Дэнса.
Ну а те, кто все это не понял или считает это излишней болтологией и заморочками, могут просто воспользоваться этой тулзой для проверки танцев – Google Dance Tool
Млин, наверное надо было просто сразу спалить эту тулсу и не морочить людям голову. Вот и сказке конец, а кто слушал – маладец! |
|
|
|
|
|
я чаще видел это определение как "пляски google"
а оно точно раз в месяц а не раз в год? |
|
|
|
|
|
А есть у кого еще больше 10000 серверов?
ЗЫЫЫ:кстате сижу слушаю музыку, так этот кот под любую музыку смачно танцует))), ваще немогу насмотреться на него, такой шкодный |
|
Последний раз редактировалось: sydoow (Ср Янв 16, 2008 7:55 am), всего редактировалось 1 раз |
|
|
|
|
анимашки зачетные |
|
|
|
|
|
zone4570, кажется пляски - это на старославянском будет...
а в те времена гугл еще не родился. |
|
|
|
|
|
|
|