|
|
|
Сегодня мы с вами поговорим о том, где Гугл берет информацию о принадлежащих вам сайтах и какие это может иметь последствия.
За последние 10 лет Гугл затратил неимоверное количество усилий, пытаясь определить связи между сайтами, принадлежащими одному владельцу. Дело в том, что таким образом Гугл пытается предотвратить манипуляцию выдачей со стороны вебмастеров. Ведь Гугл пропагандирует естественные ссылки, поэтому перекрестные ссылки с ресурсов, принадлежащих одному и тому же человеку должны передавать меньший вес.
Плюсы.
В тоже время Гугл хочет вознаградить вебмастеров за перекрестные ссылки. Существуют ситуации, когда установление связей между сайтами может принести пользу. Хорошим примером здесь будут сайты наподобие eBay. У них есть американский сайт и теперь они хотят сделать версию для Эквадора. Если заниматься раскруткой сайта с нуля, то выход в топ займет очень много времени. Поэтому они ставят ссылки со старого сайта для распределения авторитета.
Этот же принцип работает и на маленьких сайтах (поддоменах). Вы вероятно видели множество блогов, которые расположены на поддоменах основных сайтов. Это удобно по многим причинам, в том числе и из-за того, что Гугл выше ранжирует такие блоги.
Тоже самое относится и к мультиязычным сайтам. Предположим, что у вас на сайте есть контент на французском, английском и испанском языке. Возможно они находятся на другом поддомене, но вы хотите продемонстрировать Гуглу, что они так же авторитетны, как и основной сайт, над которым вы так долго работали.
Минусы.
Самая большая проблема в том, что при взаимных ссылках на сайты, принадлежащие одному человеку, передается меньший вес. Поэтому вебмастера, использующие черные и серые методы продвижения, изо всех сил пытаются скрыть эти связи.
Кроме того, существует проблема «плохого» окружения. Если у вас есть 12 сайтов и все они перелинкованы, то для Гугла это сигнал о нарушении принципов компании, за которым может последовать потеря ссылочного веса или даже санкции.
В настоящее время мы наблюдаем новый вид санкций. Они накладываются не на сайты, а на людей. Например, вебмастер, после попадания в бан, решил начать все с нового листа. Он создал новый сайт на новом домене, но через некоторое время он тоже попадает под санкции, даже при отсутствии ссылок. Как Гугл узнал, что это тот же самый сайт?
Сигналы, по которым Гугл палит сетки сайтов.
Хочу сразу отметить, что мы не знаем всех сигналов. У нас есть только догадки. Традиционно, Гугл учитывает такие вещи как WHOIS, IP адрес, хостинг и подобную информацию, находящуюся в свободном доступе.
Есть такой ресурс, как SpyOnWeb предназначенный для вычисления сайтов, принадлежащих одному владельцу. Может определить сайты находящиеся на одном аккаунте Google AdSense, сервиса статистики Google Analytics, а так же сайты, имеющие один и тот же IP-адрес.
Возьмем для примера домен Moz.com. SpyOnWeb покажет все сайты, которые размещены на одном хостинге или IP, или используют один и тот же код Google Analytics или AdSense. Вся эта информация находится в свободном доступе в интернете и заложена в исходном коде сайта. Вам даже не нужно иметь доступ к аккаунту Google Analytics или AdSense.
Собрав всю эту информацию, определить сайты одного владельца очень легко. Раньше, существование связей между сайтами определялось на основе C-блоков. Здесь на Moz, с помощью Open Site Explorer, можно посмотреть число уникальных связанных друг с другом C-блоков. Но с переходом на новую версию интернет протокола (Ipv6), этот способ скоро перестанет работать, поскольку С-блоки базируются на 4 версии протокола. Наши инженеры сейчас ищут им альтернативу, т.к. в ближайшем времени эта метрика исчезнет.
Кроме того, не следует забывать о перелинковке, когда все сайты ссылаются друг на друга, а у Гугла есть самый подробный каталог ссылок. Используя статистические методы анализа очень легко определить что кому принадлежит и кто что контролирует.
Существуют и другие сигналы, о которых часто забывают, но Гугл их тем не менее учитывает. Я называю их сигналами контента, когда контент с одного сайта похож или идентичен контенту с другого сайта. Для Гугла это веские основания для подозрений. Но поскольку, многие сайты копируют контент, это не основной сигнал и Гугл будет смотреть на другие показатели. Поэтому если вы используете контент и картинки с забаненного сайта, то новый сайт может тоже попасть под санкции.
Очень часто, вебмастера используют на своих сайтах одинаковые темы Вордпресс или одинаковые CSS/JavaScript файлы. Это тоже может служить дополнительным признаком.
Даже совпадение контактных данных из раздела «О нас», свидетельствует о том, что сайты связаны между собой.
Кроме того, у Гугла есть специальные инструменты вроде авторства или атрибута Hreflang, которые связывают страницы разных сайтов и помогают при ранжировании.
Так что, от Гугла очень сложно скрыть принадлежность сайта. И это не стоит потраченных усилий. Скорее наоборот, в случае с поддоменами и альтернативными языками указание авторства принесет только пользу.
Оригинал статьи на английском языке: http://moz.com/blog/how-google-knows-what-sites-you-control-and-why-it-matters-whiteboard-friday |
|
|
|
|
|
Познавательно,спасибо |
|
|
|
|
|
еще можно пробить все , если пользуешься почтой от гугла, они же все читают и мониторят. До Свидания Gmail!!! |
|
|
|
|
|
Shkiff, че прикалуешься? эт сколько читателей нужно кормить? |
|
|
|
|
|
Вполне серьезно, гугл еще не такое может. Если они показывают рекламу на основе полученных писем, то и определить вебмастеров по регистраторам не будет для них большой проблемы.
Если посмотреть в акке Гугла, там можно найти твои поисковые запросы, которые ты делал за последние 3-5 лет. Где-то у меня проскакивало этот сервис в гугле. Я даже сам удивился, когда это увидел. И при поиске ща выхожу из всех акков гугла, чищю историю а потом уж вбиваю то что ищу. |
|
|
|
|
|
Цитата: |
можно найти твои поисковые запросы, которые ты делал за последние 3-5 лет
|
Вот так зайдешь случайно на детский сайт, а потом всю оставшуюся жизнь будешь смотреть рекламу подгузников. |
|
|
|
|
|
Miss Content писал(а): |
Цитата: |
можно найти твои поисковые запросы, которые ты делал за последние 3-5 лет
|
Вот так зайдешь случайно на детский сайт, а потом всю оставшуюся жизнь будешь смотреть рекламу подгузников.
|
А че ты детских сайтах делаешь? Не уж то готовишься стать мамой? |
|
|
|
|
|
Цитата: |
А че ты детских сайтах делаешь?
|
Это я для примера.
А Гугл знает не только про ваши сайты.
Прежде всего, Google, естественно, знает все ваши поисковые запросы. Помимо этого, Google знает, какие сайты вы посещаете (поскольку на всех этих сайтах, скорее всего, установлены рекламные блоки Google AdSense).
Если вы используете браузер Google Chrome, то Google знает все веб-адреса, которые вы вводите в адресную строку браузера (так называемый Omnibox) - эта фича включена по умолчанию, и большинство пользователей ее, скорее всего, не отключают.
Если вы пользуетесь почтовым сервисом Gmail, то Google знает всё, что касается вашей переписки (Google автоматически сканирует текст всех получаемых и отправляемых вами писем для показа вам релевантной рекламы). При этом встроенный в почту Gmail чат также сохраняет тексты всех ваших переписок.
Самый популярный в мире видео-сервис YouTube принадлежит Google. Если вы смотрите там видео, то Google знает, какие видео-ролики вы смотрите, какие оставляете комментарии и какие выставляете оценки.
Если вы ищете книги с помощью Google Books, то Google знает, какие книги вас интересуют.
Если вы используете сервис Google Calendar, то Google знает ваш распорядок дня и все ваши записанные в календарь планы.
Если вы пользуетесь сервисом Google Latitude, отслеживающим ваше местонахождение посредством вашего мобильного телефона с GPS, то Google знает ваше местонахождение.
Если вы используете сервис Google Voice, то Google знает не только, кому и когда вы звоните, но и сохраняет у себя транскрибированные тексты голосовых сообщений.
Если вы храните свои фотографии в веб-альбомах Picasa, то вы, вероятно, знаете, что там имеется технология распознавания лиц, автоматически распознающая вас и ваших друзей. Таким образом, у Google имеется фото-досье на вас и на всех ваших знакомых, чьи фотографии вы выложили. |
|
|
|
|
|
Самое важно Гуглу знать, как и Яндексу, какую рекламу тебе подсунуть. Стоит что-то поискать в интернете, так сразу потом следуют релевантные этому поиску объявления в Директе и Адвордсе на сайтах, где они есть, но не имеющие ничего общего с твоими поисковыми запросами. Это могут быть какие-то новостные сайты или вообще тематические форумы и прочее. Ну, это и логично: раз ты, что-то ищешь, значить тебя это интересует, значит можешь перейти по платному объявлению и купить нужную тебе вещь. Таким образом вся эта слежка затеяна ради одной цели - чтобы рекламодатели были довольны и поисковики были с прибылью, все остальные аспекты твоих похождений в Интернете мало кого интересуют, если ты, конечно не обладаешь какой-то супер-секретной информацией или баснословным состоянием, например. |
|
|
|
|
|
|
Miss Content писал(а): |
Цитата: |
А че ты детских сайтах делаешь?
|
Это я для примера.
|
Я уж думал бухать будем и отмечать рождение твоего младенца |
|
|
|
|
|
|
Цитата: |
Ну, это и логично: раз ты, что-то ищешь, значить тебя это интересует, значит можешь перейти по платному объявлению и купить нужную тебе вещь.
|
В данный момент Гугл мне демонстрирует рекламу таунхаусов, оборудование Tektronix, архивный шкаф и предлагает стать гражданином UK. Ничего из этого мне абсолютно не нужно. |
|
|
|
|
|
|
|