Google рассказывает о своих поисковых алгоритмах
Новая тема Написать ответ
# Пн Май 26, 2008 12:55 pmsamedi Зарег.: 17.04.2008 ; Сообщ.: 214Ответить с цитатой
В течение долгого времени компания Google хранила в строгом секрете формулы своих поисковых алгоритмов. Причины понятны: во-первых, чтобы защититься от конкурентов; во-вторых, чтобы эту информацию не могли использовать в своих целях «чёрные» оптимизаторы. И вот, наконец, политика скрытности начинает меняться. Глава подразделения поискового качества (Search Quality) Уди Манбер опубликовал сообщение в корпоративном блоге, которое он сам называет первым шагом по открытию ранее секретной информации.

В первом сообщении Уди Манбер рассказывает об основах системы ранжирования поискового движка Google. Он объясняет, что всем известный алгоритм PageRank является частью гораздо более масштабной системы, которая включает в себя языковые модели (обработка фраз, синонимов, опечаток и т.д.), модели обработки запросов (это не лингвистика, а попытка понять суть поисковых запросов), временные модели (на некоторые запросы лучше выдавать самые свежие страницы, проиндексированные в последние 30 минут, а на другие — старые страницы с проверенным качеством), а также модели персонализации.

В первом сообщении Манбера мы не видим ничего «секретного», чего бы не знали раньше. Но это только начало, и в будущем Манбер может опубликовать новую интересную информацию, так что есть смысл внимательно следить за корпоративным блогом Google.

Независимые эксперты с иронией комментируют, что Google всегда была не менее закрытой компанией, чем Microsoft. Даже хуже, более лицемерной, потому что система работы Google такая: они заставляют людей открывать информацию в свободный доступ, собирают её в свой закрытый «чёрный ящик», с помощью которого зарабатывают деньги. Понятно, что такие действия вызывают некоторое недовольство у авторов контента, так что новая стратегия Google по открытию своих алгоритмов — это, в какой-то степени, вынужденный шаг.

© alizar.habrahabr.ru


Последний раз редактировалось: samedi (Пн Май 26, 2008 1:05 pm), всего редактировалось 1 раз
# Пн Май 26, 2008 1:04 pmВацлав Зарег.: 21.02.2006 ; Сообщ.: 4965Ответить с цитатой
Для "черных" они не открыли ничего нового. Все кто умеет думать головой и владеет достаточными статистическими площадками, давно поняли, что Page Rank является далеко не главной составляющей. Как и модель ссылочного ранжирования, которая все дальше и дальше отодвигается на второй план.
# Пн Май 26, 2008 1:10 pmsamedi Зарег.: 17.04.2008 ; Сообщ.: 214Ответить с цитатой
В данном тексте действительно лишь общие слова и ничего конкретного. Интереснее другое:

Цитата:
But being completely secretive isn’t ideal, and this blog post is part of a renewed effort to open up a bit more than we have in the past. We will try to periodically tell you about new things, explain old things, give advice, spread news, and engage in conversations. Let me start with some general pieces of information about our group. More blog posts will follow.


Возможно, СЕОшникам будут теперь подкидывать информацию для размышления.
# Пн Май 26, 2008 1:17 pmВацлав Зарег.: 21.02.2006 ; Сообщ.: 4965Ответить с цитатой
Лучшую информацию для размышлений дает собственная аналитика Smile
Наблюдения за выдачей, за изменением разных пропорций и коэффициентов и особенно предикация. Как давно писал samlowry - нужно стараться быть на шаг впереди поисковиков и постоянно думать "а как бы я на их месте сделал что-то или как бы я боролся с тем-то".
# Пн Май 26, 2008 2:59 pmsamedi Зарег.: 17.04.2008 ; Сообщ.: 214Ответить с цитатой
Собственная аналитика в любом случае должна опираться на базовые знания алгоритмов.

Например, нужно написать программу расстановки ссылок между сплогами. Существуют алгоритмы концентрических колец, прямых лучей и другие. Но зная, что гугл представляет все ссылки между страниц графом, становится понятна неизбежность скорого бана. Так как граф подобной расстановки будет замкнутым и будет вычислен within a fraction of a second.

В таких случаях никакие наблюдения за выдачей картины не сделают.
# Пн Май 26, 2008 3:03 pmВацлав Зарег.: 21.02.2006 ; Сообщ.: 4965Ответить с цитатой
Ошибаешься. Всякие "алгоритмы" перелинковок - это один большой нонсенс Smile Единственный верный алгоритм - это отсутствие алгоритма Smile У гугла серьезная статистическая база, на основе которой он может определять все, что выходит за статистические рамки "средних показателей".
Единственный верный, и давно раскрытый гуглом секрет ранжирования: "делайте сайты для людей, а не для поисковых систем".
# Пн Май 26, 2008 3:21 pmsamedi Зарег.: 17.04.2008 ; Сообщ.: 214Ответить с цитатой
Помни, Нео, Матрица - это программа. Некоторые её законы можно обойти, другие - взломать. (с) Smile
# Пн Май 26, 2008 7:26 pmegorych Зарег.: 09.05.2007 ; Сообщ.: 208Ответить с цитатой
samedi писал(а):
В первом сообщении Уди Манбер рассказывает об основах системы ранжирования поискового движка Google.


Имхо ерунда, аналогично "сенсационным" заявлениям Мэта Каттса что чем больше ссылок тем круче. Намного более подробно эти "секреты" давно лежат в открытом доступе (линк, был где-то лучше оформленный материал на 2-3 часа чтения, но линки не нашел). Глупо ожидать от сотрудников гугли такой доброты душевной (читай глупости) чтобы добровольно добавлять себе работы, рассказав всем подряд про алгоритмы ранжирования.
Новая тема Написать ответ    ГЛАВНАЯ ~ ДАЙДЖЕСТ БЛОГОСФЕРЫ
 
Любое использование материалов, размещенных на ArmadaBoard.com, без разрешения владельцев ArmadaBoard.com запрещено.