|
|
|
Хотелось бы узнать мнения.
С какого процента похожести контента начинается релевантность, достаточная для качественного ранжирования ссылок?
Или по-человечески, сколько должно быть у двух ресурсов совпадений в наполнении, чтобы они могли считаться релевантными? И какие это должны быть совпадения?
Спасиб, всем плюсы. |
|
|
|
|
|
Уууу, ты спросил Маловероятно, что кто-нибудь владеет хотя бы приблизительными цифрами на сей счет. Ведь тематика документа определяется многими факторами и итерациями индексации. Тематика документа зависит не только от контента на документе-реципиенте, но и в большОй степени от тематики входящих ссылок и тематики документов-доноров ссылок. Тематики которых, в свою очередь, так же зависят от аналогичных факторов. |
|
|
|
|
|
Угу. То есть оценивается такая релевантность, например, при обмене ссылками, исключительно "на глаз", как все и делают?
А если поставить ссылки с большого количества ресурсов по тематике А на ресурс по тематике Б, то ресурс-реципиент станет релевантен тематике А?
Забавные алгоритмы...  |
|
|
|
|
|
Очень сложные вычисления. Есть такой алгоритм "Okapi BM25". |
|
|
|
|
|
Taburetkin, спасибо, почитал про алгоритм.
Но пользоваться этими знаниями в "бытовых" условиях, когда нужно быстро оценить релевантность ресурсов, вряд ли получится. Вероятно, релевантный глазомер просто приходит с опытом  |
|
|
|
|
|
у гугла есть неплохая тулза... - сказал реф реферу и дал линк
http://labs.google.com/sets выдает релевантные с его - гугла точки зрения запросы |
|
|
|
|
|
|
|