Проблема определения уникальности текстов поисковиками
Новая тема Написать ответ
# Вс Май 17, 2009 8:47 amLOVE Зарег.: 01.12.2007 ; Сообщ.: 1742Ответить с цитатой
Споткнется ли гугл рано или поздно на проблеме определения уникальности текстов?

Ведь можно предположить, что с ростом количества материалов в сети и при ограниченной словарной базе тексты все чаще и чаще будут дублироваться или определяться как дублированные. Особенно по одинаковым тематекам. И уже обычный синонимайзер может доставить огромные проблемы поисковику.

Верна ли теория?
# Вс Май 17, 2009 10:24 amLexix Зарег.: 11.07.2008 ; Сообщ.: 2143Ответить с цитатой
Думаю что в скором времени изменится метод определения уникальности контента, подкрутятся схемы в сторону трастовости, а может даже нас ждут кардинальные изменения.
# Сб Май 30, 2009 10:29 pmZmey Горыныч Зарег.: 03.05.2009 ; Сообщ.: 14Ответить с цитатой
Пока мастера споткнулись об алгоритмы и гуглевские и яндексовые. Там все очень серьезно, есть параметры текста о существовании которых многие не подозревают. Не читаемый уникальный текст сделать можно, а вот осмысленное лучше через копирайтера.
# Сб Май 30, 2009 10:50 pmegorych Зарег.: 09.05.2007 ; Сообщ.: 208Ответить с цитатой
вряд ли машины разбираются в смысле Smile

уник как определялся так и определяется до сих пор

в гугле вводишь кусок текста в кавычках - и смотришь сколько совпадений в индексе. чем меньше результатов для как можно более коротких фраз из текста - тем лучше. для самописного текста 4-5-и словные куски на 90% уникальны, т.е. результатов кроме оригинала не выдает.

это очень просто для самих же поисковиков. пробежаться по тексту простым скриптом и наложить его на базу - как десяток простых поисков, ерунда. и поставить свойство к странице - какой-нить приведенный индекс уникальности. например...
# Сб Май 30, 2009 10:54 pmЛена Зарег.: 19.10.2005 ; Сообщ.: 1203Ответить с цитатой
Вообще-то была и есть такая вещь - латентно-семантический анализ. Дальнейшее развитие получит вероятностный латентно-семантический анализ. И не будет у поисковиков таким проблем о которых вы беспокоитесь.
# Сб Май 30, 2009 11:30 pmLOVE Зарег.: 01.12.2007 ; Сообщ.: 1742Ответить с цитатой
Zmey Горыныч писал(а):
Пока мастера споткнулись об алгоритмы и гуглевские и яндексовые. Там все очень серьезно, есть параметры текста о существовании которых многие не подозревают. Не читаемый уникальный текст сделать можно, а вот осмысленное лучше через копирайтера.



Если робот определяет читаемость по параметрам текста, значит также робот может и создать такие тексты.
# Сб Май 30, 2009 11:32 pmLOVE Зарег.: 01.12.2007 ; Сообщ.: 1742Ответить с цитатой
egorych писал(а):
для самописного текста 4-5-и словные куски на 90% уникальны, т.е. результатов кроме оригинала не выдает.



Это же не может продолжаться вечно, верно?
# Вс Май 31, 2009 2:01 pmegorych Зарег.: 09.05.2007 ; Сообщ.: 208Ответить с цитатой
если "вечно" это еще 5-10 лет, тогда может Smile

http://www.google.com/search?q="Споткнется+ли+гугл+рано+или+поздно"

http://www.google.com/search?q="Ведь+можно+предположить,+что+с+ростом+количества+материалов"

блин как тут на армаде сделать нормальную ссылку? [url=ht..]текст[/url] не работает
# Вс Май 31, 2009 2:23 pmЛена Зарег.: 19.10.2005 ; Сообщ.: 1203Ответить с цитатой
Цитата:
блин как тут на армаде сделать нормальную ссылку? [url=ht..]текст[/url] не работает


Работает:

http://www.google.com/search?q="Споткнется+ли+гугл+рано+или+поздно"

http://www.google.com/search?q="Ведь+можно+предположить,+что+с+ростом+количества+материалов"
# Вс Май 31, 2009 2:29 pmLexix Зарег.: 11.07.2008 ; Сообщ.: 2143Ответить с цитатой
вот так

Код:
[url=http://www.google.com/search?client=opera&rls=ru&q=%D1%81%D0%BF%D0%BE%D1%82%D0%BA%D0%BD%D1%91%D1%82%D1%81%D1%8F+%D0%BB%D0%B8+%D0%B3%D1%83%D0%B3%D0%BB+%D1%
80%D0%B0%D0%BD%D0%BE+%D0%B8%D0%BB%D0%B8+%D0%BF%D0%BE%D0%B7%D0%B4%D0%BD%D0%BE&sourceid=opera&ie=utf-8&oe=utf-8]споткнётся ли гугл рано или поздно[/url]



споткнётся ли гугл рано или поздно
# Вс Май 31, 2009 4:26 pmLi-Hua Зарег.: 25.12.2005 ; Сообщ.: 11544Ответить с цитатой
Имхо, уже давно идет и будет продолжать идти медленный но верный сдвиг в сторону трастовости сайта. Уник очень сложно определить, особенно на маленьких объемах почти нереально, я в этом на сплогах убедился где в посте 1 предложение. Вобщем есть смысл большой в улучшении методов анализа поведения посетителей и гугл это развивает, на этом и будет в дальнейшем строится ранжирование, т.е. качественные СДЛ будут рулить сильнее и сильнее по позициям. Это только имхо.
# Пн Июн 01, 2009 5:49 pmZmey Горыныч Зарег.: 03.05.2009 ; Сообщ.: 14Ответить с цитатой
LOVE писал(а):
Если робот определяет читаемость по параметрам текста, значит также робот может и создать такие тексты.


Если робот может опознать тебя, он тебя может сделать. :mrgreen:
egorych писал(а):

в гугле вводишь кусок текста в кавычках - и смотришь сколько совпадений в индексе


Ты видишь только часть айзберга. :mrgreen:


Li-Hua. Ловушку с тарастовостью и уником гугл одолел 2-3 года назад. Про малые обьемы, это да. СДЛ уже рулят, в основном из за того что вступает в силу поведенческая статистика.
Не пытайтесь слепить алгоритм на нескольких параметрах, их гораздо больше.
Новая тема Написать ответ    ГЛАВНАЯ ~ ПОИСКОВЫЕ СИСТЕМЫ
 
Любое использование материалов, размещенных на ArmadaBoard.com, без разрешения владельцев ArmadaBoard.com запрещено.