На страницу Пред. 1, 2, 3 |
|
|
Taburetkin, я не понял как из ответа гугла следует, что синонимизация не делает текст уникальным. Из него как раз следует, что при изменении 30% текста он становится уникальным. |
|
|
|
|
|
Kerk,
Taburetkin писал(а): |
ответ: разбавьте ваш текст дополнительным уникальным текстом
|
Гугл определяет все математически. Чистая математика.
Cabal, то что ты предлагаешь тоже вычисляется.
Большие массивы текста определяются по методу "облака" (не помню как называеся точно). Очень очень упрощенно выглядит так:
Например берется текст А и накладывается на текст Б. В зависимости от % текст считается дублем. Конечно не сам текст а его "математическая формула" построения так сказать.
http://www.cs.umd.edu/~pugh/google/Duplicates.pdf |
|
|
|
|
|
О. Вспомнил. Кусок информации я могу выдать. Из примитивных "намеков".
Синонимизировать, сохраняя смысл и добавляя уникальность нужно не отдельные слова, а словосочетания. Т.е. выхватывать из фразы (при ее первичном парсинге) только существительные, затем осуществлять поиск перед ними описательных прилагательных. Для этого нужно дерево объектов в базе - чтобы при замене выявленных конструкций [adverb]+adjective + noun(s/p) не нарушалась смысловая связь. Мутновато? Мда. |
|
|
|
|
|
этo называется k-shingles. разбивка на маленькие куски
the brown fox
quick brown fox
brown fox jumped
fox jumped over |
|
|
|
|
|
вот это уже теплее - но общий смысл текстов может нарушиться! посему рерайтинг больше плюсов дает для белых проектов - здесь же ведь белые проекты обсуждаются, тексты для них и жизнь в анналах гугля оных ?  |
|
|
|
|
|
Вацлав, нет-нет, не мутновато. О чем-то таком я тоже думал
Taburetkin, из того, что ты выложил как раз следует, что замена 30% слов делает текст полностью уникальным. |
|
|
|
|
|
Я уже где-то приводил простой пример про тапки:
Красные тапки, привет вам - вы хороши.
и
Синие сапоги, здравствуйте - вы лучшие.
И 1е и 2е = А + В, С - Д.
И если у тебя текста страница, то разбивка на маленькие куски и сравнение "отпечатков" говорит о дублиронанности контента т.к. математическая структура остается таже. Гуглю абсолютно все равно что ты поменял синий на красный, а тапки на сапоги. С математической точки ничего не поменялось и он посчитает твой контент дублем. |
|
|
|
|
|
Странно это, тогда гугл первым делом забанит все справочники и словари, ибо там информация вся по шаблону. Вацлав говорит именно о замене слов на синонимы без изменений в синтаксической структуре предложения, видимо у него это работает. Или нет?
Если Табуреткин прав, то с синонимами вообще можно не заморачиваться, а настрогать шаблонов для переформулировок типа "He will build a house for us" --> "He will build us a house". |
|
|
|
|
|
|
Действительно, уже обсуждалось неоднократно. Суммируя те обсуждения, можно сделать вывод, что технически реализовать замену фразами/устойчивыми словосочетаниями реально и это уже сделано. Запор в надобности обладать здоровым тезаурусом, чтобы делать адекватные замены относительно темы статей. |
|
|
|
|
|
от перестановки слов в текста он не становится уникальным !!!
на тему тезаурусов, хорошая мысля, вот только где взять такой "правильный" словарик. |
|
|
|
|
|
|
|