Синонимизация
На страницу Пред.  1, 2, 3
Новая тема Написать ответ
# Пт Янв 11, 2008 11:32 pmKerk Зарег.: 30.09.2007 ; Сообщ.: 550Ответить с цитатой
Taburetkin, я не понял как из ответа гугла следует, что синонимизация не делает текст уникальным. Из него как раз следует, что при изменении 30% текста он становится уникальным.
# Сб Янв 12, 2008 2:40 amTaburetkin Зарег.: 25.02.2007 ; Сообщ.: 1426Ответить с цитатой
Kerk,

Taburetkin писал(а):
ответ: разбавьте ваш текст дополнительным уникальным текстом



Гугл определяет все математически. Чистая математика.
Cabal, то что ты предлагаешь тоже вычисляется.

Большие массивы текста определяются по методу "облака" (не помню как называеся точно). Очень очень упрощенно выглядит так:

Например берется текст А и накладывается на текст Б. В зависимости от % текст считается дублем. Конечно не сам текст а его "математическая формула" построения так сказать.




http://www.cs.umd.edu/~pugh/google/Duplicates.pdf
# Сб Янв 12, 2008 5:21 amВацлав Зарег.: 21.02.2006 ; Сообщ.: 4965Ответить с цитатой
О. Вспомнил. Кусок информации я могу выдать. Из примитивных "намеков".
Синонимизировать, сохраняя смысл и добавляя уникальность нужно не отдельные слова, а словосочетания. Т.е. выхватывать из фразы (при ее первичном парсинге) только существительные, затем осуществлять поиск перед ними описательных прилагательных. Для этого нужно дерево объектов в базе - чтобы при замене выявленных конструкций [adverb]+adjective + noun(s/p) не нарушалась смысловая связь. Мутновато? Мда.
# Сб Янв 12, 2008 5:55 amTaburetkin Зарег.: 25.02.2007 ; Сообщ.: 1426Ответить с цитатой
этo называется k-shingles. разбивка на маленькие куски

the brown fox
quick brown fox
brown fox jumped
fox jumped over
# Сб Янв 12, 2008 1:38 pmvitvirtual Зарег.: 11.06.2007 ; Сообщ.: 9061Ответить с цитатой
вот это уже теплее - но общий смысл текстов может нарушиться! посему рерайтинг больше плюсов дает для белых проектов - здесь же ведь белые проекты обсуждаются, тексты для них и жизнь в анналах гугля оных ? Wink
# Сб Янв 12, 2008 4:31 pmKerk Зарег.: 30.09.2007 ; Сообщ.: 550Ответить с цитатой
Вацлав, нет-нет, не мутновато. О чем-то таком я тоже думал
Taburetkin, из того, что ты выложил как раз следует, что замена 30% слов делает текст полностью уникальным.
# Сб Янв 12, 2008 8:32 pmTaburetkin Зарег.: 25.02.2007 ; Сообщ.: 1426Ответить с цитатой
Я уже где-то приводил простой пример про тапки:

Красные тапки, привет вам - вы хороши.
и
Синие сапоги, здравствуйте - вы лучшие.

И 1е и 2е = А + В, С - Д.
И если у тебя текста страница, то разбивка на маленькие куски и сравнение "отпечатков" говорит о дублиронанности контента т.к. математическая структура остается таже. Гуглю абсолютно все равно что ты поменял синий на красный, а тапки на сапоги. С математической точки ничего не поменялось и он посчитает твой контент дублем.
# Сб Янв 12, 2008 9:33 pmKerk Зарег.: 30.09.2007 ; Сообщ.: 550Ответить с цитатой
Странно это, тогда гугл первым делом забанит все справочники и словари, ибо там информация вся по шаблону. Вацлав говорит именно о замене слов на синонимы без изменений в синтаксической структуре предложения, видимо у него это работает. Или нет?

Если Табуреткин прав, то с синонимами вообще можно не заморачиваться, а настрогать шаблонов для переформулировок типа "He will build a house for us" --> "He will build us a house".
# Пн Янв 14, 2008 6:00 pmKerk Зарег.: 30.09.2007 ; Сообщ.: 550Ответить с цитатой
Еще мнения есть?
# Пт Янв 18, 2008 3:15 amYurium Зарег.: 02.06.2007 ; Сообщ.: 36Ответить с цитатой
Действительно, уже обсуждалось неоднократно. Суммируя те обсуждения, можно сделать вывод, что технически реализовать замену фразами/устойчивыми словосочетаниями реально и это уже сделано. Запор в надобности обладать здоровым тезаурусом, чтобы делать адекватные замены относительно темы статей.
# Пт Янв 18, 2008 9:58 ambaracuda Зарег.: 16.03.2007 ; Сообщ.: 693Ответить с цитатой
от перестановки слов в текста он не становится уникальным !!!


на тему тезаурусов, хорошая мысля, вот только где взять такой "правильный" словарик.
Новая тема Написать ответ    ГЛАВНАЯ ~ ПОИСКОВЫЕ СИСТЕМЫ
 На страницу Пред.  1, 2, 3
Любое использование материалов, размещенных на ArmadaBoard.com, без разрешения владельцев ArmadaBoard.com запрещено.