Дублирование контента: как с этим бороться? > ПОЛЕЗНЫЕ СТАТЬИ

Дублирование контента: как с этим бороться?

# Чт Мар 01, 2007 2:10 pmRabbit Зарег.: 01.08.2005 ; Сообщ.: 19787

Дублирование контента – это одна из тех проблем, которую создатели поисковых систем пытаются решить уже достаточно давно. Борьба с этим злом в области поисковых технологий происходит с переменным успехом, а, в конечном счете, страдают авторы материалов и простые пользователи.

Сами разработчики поисковых систем не раз поднимали эту проблему на множестве конференций, но воз, как и раньше ...

А что делать простому пользователю, который по определенному запросу на первых страницах находит один и тот же материал? Хорошо, если материал качественный, а если нет? Вот и остается пользователю либо довольствоваться тем, что дали, либо продолжить поиск, тратя на него свое время.

Проблема заключается еще и в том, что в большинстве случаев дублирование контента происходит незлонамеренно. Основными причинами дубляжа контента могут стать:

При этом не следует забывать, что переводные статьи (чем, собственно, занимается ваш слуга) не считаются дублированными статьями. Во всяком случае, об этом говориться на официальном блоге Google. Данная поисковая система даже старается помочь пользователям разных государств лучше понимать друг друга, осуществляя множественный перевод с одних языков мира на другие.

На блоге говорится, что фрагмент, который оформлен как цитата, дублированным контентом не считается. Хотя верится в это с трудом.

Несомненно, больше хлопот доставляют те, кто, не ставя ссылки на источник, сознательно ворует контент без соблюдения авторских прав.

Обнаружить «вредителей» можно с помощью следующих сервисов:

www.copyscape.com. (сервис позволяет найти, на каких сайтах сеть контент, похожий на тот, что представлен на введенной странице);
webconfs (сервис, показывающий процентное соотношении похожего контента на сравниваемых страницах).

Кроме этих сервисов, для выявления дубляжей используется параметр &rd=0 (только для поисковой системы Яндекс). В строку поиска вводится фрагмент текста, который, может быть, сворован, Яндекс выдает точные повторения, чтобы обнаружить нечеткие дубли в конец url на странице поиска ставится &rd=0, поиск проводится повторно. Но, повторюсь, данный параметр применим только для Яндекса.

Выявить сайты, которые воруют у вас контент, не ставя ссылку, - это полдела. Обратитесь к ним сначала с просьбой поставить ссылку. Безрезультатно? С предупреждением о том, что могут быть приняты адекватные меры. В том случае, если ваши требования не выполнены, можете смело жаловаться хостеру. Они обычно не церемонятся, в результате «сайт-вор» может прекратить свою деятельность на долгий срок.

Поисковые системы стараются бороться с дублирование текста так, как могут - придумывают различные фильтры. Конечно, какая-то часть повторяющегося материала отсеивается, но другая часть остается. И, к сожалению, очень много материала повторяется из-за ошибок веб-мастеров. Есть несколько шагов, которые помогут значительно сократить количество дублированного материала:

www.,

Поисковая система Google просит пользователей сообщать о нарушении авторских прав, которое ведет к захламлению поиска спамом, и обещает принимать против нарушителей меры.

Иными словами, проблема, как сохранить релевантную выдачу, должна волновать не только разработчиков поисковых систем, но и всех, кто заинтересован в качественном поиске.

SEONEWS

# Пт Мар 02, 2007 7:18 ampirate Зарег.: 16.05.2006 ; Сообщ.: 531

Ответить с цитатой

Цитата:

Иными словами, проблема, как сохранить релевантную выдачу, должна волновать не только разработчиков поисковых систем, но и всех, кто заинтересован в качественном поиске.

ага, перекладывают свои проблемы на вебмастеров.

# Пт Мар 02, 2007 10:51 amMegaMonstr Зарег.: 23.12.2006 ; Сообщ.: 824

Ответить с цитатой

Rabbit писал(а):

постарайтесь не допускать наличия таких страниц на сайте, как /index.html;

Почему?

# Пт Мар 02, 2007 8:19 pmuser00 Зарег.: 24.07.2006 ; Сообщ.: 717

Ответить с цитатой

А вот здесь copyscape.com можно проверить свои страницы на наличие дубликатов в интернет.

Может немножко отхожу в сторону от темы, но для тех кто не знал о данном сервисе это будет полезной информацией.

# Вт Мар 13, 2007 2:52 amАлександр Гор Зарег.: 11.12.2006 ; Сообщ.: 18

Ответить с цитатой

(Очередные размышления товарища средь господ)
Ох, господа-господа. Между прочим, на ваш форум я наткнулся как раз благодаря такому дублированию (правда с ссылкой на источник). Так уж не надо превращать жадность в паранойю. А то вообще сильно напоминает один старый добрый советский мультик, там где про волшебный горшочек, варивший для всех кашу. И цитата оттуда по-памяти: «эй ты, не ешь кастрюлей, у меня всё записано!».

P/S Да и кстати content – содержание (Оксфордский англо-русский словарь). Так для общего развития. А то вдруг уже и язык «туземцев» забываться стал. :mrgreen:

# Вт Мар 13, 2007 10:33 amRabbit Зарег.: 01.08.2005 ; Сообщ.: 19787

Ответить с цитатой

user00 писал(а):

А вот здесь можно проверить свои страницы на наличие дубликатов в интернет.

Может немножко отхожу в сторону от темы, но для тех кто не знал о данном сервисе это будет полезной информацией.

В статье эта ссылка есть Wink

# Вт Мар 13, 2007 4:11 pmChin Зарег.: 29.01.2007 ; Сообщ.: 2890

Ответить с цитатой

MegaMonstr писал(а):

Rabbit писал(а):

постарайтесь не допускать наличия таких страниц на сайте, как /index.html;

Почему?

Да это бред.
Просто надо чтобы site.com/ и site.com/index.* были для поисковика ОДНОЙ страницей.
В яндексе из за расклейки / и /index.* регулярно происходит "улёт" морд из топа. Во всяком случае раньше происходил, может уже и победили, не слежу.

Новая тема	Написать ответ	ГЛАВНАЯ ~ ПОЛЕЗНЫЕ СТАТЬИ

Любое использование материалов, размещенных на ArmadaBoard.com, без разрешения владельцев ArmadaBoard.com запрещено.