Реакция ПС на замену букв
На страницу 1, 2  След.
Новая тема Написать ответ
# Чт Dec 11, 2008 7:54 pmAlexNote Зарег.: 01.09.2008 ; Сообщ.: 19Ответить с цитатой
Здравствуйте!

Дано: на сайте размещается информация, взятая RSS-граббером с другого сайта (либо сайтов). Никаких ссылок на первоисточник, конечно же, нет. Все русские буквы в тексте, абсолютно все, заменяются на аналогичные по написанию английские буквы. К примеру: А-A, у-y, к-k и так далее.


Вопрос:
какие санкции будут применены поисковыми системами к данному сайту или конкретной странице при такой замене? Ясно, что в результатах поиска вор не будет выше первоисточника, а какие еще могут быть санкции? Долгая индексация, быстрый бан?

Я сайты под сапу не клепал с такой заменой, поэтому очень интересует опыт других людей. Вопрос задается для прояснения ситуации с защитой контента. Есть плагин для вордпресса, конвертирующий русские буквы в RSS на английские аналоги, с тем, чтобы ворам неповадно было. Хочу узнать, что может быть автонаполняемым сайтам-ворам за использование такой вот каши.

Спасибо!
# Чт Dec 11, 2008 8:10 pmВацлав Зарег.: 21.02.2006 ; Сообщ.: 4965Ответить с цитатой
Вот такие. Лови.
# Чт Dec 11, 2008 8:21 pmAlexNote Зарег.: 01.09.2008 ; Сообщ.: 19Ответить с цитатой
Вацлав писал(а):
Вот такие. Лови.



Не понял, что ловить?=)
# Чт Dec 11, 2008 8:29 pmHello_Kitty Зарег.: 30.04.2007 ; Сообщ.: 10763Ответить с цитатой
Smile а ты не заметил возле своего ника "плюсик"?
подведи курсор к плюсику и тайтл выскачет с пояснением.
это ты словил оплеуху от Вацлава за нарушение.
# Чт Dec 11, 2008 8:34 pmAlexNote Зарег.: 01.09.2008 ; Сообщ.: 19Ответить с цитатой
А что я нарушил, не подскажете? Знакомый программист создал плагин для защиты RSS-ленты, вставки копирайта и подмены букв , чтобы на сайтах, укравших контент, был не оригинальный текст, а каша из букв. Сделано это было в надежде, что блоги-первоисточники контента не будут выпадать из поиска, после того, как у них украдут контент. Я спросил, насколько оправданны эти надежды.

Или авторские права - запрещенная тема?
# Чт Dec 11, 2008 8:40 pmВацлав Зарег.: 21.02.2006 ; Сообщ.: 4965Ответить с цитатой
Отставить оплеуху. Моя вина, неправильно истолковал пост ТС, подумав что он собирается таким образом грабить контент, а не защищать оный. Утром плюс магически исчезнет.
Приношу свои извинения.
# Чт Dec 11, 2008 8:44 pmAlexNote Зарег.: 01.09.2008 ; Сообщ.: 19Ответить с цитатой
Ничего, я понимаю. Такие вопросы часто задают именно воры. Я яндексу отписал, они пишут, что
Цитата:
Чаще всего дублирующие блоги просто напросто выпадают из нашего поиска автоматически. Каких-то специальных санкций мы не налагаем.



А однозначных пояснений по мешанине русских и английских букв не дали. Вот тема и появилась, в надежде, что кто-то, кто пытался так уникализировать свой сапосайты, поделится опытом - вылетят воры из индекса или нет.
# Чт Dec 11, 2008 9:36 pmIseeDeadPeople Зарег.: 06.12.2005 ; Сообщ.: 21915Ответить с цитатой
AlexNote, а как твой РСС плагин узнает когда се паук тянет твою РСС или это чей то `граббер` ? -- а ты незнал что боты также РСС чекают (?)
если отличить можно, то зачем тогда ........ ? непроще ли тогда просто выдавать линки на себя, без всякого контента...
а если нет, то и се боты и воры будут глотать одно и тоже кашу....
а если реализуешь то это уже - клоакинг, - бан се тебе как поймет что с разных машин/рефери/агент - выдача разниться

а так - се_парсер кмк слова с заменами просто небудет видеть не как не_русский ни как не_англ
т.е. ИМЕННО "не как не_русский ни как не_англ" а не "не как русский ни как англ"
т.е. Опять же - у твоего `вора` будет уникальный контент, ты его еще и `морфить` ему его будешь

r5 :mrgreen:
# Чт Dec 11, 2008 9:54 pmAlexNote Зарег.: 01.09.2008 ; Сообщ.: 19Ответить с цитатой
Блин, о клоакинге я не подумал. Если поисковик перейдет на блог, то он получит нормальный текст. Но если возьмет текст из ленты, то будет каша и именно она сохранится в кеше. И именно по ней будет расцениваться сайт.

Елки, и все затея коту под хвост? Так вроде хорошо звучало...
# Чт Dec 11, 2008 10:27 pmIseeDeadPeople Зарег.: 06.12.2005 ; Сообщ.: 21915Ответить с цитатой
"И именно по ней будет расцениваться сайт. "

несовсем,
РСС поток и хтмл поток - расцениваються как два разных пони... и есть спицефика даже поиска чисто по РСС потокам, блогсерч.
Учти кмк - скорее если бот знает что на сайте есть лента, он с ленты начинает чекать есть ли новое на сайте что то... - так ему ясно проще и по трафику и по лошадкам потом.

но на фиде у тебя будет каша, - а на сайте другое... - как мин, недоразумения у вас будут.. и как следствии актуальность твоей ленты он считать небудет, т.к. для него это будет что то уже подобное.. да еще и в индекс хтмл твоего домена, на это что то подобное (РСС поток) стоит хидер как алтернатива-рсс-линк.


AlexNote,

да еще и в индекс хтмл твоего домена, на это что то подобное (РСС поток) стоит хидер как алтернатива-рсс-линк.

вот этот момент четко понимаешь ?
# Чт Dec 11, 2008 10:57 pmAlexNote Зарег.: 01.09.2008 ; Сообщ.: 19Ответить с цитатой
Ты про
Код:
<link rel="alternate" type="application/rss+xml" title="AlexNote RSS Feed" href="http://www.alexnote.ru/feed/" />

?
Это сообщает о наличии альтернативной версии контента.

Тут уже роли не играет, что в хедере, что в RSS. Если поисковики будут сохранять подмененный контент, то использовать плагин смысла нет. Не подставлять же свой блог ради того, чтобы и ворам досталось. Задумка не прошла...

Спасибо! Я до клоакинга, что-то, не дошел сам.
# Чт Dec 11, 2008 11:55 pmIseeDeadPeople Зарег.: 06.12.2005 ; Сообщ.: 21915Ответить с цитатой
да, т.е. на твоей индекс стр, тегом кот. ты указал тут ... точно сказано боту что у нас есть РСС поток ... а в фиде (РСС потоке) и текст другой будет и ссылки на топики твоего блога с кратким текстом как каша будет + линки на топики (там же в РСС потоке как <link>...</link>), тама текст уже нормальный получаеться....

" Я до клоакинга " - ну клоакинг бы получился, если бы ОДИН ДОКУМЕНТ меняет свойства (выдачу) при разных ИП/Агент/рефери ... т.е. если бы реализовал... то скорее ... `спроси уже у бота как зайдет на твой сайт` - что он подумает....
# Пт Dec 12, 2008 12:23 amFraud Зарег.: 27.07.2007 ; Сообщ.: 309Ответить с цитатой
AlexNote,
закрой фид от индексации от поисковиков в robots.txt

IseeDeadPeople,
Бот начинает чекать не с фида, а с карты сайта есть ли что новое на сайте.

Идея плагина мне понравилась! Smile Думаю стоит попробовать.
# Пт Dec 12, 2008 1:27 amAlexNote Зарег.: 01.09.2008 ; Сообщ.: 19Ответить с цитатой
Fraud
У меня в блоге описание и ссылка на страницу автора, посмотрите, попробуйте.

Да, если в роботс закрыть фид, то данные будут браться с блога, не с ленты. Надо подумать над этим. Кроме поисковиков есть еще и пинг-сервисы, берущие после обновления ленту. Хотя толку от них все равно нет.

Мне бы дали однозначный ответ на вопрос как ПС относятся к страницам с текстом, состоящим из мешанины русских и англ. букв, было бы понятнее, стоит ли возиться=) Если за это банят - можно легко избавиться от воров. Если это игнорируется, то и резона использовать эту фичу нет.
# Пт Dec 12, 2008 9:49 amRabbit Зарег.: 01.08.2005 ; Сообщ.: 19787Ответить с цитатой
AlexNote, провела небольшой эксперимент.

меняла букву а на латинскую.
Яндекс все прекрасно понял.
Гугл тоже понял, но предложил правильный вариант...

Т.е. поисковики научены разбираться в подмене похожих букв. И если текст по их понятием идентичен, то может является дубликатом? И соответственно все санкции к дублицированному контенту.. Точно не знаю, но вот такие мысли возникли...
Новая тема Написать ответ    ГЛАВНАЯ ~ ПОИСКОВЫЕ СИСТЕМЫ
 На страницу 1, 2  След.
Любое использование материалов, размещенных на ArmadaBoard.com, без разрешения владельцев ArmadaBoard.com запрещено.