Вопрос по robots.txt
Новая тема Написать ответ
# Пт Янв 05, 2007 11:12 pmRabbit Зарег.: 01.08.2005 ; Сообщ.: 19787Ответить с цитатой
Господа, такой вопрос:
есть определенные страницы, закрытые от индексации файлом robots.txt. Гугл и Яндекс послушно следуют указаниям данного файла.
А вот live.com и MSN мало того, что игнорируют данный запрет - они еще эту страницу на первую страницу в выдаче повесили Cool
В чем может быть дело? Может быть для них какой-то свой, особый файл нужно составлять?
# Сб Янв 06, 2007 6:49 pmLi-Hua Зарег.: 25.12.2005 ; Сообщ.: 11544Ответить с цитатой
баги лезут, ждите пока исправять Smile
# Сб Янв 06, 2007 7:31 pmВацлав Зарег.: 21.02.2006 ; Сообщ.: 4965Ответить с цитатой
Ну, шоб перви, Гугл жрет файлы, запрещенные к индексации через robots.txt, в чем его не раз уже обвиняли. Официальная позиция примерно такова - "жрем, анализируем, но в выдачу не выкладываем. Проверяем для борьбы с клоакингом".

Касаемо лайва и мсна - пните админа, пускай сверит соответствие спецификациям роботс.ткст. Они же не вечные и иногда меняются. Я вот вообще на паре ресурсов забыл про появление лайвкома и забыл написать для него правила.
# Сб Янв 06, 2007 11:11 pmRabbit Зарег.: 01.08.2005 ; Сообщ.: 19787Ответить с цитатой
Вацлав писал(а):
Касаемо лайва и мсна - пните админа, пускай сверит соответствие спецификациям роботс.ткст. Они же не вечные и иногда меняются. Я вот вообще на паре ресурсов забыл про появление лайвкома и забыл написать для него правила.


А такое
Цитата:
User-agent: *


разве не подразумевает всех-всех агентов?
# Вс Фев 25, 2007 4:25 pmuser00 Зарег.: 24.07.2006 ; Сообщ.: 717Ответить с цитатой
Я один скрипт разместил на сайте, а в robots.txt запретил папку со скриптом индексировать Яндексу. Каково было мое удивление, когда Яндекс забанил мой сайт именно из за этого скрипта (причину изложила служба поддержки Яндекса).
Новая тема Написать ответ    ГЛАВНАЯ ~ ТЕХНИЧЕСКИЕ ВОПРОСЫ
 
Любое использование материалов, размещенных на ArmadaBoard.com, без разрешения владельцев ArmadaBoard.com запрещено.