|
|
|
Есть домен, с него пощу фрихи. В руте лежит блог. Хочу скомить гуглю сайтмап всего сайта. Для ВП поставил плугин Google Sitemap Generator, сгенерил - все ок. Но на домене еще несколько десятков фрих (зеркальных) и было бы не плохо проинформировать (и получать данные) и об этих страницах тоже. Как это сделать? Понятно что скормить гуглю еще одну мапу, но генерить ее руками задолбешся.
Есть какой-то скрипт для этих целей? |
|
|
|
|
|
Я собственно хз, но с google сайтмапом были постоянно траблы - ругался сам webmaster
поэтому я сейчас кормлю ему http://блог/rss - никто не ругается и всё тихо! |
|
|
|
|
|
у меня с сайтмапами траблов никаких нет. просто не хочется генерить ее руками из нескольких сотен урлов. да и апдейтить тоже вручную придется при постинге кждой новой фрихи. стопудово должен быть скрипт который пошерстит мою фтпху и сгенерит список урлов... |
|
|
|
|
|
|
хml-sitemaps.com юзал, но для белых, неадалтовых проэктов. с фрихами проблема в том что не все фрихи/зеркала доступны с морды, да и не только с морды. на некоторые можно попасть только с ЛЛ куда они прописаны.
tools.webmasters.sk - не юзал, сенкс, но думаю что аналогично с хml-sitemaps.com вопрос не решит...
gsitecrawler - поставил, ближе к истине, сейчас потестю, спасибо. но боюся что он тоже не все страницы выловит.
есть скрипт который пройдется по ФТП на предмет html документов и сгенерит из них мапу? на крайняк пусть не мапу а хотя бы список урлов? |
|
|
|
|
|
Не претендую на унивесальность - не судите строго , но первое что в голову пришло:
- зайти на фтп через тоталкоммандер,
- выделить нужные файлы по маске("+" на цифровой панельке),
- сохранить выделенное в файл(Выделение - Сохранить выделение в файл...),
- открыть в редакторе, понимающем esc-последовательности(напр. AkelPad),
- команда "найти и заменить", искать "\n"(это символ конца строки), заменит на "\nhttp://yoursite.com/root/"("\n" нужно для расположения каждой ссылки с новой строки),
- заменятся строки кроме первой, в ней вставляем в начало "http://yoursite.com/root/"
Вот список всех урлов. Для xml нужно смотреть спецификацию формата. |
|
|
|
|
|
pepper, держи +7, щас бум тестить, скорей всего это будет единственный способ... |
|
|
|
|
|
Цитата: |
выделить нужные файлы по маске("+" на цифровой панельке),
|
эт где, подскажи тупому? |
|
|
|
|
|
Цитата: |
эт где, подскажи тупому?
|
Ну что же Вы так?! Не тупому, а временно не знающему
"+" на дополнительной панели клавы справа, где цифры |
|
|
|
|
|
pepper, все расдуплился. но только тож не то. по маске получается выделить только файлы в текущем фолдере, а в сабфолдерах нет.
роем дальше... |
|
|
|
|
|
Ну Budd, ты меня заинтриговал! Держи еще один способ:
- заходим на фтп через тоткомандер в корень, видим все файлы и субпапки
- жмем на поиск (Alt+F7), в качестве файлов для поиска пишем маску "*.html", найдет все файлы включая подпапки
- все выделяем и сохраняем в файл
- поиск и замена, ищем полный путь к корню фтп, заменяем на урл
вуаля |
|
|
|
|
|
пробовал, можно так, но есть одно но. конпка Feed to listbox не активна при поиске по ФТП. так что как ни крути придется сайт сливать и серчить оффлайново, чего я боялся.
но все равно пасибо огромное pepper! |
|
|
|
|
|
Ooops, извини,Budd, не было возможности проверить
|
|
|
|
|
|
Вроде были програмы которые индексируют сайт и выдают на выходе мапу в желаемлм формате. Вроде на блоге СЕО-критика их видел. Искать не стал тк считаю твою затею бесполезной но наводку лови. |
|
|
|
|
|
все, заборол!
с помощью этого скрипта. гребет мапу из следующих источников:
- прописанные в конфиге урлы
- логи сервака
- список урлов
- существующая мапа
- директория сайта (что мне собсно и нужно было)
ща на крон повешу и вообще шеколод.
плять, с такими раскладами недолго и линух освоить (превед Вацлав)! |
|
|
|
|
|
|
|