|
|
|
Привет!
Давно не виделись, а кто-то вообще может быть меня не знает
Есть региональный сайт, на котором я хочу размещать местные новости, которые не хочу писать сам, а хочу парсить с источников и 1 в 1 постить у себя. Как такое сделать?
Я в этой теме вообще ноль, распишите, пожалуйста, подробно. А если кто-то сможет помочь технически, я вообще буду благодарен. |
|
|
|
|
|
А RSS у доноров есть?
Есть варианты RSS грабить. Тем же zerber'ом к примеру, он и постить умеет в некоторые движки.
Развитие зербера остановилось, но софт работоспособен до сих пор.
Или прогеру заказать, если список доноров заранее известен и верстка у них не часто меняется, самый лучший вариант, имхо.
Content Downloader очень гибок в настройках, но чтобы им постить надо извращаться. |
|
|
|
|
|
А разве это не скажется негативно на сайте? Ведь это по сути копипаст. |
|
|
|
|
|
Привет, m_Stasuk!
Проще всего rss или atom брать, если есть, как уже сказал Natud.
Если ленты нет, то заказать скрипт для парсинга с прямым выводом или обработкой. На php выйдет дешевле всего и универсальное решение (либо чистый php, либо php+curl, если нужна эмуляция).
Вот простой скрипт-образец, выбирает все между двумя тегами заданной страницы (для кириллицы - дополнительно перекодируем либой a.charset.php):
Код: |
<?php
$html = file_get_contents('http://litres.se/');
$pattern = '#\<article\>(.*)\<\/article\>#s';
preg_match_all($pattern,$html, $news);
print_r($news[1]);
?>
|
Берет все между тегами <article> и </article>.
Основные проблемы в этой задаче - нормальный парсинг источника (чтобы отдавал контент без подводных камней и препон) и дальнейшая очистка и подготовка к публикации. |
|
|
|
|
|
Toulan, если новости появляются у меня и у источника и при этом количество уникального контента на моем сайте велико — проблем не будет.
Пока буду переваривать, спасибо за подсказки, парни. |
|
|
|
|
|
Цитата: |
А разве это не скажется негативно на сайте? Ведь это по сути копипаст.
|
Цель парсига не идексация, а предоставление пользователям полезного контента в одном месте, без утомительного лазания по другим сайтам. |
|
|
|
|
|
Тоже вопрос к тем кто парсит новости. Откуда это делаете? |
|
|
|
|
|
Doc писал(а): |
Цитата: |
А разве это не скажется негативно на сайте? Ведь это по сути копипаст.
|
Цель парсига не идексация, а предоставление пользователям полезного контента в одном месте, без утомительного лазания по другим сайтам.
|
Сорри, но для меня актуален вопрос: -С ссылкой на источник? или.. за счет траста...плевать? |
|
|
|
|
|
mordehay, с ссылкой конечно. В чем боязнь ставить ссылки? |
|
|
|
|
|
DrKronos писал(а): |
mordehay, с ссылкой конечно. В чем боязнь ставить ссылки?
|
Да как то, думал так
3 новости в день(минимум) на 30 днёв=90 ссылей ежемесячно на 12 мес
(но, на один рес?)
Стандартная боязнь новичка на исход-ие |
|
|
|
|
|
Это же ссылки на источник, а не "купить дипломы оптом". Энциклопедическая ценность статьи вырастает, если указаны источники. Поисковый бот видит, что ты не плагиатишь, а цитируешь. |
|
|
|
|
|
DrKronos писал(а): |
Это же ссылки на источник, а не "купить дипломы оптом". Энциклопедическая ценность статьи вырастает, если указаны источники. Поисковый бот видит, что ты не плагиатишь, а цитируешь.
|
Виноват, не так спросил. Проэкт не для продажи ссылок, тогда? А СДЛ-с монетизацией трафа? (корявые вопросы? сорри) |
|
|
|
|
|
|
DrKronos писал(а): |
mordehay, топик про СДЛ.
|
Мне очень стыдно, за невнимательность |
|
|
|
|
|
m_Stasuk писал(а): |
Привет!
Есть региональный сайт, на котором я хочу размещать местные новости, которые не хочу писать сам, а хочу парсить с источников и 1 в 1 постить у себя. Как такое сделать?
|
Ночной Бдун wm.alensoft.com, в режиме парсера - бесплатный. (один месяц)
Делите, складываете источники по каналам, рубрикам, по времени запускается, парсит.
По видео - можно разобраться как каналы настраиваются.
Публикатор - платный
Хорошая прога ИМХО. |
|
|
|
|
|
|
|