Чем выдернуть тайтлы и дискрипшены по списку урлов???
Новая тема Написать ответ
# Ср Янв 29, 2014 11:12 amGostonP Зарег.: 19.07.2013 ; Сообщ.: 487Ответить с цитатой
Подскажите плиз, чем по списку урлов (5К) повыдергивать тайтлы и дискрипшены,что-бы на выходе иметь их в столбик в двух txt файлах, в одном соответственно тайтлы, а в другом дискрипшены ??? :smk:
# Ср Янв 29, 2014 1:32 pmexolon Зарег.: 22.11.2007 ; Сообщ.: 2397Ответить с цитатой
content downloader

или свой скрипт
# Ср Янв 29, 2014 2:23 pmGostonP Зарег.: 19.07.2013 ; Сообщ.: 487Ответить с цитатой
блин точно, он был у меня где-то, кстати с армады мне скидывали.. ушел искать!
СПС! :smk:
# Ср Янв 29, 2014 7:39 pmbanzai Зарег.: 24.05.2007 ; Сообщ.: 729Ответить с цитатой
тайтлы может и STGrabber повытягивать
# Сб Фев 01, 2014 11:53 amGostonP Зарег.: 19.07.2013 ; Сообщ.: 487Ответить с цитатой
Надуюсь у нас тут есть кодеры???
Нашел такой вот говнокод, дергает тайтлы и дикриптион по списку урлов, только что-то с косяками, может кто-то доработает данный код??? думаю многим пригодится!
ЧТо не так: 1)тайтлы вставляет не в столбик, а в строчку...
2)какая-то борода с дискриптион....

Код:

<?php
ob_implicit_flush();
$urls = file("urls.txt");
$file_titles = fopen("titles.txt", "a");
$file_descs = fopen("descriptions.txt", "a");
$pattern1 = "/<title>(.*?)<\/title>/is";
$pattern2 = "/<meta name=(\"|')description(\"|') content=(\"|')(.*?)(\"|')(.*?)>/is";
foreach ($urls as $one_url)
{
    $html = file_get_contents(trim($one_url));
    preg_match($pattern1, $html, $matches);
    fwrite($file_titles, $matches[1]."\n");
    preg_match($pattern2, $html, $matches);
    fwrite($file_descs, $matches[4]."\n");
    echo $one_url . " done.<br />";
}
fclose($file_titles);
fclose($file_descs);
?>



:smk:
# Вс Фев 02, 2014 11:00 pmsawm Зарег.: 16.01.2008 ; Сообщ.: 3108Ответить с цитатой
имхо написать под себя за баксов 10 реально
# Пн Фев 03, 2014 4:49 pmexolon Зарег.: 22.11.2007 ; Сообщ.: 2397Ответить с цитатой
GostonP писал(а):
ЧТо не так: 1)тайтлы вставляет не в столбик, а в строчку...


замени fwrite($file_titles, $matches[1]."\n"); на fwrite($file_titles, $matches[1]."\r\n");

И вообще, зачем тебе этот скрипт. Один поток это будет очень долго. Освой лучше тот же content downloader или аналог.
# Вт Фев 04, 2014 1:15 amGostonP Зарег.: 19.07.2013 ; Сообщ.: 487Ответить с цитатой
exolon писал(а):
GostonP писал(а):
ЧТо не так: 1)тайтлы вставляет не в столбик, а в строчку...


замени fwrite($file_titles, $matches[1]."\n"); на fwrite($file_titles, $matches[1]."\r\n");

И вообще, зачем тебе этот скрипт. Один поток это будет очень долго. Освой лучше тот же content downloader или аналог.



да кинул его сюда - может кому пригодиться!

А так да, content downloader норм! :smk:
Новая тема Написать ответ    ГЛАВНАЯ ~ ТЕХНИЧЕСКИЕ ВОПРОСЫ
 
Любое использование материалов, размещенных на ArmadaBoard.com, без разрешения владельцев ArmadaBoard.com запрещено.