|
|
|
Подскажите плиз, чем по списку урлов (5К) повыдергивать тайтлы и дискрипшены,что-бы на выходе иметь их в столбик в двух txt файлах, в одном соответственно тайтлы, а в другом дискрипшены ??? |
|
|
|
|
|
content downloader
или свой скрипт |
|
|
|
|
|
блин точно, он был у меня где-то, кстати с армады мне скидывали.. ушел искать!
СПС! |
|
|
|
|
|
|
Надуюсь у нас тут есть кодеры???
Нашел такой вот говнокод, дергает тайтлы и дикриптион по списку урлов, только что-то с косяками, может кто-то доработает данный код??? думаю многим пригодится!
ЧТо не так: 1)тайтлы вставляет не в столбик, а в строчку...
2)какая-то борода с дискриптион....
Код: |
<?php
ob_implicit_flush();
$urls = file("urls.txt");
$file_titles = fopen("titles.txt", "a");
$file_descs = fopen("descriptions.txt", "a");
$pattern1 = "/<title>(.*?)<\/title>/is";
$pattern2 = "/<meta name=(\"|')description(\"|') content=(\"|')(.*?)(\"|')(.*?)>/is";
foreach ($urls as $one_url)
{
$html = file_get_contents(trim($one_url));
preg_match($pattern1, $html, $matches);
fwrite($file_titles, $matches[1]."\n");
preg_match($pattern2, $html, $matches);
fwrite($file_descs, $matches[4]."\n");
echo $one_url . " done.<br />";
}
fclose($file_titles);
fclose($file_descs);
?>
|
|
|
|
|
|
|
имхо написать под себя за баксов 10 реально |
|
|
|
|
|
GostonP писал(а): |
ЧТо не так: 1)тайтлы вставляет не в столбик, а в строчку...
|
замени fwrite($file_titles, $matches[1]."\n"); на fwrite($file_titles, $matches[1]."\r\n");
И вообще, зачем тебе этот скрипт. Один поток это будет очень долго. Освой лучше тот же content downloader или аналог. |
|
|
|
|
|
exolon писал(а): |
GostonP писал(а): |
ЧТо не так: 1)тайтлы вставляет не в столбик, а в строчку...
|
замени fwrite($file_titles, $matches[1]."\n"); на fwrite($file_titles, $matches[1]."\r\n");
И вообще, зачем тебе этот скрипт. Один поток это будет очень долго. Освой лучше тот же content downloader или аналог.
|
да кинул его сюда - может кому пригодиться!
А так да, content downloader норм! |
|
|
|
|
|
|
|