На страницу 1, 2 След. |
|
|
Я так понимаю варианта всего 2:
хрефер и аура.
Что лучше/легче/круче/и т.д
Отзывы хотелось бы услышать, кто че юзает. |
|
|
|
|
|
есть ещё хороший парсер hххp://xkovator.com - я свою первую базу им собирал. недостаток у него - проксичекера нет встроенного, так что придётся чекать прокси самому или ждать пока он рабочую подберёт |
|
|
|
|
|
|
Да нет, мне нужно парсить базы для спама. Т.е. гесты, форумы и блоги.
Причем софт нужен серьезный, чтобы парсил быстро и много. Обьемы большие. |
|
|
|
|
|
BrokenBrake писал(а): |
http://pipes.yahoo.com/
Бесплатно, полная настраиваемость любых параметров.
Недостаток: требуется мозг
|
Можно поподробнее? Не про моск, а про настраиваемость  |
|
|
|
|
|
|
Благодарствую) Как раз будет, чего почитать сегодня в метро по дороге домой...  |
|
|
|
|
|
iwfyb писал(а): |
Причем софт нужен серьезный, чтобы парсил быстро и много. Обьемы большие.
|
имхо, 90% успеха парсинга зависит от проксей и от метода работы с ними парсера. но если серьёзно настроен, то только парсер на заказ - из того что есть в паблике - попробуй хрефер |
|
|
|
|
|
iwfyb писал(а): |
Да нет, мне нужно парсить базы для спама. Т.е. гесты, форумы и блоги.
Причем софт нужен серьезный, чтобы парсил быстро и много. Обьемы большие.
|
.. ну тут есть серверные решения и локальные..
пони, ты локальный софт .. или серверный ищешь ?
есть еще локальный AGGRESS PARSER ~ .. и писал про него, а скорости .. парсинга зависят не от канала (хотя от 10+ Кбайт/сек хватит) .. а чисто в количестве живых проксей.. которые еще не в tmp-бане у СЕ..
хрефер и аура.
хрефер это тот который идет в комплекте с хрумером ?
а аура что за пони ? |
|
|
|
|
|
Danusya писал(а): |
Благодарствую) Как раз будет, чего почитать сегодня в метро по дороге домой...
|
.. так расскажите точнее, как при помощи этого запарсить динамически (пхп-скриптами) базу в 100.000 гестов ?
____________
конечно, у меня напр. есть около 500 живых проксей, собранных с паблика.. вродеб 1/3 из них.. незабанены в гугле..
но даже этим, собрать крупные базы.. будет слишком долго..
.. у кого кстати есть, крупные базы признаков.. - желательно цели это - старые гесты/ббс-ки.. без всяких каптч,
.. у меня есть одна в 16к+ строк.. - что нить еще крупнее у кого то есть ? |
|
|
|
|
|
IseeDeadPeople писал(а): |
а аура что за пони ?
|
ауру автор, похоже, забросил hххp://auraproff.biz |
|
|
|
|
|
Ну хз просто.
Прокси не вопрос, да и запросы тоже. Лучше конечно серверный, ибо надо много и качественно. |
|
|
|
|
|
|
изначально так и думал за хрефер, сенкс всем. |
|
|
|
|
|
так же подерживаю хрефер. |
|
|
|
|
|