Чем парсить?
На страницу 1, 2  След.
Новая тема Написать ответ
# Пт Июл 24, 2009 12:11 amiwfyb Зарег.: 14.03.2008 ; Сообщ.: 2862Ответить с цитатой
Я так понимаю варианта всего 2:
хрефер и аура.
Что лучше/легче/круче/и т.д
Отзывы хотелось бы услышать, кто че юзает.
# Пт Июл 24, 2009 1:36 ambillybob Зарег.: 25.01.2008 ; Сообщ.: 9Ответить с цитатой
есть ещё хороший парсер hххp://xkovator.com - я свою первую базу им собирал. недостаток у него - проксичекера нет встроенного, так что придётся чекать прокси самому или ждать пока он рабочую подберёт
# Пт Июл 24, 2009 3:06 amBrokenBrake Зарег.: 16.02.2007 ; Сообщ.: 3432Ответить с цитатой
http://pipes.yahoo.com/
Бесплатно, полная настраиваемость любых параметров.
Недостаток: требуется мозг Sad
# Пт Июл 24, 2009 11:57 amiwfyb Зарег.: 14.03.2008 ; Сообщ.: 2862Ответить с цитатой
Да нет, мне нужно парсить базы для спама. Т.е. гесты, форумы и блоги.
Причем софт нужен серьезный, чтобы парсил быстро и много. Обьемы большие.
# Пт Июл 24, 2009 1:07 pmDanusya Зарег.: 24.10.2008 ; Сообщ.: 47Ответить с цитатой
BrokenBrake писал(а):
http://pipes.yahoo.com/
Бесплатно, полная настраиваемость любых параметров.
Недостаток: требуется мозг Sad



Можно поподробнее? Smile Не про моск, а про настраиваемость :smk:
# Пт Июл 24, 2009 3:12 pmBrokenBrake Зарег.: 16.02.2007 ; Сообщ.: 3432Ответить с цитатой
Можно - http://brokenbrake.biz/category/Yahoo-Pipes/
# Пт Июл 24, 2009 5:09 pmDanusya Зарег.: 24.10.2008 ; Сообщ.: 47Ответить с цитатой
BrokenBrake писал(а):
Можно - http://brokenbrake.biz/category/Yahoo-Pipes/



Благодарствую) Как раз будет, чего почитать сегодня в метро по дороге домой... :thup:
# Пт Июл 24, 2009 8:13 pmbillybob Зарег.: 25.01.2008 ; Сообщ.: 9Ответить с цитатой
iwfyb писал(а):

Причем софт нужен серьезный, чтобы парсил быстро и много. Обьемы большие.


имхо, 90% успеха парсинга зависит от проксей и от метода работы с ними парсера. но если серьёзно настроен, то только парсер на заказ - из того что есть в паблике - попробуй хрефер
# Пт Июл 24, 2009 9:46 pmIseeDeadPeople Зарег.: 06.12.2005 ; Сообщ.: 21912Ответить с цитатой
iwfyb писал(а):
Да нет, мне нужно парсить базы для спама. Т.е. гесты, форумы и блоги.
Причем софт нужен серьезный, чтобы парсил быстро и много. Обьемы большие.



.. ну тут есть серверные решения и локальные..
пони, ты локальный софт .. или серверный ищешь ?

есть еще локальный AGGRESS PARSER ~ .. и писал про него, а скорости .. парсинга зависят не от канала (хотя от 10+ Кбайт/сек хватит) .. а чисто в количестве живых проксей.. которые еще не в tmp-бане у СЕ..

хрефер и аура.

хрефер это тот который идет в комплекте с хрумером ?

а аура что за пони ?
# Пт Июл 24, 2009 9:56 pmIseeDeadPeople Зарег.: 06.12.2005 ; Сообщ.: 21912Ответить с цитатой
Danusya писал(а):
BrokenBrake писал(а):
Можно - http://brokenbrake.biz/category/Yahoo-Pipes/



Благодарствую) Как раз будет, чего почитать сегодня в метро по дороге домой... :thup:



.. так расскажите точнее, как при помощи этого запарсить динамически (пхп-скриптами) базу в 100.000 гестов ?

____________

конечно, у меня напр. есть около 500 живых проксей, собранных с паблика.. вродеб 1/3 из них.. незабанены в гугле..
но даже этим, собрать крупные базы.. будет слишком долго..

.. у кого кстати есть, крупные базы признаков.. - желательно цели это - старые гесты/ббс-ки.. без всяких каптч,
.. у меня есть одна в 16к+ строк.. - что нить еще крупнее у кого то есть ?
# Пт Июл 24, 2009 11:12 pmbillybob Зарег.: 25.01.2008 ; Сообщ.: 9Ответить с цитатой
IseeDeadPeople писал(а):

а аура что за пони ?


ауру автор, похоже, забросил hххp://auraproff.biz
# Сб Июл 25, 2009 1:04 amiwfyb Зарег.: 14.03.2008 ; Сообщ.: 2862Ответить с цитатой
Ну хз просто.
Прокси не вопрос, да и запросы тоже. Лучше конечно серверный, ибо надо много и качественно.
# Сб Июл 25, 2009 11:50 amLexix Зарег.: 11.07.2008 ; Сообщ.: 2143Ответить с цитатой
Юзай хрефер.
# Пн Авг 03, 2009 2:10 pmiwfyb Зарег.: 14.03.2008 ; Сообщ.: 2862Ответить с цитатой
изначально так и думал за хрефер, сенкс всем.
# Вт Авг 04, 2009 3:11 pmstarter Зарег.: 31.07.2009 ; Сообщ.: 30Ответить с цитатой
так же подерживаю хрефер.
Новая тема Написать ответ    ГЛАВНАЯ ~ ПОИСКОВЫЕ СИСТЕМЫ
 На страницу 1, 2  След.
Любое использование материалов, размещенных на ArmadaBoard.com, без разрешения владельцев ArmadaBoard.com запрещено.