Скрипт парсинга + сортировка по Pr
Новая тема Написать ответ
# Сб Ноя 17, 2007 12:42 pmTesey Зарег.: 13.11.2007 ; Сообщ.: 7Ответить с цитатой
Продаю скрипт, который в многопоточном режиме парсит гугл по запросам, удаляет дупы и сортирует все ссылки по PageRank

Максимальная выборка ссылок, достигается подставлением дополнительных слов и зон, т.е. если по запросу guestbook больше 1000 (макс. кол-во ссылок, которое можно взять без бана из google) , то подставляются зоны, если опять в результате больше 1000, то подставляются еще доп. слова, в итоге имеется максимальное количество выборки из google по заданным кеям

Вам остается только добавить список запросов в search.inc, желаемые зоны для парсинга в site.inc, дополнительные слова в words.inc и пойти гулять. Когда вернетесь- будет напарсена -база, ссылки раскиданы по текстовым файлам pr0.txt - pr10.txt , и один общий файл db_pr.txt, отсоритрованный так, что в начале идут ссылки с самым высоким PR.

Имеется также фильтр, в котором можно отбрасывать ссылки с ненужными фразами, или наоборот в базу попадут только ссылки, имеющие определенные слова.

Парсер серверный, но хорошо работает и на windows в консоли.

Скорость очень высока - РЕАЛЬНО напарсить 100К чистых ссылок в час

Работа с прокси:
прокси автоматом подгружаются с указанных сайтов (нормально подойдут и паблик сайты с прокси) либо из файла. Как только прокси заканчиваются, они опять автоматом подгружаются. Также можно выставить время подгрузки прокси в секундах, т.е. прокси автоматизированы, можно задать один раз список сайтов и забыть о них.

стоимость: 97$
Бонус: в комплекте 4834 уникальных запроса для парсинга гостевых
Бесплатная помощь в установке и настройке.
Тестировался на linux, freebsd, CentOS и windows

Могу дать на проверку одному из авторитетов форума
контакты: icq 117195
Новая тема Написать ответ    ГЛАВНАЯ ~ РЕКЛАМА И ОБЪЯВЛЕНИЯ
 
Любое использование материалов, размещенных на ArmadaBoard.com, без разрешения владельцев ArmadaBoard.com запрещено.