На страницу Пред. 1, 2 |
|
|
200К без дублей? на паблик проксях? по признакам форумов в гугле?
Ну ты волшебник
Кста, а когда ты эти ресы прогонять то успеваешь? |
|
|
|
|
|
ifund, а че волшебник то? это же медленно, целых два дня потратил на 200к. и не факт что 50% их пробет хрум. |
|
|
|
|
|
+1
Парсить хрефером, но не используя запросы типа inurl: |
|
|
|
|
|
adamant писал(а): |
ifund, а че волшебник то? это же медленно, целых два дня потратил на 200к. и не факт что 50% их пробет хрум.
|
угу я и написал что 200к спарсил но не писал сколько из них пробиваетса
разговор же шел о том как собирают базы а не о том как они потом по пробиву
по поводу того что медленно согласен поэтому пару недель попарсив и погоняв по ним крумака пришел к выводу что пока нет отдельного выделенного сервака с хрумером это мартышкин труд и решил что проще покупать базы не трахать мозг не себе не овнерам форумов
ps запросы inurl использую и хрефер парсил через паблик прокси
Код: |
inurl:"board.htm" intitle:"forum"
inurl:"board.htm" intitle:"forum" intext:"forum"
inurl:"wwwboard.html" intitle:"forum"
inurl:"wwwboard.html" intitle:"forum" intext:"forum"
inurl:"forum.cgi" intitle:"forum" intext:"add topic"
inurl:"forum.cgi" intitle:"forum" intext:"IPB"
inurl:"forum.cgi" intitle:"forum" intext:"VBulletin"
inurl:"forum.cgi" intitle:"phorum"
inurl:"forum.cgi" intitle:"phorum" intext:"forum"
inurl:"forum.cgi" intitle:"new topic"
inurl:"forum.cgi" intitle:"new topic" intext:"forum"
inurl:"forum.cgi" intitle:"phpBB"
inurl:"forum.cgi" intitle:"phpBB" intext:"forum"
inurl:"forum.cgi" intitle:"phpBB" intext:"phpBB"
inurl:"forum.cgi" intitle:"yaBB" intext:"yaBB"
inurl:"forum.cgi" intitle:"IPB"
inurl:"forum.cgi" intitle:"IPB" intext:"IPB"
inurl:"forum.cgi" intitle:"posting" intext:"new topic"
inurl:"forum.cgi" intitle:"posting" intext:"post new topic"
inurl:"forum.cgi" intitle:"post new topic" intext:"forum"
inurl:"forum.cgi" intitle:"post new topic" intext:"new topic"
inurl:"forum.cgi" intitle:"PHP-Nuke"
inurl:"forum.cgi" intitle:"PHP-Nuke" intext:"forum"
|
парсил по таким признакам, признаки брал из базы их там около 15к
где взял базу не помню  |
|
|
|
|
|
Как я зачечал, если парсить с "inurl:", то намного быстрее каптча появляеться (ну и бан на ИП/сетку если всеравно её вводить и далее игогокать),
нежели если использовать простые текстовые признаки. |
|
|
|
|
|
Знаете, я тут посмотрел и поразмыслил: так вот, лучше покупать базы у проверенных людей. Сам тоже парсил по всякому, базы получались отличные, но у Xokins'а просто замечательные (окуенные). Если его контактов нет, то стучитесь в асю 3045160. Пользуюсь и куею. |
|
|
|
|
|
zeoman, толку тут ICQ давать нет У кого нет акка на БМ форуме - не продаст. |
|
|
|
|
|
Скрытый пост. Для просмотра требуется 1500 сообщений. |
|
|
|
|
|
BVz, говорит что продаст. Его аська 3045160.
База Русскоязычных форумов - 721.313 url
База Англоязычных форумов - 3.665.251 url |
|
|
|
|
|