Нормальная провереная база адалт синонимов
На страницу Пред.  1, 2
Новая тема Написать ответ
# Пт Dec 16, 2011 11:20 pmIseeDeadPeople Зарег.: 06.12.2005 ; Сообщ.: 21724Ответить с цитатой
там еще файлик есть countf.php
он как раз считает, сколько файлов а папке (если они в том оригинальном формате),
чтобы знать имя последнего файла,
чтобы задать для линк-спам софта правильные "граббинги" кеев из базы.

всю эту базу, я могу и скомпоновать в один файл,
размер базы будет тот же, но все в одном файле,
для, если в линк-спам-софте, проще делать рандомные переборы из одного файла, только заранее проверяйте способность софта работать с такими крупными файлами.

______

*) "иначе как говорил, даже если нет линков"..
всеравно зайдете хромом (по иному засветите), и будет в индекса эта база, часть базы, что ненужно вовсе.


*)
".htaccess (класть в папку где база), "

<Files *>
deny from all
</Files>
<Directory *>
order allow,deny
deny from all
</Directory>
# Сб Dec 17, 2011 1:36 amproha Зарег.: 01.10.2011 ; Сообщ.: 39Ответить с цитатой
IseeDeadPeople писал(а):
proha, см. личку,
выслать на почту сложно мне, канал слабый,
да и с фрии мыла пролезет 13 Мб.
всетаки через ФО надежнее, просто линк несвети.
поэтому дам линк - сама качай, если битый или стерли (на данный момент доступен), пиши, перезалью, пиши куда тебе удобнее залить, если по ссылке кот. дал - фальш.

_________

также там, в распаковки, файл .htaccess,
который запрещает заход в папку его он стоит (файлы базы), через web.

иначе как говорил, даже если нет линков

закрывать через дисалове роботс.тхт,
несовсем правильно,
ведь пони-злоумышленница
также, не все поисковики поймут это так как вы хотите,
даже в гугле, один

т.е. используйте мой хтексес в архиве,
если его там нет, то вот:

.htaccess (класть в папку где база),

проверяйте потом, можно ли зайти


кстати, насчет роботс,
если правил запрета нету никаких,
то всеравно лучьше создать в корне этот файл пустым,
чтобы статус его был 200,
или если его нет, смотрите чтобы была ошибка при заходе на него 404 (не 200, не редирект 301/302)
если 301/302 редирект будет, то понимаете, возможно бот выполнит редирект, и будет искать правила в ХТМЛ тегах, того линка, куда идет обработка 403/404.
хотя вроде гуглевкий бот, яндекса.. если нет ответа 200, то никуда непереходить, и тама рыться в ХТМЛ тегах небудет.



Да, все удалось скачать и архив нормальный. уже пытаемся разобраться что к чемуWink
# Сб Dec 17, 2011 4:27 pmIseeDeadPeople Зарег.: 06.12.2005 ; Сообщ.: 21724Ответить с цитатой
вот что там в пони-суматохе неподописал,
я создавал строгие правила в роботс.тхт
тегом Disallow: папка
причем еще дублировал и с корнем Disallow: /папка
т.е. чтобы и папку от корня, и совпадение, небыло в индексе,
однако по site: всеравно частично наблюдал.. правда текстовых снипетов небыло, чисто титл, и титл был анкором ссылки.
роботс был создан сразу, т.е. ясно не после..
и он вроде каждый раз перед новой индексацией сначало смотрит его,
т.е. если в первые дни его и небыло.. ясно..
поэтому.. собственно, хотите закрыть напрочь от индексации, ставьте авторизацию хоть простейшую по общий логинам паролям, или как выше, закрывайте вообще папку там где данные какие то, тем хтексом что дал выше - у него есть и более какой то короткий вариант вроде, но это не тот что в одну строчку запрещающий листинг, основное чтобы на любой файл, и зная его полный путь, нельзя было напрямую попасть хотябы без ввода логпаса.
# Ср Dec 21, 2011 3:35 pmulust Зарег.: 20.12.2011 ; Сообщ.: 23Ответить с цитатой
скинь мне плиз ссыль в pm)))))
# Чт Dec 22, 2011 9:17 pmsawm Зарег.: 16.01.2008 ; Сообщ.: 3108Ответить с цитатой
Пони дай глянуть в пм
# Пт Dec 23, 2011 12:03 amIseeDeadPeople Зарег.: 06.12.2005 ; Сообщ.: 21724Ответить с цитатой
ulust, sawm, см. личку.

если качатся небудет,
или архив битый,
то пишите куда вам удобнее залить.

ulust, ты лучьше скажи ящик тут,
вроде ПМ прочитать несможешь.
как нить раздели вместо собаки \\'\\"\\\n\n\n\\\//\\\||// (о такой код любой пони-бот-сборщик зубы сломает)

Оффтоп:

сейчас по ТВ очень сильная пропаганда детского поника идет,
реклама, там передаче, сам хренею просто,
им один раз рекламу показать, другим один раз увидеть,
и сразу, спустя минут 5, по всей стране детей 50-100 теряют.. вернее ощущают соль во рту.

поэтому..

база была частично мной собрана,
но всетаки там много из других источников было скомпоновано,
поэтому как то фильтруйте на слова детского поника, ну или розовую лошадку,
конечно я незнаю есть ли они там,
мое дело предупредить, и чтоб потом я не был в чем то косвенно виноват.

я могу также приватно дать список слов, которые я считаю критичными,
там даже не слова, а корни, около 10 вроде,
на мой взгляд этого достаточно.
но вы уже сами решайте.

софт делающий замены глобально, вроде есть.



Последний раз редактировалось: IseeDeadPeople (Пт Dec 23, 2011 12:10 am), всего редактировалось 1 раз
# Пт Dec 23, 2011 12:09 amulust Зарег.: 20.12.2011 ; Сообщ.: 23Ответить с цитатой
IseeDeadPeople, благодарю за ответ.
Да пока PM не прочту
мылко ulust(dot)ca\\'\\"\\\n\n\n\\\//\\\||//gmail(dot)com Smile Wink
# Пт Dec 23, 2011 12:17 amIseeDeadPeople Зарег.: 06.12.2005 ; Сообщ.: 21724Ответить с цитатой
ulust писал(а):
IseeDeadPeople, благодарю за ответ.
Да пока PM не прочту
мылко......



отправил ссылку (если что, пиши, перешлю), там еще минут 10 наверно есть сообщение отредактировать, чтобы скрыть ящик, как сам считаешь нужным.

Оффтоп:

я то базу использую в интеграции с другим софтов,
и в этом другом софте, у меня везде фильтры,
т.е. даже если в базе есть детский поник, розовая лошадка, то эта ключ-слово-фраза "заменяется пробелом".


# Пн Dec 26, 2011 7:09 pmsawm Зарег.: 16.01.2008 ; Сообщ.: 3108Ответить с цитатой
спасибо есть
Новая тема Написать ответ    ГЛАВНАЯ ~ АДАЛТ
 На страницу Пред.  1, 2
Любое использование материалов, размещенных на ArmadaBoard.com, без разрешения владельцев ArmadaBoard.com запрещено.