|
|
|
Не подскажет ли кто-нибудь, как определить окончание строки в урл?
Хочу найти inurl:.com<конец урла>. Чтоб безо всяких параметров, страниц и прочего... тольго голову сайта.
Подумал вот: как было бы здорово, если б Гугл понимал регулярные выражения...
а потом вдруг подумал: а что если есть некая команда, говорящая ему, что далее следует регулярное выражение? Никто, случаем, не знает?
Чисто теоретически, конечно, понятно, что регулярки - это очень большая нагрузка, но вдруг все-таки? |
|
|
|
|
|
Очень интересную тему ты поднял. И я только что благодаря этому нашел весьма занимательную особенность. Гугл как-то всё же разделяет составные слова без всяких дефисов и прочерков.
Для проверки попробуйте такие запросики:
inurl:brokenbrake.biz (предсказуемый результат)
inurl:brokenbrake.biz inurl:broken (хм)
inurl:brokenbrake.biz inurl:brokenb (вот так дела!) |
|
|
|
|
|
Хех...
site:*.ru покажет, а вот site:*net.ru уже нет |
|
|
|
|
|
Да, про inurl действительно интересно получилось.
А про сайт - вариант, конечно, но сам понимаешь, какое кол-во интересующих урлов находится на поддоменах. ) |
|
|
|
|
|
Короче, наверно совсем исключить лишние страницы не выйдет, но, по крайней мере, сократить их список явно можно. Например, вот так - allinurl:brokenbrake.biz -html
И добавляя значения с минусом. |
|
|
|
|
|
Ещё примерчик - allinurl:sex -html site:com |
|
|
|
|
|
Хотя почему бы не сделать ?
site:*.*.com -inurl:www
и
site:*.*.*.com
Хммм... Интересно... Этак по всем уровням можно домены пропарсить. Типа "тема". =) |
|
|
|
|
|
Не, такие звездочки не работают. А минус www вообще вредно, потому что некоторые сайты с www, некоторые без. |
|
|
|
|
|
еще как работают. проверь
потому и минус, что некоторые с, а некоторые без |
|
Последний раз редактировалось: Xenoid (Пт Окт 05, 2007 1:49 am), всего редактировалось 1 раз |
|
|
|
|
Точно, работают! А это прикольно. Весьма... |
|
|
|
|
|
Гы, я прямо увлекся
Вот, пожалуйста, гуглом проиндексировано 4 домена... двадцать седьмого уровня!
site:*.*.*.*.*.*.*.*.*.*.*.*.*.*.*.*.*.*.*.*.*.com -inurl:www
Хм, а звездочек меньше |
|
|
|
|
|
Да уж. Весьма...
Вот только заметил, что при добавлении любого запроса перестает работать свойство "найти только голову".
Снова лезут всякие страницы. |
|
|
|
|
|
Цитата: |
Гугл как-то всё же разделяет составные слова без всяких дефисов и прочерков.
|
Конечно же различает, иначе как бы он работал.
про домены 27 уровня интересно... |
|
|
|
|
|