Поиск в Гугл. вопрос по синтаксису.
Новая тема Написать ответ
# Пт Окт 05, 2007 1:07 amXenoid Зарег.: 06.09.2007 ; Сообщ.: 66Ответить с цитатой
Не подскажет ли кто-нибудь, как определить окончание строки в урл?
Хочу найти inurl:.com<конец урла>. Чтоб безо всяких параметров, страниц и прочего... тольго голову сайта.
Подумал вот: как было бы здорово, если б Гугл понимал регулярные выражения...
а потом вдруг подумал: а что если есть некая команда, говорящая ему, что далее следует регулярное выражение? Никто, случаем, не знает?
Чисто теоретически, конечно, понятно, что регулярки - это очень большая нагрузка, но вдруг все-таки?
# Пт Окт 05, 2007 1:18 amBrokenBrake Зарег.: 16.02.2007 ; Сообщ.: 3432Ответить с цитатой
Очень интересную тему ты поднял. И я только что благодаря этому нашел весьма занимательную особенность. Гугл как-то всё же разделяет составные слова без всяких дефисов и прочерков.

Для проверки попробуйте такие запросики:

inurl:brokenbrake.biz (предсказуемый результат)
inurl:brokenbrake.biz inurl:broken (хм)
inurl:brokenbrake.biz inurl:brokenb (вот так дела!)
# Пт Окт 05, 2007 1:20 amBrokenBrake Зарег.: 16.02.2007 ; Сообщ.: 3432Ответить с цитатой
Хех...
site:*.ru покажет, а вот site:*net.ru уже нет Smile
# Пт Окт 05, 2007 1:27 amXenoid Зарег.: 06.09.2007 ; Сообщ.: 66Ответить с цитатой
Да, про inurl действительно интересно получилось.
А про сайт - вариант, конечно, но сам понимаешь, какое кол-во интересующих урлов находится на поддоменах. )
# Пт Окт 05, 2007 1:27 amBrokenBrake Зарег.: 16.02.2007 ; Сообщ.: 3432Ответить с цитатой
Короче, наверно совсем исключить лишние страницы не выйдет, но, по крайней мере, сократить их список явно можно. Например, вот так - allinurl:brokenbrake.biz -html
И добавляя значения с минусом.
# Пт Окт 05, 2007 1:29 amBrokenBrake Зарег.: 16.02.2007 ; Сообщ.: 3432Ответить с цитатой
Ещё примерчик - allinurl:sex -html site:com
# Пт Окт 05, 2007 1:33 amXenoid Зарег.: 06.09.2007 ; Сообщ.: 66Ответить с цитатой
Хотя почему бы не сделать ?
site:*.*.com -inurl:www
и
site:*.*.*.com
Хммм... Интересно... Этак по всем уровням можно домены пропарсить. Типа "тема". =)
# Пт Окт 05, 2007 1:35 amBrokenBrake Зарег.: 16.02.2007 ; Сообщ.: 3432Ответить с цитатой
Не, такие звездочки не работают. А минус www вообще вредно, потому что некоторые сайты с www, некоторые без.
# Пт Окт 05, 2007 1:36 amXenoid Зарег.: 06.09.2007 ; Сообщ.: 66Ответить с цитатой
еще как работают. проверь
потому и минус, что некоторые с, а некоторые без


Последний раз редактировалось: Xenoid (Пт Окт 05, 2007 1:49 am), всего редактировалось 1 раз
# Пт Окт 05, 2007 1:40 amBrokenBrake Зарег.: 16.02.2007 ; Сообщ.: 3432Ответить с цитатой
Точно, работают! :thup: А это прикольно. Весьма...
# Пт Окт 05, 2007 1:43 amBrokenBrake Зарег.: 16.02.2007 ; Сообщ.: 3432Ответить с цитатой
Гы, я прямо увлекся r5

Вот, пожалуйста, гуглом проиндексировано 4 домена... двадцать седьмого уровня!

site:*.*.*.*.*.*.*.*.*.*.*.*.*.*.*.*.*.*.*.*.*.com -inurl:www

Хм, а звездочек меньше Shocked
# Пт Окт 05, 2007 1:48 amXenoid Зарег.: 06.09.2007 ; Сообщ.: 66Ответить с цитатой
Да уж. Весьма...
Вот только заметил, что при добавлении любого запроса перестает работать свойство "найти только голову".
Снова лезут всякие страницы.
# Пт Окт 05, 2007 10:39 amLi-Hua Зарег.: 25.12.2005 ; Сообщ.: 11544Ответить с цитатой
Цитата:
Гугл как-то всё же разделяет составные слова без всяких дефисов и прочерков.




Конечно же различает, иначе как бы он работал.


про домены 27 уровня интересно...
Новая тема Написать ответ    ГЛАВНАЯ ~ ТЕХНИЧЕСКИЕ ВОПРОСЫ
 
Любое использование материалов, размещенных на ArmadaBoard.com, без разрешения владельцев ArmadaBoard.com запрещено.